Está en la página 1de 275

INTRODUCCIN A LA

MECNICA CUNTICA
JULIO GRATTON

PRLOGO
Las presentes notas se basan en los apuntes que prepar en 2000 para el Curso de Fsica 4, y
hacen pareja con Termodinmica e Introduccin a la Mecnica Estadstica. El estudiante
debera leer ambas pues son complementarias. Esta edicin ha sido ampliada considerablemente
respecto de la versin primitiva. Usamos siempre las unidades gaussianas en el desarrollo de la
teora. Sin embargo, al considerar ejemplos y al dar valores numricos se emplean a veces
unidades prcticas o que pertenecen a otros sistemas. Por lo tanto el lector debe tener el debido
cuidado en el empleo de las frmulas.
Existe una extensa bibliografa que el estudiante puede consultar con provecho. Si bien todos los
temas del programa de Fsica 4 se tratan en estas notas y en Termodinmica e Introduccin a la
Mecnica Estadstica, se recomienda a los estudiantes que consulten y lean otros textos, para
familiarizarse con la literatura y dado que algunos temas se tratan en ellos con mayores detalles o
con enfoques diferentes. Asimismo, es fascinante conocer la historia de la Mecnica Cuntica,
para apreciar cmo se fueron desarrollando los conceptos que se introducen en el Curso. El
alumno no debe desdear obras que se han escrito hace ya muchos aos, pues muchas de ellas
son excelentes, y a veces mejores que otras ms recientes. Entre los innumerables libros que se
han escrito sobre la Mecnica Cuntica puedo indicar los siguientes:
(a) de carcter introductorio:
1.
R. Eisberg y R. Resnik, Fsica Cuntica, Limusa
2.
L. R. Argello, Fsica Moderna, Answer Just in Time.
3.
J. C. Wilmott, Fsica Moderna, Limusa.
4.
R. Eisberg, Fundamentos de Fsica Moderna, Limusa.
5.
S. Borowitz, Fundamentals of Quantum Mechanics, Benjamin.
6.
R. H. Dicke y J. P. Wittke, Introduction to Quantum Mechanics, Addison-Wesley.
7.
R. P. Feynman, R. B. Leighton y M. Sands, The Feynman Lectures on Physics, Vol 3,
Quantum Mechanics, Addison-Wesley.
8.
F. Mandl, Quantum Mechanics, Butterworths.
9.
D. Park, Introduction to Quantum Theory, Mc Graw-Hill.
10. S. Gasiorowicz, Quantum Physics, Wiley.
(b) ms avanzados:
11. G. Baym, Lectures in Quantum Mechanics, Benjamin.
12. D. Bohm, Quantum Theory, Prentice-Hall.
13. A. S. Davydov, Quantum Mechanics, Addison-Wesley.
14. P. A. M. Dirac, The Principles of Quantum Mechanics, Oxford.
15. L. D. Landau y E. M. Lifschitz, Quantum Mechanics (Nonrelativistic Theory), AddisonWesley.
16. A. Messiah, Quantum Mechanics, Wiley.
17. E. Merzbacher, Quantum Mechanics, Wiley.
18. L. I. Schiff, Quantum Mechanics, Mc. Graw-Hill.
(c) de carcter histrico, excelentes aunque requieren un buen conocimiento de la Mecnica
Cuntica para ser apreciados en todo su valor:
19. A. Pais, Subtle is the Lord , Oxford.
20. A. Pais, Inward bound, Oxford.
ii

21. A. Pais, Niels Bohrs times, Oxford.


Tambin puede resultar provechoso consultar las diferentes voces en la Encyclopaedia
Britannica, dado que han sido escritas por distinguidos especialistas, as como realizar
bsquedas en la Web.
Pido disculpas por las erratas que pueden haber quedado en en estas notas pese a la revisin y
agradecer que se me ponga al corriente de las que fueran detectadas.
Julio Gratton
Buenos Aires, enero de 2003.

iii

INDICE
1. Introduccin

2. Naturaleza atmica de la materia y la electricidad


La hiptesis atmica
Evidencias de la naturaleza atmica de la materia
Pesos atmicos y la Tabla Peridica de los elementos
La Teora Cintica
Tamao de los tomos
La atomicidad de la carga elctrica
Los rayos catdicos
El electrn
El experimento de Millikan y la cuantificacin de la carga

3
3
3
5
5
6
7
7
8
8

3. Estructura atmica
Cargas atmicas positivas
La dispersin de rayos X y la cantidad de electrones de cada tomo
El modelo atmico de Thomson
Radioactividad
La dispersin de partculas por los tomos y el fracaso del modelo de Thomson
El modelo de Rutherford y el ncleo atmico
La constante que est faltando

10
10
10
12
13
13
15
18

4. Radiacin, fotones y la constante de Planck


Introduccin
La teora de Planck de la radiacin de cuerpo negro
El postulado de Planck
El efecto fotoelctrico
Teora cuntica de Einstein del efecto fotoelctrico
El efecto Compton
La emisin de rayos X
Creacin y aniquilacin de pares
La naturaleza dual de la radiacin electromagntica

20
20
20
23
23
25
27
31
33
35

5. La Teora Cuntica Antigua


Introduccin
El espectro atmico
Los postulados de Bohr
Teora de Bohr del tomo con un electrn
El espectro de lneas de rayos X
Refinamientos del modelo de Bohr
El principio de correspondencia
El experimento de Franck y Hertz
Constantes fundamentales, consideraciones dimensionales y escalas
Crtica de la Teora Cuntica Antigua

37
37
37
38
39
43
44
48
49
51
52

iv

6. Propiedades ondulatorias de la materia


El postulado de Broglie
Algunas propiedades de las ondas piloto
El experimento de Davisson y Germer
Interpretacin de la regla de cuantificacin de Bohr
El principio de incerteza
Interpretacin fsica de Heisenberg del principio de incerteza
La relacin de incerteza entre la energa y el tiempo
La dispersin de un paquete de ondas
El principio de complementaridad

53
53
54
56
57
58
62
63
64
65

7. La teora de Schrdinger
Introduccin
La ecuacin de Schrdinger
Interpretacin de la funcin de onda
La ecuacin de Schrdinger independiente del tiempo
Cuantificacin de la energa en la teora de Schrdinger
Valores esperados y operadores diferenciales
Propiedades matemticas de operadores lineales en espacios funcionales

68
68
68
70
72
73
76
79

8. El formalismo de la Mecnica Cuntica


Introduccin
Propiedades de las funciones de onda y de las autofunciones de la energa
Normalizacin en una caja
Relaciones de conmutacin
Autoestados de una variable dinmica
Mediciones simultneas y operadores que conmutan
Las relaciones de incerteza de Heisenberg
Constantes del movimiento y ecuaciones del movimiento para operadores
El lmite clsico
Representacin coordenadas y representacin impulsos
Transformaciones unitarias

87
87
88
90
90
91
92
94
95
97
98
100

9. Soluciones de la ecuacin de Schrdinger


Introduccin
La partcula libre
El potencial escaln
Penetracin de una barrera de potencial
El oscilador armnico simple

103
103
103
106
110
114

10. Fuerzas centrales, momento angular y tomo de hidrgeno


Introduccin
Propiedades del momento angular
Magnitud del momento angular
Traslaciones y rotaciones infinitesimales y sus generadores
Fuerzas centrales y conservacin del momento angular

118
118
118
119
120
121

Energa cintica y momento angular


Reduccin del problema de fuerzas centrales
Dependencia angular de las autofunciones
El problema de autovalores para Lz y la cuantificacin espacial
Teora elemental del efecto Zeeman
Autovalores y autofunciones de L2
La ecuacin radial
Estados ligados de tomos con un solo electrn

121
122
123
125
125
126
131
133

11. El Spin
El momento angular intrnseco
La evidencia espectroscpica
La hiptesis de Uhlenbeck y Goudsmit
El experimento de Stern y Gerlach
El spin como una variable dinmica
Los spinores y la teora del spin en forma matricial
Spin y rotaciones
Las matrices de Pauli
Operadores de momento magntico y momento angular intrnseco

138
138
138
139
140
142
144
146
150
152

12. tomos con varios electrones, el Principio de Exclusin y la Tabla Peridica


Descripcin de un tomo con varios electrones
El mtodo del campo autoconsistente
Propiedades de los elementos
El Principio de Exclusin
El Principio de Exclusin y la estructura atmica
La unin qumica y otras interacciones entre tomos

156
156
159
161
164
165
170

13. Partculas idnticas


La indistinguibilidad y la funcin de onda de un sistema de varias partculas idnticas
Funciones de onda simtricas y antisimtricas
Bosones y Fermiones
Sistemas de partculas independientes
El Principio de Exclusin de Pauli
Las interacciones de intercambio
El tomo de helio

183
183
185
186
187
188
189
196

14. Segunda cuantificacin


Segunda cuantificacin de sistemas de Bosones
Segunda cuantificacin de sistemas de Fermiones
Ecuaciones de movimiento para operadores de campos de Fermiones y Bosones
Conexin de la segunda cuantificacin con la Teora Cuntica de Campos
El mtodo de Hartree-Fok

200
200
213
219
221
223

15. Las Estadsticas Cunticas


El lmite clsico
La funcin de particin de un sistema de partculas idnticas sin interaccin

229
229
230

vi

Las distribuciones de Bose-Einstein y de Fermi-Dirac


El gas perfecto de Bosones
El gas de fotones y la radiacin de cuerpo negro
La emisin y absorcin de fotones
El gas perfecto de Fermiones
El modelo de electrn libre de los metales
El equilibrio de las enanas blancas

vii

232
233
242
246
257
263
265

1. Introduccin

1. INTRODUCCIN
La Mecnica Cuntica se ocupa del comportamiento de la materia y la radiacin en las escalas
atmica y subatmica. De esta forma procura describir y explicar las propiedades de las molculas, los tomos y sus constituyentes: electrones, protones, neutrones, y otras partculas ms
esotricas como los quarks y los gluones. Esas propiedades incluyen las interacciones de las
partculas entre s y con la radiacin electromagntica.
El comportamiento de la materia y la radiacin en la escala atmica presenta aspectos peculiares; de acuerdo con ello las consecuencias de la Mecnica Cuntica no siempre son intuitivas ni
fciles de entender. Sus conceptos chocan con las nociones que nos resultan familiares porque
derivan de las observaciones cotidianas de la naturaleza en la escala macroscpica. Sin embargo,
no hay razones en virtud de las cuales el comportamiento del mundo atmico y subatmico deba
seguir las mismas pautas que los objetos de nuestra experiencia diaria.
El desarrollo de las ideas bsicas de la Mecnica Cuntica comenz a principios del siglo pasado, como consecuencia de una serie de descubrimientos y observaciones que pusieron en evidencia las graves dificultades de la Fsica Clsica para interpretar las propiedades del tomo y
sus partes constituyentes as como las propiedades de la radiacin electromagntica y su interaccin con la materia. Esos descubrimientos revolucionaron las nociones hasta entonces sustentadas por los fsicos y plantearon una asombrosa cantidad de enigmas, cuya solucin oblig a realizar un profundo replanteo de los fundamentos y conceptos bsicos de la Fsica.
El estudio de la Mecnica Cuntica es importante por varias razones. En primer lugar porque
pone de manifiesto la metodologa esencial de la Fsica. En segundo lugar porque tuvo un xito
formidable ya que permiti dar respuestas vlidas a casi todos los problemas en los cuales se la
ha aplicado. En tercer lugar porque es la herramienta terica bsica para numerosas disciplinas
de gran importancia, como la Qumica Fsica, la Fsica Molecular, Atmica y Nuclear, la Fsica
de la Materia Condensada y la Fsica de Partculas.
Subsiste, sin embargo, una curiosa paradoja alrededor de la Mecnica Cuntica. A pesar de su
notable xito en todas las cuestiones de inters prctico en las que se la ha aplicado, sus fundamentos contienen aspectos an no aclarados en forma completamente satisfactoria. En particular,
cuestiones relacionadas con el proceso de medicin.
Una caracterstica esencial de la Mecnica Cuntica, que la diferencia de la Mecnica Clsica, es
que en general es imposible por razones de principio, efectuar una medicin sobre un sistema sin
perturbarlo. Pero los detalles de la naturaleza de esta perturbacin, y el punto exacto en que ella
ocurre son asuntos an oscuros y controvertidos. Por estos motivos la Mecnica Cuntica atrajo
algunos de los ms brillantes cientficos del siglo XX, que han erigido con ella un majestuoso y
elegante edificio intelectual.
Este es un curso introductorio. Por lo tanto pondremos el nfasis sobre el desarrollo de los conceptos bsicos de la Mecnica Cuntica, sin entrar en los detalles de algunas tcnicas de clculo
y formalismos, dado que estos temas se estudian en otros cursos.
En los Captulos 2 a 4 de estas notas pasaremos revista a estos temas desde una perspectiva histrica, y mostraremos que el comportamiento de las partculas atmicas y de la radiacin no se
puede describir adecuadamente mediante las nociones clsicas de partcula y onda. Estos conceptos, que derivan de la experiencia a nivel macroscpico, no son adecuados en la escala atmica y por lo tanto deben ser abandonados y reemplazados por una nueva teora, que es precisamente la Mecnica Cuntica. Por razones de espacio no entraremos en los detalles prcticos y

1. Introduccin
tcnicos de los experimentos que contribuyeron a echar las bases de la Mecnica Cuntica y en
cambio sugerimos al lector que recurra a la bibliografa para satisfacer su natural curiosidad. Recomendamos enfticamente que realice estas lecturas complementarias para adquirir una adecuada cultura cientfica.
En el Captulo 5 presentamos a la Teora Cuntica Antigua, por su inters histrico y porque
constituy, a pesar de sus falencias, el primer intento exitoso en resolver algunos de los problemas y paradojas surgidas del estudio del tomo.
En los Captulos 6 y 7 introducimos las ideas fundamentales de la Mecnica Cuntica moderna,
y en los siguientes Captulos desarrollamos el formalismo de la teora y mostramos su aplicacin
por medio de algunos ejemplos.
Estas notas dejan de lado gran parte de las extensiones y aplicaciones de la Mecnica Cuntica.
En particular, no tratamos ni la Mecnica Cuntica Relativstica, ni las Teoras de Campos.
Tampoco incursionamos en las aplicaciones al ncleo atmico, a las partculas subnucleares y a
la materia condensada.

2. Naturaleza atmica de la materia y la electricidad

2. NATURALEZA ATMICA DE LA MATERIA Y LA

ELECTRICIDAD

La hiptesis atmica
El concepto del tomo, en la forma que fuera aceptado por lo cientficos desde 1600 hasta 1900,
se bas en las ideas de filsofos griegos del siglo V AC. Fueron Leucippo de Mileto y su discpulo Demcrito de Abdera quienes originaron la filosofa atmica, introduciendo la nocin de un
constituyente ltimo de la materia, que denominaron tomo (es decir, indivisible en la lengua
griega). Demcrito crea que los tomos eran uniformes, slidos, duros, incompresibles e indestructibles y que se movan en nmero infinito por el espacio vaco; segn sus ideas, las diferencias de forma y tamao de los tomos determinaban las propiedades de la materia. Estas especulaciones fueron luego continuadas por Epicuro de Samos.
Si bien la teora atmica griega es significativa del punto de vista histrico y filosfico, carece
de valor cientfico, pues no se funda en observaciones de la naturaleza, ni en mediciones, pruebas y experimentos. Para los griegos, la ciencia constitua tan slo un aspecto de su sistema filosfico, mediante el cual buscaban una teora general que explicara el Universo. Con este fin ellos
usaban casi exclusivamente la matemtica y el razonamiento, cuando hablaban de la Fsica. Fue
as que Platn y Aristteles atacaron la teora atmica sobre bases filosficas y no cientficas. En
efecto, mientras Demcrito crea que la materia no se poda mover en el espacio sin el vaco, y
que la luz consista del rpido movimiento de partculas a travs del vaco, Platn rechazaba la
idea que atributos como bondad o belleza fueran simplemente manifestaciones mecnicas
de tomos materiales. Del mismo modo, Aristteles no aceptaba la existencia del vaco, pues no
poda concebir que los cuerpos cayeran con igual rapidez en un vaco. El punto de vista
Aristotlico prevaleci en la Europa medioeval, y la ciencia de los telogos Cristianos se bas en
la revelacin y la razn, motivo por el cual las ideas de Demcrito fueron repudiadas por considerrselas materialistas y ateas.

Evidencias de la naturaleza atmica de la materia


Con el Renacimiento dio comienzo la nueva ciencia experimental, y se pusieron en duda los
puntos de vista Aristotlicos hasta entonces dominantes. Tan pronto como Galileo expres su
creencia de la existencia del vaco (en 1638), los cientficos comenzaron a estudiar las propiedades del aire y del vaco (parcial), para poner a prueba los mritos relativos de la ortodoxia
Aristotlica y de la teora atmica. As fue que Robert Boyle en 1658 comenz sus estudios sistemticos sobre la elasticidad del aire que lo llevaron a establecer en 1662 la Ley que lleva su
nombre1. Como conclusin de sus experimentos, Boyle escribi que toda materia est constituida por partculas slidas de una nica clase, dispuestas en molculas de modo de dar a los
materiales sus diferentes propiedades. Cuarenta aos despus, en 1704, Isaac Newton, en su libro Optiks, expuso su visin del tomo, semejante a las de Demcrito y de Boyle. Fue as como
las antiguas especulaciones acerca de una partcula dura e indivisible fueron lentamente reemplazadas por una teora cientfica basada en resultados experimentales y en deducciones matemticas. Pero fueron necesarios ms de 2000 aos antes que los fsicos modernos comprendieran
que el tomo es divisible, y que no es ni duro, ni slido, ni inmutable.

Redescubierta en 1672 en forma independiente por el fsico francs Edme Mariotte.

2. Naturaleza atmica de la materia y la electricidad


En el curso del siglo XIX se acumul gran parte de la evidencia de que la materia est compuesta por tomos. Recapitulamos brevemente los hitos ms relevantes.
En primer lugar debemos citar algunas leyes de la qumica. Mencionamos en primer trmino la
Ley de las proporciones constantes, descubierta por Joseph Proust en 1794:
Ley de las proporciones constantes:
cuando se unen elementos qumicos para formar un determinado compuesto, las proporciones en peso de los elementos que se combinan son siempre las mismas.
Dicha Ley fue extendida en 1808 por John Dalton, quien propuso la
Ley de las proporciones mltiples:
cuando dos elementos se combinan de distintas formas para dar lugar a diferentes compuestos, los pesos de uno de los dos elementos que se combinan con un peso definido del
otro, guardan una relacin simple entre s.
La teora atmica permite explicar estas leyes. Toda cantidad macroscpica de algn elemento
qumico consta de gran nmero de tomos de dicho elemento. Todos esos tomos tienen el
mismo peso (o masa), que es caracterstico del elemento. Cuando dos elementos se combinan
para formar un compuesto, los tomos de los elementos se combinan en una proporcin simple,
para dar lugar a una molcula del compuesto.
Por ejemplo, si se forma xido cprico a partir de cobre y oxgeno, se encuentra siempre que
63.5 g de cobre se combinan con 16 g de oxgeno. A partir de los mismos elementos tambin se
puede formar xido cuproso, pero en este caso 63.5 g de cobre siempre se combinan con 8 g de
oxgeno. La hiptesis atmica explica estos hechos diciendo que los pesos atmicos del cobre y
el oxgeno estn en la relacin 63.5:16, y que el xido cprico es CuO mientras que el xido cuproso es Cu2O. Gracias a esta hiptesis tan simple se pudieron explicar cuantitativamente los
pesos de combinacin que se observaron en qumica.
Casi simultneamente, Joseph-Louis Gay Lussac (1808) encontr que en el estado gaseoso, no
slo los pesos sino tambin los volmenes que participan en las reacciones qumicas siguen leyes sencillas, siempre y cuando los gases se comporten segn las leyes de los gases ideales:
Ley de Gay-Lussac:
en cada gas que se forma o se descompone, los volmenes de los gases componentes y
compuestos guardan relaciones simples entre s.
Si comparamos esta ley con las anteriores se llega a la conclusin que el volumen de un gas est
relacionado con el nmero de partculas del mismo, y como consecuencia de ello Amedeo
Avogadro formul en 18112 la Ley que lleva su nombre:
Ley de Avogadro:
volmenes iguales de distintos gases, en las mismas condiciones de temperatura y presin,
contienen el mismo nmero de molculas.
Esta ley implica que, a una misma temperatura y presin, una cantidad de gas cuyo peso es igual
al peso molecular3 ocupa siempre el mismo volumen especfico sin importar de que gas se trate.

El trabajo de Avogadro fue ignorado durante casi 50 aos, y su Ley fue aceptada por la comunidad cientfica

recin en 1858.

2. Naturaleza atmica de la materia y la electricidad


A temperatura y presin normales, o sea 0 C y 1 Atm, este volumen es de 22.4 litros. El nmero
de molculas en un mol4 se denomina nmero de Avogadro, y su valor es

N0 = 6.023 10 23

(2.1)

El nmero de Avogadro se puede determinar de distintas maneras; la ms precisa se basa en medir las distancias atmicas por difraccin de rayos X.

Pesos atmicos y la Tabla Peridica de los elementos


A medida que se descubrieron ms y ms elementos a lo largo del siglo XIX, los cientficos se
comenzaron a preguntar qu relacin existe entre las propiedades fsicas de los elementos y su
peso atmico. De esta forma, durante la dcada de 1860 se propusieron varios esquemas. En
1869, el qumico Dmitry Ivanovich Mendeleyev introdujo la Tabla Peridica, basada sobre los
pesos atmicos determinados a partir de la teora de Avogadro de las molculas diatmicas. Encontr que si se ordenaban a los elementos segn su peso atmico, se pona en evidencia una
caracterstica periodicidad de sus propiedades. Los elementos que tienen propiedades qumicas
semejantes, o bien tienen pesos atmicos aproximadamente iguales (como ocurre con el grupo
Pt, Ir y Os), o bien tienen pesos atmicos que aumentan de manera uniforme (como K, Rb y Cs).
Dejando de lado el Hidrgeno pues es anmalo, Mendeleyev orden5 los 63 elementos entonces
conocidos en seis grupos, de acuerdo con su valencia. Al observar que las propiedades qumicas
cambian gradualmente a medida que aumenta el peso atmico, Mendeleyev predijo la existencia
de nuevos elementos en todos los casos en que haba un hueco en la secuencia de pesos atmicos de elementos consecutivos dentro del ordenamiento propuesto. Por lo tanto su sistema, adems de ser una forma de clasificacin, sirvi tambin de herramienta para la investigacin. Al
mismo tiempo, la Tabla Peridica dej planteados interrogantes muy importantes para cualquier
futura teora del tomo: de dnde proviene el patrn de los pesos atmicos? cul es el origen
de la periodicidad de las propiedades qumicas de los elementos?

La Teora Cintica
La hiptesis atmica se fortaleci an ms debido al xito de la Teora Cintica, la cual trata los
gases como compuestos por un nmero muy grande de molculas que se desplazan en el vaco
con velocidades distribuidas al azar, cuya magnitud promedio se relaciona con la temperatura.
De esta forma se pueden calcular las propiededes mecnicas y trmicas de los gases (ecuacin de
estado, viscosidad, conductividad trmica, etc.) en trminos de la masa, el tamao y la velocidad
de las molculas. El primero en desarrollar esta teora fue Daniel Bernoulli (1738), quien la emple para deducir la Ley de Boyle, basado en la idea que la presin se debe al choque de las
molculas del gas con las paredes del recipiente que lo contiene. Sin embargo su trabajo fue rechazado por ms de un siglo6. La teora fue vuelta a formular en forma independiente por John

Expresado (por ej.) en g.

Un mol es la cantidad de sustancia cuyo peso es igual al peso molecular expresado en g.

El nmero de orden de cada elemento dentro de la Tabla Peridica se denomina hoy nmero atmico, y como

veremos en el Captulo 3, es igual al nmero de electrones que posee el tomo.


6

Fundamentalmente porque se daba ms crdito a las ideas de Newton, segn las cuales la presin se originaba

debido a una supuesta repulsin entre las molculas. Incluso los genios se equivocan!

2. Naturaleza atmica de la materia y la electricidad


Herapath (1820) y por John James Waterston (1845) quien fue el primero en deducir la equiparticin de la energa. Sin embargo, estos trabajos corrieron la misma suerte que el de Bernoulli
y fueron ignorados7. Recin despus de los trabajos de James Prescott Joule (1840), que desacreditaron la Teora del Calrico al mostrar que el calor es una forma de energa, el camino
qued despejado para la aceptacin de la Teora Cintica. Fue as que Rudolf Clausius desarroll
en 1857 la matemtica correspondiente, y luego James Clerk Maxwell y Ludwig Eduard
Boltzmann completaron su desarrollo alrededor de 1860.
En este contexto corresponde mencionar un fenmeno que constituye una de las comprobaciones
ms evidentes de la hiptesis atmica. Si se suspende un objeto diminuto dentro de un gas,
tambin es bombardeado por las molculas. Como el nmero de las molculas es finito, no se
establece un equilibrio exacto en cualquier instante y en consecuencia el objeto se mueve en
forma aleatoria. Un botnico, Robert Brown, fue el primero (1828) en observar este fenmeno
(que en su honor se denomina movimiento Browniano) al observar bajo el microscopio una suspensin de granos de polen en agua. Mucho tiempo despus, en 1908, Jean Perrin us el movimiento Browniano para determinar el nmero de Avogadro, basado en la analoga entre las partculas suspendidas en el lquido y las molculas en la atmsfera8. La teora correspondiente haba sido publicada por Albert Einstein y Marian Ritter von Smoluchowski en 1905. Luego del
trabajo de Perrin ya nadie cuestion la existencia de los tomos.

Tamao de los tomos


Las primeras estimaciones modernas del tamao de los tomos fueron realizadas por Joseph
Lotschmidt en 1865, y se basaron en los resultados de la Teora Cintica. No las comentaremos
aqu. Ser suficiente decir que conociendo el nmero de Avogadro, podemos calcular el tamao
de los tomos de un slido (por ejemplo un metal) si suponemos que estn ubicados uno junto al
otro de modo que los tomos vecinos se tocan entre s. Si A es la masa atmica9 de la sustancia y
su densidad, el radio r de un tomo est dado por

1 A
r=

2 N0

1/ 3

(2.2)

Si se hace este clculo para varios elementos, desde el litio ( A = 7) al plomo ( A = 207) se encuentra que r vara entre 1.3x108 cm y 1.55x108 cm. De acuerdo con estas estimaciones todos
los tomos tienen un tamao del orden de 108 cm, es decir 1 . Otros mtodos, como la teora
cintica, dan resultados semejantes. Se debe notar que no hemos definido con precisin lo que
significa el radio de un tomo, y por lo tanto tenemos que tener cuidado con el uso de este
trmino; en particular no sabemos todava cmo vara la interaccin entre dos tomos como funcin de la distancia.
7

En esos tiempos estaba en boga la Teora del Calrico, motivo por el cual no se aceptaba la idea que el calor

estuviera relacionado con el movimiento de las molculas.


8

La variacin de la densidad del aire con la altura depende del balance entre la gravedad (que tiende a hacer

descender las molculas) y la agitacin trmica (que tiende a expandir el aire). La relacin entre densidad y altura
para partculas Brownianas en suspensin obedece a un balance semejante.
9

La masa atmica A es la masa de N0 tomos. El valor numrico de A, cuando se expresa en mltiplos enteros de la

masa del tomo de hidrgeno, se denomina nmero de masa y se indica con A.

2. Naturaleza atmica de la materia y la electricidad

La atomicidad de la carga elctrica


Los experimentos sobre la electrlisis realizados por Michael Faraday a partir de 1832 demostraron que la cantidad de sustancia liberada en un electrodo de una cuba electroltica por el paso de
una carga elctrica Q es proporcional a la masa equivalente de la sustancia (la masa atmica dividida por la valencia). La constante de proporcionalidad F se denomina Faraday, y se tiene:

M=

QA
vF

(2.3)

donde M es la masa liberada de la sustancia, Q es la carga transferida y v es la valencia. El valor


de un Faraday es
F = 96500 C/mol equivalente

(2.4)

El hecho que la masa liberada es estrictamente proporcional a la carga total transferida sugiere
que la carga es transportada por los iones mismos. La hiptesis ms simple es que cada ion lleva
una carga qv, es decir, un mltiplo de una carga elemental q. Entonces la carga necesaria para
liberar un mol es N0qv y por lo tanto, puesto que para un mol M = A , tendremos que

q = F / N0 4.8 10 10 u.e.s. 1.60 10 19 C

(2.5)

Si combinamos la hiptesis atmica con los resultados de la electrlisis se concluye que cada ion
est asociado con una carga determinada qv, que es un mltiplo de la carga elemental q. Por lo
tanto la carga elctrica tiene tambin una naturaleza atmica y en el electrolito cada ion lleva un
nmero de tomos de carga igual a su valencia.

Los rayos catdicos


A temperatura y presin normales los gases no conducen la electricidad, hasta que la intensidad
del campo elctrico es tal que se produce una chispa. Sin embargo, si se tiene un par de electrodos en un recipiente cerrado y se reduce la presin a menos de 10 mm Hg, al aplicar algunos kV
entre los electrodos se observa una descarga brillante, con colores y patrones llamativos. Si se
reduce an ms la presin, la regin oscura que est delante del ctodo se extiende paulatinamente hasta que a una presin de unos 103 mm Hg llena todo el recipiente. No obstante, sigue
pasando corriente elctrica. Si se hace un orificio en el nodo, se observa un resplandor verdoso
en la pared del tubo de vidrio detrs del orificio. Los agentes que producen este resplandor viajan en lnea recta desde el orificio del nodo, cosa que se puede verificar por la sombra que produce cualquier objeto que se interponga entre el nodo y la pared de vidrio. Si se coloca una
rueda de paletas en la trayectoria, comienza a girar, lo que muestra que los agentes llevan cantidad de movimiento. Dichos agentes se denominaron rayos catdicos10.

10

Los rayos catdicos fueron descubiertos por Julius Plcker en 1858 e investigados por William Crookes en 1879,

quien encontr que se desvan en un campo magntico, y que la direccin de la desviacin sugiere que se trata de
partculas de carga negativa. Sin embargo la verdadera naturaleza de los rayos catdicos fue tema de controversia.
Una prueba crucial consisti en estudiar el efecto sobre los mismos de un campo elctrico. En 1892 Heinrich Hertz
llev a cabo un experimento que tuvo resultados negativos. J. J. Thomson consider que ello se deba a que el vaco
no haba sido suficientemente bueno en el experimento de Hertz, y decidi repetirlo con un vaco mejor.

2. Naturaleza atmica de la materia y la electricidad

El electrn
Joseph John Thomson realiz varios experimentos en 1896-7 sobre un haz fino de rayos catdicos producido colimando los rayos que salen del orificio del nodo. Comprob que todos son
desviados por igual por un campo elctrico transversal a su trayectoria, y por el sentido de la
desviacin dedujo que todos tienen la misma carga negativa que indicamos con e, de modo que
se trata de algn tipo de partcula. Estudiando la desviacin concluy que, si estas partculas tienen una masa m, resulta
mv 2
= cte.
e

(2.6)

Aplicando un campo magntico al haz de rayos catdicos observ una desviacin, a partir de la
cual determin la relacin carga/masa de las partculas. El valor actualizado de esa relacin es:

e
= (1.7598 0.0004) 108 C/g
m

(2.7)

Los experimentos de electrlisis permiten tambin calcular una relacin carga/masa. Si consideramos esta relacin para el elemento ms liviano, o sea el hidrgeno, resulta

Q
= 9.57 10 4 C/g
M

(2.8)

Si comparamos la relacin carga/masa (2.7) con la (2.8) obtenemos


(e / m )
= 1.84 103
(Q / M )

(2.9)

Por lo tanto, o las partculas de los rayos catdicos son mucho ms livianas que el tomo de hidrgeno, o bien llevan una carga casi dos mil veces mayor a la del ion hidrgeno. Esta ltima
hiptesis parece tan poco lgica que Thomson propuso que tanto las partculas de los rayos
catdicos como el ion de hidrgeno llevan cargas de igual valor absoluto y que las partculas de
los rayos catdicos, que denomin electrones, son mucho ms livianas que los tomos.

El experimento de Millikan y la cuantificacin de la carga


En realidad hasta ahora slo podemos afirmar que la carga promedio en la electrlisis est cuantificada, pues si bien supusimos que cada tomo lleva una carga qv, en realidad solo es necesario
suponer que la carga promedio vale qv. Del mismo modo, los experimentos de Thomson se podran explicar suponiendo que dentro de los tomos hay algn material especial con carga negativa y con una relacin carga/masa sumamente elevada, y que en las descargas elctricas algunos fragmentos de ese material son emitidos por los tomos del gas o por el ctodo. Todava no
hemos presentado pruebas concluyentes de que ese material especial slo puede existir en cantidades discretas, a parte las deducciones que se pueden hacer a partir de la electrlisis.
Las pruebas cruciales fueron aportadas por Robert A. Millikan, quien en 1909 estudi la cada en
el aire por efecto de la gravedad de minsculas gotas cargadas elctricamente. Mediante un par
de electrodos poda introducir un campo elctrico vertical y as estudi el movimiento de las
gotas, con y sin el campo elctrico. No vamos a reproducir aqu las frmulas (ver J. C. Wilmott,

2. Naturaleza atmica de la materia y la electricidad


Fsica Atmica), pero se puede mostrar que de esta forma se puede calcular la carga de las gotas
individuales. Lo que encontr Millikan es que dichas cargas son siempre mltiplos enteros de la
carga ms pequea que puede llevar una gota. De este modo qued demostrado que la carga est
cuantificada. El valor del cuanto de carga es

e = 4.80273 10 10 u.e.s. 1.603 10 19 C

(2.10)

valor que coincide con el que se deduce de la electrlisis (ec. (2.5)). Combinando este valor con
la relacin carga/masa (2.7) podemos obtener la masa del electrn:

me = (9.108 0.012) 10 28 g

(2.11)

Recogiendo los resultados que hemos presentado hasta aqu, podemos concluir que a comienzos
del siglo XX haba quedado demostrada la naturaleza atmica de la materia. Sin embargo, en
contradiccin con las ideas primitivas acerca del tomo, ste resultaba ser un objeto compuesto,
y uno de sus componentes, el electrn, haba sido identificado.

3. Estructura atmica

3. ESTRUCTURA ATMICA
Cargas atmicas positivas
De acuerdo con los resultados reseados en el Captulo 2 sabemos que la materia est formada
por tomos cuyo radio es de unos 108 cm. Estos tomos estn constituidos, al menos en parte,
por electrones. Puesto que son elctricamente neutros es obvio que la carga debida a los electrones que contienen debe estar equilibrada por una carga positiva igual.
Adems de los rayos catdicos, en los experimentos con tubos de descarga se observaron partculas con carga positiva que emanan del nodo, que fueron denominadas rayos positivos1. En
1898 Wilhelm Wien investig estos rayos y encontr que tienen una relacin masa/carga ms de
1000 veces mayor que la de los electrones. Puesto que esta relacin es comparable con la relacin masa/(carga del electrn) de los tomos residuales del tubo de descarga, se sospech que
los rayos positivos son iones (tomos cargados positivamente porque les faltan uno o ms electrones) provenientes del gas presente en el tubo. En 1913 Thomson refin el dispositivo de Wien
para separar los diferentes iones y medir sus relaciones masa/carga. As determin la presencia
de iones de varios estados de carga (es decir, tomos que han perdido uno, dos, tres, , etc.
electrones), que aparecan como diferentes trazas en una placa fotogrfica. Al realizar sus experimentos con nen, observ que los haces de iones del mismo estado de carga producan dos trazas en vez de una. Los qumicos haban atribuido al Ne un numero de masa de 20.2, pero las trazas observadas por Thomson sugeran nmeros atmicos de 20.0 (la traza ms intensa) y 22.0 (la
ms dbil). Concluy entonces que el Ne consiste de una mezcla de dos variedades, que denomin istopos2: la ms abundante, 20Ne (con nmero de masa 20.0) y la ms escasa 22Ne (de
nmero de masa 22.0). Ms tarde se descubri un tercer istopo, el 21Ne, que tambin est presente en cantidades diminutas3. Estos resultados demostraron que la hiptesis de Dalton, que
todos los tomos de un dado elemento tienen la misma masa, est en error. La tcnica de
Thomson fue perfeccionada por Francis W. Aston, quien desarroll el espectrgrafo de masa en
1919 y lo utiliz para analizar cerca de 50 elementos en los aos siguientes, lo que le permiti
descubrir que la mayora tienen istopos.
En conclusin, no hay ninguna evidencia de que en el tomo exista una partcula positiva equivalente al electrn. Por lo tanto la carga positiva est de alguna manera (no trivial) asociada con
la masa del tomo.

La dispersin de rayos X y la cantidad de electrones de cada tomo


Las pruebas que los tomos de una dada especie contienen un nmero definido de electrones
provienen de los experimentos sobre dispersin de rayos X.

A veces tambin llamados rayos canales. Fueron descubiertos por Eugen Goldstein en 1886.

El trmino istopo proviene del griego y significa igual lugar. Se refiere al hecho que las variedades del mismo

elemento ocupan igual lugar en la Tabla Peridica, pues tienen (casi exactamente) las mismas propiedades qumicas. Ya en 1886 Crookes avanz la idea que todos los tomos tienen pesos atmicos enteros y que los elementos
cuyos nmeros de masa tienen valores no enteros son en realidad mezclas. Asimismo, la existencia de istopos fue
sospechada por Frederick Soddy en 1910, al estudiar los productos del decaimiento radioactivo del torio.
3

Hoy sabemos que de cada 1000 tomos de Ne, 909 son de 20Ne, 88 son 22Ne y 3 son 21Ne.

10

3. Estructura atmica
Los rayos X fueron descubiertos por Wilhelm Conrad Roentgen en 1895, al realizar experimentos de descargas en gases. Cuando la diferencia de potencial entre el ctodo y el nodo es de algunos kV, al ser bombardeado por los electrones, el nodo emite una radiacin penetrante que se
denomin radiacin X. En poco tiempo se pudo mostrar que los rayos X son radiacin electromagntica de longitud de onda muy corta, debido a que

Los rayos X se producen cuando electrones energticos impactan sobre un objeto slido. En estas circunstancias los electrones sufren una violenta desaceleracin, y de
acuerdo con la teora electromagntica un electrn acelerado o desacelerado emite
radiacin.
Haga y Wind encontraron en 1899 que los rayos X se difractan al pasar por una rendija muy fina, lo que muestra que son un fenmeno ondulatorio. El tamao de la
figura de difraccin indica que la longitud de onda es del orden de 108 cm.
En 1906 Charles Glover Barkla mostr que los rayos X se pueden polarizar, lo que indica que son ondas transversales.
En 1912 Max von Laue desarrollo una tcnica para medir la longitud de onda de los
rayos X, basada en la difraccin por una red cristalina.

Cuando la radiacin electromagntica incide sobre una partcula cargada, sta oscila por efecto
del campo elctrico de la onda, y al ser acelerada emite radiacin. La intensidad total de la radiacin emitida por una carga acelerada est dada por la frmula
R=

2 e2 a2
3 c3

(3.1)

donde e es la carga, a es la aceleracin, c la velocidad de la luz y estamos usando unidades


Gaussianas. Aqu lo que nos interesa es que la energa emitida es proporcional al cuadrado de la
aceleracin. En un campo elctrico E, la aceleracin de una carga es eE / m , de modo que la
cantidad de energa dispersada por la carga es proporcional a e 4 / m 2 . Puesto que la masa de los
electrones es mucho menor que la de los dems constituyentes del tomo, es obvio que la dispersin de los rayos X por los tomos se debe esencialmente a los electrones.
Es posible entonces usar la dispersin de rayos X para estimar el nmero de electrones de un
tomo, siempre y cuando la longitud de onda de los rayos X que se emplean sea menor que la
distancia entre los electrones, pues en este caso las oscilaciones de los diferentes electrones casi
nunca estarn en fase (suponemos que las distancias que separan a los electrones no siguen un
patrn regular). En este caso las radiaciones emitidas por los diferentes electrones son incoherentes y podemos sumar sus intensidades. La intensidad total de la radiacin dispersada es entonces proporcional al nmero de electrones. Hay un segundo requisito que se debe cumplir, esto
es, que la frecuencia de los rayos X sea mucho mayor que cualquiera de las frecuencias naturales
de oscilacin de los electrones dentro del tomo, de modo que podamos tratar los electrones
como si fueran libres. Esto, en la prctica, significa que la longitud de onda de los rayos X debe
ser bastante menor que 108 cm. Con estas hiptesis (omitimos los detalles del clculo4) J. J.
Thomson mostr que la intensidad total de la radiacin difundida por un electrn bajo la influencia de una onda electromagntica de intensidad I es

Ver por ejemplo W. Panofsky y M. Phillips, Classical Electricity and Magnetism, Addison-Wesley.

11

3. Estructura atmica
2

R = T I J/s , T =

8 e2
2
25
2 = 6.66 10 cm
3 mc

(3.2)

donde T se denomina seccin eficaz de Thomson del electrn. La (3.2) tambin se puede escribir en trminos del radio clsico del electrn:
r0 =

e2
= 2.817938 10 13 cm
mc 2

(3.3)

8 2
r0
3

(3.4)

en la forma

T =

Si hay n electrones por unidad de volumen, la intensidad difundida por un trozo de materia de
seccin unidad y espesor dx ser
ndx T I

(3.5)

Esta es la energa perdida por el rayo, que por lo tanto sufre una variacin de intensidad dada por
dI = n T Idx

(3.6)

La (3.6) implica que la intensidad del haz se atena exponencialmente al atravesar un espesor
del material, es decir:
I = I0 e n T x

(3.7)

Luego midiendo la atenuacin de los rayos X que atraviesan un determinado espesor de materia
se puede determinar n y de all el nmero Z de electrones de cada tomo. Los resultados experimentales muestran que Z es aproximadamente igual a la mitad del nmero de masa A.

El modelo atmico de Thomson


Para avanzar ms fue necesario realizar otros experimentos, sugeridos por un modelo propuesto
por J. J. Thomson para explicar los datos conocidos, y que haca nuevas predicciones an no
verificadas. De acuerdo con este modelo el tomo es una esfera de carga positiva de unos 108
cm de radio, con electrones en su interior como las pasas de uva dentro de un pan dulce.
Suponiendo que la carga positiva est distribuida uniformemente, cabe esperar que tambin los
electrones estn distribuidos uniformemente, pues as la carga neta en toda esfera con centro en
el centro del tomo es nula en promedio y la distribucin de cargas es estable. Este modelo est
de acuerdo con todas las propiedades del tomo conocidas en su momento. Adems, si se
perturban las posiciones de los electrones, stos oscilarn y por lo tanto emitirn radiacin de
una determinada frecuencia. Luego se explica, al menos cualitativamente, la emisin de luz por
los tomos (se puede ver, sin embargo, que muy difcilmente pueda haber un acuerdo
cuantitativo con el espectro de la radiacin emitida que se observa).
El experimento crucial para probar el modelo fue realizado por Ernest Rutherford y sus colaboradores en 1911 y consisti en el estudio de la dispersin de partculas por tomos. Veremos
12

3. Estructura atmica
que el modelo de Thomson predice que el nmero de partculas dispersadas en ngulos grandes es despreciable. Pero el experimento desminti esta prediccin, y la explicacin de las observaciones llev a Rutherford a proponer el modelo nuclear, segn el cual el tomo est constituido por un pequeo ncleo central donde est concentrada la carga positiva y casi toda la
masa, rodeado por electrones en movimiento, de forma que el conjunto es totalmente neutro.

Radioactividad
Entre 1896 y 1898 Antoine-Henri Becquerel, Pierre Curie y Maria Curie (Maria Sklodowska)
descubrieron que algunos elementos pesados como el uranio y el torio emiten espontneamente
radiaciones penetrantes, capaces de velar una placa fotogrfica. Haciendo pasar un haz colimado
de estas radiaciones a travs de un campo magntico, se encontraron tres componentes que
fueron denominados radiacin , y . Los rayos no son desviados por el campo magntico, lo
que indica que no tienen carga elctrica; en cambio, los rayos y se desvan, mostrando que
los primeros tienen carga positiva y los segundos, negativa. Estos experimentos se realizaron
bajo vaco. Introduciendo aire en el dispositivo, se observ que bastan pocos centmetros de aire
para detener la radiacin , pero no las otras dos componentes. Interponiendo lminas de
distintos espesores se encontr que pocos mm de un material denso son suficientes para detener
la radiacin ; en cambio, la radiacin slo disminuye apreciablemente si se interpone un
bloque de plomo de varios cm de espesor. Actualmente sabemos que la radiacin est
compuesta por electrones de gran energa5, y que los rayos son radiacin electromagntica de
longitud de onda extremadamente corta. La naturaleza de las partculas fue descubierta por
Rutherford, quien encontr que se trata de tomos de Helio doblemente ionizados6.
Al estudiar la radioactividad del torio, Rutherford y Frederick Soddy descubrieron en 1902 que
la radioactividad est asociada con profundos cambios dentro del tomo, que lo transforman en
un elemento distinto. Encontraron que el torio produce continuamente una sustancia qumicamente diferente, que es intensamente radioactiva. Si el elemento as producido se separa del torio, desaparece con el correr del tiempo, dado que a su vez se transmuta en otro elemento.
Observando este proceso, Rutherford y Soddy formularon la ley del decaimiento exponencial,
que establece que en cada unidad de tiempo, decae una fraccin fija del elemento radioactivo.
El descubrimiento de la radioactividad y la transmutacin de los elementos oblig a los cientficos a modificar radicalmente sus ideas sobre la estructura atmica, pues demostr que el
tomo no es ni indivisible ni inmutable. En vez de ser simplemente un receptculo inerte que
contiene electrones, se vio que el tomo puede cambiar de forma y emitir cantidades prodigiosas
de energa. Adems, las radiaciones mismas sirvieron de instrumento para investigar el interior
del tomo.

La dispersin de partculas por los tomos y el fracaso del modelo de Thomson


Si se hace incidir un haz colimado de partculas sobre una hoja delgada (por ej. una lmina de
oro de 104 cm de espesor) se observa que casi todas la atraviesan con una leve prdida de energa, y que la mayora son desviadas menos de 1 desde su direccin original. Sin embargo, una
pequea fraccin sufre desviaciones mayores y alrededor de una en cada 104 se desva en 90 o

No siempre los rayos llevan carga negativa; algunas sustancias radioactivas emiten positrones, de modo que en

ese caso los rayos llevan carga positiva.


6

Se recomienda al alumno leer en la bibliografa citada la descripcin de estos experimentos.

13

3. Estructura atmica
ms. Estos fueron los resultados de los experimentos realizados por Rutherford y sus colaboradores Hans Geiger y Ernest Marsden en 1911. Vamos a ver ahora el significado de dicho resultado.
Al atravesar la lmina, las partculas de hecho atraviesan los tomos. En su trayectoria son
desviadas por los campos elctricos debidos a las cargas internas de los tomos. Corresponde
aclarar que en este caso el efecto de los electrones es despreciable, debido a su masa muy pequea (aproximadamente 104 veces la masa de las partculas ): es fcil estimar que el orden de
magnitud del ngulo de mxima desviacin en una colisin entre una partcula y un electrn
atmico es de apenas 104 radianes. En consecuencia se pueden ignorar las colisiones con los
electrones y basta considerar los efectos de las cargas atmicas positivas.
De acuerdo con el modelo de Thomson, los tomos constan de cargas positivas esfricas de unos
108 cm de radio, con los electrones distribuidos en su interior. Estas esferas estn densamente
empaquetadas en la lmina, por lo tanto si sta tiene 104 cm de espesor, la partcula atravesar
aproximadamente 104 tomos. Se trata entonces de un problema de dispersin mltiple, y la desviacin final de la partcula es la suma de las desviaciones producidas por cada tomo que
atraves. Estas desviaciones tienen sentidos distribuidos al azar, de modo que podemos estimar
la probabilidad de que ocurra una determinada desviacin final si conocemos la desviacin promedio debida a cada tomo. Se trata de un problema anlogo al del paseo al azar y para nuestro propsito es suficiente una estimacin grosera de las magnitudes de inters.
Consideremos el choque de una partcula cuya carga es ze ( z = 2 ) y cuya cantidad de movimiento es p = mv con una esfera de carga positiva Ze y radio R. Suponiendo que el ngulo de
desviacin es pequeo, podemos escribir

p Ft
=
p
p

(3.8)

Podemos estimar la fuerza F como zZe2 / R2 y el tiempo que dura la colisin como t R / v .
Obtenemos entonces

Ze2
ER

(3.9)

donde E es la energa cintica de la partcula . Sustituyendo en (3.9) los valores tpicos en estos
experimentos ( Z = 80, e 4.8 10 10 u.e.s. , R 10 10 m y E 5 MeV ) se obtiene

2 10 4 radianes

(3.10)

Combinando un nmero muy grande n de estas colisiones, y suponiendo que las desviaciones de
las mismas estn distribuidas al azar, se obtiene la siguiente expresin para la probabilidad
P( )d de que la desviacin total est comprendida entre y + d :

P( )d =

1
e
n 2

2
2 n 2

El valor medio cuadrtico del ngulo de desviacin total es

14

(3.11)

3. Estructura atmica
1/ 2

( )

rms = 2

= n

(3.12)

Los resultados experimentales de Rutherford y sus colaboradores mostraron que entre 0 y 3 la


(3.11) describe correctamente la dispersin de las partculas , con un valor de rms 1 , lo que
implica una desviacin promedio por tomo de 0.01 1.5 10 4 radianes. De modo que en la
regin de desviaciones pequeas, la concordancia con la prediccin del modelo es excelente.
Pero se presenta una grave discrepancia para las desviaciones grandes, pues el experimento
muestra que alrededor de 1 de cada 104 partculas se desva en 90 o ms. En cambio, la (3.11)
predice, por ejemplo, que la probabilidad que la desviacin sea mayor que 10 es de 2x1022. En
consecuencia, el modelo de Thomson no describe correctamente las desviaciones en ngulos
grandes.
El problema no tiene arreglo posible. Si, por ejemplo, disminuimos el radio R de la carga positiva para as aumentar , (pues 1/ R ), al disminuir el tamao de los tomos disminuye el nmero n de colisiones (pues n R2 ) y en consecuencia rms se mantiene constante, independientemente de R. La conclusin es que la dispersin mltiple nunca puede producir las desviaciones
a grandes ngulos que se observan.
Claramente, la condicin rms = cte. vale solo para radios tales que n >> 1. Para radios muy pequeos puede haber una sola colisin, y entonces el ngulo de desviacin es el que corresponde
a un nico evento. La ec. (3.9) sugiere que esto podra ocurrir para R 10 12 cm . Pero por otra
parte todos los mtodos para medir radios atmicos indican R 10 8 cm .
Est claro entonces que el modelo de Thomson se debe descartar.

El modelo de Rutherford y el ncleo atmico


De resultas de la evidencia que acabamos de comentar, Rutherford propuso en 1911 que el
tomo tiene un ncleo central diminuto donde reside toda la carga positiva y la mayor parte de la
masa, y que los electrones giran alrededor de l7. Veremos ahora que este modelo est de
acuerdo con los resultados de los experimentos de dispersin de partculas , pero para eso primero tenemos que formular una teora diferente para dicha dispersin.
La frmula de dispersin de Rutherford
En este caso, al analizar la dispersin de partculas , el ncleo central se puede considerar como
una carga puntual. A partir de este modelo se puede obtener una frmula para la dispersin de
partculas que concuerda muy bien con los resultados experimentales.
Las hiptesis bsicas que permiten deducir dicha frmula son:
La dispersin se debe a la interaccin entre la partcula y el ncleo, y slo es significativa
si la trayectoria pasa cerca del ncleo. Esto implica que los choques son raros y por lo tanto
el problema es de una nica colisin.
La fuerza entre la partcula y el ncleo sigue la ley de Coulomb hasta distancias muy pequeas.

Es interesante recordar que el fsico japons Hantaro Nagaoka haba propuesto en 1904 un modelo atmico

planetario semejante al de Rutherford, pero no fue tomado en cuenta por sus contemporneos debido al problema de
estabilidad que se presenta con esa clase de modelos. En efecto, el electromagnetismo predice que una carga
acelerada irradia; por lo tanto un electrn que gira alrededor de un ncleo debera perder energa y caer sobre l.

15

3. Estructura atmica

Se puede ignorar el efecto de los electrones.


Nosotros para simplificar la discusin vamos a suponer adems que el ncleo est fijo en el referencial del laboratorio y por brevedad citaremos los resultados sin dar la demostracin, ya que la
misma se puede encontrar desarrollada en la bibliografa citada y en la mayora de los textos de
Mecnica. Suponemos que la lmina tiene una espesor d, y que hay n tomos por unidad de volumen. La geometra de la colisin se indica en la Fig. 3.1. El ncleo est fijo en el origen y la
partcula se aproxima desde la derecha con velocidad inicial v. Si no hubiera desviacin, la
partcula pasara a una distancia p del ncleo. La distancia p se denomina parmetro de impacto.
Despus de la dispersin la partcula se ha desviado en un ngulo y tiene la velocidad final v f .
Dado que el ncleo se supone inmvil, tendremos que | v | = | v f | = v , y como se conserva el momento angular, es sencillo verificar que

cot( / 2) =

2 Ep
zZe2

(3.13)
donde E = mv 2 / 2 es la energa de
la partcula incidente. Como en un
choque frontal la mxima distancia de acercamiento es

dq

q + dq

a=

p + dp

zZe2
E

(3.14)

podemos escribir la (3.13) como


cot( / 2) = 2 p / a (3.15)

Fig. 3.1. Dispersin de una partcula _ por un ncleo.

A partir de estos resultados es fcil


mostrar que la probabilidad por
unidad de ngulo slido de que
una partcula de energa E sea

dispersada en un ngulo es:


2

dP( ) nd zZe2
nda 2
4
csc 4 ( / 2)
=

csc ( / 2) =
d
16 E
16

(3.16)

donde d = 2send . La (3.16) es la famosa frmula de dispersin de Rutherford. Se puede


observar que el nmero de partcula dispersadas es proporcional a Z2, de modo que el estudio de
la dispersin de partculas permite determinar Z, un dato que no se conoca bien en su tiempo,
pues slo se saba que Z A / 2 gracias a los resultados de la dispersin de rayos X.
Las predicciones de la (3.16) fueron verificadas en 1913 por Geiger y Marsden y confirmaron de
modo sorprendente dicha frmula, y as convalidaron el modelo atmico de Rutherford. Corresponde tambin mencionar que la (3.16) vale tambin en el marco de la Mecnica Cuntica.
Dispersin hacia adelante
Para analizar la aplicacin de la frmula de Rutherford a los experimentos de dispersin de partculas es preciso aclarar primero algunas cuestiones. Se puede ver de la (3.16) que cuando
16

3. Estructura atmica
es muy pequeo, dP( ) / d es mayor que la unidad, y tiende al infinito para 0 . Claramente los experimentos indican que esto no ocurre. Pero debemos tener en cuenta que no tenemos derecho de extender la validez de la (3.16) a valores muy pequeos de , porque en ese caso
no se cumplen nuestras hiptesis bsicas: primero porque no se puede ignorar el efecto de los
electrones, segundo porque no es cierto que la desviacin total es el resultado de una nica colisin. El principal efecto de los electrones (adems de ocasionar ellos mismos dispersiones
mltiples) es el de apantallar la carga nuclear, de forma que una partcula que pasa lejos del
ncleo no experimenta toda la repulsin Coulombiana del mismo. Si bien por ahora no sabemos
cmo es la distribucin de carga debida a los electrones, lo que s sabemos es que a una distancia
del ncleo del orden del radio atmico R, el apantallamiento es completo y por lo tanto las partculas que inciden con parmetros de impacto mayores que R no experimentan desviacin. Si el
nmero de tomos por unidad de rea del blanco es bajo, de manera que ndR2 < 1, entonces la
probabilidad de dispersin es menor que la unidad. Esto es lo que ocurre, por ejemplo, con
blancos gaseosos de poco espesor (un blanco gaseoso de 1 cm de espesor a 102 mm Hg contiene
aproximadamente 4x1014 tomos/cm2, luego ndR2 0.1). En cambio cuando ndb 2 > 1 ocurre
dispersin mltiple. En este caso, la probabilidad total de dispersin no es igual a la probabilidad
de dispersin por tomo multiplicada por el nmero de tomos en el blanco, pues una vez que
una partcula ha chocado una vez, los choques subsiguientes no aumentan la probabilidad de
dispersin sino que solamente modifican la desviacin, como ya se vio anteriormente. Por lo
tanto, para lminas metlicas, la distribucin angular de las partculas dispersadas vara con
continuidad desde la distribucin de Rutherford para ngulos grandes hasta la distribucin de
dispersin mltiple para ngulos pequeos, de modo tal que la probabilidad total de dispersin
es siempre igual o menor que la unidad.
El tamao del ncleo
La frmula de Rutherford (3.16) se obtuvo suponiendo que el ncleo y las partculas son
cargas puntuales. Esta aproximacin vale siempre y cuando la distancia de mximo acercamiento sea mayor que el radio del ncleo. En consecuencia se puede decir que el radio del ncleo debe ser seguramente menor que el valor ms pequeo del acercamiento mximo para el
cual la (3.16) da todava el valor correcto del nmero de partculas dispersadas.
En la dispersin de las partculas emitidas por el radio ( E = 5.3 MeV ) por un blanco de cobre
(para el cual Z = 29, como se deduce a partir del nmero de partculas dispersadas) se observ
que la ley (3.16) vale hasta 180. En este caso de la (3.14) se deduce que

a = 1.58 10 12 cm

(3.17)

y por lo tanto se concluye que el radio del ncleo del cobre es menor o igual que dicha cantidad.
Comentarios sobre el modelo de Rutherford
En conclusin, los experimentos de Rutherford demostraron que el tomo contiene un ncleo de
muy pequeas dimensiones (radio menor o igual a 1012 cm), donde reside toda la carga positiva
y casi toda la masa del tomo. Tambin mostraron que la carga positiva, medida en unidades de

17

3. Estructura atmica
la carga electrnica, es decir el nmero Z, es igual (dentro del error experimental) al nmero
atmico del elemento8.
Por todo ello Rutherford propuso un modelo en el que el tomo est formado por un ncleo con
una carga positiva igual a Ze, alrededor del cual giran Z electrones, de manera que su movimiento equilibra dinmicamente la atraccin Coulombiana que sobre ellos ejerce el ncleo. La
extensin del movimiento electrnico determina que el tamao del tomo sea de aproximadamente 108 cm. Este concepto sugiere que las propiedades qumicas de un elemento estn determinadas por el nmero de electrones de sus tomos (y no por la masa atmica, como se pensaba
hasta entonces), y tambin sugiere que deben existir elementos para todos los valores posibles de
Z, hasta que Z se hace demasiado grande y el ncleo se vuelve inestable pues probablemente ya
no puede mantener ms carga positiva en su interior.
Sin embargo, es evidente que el modelo todava es incompleto y presenta serias fallas. En primer
lugar no se da todava ninguna idea acerca de cmo los electrones determinan las propiedades
qumicas. En segundo lugar tampoco se explica porqu todos los tomos de una misma especie
tienen aparentemente el mismo tamao, y adems, porqu los tomos de especies muy distintas
tienen casi exactamente el mismo tamao. Comentaremos este asunto en la siguiente Seccin.
Por ltimo, el modelo enfrenta una objecin an ms grave: al girar alrededor del ncleo, los
electrones sufren una aceleracin continua y por lo tanto deberan irradiar ondas electromagnticas y perder energa, y en consecuencia caer en espiral hacia el ncleo. Veremos ms adelante
que la solucin de esta dificultad requiere abandonar la fsica clsica.

La constante que est faltando


Consideremos el caso ms sencillo, el del tomo de Hidrgeno, pues es suficiente para entender
la esencia de la dificultad de explicar los tamaos atmicos. Supongamos que el electrn gira
alrededor del ncleo en una rbita circular. La fuerza centrpeta es la fuerza de Coulomb y por lo
tanto tendremos
mv 2 e 2
= 2
r
r

(3.18)

e2
m

(3.19)

que nos da la relacin


rv 2 =

En esta ecuacin r puede tener cualquier valor, pues la (3.19) slo nos dice que si escalamos r
por un factor k 2 es necesario escalar v por el factor k 1. Se puede verificar que la (3.19) equivale a la Tercera Ley de Kepler.
El origen del problema reside en que las nicas constantes que intervienen en el modelo clsico
del tomo de Rutherford son la carga y la masa del electrn, y con ellas no podemos formar una
longitud caracterstica.
Existe una manera de combinar e y m con una constante universal clsica, de modo de formar
una longitud, y es usar la velocidad de la luz, c. Se construye as la constante

Es decir el nmero por el cual se ordenan los elementos en la Tabla Peridica.

18

3. Estructura atmica
re

e2
13
cm
2 = 2.8 10
mc

(3.20)

Esta longitud es el radio clsico del electrn, que ya mencionamos en conexin con la dispersin Thomson, pero no tiene nada que ver con las dimensiones atmicas, ya que surge de
comparar el equivalente energtico de la masa del electrn con la energa del campo elctrico del
mismo electrn. Es obvio que la velocidad de la luz puede intervenir slo cuando se consideran
efectos relativsticos, y este no es el caso del tomo pues se ve de inmediato a partir de la (3.19)
que si r 10 8 cm resulta que v << c .
Adelantndonos a lo que veremos ms adelante en detalle, es fcil ver que el dilema se resuelve
si introducimos la constante de Planck h ( h = 6.63 10 27 erg s ). Es posible entonces formar la
longitud
a0

(h / 2 )2
= 0.529 10 8 cm
2
me

(3.21)

Esta longitud, que se denomina radio de Bohr, tiene efectivamente el orden de magnitud correcto. Esto sugiere que la constante de Planck desempea algn papel con respecto del tamao
de los tomos, aunque por el momento no sabemos cul, ni porqu.
En 1913 Niels Bohr reform el modelo de Rutherford del tomo de hidrgeno, postulando que
slo estaban permitidas las rbitas circulares cuyo momento angular fuera un mltiplo entero de
h = h / 2 , es decir, aquellas rbitas que cumplen
mvr = nh , n = 1, 2, 3,

(3.22)

Sustituyendo (3.22) en (3.19) obtenemos


r=

n2 h2
2
2 = n a0
me

(3.23)

Por lo tanto, de acuerdo con la condicin de Bohr (3.22), a0 es el radio de la primera rbita permitida ( n = 1) y representa efectivamente el radio del tomo de hidrgeno.
La hiptesis de Bohr se encuadra dentro de lo que hoy se denomina Teora Cuntica Antigua,
que tuvo considerable xito, pues permiti interpretar varias propiedades atmicas y tambin
resolver la paradoja de los calores especficos que resulta como consecuencia del Teorema de
Equiparticin. Sin embargo esta teora presenta varios inconvenientes y finalmente fue
abandonada cuando se introdujo la Mecnica Cuntica moderna. En el Captulo 5 la comentaremos ms en detalle. Pero primero conviene discutir algunas caractersticas de la radiacin electromagntica y de sus interacciones con la materia, que fueron histricamente las que llevaron a
introducir la constante de Planck y adems mostraron que las propiedades de la radiacin no se
pueden explicar satisfactoriamente en trminos del concepto clsico de onda.

19

4. Radiacin, fotones y la constante de Planck

4. RADIACIN, FOTONES Y LA CONSTANTE DE PLANCK


Introduccin
En el Captulo 3 vimos que el modelo atmico de Rutherford est de acuerdo con los resultados
de los experimentos de dispersin de partculas , pero que no hay ningn concepto de la fsica
clsica que permite explicar el tamao de los tomos. Aparentemente hay una constante de la
naturaleza, que an no sabemos cmo interviene en la teora, que determina sta y otras propiedades no clsicas de la materia y la radiacin. Cuando Rutherford formul su modelo ya se conoca esa constante: se trata de la constante de accin de Planck, que fuera introducida por Max
Planck cuando present un artculo sobre la radiacin de cuerpo negro en la Sociedad Fsica
Alemana a fines de 1900. En este Captulo presentaremos algunas evidencias de la naturaleza
universal de dicha constante, en lo referente a fenmenos en los que interviene la radiacin
electromagntica.

La teora de Planck de la radiacin de cuerpo negro


Ya estudiamos varios aspectos de la radiacin de cuerpo negro1 y por lo tanto no volveremos sobre ello, pero queremos recordar que al estudiar la Mecnica Estadstica mostramos que la cantidad de modos de radiacin electromagntica de frecuencia comprendida entre y + d presentes en una cavidad de volumen V est dada por

N ( )d =

8V 2
d
c3

(4.1)

y que la aplicacin del teorema de equiparticin, segn el cual a cada modo de oscilacin del
campo electromagntico le corresponde en el equilibrio una energa media = kT (k es la
constante de Boltzmann), lleva a la distribucin espectral de Rayleigh-Jeans2:
u( , T )d =

8 2
8 2 kT

=
d
c3
c3

(4.2)

donde u( , T ) es la densidad de energa (energa por unidad de volumen) en el intervalo de frecuencia ( , + d ). La (4.2) contradice la experiencia y es a todas luces absurda pues al
integrarla sobre todas las frecuencias predice una densidad de energa divergente (la catstrofe
ultravioleta). En esa poca se conoca la Ley de Wien, que se deduce a partir de argumentos
puramente termodinmicos, y que establece que

u( , T ) = c1 3g(c2 / T ) , c1, c2 = cte.

(4.3)

donde g es una funcin desconocida. La (4.3) implica que el mximo de u( , T ) ocurre para una
frecuencia m que es proporcional a la temperatura, esto es m ~ T . Por otra parte las medi1

Ver Termodinmica e introduccin a la Mecnica Estadstica, Captulos 15 y 18.

Deducida por Lord Rayleigh (John William Strutt) en 1900. En su trabajo, publicado en Nature en 1905, estim

mal el nmero de modos, por un factor 8 en exceso, error que fue corregido ese mismo ao por James Jeans.
Tambin corresponde mencionar que en 1905 Einstein obtuvo la frmula (4.2) en su artculo sobre el efecto
fotoelctrico que se comenta ms adelante.

20

4. Radiacin, fotones y la constante de Planck


ciones de u( , T ) que se conocan antes de 1900 cubran solamente el rango de frecuencias altas,
ms all del mximo de u( , T ) . En base a esos datos Wien propuso en 1896 la frmula emprica

u( , T ) = A 3e B / T

, A, B = cte.

(4.4)

que tiene la forma (4.3) y por lo tanto cumple la Ley de Wien, y con elecciones adecuadas de las
constantes permite un buen ajuste de las mediciones disponibles hasta ese momento.
En 1900 Otto Lummer y Ernst Pringsheim, y tambin Heinrich Rubens y Ferdinand Kurlbaum
llevaron a cabo mediciones muy precisas en un rango de frecuencias bajas que hasta entonces no
de haba estudiado y encontraron que la frmula (4.4) est en desacuerdo con los valores medidos, segn los cuales para frecuencias muy bajas se tiene

u( , T ) ~ 2 T

(4.5)

Al conocer estos resultados3 Planck propuso una frmula que interpolara entre (4.4) y (4.5).
Dicha frmula es la siguiente:
u( , T )d =

8 2
h
d
h / kT
3
c e
1

(4.6)

y es la clebre distribucin de Planck. Ajustando la (4.6) a la distribucin espectral observada,


Planck determin el valor de h (denominada constante de Planck) como 6.551027 erg s, un
valor muy cercano al actual4, con el cual obtuvo un perfecto acuerdo con las mediciones. No
conforme con esto procur comprender porqu la (4.6) concuerda tan bien con los resultados
experimentales y con ese fin trat de darle una base terica. No discutiremos aqu los
argumentos de Planck, que se explican en detalle en el Captulo 18 de Termodinmica e
Introduccin a la Mecnica Estadstica, slo diremos que lleg a la conclusin que la energa de
los osciladores materiales de la pared de la cavidad, que estn en equilibrio con la radiacin, se
forma a partir de un nmero finito de cuantos o parcelas de energa, cada uno de energa = h ,
con lo cual introdujo la cuantificacin de la energa. Pero en realidad fue Einstein quien aclar5
el significado de la frmula de Planck y de las hiptesis sobre la cuales se basa, al expresar que
la energa de los osciladores de Planck puede tomar slo valores que son mltiplos enteros del
cuanto h , y que en la absorcin y emisin de radiacin, la energa del oscilador cambia en
forma discontinua.
A continuacin vamos a mostrar cmo se debe modificar la teora clsica para obtener el
resultado correcto (4.6). Recordemos el origen de la Ley de Equiparticin. Bsicamente es una
consecuencia de la distribucin de Boltzmann, que en este caso expresa que la probabilidad
P( )d que un modo de oscilacin tenga una energa entre y + d vale
e / kT
P( )d =
Z

, Z = e / kT d

(4.7)

El lector puede notar que (4.5) es el resultado de la teora de Rayleigh-Jeans, que fue publicada recin en 1905,

despus de los hechos que estamos relatando. Por lo tanto Planck no conoca el resultado clsico (4.2).
4

El valor actual de h es 6.62607551027 erg s.

En su artculo de 1906 sobre la teora del calor especfico de un slido.

21

4. Radiacin, fotones y la constante de Planck


En trminos de la distribucin de Boltzmann, se expresa como

e / kT d

= P( )d =
0

(4.8)

e / kT d

y al calcular las integrales en la (4.8) se obtiene precisamente = kT .


La gran contribucin de Planck consisti en que advirti que poda obtener el resultado que buscaba si trataba como una variable discreta, en lugar de la variable continua que es en la Fsica
Clsica. A partir de esto Einstein lleg a la conclusin que para llegar a la (4.6) era preciso suponer que la energa de cada modo de oscilacin del campo de radiacin toma slo ciertos valores discretos, mltiplos enteros de h , en lugar de cualquier valor. Supongamos entonces que
los valores permitidos de la energa son

= 0, h , 2 h , 3h ,

(4.9)

Siendo as las integrales en la (*4.7) se deben reemplazar por sumas:

nh nh / kT
e
ne n

kT
d n
= n =0
= h n =0
= h
ln e

1 nh / kT
d n = 0

n
e
e
kT

n=0
n=0

nhP(nh )

n=0

P(nh )

n=0

(4.10)

donde = h / kT . Pero

e n =
n=0

1
1 e

(4.11)

y por lo tanto

= h

d
d

d
h
1
) = h e
=

=
ln
h

ln(
1
e
1 e

d
1 e
e 1

(4.12)

Resulta entonces6

h
e

h / kT

(4.13)

Usando este valor de en la (4.2) en lugar de kT se obtiene la (4.6), con lo cual queda
aclarado el origen de dicha frmula.
Recapitulando, no es preciso alterar la distribucin de Boltzmann, sino que hay que postular que
la energa de los osciladores de la radiacin misma puede tomar solamente los valores discretos
(4.9) y no cualquier valor, como predice la teora clsica.
6

Esta deduccin de la distribucin de Planck basada en suponer que la energa de cada modo de oscilacin del

campo de radiacin est cuantificada fue dada por Debye en 1910.

22

4. Radiacin, fotones y la constante de Planck

El postulado de Planck
La hiptesis de Planck se puede generalizar y enunciar como un postulado del modo siguiente:
Postulado de Planck:
cualquier ente fsico con un grado de libertad mecnico, cuya coordenada generalizada
realiza oscilaciones armnicas simples slo puede poseer valores discretos de la energa,
dados por

= nh

n = 0, 1, 2,

(4.14)

donde es la frecuencia de la oscilacin y h es una constante universal.


Si la energa del ente obedece el postulado de Planck se dice que est cuantificada, los niveles
de energa permitidos se llaman estados cunticos y el nmero entero n se denomina nmero
cuntico.
Se podra tal vez pensar que hay sistemas fsicos cuyo comportamiento no est de acuerdo con el
postulado de Planck, por ejemplo sistemas macroscpicos como el pndulo. Pero es fcil constatar que debido a la pequeez de h, en esos casos la diferencia de energa h entre los niveles es
insignificante: no se puede medir la energa de un sistema macroscpico con suficiente precisin
como para verificar si el postulado de Planck se cumple o no. Las consecuencias del postulado
de Planck se ponen de manifiesto solamente cuando es muy grande y/o es tan pequea que
= h es del mismo orden que . Un caso es el que acabamos de estudiar: la radiacin de alta
frecuencia del cuerpo negro.
Cabe subrayar que Planck restringi la cuantificacin de la energa a las oscilaciones de los
electrones radiantes de la pared de la cavidad del cuerpo negro, pues pensaba que una vez
emitida, la energa electromagntica se esparca por el espacio en forma de ondas. La extensin
de la cuantificacin de la energa a la radiacin misma se debe a Einstein, quien (como veremos
al tratar el efecto fotoelctrico) propuso que la energa radiante est cuantificada en paquetes
concentrados que hoy llamamos fotones o cuantos de luz.
Tambin debemos mencionar que el postulado de Planck resuelve el problema de los calores especficos de los slidos, cuya dependencia con la temperatura no se describe correctamente mediante la teora clsica basada en la equiparticin de la energa. El problema es enteramente
anlogo al de la radiacin de cuerpo negro y el lector lo puede encontrar tratado en el Captulo
18 de Termodinmica e introduccin a la Mecnica Estadstica.
En lo que sigue examinaremos los procesos de interaccin entre la radiacin y la materia.
Consideraremos el efecto fotoelctrico, el efecto Compton y la creacin de pares, que implican
la absorcin o dispersin de radiacin, y procesos de emisin de radiacin como el bremsstrahlung (o radiacin de frenamiento) y la aniquilacin de pares. En todos estos casos la evidencia experimental indica que en sus interacciones con la materia la radiacin se comporta como
corpsculo, a diferencia de su naturaleza ondulatoria cuando se propaga.

El efecto fotoelctrico
El efecto fotoelctrico fue descubierto por Hertz en 1887, cuando observ que una descarga
elctrica entre dos electrodos se produce ms fcilmente si sobre uno de ellos incide luz ultravioleta. Poco despus, los trabajos de Wilhelm Hallwachs (1888), J. J. Thomson (1899) y
Philipp L. A. Lenard (1900) demostraron que la luz ultravioleta facilita la descarga porque
provoca la emisin de electrones desde la superficie del ctodo y determinaron las caractersticas

23

4. Radiacin, fotones y la constante de Planck


de dicha emisin, un fenmeno que se denomin efecto fotoelctrico. La Fig. 4.1 muestra el
esquema de un experimento para estudiar el efecto fotoelctrico
La Fig. 4.2 muestra la corriente fotoelctrica como funcin de la diferencia de potencial entre
ctodo y nodo. Se observa que para V suficientemente grande, i alcanza un valor lmite, o de
saturacin, para el cual todos los electrones emitidos por el ctodo son colectados por el nodo.
La corriente de saturacin es proporcional a la intensidad del haz de luz que incide sobre el ctodo. Si V se hace negativo, la corriente no cae de inmediato a cero, lo que sugiere que los electrones son emitidos con cierta energa cintica, de modo que algunos alcanzan el otro electrodo a
pesar que el campo elctrico se opone a su movimiento. Sin embargo, para cierto valor negativo
V0 , llamado potencial de frenamiento, la corriente fotoelctrica se anula.
luz ultravioleta
ventana de cuarzo

ctodo

nodo

i
ia
ib

i
V
V
V0
0 +
Fig. 4.2. Corriente vs. voltaje en el aparato
de la fig. 4.1. La curva b corresponde a luz
cuya intensidad es la mitad de la de la curva
a.

Fig. 4.1. Experimento para estudiar el efecto


fotoelctrico. El dispositivo est bajo vaco.
El voltaje V entre el ctodo y el nodo se
puede variar de forma continua, y se mide la
corriente i.

La energa cintica mxima de los fotoelectrones es entonces

V0

Kmax = eV0

i0

Fig. 4.3. Potencial de frenamiento en funcin


de la frecuencia de la luz.

(4.15)

y es independiente de la intensidad de la luz.


El comportamiento del potencial de frenamiento V0 como funcin de la frecuencia de
la luz fue estudiado por Millikan en 1914 y se
obtuvo un grfico lineal como el de la Fig. 4.3.
Se observa una frecuencia de corte 0 bien definida, que depende del material del ctodo, por

debajo de la cual no hay efecto fotoelctrico.


Hay tres aspectos fundamentales del efecto fotoelctrico que no se pueden explicar en trminos
de la teora ondulatoria clsica de la luz:
Segn la teora ondulatoria, la intensidad del haz luminoso es proporcional al cuadrado de la
amplitud E del campo elctrico oscilante de la onda. Como la fuerza sobre el electrn es eE,
la energa cintica de los fotoelectrones debera aumentar con la intensidad del haz, pero el

24

4. Radiacin, fotones y la constante de Planck


experimento muestra que Kmax es independiente de la intensidad del haz; esto fue probado
sobre un rango de intensidades de 107.
Segn la teora ondulatoria el efecto fotoelctrico debera ocurrir para cualquier frecuencia,
con tal que el haz tenga suficiente intensidad como para suministrar la energa necesaria para
emitir los fotoelectrones. Pero el experimento muestra que para cada superficie hay una frecuencia de corte 0 , por debajo de la cual no hay efecto fotoelctrico, sin que importe cun
intenso sea el haz de luz.
Si la energa que adquiere el fotoelectrn es absorbida de la onda, debe tenerse presente que
la seccin eficaz de absorcin para un electrn en un metal difcilmente sea mucho mayor
que la seccin transversal de un tomo. Por otra parte, en la teora clsica, la energa luminosa est uniformemente distribuida sobre el frente de onda. Por lo tanto, si la intensidad de
la luz es baja, cabra esperar que exista un tiempo de retraso fcilmente medible, entre el
instante en que la luz comienza a incidir sobre el ctodo y el momento en que es emitido el
fotoelectrn, pues durante ese intervalo el electrn ir absorbiendo la energa del haz hasta
acumular la que necesita para escapar7. Sin embargo nunca se observ tal retraso.

Teora cuntica de Einstein del efecto fotoelctrico


En 1905 Einstein, influenciado por los trabajos de Lenard, puso en duda la teora clsica de la
luz y varios aos antes de los experimentos de Millikan propuso que la energa luminosa est
cuantificada en paquetes concentrados, a los que hoy llamamos fotones. El argumento de
Einstein se apoyaba en que los experimentos de interferencia y difraccin de la luz, sobre los
cuales se basa la teora ondulatoria, se efectan en situaciones en que el nmero de fotones es
muy grande. Por lo tanto sus resultados representan el promedio de los comportamientos de los
fotones individuales, lo que explica porqu en esos experimentos no manifiestan los fotones.
Por cierto, los experimentos clsicos de interferencia y difraccin muestran de manera definitiva
que los fotones no viajan desde donde son emitidos hasta donde son finalmente absorbidos del
mismo modo que lo hara una partcula clsica: viajan como ondas, en el sentido que los clculos
basados en la propagacin de ondas explican correctamente los patrones de interferencia y de
difraccin, que dependen, como dijimos, del modo en que se desplazan en promedio los fotones.
Pero Einstein no se preocup de la propagacin de la radiacin, sino de como es emitida y
absorbida. Pens que si la energa contenida en las ondas electromagnticas de frecuencia slo
puede ser un mltiplo entero de h, entonces en el proceso de emisin se producen cuantos de
energa electromagntica, cada uno de los cuales lleva una energa h. Einstein supuso que esos
cuantos estn localizados inicialmente en una pequea regin del espacio, y que se mantienen
localizados mientras se alejan de la fuente con la velocidad c. Supuso adems que la energa de
cada paquete o fotn est relacionada con su frecuencia de acuerdo con la ecuacin
E = h

(4.16)

Tambin supuso que en el efecto fotoelctrico cada fotn es completamente absorbido por un
electrn.

Una sencilla estimacin muestra que si la energa necesaria para extraer un fotoelectrn es de 2 eV y la seccin

eficaz de absorcin es igual al rea transversal de un tomo, con una fuente luminosa de 1 W a 1 m de distancia se
precisaran 200 s para que el electrn adquiera la energa necesaria para escapar.

25

4. Radiacin, fotones y la constante de Planck


Cuando un electrn es emitido por el fotoctodo, su energa cintica es entonces
K = h w

(4.17)

donde h es la energa del fotn absorbido y w es el trabajo necesario para extraer el electrn del
metal. Este trabajo toma en cuenta el efecto de los campos elctricos atractivos debidos a los
tomos de la superficie y las prdidas de energa cintica del electrn causadas por las colisiones
que sufre hasta que sale de la superficie. Algunos electrones estn ligados ms fuertemente que
otros, o soportan ms colisiones en el trayecto. Por lo tanto es lgico suponer que hay una energa cintica mxima con la cual un fotoelectrn puede ser emitido, que se tiene cuando la energa
de unin del electrn es la mnima posible y cuando ste no pierde energa cintica por colisiones. Esta energa cintica mxima es

Kmax = Kmax ( ) = h w0

(4.18)

donde w0 , que se denomina la funcin trabajo, es la energa mnima necesaria para extraer un
electrn del metal y es una propiedad del metal del ctodo.
Veremos ahora que las hiptesis de Einstein explican satisfactoriamente el efecto fotoelctrico,
lo que no se logra en cambio con la teora ondulatoria clsica.
El primer hecho, que Kmax es independiente de la intensidad de la luz, es consecuencia de la
(4.18). De acuerdo con la teora de Einstein, la intensidad de la luz es proporcional al nmero
de fotones que llegan a la superficie (por unidad de tiempo y de rea), por lo tanto la corriente fotoelctrica es proporcional a la intensidad, pero cada proceso individual de emisin
es independiente de la intensidad y slo depende de la frecuencia de la radiacin.
La existencia de una frecuencia de corte, es tambin una consecuencia de la (4.18). En
efecto, para cada metal, existe una frecuencia 0 tal que

h 0 = w0

(4.19)

y para esa frecuencia Kmax ( 0 ) = 0 . En otras palabras, un fotn de la frecuencia 0 tiene


justamente la energa suficiente para extraer un fotoelectrn, sin que le sobre nada que pueda
aparecer como energa cintica del electrn. Si < 0 , los fotones no tienen energa suficiente para extraer fotoelectrones y no hay efecto fotoelctrico, por grande que sea la intensidad (o sea el flujo de fotones) del haz de luz.
La ausencia del tiempo de retraso tambin se explica, pues la energa necesaria para que el
electrn sea emitido se suministra en paquetes concentrados. Tan pronto la iluminacin del
fotoctodo deja de ser nula, hay por lo menos un fotn, que puede ser absorbido provocando
la emisin de un fotoelectrn.
Si sustituimos Kmax = eV0 (ec. (4.15)) en la ecuacin de Einstein (4.18) obtenemos

V0 =

h w0

e
e

(4.30)

Por lo tanto, la teora de Einstein predice que el potencial de frenamiento V0 es una funcin lineal de , en perfecto acuerdo con los resultados experimentales (Fig. 4.3). La pendiente de la
curva experimental permite determinar

26

4. Radiacin, fotones y la constante de Planck

h
= 3.9 10 15 V s
e

(4.31)

Multiplicando esta relacin por la carga electrnica se puede determinar h. Examinando cuidadosamente estos datos Millikan encontr h = 6.57 10 34 J s con una precisin del 0.5%, valor
que concuerda con el que obtuvo Planck. Es ciertamente notable el acuerdo entre estas dos
determinaciones de h usando fenmenos y teoras completamente diferentes, y es una prueba de
la validez de la suposicin fundamental del cuanto de luz, o fotn.
Actualmente el concepto de fotn se usa en todo el espectro electromagntico y no slo en el
visible o cerca de l. La energa de los fotones vara en 18 rdenes de magnitud desde las ondas
de VLF ( 10 4 Hz ) a los fotones ms energticos de los rayos csmicos ( 10 22 Hz ).
Cabe mencionar que para que un fotn pueda ser absorbido, como ocurre en el efecto fotoelctrico, es preciso que el electrn est ligado a un tomo o a un slido. Un electrn libre no puede
absorber un fotn pues, como veremos luego, en tal proceso no se pueden conservar simultneamente la energa y la cantidad de movimiento (por la misma razn un electrn libre tampoco
puede emitir un fotn). Para que el electrn absorba (o emita) un fotn debe intervenir en el proceso una tercera partcula, pues slo as se pueden conservar tanto la energa como la cantidad de
movimiento. Debido a la gran masa de un tomo o de un slido, el sistema puede absorber la
cantidad de movimiento necesaria para el balance sin adquirir una cantidad apreciable de energa. Por lo tanto la ecuacin de la energa (4.18) sigue siendo vlida, y el efecto es posible porque adems del electrn emitido existe una partcula pesada que absorbe la cantidad de movimiento necesaria para conservar el impulso. Para fotones de energa comparable a las de los rayos X o superiores, el efecto fotoelctrico es un mecanismo importante de absorcin. A energas
todava mayores se vuelven importantes otros procesos que estudiaremos ms adelante. Por ltimo, es preciso recalcar que en el modelo de Einstein un fotn de frecuencia tiene exactamente la energa h, y no mltiplos enteros de h. Segn el modelo de Einstein, la radiacin de
la cavidad de un cuerpo negro constituye un gas de fotones. Aplicando este concepto, aos
despus de la deduccin de Planck, Satyendra Nath Bose volvi a obtener la frmula8 (4.6).

El efecto Compton
En 1923 los experimentos de Arthur Holly Compton dieron una nueva confirmacin de la naturaleza corpuscular de la radiacin. Compton hizo incidir un haz colimado de rayos X de longitud
de onda bien definida sobre un blanco de grafito y midi la intensidad y la longitud de onda de
los rayos dispersados en varias direcciones. Se observ que aunque el haz incidente consiste
esencialmente de una nica longitud de onda, en los rayos X dispersados en direcciones que
forman un ngulo no nulo con la direccin del haz, aparecen dos longitudes de onda: una es la
misma de la radiacin incidente y la otra, , es mayor, esto es = + . Este corrimiento
, denominado corrimiento Compton, vara con el ngulo en que se observan los rayos X
dispersados.

Es interesante mencionar que el artculo de Bose fue rechazado por el rbitro de la revista Philosophical Magazine,

a la cual lo haba presentado; de resultas de ello Bose lo envi a Einstein, quien lo tradujo personalmente al alemn
y lo hizo publicar el Zeitschrift fr Physik. Posteriormente Einstein generaliz el mtodo de Bose y lo aplic a
partculas con masa. Las teoras de Bose y de Einstein se tratan en el Captulo 15.

27

4. Radiacin, fotones y la constante de Planck


La presencia de una longitud de onda diferente de la de la radiacin incidente en la radiacin
dispersada no se puede explicar si se considera la radiacin X como una onda electromagntica
clsica. De acuerdo con el Electromagnetismo clsico el campo elctrico de la onda incidente,
que oscila con la frecuencia , acta sobre los electrones libres del blanco y los fuerza a oscilar
con esa misma frecuencia. Los electrones oscilantes irradian en todas las direcciones ondas
electrmagnticas, de frecuencia igual a la de la oscilacin. Por lo tanto, segn la teora clsica, la
radiacin dispersada tiene la misma frecuencia y longitud de onda que la radiacin incidente.
Ante estos hechos, Compton (y tambin independientemente Peter Debye) interpret los
resultados del experimento suponiendo que la radiacin X incidente est compuesta por fotones,
cada uno de los cuales lleva una energa E = h y
E', p', h'
que esos fotones chocan con los electrones libres
fotn
del blanco. Segn este punto de vista, los fotones
que han chocado constituyen la radiacin
E, p, h
e
dispersada. Como en la colisin el fotn cede
parte de su energa al electrn, el fotn dispersado
q
electrn
debe tener una energa menor, E < E , luego una
frecuencia menor = E / h y entonces una
K, pe
longitud de onda mayor = c / . As se explica
cualitativamente el corrimiento = .
Los experimentos indican que la frecuencia de la
Fig. 4.4. Efecto Compton.
radiacin dispersada es independiente del material
del blanco, lo que significa que la colisin no involucra tomos completos. Por lo tanto Compton
supuso que la dispersin se debe a la colisin entre un fotn y un particular electrn del blanco,
y adems supuso que los electrones que participan en estos procesos se pueden considerar libres
e inicialmente en reposo. Se pueden justificar estas suposiciones teniendo en cuenta que la
energa de un fotn X es varios rdenes de magnitud mayor que la de un fotn ultravioleta, y al
estudiar el efecto fotoelctrico vimos que esta ltima es comparable a la energa mnima con la
cual un electrn est ligado a un metal.
Vamos a analizar ahora cuantitativamente la colisin entre un fotn y un electrn (Fig. 4.4). Si
suponemos que el fotn es una partcula de energa E = h que se mueve con la velocidad de la
luz, es evidente que su masa en reposo debe ser nula, por lo tanto su energa total relativstica es
puramente cintica. La cantidad de movimiento del fotn se puede obtener de la relacin general
entre la energa relativstica E, la cantidad de movimiento p y la masa en reposo m:

E 2 = c 2 p2 + m 2c 4

(4.32)

p = E / c = h / c = h /

(4.33)

Puesto que para un fotn m = 0, resulta

Cabe observar que el Electromagnetismo clsico conduce tambin a la relacin p = E / c donde


p y E son respectivamente la cantidad de movimiento y la energa de la radiacin, por unidad de
volumen.
La conservacin de la cantidad de movimiento (ver Fig. 4.4) implica

p = p cos + pe cos
28

(4.34)

4. Radiacin, fotones y la constante de Planck


y

psen = pesen

(4.35)

donde p y pe son la cantidad de movimiento del fotn y del electrn luego de la colisin y ,
son los ngulos entre p y p , pe , respectivamente. Eliminando entre estas ecuaciones resulta

p2 + p 2 2 pp cos = pe2

(4.36)

La conservacin de la energa relativstica total requiere

E + mec 2 = E + mec 2 + K

(4.37)

donde K es la energa cintica del electrn despus de la colisin. Usando la (4.33), la condicin
de conservacin de la energa se escribe como
c( p p ) = K

(4.38)

Usando la (4.32) podemos escribir K en funcin de pe :

( mec 2 + K )2 = c 2 pe2 + me2 c 4

(4.39)

2 Kme + K 2 / c 2 = pe2

(4.40)

que se reduce a

Usando ahora la (4.38), la condicin de conservacin de la energa se escribe como

2 mec( p p) + ( p p)2 = pe2

(4.41)

Finalmente podemos eliminar pe entre la (4.36) y la (4.41) para obtener la relacin entre p y p :

mec( p p) = pp(1 cos )

(4.42)

1 1
1
=
(1 cos )
p p mec

(4.43)

que podemos escribir en la forma

Recordando la (4.33), la (4.43) se puede llevar a la forma

h
(1 cos )
mec

(4.44)

La (4.44), que expresa entonces la conservacin de la energa y la cantidad de movimiento en la


colisin es la ecuacin de Compton. La cantidad

C =

h
= 2.42631058 10 10 cm
mec

29

(4.45)

4. Radiacin, fotones y la constante de Planck


se denomina longitud de onda Compton del electrn. En trminos de C el corrimiento
Compton se expresa como

= C (1 cos )

(4.46)

Se puede observar que el corrimiento Compton depende solamente del ngulo de dispersin , y
es independiente de la longitud de onda del fotn incidente.
La ecuacin de Compton describe correctamente los corrimientos observados. De acuerdo con la
(4.46) vara desde 0 para = 0 (que corresponde a una colisin rasante en la que el fotn
incidente no sufre desviacin) hasta 2C para = 180 (colisin frontal, en la cual el fotn regresa en la misma direccin desde la cual vino). En experimentos posteriores Compton y A. W.
Simon (1925) detectaron tambin el electrn de retroceso que resulta de la colisin y
comprobaron que aparece simultneamente con la radiacin X dispersada. Tambin verificaron
la prediccin sobre la energa y direccin de movimiento del electrn dispersado. Con esto
quedaron reivindicadas las ideas de Einstein y ya nadie dud de la realidad de los fotones.
Falta todava explicar porqu para ngulos 0 se observan fotones dispersados con la misma
longitud de onda de la radiacin incidente. Hasta aqu hemos supuesto que el electrn que sufre
la colisin est libre. Esta suposicin es razonable, incluso si el electrn est inicialmente ligado,
siempre y cuando la energa cintica que adquiere en la colisin sea mucho mayor que su
energa de ligadura. Sin embargo, si el electrn est fuertemente ligado, o si la energa del fotn
incidente es muy pequea, el electrn no es expulsado del tomo. Entonces la colisin ocurre, en
la prctica, con el tomo como un todo y podemos repetir las consideraciones anteriores acerca
de la conservacin de la energa y la cantidad de movimiento, pero en lugar de la masa me del
electrn, tenemos que poner la masa ma del tomo, pues ste retrocede como un todo durante la
colisin. Puesto que ma es varios miles de veces mayor que me , el corrimiento Compton para
colisiones con electrones fuertemente ligados es insignificante e imposible de detectar.
En conclusin: en el experimento se observan los fotones dispersados por los electrones dbilmente ligados, que son expulsados del tomo por la colisin, y esos fotones cambian su longitud
de onda, pero tambin se observan fotones dispersados por otros electrones fuertemente ligados,
que siguen ligados despus de la colisin; estos fotones no cambian su longitud de onda.
El proceso de dispersin sin cambio de la longitud de onda no es otra cosa que la dispersin de
Thomson, de la cual hemos ya hablamos en el Captulo 3. La correspondiente teora fue desarrollada por Thomson en 1900 en a partir del Electromagnetismo clsico. Pese a que la deduccin
de la dispersin Thomson es diferente de la presente interpretacin cuntica de la dispersin
Compton, ambas explican los mismos hechos, pues la dispersin Thomson es el lmite de la dispersin Compton, cuando la longitud de onda de la radiacin incidente es muy larga, esto es,
cuando = C / 0 . En ese lmite los resultados clsico y cuntico coinciden.
La fsica clsica falla al explicar la dispersin de radiacin en el dominio de las frecuencias muy
altas, es decir longitudes de onda muy cortas. Ocurre aqu algo semejante a la catstrofe ultravioleta, donde las predicciones clsicas fallan groseramente al intentar describir la radiacin de
cuerpo negro. Esto se relaciona con el valor de la constante de Planck. Para longitudes de onda
muy largas, es muy pequea y como h tambin es muy pequea, la granulosidad h de la
energa electromagntica es imperceptible y se confunde con el continuo de la fsica clsica.
Pero para longitudes de onda suficientemente cortas h ya no es pequeo y los efectos cunticos
son importantes.

30

4. Radiacin, fotones y la constante de Planck


Para completitud citamos la frmula de Klein-Nishina que expresa la seccin eficaz de la dispersin Compton9:

C = T f () , =

= C
2
mec

(4.47)

donde T = 8r02 / 3 es la seccin eficaz clsica de Thomson; los efectos cunticos estn contenidos en la funcin f ( ) , que tiene la expresin complicada que damos a continuacin:

f () =

3(1 + ) 2 + 2 ln(1 + 2 ) 3 1 + 3
ln(1 + 2 )

2
2
4 (1 + 2 )
4
1 + 2
2

(4.48)

Obsrvese que es igual al cociente entre la energa del fotn y la energa en reposo del electrn. Para pequeos, se ve fcilmente que
f () = 1 2 +

26 2
5

(4.49)

En el lmite 0 se tiene f ( ) = 1 y la (4.47) se reduce a la frmula clsica de Thomson.


Por ltimo, podemos ver que el balance de la cantidad de movimiento (4.36)

p2 + p 2 2 pp cos = pe2

(4.50)

2 mec( p p) + ( p p)2 = pe2

(4.51)

y de la energa

no se pueden satisfacer simultneamente si el fotn es absorbido por el electrn libre. En efecto,


si el fotn fuera absorbido se tendra p = 0 , y la (4.50) y (4.51) se reducen, respectivamente a

p2 = pe2

2 mecp + p2 = pe2

(4.52)

que no se pueden satisfacer simultneamente. Por lo tanto un electrn libre no puede absorber
un fotn. Del mismo modo se puede ver que un electrn libre no puede emitir un fotn.

La emisin de rayos X
Los rayos X se producen en un tubo de descarga cuando electrones de alta energa acelerados
por una diferencia de potencial de 104 V, se frenan al penetrar en el material del nodo10. Segn la fsica clsica, el frenamiento de los electrones resulta en la emisin de un espectro continuo de radiacin electromagntica, que se denomina radiacin de frenamiento o tambin
bremsstrahlung (que significa lo mismo en idioma alemn). La observacin muestra que, adems del espectro continuo de bremsstrahlung, tambin se emiten lneas caractersticas del material del nodo, pero por el momento no nos ocuparemos de ellas.
La caracterstica ms notable de la emisin de rayos X por estos dispositivos es que para una
dada energa del electrn hay una longitud de onda mnima m bien definida. Por ejemplo para
9
10

Obtenida por Oskar Klein y Yoshio Nishina en 1928 a partir de la teora relativstica de Dirac.
Este fenmeno se llama Efecto Volta.

31

4. Radiacin, fotones y la constante de Planck


electrones de 40 keV, m = 0.311 . Mientras la forma de la distribucin espectral depende
tanto del material del blanco como del potencial V de aceleracin, m depende slo de V y tiene
el mismo valor para todos los materiales. El Electromagnetismo clsico no explica este hecho,
porque no hay motivo para que no se puedan emitir radiaciones de cualquier longitud de onda.
Sin embargo si se considera que la radiacin X
fotn
consiste de fotones la explicacin es muy simple.
La Fig. 4.5 muestra un esquema del proceso eleK
mental de emisin de un fotn por bremsstrahlung. Un electrn de energa cintica inicial K
se frena al chocar con un ncleo y la energa que
electrn
pierde aparece como un fotn de rayos X. La intencleo
raccin Coulombiana del electrn con el ncleo
K'
hace que ste absorba cierta cantidad de movimiento, y el frenamiento del electrn produce la
Fig. 4.5. Emisin de rayos X por
emisin del fotn. Como la masa del ncleo es
bremsstrahlung.
mucho mayor que la del electrn, se puede ignorar la energa que adquiere en la colisin. Si K es la energa cintica del electrn despus de la
colisin, la energa del fotn emitido es

h =

hc
= K K

(4.53)

Los electrones del haz incidente pueden perder diferentes cantidades de energa en las colisiones, y un dado electrn queda en reposo despus de cierto nmero de ellas. Es as que muchos
electrones producen en conjunto un espectro continuo que se extiende desde m hasta ,
de acuerdo con las prdidas de energa de las colisiones individuales. Un fotn de longitud de
onda m se emite cuando el electrn pierde toda su energa en un nico choque. Cuando esto
ocurre, K = 0, y entonces K = hc / m . Puesto que K es igual a la energa eV que adquiri el
electrn al acelerarse en la diferencia de potencial V del tubo de rayos X, se tiene

m =

hc
eV

(4.54)

Por lo tanto m corresponde a la conversin de toda la energa cintica del electrn en un nico
fotn. La (4.54) muestra que la existencia de m es un fenmeno puramente cuntico11.
El bremsstrahlung es, como vemos, una suerte de efecto fotoelctrico inverso: en el efecto fotoelctrico se absorbe un fotn cuya energa y cantidad de movimiento van al electrn y al ncleo, en el bremsstrahlung se crea un fotn cuya energa y cantidad de movimiento provienen de
la colisin de un electrn con un ncleo12. El bremsstrahlung no slo ocurre en los tubos de
rayos X, sino que tiene lugar tambin en muchas situaciones en la naturaleza y en el laboratorio.

11

La existencia de

fue predicha por Einstein en 1906, y la evidencia experimental fue obtenida por William

Duane y Franklin Hunt en 1915. Por ese motivo


12

m se denomina lmite de Duane-Hunt.

En 1909 Johannes Stark aplic la hiptesis del cuanto de luz al bremsstrahlung y concluy que la conservacin

de la cantidad de movimiento requiere que el cuanto de luz posea un impulso igual a h/c. Esta fue la primara vez
que se incluy explcitamente el fotn en el balance de la cantidad de movimiento de un proceso elemental.

32

4. Radiacin, fotones y la constante de Planck

Creacin y aniquilacin de pares


Adems del efecto fotoelctrico y el efecto Compton, hay otro proceso mediante el cual un fotn
de alta energa puede perder su energa al interactuar con la materia. Se trata de la creacin de
pares, que es un ejemplo de conversin de la energa radiante en energa de masa en reposo y
energa cintica de partculas. Aqu vamos a comentar brevemente este proceso y su proceso inverso, la aniquilacin de pares, pero no daremos sus tratamientos completos ya que requieren la
teora cuntica relativstica de campos.
Creacin de pares
Hay hoy una amplsima evidencia experimental acerca de la creacin de pares, pero no existe
explicacin de este fenmeno en la fsica clsica. En la Fig. 4.6 se muestra un esquema de un
proceso de este tipo, que consiste en que un fotn pierde toda su energa h en una colisin con
un ncleo, creando un par de partculas integrado por un electrn y un positrn y dndoles adems cierta energa cintica. El positrn es una partcula idntica en todas sus propiedades al
electrn, excepto que el signo de su carga (y de
electrn
su momento magntico) es opuesto al del electrn: esto es, el positrn es un electrn con carga
e , Ke
positiva en lugar de negativa. El positrn es lo
fotn
que se denomina la antipartcula del electrn.
La teora cuntica de campos predice que cada
hi
+e , Kp
partcula tiene una correspondiente antipartncleo
cula, y esta prediccin se ha verificado siempre.
En general, cuando se habla de par se entiende
positrn
un par formado por una partcula y su correspondiente antipartcula. En la creacin de
Fig. 4.6. Produccin de un par electrnpares electrn-positrn la energa involucrada en
positrn.
el retroceso del ncleo es despreciable debido a
su masa, y por lo tanto el balance de la energa (relativstica) es
h = Ee + E p = ( mec 2 + Ke ) + ( m pc 2 + K p ) = 2 mec 2 + Ke + K p

(4.55)

puesto que m p = me . En esta frmula los subndices e y p se refieren al electrn y al positrn,


respectivamente. La energa cintica del positrn es ligeramente mayor que la del electrn debido a que la carga positiva del ncleo acelera al positrn y frena al electrn. La carga elctrica
total se conserva, pues el fotn no tiene carga y la carga neta del par es nula.
Haciendo los balances de energa y cantidad de movimiento, es fcil verificar que un fotn no
puede desaparecer en el vaco creando un par: es necesaria la presencia del ncleo (que puede
absorber cantidad de movimiento sin afectar sensiblemente el balance de energa) para permitir
la conservacin simultnea de la cantidad de movimiento y la energa.
De la (4.55) se ve que hay una energa mnima, o umbral, que debe tener el fotn para crear un
par:

h min = 2 mec 2 1.02 MeV

33

(4.56)

4. Radiacin, fotones y la constante de Planck


que corresponde a una longitud de onda = C / 2 = 0.012 . Si la longitud de onda del fotn es
menor que este valor, el fotn crea el par con energa cintica no nula.
Como se ve, la creacin de pares es un fenmeno de alta energa, que ocurre con rayos X cortos
o rayos . Se observa en la naturaleza debido a los fotones de alta energa de los rayos csmicos
y a los rayos emitidos por sustancias radioactivas, y en el laboratorio debido a los fotones de
bremsstrahlung producidos en los aceleradores de partculas.
Si el fotn tiene suficiente energa es posible crear otros pares partcula-antipartcula, por ejemplo pares protn-antoprotn, y otros ms. Como la masa en reposo del electrn es la menor entre
las partculas posibles, el umbral para la creacin de pares electrn-positrn es el ms bajo.
Aniquilacin de pares
El proceso inverso a la creacin de pares es la aniquilacin de pares. Si una partcula y su antipartcula, por ejemplo un electrn y un positrn se encuentran inicialmente en reposo y prximos
entre s, se unen y se aniquilan mutuamente. En este proceso desaparece la materia y en su lugar
aparece energa radiante. Puesto que la cantidad de movimiento inicial del conjunto es nula, y el
proceso debe conservar la cantidad de movimiento, no es posible crear un nico fotn. El
proceso ms probable es la creacin de dos fotones, con cantidades de movimiento iguales pero
de signo opuesto. Pero tambin es posible, aunque mucho menos probable, la aniquilacin con
creacin de tres (o ms) fotones.
Consideremos la aniquilacin con creacin de dos fotones. La conservacin de la cantidad de
movimiento requiere p1 = p2 . Como para un fotn p = h / c , lo anterior implica 1 = 2 = .
Puesto que las energa cinticas de las partculas del par son nulas, la conservacin de la energa
requiere

h = mec 2 = 0.511 MeV

(4.57)

Esto corresponde a una longitud de onda igual a

h
= C
mec

(4.58)

es decir, igual a la longitud de onda Compton.


Los positrones que se crean en el proceso de produccin de pares pierden energa al atravesar la
materia en sucesivas colisiones, hasta que se combinan con un electrn para formar un sistema
ligado denominado positronio, en el cual el electrn y el positrn se mueven alrededor de su
centro de masa comn. El positronio tiene una vida muy corta ya que en un tiempo de alrededor
de 1010 s desde su formacin, el electrn y el positrn se aniquilan.
Comentarios
La primera evidencia experimental de la existencia del positrn fue obtenida por Carl David
Anderson en 1932 al investigar la radiacin csmica13. En 1933 Patrick M. Blackett y Giuseppe
Occhialini observaron por la primera vez la creacin de pares electrn-positrn, utilizando una
cmara de niebla. Este descubrimiento permiti explicar el origen de una discrepancia entre las
13

La radiacin csmica consiste en un flujo de partculas cargadas y fotones de gran energa que inciden sobre la

Tierra provenientes de fuentes extraterrestres.

34

4. Radiacin, fotones y la constante de Planck


mediciones de la atenuacin de rayos X de gran energa por diversos materiales y la teora entonces existente. La atenuacn predicha por la teora era muy pequea en comparacin con la
observada, pues la creacin de pares es el mecanismo de absorcin que domina para fotones de
alta energa. Pero la mayor importancia de estos descubrimientos fue que confirm la teora
cuntica relativstica de Dirac, que en 1928 predijo la existencia del positrn y los procesos de
creacin y aniquilacin de pares.

La naturaleza dual de la radiacin electromagntica


Acabamos de estudiar varios fenmenos que muestran que la radiacin electromagntica se
comporta como un conjunto de partculas, los fotones, que intervienen individualmente en los
procesos elementales de emisin, absorcin y dispersin. Sin embargo, los fenmenos de interferencia y difraccin muestran que la radiacin es un fenmeno ondulatorio. Por lo tanto la radiacin electromagntica se comporta como onda en ciertas circunstancias y como corpsculo en
otras. Veremos pronto que las partculas atmicas, como el electrn y el protn, tambin exhiben
la misma clase de dualidad, pues adems de comportarse como partculas, en ciertas circunstancias se comportan como ondas, pudiendo dar lugar a fenmenos de interferencia y difraccin.
Esta dualidad onda-partcula es caracterstica de todos los entes de escala atmica o menor, y no
es compatible con nuestra experiencia a nivel macroscpico ni con la descripcin dada por la
fsica clsica. Sin embargo, veremos oportunamente que la Mecnica Cuntica permite reconciliar la coexistencia de los aspectos corpusculares y ondulatorios de estos entes.
Es oportuno subrayar en este contexto que los conceptos de onda y de partcula son extrapolaciones de experiencias a nivel macroscpico. As, en la Mecnica Newtoniana se trata un
planeta como la Tierra como una partcula. Creemos en ese concepto porque la Mecnica
Newtoniana (o la relativstica, si la velocidad es muy elevada) permite calcular correctamente el
movimiento. Aplicando los mismos mtodos podemos describir fenmenos de escala ms pequea, como el movimiento de partculas de polvo o de las gotas de un aerosol. Pero este no es
un motivo suficiente para dar por sentado que el concepto macroscpico de partcula se puede
extrapolar indefinidamente, hasta la escala del tomo y ms all de ella. Por supuesto, se pueden
hacer extrapolaciones, pero slo hasta que se encuentra que ya no funcionan.
Con el concepto de onda sucede lo mismo. Podemos ver con nuestros ojos las ondas en la superficie del agua de un estanque. Pero an del punto de vista clsico, sabemos que no podemos extrapolar el concepto indefinidamente, pues al llegar a las dimensiones moleculares la nocin
misma de superficie del agua pierde sentido. En esa escala encontraremos un gran nmero de
molculas que se mueven aparentemente al azar, y slo despus de promediar el comportamiento de grandes grupos de molculas podemos recuperar los conceptos de superficie y de
onda. Estos comentarios muestran que el problema surge cuando intentamos extrapolar conceptos macroscpicos como superficie y onda, derivados de nuestra experiencia cotidiana, hasta
dominios donde carecen de validez.
Lo que indican claramente los fenmenos que hemos estudiado en este Captulo y otros que veremos ms adelante, es que los conceptos clsicos de partcula y onda no se pueden extrapolar a
la escala atmica. En esa escala no es lcito establecer una distincin entre partcula y onda
en el sentido clsico. Por otra parte, esa distincin est implcita en el planteo tradicional de la
Mecnica, por la forma misma con la cual se definen las variables dinmicas del sistema. Por
eso, como veremos, en la Mecnica Cuntica se parte de un planteo radicalmente diferente.

35

4. Radiacin, fotones y la constante de Planck


Yendo ahora especficamente al caso de las ondas electromagnticas, podemos decir lo siguiente. No podemos ver las ondas electromagnticas del mismo modo que las olas en la superficie del agua. Pero tenemos varias razones para creer que son tambin un fenmeno ondulatorio. En efecto:
podemos observar los fenmenos de interferencia y difraccin, que se asocian con los fenmenos ondulatorios;
la distribucin de energa en el espacio y el tiempo se predice correctamente por medio de la
teora de Maxwell para todas las longitudes de onda, desde prcticamente infinito hasta alrededor de unos 0.02 ;
en el caso de las ondas de radio podemos medir, adems de la longitud de onda, tambin la
amplitud y la fase.
Veamos estos puntos con ms detalle, comenzando por el ltimo. Hay un lmite a la intensidad
ms pequea que se puede medir, dado por la agitacin trmica de las molcula en la antena de
deteccin, que corresponde a un flujo de alrededor de 1010 fotones/s. Por lo tanto, el ltimo
punto nos dice que muchos fotones que actan en conjunto sobre los electrones de una antena
tienen la apariencia de un campo electromagntico clsico.
Por otra parte, es fcil demostrar que en un interfermetro ptico ordinario se puede trabajar con
intensidades que corresponden a tener en un dado instante un nico fotn dentro del instrumento.
Y en esas condiciones se observa interferencia. Un caso extremo fue estudiado por G. I. Taylor
en 1909, quien demostr que se obtiene el patrn de interferencia habitual, usando una fuente
luminosa tan dbil que la fotografa demor tres meses en registrarse.
Podemos analizar el significado de lo anterior si imaginamos sustituir la placa fotogrfica por
varios fotoelectrodos muy pequeos, de modo que detectando el electrn emitido podemos determinar en cul de ellos incidi el fotn. La energa luminosa total captada por cualquier detector es proporcional al nmero de fotones que llegaron al mismo. Si se efecta ese experimento, se encuentra que a medida que transcurre el tiempo, el nmero de fotones que se registra
en cada detector tiende al valor de la intensidad que predice la teora ondulatoria. Pero esto es
cierto slo en promedio, y si el nmero total de fotones es pequeo pueden ocurrir grandes fluctuaciones. Por otra parte, cada fotn individual llega a un slo detector.
La figura de interferencia dada por dos rendijas depende de que la luz pase por ambas (esto se
comprueba tapando una de ellas). El hecho que cuando la luz atraviesa ambas rendijas se produce interferencia demostr que es un fenmeno ondulatorio y por ese motivo se descart la teora corpuscular de Newton. Significa sto que los fotones se pueden dividir en dos? Recordemos
que por nuestro aparato pasa un slo fotn por vez. Podemos salir de dudas, poniendo un detector detrs de cada rendija. Si hacemos eso no veremos ms la figura de interferencia, pero podremos determinar si el fotn pasa por una sola rendija o por ambas. Lo que resulta es que el
fotn pasa o por una rendija, o por la otra, y no por ambas a la vez. Por lo tanto, el fotn no se
divide. Sin embargo, si el fotn no pasa por ambas rendijas, cmo hace para interferir consigo
mismo?
Una pista para resolver este dilema consiste en pensar que la onda electromagntica nos dice
algo, no acerca de dnde est exactamente el fotn, sino acerca de la probabilidad de encontrarlo en determinado sitio. Si suponemos que esa probabilidad est relacionada con la intensidad de la onda, se resuelve el problema. En el Captulo 15 se muestra como el comportamiento
dual onda-corpsculo de la radiacin queda incorporado al formalismo de la Mecnica Cuntica.

36

5. La Teora Cuntica Antigua

5. LA TEORA CUNTICA ANTIGUA


Introduccin
El intento de resolver el problema de la inestabilidad del tomo de Rutherford llev a Niels Bohr
a formular en 1913 una teora simple de la estructura atmica, uno de cuyos mayores mritos fue
que permiti explicar el espectro de la radiacin electromagntica emitida por ciertos tomos.
Dicha teora fue luego perfeccionada por William Wilson, Jun Ishiwara, Planck, Arnold
Sommerfeld y otros, y dio lugar a lo que hoy llamamos la Teora Cuntica Antigua. Si bien esta
teora fue luego abandonada, cumpli en su momento un rol importante para el desarrollo de la
Mecnica Cuntica moderna. Por este motivo daremos aqu una resea de la misma. Pero antes
es necesario mencionar brevemente algunos aspectos sencillos del espectro atmico.

El espectro atmico
En contraste con el espectro continuo de la radiacin trmica, la radiacin electromagntica
emitida por un tomo libre consiste de un conjunto discreto de longitudes de onda. Cada una de
estas longitudes de onda recibe el nombre de lnea, pues as es como aparece en las placas fotogrficas obtenidas con los espectrgrafos. Cada especie atmica tiene su propio espectro, integrado por un conjunto de lneas caractersticas. Este hecho tiene gran importancia prctica, pues
permite identificar los elementos presentes en una fuente de luz. Por esta razn durante el siglo
XIX se dedic mucho esfuerzo a medir con precisin los espectros de los diferentes tomos.
Tales espectros son muy complicados y generalmente constan de centenares de lneas.
El ms sencillo de todos los espectros es el del tomo de hidrgeno, lo que no es sorprendente
puesto que se trata del tomo ms simple ya que tiene un solo electrn. Por este motivo, y tambin por razones histricas y tericas, presenta mucho inters.
H_
H`
Ha
Hb H
H'

6500
Rojo

6000

5500

5000
Azul

4500
Violeta

4000

Casi
ultravioleta

Fig. 5.1. Parte visible del espectro del hidrgeno.


En el visible (Fig. 5.1), el espectro del hidrgeno presenta una serie regular de lneas que comienza en el rojo y termina en el violeta; el espaciado entre lneas contiguas decrece paulatinamente hasta que se llega al lmite de la serie, que se encuentra para 3645.6 . La regularidad de
este espectro llev a muchos a buscar frmulas empricas que representasen las longitudes de
onda de las lneas. La frmula correcta fue hallada en 1885 por Johann Jakob Balmer (un profesor de escuela secundaria) y es, expresada en trminos del nmero de onda k 2 / ,

2, n

k2, n
1
1
= RH 2 2 , n = 3, 4, 5,
2
2
n
37

(5.1)

5. La Teora Cuntica Antigua


donde

RH = 109677.576 0.012 cm 1

(5.2)

se denomina constante de Rydberg para el tomo de hidrgeno. Posteriormente, gracias al trabajo de varios espectroscopistas entre quienes tuvo un rol preponderante Johannes Rydberg
(1890), se encontraron frmulas semejantes para diferentes series, del tipo
km , n
1
1
= RH 2 2

m
n
2

, m = 1, 2, 3, , n = n + 1, n + 2, n + 3,

(5.3)

La serie de Balmer (5.1) corresponde a m = 2; la serie correspondiente a m = 1 se encuentra en


el ultravioleta y se denomina serie de Lyman. Las correspondientes a m = 3, 4 y 5 se encuentran
en el infrarrojo y se llaman serie de Paschen, Brackett y Pfund, respectivamente.
Las frmulas para las series de los tomos alcalinos (sodio, potasio, rubidio, cesio, ) tienen la
misma estructura general:
km , n

1
1
= R

2
2
2
(n bm )
( m am )

(5.4)

donde R es la constante de Rydberg para el elemento, m es el entero que identifica la serie, am y


bm son constantes para la serie, y n es el entero variable. El valor de R es el mismo para todos
los elementos dentro de un 0.05% y aumenta levemente al aumentar el peso atmico.
Ligado con el espectro de emisin que estuvimos comentando, est el espectro de absorcin, que
se obtiene cuando se emplea una fuente luminosa que emite un espectro continuo y se interpone
entre la fuente y el espectrgrafo un recipiente que contiene un vapor atmico. En este caso se
encuentra que la placa est velada, salvo en algunas lneas que corresponden a las longitudes de
onda que son absorbidas por los tomos del vapor. A cada lnea del espectro de absorcin le corresponde una lnea del espectro de emisin. Pero la inversa no es cierta: no todas las lneas de
emisin se observan en el espectro de absorcin. Por ejemplo, en el espectro de absorcin del
hidrgeno slo aparecen normalmente las lneas de la serie de Lyman. Pero si el gas est a una
temperatura muy elevada, como ocurre en algunas estrellas, en el espectro de absorcin tambin
se ven las lneas de la serie de Balmer.

Los postulados de Bohr


Toda teora de la estructura atmica debe explicar estas caractersticas del espectro, as como
muchas otras que no hemos comentado. La gran precisin de las medidas espectroscpicas impone adems severos requerimientos sobre las predicciones tericas.
Por otra parte, el espectro del hidrgeno es completamente inexplicable en trminos clsicos, del
mismo modo que son inexplicables otros aspectos del tomo tales como su tamao, la existencia
del ncleo y su estabilidad, como hemos visto en el Captulo 3. El gran mrito de Bohr reside en
que reconoci la necesidad de abandonar la Fsica Clsica, y en consecuencia tuvo la audacia de
proponer que varias leyes de la Mecnica y del Electromagnetismo no se cumplen en la escala
atmica. De esta forma consigui dar un paso de fundamental importancia, que indic la direccin en que haba que avanzar para superar el punto muerto al cual haba llegado la Fsica Terica.

38

5. La Teora Cuntica Antigua


La teora de Bohr tiene gran sencillez matemtica y concuerda cuantitativamente con los datos
espectroscpicos del hidrgeno. Sin embargo, los postulados sobre los cuales se basa parecen
artificiosos. Son los siguientes:
Postulados de Bohr:

El electrn se mueve en una rbita circular alrededor del ncleo bajo la influencia de la
atraccin Coulombiana de ste, obedeciendo las leyes de la mecnica clsica.

Dentro de las infinitas rbitas clsicas, el electrn se mueve slo en aquellas en las que
el momento angular orbital L tiene los valores L = nh = nh / 2 , donde n = 1, 2, 3, .

Cuando el electrn se mueve en una rbita permitida, no irradia energa electromagntica a pesar de ser acelerado constantemente y por lo tanto su energa total E permanece constante.

Un electrn que se mueve inicialmente en una rbita de energa Ei puede cambiar discontinuamente su movimiento y pasar a moverse en otra rbita de energa E f ; cuando
esto ocurre se emite un fotn cuya frecuencia es = ( Ei E f ) / h .

Se debe notar la diferencia entre la cuantificacin de Bohr del momento angular y la cuantificacin de Planck, que se refiere a la energa total de una partcula (por ejemplo un electrn que
realiza oscilaciones armnicas simples). Veremos que la cuantificacin del momento angular
implica tambin la cuantificacin de la energa total, pero de una forma diferente a la de Planck.
El tercer postulado resuelve manu militari el problema de la estabilidad debido a la radiacin del
electrn acelerado, mediante el simple expediente de postular que esta caracterstica de la teora
clsica no vale para el electrn cuando se mueve en una rbita permitida. Este postulado se basa
en la observacin experimental de que los tomos son estables, a pesar que la teora clsica predice lo contrario. El cuarto postulado est ligado al postulado de Einstein sobre la energa de un
fotn (ec. (4.41)).
Se puede observar que los postulados de Bohr mezclan de manera arbitraria la fsica clsica con
la no clsica, y en tal sentido son intelectualmente insatisfactorios. Por ejemplo, se supone que el
electrn se mueve segn las leyes de la mecnica clsica, y al mismo tiempo se afirma que su
momento angular est cuantificado; se supone que el electrn obedece la ley de Coulomb, pero
acto seguido se lo exime de cumplir la regla que toda carga acelerada irradia.
Sin embargo, se puede argumentar que no nos debemos sorprender si las leyes de la fsica clsica (basadas en nuestra experiencia con sistemas macroscpicos) no son completamente vlidas
cuando tratamos con un sistema microscpico como el tomo. En ltima instancia, la justificacin de los postulados de Bohr (y de cualquier postulado, en realidad) reside en si describen correctamente los resultados experimentales, o no.

Teora de Bohr del tomo con un electrn


Consideremos un tomo formado por un ncleo de masa M y carga +Ze, y un electrn de masa
me y carga e (por ej. un tomo de hidrgeno, un tomo de helio ionizado una vez, uno de litio
doblemente ionizado, etc.) que gira alrededor del ncleo en una rbita circular de radio r con la
velocidad v. Por ahora, supongamos que el ncleo se puede considerar fijo (o sea, M = ). Se
cumple entonces que la fuerza de Coulomb debe ser igual a la fuerza centrpeta:
Ze2 me v 2
=
r2
r

39

(5.5)

5. La Teora Cuntica Antigua


Puesto que la fuerza de Coulomb es central, se conserva el momento angular

L = me vr = cte.

(5.6)

Reemplazando en (5.5) tenemos

L2
me r

(5.7)

L2
me Ze2

(5.8)

Ze2 =

Despejando r obtenemos

r=
Aplicando la regla de cuantificacin

L = nh , n = 1, 2, 3,

(5.9)

h h / 2

(5.10)

donde hemos definido

encontramos que las rbitas permitidas tienen radios dados por

n2 h2
rn =
me Ze2

(5.11)

que son proporcionales al cuadrado del nmero cuntico n. La rbita ms pequea ( n = 1) del
tomo de hidrgeno ( Z = 1) tiene un radio igual a

r1 = a0

h2
8
cm
2 = 0.529 10
mee

(5.12)

que se denomina radio de Bohr. Veremos en seguida que esta rbita es la de menor energa.
La velocidad del electrn tambin est cuantificada, y su valor es

vn =

nh
Ze2 Z
=
= c
me rn
nh
n

(5.13)

donde hemos introducido la constante adimensional

e2
= 7.297 10 3 1 / 137
hc

(5.14)

que se llama constante de la estructura fina por motivos que se vern en breve. Dicha constante
es una medida de la fuerza de la interaccin electromagntica y juega un rol muy importante en
la electrodinmica cuntica.
Para la rbita ms pequea ( n = 1) del tomo de hidrgeno tenemos
40

5. La Teora Cuntica Antigua


v1 =

e2
= c = 2.2 108 cm/s
h

(5.15)

que es menos del 1% de la velocidad de la luz, por lo tanto est bien haber usado en nuestros
clculos la mecnica clsica no relativstica.
Calculemos la energa total del electrn:

En = Tn + Vn = 12 me vn2

Ze2
= 12 me vn2
rn

(5.16)

Sustituyendo (5.11) y (5.13) en (5.16) obtenemos


2

m Ze2
Z2
En = Tn + Vn = e2
=
E1 , n = 1, 2, 3,

2n h
n2

(5.17)

donde

E1 = 12

2
mee 4
1 e = 1 m c 2 2 = 13.6 eV
=

2
2 e
h2
a0

(5.18)

Por lo tanto la cuantificacin del momento angular implica la cuantificacin de la energa total.
La informacin contenida en la (5.17) se suele presentar en un diagrama de niveles de energa
(ver Fig. (5.2). El estado estable, o sea el de energa mnima, corresponde a n = 1 y su energa es
E1 = 13.6 eV para el tomo de hidrgeno.
Podemos calcular la frecuencia m,n del fotn emitido por el electrn al pasar del estado n al estado m ( m < n ). De acuerdo con el cuarto postulado de Bohr
2

m, n

E Em
m Ze2 1
1
= n
= e
2 2
h
n
4h h m

(5.19)

El correspondiente nmero de onda km, n = 2 m, n / c est dado por


km , n =

me Z 2e 4 1
1
1
1
2 = 2R 2 2
3
2

m
n
m
n
2ch

, m<n

(5.20)

donde:

R =

me Z 2e 4
Z2
=
2
4ch3
4D C

(5.21)

y D C C / 2 ( C es la longitud de onda Compton del electrn, ec. (4.58)). Las ecuaciones


(5.17) y (5.21) contienen las predicciones principales de la teora de Bohr.
Veamos primero la emisin de radiacin por un tomo de Bohr. Las ecuaciones mencionadas
nos dicen lo siguiente:
El estado normal del tomo es el de mnima energa o sea el estado con n = 1, que se suele
denominar estado fundamental o estado base. Puesto que no hay otro estado con energa

41

5. La Teora Cuntica Antigua


menor, este estado es estable. El radio de la rbita correspondiente (ec. (5.12)) determina el
tamao del tomo (con un solo electrn), que resulta ser del orden de magnitud correcto.
En determinadas circunstancias el tomo puede absorber energa (por causa de las colisiones,
como ocurre en una descarga elctrica, o por otro mecanismo), pasando a un estado de energa mayor, con n > 1.
El tomo emite ese exceso de energa, obedeciendo la tendencia comn de todos los sistemas
fsicos, y regresa al estado fundamental. Esto se consigue mediante una serie de transiciones
en las que el electrn pasa sucesivamente a estados de energa ms baja, hasta que finalmente llega al estado fundamental.
En la gran variedad de procesos de excitacin y desexcitacin que ocurren en la fuente de luz
cuyo espectro se est registrando se producen todas las transiciones posibles y por lo tanto se
emite el espectro completo. A partir de la ec. (5.17) podemos calcular los nmeros de onda
de todas las lneas del espectro. Es fcil verificar que de esa manera se obtienen las frmulas
de las series de Lyman, Balmer, Paschen, etc. (Fig. 5.3). El valor de R concuerda con el
valor experimental de la constante de Rydberg.
n
E(eV)
Ese fue el gran triunfo de la teora de Bohr, muy
notable porque cuando fue formulada an no se
0
'
conocan las series de Lyman, Brackett y Pfund.
4
Estas series fueron predichas por la teora y llevan
3
el nombre de quienes fueron los primeros en ob2
servarlas.
2
La teora tambin funcion bien en el caso del
4
tomo con Z = 2 y un electrn (helio ionizado
una vez).
Asimismo, las propiedades del espectro de absor6
cin se pueden entender por medio de la teora de
Bohr. Puesto que el electrn slo puede estar en
uno de los estados permitidos, puede absorber
8
nicamente cantidades de energa iguales a las
diferencias de energa entre los estados permitidos. La absorcin es el proceso inverso de la emi10
sin y por lo tanto las longitudes de onda absorbidas son iguales a las de las lneas emitidas. Nor12
malmente el tomo que absorbe est en el estado
fundamental; por eso generalmente en el espectro
1
de absorcin del tomo de hidrgeno se observan
slo las lneas de la serie de Lyman. Pero si el gas
est a una temperatura muy alta, parte de los toFig. 5.2. Niveles de energa del tomo de mos pueden estar en el primer estado excitado con
hidrgeno de acuerdo con la teora de
n = 2 , y en tal caso se observan tambin las lneas
Bohr.
de absorcin de la serie de Balmer. La temperatura necesaria se puede estimar a partir de la distribucin de Boltzmann, y es fcil ver que debe
ser del orden de los 105 K.

42

5. La Teora Cuntica Antigua


n

E(eV)
0
Brackett
2

Pfund

'
4
3

Paschen
2

Balmer

10

12
1
Lyman
Fig. 5.3. Origen de las cinco series espectrales conocidas del tomo de
hidrgeno de acuerdo con la teora de Bohr.

El espectro de lneas de rayos X


Es oportuno mencionar aqu las investigaciones de Henry G. J. Moseley sobre las lneas espectrales de rayos X de elementos pesados, que influyeron sobre la teora que estamos presentando
ya que Bohr se mantuvo al corriente de las mismas. Moseley se bas en los trabajos de Barkla, y
para medir las longitudes de onda de los rayos X utiliz las tcnicas de difraccin sobre cristales
desarrolladas por Sir Lawrence Bragg y su hijo William. Comparando los rayos X emitidos por
diferentes elementos, encontr que tienen frecuencias caractersticas que varan de acuerdo con
un patrn regular. Sin embargo, la diferencia de frecuencia no est gobernada por la diferencia
de masa entre los elementos, sino por la diferencia entre las cargas elctricas de sus ncleos, es
decir, las diferencias entre los respectivos nmeros atmicos1.
Sin entrar en mayores detalles, podemos decir que el espectro de lnea de rayos X se debe a transiciones de los electrones ms internos de un tomo. Para ellos, la carga nuclear no est apantallada por los dems electrones (que se mueven en rbitas de radio mayor), por lo tanto se puede
aplicar la frmula (5.17) que obtuvimos en la Seccin precedente. En la terminologa de rayos
X, los niveles de energa correspondientes a n = 1, 2, 3, se denominan K, L, M,
En su primer experimento de 1913, Moseley estudi los rayos X de la serie K (asociada con las
transiciones al nivel de energa K) para los elementos hasta el Zn y el ao siguiente extendi sus
investigaciones hasta el Au, usando las lneas de la serie L (transiciones al nivel L). Las frmulas
1

Fue precisamente Moseley quien introdujo el trmino nmero atmico para designar a Z.

43

5. La Teora Cuntica Antigua


que obtuvo para las frecuencias se relacionan muy estrechamente con las frmulas de Bohr para
tomos con un solo electrn, y muestran que las frecuencias son proporcionales a Z2. As, las
series K y L son anlogas a las series de Lyman y de Balmer del tomo de hidrgeno.
La regularidad de las diferencias en las frecuencias del espectro de rayos X permiti a Moseley
ordenar por nmero atmico todos los elementos desde el Al hasta el Au. Pudo observar as que
en algunos casos el orden dado por los pesos atmicos es incorrecto. Por ejemplo, el peso atmico del Co es mayor que el del Ni, pero sus nmeros atmicos son 27 y 28, respectivamente.
Cuando Mendeleyev construy su Tabla Peridica se tuvo que basar en los pesos atmicos, pero
coloc al Cu y el Ni en el orden inverso (es decir, el orden correcto de acuerdo con Z) para que
sus propiedades qumicas encajaran mejor.
En algunos lugares de la Tabla Peridica, Moseley encontr diferencias en Z mayores que la
unidad, y predijo correctamente la existencia de elementos an no descubiertos. Puesto que hay
un nico elemento para cada Z, los cientficos pudieron finalmente confiar en la completitud de
la Tabla Peridica.

Refinamientos del modelo de Bohr


Mencionaremos brevemente varias correcciones y perfeccionamientos del modelo de Bohr.
Correccin por masa nuclear finita
El hecho que el ncleo tiene una masa finita se puede tener en cuenta fcilmente si en todas las
ecuaciones de la Seccin anterior en lugar de la masa del electrn se emplea la masa reducida
del sistema electrn-ncleo, dada por

me M
me + M

(5.22)

La frmula para los nmeros de onda se escribe ahora


1
1
km, n = 2RM Z 2 2 2
m
n

, m<n

(5.23)

donde:
RM =

Z 2e 4
4ch3

(5.24)

Con la correccin por el efecto de masa finita, la teora de Bohr concuerda con los datos espectroscpicos dentro de un 0.003%.
La teora de Wilson-Sommerfeld
El acierto de la teora de Bohr acentu el carcter misterioso de sus postulados bsicos, uno de
los cuales es la relacin entre la cuantificacin de Bohr del momento angular y la cuantificacin
de Planck de la energa total de un oscilador armnico simple. Este asunto se aclar en 1916
cuando Wilson y Sommerfeld enunciaron una regla de cuantificacin para cualquier sistema cuyas coordenadas varan peridicamente con el tiempo. Esta regla permiti ampliar el dominio
de aplicacin de la teora cuntica e incluye como casos particulares las cuantificaciones de
Planck y Bohr. La podemos enunciar as:
44

5. La Teora Cuntica Antigua


Regla de cuantificacin de Wilson-Sommerfeld:
en un sistema cuntico, toda coordenada q que vara peridicamente en el tiempo satisface
la condicin de cuantificacin

pq dq

= nq h , nq = 1, 2, 3,

(5.25)

donde pq es el impulso asociado a q, y la integracin se efecta sobre un perodo.


Vamos a verificar que las reglas de Bohr y de Planck son casos particulares de la (5.28).
Si una partcula se mueve en una rbita alrededor de un centro de fuerzas podemos describir el
movimiento en el plano de la rbita usando las coordenadas polares r y , donde r es la distancia
al centro y es el ngulo medido desde una direccin fija. El impulso conjugado a r es pr = mr
y el impulso conjugado a es el momento angular L = mr 2 , que es una constante del
movimiento.
Cuando la partcula realiza un movimiento circular uniforme con radio r0 no es necesario aplicar
la condicin (5.25) a la coordenada radial, pues pr = 0 . La aplicacin de (5.22) a la coordenada
angular nos da

pq dq

= Ld = 2L = n h

(5.26)

Podemos escribir la (5.26) en la forma

L = n h

(5.27)

que es precisamente la condicin de cuantificacin de Bohr (5.9) si identificamos n con n.


Consideremos ahora el caso de una partcula que realiza oscilaciones armnicas con la frecuencia . La posicin de la partcula se especifica dando la coordenada x, que cumple

x = x0sen(2t + 0 ) = x0sen(t + 0 )

(5.28)

donde x0 es la amplitud de la oscilacin y 0 es la fase inicial. El impulso de la partcula es

p = mx = 2mx0 cos(2t + 0 ) = mx0 cos(t + 0 )

(5.29)

La condicin de Wilson-Sommerfeld nos dice entonces

pq dq

= pdx = nh

(5.30)

El clculo de la integral nos da

pdx =

1
m

T = 2 /
p2 dt

0
2

= 2 mx02 cos2 (t + 0 )dt


0

E
= mx02 cos2 ( )d = mx02 =

donde
45

(5.31)

5. La Teora Cuntica Antigua


E = 12 2 mx02

(5.32)

es la energa total del oscilador. Usando la (5.31) en la (5.30) obtenemos finalmente


E = nh

(5.33)

que es precisamente la condicin de cuantificacin de Planck.


rbitas elpticas y la teora relativstica de Sommerfeld
Si quitamos la restriccin que el movimiento del electrn sea circular, tenemos que aplicar las
condiciones (5.25) no slo al movimiento azimutal, sino tambin al movimiento radial. Se obtienen entonces dos condiciones de cuantificacin:

Ld

= 2L = n h ,

pr dr

= nr h

(5.34)

La primera de ellas nos da la condicin de cuantificacin del momento angular que ya conocemos para las rbitas circulares:

L = n h , n = 1, 2, 3,

(5.35)

La segunda condicin (que no se aplica a las rbitas circulares) nos lleva despus de algunas
cuentas a una relacin entre los semiejes a y b de la elipse:
a
L 1 = nr h , nr = 0, 1, 2,
b

(5.36)

Conviene ahora definir el nmero cuntico principal n como

n n + nr

(5.37)

que coincide con el nico nmero cuntico que usamos para tratar las rbitas circulares. De
acuerdo con (5.35) y (5.36) n puede tomar los valores
n = 1, 2, 3,

(5.38)

Para un valor fijo de n, el nmero cuntico azimutal n puede tomar los valores

n = 1, 2, , n

(5.39)

y el nmero cuntico radial nr vale entonces

nr = n n

(5.40)

Usando las frmulas de la Mecnica para el movimiento en un campo de fuerzas centrales, se


puede mostrar entonces (omitimos los detalles por brevedad) que

a=

n2 h2
Ze2

, b=a
46

n
n

, E=

Z 2e 4
2n2 h2

(5.41)

5. La Teora Cuntica Antigua


donde es la masa reducida del electrn.
Se puede ver que (salvo por la sustitucin me ) la primera de estas ecuaciones es idntica a
la (5.11), que da el radio de las rbitas circulares de Bohr; la segunda muestra que la forma de
las rbitas depende del cociente n / n y la tercera equivale a la (5.16). Por lo tanto para cada
valor del nmero cuntico principal hay n diferentes rbitas permitidas, que difieren por el valor
del nmero cuntico azimutal. Una de ellas, la que corresponde a n = n , es la rbita circular de
Bohr y las otras son elpticas. Todas esas n rbitas tienen el mismo valor de la energa, pues E
depende slo del nmero cuntico principal. Esta circunstancia se expresa diciendo que el correspondiente nivel de energa est degenerado.
La degeneracin de los niveles de energa correspondientes a las rbitas con el mismo n y diferente n es consecuencia de que la fuerza de Coulomb depende de la inversa del cuadrado de la
distancia, y de que tratamos el problema como no relativstico. Por eso esta degeneracin se
suele denominar accidental. Si se calculan las correcciones relativsticas, cosa que hizo
Sommerfeld, la degeneracin se rompe y los niveles de energa del mismo n pero diferentes n
se separan, dando lugar a lo que se llama la estructura fina del espectro del hidrgeno.
ne

3
2
1

4
3

2
1

Fig. 5.4. Estructura fina de algunos niveles del tomo de hidrgeno. Se


ha exagerado la separacin para hacerla visible. Las flechas de trazos
indican transiciones que no se observan.

Puesto que v / c 10 2 , como ya vimos, las correcciones relativsticas son del orden de
(v / c)2 2 10 4 . El clculo es largo y tedioso, pero se puede mostrar que
E=

me Z 2e 4 2 Z 2 1
3
+

n n 4n
2n2 h2

47

(5.42)

5. La Teora Cuntica Antigua


Vemos entonces que la separacin de los niveles degenerados es proporcional a 2 . Ese es el
motivo por el cual recibi el nombre de constante de la estructura fina, aunque como veremos
ms adelante su significado es mucho ms general. En la Fig. 5.4 se ve la estructura fina de los
primeros niveles del tomo de hidrgeno. Las flechas indican las transiciones que producen las
lneas espectrales. Las que se observan en el espectro estn indicadas con lneas llenas, y con
lneas punteadas se indican transiciones que no se observan experimentalmente. Los nmeros de
onda de las lneas, calculadas a partir de la (5.42), concuerdan muy bien con los observados.
Examinando la figura se ve que slo se producen las transiciones para las cuales

n n f n i = 1

(5.43)

La ec. (5.43) se denomina regla de seleccin.

El principio de correspondencia
La existencia de reglas de seleccin no se explica por medio de la teora que hemos desarrollado
hasta ahora y por ese motivo, buscando darles una justificacin terica, Bohr introdujo en 1923
un postulado adicional:
Principio de correspondencia:
Para todo sistema fsico, las predicciones de la teora cuntica deben corresponder a las
predicciones clsicas para valores grandes de los nmeros cunticos que especifican al
sistema.
Una regla de seleccin vale para cualquier valor del nmero cuntico n correspondiente. Por lo tanto toda regla de seleccin que se aplica en el lmite clsico (n grande)
se aplica tambin en el dominio cuntico (n pequeo).
Es obvio que las predicciones de la teora cuntica deben corresponder a las predicciones clsicas en aqul lmite en que el sistema se comporta clsicamente. La primera parte del principio de
correspondencia expresa que ese lmite se encuentra en el dominio de los nmeros cunticos
grandes, y se apoya en hechos conocidos, como por ejemplo que la teora de Rayleigh-Jeans del
espectro del cuerpo negro concuerda con la teora de Planck para pequeo. A partir de la ec.
(4.11) se ve que
lim 0 = lim 0

h
e

h / kT

= kT

(5.44)

y por lo tanto

= nh kT

(5.45)

de modo que el valor promedio del nmero cuntico que especifica la energa de las ondas electromagnticas de frecuencia debe aumentar a medida que disminuye .
La segunda parte del principio de correspondencia es una hiptesis razonable, pues no parece
lgico que una regla de seleccin valga slo para un dominio limitado del nmero cuntico involucrado.
A modo de ejemplo, podemos aplicar el principio de correspondencia a un oscilador armnico
simple de frecuencia , cargado elctricamente. De acuerdo con la teora cuntica los estados de
48

5. La Teora Cuntica Antigua


energa de este sistema estn dados por la ecuacin En = nh , y las teoras cuntica y clsica
coinciden para n . Puesto que el oscilador est cargado puede emitir o absorber radiacin
electromagntica. De acuerdo con la teora clsica, el sistema emite radiacin de frecuencia
debido al movimiento acelerado de la carga. De acuerdo con la teora cuntica, el oscilador
emite un fotn de frecuencia = ( Ei E f ) / h = (ni n f ) cuando efecta una transicin desde
el estado ni al estado n f . Por lo tanto, la primera parte del principio de correspondencia requiere
que = y en consecuencia en el lmite clsico se debe cumplir la regla de seleccin

nemisin n f ni = 1

(5.46)

Aplicando un razonamiento semejante a la absorcin de radiacin se llega a la conclusin que en


el lmite clsico se cumple la regla de seleccin

nabsorcin n f ni = +1

(5.47)

La segunda parte del principio de correspondencia nos dice que las reglas de seleccin (5.46) y
(5.47) valen en todo el dominio cuntico. El estudio del espectro vibracional de molculas diatmicas muestra que en efecto esto es cierto.
Mediante el estudio de los espectros atmicos y moleculares se encontraron empricamente numerosas reglas de seleccin, gran parte de las cuales se pudieron entender aplicando el principio
de correspondencia, aunque a veces surgieron ambigedades.
Se debe notar, sin embargo, que la teora cuntica moderna no precisa invocar el principio de
correspondencia para explicar las reglas de seleccin, pues stas surgen como consecuencia de
leyes generales de conservacin, sin necesidad de postulados adicionales.

El experimento de Franck y Hertz


La confirmacin directa que los estados de energa del tomo estn cuantificados provino de un
sencillo experimento realizado en 1914 por James Franck y Gustav Hertz. En este experimento
(Fig. 5.5a) un ctodo caliente C emite electrones que son acelerados hacia un nodo A en forma
de grilla por una diferencia de potencial V, y pasan a travs de l para ser recogidos por una
placa colectora P, que est a un potencial VP = V Vr . El dispositivo contiene el gas o vapor de
los tomos que se quiere investigar, a baja presin. El experimento consiste en determinar la corriente I debida a los electrones recogidos por la placa como funcin de V.
El primer experimento se realiz con vapor de Hg, y los resultados se muestran en la Fig. 5.5b.
Se observa que para V pequeo, I aumenta con V, pero cuando se llega a 4.9 V la corriente cae
abruptamente. Esto indica que cuando alcanzan una energa cintica de 4.9 eV, los electrones
comienzan bruscamente a interactuar con los tomos de Hg, y una fraccin importante de ellos
pierde toda su energa cintica al excitar los tomos. Si V es apenas mayor que 4.9 V, este proceso de interaccin ocurre justo delante de A y los electrones que han perdido su energa cintica
ya no la pueden recuperar en el resto de su viaje hacia el nodo; por lo tanto son rechazados por
el potencial de frenamiento Vr y no llegan a la placa. La cada abrupta de I cuando V = 4.9 V
indica que los electrones de menos de 4.9 eV no pueden transferir su energa a los tomos de Hg.
De esto se concluye que los niveles de energa del tomo de Hg estn cuantificados, y que 4.9
eV es la diferencia de energa entre el estado fundamental y el primer estado excitado.

49

5. La Teora Cuntica Antigua


Si esta conclusin es correcta, debe existir
en el espectro de emisin del Hg una lnea
que corresponde a la transicin del primer
estado excitado al estado fundamental, con
Vapor de Hg
una frecuencia dada por = ( 4.9 eV) / h , lo
que corresponde a una longitud de onda de
2536 . Eso fue lo que observaron Franck y
Hertz, quienes comprobaron que mientras
V
V < 4.9 eV el vapor de Hg no emite ninguna
I
lnea espectral, pero cuando el potencial es
VVr
ligeramente mayor el espectro muestra una
nica lnea de emisin de 2536 .
(a)
El experimento de Franck y Hertz es una
clara prueba que los estados de energa del
I
tomo de Hg estn cuantificados, y permite
medir directamente las diferencias de energa entre los estados cunticos. Si se extiende el estudio a diferencias de potencial
mayores aparecen, en efecto, otras bruscas
cadas de la corriente. Algunas de stas se
deben a que si V es suficientemente grande,
5
10
V
en su recorrido de C a A los electrones pue(b)
den excitar dos o ms veces el nivel de 4.9
eV, pero otras cadas se deben a la excitaFig. 5.5. Experimento de Franck y Hertz:
cin de estados diferentes. A partir de los
(a) esquema del dispositivo, (b) resultados.
valores de V correspondientes a estas cadas
se pueden determinar las diferencias de energa entre esos estados y el estado fundamental.
Otra manera de determinar experimentalmente el esquema de niveles de un tomo es medir su
espectro, para construir un conjunto de niveles compatible con el mismo. Esto no es fcil en la
prctica, puesto que el espectro, y por lo tanto el esquema de niveles, suele ser muy complicado.
Por otra parte, el mtodo espectroscpico tiene la virtud de ser muy preciso.
Toda vez que las diferencias de energa entre estados atmicos se determinaron por ambos
mtodos, el espectroscpico y el de Franck y Hertz, los resultados fueron coincidentes.
Por encima del estado discreto ms alto, es decir para E 0, estn los estados de energa que
consisten de un electrn no ligado y un tomo ionizado. La energa del electrn libre no est
cuantificada, por lo tanto los estados del electrn con E 0 forman un continuo. Es posible excitar el tomo desde el estado fundamental hasta un estado del continuo, si se suministra a un
electrn una energa mayor que la energa de ionizacin, que para el tomo de Hg es de 10.4 eV
(13.6 eV para el tomo de hidrgeno). Tambin es posible el proceso inverso, esto es que un
tomo ionizado capture un electrn libre en uno de los estados ligados del tomo neutro. En este
proceso se emite radiacin de una frecuencia mayor que la que corresponde al lmite de la serie
correspondiente al nivel en cuestin. El valor exacto de la frecuencia depende de la energa inicial E 0 del electrn libre, y puesto que E puede tener cualquier valor, el espectro tiene una
parte continua ms all del lmite de la serie. Esto se puede observar en el caso del Hg, aunque
con dificultad.
C

50

5. La Teora Cuntica Antigua

Constantes fundamentales y escalas de la Fsica Atmica


Lo que hasta ahora hemos visto acerca de la fsica del tomo y de la interaccin entre la radiacin electromagntica y la materia nos muestra que en ellas intervienen cuatro constantes fsicas
universales:
Constantes fundamentales de la Fsica Atmica:

e 2 , el cuadrado de la carga elctrica fundamental ( e = 4.80321 10 10 u.e.s.)

c = 2.99792458 1010 cm / s , la velocidad de la luz

me = 9.1093897 10 28 g , la masa del electrn

h = 1.05457 10 27 erg s , la constante de Planck

En el sistema Gaussiano, y tomando como dimensiones fundamentales longitud (L) tiempo (T) y
energa (E), la dimensionalidad de esas constantes es:

[e2 ] = EL

[c] = LT 1 , [me ] = EL2T 2 , [h] = ET

(5.48)

En virtud del Teorema Pi, hay una nica combinacin adimensional independiente de estas cuatro constantes, que es la constante de la estructura fina

e2
= 1/137.0359895
hc

(5.49)

Con las tres constantes clsicas e2 , c, me podemos formar una longitud caracterstica que es el
radio clsico del electrn

e2
= 2.817938 10 13 cm
mec 2

(5.50)

e2
r0
= 0.939963 10 23 s
3 =
mec
c

(5.51)

r0 =
un tiempo caracterstico

y una energa caracterstica, que es el equivalente de la masa en reposo del electrn:

= mec 2

(5.52)

Todas las longitudes caractersticas que aparecen en la teora se pueden entonces expresar en
trminos de r0 y :
la longitud de onda Compton del electrn
DC

C
h
r
=
= 0 = 0.386159 10 10 cm
2 mec

el radio de Bohr
51

(5.53)

5. La Teora Cuntica Antigua

h2
r0
8
a0 =
cm
2 = 2 = 0.529177 10
mee

(5.54)

la longitud de onda caracterstica del espectro atmico

2 n 2 ch3 2 n 2
ch3
r
=
D
,
D
=
= 03 = 7.25163 10 7 cm
0
0
2
4
2
4
Z mee
Z
mee

(5.55)

Vemos en consecuencia que las longitudes caractersticas de los fenmenos de escala atmica
que involucran electrones y radiacin electromagntica guardan entre s relaciones de escala determinadas por la constante de la estructura fina . Concretamente:

r0 : D C : ao : D 0 = 1 : 1 : 2 : 3

(5.56)

Relaciones anlogas existen entre los tiempos y energas caractersticas. Estas relaciones tienen
un carcter fundamental pues provienen de las propiedades de la interaccin electromagntica y
la naturaleza cuntica de los fenmenos atmicos, y son independientes de la particular teora
que los describe.

Crtica de la Teora Cuntica Antigua


Hemos visto en este Captulo que la teora de Bohr y su extensin por Wilson y Sommerfeld,
que constituyen la Teora Cuntica Antigua, tuvieron importantes xitos. Sin embargo debemos
sealar las siguientes limitaciones y defectos:
La teora se aplica solamente a sistemas peridicos en el tiempo, lo que excluye muchos sistemas fsicos.
Permite calcular las energas de los estados permitidos y las frecuencias de la radiacin emitida o absorbida en las transiciones entre esos estados, pero no predice el tiempo caracterstico involucrado en una transicin.
Slo se aplica a los tomos con un electrn, y aquellos que tienen muchos aspectos en comn
con los tomos de un electrn (como los metales alcalinos), pero falla si se la intenta aplicar
al tomo de helio, que tiene dos electrones.
Por ltimo, la teora no es intelectualmente satisfactoria, pues se mezclan en ella de forma
arbitraria aspectos clsicos con aspectos cunticos.
Puesto que algunas de estas objeciones son de carcter fundamental, los fsicos de la poca se
esforzaron por desarrollar una nueva teora cuntica que no padeciera estas limitaciones ni fuera
pasible de objeciones. Este esfuerzo logr el objetivo cuando Werner Heisenberg en 1924 (y
luego Max Born y Pascual Jordan) propuso su dinmica de matrices y Erwin Schrdinger en
1925, apoyndose en una idea propuesta en 1924 por Louis-Victor de Broglie, desarroll la mecnica ondulatoria. Pese a que su forma es muy distinta, las teoras de Heisenberg y de
Schrdinger son completamente equivalentes y su contenido es idntico, como fue demostrado
por Schrdinger. El planteo axiomtico de la Mecnica Cuntica se complet poco despus por
medio de la teora de las transformaciones de Paul A. M. Dirac y Pascual Jordan. Pero de eso
nos ocuparemos en los prximos captulos.

52

6. Propiedades ondulatorias de la materia

6. PROPIEDADES ONDULATORIAS DE LA MATERIA


El postulado de Broglie
El desarrollo de la Mecnica Cuntica comenz con una idea muy simple pero revolucionaria
que fue expuesta en 1924 por Louis-Victor de Broglie en su Tesis Doctoral. Inspirado por el
comportamiento dual onda-corpsculo de la radiacin, de Broglie especul sobre la posibilidad que tambin la materia tuviera un comportamiento dual, esto es que las entidades fsicas
que consideramos como partculas (electrones, tomos, bolas de billar, etc.) pudieran en
determinadas circunstancias manifestar propiedades ondulatorias.
Hemos visto que la naturaleza corpuscular de la radiacin electromagntica se pone en evidencia cuando se estudia su interaccin con la materia (emisin y absorcin, efecto fotoelctrico, efecto Compton, creacin y aniquilacin de pares, etc.). Por otra parte, su naturaleza
ondulatoria se manifiesta por la forma con que se propaga, dando lugar a los fenmenos de
interferencia y difraccin. Esta situacin se puede describir diciendo que la radiacin electromagntica es una onda que al interactuar con la materia manifiesta un comportamiento
corpuscular. Con igual derecho podemos tambin decir que consta de partculas (los fotones)
cuyo movimiento est determinado por las propiedades de propagacin de ciertas ondas que
les estn asociadas. En realidad ambos puntos de vista son aceptables. Pensando en trminos
de la segunda alternativa y razonando por analoga, de Broglie explor la idea que el movimiento de una partcula est gobernado por la propagacin de ciertas ondas piloto asociadas
con ella. Ciertamente, es muy sugestivo el hecho que la constante de Planck juegue un rol
crucial, tanto para el comportamiento de los electrones del tomo (como lo muestra claramente el xito de la teora de Bohr) como para la interaccin de la radiacin con la materia.
En el caso de la radiacin, h est vinculado con los aspectos corpusculares de la misma. No es
absurdo entonces especular sobre la posibilidad que en el caso de una partcula como el electrn, h est relacionado con alguna clase de comportamiento ondulatorio.
Cuando de Broglie public su trabajo an no se haban observado comportamientos ondulatorios asociados con el movimiento de una partcula, aunque el tema haba sido investigado en
varias ocasiones. Pero esta falta de evidencia no es excluyente, pues si en esas ocasiones la
longitud de onda de las ondas piloto hubiese sido muy corta no hubiera sido posible observar
los aspectos ondulatorios. Esta situacin se da tambin en la ptica, donde para observar interferencia o difraccin es preciso que las diferencias de caminos pticos sean del orden de la
longitud de onda de la luz empleada. Cuando esto no ocurre, la propagacin de la luz se puede
describir adecuadamente mediante la ptica geomtrica, que es en esencia una teora corpuscular.
Para determinar la longitud de onda de las ondas piloto, de Broglie procedi por analoga a lo
que se hace con la radiacin electromagntica, considerada como un conjunto de fotones. De
acuerdo con la ecuacin de Einstein, la frecuencia de un fotn de energa E es

= E/h

(6.1)

La longitud de onda se calcula mediante la relacin usual

= vf /
53

(6.2)

6. Propiedades ondulatorias de la materia


donde v f es la velocidad de fase de la onda. Para el caso del fotn, v f = c de modo que

= c / = hc / E

(6.3)

Recordando que la cantidad de movimiento del fotn es p = E / c , tenemos que

= h/ p

(6.4)

En consecuencia, por analoga con las ecs. (6.1) y (6.4), se puede formular el
Postulado de Broglie:
La longitud de onda y la frecuencia de la onda piloto asociada a una partcula de impulso p y energa relativstica total E estn dadas por

= h/ p , = E/h

(6.5)

y el movimiento de la partcula est regido por la propagacin de las ondas piloto.


La longitud de onda de la onda piloto se llama longitud de onda de Broglie de la partcula.

Algunas propiedades de las ondas piloto


En la descripcin del movimiento de la partcula por medio de la onda piloto est implcita la
hiptesis que la posicin de la partcula est determinada por la onda, en el sentido que la
probabilidad de encontrar la partcula en un dado lugar est relacionada con la amplitud de la
onda en ese lugar. Si bien an no conocemos la ecuacin que rige la propagacin de la onda
piloto, podemos hacer algunas afirmaciones sobre su comportamiento, basadas en las propiedades generales de las ondas. Para simplificar trataremos una sola dimensin espacial, pues la
generalizacin a tres dimensiones es obvia. En primer lugar, para que se puedan presentar interferencia y difraccin, las ondas piloto deben cumplir el principio de superposicin. Por lo
tanto podemos construir paquetes de onda de la forma:
+

( x, t ) =

A(k )e i ( k )ei( k x t )dk

(6.6)

que es una superposicin de ondas planas del tipo1

k = ei( k x t )

(6.7)

con una distribucin espectral dada por la funcin real A( k ) y fases ( k ) , donde

2 p
=

= ( k ) = 2 =

E
h

(6.8)

El lector no se debe sentir incmodo porque (x,t) y k sean complejas. Es ms sencillo para el clculo usar

exponenciales imaginarias en lugar de senos o cosenos y de ltimas, si se desea, se puede siempre tomar la parte
real de (x,t) y k. Adems, veremos en el Captulo 7 que las ondas asociadas con las partculas son complejas.

54

6. Propiedades ondulatorias de la materia


Como E = m c 2 y p = m v (donde m = m0 /[1 + (v / c)2 ]1 / 2 , m0 es la masa en reposo de la
partcula y v su velocidad), cada onda monocromtica (6.7) se propaga con la velocidad de
fase

v f =

E c2
=
=
k p v

(6.9)

La (6.9) muestra que v f no coincide con la velocidad de la partcula y es mayor que c, pero
ste no es un inconveniente, pues el movimiento de una partcula localizada est descripto por
el grupo (6.6) y no por las ondas monocromticas (6.7), que no estn localizadas sino que se
extienden a todo el espacio. Es imporh
tante observar que v f depende de k, lo
que implica que hay dispersin y por
lo tanto el grupo de ondas se distor^
siona y se ensancha a medida que se
propaga. En esto las ondas piloto difieren de las ondas electromagnticas en
el vaco, para las cuales la velocidad
x
de fase c no depende de k, y por lo
tanto un paquete de ondas se propaga
sin cambio de forma.
Supongamos que la distribucin espectral A( k ) tiene su mximo en
Fig. 6.1. Paquete de ondas.
k = k y difiere de cero slo para k
prximo a k. En tal caso, las nicas contribuciones significativas en la superposicin (6.6)
provienen de los valores de k prximos a k. El paquete tendr la forma representada (cualitativamente) en la Fig. 6.1 y estar localizado en el lugar donde las diferentes ondas planas
con k = k + k (donde k << k ) que lo componen estn en fase. Calculamos entonces la fase,
conservando trminos lineales en k y despreciado las potencias superiores; resulta:

k x ( k )t ( k ) = ( k + k ) x ( k + k )t ( k + k )

= kx ( k )t ( k ) + x


t
k
k k k

(6.10)

La posicin del paquete est dada por el valor de x para el cual se anula el coeficiente de k
en la (6.10), esto es:




x = t + = vgt + x0 , x0
k k k k
k k

(6.11)

La (6.11) muestra que el paquete se desplaza con la velocidad de grupo, dada por

E

vg
=
k k p

55

(6.12)

6. Propiedades ondulatorias de la materia


Ahora bien, de E 2 = c 2 p2 + m02 c 4 resulta

E
p
= c2
p
E

(6.13)

y puesto que E = mc 2 y p = mv , donde v es la velocidad de la partcula, obtenemos que

vg = v

(6.14)

esto es, el grupo se desplaza con la velocidad de la partcula, como debe ser para que la descripcin del movimiento dada por la onda piloto sea consistente. Notar que de (6.9) y (6.14)
se obtiene que vg v f = c 2

El experimento de Davisson y Germer


Claramente, los aspectos ondulatorios del movimiento de una partcula slo se manifiestan si
la longitud de onda de Broglie (6.5) es del orden de magnitud de alguna dimensin caracterstica del experimento y dada la pequeez de h, esto no es fcil de conseguir. Por ejemplo,
una partcula de polvo cuya masa es de 1011 g y que se desplaza con una velocidad de 1 cm/s
tiene una longitud de onda de Broglie del orden de 1015 cm, que es despreciable en comparacin con el tamao de cualquier sistema fsico (recordemos que el ncleo atmico tiene un
radio del orden de 1012 cm). Por consiguiente no se puede verificar el postulado de Broglie
estudiando el movimiento de partculas macroscpicas.
Consideremos ahora un electrn de 10 eV de energa, que es del orden de magnitud de la
energa cintica del electrn en un tomo de hidrgeno. En este caso resulta

3.9 10 8 cm

(6.15)

que si bien es pequea, es del orden del tamao de un tomo y por lo tanto de la distancia interatmica en un cristal. Esto sugiere que cuando un haz de electrones se refleja sobre un
cristal, o lo atraviesa, se pueda observar la difraccin de la onda piloto.
Los primeros en observar este efecto fueron Clinton Davisson y Lester Germer, en 1927. En
su experimento hicieron incidir un haz de electrones de 54 eV (cuya longitud de onda de
Broglie es de 1.67 ) sobre la superficie de un cristal de nquel (distancia interatmica
d = 2.15 ), y midieron la cantidad N( ) de electrones dispersados a distintos ngulos .
Encontraron que N( ) tiene un pico para 50 (ver Fig. 6.2). Este resultado prueba cualitativamente el postulado de Broglie. En efecto, el pico slo se puede explicar como el efecto
de la interferencia constructiva de las ondas dispersadas por los tomos regularmente espaciados sobre la superficie del cristal. Se debe observar que se trata de la interferencia de las ondas asociadas a un nico electrn, y que provienen de varias partes del cristal. Esto se puede
demostrar empleando un haz de intensidad tan pequea que en todo instante un nico electrn
est viajando en el aparato; en este caso se observa que la distribucin angular de los
electrones dispersados no cambia.
Los resultados de Davisson y Germer tambin confirman cuantitativamente el postulado de
Broglie. Recordemos la conocida frmula de la red de difraccin (ley de Bragg):

56

6. Propiedades ondulatorias de la materia


dsen = n

(6.16)

Si suponemos que el pico a 50 corresponde a difraccin del primer orden ( n = 1) la (6.16)


nos da = 1.65 , que dentro de la precisin del experimento concuerda con el valor de la
longitud de onda calculada mediante la (6.5). Para voltajes de aceleracin mayores se puede
observar tambin un segundo pico (correspondiente a n = 2 ).
N(e)

e
dsene

30

60

90

(b)

(a)

Fig. 6.2. Difraccin de electrones: (a) esquema geomtrico, (b) resultados.

En 1928 George P. Thomson (hijo de J. J. Thomson) observ la difraccin de electrones en la


transmisin a travs de cristales. Poco despus, Immanuel Estermann, Otto Frisch y Otto
Stern encontraron efectos de difraccin al dispersar tomos de He en la superficie de un cristal de LiF. Desde entonces se observaron muchos otros ejemplos de estos efectos, y la validez
del postulado de Broglie qued confirmada ms all de toda duda.
Vamos a ver ahora que las propiedades ondulatorias del electrn permiten identificar las razones fsicas detrs de los hasta entonces misteriosos postulados de la teora de Bohr y
Sommerfeld (Captulo 5).

Interpretacin de la regla de cuantificacin de Bohr


La longitud de onda de Broglie de un electrn cuya energa cintica es del orden de la energa
cintica del electrn en el tomo de hidrgeno, es del mismo orden de magnitud que el
tamao del tomo. Por ese motivo es sensato esperar que las propiedades de las ondas piloto
sean de fundamental importancia para el movimiento del electrn dentro del tomo. Por otra
parte hay una importante diferencia entre el movimiento de una partcula libre que hemos
considerado hasta ahora y el movimiento del electrn en un estado ligado. En el caso de una
partcula libre la onda piloto es una onda viajera. En el caso de un electrn que recorre repetidamente una rbita, cabe esperar que la onda asociada sea estacionaria.
En 1924 de Broglie mostr que las propiedades de las ondas estacionarias permiten interpretar
la regla de cuantificacin de Bohr del momento angular
L = mvr = pr = nh / 2

57

, n = 1, 2, 3,

(6.17)

6. Propiedades ondulatorias de la materia


En efecto, si sustituimos en esta ecuacin la expresin del impulso p = h / , obtenemos
2r = n

(6.18)

es decir: la circunferencia de las rbitas permitidas contiene un nmero entero de longitudes


de onda de Broglie. Este es el significado de la condicin de cuantificacin de Bohr.
Si pensamos que el electrn recorre reiteradamente su rbita, la (6.18) es precisamente la
condicin necesaria para que la onda piloto asociada al movimiento del electrn se combine
coherentemente consigo misma en sucesivos recorridos, de manera que se forme una onda
estacionara. Si se violara esa condicin, al cabo de cierto nmero de vueltas, la onda piloto
interferira destructivamente consigo misma y su intensidad total se anulara. Puesto que la
intensidad de la onda piloto se relaciona con la probabilidad de encontrar la partcula, esto
implica que el electrn no se puede encontrar en una rbita que no cumpla la (6.18).
Ms en general, en el caso de una partcula que efecta un movimiento peridico se puede demostrar lo mismo. Por consiguiente llegamos a la
Interpretacin de Broglie de las reglas de cuantificacin de la Teora Cuntica Antigua:
el requerimiento que la onda piloto asociada sea estacionaria equivale a pedir que el
movimiento de la partcula cumpla las condiciones de cuantificacin de WilsonSommerfeld.
Corresponde subrayar la enorme importancia conceptual de la interpretacin de Broglie, que
por fin aclara el origen fsico de las reglas de cuantificacin que hasta entonces era misterioso.
Veremos ms adelante que las propiedades de las ondas estacionarias tienen una importancia
fundamental en la teora de Schrdinger. Se mostrar que todo estado de energa definida del
electrn est descripto por una onda estacionaria, y de resultas de ello todas las caractersticas
observables de esos estados son independientes del tiempo, entre ellas la distribucin de la
carga elctrica. Ese es el motivo porqu un electrn no emite ondas electromagnticas cuando
se encuentra en uno de los estados permitidos del tomo.

El principio de incerteza
La descripcin del movimiento en trminos de la onda piloto trae como consecuencia inevitable que no existe ningn estado de una partcula en el cual se puedan conocer con exactitud y
simultneamente su posicin y su cantidad de movimiento. Esto es una consecuencia de propiedades generales de las ondas de cualquier naturaleza (y por lo tanto tambin de las ondas
piloto), y del hecho que, de acuerdo con la interpretacin de Broglie, la partcula est localizada donde la onda piloto tiene una amplitud no nula.
Para simplificar consideremos el movimiento de una partcula libre en una dimensin espacial
x (la generalizacin a tres dimensiones es trivial). Supongamos que conocemos con exactitud
la cantidad de movimiento px de la partcula; la relacin (6.4) nos dice entonces que la longitud de onda de la onda piloto debe ser exactamente x = h / px . La onda piloto es pues una
onda monocromtica que se extiende desde x = a x = + , del tipo

= Aei( k x x t ) , kx = 2 / x = px / h , = 2 = E / h
58

(6.19)

6. Propiedades ondulatorias de la materia


Luego una partcula cuyo impulso se conoce con exactitud puede tener cualquier posicin.
La onda piloto que describe una partcula localizada en el entorno de algn x no puede ser
monocromtica sino que debe ser un paquete del tipo (6.6) (Fig. 6.1), esto es
+

A(kx )ei ( k x )ei( k x x t )dkx

(6.20)

En un instante dado, por ejemplo t = 0, tendremos (recordando las (6.10) y (6.11)) que
+

( x, 0) =

A(kx )ei ( k x )eik x x dkx = e +i[k x x ( k x )] A(kx + kx)eik ( x x0 )dkx (6.21)

Las ondas monocromticas se superponen en fase en x = x0 y por lo tanto ( x, 0) es mxima


all. Para x x0 , las diferentes ondas con kx = kx + kx tienen desfasajes dados por kx( x x0 )
y habr interferencia destructiva cuando kx( x x0 ) . Si el ancho de la distribucin espectral del paquete es kx (esto es, si A( kx + kx) difiere apreciablemente de cero slo si
| kx | < kx ), su extensin espacial x es entonces (aproximadamente) x 2 / kx , y en
consecuencia, recordando que px = hk x , resulta

xpx h

(6.22)

Este argumento muestra que hay una relacin entre la incerteza de la posicin de la partcula
(dada por la extensin x del paquete) y la incerteza de su impulso (dada por el ancho
kx = px / h de la distribucin espectral del mismo).
Se debe notar que la relacin (6.22) es aproximada, porque no dimos an una definicin precisa de x y px . Esta definicin depende de la relacin entre y la probabilidad de encontrar la partcula en un determinado lugar, que an no hemos especificado. Veremos en el prximo Captulo que dicha probabilidad es proporcional a 2 . Por lo tanto es natural definir
x como la desviacin standard desde la media, calculada con una distribucin de probabilidad proporcional a 2 . De modo anlogo, px se puede definir en trminos de A 2 .
La herramienta matemtica apropiada para manejar expresiones del tipo (6.20) es la transformacin (o integral) de Fourier. La transformada de Fourier de la funcin f (r ) se indica con
F( s) y est definida por
F(s) =

1
2

f (r )eirs dr

(6.23)

La transformacin de Fourier se puede invertir por medio de la integral de inversin


f (r ) =

1
2

F(s)e irs ds

(6.24)

y se dice que F( s) es la antitransformada de Fourier de f (r ) . Las transformadas de Fourier


figuran en tablas (ver por ejemplo Gradshteyn y Ryzhik, Tables of Integrals, Series and Pro59

6. Propiedades ondulatorias de la materia


ducts, Academic Press, 1980) o se calculan numricamente. De inters para nosotros son la
transformada de Fourier de una constante, que es proporcional a la funcin delta de Dirac:
f (r ) = 1

F( s) = (2 )1 / 2 ( s)

(6.25)

y la transformada de Fourier de una Gaussiana, que es tambin una Gaussiana:


f (r ) = e r

/ 2a2

F( s) = ae a

2 2

s /2

(6.26)

De la (6.25) vemos que el paquete de ondas que describe una partcula perfectamente localizada en x = 0 , es decir, tal que ( x ) ( x ) se obtiene como una superposicin del tipo
(6.20) con A( kx ) = cte., es decir, una superposicin de todos los posibles valores de kx , y por
lo tanto de px . Por consiguiente, si una partcula est exactamente localizada en una posicin, su cantidad de movimiento es completamente indeterminada.
El caso de una partcula cuya cantidad de movimiento se conoce con exactitud pero su posicin est completamente indeterminada, y el de una partcula cuya posicin se conoce con
exactitud pero su cantidad de movimiento est completamente indeterminada son casos extremos. En general se conoce la cantidad de movimiento con una incerteza px y la posicin
con una incerteza x . En ese caso, las propiedades de la integral de Fourier permiten encontrar la relacin entre x y px . Por ejemplo, supongamos tener un paquete Gaussiano de ancho kx , esto es
A( kx ) e ( k x / 2 k x )

(6.27)

Entonces la (6.26) muestra que en t = 0, ( x ) es una Gaussiana de ancho x :


2

( x ) e ( x / 2 x ) ,

(6.28)

donde los anchos kx y kx de las respectivas distribuciones de probabilidad (proporcionales


a 2 y A 2 ) cumplen

xkx = 1 / 2

(6.29)

y recordando que kx = px / h , obtenemos que en t = 0 un paquete Gaussiano cumple2

xpx = h / 2

(6.30)

La teora de la transformacin de Fourier permite demostrar que en general los anchos de


f (r ) y de su transformada F( s) , definidos como las desviaciones standard desde las medias
2
(calculadas en trminos de f y F 2 ), cumplen la relacin

rs 1 / 2

Se puede mostrar que para tiempos diferentes del inicial, el ancho x es mayor.

60

(6.31)

6. Propiedades ondulatorias de la materia


donde el signo = se cumple slo cuando f (r ) y su transformada F( s) son Gaussianas. En general la relacin entre las incertezas de la posicin y el impulso de una partcula es entonces:

xpx h / 2

(6.32)

Generalizando lo anterior a tres dimensiones, llegamos al:


Principio de incerteza de Heisenberg:
si x, y, z son las coordenadas de una partcula y px , py , pz son los respectivos impulsos
conjugados, se cumple que

xpx h / 2
ypy h / 2

(6.33)

zpz h / 2
en el caso de coordenadas angulares, entre cada coordenada y el correspondiente momento angular L se cumple la relacin de incerteza

L h / 2

(6.34)

Observemos que el principio de incerteza no establece restricciones sobre productos del tipo
xpy , xy , px py , etc.
La (6.32) establece solamente un lmite inferior al producto xpx . Es perfectamente posible
tener situaciones en que xpx >> h ; esto ocurre cuando nuestras mediciones de la posicin
y el impulso no alcanzan la mxima precisin posible, compatible con el principio de incerteza. Puesto que h es muy pequeo, es muy difcil que en una medicin en escala macroscpica xpx sea comparable con h , y por ese motivo el principio de incerteza es irrelevante
en los experimentos de la Mecnica Clsica. Sin embargo, sus consecuencias son muy importantes cuando se consideran las distancias y los impulsos de los sistemas atmicos y nucleares. Como prueba de ello vamos a mostrar que el tamao del tomo est determinado por el
principio de incerteza.
Consideremos, para simplificar, un tomo de hidrgeno. Podemos expresar la energa del
electrn como la suma de la energa cintica p 2 / 2 me ms la energa potencial e 2 / r :

E=

p 2 e2

2 me r

(6.35)

La incerteza de la posicin del electrn es r r , y por consiguiente la incerteza de su impulso es p h / r , por lo tanto p 2 ( p)2 h 2 /( r )2 . Sustituyendo en (6.35) obtenemos

E=

h2
e2

2 me ( r )2 r

El estado de menor energa se obtiene requiriendo que

61

(6.36)

6. Propiedades ondulatorias de la materia

dE
1 h2
=
e2 = 0
2
dr
( r ) me r

(6.37)

lo que nos da

r =

h2
= a0
mee 2

(6.38)

es decir r = a0 . Por lo tanto:


El radio de Bohr, que nos da el tamao del tomo de hidrgeno, se obtiene pidiendo que
la energa del tomo tenga el mnimo valor compatible con el principio de incerteza.

Interpretacin fsica de Heisenberg del principio de incerteza


En nuestra presentacin, el principio de incerteza surge como una consecuencia matemtica
de la hiptesis de Broglie, que asocia a cada partcula una onda piloto que describe su movimiento. Pero debemos recordar que cuando Werner Heisenberg introdujo en 1927 el principio
de incerteza, sus argumentos no se basaron en la hiptesis de Broglie, sino en las propiedades
corpusculares de la radiacin electromagntica y sus consecuencias sobre el proceso de medicin. De esta forma, Heisenberg puso de manifiesto que existe un lmite natural insuperable a
la precisin con la que se pueden medir simultneamente la posicin y el impulso de una
partcula, debido a que la medicin de una de estas cantidades inevitablemente perturba a la
partcula de modo tal que deja incierto el valor de la otra canobservador
tidad. Este es el origen fsico del principio de incerteza.
La naturaleza de los argumentos de Heisenberg se entiende si
examinamos un experimento de pizarrn ideado por Bohr en
1928. Consideremos el dispositivo de la Fig. 6.3. Con el microscopio se desea determinar la posicin instantnea de la
partcula, que podemos ver por medio de los fotones que dispersa cuando se la ilumina. El poder de resolucin del microscopio es / sen ( es la longitud de onda y es el semingulo subtendido por el objetivo del microscopio), por lo tanto la
indeterminacin de la medida es
_

(6.39)
x
sen
hi
x
Supongamos que basta ver un fotn para llevar a cabo la mepartcula
dida. Claramente, el microscopio capta el fotn cuando ste es
dispersado en un ngulo comprendido entre y +. Luego la
Fig. 6.3. Microscopio de
incerteza de la componente x del impulso del fotn despus de
Heisenberg.
la dispersin es

( px )fotn = 2 psen =

62

2 hsen

(6.40)

6. Propiedades ondulatorias de la materia


pues pfotn = h / . Ahora bien, como la componente x del impulso del fotn se puede conocer
exactamente antes de la dispersin (no hace falta conocer la coordenada x del cuanto), la conservacin de la cantidad de movimiento implica que la partcula adquiere un impulso cuya
magnitud es incierta en una cantidad igual a la incerteza del impulso del fotn, es decir

px = ( px )fotn =

2 hsen

(6.41)

Por lo tanto, en el instante de la medicin tenemos que

xpx 2 h > h

(6.42)

Si se usa luz de longitud de onda ms corta, la medida de la posicin es ms precisa, pero al


mismo tiempo aumenta la incerteza del impulso de la partcula.
Esta discusin muestra que el principio de incerteza es consecuencia de la cuantificacin de la
radiacin electromagntica, y se origina porque para observar la partcula es preciso dispersar
por lo menos un fotn. En otras palabras, es imposible observar la partcula por medio de una
iluminacin que le imparta un impulso arbitrariamente pequeo. Debido a la cuantificacin, el
fotn es el intermediario indispensable entre la partcula y el instrumento de medida, y perturba la partcula de una manera incontrolable e impredecible. Por lo tanto es imposible, despus de la medida, conocer con exactitud la posicin y la cantidad de movimiento de la partcula. Las relaciones de incerteza (6.32) y (6.33) expresan que la constante de Planck es la medida de la magnitud mnima de esa perturbacin incontrolable3.

La relacin de incerteza entre la energa y el tiempo


Consideremos un grupo de ondas del tipo
+

A(kx )ei ( k x )ei( k x x t )dkx

, = ( k x )

(6.43)

cuya longitud es x . El tiempo que necesita el grupo para recorrer la distancia x es

t =

x x
=
vg
vx

(6.44)

donde vx es la componente x de la velocidad de la partcula. Por lo tanto t es la incerteza


con la cual se conoce el instante en el cual el grupo pasa por un determinado lugar. Pero
igualmente, podemos interpretar que t es el intervalo de tiempo durante en cual un observador ubicado en una posicin fija x puede llevar a cabo mediciones sobre la partcula.
Por otra parte el grupo es una superposicin de ondas de diferentes kx , por lo tanto de diferentes frecuencias, y por ende de diferentes energas E = h = h ( kx ) . De la relacin
3

En el libro de Heisenberg The Physical Principles of Quantum Mechanics (Dover, 1930) el lector puede

encontrar una extensa discusin del principio de incerteza y de numerosos experimentos de pizarrn que
ilustran su origen fsico.

63

6. Propiedades ondulatorias de la materia

E
=
= (vg ) x = vx
kx px

(6.45)

resulta que la incerteza en px implica una incerteza en la energa de la partcula, dada por

E = v x p x

(6.46)

Tomando el producto de (6.44) por (6.46) y usando la relacin de incerteza xpx h / 2


obtenemos entonces una relacin entre el tiempo t durante el cual se observa la partcula y
la incerteza E de su energa:

tE h / 2

(6.47)

La interpretacin de Heisenberg de la relacin de incerteza (6.47) es ms amplia y se enuncia


de la manera siguiente:
Relacin de incerteza entre la energa y el tiempo:
una medida de la energa de un sistema efectuada durante el tiempo t tiene una incerteza E , y se cumple que tE h / 2 .
Veremos ms adelante ejemplos de situaciones donde se aplica esta relacin de incerteza.

La dispersin de un paquete de ondas


Consideremos un paquete de ondas que describe una partcula libre, de la forma (6.6):
+

( x, t ) =

A(k )ei( k x t )dk

(6.48)

y sea kx es el ancho de la distribucin espectral A( k ) . En la (6.48) pusimos ( k ) = 0 de


modo que el grupo est localizado en x = 0 cuando t = 0.
En t = 0 la (6.48) se reduce a
+

( x, 0) = eikx A( k )eik x dk

(6.49)

donde k = k + k . Para estudiar la evolucin temporal del paquete desarrollamos el exponente imaginario de la (6.48) en potencias de k , pero a diferencia de lo que hicimos antes
(ec. (6.10)) vamos a conservar los trminos cuadrticos. Tenemos entonces:

k x ( k )t = ( k + k ) x ( k + k )t = kx ( k )t + x

h
= kx ( k )t + ( x vt )k
tk 2
2m


2
t k 12 2 tk 2
k
k

(6.50)

donde para escribir el ltimo rengln usamos que / k = vg = v = p / m = hk / m , y por lo


tanto que 2 / k 2 = h / m . Sustituyendo (6.50) en (6.48) obtenemos
64

6. Propiedades ondulatorias de la materia


+

( x, t ) =

ei[ kx ( k )t ]

h
i ( x vt ) k
tk 2
m
2

dk
A( k )e

(6.51)

Comparando la (6.51) con la (6.49) vemos que si ignorramos el trmino cuadrtico en k de


la exponencial en el integrando de la (6.51), se tendra que ( x, t ) = e i ( k )t ( x vt, 0) , esto
es, el grupo se movera sin cambiar de forma (la fase e i ( k )t es irrelevante). Es precisamente
el trmino htk 2 / 2 m el que da lugar a la dispersin del grupo, al introducir un desfasaje creciente con el tiempo entre las diferentes ondas monocromticas que lo componen. La condicin de interferencia destructiva es ahora
h
k xt
tk

2m

(6.52)

donde hemos escrito xt = x vt para indicar el apartamiento desde el centro del grupo. De la
(6.52) resulta que el ancho del grupo es entonces

xt = 2xt

2 h
+ tk
k m

(6.53)

que podemos escribir en la forma

x t

h p
+
t = x0 + vt
p m

(6.54)

La (6.54) muestra que el ancho del paquete crece linealmente con el tiempo desde su valor
mnimo x0 h / p para t = 0, dado por el principio de incerteza.
Este resultado es coherente con lo que se obtiene clsicamente. En efecto, en la Mecnica
Clsica, si en t = 0 determinamos la posicin de una partcula con una incerteza x0 y su
velocidad con una incerteza v (debido a las limitaciones de los instrumentos de medida),
despus de transcurrir un tiempo t la incerteza de la posicin es precisamente la que resulta de
la ec. (6.54). En este sentido, la frmula (6.54) no nos dice nada nuevo. La novedad es que
ahora, a diferencia de lo que ocurre en la Mecnica Clsica, x0 y v no son independientes
pues estn relacionados por el principio de incerteza x0 v h / m . De resultas de eso la
(6.54) se puede escribir

x t = x 0 +

h
t
mx0

(6.55)

De la (6.55) vemos que cuanto menor es la incerteza x0 , tanto ms rpidamente crece xt .

El principio de complementaridad
El principio de incerteza permite resolver las aparentes paradojas que se originan en la dualidad onda-corpsculo de la radiacin y la materia. Si se intenta determinar si la radiacin es
una onda o un corpsculo, resulta que todo experimento que fuerza a radiacin a exhibir su
carcter ondulatorio, al mismo tiempo suprime las manifestaciones de su carcter corpuscular,
65

6. Propiedades ondulatorias de la materia


y viceversa. Es decir, en una misma situacin experimental no se pueden observar a la vez los
aspectos ondulatorio y corpuscular. Lo mismo ocurre con la materia. De resultas de ello las
evidencias obtenidas bajo distintas condiciones experimentales no se pueden captar en una
nica imagen, sino que son complementarias, en el sentido que slo la totalidad de los fenmenos agota la posible informacin sobre el objeto del estudio. Esto es consecuencia de que a
nivel atmico es imposible separar netamente el comportamiento de los objetos (fotones,
electrones, etc.) de la interaccin con el instrumento de medida, que define las condiciones
bajo las cuales aparece el fenmeno. Esta es la esencia del principio de complementaridad de
Bohr: los conceptos de onda y partcula no se contradicen sino que se complementan.
Consideremos, por ejemplo, el experimento de Young de
interferencia de luz por dos rendijas (o en forma equivafuente
lente, la interferencia de electrones) cuyo esquema se da
en la Fig. 6.4. La distancia entre las rendijas es d.
Del punto de vista ondulatorio, la onda original se divide
en dos ondas coherentes al pasar por las rendijas, y la superposicin de ambas produce las caractersticas franjas
de interferencia en la pantalla.
Supongamos ahora que reemplazamos la pantalla por un
mosaico de minsculos fotoctodos, de manera que mid
rendijas
diendo la corriente producida por la emisin del correspondiente fotoelectrn podemos determinar en qu lugar
y
de la pantalla ha llegado cada fotn. Igualmente, la distrie
bucin de los fotoelectrones sigue el mismo patrn de inx
terferencia. Sin embargo, cada fotn individual llega a un
lugar bien definido de la pantalla: el del fotoctodo donde
fue absorbido.
Si se piensa en el fotn como un corpsculo, parece lgico
pensar que tiene que pasar o por una, o por la otra de las
pantalla
rendijas, pero en este caso se plantea una paradoja, pues a
Fig. 6.4. Interferencia por dos primera vista parece absurdo que el movimiento del fotn
rendijas.
ms all de las rendijas est influenciado por la presencia
de la rendija por la cual no pas.
La paradoja proviene de suponer que el fotn debe pasar por una rendija o por la otra. Tal
afirmacin no tiene sentido a menos que se determine experimentalmente por cul de las dos
rendijas ha pasado. Sin embargo, resulta que esa determinacin es imposible de lograr, sin
destruir el patrn de interferencia.
En efecto, para determinar por cul rendija pasa el fotn habra que poner un detector en cada
rendija. Pero el detector inevitablemente interacta con el fotn y altera la trayectoria que de
otra forma seguira. El principio de incerteza permite demostrar que si el detector tiene suficiente resolucin espacial como para poder determinar por cul rendija pas el fotn, entonces
la perturbacin que produce en el impulso del fotn causa una desviacin que destruye el
patrn de interferencia de dos rendijas.

66

6. Propiedades ondulatorias de la materia


Supongamos, para concretar, que con nuestro detector determinamos la coordenada y del fotn con una incerteza

y << d .

(6.56)

con lo cual podemos asegurar por cul rendija pas.


En este proceso de deteccin hay una interaccin que cambia el impulso del fotn; de resultas
de ello la componente y del impulso tendr una incerteza py . Para no destruir el patrn de
interferencia, py debe ser tal que

py / px <<

(6.57)

donde px es la componente x del impulso del fotn y es el ngulo subtendido desde la rendija por la posicin de un mximo y la del mnimo adyacente, que vale

= / 2d

(6.58)

py << px / 2 d = h / 2 d

(6.59)

Sustituyendo (6.58) en (6.57) obtenemos

pues h / px . Multiplicando ahora las desigualdades (6.56) y (6.59) obtenemos que la condicin que se debe satisfacer para determinar por cul rendija pasa el fotn, sin destruir el
patrn de interferencia, es

ypy << h / 2

(6.60)

Pero esta condicin viola el principio de incerteza. Por lo tanto no podemos saber por cul
rendija pas el fotn y al mismo tiempo ver la figura de interferencia. Esto significa que el
problema que nos preocupa es ilusorio.
Veremos luego otros ejemplos en que el principio de incerteza ayuda a resolver conflictos
aparentes entre los aspectos ondulatorios y corpusculares de un ente.

67

7. La teora de Schrdinger

7. LA TEORA DE SCHRDINGER
Introduccin
El trabajo de Broglie llam la atencin de Einstein, quien lo consider muy importante y lo difundi entre los fsicos. Inspirado en las ideas all expuestas, Erwin Schrdinger desarroll entre
1925 y 1926 su teora de la mecnica ondulatoria, que es una de las maneras en que se presenta
la Mecnica Cuntica. Corresponde mencionar que casi simultneamente, Werner Heisenberg
desarroll un enfoque alternativo: la mecnica matricial. En la teora de Heisenberg no se consideran ondas piloto; en su lugar se manejan las variables dinmicas como x, px , etc., que se representan mediante matrices. Los aspectos cunticos se introducen en dicha teora por medio del
principio de incerteza, que se expresa por medio de las propiedades de conmutacin de las matrices. El principio de incerteza es en realidad equivalente al postulado de Broglie, y las teoras
de Heisenberg y de Schrdinger son idnticas en contenido aunque de forma aparentemente muy
distinta. Pero esto no fue comprendido en seguida, y en un primer momento hubo cidas polmicas entre los sostenedores de una y otra, hasta que Schrdinger en 1928 demostr la equivalencia
de ambas. Debido a que la teora de Schrdinger se presta mejor para un tratamiento introductorio no entraremos en los detalles de la teora de Heisenberg1.

La ecuacin de Schrdinger
Aunque el postulado de Broglie es correcto, no es todava una teora completa del comportamiento de una partcula, pues no se conoce la ecuacin que rige la propagacin de la onda piloto.
Por eso pudimos analizar la propagacin de la onda piloto nicamente en el caso de una partcula libre y no sabemos an como tratar una partcula sometida a fuerzas. Falta, adems, una relacin cuantitativa entre la onda y la partcula, que nos diga de qu forma la onda determina la
probabilidad de observar la partcula en un determinado lugar.
Pese a que el postulado de Broglie es consistente con la relatividad (restringida), Schrdinger se
limit a desarrollar una teora no relativstica2. Adems abandon el trmino onda piloto y
llam funcin de onda a la funcin ( x, t ) y a la onda en s; nosotros usaremos esa terminologa
de ahora en ms. En consecuencia Schrdinger adopt como punto de partida las ecuaciones

= h/ p

(7.1)

= E/h

(7.2)

pero supuso que la energa est dada por la expresin no relativstica


1
2

El lector interesado los puede encontrar en el libro de Heisenberg ya citado en el Captulo 6.


Tena buenas razones para ello. El desarrollo de la Mecnica Cuntica Relativstica es mucho ms complejo y

difcil y slo se pudo completar muchos aos despus. La razn fundamental es que en una teora relativstica
consistente no se pueden introducir fuerzas (que implican accin a distancia) y adems hay que tomar en cuenta los
procesos de creacin y aniquilacin de materia (ver Captulo 4). Esto implica que se tiene que cuantificar el campo
electromagntico (y el que describe cualquier otro tipo de fuerzas que se quiera considerar) y los campos que
describen las partculas.

68

7. La teora de Schrdinger

E = p2 / 2 m + V

(7.3)

donde m es la masa en reposo. Esta diferencia en la definicin de E cambia el valor de . Pero


cabe sealar que los experimentos de difraccin que demuestran la validez de la (7.1), en realidad no dicen nada acerca de la (7.2). Adems veremos que el valor de no tiene importancia en
la teora de Schrdinger. Asimismo, la (7.3) da el valor correcto de la velocidad de grupo para
una partcula libre ( V = V0 = cte.), pues usando (7.2) resulta

h = h 2 k 2 / 2 m + V0

(7.4)

donde k = 2 / y = 2 , y por lo tanto

vg =

= hk / m = p / m = v
k

(7.5)

La ecuacin que rige la propagacin de las ondas de materia debe satisfacer entonces los siguientes requisitos:

Debe ser consistente con las ecs. (7.1), (7.2) y (7.3), esto es con h = h2 k 2 / 2 m + V .
Debe ser lineal en ( x, t ) , para que podamos superponer funciones de onda y reproducir
efectos de interferencia y difraccin como los que observaron Davisson y Germer.

El impulso de una partcula libre es constante; por lo tanto cuando V = V0 = cte. la ecuacin
debe tener soluciones de onda viajera como vimos en el Captulo 6.
Consideremos entonces una partcula libre. Para satisfacer el tercer requisito, la describiremos
mediante una onda viajera f que depende del argumento ( kx t ) . Puesto que para hacer aparecer los factores y k2 de la ec. (7.4) hay que derivar la funcin de onda una vez respecto del
tiempo y dos veces respecto de la coordenada, la ecuacin buscada podra ser de la forma

f h 2 2 f
=
+ V0 f
t
2 m x 2

(7.6)

donde y son constantes a determinar. Como la (7.6) es lineal, satisface el segundo requisito.
Es fcil ver que ondas viajeras del tipo f = cos(kx t ) f = sen( kx t ) no cumplen con
primer requisito, pues no se puede recoger en un factor comn la dependencia espacial y temporal, como hara falta para obtener la (7.4). Pero con un poco de lgebra se ve que una combinacin lineal del tipo f = cos( kx t ) + sen( kx t ) permite obtener la (7.4) si = i , = y
= 1. Lo usual es tomar = +i , luego = i y entonces obtenemos de la (7.6) la ecuacin
2
f
h2 f
ih
=
+ V0 f
2 m x 2
t

(7.7)

que cumple los tres requisitos que estipulamos. La solucin de onda viajera es pues de la forma

f = cos( kx t ) + isen( kx t ) = ei( kx t )


y como adelantamos en el Captulo 6 es necesariamente compleja.

69

(7.8)

7. La teora de Schrdinger
La ec. (7.8) se obtuvo para el caso especial V = V0 = cte.. Vamos a postular que cuando
V = V ( x, t ) , la ecuacin diferencial que describe la funcin de onda tiene la misma forma. Se
obtiene as la
Ecuacin de Schrdinger:
ih

( x, t )
h 2 2 ( x, t )
=
+ V ( x, t ) ( x, t )
t
2 m x 2

(7.9)

Como se ve, es una ecuacin en derivadas parciales lineal y del segundo orden, y a diferencia de
otras ecuaciones diferenciales de la fsica contiene el imaginario i. De resultas de eso sus soluciones son necesariamente funciones complejas.
La (7.9) vale para una dimensin espacial. En tres dimensiones la ecuacin de Schrdinger es:
ih

( r , t )
h2 2
=
( r , t ) + V ( r , t ) ( r , t )
t
2m

(7.10)

donde 2 es el operador Laplaciano.

Interpretacin de la funcin de onda


La funcin de onda ( x, t ) es inherentemente compleja y por lo tanto no se puede medir con un
instrumento real. Pero sta es una caracterstica deseable pues nos impide atribuir a la funcin de
onda una existencia fsica como (por ejemplo) la de las olas de la superficie del agua. En realidad ( x, t ) no es ms que un instrumento de clculo que slo tiene significado en el contexto de
la teora de Schrdinger de la que forma parte. Esto queda de manifiesto claramente si se considera que la funcin de onda no aparece en la teora de Heisenberg, y sin embargo los resultados
fsicos de ambas teoras son equivalentes. Veremos ms adelante otras consecuencias de estos
hechos. Pero lo dicho no implica que la funcin de onda carece de inters fsico. Veremos, en
efecto, que la funcin de onda contiene toda la informacin sobre la partcula asociada, compatible con el principio de incerteza.
Para obtener esa informacin hay que relacionar ( x, t ) con las variables dinmicas de la partcula asociada. Como dijimos en el Captulo 6, hay una relacin entre la intensidad de ( x, t )
en un punto (x, t) y la densidad de probabilidad P( x, t ) de encontrar a la partcula en el entorno
de ese punto. Sin embargo, es obvio que no podemos igualar una cantidad compleja como
( x, t ) con P( x, t ) que es una magnitud real. La relacin correcta entre ( x, t ) y P( x, t ) fue
propuesta en 1926 por Max Born:
Postulado de Born:
si en el instante t se lleva a cabo una medida para ubicar la partcula descripta por la funcin de onda ( x, t ) , entonces la probabilidad P( x, t )dx de que el valor de x se encuentre
entre x y x + dx es
P( x, t )dx =

* ( x, t ) ( x, t )dx
=
* ( x, t ) ( x, t )dx

todo x

( x, t ) 2 dx
2
( x, t ) dx

todo x

donde * ( x, t ) indica el complejo conjugado de ( x, t ) .

70

(7.11)

7. La teora de Schrdinger
Para que el postulado de Born tenga sentido, la integral
N

* ( x, t ) ( x, t )dx

(7.12)

todo x

(que se denomina la norma de ) debe existir. En otras palabras, toda funcin de onda aceptable
debe ser de cuadrado integrable, lo que implica que ( x, t ) debe tender a cero con suficiente
rapidez para x . Se debe notar que las soluciones de onda viajera del tipo (7.8) no son de
cuadrado integrable y por lo tanto no son funciones de onda aceptables. Sin embargo no las vamos a descartar pues a partir de ellas, mediante la integral de Fourier, se pueden formar paquetes
que s son de cuadrado integrable y por lo tanto funciones de onda aceptables. Volveremos ms
adelante sobre este tema.
En adelante vamos a suponer que la funcin de onda est normalizada de modo que la integral
del cuadrado de su mdulo (extendida a todo el dominio de la coordenada) es igual a la unidad:
N =

* ( x, t ) ( x, t )dx

todo x

( x, t )2 dx

=1

(7.13)

todo x

cosa que podemos lograr siempre, pues la ecuacin de Schrdinger es lineal y si es una solucin no normalizada, entonces

* dx

(7.14)

todo x

es tambin solucin y est normalizada. Adems mostraremos en breve que si la funcin de onda
est normalizada en un dado instante t, permanece normalizada en todo otro instante t . En consecuencia podemos escribir la (7.11) como
P( x, t )dx = * ( x, t ) ( x, t )dx = ( x, t ) 2 dx

(7.15)

La cantidad * = 2 es siempre real y por lo tanto el postulado de Born no es inconsistente.


Pero esto no prueba todava la validez de dicho postulado, pues * no es la nica funcin real
que se puede obtener a partir de . Sin embargo se puede dar un argumento de plausibilidad del
modo siguiente. La satisface la ecuacin de Schrdinger
ih

h 2 2
=
+ V
t
2 m x 2

(7.16)

Tomando el complejo conjugado de la (7.16) obtenemos


ih

*
h 2 2 *
=
+ V *
t
2 m x 2

(7.17)

Ahora multiplicamos la (7.16) por * y la (7.17) por y restamos para obtener

*
h 2 * 2
2 *
ih *
+
=

t
t
x 2
x 2
2m

71

(7.18)

7. La teora de Schrdinger
que se puede poner en la forma

ih *

* =
*

t
x 2 m
x
x

(7.19)

Si ahora definimos la corriente de probabilidad como


J ( x, t )

ih *

*

2m
x
x

(7.20)

la (7.19) se escribe como

P
J
=
t
x

(7.21)

Esta ecuacin expresa la conservacin de la probabilidad. En efecto, integrando la (7.21) entre


x1 y x2 obtenemos
x

2
P( x, t )dx = J ( x1, t ) J ( x2 , t )
t x

(7.22)

que nos dice que la variacin de la probabilidad de encontrar la partcula en el intervalo ( x1 , x2 )


est dada por el flujo neto de la corriente de probabilidad que entra en dicho intervalo.
Si extendemos el intervalo de integracin a todo x, resulta
+

dN
* ( x, t ) ( x, t )dx = = 0
P( x, t )dx =

t
t
dt

(7.23)

puesto que y / x , y entonces J, se anulan en x = . Por lo tanto la (7.23) nos dice que
si la funcin de onda est normalizada en un dado instante t, permanece normalizada en todo
otro instante t .

La ecuacin de Schrdinger independiente del tiempo


Cuando V = V ( r ) no depende del tiempo, la ecuacin de Schrdinger (7.10) admite soluciones
separables de la forma

( r , t ) = ( r ) (t )

(7.24)

La soluciones de la forma (7.24) son una familia de soluciones particulares de la (7.10) que reviste particular inters, como veremos ahora.
Sustituyendo (7.24) en (7.10) y dividiendo por ( r ) (t ) obtenemos
ih

1 d (t )
1 h2 2
=
( r ) + V ( r ) ( r )

(t ) dt
(r ) 2m

(7.25)

El miembro izquierdo de la (7.25) depende solo de t y el miembro derecho depende solo de las
variables espaciales r. Por lo tanto ambos miembros deben ser iguales a una constante C, que se
72

7. La teora de Schrdinger
denomina constante de separacin, y entonces la ecuacin de Schrdinger se separa en dos
ecuaciones, una para (t ) y la otra para ( r ) :

ih

1 d (t )
1 h2 2
=C ,
( r ) + V ( r ) ( r ) = C

(t ) dt
(r ) 2m

(7.26)

La ecuacin para (t ) se integra de inmediato. A menos de un factor constante, la solucin es:

(t ) = e iCt / h

(7.27)

que es una funcin compleja puramente oscilatoria con frecuencia = C / h . Recordando que la
(7.2) nos dice que = E / h , donde E es la energa de la partcula, debemos identificar la constante de separacin C con la energa total E. Luego la segunda de las (7.26) se escribe como la
Ecuacin de Schrdinger independiente del tiempo:

h2 2
( r ) + V ( r ) ( r ) = E ( r )
2m

(7.28)

Esta ecuacin determina la dependencia espacial ( r ) de las funciones de onda separables del
tipo (7.24). Como se ve es una ecuacin del segundo orden, que no contiene factores imaginarios
y por lo tanto sus soluciones no son necesariamente complejas. Sus soluciones E ( r ) , que dependen del valor de la constante de separacin E, se denominan autofunciones (o funciones propias) de la energa, y los correspondientes valores de E se denominan autovalores (o valores
propios) de la energa.
Finalmente, la funcin de onda se escribe como

E ( r , t ) = E ( r )e iEt / h

(7.29)

Veremos en seguida que al resolver la ecuacin de Schrdinger independiente del tiempo (7.28)
slo se obtienen soluciones aceptables para ciertos valores particulares de E. De esta forma aparece la cuantificacin de la energa.

Cuantificacin de la energa en la teora de Schrdinger


Para ver de manera sencilla como aparece la cuantificacin de la energa, consideremos las soluciones E ( x ) de la ecuacin de Schrdinger independiente del tiempo en el caso de una sola
coordenada x. La (7.28) se escribe entonces
h2
xx = [V ( x ) E ]
2m

(7.30)

Para que una solucin sea aceptable y x deben ser uniformes, finitas y continuas para todo x,
pues en caso contrario la funcin de onda violara alguno de estos requisitos, y entonces la
densidad de probabilidad o la corriente de probabilidad no estaran bien definidas en algn lugar.
Si adems E y V son finitos, entonces la (7.30) nos dice que xx es tambin finita.
Supongamos ahora que resolvemos la (7.30) para un potencial V ( x ) como se muestra en la Fig.
7.1, por ejemplo por integracin numrica. Para eso comenzamos por asignar arbitrariamente un

73

7. La teora de Schrdinger
valor de E (como el que se indica en la Fig. 7.1 con la recta horizontal). Vemos as que los puntos de retorno clsicos x y x (determinados por la condicin E = V ( x ) ) dividen el eje x en tres
regiones: x < x (regin I) y x > x (regin III), donde V ( x ) E > 0 y por lo tanto xx > 0 , y
x < x < x (regin II), donde V ( x ) E < 0 y entonces xx < 0 .
Comencemos por integrar la (7.30) en la
V(x)
direccin positiva de x a partir del punto
x0 , asignando los valores iniciales de
V1
( x0 ) y x ( x0 ) . Dada la linealidad de la
ecuacin (7.30) podemos siempre fijar
I
II
III
( x0 ) = 1 , de modo que el nico parmeE
tro que podemos variar para obtener una
solucin aceptable es x ( x0 ) .
De acuerdo a lo dicho, en la regin II
x0 x"
x'
x
es cncava hacia abajo donde > 0 y
cncava hacia arriba donde < 0 . Luego
Fig. 7.1. Diagrama de la energa que muestra la oscila y se mantiene acotada.
relacin entre la energa potencial y la energa
En la regin III, en cambio, es cncava
total en un caso tpico.
hacia arriba donde > 0 y cncava hacia
abajo donde < 0 . Entonces se dispara hacia + (si es positiva) como en la curva (a) de la
Fig. 7.2, o hacia (si es negativa) como en la curva (b), y en ambos casos, tanto ms rpidamente cuanto mayor es . Por supuesto ninguno de estos comportamientos es aceptable. Solamente para un nico valor x ( x0 ) III de x ( x0 ) se encontrar una que tenga un comportamiento aceptable como el de la curva
s(x)
(c). En este caso tiende asinttica(a)
mente al eje x, y cuanto ms se apro1
xima a l, tanto menor es su concaviI
II
III
dad, de modo que no se vuelve hacia
arriba. Cuando se resuelve numrica(c) mente el problema, x ( x0 ) III se de0
termina por prueba y error.
x0 x"
x'
x
Al integrar la (7.30) desde x0 en la
direccin negativa de x, en la regin I
sucede lo mismo que en la regin III:
(b)
en general se dispara hacia + o
hacia , salvo para un nico valor
Fig. 7.2. Intentos de integracin numrica de la
ecuacin de Schrdinger independiente del tiempo.
x ( x0 ) I de x ( x0 ) , que da un comportamiento aceptable para x .
Usualmente tendremos x ( x0 ) I x ( x0 ) III . Por lo tanto la (7.30) no tiene soluciones aceptables para el valor de E que hemos fijado, pues cualquiera sea el valor de x ( x0 ) que se elija,
diverge para x + , o para x , o en ambos casos.
Sin embargo, al repetir el procedimiento con diferentes valores de E, se encuentra en general que
existen algunos valores especiales E1, E2 , E3 , (ordenados de menor a mayor) para los cuales
se cumple que x ( x0 ) I = x ( x0 ) III , y entonces la ecuacin de Schrdinger independiente del
tiempo tiene soluciones aceptables 1 ( x ), 2 ( x ), 3 ( x ), . La Fig. 7.3 muestra (cualitativamente) el aspecto de las tres primeras soluciones aceptables; se ve que en las regiones I y III el
74

7. La teora de Schrdinger
comportamiento de todas ellas es semejante, mientras que en la regin II se observa que 1 ( x )
no se anula nunca, 2 ( x ) tiene un nodo, 3 ( x ) tiene dos nodos, y as sucesivamente.
De la Fig. 7.3 y de la ec. (7.30) se puede
ver que E2 > E1 . Consideremos el punto
x0 donde 1 ( x ) = 2 ( x ) . De la Fig. se
s2(x)
reconoce que
s1(x)
(7.31)
( 2 ) xx x > ( 1 ) xx x
0

x'

x0

x"

de modo que
V ( x0 ) E2 > V ( x0 ) E1 (7.32)

s3(x)

y por lo tanto E2 > E1 . De manera semejante se puede ver que E3 > E2 , etc.
Fig. 7.3. Las tres primeras soluciones aceptables de
la ecuacin de Schrdinger independiente del tiemDebe quedar claro que las diferencias de
po en un caso tpico.
energa ( E2 E1 ), ( E3 E2 ), etc.
no son infinitesimales, porque las diferencias entre las derivadas segundas de en x0 son finitas. Por lo tanto los valores permitidos de la energa estn bien separados y forman un conjunto
discreto.
Resulta entonces que la energa de una partcula cuya energa potencial es independiente del
tiempo est cuantificada, pues slo para un conjunto discreto de valores E1, E2 , E3 , de la
energa (que se denominan niveles de energa) hay soluciones aceptables de la ecuacin de
Schrdinger independiente del tiempo.
Lo dicho vale siempre y cuando el valor
E
de la energa total sea tal que haya dos
puntos de retorno. Si V ( x ) es tal como se
Continuo
muestra en la Fig. 7.1, esto es cierto si
V1
E < V1, donde V1 es el valor lmite que
alcanza V cuando x + ; en este caso
hay en general un nmero finito3 de niE3
veles discretos de la energa para los
E2
E1
cuales E < V1 (Fig. 7.4).
Cuando E > V1 la situacin es diferente,
pues hay un nico punto de retorno (el
x
punto x ), que divide el eje x en las reFig. 7.4. Niveles permitidos de energa en un caso giones I ( x < x ) y II ( x > x ). Puesto que
tpico.
en la regin II se cumple que
V ( x ) E < 0 , la oscila y se mantiene finita para x + . Pero nuestra discusin anterior
muestra entonces que para cualquier valor de E ( E > V1) se puede siempre elegir un valor
3

Puede haber excepciones cuando la energa potencial se aproxima muy lentamente al valor lmite, porque en ese

caso la separacin entre los niveles de energa se hace muy pequea a medida que nos aproximamos a V1, y si eso
ocurre puede haber infinitos niveles discretos de energa por debajo de V1. Un ejemplo importante es el de la energa
potencial Coulombiana, que tiende muy lentamente al valor lmite V1 = 0.

75

7. La teora de Schrdinger

x ( x0 ) I de x ( x0 ) , tal que tenga un comportamiento aceptable para x . Por lo tanto


todos los valores E > V1 de la energa estn permitidos. Se dice entonces que los niveles de energa forman un continuo. Debe quedar claro que si V ( x ) alcanza valores lmite tanto a la izquierda como a la derecha, los valores permitidos de la energa forman un continuo para todas
las energas mayores que el menor de esos valores lmite.
Resumiendo, hemos llegado al siguiente resultado:
Cuantificacin de la energa en la teora de Schrdinger:
si la relacin entre V ( x ) y la energa total E es tal que una partcula clsica est confinada (ligada), los niveles de energa permitidos son discretos.
si esa relacin es tal que una partcula clsica no est ligada, la energa total puede tomar cualquier valor, de modo que los niveles de energa forman un continuo.
El conjunto de todos los niveles permitidos de la energa se denomina espectro de energa. En
general, entonces, el espectro de energa de una partcula cuya energa potencial es V ( x ) tiene
una parte discreta y una parte continua. Slo cuando V ( x ) crece sin lmite para x el espectro es completamente discreto. Veremos que las conclusiones a que hemos llegado a partir de
nuestra discusin cualitativa se verifican en todos los casos especficos que estudiaremos.

Valores esperados y operadores diferenciales


Consideremos una partcula y su funcin de onda ( x, t ) . Conforme al postulado de Born, la
probabilidad de encontrar la partcula en el intervalo entre x y x + dx es:

P( x, t )dx = * ( x, t ) ( x, t )dx

(7.33)

Por consiguiente el valor medio de una serie de mediciones de x (realizadas al mismo tiempo t),
que designaremos con x y llamaremos el valor esperado de x, est dado por
+

x=

xP( x, t )dx

= * ( x, t ) x ( x, t )dx

(7.34)

En la (7.34) hemos escrito los factores del integrando en un orden particular, por razones que
resultarn claras en breve. Es fcil ver que el valor esperado de cualquier funcin f ( x, t ) de x y t
(por ejemplo V ( x, t ) ) est dado por
+

f ( x, t ) = * ( x, t ) f ( x, t ) ( x, t )dx

(7.35)

puesto que las mediciones que se realizan para obtener el valor medio se hacen en el mismo
tiempo t.
La coordenada x y funciones como V ( x, t ) son ejemplos de variables dinmicas que caracterizan
el estado de la partcula. Otras variables dinmicas de inters son el impulso p y la energa total
E (y en el caso de movimiento en tres dimensiones, las tres componentes del impulso p y del
momento angular L). Consideremos el impulso. Por analoga con (7.34) y (7.35) podramos pensar que el valor esperado de p se calcule como

76

7. La teora de Schrdinger
+

p = * ( x, t ) p ( x, t )dx

(7.36)

El problema de la (7.36) es que para calcular la integral se precisara expresar p en trminos de x


y t. En un problema clsico, una vez resueltas las ecuaciones del movimiento se puede siempre
expresar p como funcin de x y t, pero no podemos hacer lo mismo en el caso cuntico, pues el
principio de incerteza establece que p y x no se pueden conocer simultneamente con exactitud.
Luego hay que encontrar otra forma de expresar el integrando en trminos de x y t.
La forma que buscamos se puede inferir considerando el caso de una partcula libre, cuya funcin de onda (ec. 7.8) es4

f = ei( kx t )

(7.37)

Si derivamos respecto de x obtenemos f / x = ik f , que recordando la relacin k = p / h se


puede escribir como

ih

= p f
x f

(7.38)

La (7.38) indica que existe una relacin entre la variable dinmica p y el operador diferencial
ih / x :

p ih

(7.39)

Una relacin semejante existe entre la energa E y el operador ih / t

E ih

(7.40)

pues la (7.37) nos dice que

ih

= E f
t f

(7.41)

Estas asociaciones no estn limitadas al caso de la partcula libre. Consideremos por ejemplo la
relacin (7.3) que define la energa E:

E = p2 / 2 m + V

(7.42)

Si en esta relacin reemplazamos las variables dinmicas por los operadores asociados resulta

El lector podra objetar que usemos la funcin (7.37), que no es de cuadrado integrable. La objecin es correcta:

el procedimiento riguroso es considerar un paquete de ondas de cuadrado integrable, pero casi monocromtico. El
clculo es ms laborioso, pero se llega al mismo resultado. Veremos en breve una forma ms cmoda de proceder,
basada en normalizar funciones como la (7.37) con la delta de Dirac.

77

7. La teora de Schrdinger
ih

h2 2
=
+ V ( x, t )
t
2 m x 2

(7.43)

Esta ecuacin entre operadores implica que para toda funcin de onda ( x, t ) se cumple que
ih

( x, t )
h 2 2 ( x, t )
=
+ V ( x, t ) ( x, t )
t
2 m x 2

(7.44)

que es la ecuacin de Schrdinger (7.9). Esto implica que postular las relaciones (7.39) y (7.40)
entre las variables dinmicas y los correspondientes operadores es equivalente a postular la
ecuacin de Schrdinger. Esta fue en realidad la va que sigui Schrdinger para obtener su
ecuacin, y es un mtodo poderoso para obtener la ecuacin de Schrdinger en casos ms complicados que los que discutimos hasta ahora.
Aplicando la (7.39) en la (7.36) obtenemos la expresin del valor esperado del impulso:
+

( x, t )
p = ih
dx
* ( x, t )

(7.45)

y anlogamente usando la (7.40) se obtiene el valor esperado de la energa


+

( x, t )
E = ih
dx
* ( x, t )

(7.46)

Usando la (7.43) obtenemos tambin


+

h2 2

E = ih * ( x, t )
+
V
(
x
,
t
)
( x, t )dx
2 m x 2

(7.47)

En general, podemos calcular el valor esperado de cualquier variable dinmica f ( x, p, t ) como


+

f ( x, p, t ) = * ( x, t ) f ( x, ih / x, t ) ( x, t )dx

(7.48)

donde el operador f ( x, p, t ) se obtiene reemplazando5 p por el operador ih / x en la funcin


f ( x, p, t ) que especifica la variable dinmica f.
Estos resultados muestran que la funcin de onda, adems de determinar la densidad de probabilidad y la corriente de probabilidad como ya vimos, contiene mucha ms informacin, pues por
medio de la (7.48) nos permite calcular el valor esperado de cualquier variable dinmica. En
realidad, la funcin de onda contiene toda la informacin que podemos llegar a obtener acerca
de la partcula, habida cuenta del principio de incerteza.

Hay que tomar ciertas precauciones, que se vern oportunamente, cuando en la expresin de f aparecen productos

de dos o ms variables dinmicas, ya que en general el producto de operadores no es conmutativo.

78

7. La teora de Schrdinger

Propiedades matemticas de operadores lineales en espacios funcionales


Como acabamos de ver, en la Mecnica Cuntica las variables dinmicas se representan por medio de operadores. Por lo tanto conviene repasar algunas propiedades de los operadores, que vamos a presentar sin pretensin de rigor matemtico.
Al calcular la norma de la funcin de onda y los valores esperados de variables dinmicas nos
encontramos con expresiones del tipo

* d

( , )

(7.49)

que se suelen llamar producto interno o producto escalar de las funciones y , por analoga
con el producto escalar ordinario de dos vectores. La integral se efecta sobre el dominio D de
las variables de que dependen las funciones. Por ejemplo, en las (7.45), (7.48) la variable de integracin es x y la integral va de a +; en tres dimensiones podramos tener d = dx dy dz o
bien d = r 2sen dr d d (en este caso la integral sobre r va de 0 a , la integral sobre va de
0 a y la integral sobre va de 0 a 2), u otras expresiones segn el sistema de coordenadas
usado. Para tener expresiones compactas usaremos la notacin ( , ) para indicar el producto
escalar. Daremos por sobreentendido que las funciones , , , , etc. son de cuadrado integrable y satisfacen oportunas condiciones en el contorno de D, y por ahora supondremos que el
dominio D de integracin en (7.52) es finito. Ms adelante veremos como proceder cuando D es
infinito.
Producto escalar, norma y ortogonalidad
El producto escalar o producto interno ( , ) de dos funciones y (en este orden) es un nmero complejo y se cumple que

(, ) = ( , )* , (, a + b ) = a(, ) + b(, )

(7.50)

donde a, b son dos nmeros complejos cualesquiera. La norma N de una funcin de define como

N ( , )

(7.51)

La norma es siempre real y positiva, salvo para la funcin nula = 0 para la cual N = 0. Una
funcin se dice normalizada cuando su norma es 1:

( , ) = 1

(7.52)

Dos funciones y se dicen ortogonales cuando su producto escalar es nulo:

( , ) = 0

(7.53)

Sistema ortonormal
Una serie de Fourier es un caso especial de expansin de una funcin arbitraria en serie de funciones ortogonales. Pasaremos revista a las propiedades generales de esas expansiones.
Sea un conjunto finito (o infinito numerable) de funciones

79

7. La teora de Schrdinger

1, 2 , 3 ,

(7.54)

definidas en D. El conjunto se dice ortonormal (ortogonal y normalizado) si se cumple

( i , j ) = ij

para todo i, j

(7.55)

Queremos representar una funcin f arbitraria de cuadrado integrable definida en D mediante


una serie de las j . Primero supongamos que la serie tiene un nmero finito n de trminos de la
forma
n

fn = a j j

(7.56)

j =1

donde los a j son coeficientes numricos. Usaremos como criterio de la bondad de la aproximacin el de minimizar la norma de la diferencia entre f y fn , (el error standard); pediremos
entonces que

Mn = ( f fn, f fn )

(7.57)

sea mnimo. Con algunos clculos que omitimos por brevedad se encuentra que el mnimo se
tiene cuando

a j = ( j , f )

(7.58)

y en ese caso el error standard es


n

Mn = ( f , f ) a j

(7.59)

j =1

Puesto que por definicin Mn es no negativo, se obtiene la desigualdad de Bessel


n

( f , f ) aj

(7.60)

j =1

Si el conjunto (7.54) es infinito, podramos esperar que al tomar n ms y ms grande se obtenga


una serie que represente cada vez mejor a f. Esta expectativa intuitiva es correcta, siempre y
cuando el conjunto ortonormal (7.54) sea completo. El sistema (7.54) se dice completo cuando
para cada nmero positivo arbitrariamente pequeo existe un entero finito n0 = n0 ( ) , tal que
para todo n > n0 se cumple que Mn < . En ese caso, se dice que la serie

f = a j j ,

(7.61)

j =1

con los coeficientes dados por la (7.58), converge en la media a f, y se escribe

f = a j j
j =1

80

(7.62)

7. La teora de Schrdinger
La igualdad (7.62) se debe interpretar que significa que la serie del miembro derecho es igual a f
casi en todas partes6 del dominio D. En general no es trivial demostrar que un dado conjunto
ortonormal es completo. Nosotros vamos a suponer, cuando sea necesario, que los sistemas ortonormales que nos interesan son efectivamente completos.
El mtodo de ortogonalizacin de Schmidt
Hasta ahora hemos supuesto que el sistema ortonormal j est asignado. En realidad para hacer
expansiones alcanza con que las funciones del sistema sean linealmente independientes. Pero es
ms cmodo trabajar con un sistema ortonormal. Por lo tanto es til tener un procedimiento sistemtico para ortogonalizar un conjunto de funciones f j linealmente independientes. A continuacin describimos el mtodo de Schmidt.
Sea N1 la norma de f1. La primera funcin ortonormal es entonces
1
f1
N1

(7.63)

1
[ f2 1 (1, f2 )]
N2

(7.64)

1 =
La segunda funcin ortonormal es

2 =

donde N2 es la norma de la funcin encerrada por el corchete de la (7.64).


La tercera funcin ortonormal es

3 =

1
[ f3 1 (1, f3 ) 2 ( 2 , f3 )]
N3

(7.65)

donde N3 es la norma de la funcin encerrada por el corchete de la (7.65).


Continuando de esta manera se pueden ortogonalizar y normalizar sucesivamente todas las f j .
Funcin delta de Dirac y relaciones de clausura
La funcin delta de Dirac ( x a) = ( a x ) es una funcin par definida por:

( x a) = 0
c

( x a)dx

para x a

(7.66)

1 si a est dentro del intervalo (b, c)


=
0 si a est fuera del intervalo (b, c)

(7.67)

La funcin delta de Dirac se puede definir como la forma lmite de una curva con un pico agudo
que se hace ms y ms alto y ms y ms angosto, de forma tal que el rea debajo de la curva se
mantiene constante. Por ejemplo se puede usar una Gaussiana, y entonces
1
( x a) = lim 0
e

6

( x a)2
2

(7.68)

Se dice que dos funciones f1 y f2 son iguales casi en todas partes cuando difieren en un conjunto de puntos de

medida nula.

81

7. La teora de Schrdinger
Sea f ( x ) es una funcin arbitraria de x definida en el entorno de x = a (el intervalo de integracin incluye x = a ); es fcil entonces demostrar las siguientes propiedades de integrales que
contienen funciones delta:
(I):

f ( x ) ( x a)dx

= f ( a)

(7.69)

(II) si ( n) ( x a) indica la derivada n-sima de ( x a) respecto de su argumento, entonces

f ( x ) (n) ( x a)dx

= ( 1)n f ( n ) ( a)

(7.70)

(III) si y = y( x ) , entonces

f ( x ) ( y( x ))dx

f (x )

y( xii )

(7.71)

donde los puntos xi son las races reales de y( x ) = 0 en el intervalo de integracin. La ec. (7.71)
es equivalente a decir que

( y( x )) =
i

( x xi )
y ( xi )

(7.72)

La funcin delta se puede definir en ms de una dimensin. Por ejemplo

( r a) = ( x ax ) ( y ay ) ( z az )

(7.73)

Retornamos ahora a nuestra discusin de las expansiones ortonormales. Escribimos la (7.62)


para una funcin arbitraria f:

f ( x) =

j =1

( *j , f ) j ( x ) = j ( x ) *j ( x ) f ( x )dx
j =1

j =1

a j j ( x ) =

(7.74)

donde hemos intercambiado el orden de suma e integral. Comparando la (7.74) con la (7.69)
obtenemos que
j ( x ) *j ( x ) = ( x x )

(7.75)

La (7.75) se denomina relacin de clausura o de completitud, y se cumple para todo sistema ortonormal completo. La (7.75) se denomina a veces teorema de expansin debido al siguiente
teorema: si f y g son funciones arbitrarias y las j forman un sistema completo, se cumple
( f , g) = ( f , j )( j , g)

(7.76)

La demostracin se basa en la definicin del producto escalar y en la relacin de completitud


(7.75).
82

7. La teora de Schrdinger
Integrales de Fourier
Hasta ahora hemos considerado expansiones en trminos de un sistema ortonormal j que consiste de una infinidad numerable de funciones. Cuando el dominio D es infinito el ndice discreto
j se convierte en un parmetro continuo k. Tambin puede suceder que aparezca una combinacin de valores discretos e intervalos continuos del ndice. En general, la transicin matemtica
rigurosa desde un dominio finito con un ndice discreto a un dominio infinito con un parmetro
continuo no es trivial. Nosotros indicaremos los pasos formales para el caso de la integral de
Fourier, sin pretensin de rigor7.
Consideremos la integral de Fourier
f ( x) =

1
2

F(k )eikx dk

(7.77)

y la transformacin inversa
F(k ) =

1
2

f ( x )e ikx dx

(7.78)

En estas frmulas las variables continuas k y x estn en pie de igualdad, pero para establecer una
conexin con nuestra anterior discusin podemos observar que la (7.77) es anloga a la expansin en serie (7.62) mientras que la (7.78) es anloga a la expresin del coeficiente (7.58) de la
serie, donde la funcin ortonormal j ( x ) se ha reemplazado por

1 ikx
e
2

(k, x ) =

(7.79)

Es fcil verificar que la ortonormalidad de las funciones (7.79) se expresa como


1
2

ei( k k ) x dx

= (k k )

(7.80)

Anlogamente, combinando la (7.77) con la (7.78) obtenemos la relacin de clausura o de completitud:


1
2

eik ( x x )dk

= ( x x )

(7.81)

Un resultado importante de las integrales de Fourier es el teorema de Parseval, que establece que
si f y g son dos funciones cuyas transformadas de Fourier son F y G, se cumple que
+

f * ( x )g( x )dx

F* (k )G(k )dk

(7.82)

El lector interesado en el detalle matemtico puede consultar, por ejemplo, el libro de E. C. Titcmarsh Introduction

to the Theory of Fourier Integrals Oxford Univ. Press, 1948.

83

7. La teora de Schrdinger
Una demostracin no rigurosa de la (7.82) se obtiene sustituyendo las integrales (7.77) en el
primer miembro de la (7.82), intercambiando el orden de integracin, y usando la relacin de ortonormalidad (7.80).
Si en (7.82) ponemos g = f resulta
+

f * ( x ) f ( x )dx =

F* (k ) F(k )dk

(7.83)

que muestra que la norma de f ( x ) en el dominio infinito de x es igual a la norma de F( k ) en el


dominio infinito de k. Esta forma especial del teorema de Parseval es el equivalente para la integral de Fourier de la (des)igualdad de Bessel (pues la ec. (7.59) se convierte en una igualdad
para un sistema completo).
Este resultado justifica emplear funciones que no se pueden normalizar a la unidad (como las
ondas planas) para construir paquetes. En efecto, si las funciones del sistema ortonormal se normalizan a la delta de Dirac, la (7.83) garantiza que el paquete de ondas est normalizado si F( k )
es de cuadrado integrable.
Operadores lineales
Un operador A se define como un ente que acta sobre una funcin para producir otra funcin
:

= A

(7.84)

Nosotros estamos interesados nicamente en operadores lineales, que cumplen las condiciones

A(c ) = cA( ) , A( + ) = A + A

(7.85)

El producto de dos operadores A y B se define como

AB = A( B )

(7.86)

AB BA

(7.87)

Debe notarse que en general

a menos que A y B conmuten. El conmutador de dos operadores se indica con [ A, B] y se define


como
[ A, B] = AB BA

(7.88)

g = Kf

(7.88)

Ncleo de un operador lineal


Un operador lineal K definido por

se puede escribir en forma explcita como

84

7. La teora de Schrdinger

g( x ) = k ( x, x ) f ( x )dx

(7.89)

La funcin k ( x, x ) se denomina ncleo del operador K. Pese a que la (7.89) tiene el aspecto de
una ecuacin integral lineal que no incluye operadores diferenciales, es fcil ver que con la
ayuda de la funcin delta de Dirac se obtienen operadores diferenciales. Por ejemplo si
K=

d2
2
2 +
dx

(7.90)

entonces
d2

k ( x, x ) = 2 + 2 ( x x )
dx

(7.91)

Operador adjunto
El operador K adjunto de K se define como el operador que cumple

( , K) = ( K , )

(7.92)

para todo par de funciones y arbitrarias. Usando la (7.89) encontramos que el ncleo adjunto
k ( x, x ) est dado por

k ( x, x ) = [k ( x , x )]*

(7.93)

Operadores Hermitianos
Un operador K para el cual K = K se dice Hermitiano o autoadjunto. Para un operador autoadjunto el producto escalar ( f , Kf ) es real para cualquier f, pues:

( f , Kf ) = ( K f , f ) = ( Kf , f ) = ( f , Kf )*

(K Hermitiano)

(7.94)

Esta propiedad de los operadores Hermitianos es de fundamental importancia, pues una hiptesis
bsica de la Mecnica Cuntica es que los valores esperados de las magnitudes observables se
expresan en la forma ( f , Kf ) y son siempre reales. Por lo tanto todos los observables deben estar representados por operadores Hermitianos.
Un operador que cumple K = K se dice anti-Hermitiano.
Autovalores y autofunciones de un operador Hermitiano
El problema de autovalores para un operador lineal K se expresa como
K =

(7.95)

Las soluciones de (7.95) existen slo para ciertos valores particulares de , indicados con j ,
que se denominan autovalores o valores propios del operador K. Las correspondientes soluciones j ( x ) se denominan autofunciones o funciones propias de K. Un ejemplo lo constituyen las

85

7. La teora de Schrdinger
soluciones de la ecuacin de Schrdinger independiente del tiempo, que son las autofunciones
del operador que representa la energa total de un sistema cuntico. El conjunto de autovalores
de K se denomina el espectro de K.
Por lo dicho, los autovalores y autofunciones de K cumplen que

K j = j j

(7.96)

Una propiedad muy importante de los operadores Hermitianos es que todos sus autovalores son
reales. Para demostrarlo basta tomar el producto escalar de la (7.96) por j :

( j , K j ) = j ( j , j )

(7.97)

Puesto que ( j , K j ) y ( j , j ) son ambos reales, j es real. Vale tambin la propiedad recproca, esto es, un operador todos cuyos autovalores son reales es Hermitiano.
Vamos a mostrar ahora que las autofunciones que corresponden a diferentes autovalores son ortogonales. Para ver esto, consideremos dos autofunciones i y j que satisfacen

K i = i i

K j = j j

(7.98)

Ahora tomamos el producto escalar de j (a la izquierda) por la primera de estas ecuaciones y el


producto escalar de la segunda ecuacin por i (a la derecha) y restamos:
( j , K i ) ( K j , i ) = (i *j )( j , i )

(7.99)

Puesto que K es Hermitiano el primer miembro de la (7.99) se anula y como j es real obtenemos

0 = (i j )( j , i )

(7.100)

Las condiciones de ortogonalidad (7.100) muestran que las autofunciones correspondientes a


diferentes autovalores son ortogonales. En el caso que se presente degeneracin, esto es que a un
autovalor le correspondan dos o ms autofunciones, siempre se las puede ortogonalizar por el
mtodo que indicamos antes.
En consecuencia de lo anterior, a partir de las autofunciones de un operador Hermitiano es
siempre posible construir un sistema ortonormal (de ser necesario ortogonalizando las autofunciones correspondientes a los autovalores degenerados). Surge entonces el problema de la completitud de ese sistema. La completitud puede ser difcil de probar rigurosamente para los operadores de la Mecnica Cuntica, aunque por razones fsicas parece plausible que se cumpla y no
se conocen hasta ahora excepciones. Por lo tanto nosotros vamos a suponer que toda variable
dinmica u observable est representado por un operador Hermitiano cuyas autofunciones forman un sistema ortonormal completo.

86

8. El formalismo de la Mecnica Cuntica

8. EL FORMALISMO DE LA MECNICA CUNTICA


Introduccin
En el Captulo 7 vimos que el estado de un sistema cuntico se describe por medio de la funcin
de onda ( r , t ) , y que las variables dinmicas se representan mediante operadores Hermitianos,
cuyos autovalores son siempre reales y cuyas autofunciones forman un sistema ortonormal completo. La funcin de onda contiene toda la informacin de inters fsico acerca del sistema, en el
sentido que a partir de ella se puede calcular el valor esperado de cualquier variable dinmica.
Los operadores que representan las variables dinmicas se construyen a partir de sus expresiones
clsicas1 mediante ciertas prescripciones, que se introducen en la teora como postulados. Veremos ahora algunas consecuencias de estos hechos, as como ciertas extensiones del formalismo.
Volvamos por un momento a las soluciones de la ecuacin de Schrdinger independiente del
tiempo. Dicha ecuacin expresa el problema de autovalores del operador Hamiltoniano2 H que
representa la energa total del sistema en trminos de las variables dinmicas. Para una partcula
que se mueve a lo largo del eje x en un campo de fuerzas que derivan de una energa potencial
V ( x ) este operador es
p 2
h2 2
H =
+ V ( x , t ) =
+ V ( x, t )
2m
2 m x 2

(8.1)

Para casos ms complicados hemos enunciado reglas generales que nos permiten construir la
expresin apropiada de H . Es fcil verificar explcitamente que el operador (8.1) es Hermitiano
(si la funcin de onda cumple adecuadas condiciones de contorno); por otra parte los resultados
de nuestro estudio cualitativo implican que H es Hermitiano pues sus autovalores son reales. El
conjunto de las autofunciones de H permite formar entonces un sistema ortonormal completo

j ( x, t ) = e

iE j t / h

j ( x)

(8.2)

Aqu, el ndice j toma valores discretos para las autofunciones correspondientes a la parte discreta del espectro de energa, y es un parmetro continuo j E para las autofunciones de la
parte continua del espectro de E, que escribiremos como

E ( x, t ) = e iEt / h E ( x )

(8.3)

Las autofunciones de la parte discreta del espectro cumplen la condicin de ortonormalidad


+

i* ( x, t ) j ( x, t )dx = i* ( x ) j ( x )dx = ij

(8.4)

mientras que las autofunciones del continuo estn normalizadas a la funcin delta de Dirac:

Esto es cierto cuando se trata de observables que tienen un anlogo clsico. Veremos ms adelante que ser

necesario introducir en la Mecnica Cuntica nuevos observables que no corresponden a ninguna variable dinmica
clsica, como el spin del electrn.
2

En esta Seccin indicamos con los operadores, para distinguirlos de las variables dinmicas que representan.

87

8. El formalismo de la Mecnica Cuntica


+

E* ( x, t )E ( x, t )dx

= *E ( x ) E ( x )dx = ( E E )

(8.5)

de modo semejante a la ( k, x ) = (2 )1 / 2 eikx en el caso de la transformada de Fourier.

Propiedades de las funciones de onda y de las autofunciones de la energa


Gracias a la completitud del sistema (8.2), toda solucin ( x, t ) de la ecuacin de Schrdinger
( x, t )
h 2 2 ( x, t )
(8.6)
=
+ V ( x ) ( x, t )
ih
t
2 m x 2
se puede expandir en trminos de las j :

( x, t ) =

a j j ( x, t ) +
a( E )E ( x, t )dE
discreto
continuo

a je

iE j t / h

a( E )e iEt / h E ( x )dE

j ( x) +

discreto

(8.7)

continuo

En virtud de la ortonormalidad de las autofunciones, los coeficientes de (8.7) estn dados por
+

a j = ( j , ) = j* ( x, t ) ( x, t )dx = eiE j t / h *j ( x ) ( x, t )dx

(8.8)

para la parte discreta del espectro y por


+

a( E ) = (E , ) = E* ( x, t ) ( x, t )dx = eiEt / h *E ( x ) ( x, t )dx

(8.9)

para la parte continua. Notar que en general los coeficientes a j y a( E ) dependen de t.


Usando las condiciones de ortonormalidad (8.3) y (8.4) se encuentra que la norma de ( x, t ) es
+

( , ) = * ( x, t ) ( x, t )dx =

a*j a j +
discreto

a( E )* a( E )dE

(8.10)

continuo

Es fcil verificar que la norma de no depende de t como ya habamos demostrado en el Captulo anterior. En adelante vamos a suponer que est normalizado a la unidad:
+

* ( x, t ) ( x, t )dx

a*j a j +
discreto

a( E )* a( E )dE

=1

continuo

Usando la expansin (8.7) podemos ver que la densidad de probabilidad se expresa como

88

(8.11)

8. El formalismo de la Mecnica Cuntica


P( x, t ) = ( x, t )* ( x, t )
=

a*j a j *j ( x ) j ( x ) +

i ( E j Ek ) t / h

k* ( x ) j ( x ) +

j , k discreto

j discreto

a*a( E )e i( E E j )t / h * ( x ) ( x ) + c.c. dE +
j
j
E

j discreto

(1 kj )ak*a j e

(8.12)

E continuo

a( E )* a( E ) *E ( x ) E ( x )dE

E continuo

[1 ( E E )]a( E )* a( E )ei( E E )t / h *E ( x ) E ( x )dE dE

E , E continuo

donde c.c. indica el complejo conjugado de la expresin precedente. En general, la densidad de


probabilidad depende del tiempo. Sin embargo, en el caso particular en que la partcula tiene una
energa bien definida, de modo que su funcin de onda es una de las autofunciones (8.2) de la
energa, la densidad de probabilidad es independiente del tiempo:
P = P( x ) = j* ( x, t ) j ( x, t ) = *j ( x ) j ( x )

(8.13)

Por ese motivo esos estados se denominan estados estacionarios. Es fcil verificar que en un estado estacionario la corriente de probabilidad es nula cuando es real.
Calculemos el valor esperado de la energa en un estado descripto por la funcin de onda
( x, t ) . Usando la expansin (8.7) de ( x, t ) en trminos de las autofunciones de H resulta
+

( x, t )
E = ( , H ) = ih
dx = E j a*j a j +
* ( x, t )

t
discreto

E a( E )* a( E )dE

(8.14)

continuo

Observando la (8.14) podemos interpretar que a*j a j es la probabilidad que al efectuar una medida de la energa obtengamos un valor igual a E j (esto es, la probabilidad que el sistema se encuentre en el estado discreto j) y que a( E )* a( E )dE es la probabilidad que al medir la energa
obtengamos un valor comprendido en el intervalo entre E y E + dE (esto es, la probabilidad que
el sistema se encuentre un estado del continuo con energa entre E y E + dE ).
Se debe notar que si no es un estado estacionario las a j y a( E ) son funciones del tiempo; sin
embargo es fcil verificar que si V = V ( x ) ,
d ( a*j a j )
dE
Ej
=
+
dt discreto
dt

E d ( a( E ) a( E )) dE = 0

dt

(8.15)

continuo

de modo que el valor esperado de la energa se conserva, como ocurre clsicamente.


Observando las (8.11) y (8.14) se aclara porqu las autofunciones del continuo se normalizan
con la delta de Dirac (ec. (8.4)): se asegura as que se cumpla con el postulado de Born.
Para concluir esta discusin es oportuno hacer un comentario acerca de la completitud del sistema de autofunciones. En realidad no hemos demostrado que el sistema (8.2) tenga esa
propiedad. Sin embargo, por razones fsicas parece razonable que as sea. Esto se puede ver con
el siguiente argumento. Supongamos que el sistema (8.2) no fuera completo. Eso implicara que
89

8. El formalismo de la Mecnica Cuntica


existe algn estado ( x, t ) de la partcula para el cual la norma de la diferencia entre y su
expansin en trminos de las j no es nula. Esto es, la funcin

( x, t ) = ( x, t ) a j j ( x, t ) + a( E )E ( x, t )dE
discreto

continuo

(8.15)

no sera nula casi en todas partes. En consecuencia ( x, t ) representara un estado de la partcula, solucin de la ecuacin de Schrdinger (8.5), para el cual existe una probabilidad no nula
de encontrar la partcula en alguna parte, pero para el cual no se puede medir la energa. Como
esto es fsicamente absurdo, concluimos que ( x, t ) debe ser nulo (casi en todas partes) y por
consiguiente el sistema (8.2) debe ser completo.
En adelante, para simplificar la notacin, escribiremos siempre

j =1

j =1

( x, t ) = a j j ( x, t ) = a j e

iE j t / h

j ( x)

(8.16)

dando por sobreentendido que la sumatoria de la (8.16) se debe interpretar como una suma sobre
la parte discreta del espectro y una integral sobre la parte continua, como en la (8.7).

Normalizacin en una caja


Existen maneras de evitar que las autofunciones del espectro continuo se tengan que normalizar
con la delta de Dirac. Se trata de artificios matemticos mediante los cuales el espectro continuo
se transforma en discreto. Mostraremos en qu consisten para una dimensin espacial, pues la
generalizacin a ms dimensiones es obvia. La idea bsica es suponer que x est limitado a un
intervalo finito ( x0 , x0 + L ) de longitud L y que la funcin de onda cumple oportunas condiciones de contorno en x0 y x0 + L . Se suelen emplear dos tipos de condiciones de contorno:
paredes rgidas: en este caso se imponen las condiciones

( x0 , t ) = ( x0 + L, t ) = 0

(8.17)

condiciones peridicas: se pide que

( x0 , t ) = ( x0 + L, t )

(8.18)

Si repetimos el razonamiento cualitativo del Captulo 7 acerca de las soluciones de la ecuacin


de Schrdinger independiente del tiempo, teniendo en cuenta que las soluciones tienen que cumplir las condiciones ( x0 ) = ( x0 + L) = 0 (caso (8.17)) o bien ( x0 ) = ( x0 + L) (caso
(8.18)), es fcil ver que los autovalores de la energa son siempre discretos.

Relaciones de conmutacin
En lo sucesivo omitiremos la que empleamos para distinguir los observables de los operadores
que los representan, pues no puede surgir confusin. Sean dos observables F y G cualesquiera
representados por los operadores Hermitianos F y G. Es fcil verificar que el adjunto del
producto FG es:

( FG) = G F = GF

90

(8.19)

8. El formalismo de la Mecnica Cuntica


de donde se desprende que FG es Hermitiano si y slo si F y G conmutan. Luego, si bien x y px
son observables, el producto xpx no lo es, pues los operadores x e ih / x no conmutan. En
efecto, si una funcin cualquiera:

( xpx px x ) = ihx + ih x = ih

x
x

(8.20)

de donde obtenemos la siguiente relacin fundamental entre operadores:

[ x, px ] xpx px x = ih

(8.21)

De manera semejante se puede mostrar que

[ y, py ] ypy py y = ih

[ z, pz ] zpz pz z = ih

(8.22)

Todos los dems productos de las coordenadas cartesianas y sus impulsos conjugados son conmutativos, esto es xy = yx , xpy = py x , px py = py px , etc.

Autoestados de una variable dinmica


Como veremos en breve, el hecho que x y px no conmutan est vinculado con la relacin de incerteza entre x y px , es decir con la imposibilidad de tener valores bien definidos de ambas variables dinmicas. Como primer paso para encontrar esa relacin, vamos a determinar los estados de un sistema para los cuales una variable dinmica F representada por el operador
Hermitiano F tiene un valor bien definido, es decir, los estados f en los cuales al medir F obtenemos con certeza un cierto valor f. Es fcil verificar que para que eso ocurra, debe ser una
autofuncin de F. En efecto, f debe satisfacer la condicin:

F = ( f , F f ) = f

(8.23)

y la condicin

F 2 = ( F F )2 = ( f ,( F F )2 f ) = ( f ,( F f )2 f )
= (( F f ) f ,( F f ) f ) = 0

(8.24)

donde para llegar al ltimo rengln usamos la (8.23) y el hecho que F es Hermitiano. De la
(8.24) se desprende entonces que se debe cumplir

( F f ) f = 0

esto es

F f = f f

(8.25)

Luego f es una autofuncin de F. Los estados descriptos por autofunciones de F se suelen denominar autoestados de F. La (8.25) nos dice lo siguiente:

Una variable dinmica representada por el operador Hermitiano F tiene un valor bien
definido f cuando el sistema se encuentra en el autoestado de F correspondiente al autovalor f.

91

8. El formalismo de la Mecnica Cuntica


La ecuacin de Schrdinger independiente del tiempo H n = En n no es ms que un caso particular de la (8.25): las autofunciones n son los nicos estados en los cuales el sistema tiene
una energa bien definida En .
Puesto que el operador Hermitiano F tiene un sistema completo de autofunciones ortonormales
f j , cualquier estado se puede representar como

= a j f j con a j = ( f j , )

(8.26)

y el valor esperado de F en el estado es


F = ( , F ) = f j | a j |2

(8.27)

Las conclusiones son entonces las siguientes:


El resultado de medir una variable dinmica F de un sistema que se encuentra en un estado cualquiera es siempre uno de los autovalores de F.
Si el sistema se encuentra en un estado cualquiera , la probabilidad que al medir F se
obtenga el autovalor f est dada por | a j |2 =| ( f j , ) |2 .
Inmediatamente despus de efectuar una medicin de F cuyo resultado fue el autovalor
f, el sistema se encuentra en el autoestado correspondiente a f.

Mediciones simultneas y operadores que conmutan


Puesto que un observable F tiene un valor bien definido f slo cuando el sistema se encuentra en
un autoestado de F, es evidente que:
Dos observables F y G pueden ambos tener valores bien definidos si y solo si el sistema
est en un autoestado de ambos operadores.
Cuando F y G tienen valores bien definidos para todos los autoestados de uno de ellos (por
ejemplo F) se dice que son compatibles.
Para que dos observables sean compatibles es necesario que los operadores que los representan
tengan un sistema completo de autofunciones en comn. En tal caso podemos designar las autofunciones mediante los autovalores f j de F y gk de G, es decir
F f j gk = f j f j gk , G f j gk = gk f j gk

(8.28)

Si multiplicamos por F la segunda de estas ecuaciones, por G la primera y restamos, resulta


( FG GF ) f j gk = 0

(8.29)

Puesto que la (8.29) vale para todas las autofunciones de un sistema completo, se debe cumplir
[ F, G] = FG GA = 0

92

(8.30)

8. El formalismo de la Mecnica Cuntica


Recprocamente, si F y G conmutan hay un sistema completo de autofunciones comunes a
ambos. En efecto, sea gk la autofuncin de G que satisface Ggk = gkgk . Entonces

G( Fgk ) = F(Ggk ) = gk ( Fgk )

(8.31)

de modo que Fgk es tambin autofuncin de G correspondiente al mismo autovalor gk . Hay


dos posibilidades, segn si el autovalor gk es degenerado o no lo es.
Si gk no es degenerado, le corresponde una nica autofuncin gk , luego la (8.31) implica que

Fgk = gk

(8.32)

donde es un nmero, de modo que gk es tambin una autofuncin de F correspondiente al


autovalor . Si en cambio gk es degenerado y le corresponden (digamos) n autofunciones gk ,i ,
la (8.31) implica que
n

Fgk .i = gk , r fri

con

r =1

fri = (gk , r , Fgk .i )

(8.33)

donde las cantidades fri se denominan elementos de matriz del operador F en la base gk ,i , y
por ser F Hermitiano cumplen fir = fri* . Vemos entonces que en general las gk ,i no son autofunciones de F. Pero es siempre posible construir un nuevo conjunto gk , s de autofunciones de
G correspondientes al autovalor gk , de la forma
n

gk , s = dsigk ,i

(8.34)

i =1

y determinar los coeficientes dsi de modo que gk , s sea tambin autofuncin de F, es decir que

Fgk , s = gk , s

(8.35)

En efecto, si sustituimos la (8.34) en (8.35) resulta


n

Fgk , s = dsi Fgk ,i = dsi frigk , r = dsigk ,i


i =1

i =1 r =1

(8.36)

i =1

Por lo tanto se debe cumplir que


n

dsi ( fri ri )gk ,r

(8.37)

i =1 r =1

La (8.37) nos da un sistema de n ecuaciones lineales para las n incgnitas dsi :


n

dsi ( fri ri ) = 0 , s fijo , r = 1, 2, , n

(8.38)

i =1

Este sistema de ecuaciones tiene soluciones no triviales si, y solo si, es nulo el determinante de
los coeficientes:

93

8. El formalismo de la Mecnica Cuntica

det( fri ri ) = 0

(8.39)

La ec. (8.39) es una ecuacin de grado n en el autovalor , que se denomina ecuacin caracterstica. Se puede mostrar que en virtud de que fir = fri* , la (8.36) tiene siempre n races reales
que nos dan los autovalores 1, 2 , , n de F. Para cada autovalor s , el sistema (8.38) permite calcular los coeficientes dsj y por lo tanto la autofuncin gk , s . Estas nuevas funciones son
evidentemente autofunciones simultneas de F y G. Queda entonces demostrado que:
La condicin necesaria y suficiente para que dos observables sean compatibles es que
conmuten los operadores que los representan.
Cuando dos observables F y G estn representados por operadores que conmutan, son
compatibles y existe un sistema completo de autofunciones comunes a ambos.

Las relaciones de incerteza de Heisenberg


Acabamos de ver que cuando dos observables conmutan se pueden especificar simultneamente.
En cambio,
Cuando dos observables F y G no conmutan no pueden ambos tener valores bien definidos simultneamente.
La medida de la inevitable falta de precisin en el conocimiento de F y G est determinada por
su conmutador:
[ F, G] = FG GF = iC

(8.40)

Es fcil verificar que si F y G son Hermitianos, C tambin es Hermitiano. Ahora vamos a demostrar que en cualquier estado ( x, t ) las incertezas

F = ( F F ) 2

1/ 2

G = ( G G ) 2

1/ 2

(8.41)

de F y G cumplen la relacin

FG 12 | C |

(8.42)

Para ver esto conviene primero demostrar que si u y w son dos funciones cualesquiera, se cumple la desigualdad de Schwarz:
(u, u)( w, w ) 14 [(u, w ) + ( w, u)]2

(8.43)

En efecto, sea un parmetro real. Entonces si w u se cumple que

0 < (u + w, u + w ) = 2 (u, u) + [(u, w ) + ( w, u)] + ( w, w )

(8.44)

Por lo tanto la ecuacin

2 (u, u) + [(u, w ) + ( w, u)] + ( w, w ) = 0

94

(8.45)

8. El formalismo de la Mecnica Cuntica


no tiene races reales y por consiguiente su discriminante es negativo, esto es

[(u, w ) + ( w, u)]2 4(u, u)( w, w) < 0

(8.46)

de donde si w u obtenemos la (8.43) con el signo >. Si en cambio w = u es fcil verificar que la (8.43) se cumple con el signo =.
Sea ahora = ( x, t ) un estado cualquiera de nuestro sistema, y pongamos

u = ( F F ) y

w = i(G G )

(8.47)

Entonces

(u, u) = (( F F ) ,( F F ) ) = ( ,( F F )2 ) = F 2

(8.48)

y anlogamente se encuentra que

( w, w ) = G 2

(8.49)

Por otra parte


(u, w ) + ( w, u) = i(( F F ) ,(G G ) ) + i((G G ) ,( F F ) )
= i( ,( F F )(G G ) ) + i( ,(G G )( F F ) )
= i( ,( FG FG FG + FG ) ) + i( ,(GF GF G F + G F ) ) (8.50)
= i( ,( FG GF ) )
= ( , C )

Sustituimos ahora las (8.48)-(8.50) en la desigualdad de Schwarz (8.43) y obtenemos el


resultado buscado:
Relacin general de incerteza para operadores que no conmutan:
cuando dos observables F y G no conmutan, las incertezas de F y G cumplen la relacin

FG 12 | C |

(8.51)

donde C = i[ F, G].
Como caso particular sea F = x y G = px . Entonces, de la (8.21) [ x, px ] = ih , luego C = h y
obtenemos de (8.51) la relacin de incerteza:

xpx 12 h

(8.52)

como habamos ya anticipado en el Captulo 6.

Constantes del movimiento y ecuaciones del movimiento para operadores


Sea F un observable (que puede depender explcitamente del tiempo) y F su valor esperado en
un estado cualquiera ( x, t ) . La variacin de F con el tiempo est dada por

95

8. El formalismo de la Mecnica Cuntica


d
d
F


F = ( , F ) =
, F + , F
+ ,
t

dt
dt
t t

(8.53)

Usando la ecuacin de Schrdinger

H = ih

(8.54)

donde H es el operador Hamiltoniano del sistema, podemos escribir la (8.53) en la forma


d
i
i
F
F = ( H , F ) ( , FH ) + ,
t
dt
h
h
i
F
= ( ,[ H , F ] ) + ,
t
h

(8.55)

es decir
d
i
F
F = [ H, F] +
dt
h
t

(8.56)

La (8.56) muestra que si F conmuta con H y no depende explcitamente del tiempo,

d
F =0
dt

para todo ( x, t )

(8.57)

Cuando se cumple la (8.57) el observable F se denomina constante del movimiento y se dice que
se conserva. En vista de lo demostrado precedentemente podemos afirmar lo siguiente:
Un observable F que no depende explcitamente del tiempo y conmuta con el
Hamiltoniano del sistema es constante del movimiento. Existe entonces un sistema
completo de autofunciones de H y F, es decir un conjunto completo de estados estacionarios en los cuales F est bien definido y que por lo tanto se pueden caracterizar por
los autovalores E j de H y Fk de F.
El conjunto de todas las constantes de movimiento del sistema junto con el
Hamiltoniano forman un sistema completo de observables compatibles. Por lo tanto
existe un sistema completo de estados estacionarios que se pueden caracterizar por los
autovalores E j de H y de las constantes del movimiento.
Se puede definir un operador dF / dt que se denomina derivada total de F con respecto del
tiempo como el operador para el cual
dF d
= F para todo ( x, t )
dt dt

(8.58)

Podemos escribir la (8.56) en trminos de dF / dt :


dF i
F
= [ H, F] +
dt h
t

96

(8.59)

8. El formalismo de la Mecnica Cuntica


a partir de la cual podemos escribir la siguiente ecuacin entre operadores:

dF i
F
= [ H, F] +
dt h
t

(8.60)

Para una partcula que se mueve en un campo de fuerzas que deriva de una energa potencial
V( r ) el Hamiltoniano es:
H=

p2
+ V (r )
2m

(8.61)

donde p es un operador vectorial cuyas componentes son los operadores px , py , pz y r es un


operador vectorial cuyas componentes son los operadores x, y, z. Entonces, la velocidad est representada por el operador vectorial

v=

dr i
i
= [ H, r ] =
[ p2 , r ]
dt h
2 hm

(8.62)

Es fcil verificar que [ px2 , x ] = 2ihpx y anlogamente para las dems componentes. Por lo tanto
resulta

v=

p
m

(8.63)

La (8.63) es formalmente idntica a la relacin clsica entre velocidad e impulso, pero aqu se
trata de una relacin entre operadores.
Del mismo modo, la aceleracin est representada por el operador vectorial

a=

dv i
i
i
= [ H, v] =
[ H , p] =
[V ( r ), p]
dt h
hm
hm

(8.64)

Si recordamos que p = ih resulta que [V ( r ), p] = ihV ( r ) y por lo tanto obtenemos


ma = V ( r )

(8.65)

que tambin coincide formalmente con la expresin clsica, esto es la Segunda Ley de Newton,
pero el significado de la (8.65) es diferente pues se trata de una relacin entre operadores como
la (8.63).

El lmite clsico
Las ecuaciones (8.63) y (8.65) implican que para cualquier estado ( x, t ) los valores esperados
de la velocidad y la aceleracin de una partcula que se mueve en un campo de fuerzas que deriva de una energa potencial V( r ) cumplen las relaciones

v=

p
m

(8.66)

ma = V ( r )
97

(8.67)

8. El formalismo de la Mecnica Cuntica


Estas relaciones son idnticas a las ecuaciones clsicas, salvo que se refieren a los valores esperados. Cuando las imprecisiones de nuestras medidas de los impulsos y las posiciones de la
partcula descripta por ( x, t ) son muy grandes en comparacin con las incertezas de dichas
magnitudes, los valores medidos coinciden con los valores esperados. Por lo tanto en ese caso no
es necesario distinguir entre valores medidos y valores esperados. En esas condiciones los
valores medidos cumplen las ecuaciones de la Mecnica Clsica. Este resultado fue obtenido por
Paul Ehrenfest (1927) y se conoce como
Teorema de Ehrenfest:
la Mecnica Cuntica coincide con la Mecnica Clsica en el lmite en que el principio de
incerteza deja de tener relevancia.
Por otra parte fuera de este lmite la Mecnica Cuntica predice varios interesantes fenmenos
que no tienen anlogo clsico como veremos en breve.

Representacin coordenadas y representacin impulsos


Podemos avanzar en nuestro entendimiento de la Mecnica Cuntica si hacemos un anlisis de
Fourier de la funcin de onda, en la forma
i

(r, t ) =

pr
1
h

(
p
,
t
)
e
dp
(2h)3 / 2

(8.68)

donde ( p, t ) es la transformada de Fourier de ( r , t ) en el instante t


i

pr
1
h
( p, t ) =

(
r
,
t
)
e
dr
(2h)3 / 2

(8.69)

Se pueden obtener fcilmente algunas propiedades importantes de usando la relacin de clausura en tres dimensiones, que se escribe por analoga con la (7.81) como
i

pr
1
1
e h dp =
ei k r dk = ( r )
3
/
2
(2h)
(2 )3

(8.70)

Introduciendo la representacin de Fourier (8.68) y usando las propiedades de la funcin delta de


Dirac para intercambiar el orden de las integraciones, podemos mostrar que

| (r, t ) |2 dr

= | ( p, t ) |2 dp

(8.71)

y que el valor esperado de p se expresa como


( r , t )* h ( r , t ) dr = ( p, t )* p ( p, t ) dp
p=

(8.72)

mientras que el valor esperado de r est dado por


( p, t )* h ( p, t ) dp
r = ( r , t )* r ( r , t ) dr =
i p

98

(8.73)

8. El formalismo de la Mecnica Cuntica


donde p es el operador gradiente en el espacio de los impulsos. La frmula (8.71) implica que
si est normalizada a la unidad para todo t, queda tambin automticamente normalizada.
Por otra parte, puesto que
i

pr
1
e h
2h

(8.74)

representa un estado de impulso p bien definido, representa la amplitud con la cual est presente dicho estado en la funcin de onda . Por ejemplo, si ( p, t ) tiene un pico bien marcado
para un determinado valor p = p(t ) , en el instante t nuestro estado es un estado cuyo impulso
est bastante bien definido y se parece (en ese instante) a una onda plana.
Esta observacin, en conjuncin con la (8.72), nos lleva a interpretar que | ( p, t ) |2 es la probabilidad de encontrar (en el instante t) que el valor del impulso de la partcula est comprendido
entre p y p + dp . Diremos entonces que | ( p, t ) |2 es la densidad de probabilidad en el espacio
de los impulsos.
Hay una evidente analoga entre la (8.72) y la (7.34), y entre la (8.73) y la (7.36). Del punto de
vista matemtico, esto es simplemente una consecuencia de las relaciones de reciprocidad entre
la transformacin y la antitransformacin de Fourier, ecs. (8.68) y (8.69). De resultas de ello,
tanto la funcin de onda (definida en el espacio de las coordenadas) como la (definida en el
espacio de los impulsos), son descripciones igualmente vlidas del estado del sistema. Dada una
de ellas, la otra se puede calcular a partir de la (8.69) o de la (8.68). Del punto de vista fsico,
esta reciprocidad es una manifestacin de la complementaridad y de la naturaleza ondulatoria de
la materia.
De acuerdo con los postulados de la Mecnica Cuntica, el valor esperado de una funcin f ( r )
de las coordenadas est dado por
f ( r , t ) = f ( r , t ) | ( r , t ) |2 dr

(8.75)

Si sustituimos la expresin (8.68) de en la (8.75) podemos mostrar (si la funcin de onda se


anula con suficiente rapidez a distancias grandes, para que se pueda intercambiar el orden de las
integraciones y los trminos de superficie se puedan despreciar) que se obtiene

* h
f (r, t ) =
( p, t ) f p , t ( p, t ) dp
i

(8.76)

Anlogamente, a partir de la (8.72) se puede mostrar que para toda funcin analtica g( p, t ) se
tiene
g( p, t ) = ( p, t )* g( p, t ) ( p, t ) dp

(8.77)

En general, para un operador h( r , p, t ) que es una funcin analtica de r y p y eventualmente del


tiempo, siempre y cuando su expresin no contenga productos de operadores que no conmutan
(del tipo ri pi ), se puede mostrar que

99

8. El formalismo de la Mecnica Cuntica


( r , t )* h r , h , p, t ( r , t ) dr = ( p, t )* h h , p, t ( p, t ) dp (8.78)
h( r , p, t ) =

i r

i p

A partir de las frmulas clsicas, estas prescripciones permiten escribir las expresiones para los
operadores cunticos correspondientes en la mayora de los casos de inters.
Todava no sabemos como proceder cuando nuestros operadores contienen expresiones del tipo
ri pi es decir, productos de operadores que no conmutan3 (por ejemplo, el operador r p ). En
estos casos postularemos que la (8.78) sigue valiendo, pero es necesario entonces agregar alguna
prescripcin acerca del orden adecuado de los factores, cosa que veremos oportunamente cuando
se presente el caso.
La ec. (8.78) establece que a toda magnitud fsica le est asociado un operador lineal que,
cuando se lo interpone entre la funcin de onda y su conjugada compleja, permite obtener por
integracin el valor esperado de la correspondiente magnitud. La forma explcita del operador
depende, evidentemente, de si describimos el estado del sistema mediante la funcin de onda
en el espacio de las coordenadas o la funcin de onda en el espacio de los impulsos. En el
primer caso se dice que se est usando la representacin coordenadas, en el segundo caso que se
usa la representacin impulsos.
Del punto de vista prctico, es evidente que al tratar una partcula libre es preferible usar la representacin impulsos. Pero si la energa potencial no es constante, generalmente es mejor usar
la representacin coordenadas, porque trabajar con un operador de la forma V (ih p ) puede ser
incmodo. En el caso del oscilador armnico, cuyo Hamiltoniano clsico es p2 / 2 m + 2 r 2 / 2 ,
las dos representaciones son igualmente convenientes.
Claramente, ambas formas de describir al sistema son equivalentes y la eleccin de una u otra es
una cuestin de mera conveniencia. Ms adelante veremos que es ventajoso considerar ambas
descripciones como dos representaciones de una formulacin ms general y abstracta de la Mecnica Cuntica.

Transformaciones unitarias
El hecho que exista la libertad de elegir la forma de describir un sistema se debe a que en la Mecnica Cuntica, las cantidades medibles (y que por lo tanto se comparan con los resultados experimentales) se calculan siempre a partir de expresiones del tipo4
( f , g)

(8.79)

y por lo tanto estn slo indirectamente relacionadas con f y g. Por consiguiente, cualquier transformacin del tipo
f = Uf

(8.80)

El problema aqu es que el anlisis de Fourier nos permite describir nuestro estado, o en trminos de las

autofunciones de una componente impulso, o en trminos de las autofunciones de la coordenada conjugada. Pero el
principio de incerteza nos impide encontrar autofunciones de ambos operadores: tales autofunciones simultneas no
existen.
4

Aqu usamos la notacin compacta del producto escalar que introdujimos en el Captulo 7.

100

8. El formalismo de la Mecnica Cuntica


que a cada funcin f de nuestro espacio funcional F le haga corresponder una funcin f de otro
espacio funcional F , de forma tal que preserve el producto escalar (8.80), es decir, tal que se
cumpla que
( f , g) = ( f , g)

(8.81)

para todo par de funciones f, g de F, nos da una descripcin equivalente de nuestro sistema. Este
es justamente el caso de la transformacin de Fourier, que a la funcin ( r , t ) del espacio de las
coordenadas le hace corresponder la funcin ( p, t ) del espacio de los impulsos, pero esta no es
la nica transformacin del tipo (8.80) posible.
Veamos qu condiciones generales tiene que satisfacer el operador U que induce la transformacin (8.80) para que se cumpla la (8.81). Es obvio, para empezar, que U debe ser un operador
lineal y que debe tener inversa, para que las descripciones en los espacios F y F sean equivalentes. Pero adems, recordando la definicin del operador adjunto, tenemos que

( f , g) = (Uf , Ug) = (U Uf , g)

(8.82)

Comparando la (8.82) con la (8.81) vemos que para que el producto escalar de dos funciones
cualesquiera se conserve, se debe cumplir que
U = U 1

(8.83)

U U = UU = 1

(8.84)

de modo que

donde con 1 indicamos el operador identidad. Un operador que cumple la (8.83) se denomina
unitario.
Como se puede apreciar de las frmulas (8.72), (8.73), (8.75), (8.76) y (8.78) para el caso de las
representaciones coordenadas e impulso, la transformacin U induce tambin transformaciones
de los operadores que representan variables dinmicas. De esta forma, el operador A definido en
F se transforma en un operador A definido en F , y para que las dos representaciones sean
equivalentes se debe cumplir
( f , Ag) = ( f , Ag)

(8.85)

para cualesquiera f , g F . Usando la (8.80) y la condicin de unitariedad (8.83), el miembro


izquierdo de (8.85) se puede escribir como

( f , Ag) = (U 1 f , AU 1g) = (U f , AU g) = ( f , UAU g)

(8.86)

Comparando entonces la (8.86) con la (8.85) vemos que la transformacin del operador A est
dada por
A = UAU

En resumidas cuentas:

101

(8.87)

8. El formalismo de la Mecnica Cuntica


Dada una transformacin unitaria U que nos lleva de F a F , las descripcin del sistema
en trminos de las funciones f y los operadores A definidos en F es equivalente a la descripcin en trminos de las funciones f y los operadores A definidos en F .
Las relaciones entre f y f y entre A y A estn dadas, respectivamente, por las ecs.
(8.80) y (8.87).
En realidad no hace falta que F sea un espacio funcional. Basta que sea un espacio vectorial
cualquiera, con tal que se pueda establecer una correspondencia biunvoca del tipo (8.80) entre
los elementos de F y F , que preserve el producto escalar (esto es, que cumpla la (8.81)). Veremos ms adelante ejemplos concretos de estas transformaciones.
Por lo tanto, resulta que mediante transformaciones inducidas por operadores unitarios podemos
obtener diferentes descripciones del mismo sistema cuntico, todas equivalentes. Esta es la idea
bsica en que se funda la equivalencia entre el formalismo de matrices de Heisenberg y la mecnica ondulatoria de Schrdinger, y tambin la teora de las transformaciones de Dirac y Jordan.
Volveremos sobre estas cuestiones ms adelante, pues primero conviene que el lector se familiarice con la descripcin dada por la teora de Schrdinger, antes de introducir formalismos ms
generales, pero por eso mismo ms abstractos y por lo tanto menos intuitivos.

102

9. Soluciones de la ecuacin de Schrdinger

9. SOLUCIONES DE LA ECUACIN DE SCHRDINGER


Introduccin
En este Captulo aplicaremos el formalismo de Schrdinger de la Mecnica Cuntica para estudiar las soluciones de algunos problemas sencillos en una dimensin. El propsito de estos
ejemplos es que el lector se familiarice con las tcnicas de clculo y que vea el origen de algunas
de las curiosas propiedades de las soluciones de la ecuacin de Schrdinger. Comenzaremos por
el caso ms sencillo, que es la partcula libre. Luego consideraremos el potencial escaln y la
barrera de potencial, para poner en evidencia un importante fenmeno que es puramente cuntico: la penetracin de una barrera o efecto tnel. Finalmente trataremos el oscilador armnico
simple y mostraremos que sus niveles de energa estn cuantificados, de una forma ligeramente
diferente de la que resulta del Postulado de Planck de la Teora Cuntica Antigua. En todos los
casos vamos a emplear la representacin coordenadas.

La partcula libre
El Hamiltoniano de una partcula libre en una dimensin espacial x es
H=

p2
2m

(9.1)

Claramente p conmuta con H, de modo que el impulso es constante del movimiento. La ecuacin
de Schrdinger independiente del tiempo es

h 2 d 2
= E
2m dx

(9.2)

y como sabemos tiene soluciones para cualquier valor de E 0. Por lo tanto el espectro de autovalores de H es continuo y las correspondientes autofunciones de la energa (normalizadas a la
delta de Dirac) son las ondas planas

E,k =

1 ikx
e
2

E=

h 2 k 2 p2
=
2m
2m

(9.3)

Las correspondientes funciones de onda son

E, k = e iEt / h E, k =

1 i( kx t )
e
2

E hk 2
=
h 2m

(9.4)

Cada autovalor E de la energa es doblemente degenerado, pues corresponde a dos valores del
impulso:

p = hk = 2 mE

(9.5)

El signo + en la (9.5) corresponde a una partcula que se mueve hacia la derecha y el signo a
una partcula que se mueve hacia la izquierda. Puesto que los estados estacionarios (9.4) tienen
un impulso bien definido, la posicin de la partcula est totalmente indeterminada y es igualmente probable encontrarla en cualquier parte.
103

9. Soluciones de la ecuacin de Schrdinger


Las funciones de onda (9.4) forman un sistema completo, de modo que cualquier estado ( x, t )
solucin de la ecuacin de Schrdinger

ih

( x, t )
= H ( x, t )
t

(9.6)

se puede representar como una superposicin de las (9.4) de la forma


+

( x, t ) =

a(k )E,k dk

1
2

a(k )ei( kx t )dk

(9.7)

donde
a( k ) = (E, k , ) =

1
2

e i( kx t ) ( x, t )dx

(9.8)

Puesto que
+

( , ) =

a(k )* a(k )dk

(9.9)

la ( x, t ) est normalizada si la distribucin espectral a( k ) lo est. Mediante paquetes de ondas


de la forma (9.7) podemos describir estados en los cuales la partcula est localizada y estudiar
su movimiento, como ya hicimos anteriormente.
Si no queremos trabajar con las autofunciones del continuo, podemos normalizar las autofunciones de la energa en un intervalo de longitud L. Las soluciones permitidas normalizadas en el
intervalo ( x0 , x0 + L ) que satisfacen ( x0 ) = ( x0 + L) = 0 (normalizacin en una caja) son
ondas estacionarias de la forma

( x x0 ) = (2 / L)1 / 2 sen[kn ( x x0 )] , kn = n / L , n = 1, 2, 3,

(9.10)

y los correspondientes autovalores discretos de la energa son

En = h 2 n 2 2 / 2 mL2 , n = 1, 2, 3,

(9.11)

Si usamos en cambio la condicin de contorno peridica ( x0 ) = ( x0 + L) , las soluciones


permitidas (normalizadas en el intervalo ( x0 , x0 + L )) son ondas viajeras de la forma

( x x0 ) = (1 / L)1 / 2 eikn ( x x 0 ) , kn = 2 n / L , n = 0, 1, 2,

(9.12)

y los autovalores discretos de la energa son

En = 2 h 2 n 2 2 / mL2 , n = 0, 1, 2,

(9.13)

Mientras L sea mucho mayor que el tamao de la regin de inters, estos procedimientos no tienen efectos significativos y L no aparece en los resultados de los clculos de las cantidades de
inters fsico.

104

9. Soluciones de la ecuacin de Schrdinger


Esta manera de hacer las cosas es til para las aplicaciones a la Mecnica Estadstica, en las que
conviene trabajar con el espectro discreto para poder contar el nmero de estados en un dado
intervalo de energa. Con miras a esas aplicaciones vamos a calcular la densidad de estados por
unidad de intervalo de la energa para una partcula libre en tres dimensiones. Normalizaremos
las autofunciones de la energa en un cubo de arista L.
Las soluciones permitidas satisfacen las condiciones de contorno (0, y, z ) = ( L, y, z ) = 0 ,
( x, 0, z ) = ( x, L, z ) = 0 , ( x, y, 0) = ( x, y, L) = 0 , y son ondas estacionarias de la forma

( x, y, z ) = (2 / L)3 / 2 sen(kx x ) sen(ky y) sen(kz z )

(9.14)

kx = nx / L , ky = ny / L , kz = nz / L , nx , ny , nz = 1, 2, 3,

(9.15)

con

y los correspondientes autovalores discretos de la energa son


En = h 2 n 2 2 / 2 mL2 , n 2 = nx2 + ny2 + nz2

(9.16)

Podemos dar una imagen geomtrica de la (9.16) representando cada autovalor como un punto
de coordenadas (nx , ny , nx ) en un espacio de tres dimensiones. Claramente, el nmero N ( E ) de
estados con energa menor o igual a cierto valor E es igual a la cantidad de puntos (nx , ny , nx )
que cumplen la condicin En E , que usando la (9.16) se puede escribir como
nx2 + ny2 + nz2

2 mL2 E
h 2 2

(9.17)

Por lo tanto, N ( E ) es igual al volumen del primer octante de una esfera del espacio (nx , ny , nx )
con centro en el origen y radio ( E ) = ( L / h ) 2 mE . Entonces
L3
1 4
14
4 V
N ( E ) = ( E )3 =
3 3 (2 mE )3 / 2 = 3 (2 mE )3 / 2

8 3
83 h
3 h

(9.18)

donde V = L3 es el volumen del cubo. Diferenciando la (9.18) podemos calcular la densidad de


estados por unidad de intervalo de la energa, definida por dN = f ( E )dE :

f ( E ) = 4m

V
(2 mE )1 / 2
h3

(9.19)

Usando la relacin p = 2 mE , podemos escribir N en trminos del mdulo de la cantidad de


movimiento en la forma
N=

4 Vp3

3 h3

(9.20)

4 3
p V
3

(9.21)

Se puede observar que la cantidad

Vf =

105

9. Soluciones de la ecuacin de Schrdinger


es el volumen del espacio de las fases ( x, y, z, px , py , pz ) accesible a nuestra partcula, que est
contenida dentro del cubo de arista L, y cuya cantidad de movimiento tiene un mdulo menor o
igual que p. Por lo tanto la (8.19) se puede escribir tambin en la forma
V f = h3 N

(9.22)

Este resultado se suele expresar diciendo que


Cada estado ocupa un volumen h3 del espacio de las fases.
La densidad de estados por unidad de intervalo del mdulo de la cantidad de movimiento es
dN
4p2V
= f ( p) =
dp
h3

(8.23)

como se puede obtener de inmediato diferenciando la (9.20).


Obtuvimos estos resultados utilizando funciones de onda normalizadas en una caja cbica de
arista L, pero es fcil verificar que se obtiene el mismo resultado si se usan funciones de onda
normalizadas con condiciones peridicas de contorno en un cubo de arista L. Ms en general, se
puede mostrar que los resultados (9.18)-(9.20), (9.22) y (9.23) son independientes de la forma de
la caja y slo dependen de su volumen V.

El potencial escaln
Sea una partcula que se mueve en una dimensin y cuya energa potencial es (Fig. 9.1):
E
, x<0
0
V ( x) =
regin 1
regin 2
V = cte. , x > 0
V
A
C
El Hamiltoniano es entonces
B

p2
, x<0

H = 2m
2
p +V , x >0
2m

(9.24)

(9.25)

Para x < 0 (regin 1) la ecuacin de


Schrdinger independiente del tiempo es

Fig. 9.1. Potencial en escaln.

h 2 d 2
= E
2m dx

(9.26)

cuya solucin general (no normalizada) para un dado valor de E es

E(1) = Aeikx + Be ikx

k = + 2 mE / h

(9.27)

donde A y B son constantes a determinar. La corriente de probabilidad de la solucin (9.27) es

J E(1) =

hk
(| A |2 | B |2 ) = v(| A |2 | B |2 )
m
106

(9.28)

9. Soluciones de la ecuacin de Schrdinger


donde v = hk / m es el mdulo de la velocidad en la regin 1. Por lo tanto J E(1) es la diferencia
entre la corriente v | A |2 que va hacia la derecha y la corriente v | B |2 que va hacia la izquierda.
Para x > 0 (regin 2) la ecuacin de Schrdinger independiente del tiempo es

h 2 d 2
= ( E V )
2m dx

(9.29)

Aqu tenemos que distinguir dos casos, segn si E es mayor o menor que V.
Si E > V la solucin general de (9.29) es

E( 2 ) = Ceik x + De ik x

k = + 2 m( E V ) / h

(9.30)

donde C y D son constantes a determinar. La corriente de probabilidad de la solucin (9.30) es

J E( 2 ) =

hk
(| C |2 | D |2 ) = v (| C |2 | D |2 )
m

(9.31)

donde v = hk / m es el mdulo de la velocidad en la regin 2. Por lo tanto J E( 2 ) es la diferencia


entre la corriente v | C |2 que va hacia la derecha y la corriente v | D |2 que va hacia la izquierda.
Si E < V la solucin general de (9.29) es una superposicin de ondas evanescentes:

E( 2 ) = Ce x + Dex

= + 2m(V E ) / h

(9.32)

Pero en nuestro caso el trmino Dex no es aceptable pues diverge para x . Debemos entonces poner D 0 en la (9.32) y queda

E( 2 ) = Ce x

(9.33)

La corriente de probabilidad correspondiente a la solucin (9.33) es nula.


Ahora tenemos que empalmar en x = 0 la solucin de la regin 1 con la de la regin 2. Para eso
observamos que ( x ) y d ( x ) / dx deben ser continuas, para que la corriente de probabilidad
sea continua y por lo tanto se conserve la probabilidad. Debemos pedir entonces

[ E(1) ( x)]x = 0 = [ E(2) ( x)]x = 0

[ dxd E(1) ( x)]x = 0 = [ dxd E(2) ( x)]x = 0

(9.34)

Vamos a considerar por separado los casos E > V y E < V .


Caso E > V
En este caso las condiciones (9.34) nos dan dos ecuaciones
A + B = C + D , kA kB = k C k D

(9.35)

para determinar las cuatro constantes que figuran en las (9.35). Pero como se debe cumplir la
condicin de normalizacin, en realidad slo tres de ellas son independientes. Por lo tanto hay
infinitas maneras de satisfacer las (9.35). Esto corresponde al hecho que podemos tener una solucin que corresponde a que la partcula llega al escaln viniendo desde la izquierda, otra solu-

107

9. Soluciones de la ecuacin de Schrdinger


cin que corresponde a que llega viniendo desde la derecha, y tambin cualquier combinacin
lineal de ambas. Por lo tanto para E > V el espectro de la energa es continuo y cada autovalor
E > V es doblemente degenerado.
Partcula que viene desde la izquierda
Para una partcula que llega desde la izquierda debemos tener D 0 , de modo que si E > V las
(9.35) se reducen a
A + B = C , kA kB = k C

(9.36)

Resolviendo este sistema obtenemos

B k k
=
A k + k

C
2k
=
A k + k

R
1

(9.37)

El coeficiente de reflexin del potencial escaln se define como el


cociente entre la corriente reflejada y la corriente incidente:

0.8
0.6

R=

0.4

v | B |2 ( k k )2
=
(9.38)
v | A |2 ( k + k )2

El valor de R (Fig. 9.2) depende


solamente del cociente = E / V :

0.2

R=
1

E/V 5

Fig. 9.2. Coeficiente de reflexin del potencial en escaln.

( 1 )2
( + 1 )2

(9.39)

Puesto que B / A > 0 la onda incidente y la reflejada estn en fase.

El coeficiente de transmisin se define como

T=

4 1
4 kk
v | C |2
=
=
2
2
v| A|
(k + k )
( + 1 )2

(9.40)

Es fcil verificar que se cumple R + T = 1 , de manera que se conserva la probabilidad.


Comparando con el caso clsico podemos notar una importante diferencia, pues una partcula
clsica con E > V no sufre reflexin al llegar al escaln de V ( x ) : simplemente sigue de largo
con una diferente velocidad. En cambio una partcula cuntica tiene una probabilidad no nula de
ser reflejada.
Partcula que viene desde la derecha
Si la partcula llega desde la derecha tenemos A 0, de modo que las (9.35) se reducen a
B = C + D , kB = k C k D

108

(9.41)

9. Soluciones de la ecuacin de Schrdinger


y entonces

B
2k
=
,
D k + k

C k k
=
D k + k

(9.42)

A diferencia de antes, la onda incidente y la reflejada estn en contrafase, pues C / D < 0 . El coeficiente de reflexin es:

R=

v | C |2 ( k k )2
=
v | D |2 ( k + k )2

(9.43)

y su valor es el mismo que para el caso de partcula incidente desde la izquierda y otro tanto ocurre con el coeficiente de transmisin.
Caso E < V
Si E < V la solucin en la regin 2 es una exponencial decreciente, y las condiciones (9.34) nos
dan
A + B = C , ik ( A B) = C

(9.44)

de donde podemos obtener

B ik +
=
= ei
A ik

, = + 2 arctan(k / )

(9.45)

2ik
C
=
= 1 + ei
A ik

(9.46)

y en consecuencia la solucin es (a menos de una fase irrelevante ei / 2 )

2 A cos kx 2

E =

x
2 A cos 2 e

x<0

(9.47)
,

x>0

que representa una onda estacionaria en la regin 1 y una onda evanescente en la regin 2. La
onda incidente Aeikx se refleja totalmente (pues | B |2 =| A |2 ) y aunque tiene un valor no nulo
en la regin 2, no hay penetracin permanente. La corriente de probabilidad es nula en todas
partes. El espectro de la energa para E < V es continuo y a cada autovalor E < V le corresponde
una nica autofuncin, por lo tanto no hay degeneracin.
La solucin (9.47) predice que la partcula se puede encontrar en la regin x > 0 , clsicamente
inaccesible. Sin embargo para observarla en esa regin es preciso determinar su posicin con
una incerteza del orden x 1/ , y entonces p > h / x h = 2 m(V E ) por el principio
de incerteza. Por lo tanto, la incerteza de la energa es

109

9. Soluciones de la ecuacin de Schrdinger

E =

p 2
=VE
2m

(9.48)

Luego si observamos a la partcula en la regin prohibida por la mecnica clsica, en realidad no


podemos saber si su energa total es menor que V.
El lector notar que los resultados cunticos del caso E > V son anlogos a los que se obtienen
en la ptica para la reflexin y transmisin de ondas que inciden perpendicularmente sobre la
interfase que separa dos medios de diferente ndice de refraccin. En cambio, el resultado cuntico para E < V es anlogo a la reflexin total interna.
Las autofunciones que hemos obtenido al estudiar este problema no han sido an normalizadas.
Si se desea se las puede normalizar como corresponde a las autofunciones del espectro continuo,
esto es con la delta de Dirac.

Penetracin de una barrera de potencial


Sea una partcula que se mueve en una dimensin y cuya energa potencial es (Fig. 9.3):
V(x)
regin 1
V

regin 2

x<0
0 ,

V ( x ) = V , 0 < x < a
0 ,
a<x

regin 3

(9.49)

Nos interesa estudiar el caso en que la partcula


llega a la barrera desde la izquierda (regin 1,
B
G
x < 0 ) con una energa E < V . En ese caso la
Mecnica Clsica predice que la partcula se refleja en x = 0 y no puede llegar a la regin 3
0
a
x
( x > a ). Vamos a mostrar que la Mecnica
Cuntica predice en cambio que la partcula
Fig. 9.3. Barrera de potencial.
puede atravesar la barrera.
De acuerdo con lo visto anteriormente, las soluciones generales de la ecuacin de Schrdinger
independiente del tiempo en las tres regiones en que se divide el eje x son:
E

regin 1 :

x<0

, E(1) = Aeikx + Be ikx

regin 2 : 0 < x < a ,


regin 3 :

x>a

E( 2 )
E(3)

= Dex + Ce x
=

Feikx

+ Ge ikx

, k = + 2 mE / h
, = + 2 m (V E ) / h

(9.50)

, k = + 2 mE / h

Las condiciones de empalme en x = 0 son

[ E(1) ( x)]x = 0 = [ E(2) ( x)]x = 0

[ dxd E(1) ( x)]x = 0 = [ dxd E(2) ( x)]x = 0

(9.51)

y nos dan

A + B = D + C , A B = i ( D C )
k
Si resolvemos el sistema (9.52) para A y B en trminos de D y C resulta

110

(9.52)

9. Soluciones de la ecuacin de Schrdinger


A=

1
1
1
1
1 i D + 1 + i C , B = 1 + i D + 1 i C
k
k
k
k
2
2
2
2

(9.53)

Las (9.53) se pueden escribir en forma matricial:


0
A M11
= 0
B M21

0 D
M12

C
0
M22

(9.54)

donde
0 = M0 =
M11
22

1 i
2
k

0 = M0 =
, M12
21

1+ i
2
k

(9.55)

Las condiciones de empalme en x = a son

[ E(1) ( x)]x = a = [ E(2) ( x)]x = a

[ dxd E(1) ( x)]x = a = [ dxd E(2) ( x)]x = a

(9.56)

y nos dan

k
Dea + Ce a = Feika + Ge ika , Dea Ce a = i ( Feika Ge ika )

(9.57)

Si resolvemos el sistema (9.57) para D y C en trminos de F y G resulta


e a + ika
k
e a ika
k
D=
1+ i F +
1 i G

ea + ika
k
ea ika
k
C=
1 i F +
1+ i G

2
2

(9.58)

Escribimos las (9.58) en forma matricial:


a
D M11
=
a
C M21

a F
M12

a
M22 G

(9.59)

donde
a =
M11
a
M21

e a + ika
k
1+ i

ea + ika
k
=
1 i

a =
, M12

a
M22

e a ika
k
1 i

ea ika
k
=
1+ i

(9.60)

De la (9.54) y la (9.59) obtenemos

A M AF
=
B M BF
donde

111

M AG F

M BG G

(9.61)

9. Soluciones de la ecuacin de Schrdinger


0 Ma + M0 Ma
M AF = M11
11
12 21

0 Ma + M0 Ma
M AG = M11
12
12 22

(9.62)
0 Ma + M0 Ma
M BF = M21
11
22 21

0 Ma + M0 Ma
M BG = M21
12
22 22

La ec. (9.61) vincula las amplitudes de las ondas a izquierda y derecha de la barrera, y por lo
tanto permite resolver cualquier problema de reflexin y transmisin que se desee (para E < V ,
se entiende). En el presente caso, nos interesa estudiar la transmisin de una partcula que llega a
la barrera desde la izquierda. Por lo tanto pondremos G = 0 en la (9.61) y entonces resulta

F
1
e ika
=
=
A M AF cosh a + i k senha
2 k

(9.63)

El coeficiente de transmisin de la barrera es entonces


T=

F2
=
A

1
1
=
2
senh 2a
1 k
2
2
1
+
cosh a +

senh a
4 VE 1 VE
4 k

(9.64)

Si la barrera es alta (o sea E / V no es muy prximo a 1) y ancha ( a >> 1) de modo que transmite poco, entonces senha ea / 2 y la expresin de T toma una forma sencilla:
T 16e 2a

E
E
1

V
V

(9.65)

La penetracin de la barrera se suele denominar efecto tnel y es una manifestacin del carcter
ondulatorio de la partcula. El mismo fenmeno aparece para cualquier tipo de ondas. En ptica
se lo conoce con el nombre de reflexin interna total frustrada.
El efecto tnel permite explicar una paradoja
E(MeV)
que se presenta en la emisin de partculas
Vmax
por ncleos radioactivos. Como ejemplo, consideremos el elemento 238U. Mediante la disV(r)
persin por el ncleo del 238U de partculas
de 8.8 MeV emitidas por el 212Po se determin
8.8 MeV
la energa potencial V (r ) de la partcula y se
4.2 MeV
encontr que coincide con la que proviene de
la ley de Coulomb, por lo menos hasta la
R
3x1012 cm
r
distancia de 3 10 12 cm que es hasta donde
puede llegar una partcula de 8.8 MeV. Por
Fig. 9.4. Emisin de particulas _ por un
otra parte los experimentos de dispersin de
ncleo de 238U.
partculas por ncleos livianos muestran que
V (r ) se desva del comportamiento 1/ r cuando r < R (R es el radio del ncleo), porque a distancias menores actan las fuerzas nucleares que son atractivas. Cuando se desarroll la Mecnica Cuntica no se conoca todava el valor preciso de R para los ncleos pesados, pero era obvio que para el 238U deba ser seguramente menor que 3 10 12 cm. Ahora bien, el ncleo del
238
U emite ocasionalmente partculas . Se supuso entonces que dichas partculas estn presentes
112

9. Soluciones de la ecuacin de Schrdinger


dentro del ncleo, al cual estn ligadas por el potencial V (r ) . A partir de estos argumentos se
concluy1 que la forma de V (r ) es la que se indica cualitativamente en la Fig. 9.4. Por otra parte
la energa cintica de las partculas emitidas por el 238U es de 4.2 MeV (medida muy lejos del
ncleo, donde V (r ) = 0 ). Por lo tanto se presenta una situacin paradojal, pues clsicamente es
inexplicable que una partcula se emita con una energa menor que la que corresponde al tope
de la barrera.
La paradoja fue resuelta en 1928 por George Gamow, Edward Condon y Ronald P. Gurney en
trminos del efecto tnel de la Mecnica Cuntica. Para la energa potencial de la Fig. 9.4 no se
puede aplicar la expresin (9.64) del coeficiente de transmisin, pero se puede mostrar que
b

T =e

2 ( r ) dr
a

, (r ) = + 2 m[V (r ) E ] / h

(9.66)

donde a y b son los puntos de retorno clsicos. La probabilidad que una partcula que llega a la
barrera la atraviese es igual a T. Por unidad de tiempo, la partcula que va y viene dentro del
ncleo, choca con la barrera N v / 2 R veces. Por lo tanto la probabilidad de emisin por unidad
de tiempo es

vT / 2 R

(9.67)

Tomando v = (2 E / m)1 / 2 y R 9 10 13 cm (valor que infirieron del anlisis de Rutherford de


la dispersin de partculas por ncleos livianos) Gamow, Condon y Gurney obtuvieron valores
de que concuerdan razonablemente con los que se infieren a partir de los tiempos caractersticos del decaimiento radioactivo, pese a que para diferentes elementos hay enormes variaciones
de (por ejemplo = 5 10 18 s 1 para el 238U y = 2 10 6 s 1 para el 212Po), que se deben a
que depende muy fuertemente de E (la forma y la altura de la barrera son aproximadamente las
mismas para todos los emisores ).
Corresponde mencionar aqu que Johannes W. Geiger y John M. Nuttall propusieron en 1912
una ley emprica de la forma log = a + b log E , para relacionar la probabilidad de emisin
con la energa E de las partculas emitidas por diferentes sustancias radioactivas. Dicha ley reproduce razonablemente bien los datos medidos, pero el valor de la constante b implica que
depende de una potencia de E extraordinariamente alta, alrededor de 90. En esos tiempos, los
fundamentos tericos de la Ley de Geiger-Nuttall eran, por supuesto, desconocidos.
Por estos motivos, la aplicacin exitosa de la Mecnica Cuntica a la emisin de partculas a
constituy uno de los apoyos ms slidos a la nueva teora, adems de ilustrar muy claramente la
dualidad onda-partcula.
Hay muchos otros problemas sencillos en una dimensin (como el pozo cuadrado de potencial,
etc.), que se pueden resolver fcilmente por medio de las tcnicas que hemos presentado aqu.
Por razones de brevedad no los vamos a tratar, pero el lector interesado los puede encontrar desarrollados en la bibliografa.

Esta conclusin fue confirmada por experimentos posteriores con partculas de energa suficientemente grande

como para investigar el potencial para todo r.

113

9. Soluciones de la ecuacin de Schrdinger

El oscilador armnico simple


La energa potencial de un oscilador armnico simple es
V ( x ) = 12 m 2 x 2

(9.68)

donde es la frecuencia clsica del oscilador y m la masa. La forma (9.68) de V ( x ) es de gran


importancia prctica, pues es una aproximacin para cualquier energa potencial arbitraria en
el entorno de un punto de equilibrio estable. El oscilador armnico simple es tambin importante porque el comportamiento de sistemas tales como las vibraciones de un medio elstico y
del campo electromagntico en una cavidad se pueden describir como la superposicin de un nmero infinito de osciladores armnicos simples. Al cuantificar esos sistemas nos encontramos
entonces con la mecnica cuntica de muchos osciladores armnicos lineales de diferentes frecuencias. Por tal motivo, todas las teoras de campos modernas utilizan los resultados que vamos
a obtener.
El Hamiltoniano del oscilador armnico simple es
H=

p2 1
+ m 2 x 2
2m 2

(9.69)

y la ecuacin de Schrdinger independiente del tiempo es entonces:

h 2 d 2 1
+ m 2 x 2 = E
2 m dx 2 2

(9.70)

Para aligerar las frmulas introducimos en lugar de x y p los operadores adimensionales y


definidos por:
x =

h
m

p = mh

(9.71)

Es fcil verificar que y = i d / d cumplen la relacin de conmutacin

[ , ] = = i

(9.72)

En trminos de y el Hamiltoniano se escribe


H = hH

H = 12 ( 2 + 2 )

(9.73)

y la ec. (9.70) en la forma


d 2
+ (2 2 ) = 0 , E = h
d 2

(9.74)

Veamos el comportamiento de ( ) para . Para valores finitos de es fcil verificar que

( ) e

114

/2

(9.75)

9. Soluciones de la ecuacin de Schrdinger


de manera que tiene el comportamiento de una Gaussiana.
Es inmediato verificar por sustitucin directa en la (9.61) que

0 ( ) = e

/2

(9.76)

es una solucin de la (9.74) y corresponde al autovalor = 1 / 2 . En efecto, si = 1 / 2 se cumple:

d 2 0
2
2
2
2 + (2 ) 0 = 0 + 0 + (2 ) 0 = 0
d

(9.77)

Para encontrar las dems autofunciones y autovalores vamos a usar una sencilla y elegante tcnica de operadores, que es diferente de los mtodos que se emplean habitualmente en los textos
elementales de Mecnica Cuntica. Hacemos as porque esta tcnica es el prototipo de otras semejantes que se aplican en una variedad de problemas.
Nuestro mtodo se funda en las propiedades de conmutacin de ciertos operadores no
Hermitianos oportunamente definidos, y permite encontrar sistemticamente mediante un
procedimiento recursivo todas las autofunciones y sus correspondientes autovalores a partir de
0 y de . Para eso definimos el operador
a=

1
2

( + i) =

1
2

( +

d
)
d

(9.78)

d
)
d

(9.79)

que por supuesto no es Hermitiano, y su adjunto


a =

1
2

( i) =

1
2

En trminos de a y a el operador H se expresa como


H = aa + 12

(9.80)

aa aa = 1

(9.81)

El conmutador de a y a es

Puesto que H y aa conmutan, las autofunciones de H y aa son las mismas, de modo que para
encontrar los estados estacionarios es suficiente resolver el problema de autovalores de aa. Si
llamamos n ( n = 0, 1, 2,) a los autovalores y n las correspondientes autofunciones, la ecuacin que queremos resolver es

aa n = n n

(9.82)

Primero vamos a demostrar que los autovalores no pueden ser negativos. De la (9.82) obtenemos

( n , aa n ) = ( a n , a n ) = n ( n , n )

115

(9.83)

9. Soluciones de la ecuacin de Schrdinger


donde usamos la definicin de operador adjunto. Puesto que la norma de una funcin no puede
ser negativa, concluimos que

n 0

(9.84)

Si k es una autofuncin de aa, entonces a k es tambin una autofuncin; en efecto usando


la relacin de conmutacin (9.81) vemos que:

( aa)a k = a ( aa + 1) k = (k + 1)a k

(9.85)

Por lo tanto a k es una autofuncin con autovalor k + 1. Del mismo modo se obtiene

( aa)a k = a( aa 1) k = (k 1)a k

(9.86)

que muestra que a k es una autofuncin de aa con autovalor k 1. Debido a estas propiedades a y a se denominan operador de subida y operador de bajada, respectivamente. Operando
reiteradamente con a y a sobre una autofuncin k dada, podemos generar nuevas autofunciones correspondientes a diferentes autovalores, del mismo modo como se suben o se bajan los
peldaos de una escalera. Sin embargo, la condicin (9.84) limita la cantidad de veces que se
puede aplicar el operador de bajada, porque cuando se llega un autovalor 0 0 < 1, la aplicacin del operador de bajada no permite ya encontrar una nueva autofuncin, pues sera una autofuncin correspondiente a un autovalor que viola la condicin (9.84). Por lo tanto para el peldao ms bajo de la escalera ( n = 0 ) se debe cumplir

aa 0 = 0 0

, 0 0 < 1

(9.97)

y tambin

a 0 = 0

(9.88)

y por consiguiente el menor autovalor de aa es

0 = 0

(9.89)

Partiendo entonces de 0 y de 0 = 0 podemos obtener todas las dems autofunciones y autovalores por aplicacin reiterada del operador de subida a. Pero nosotros ya conocemos 0 , que
est dado por la (9.76):

0 ( ) = e

/2

(9.90)

Por consiguiente la n-sima autofuncin, y su correspondiente autovalor son

( a )n

0 ( ) =

1
2

( d ) e 2 / 2
d

Usando la (9.74) y la (9.80) obtenemos que

116

n = n

(9.91)

9. Soluciones de la ecuacin de Schrdinger


H n = h (n + 12 ) n

(9.92)

y por lo tanto los autovalores de la energa son


En = h (n + 12 )

n = 0, 1, 2,

(9.93)

Observamos que a diferencia del caso clsico, la energa del oscilador no es nula en el estado
fundamental ( n = 0 ) sino que todava vale h / 2 . Este resultado de la teora de Schrdinger difiere del que se obtuvo en la Teora Cuntica Antigua a partir de los postulados de cuantificacin
Planck y de Wilson-Sommerfeld. La energa h / 2 se denomina energa de punto cero del oscilador armnico y su existencia es un fenmeno cuntico que se puede entender en base al principio de incerteza.
Veamos ahora las expresiones explcitas de las autofunciones (9.91). Es fcil verificar que n
tiene la forma

n = Cn Hn ( )e

/2

(9.94)

donde Hn ( ) es un polinomio de grado n y Cn es una constante de normalizacin todava no


especificada. Los polinomios Hn ( ) se denominan polinomios de Hermite y se suelen definir de
modo que el coeficiente de la potencia ms elevada de sea 2n. Los primeros polinomios de
Hermite son:

H0 ( ) = 1
H1 ( ) = 2
H2 ( ) = 4 2 2

H3 ( ) = 8 3 12
H4 ( ) = 16 4 48 2 + 12
H5 ( ) = 32 5 160 3 + 120

(9.95)

Los polinomios de Hermite satisfacen la ecuacin diferencial

d 2 Hn
dHn
+ 2 nHn = 0
2 2
d
d

(9.96)

Una forma simple de definir los polinomios de Hermite es

Hn = ( 1)n e

d n 2
e
d n

(9.97)

Se puede ver que los polinomios de Hermite tienen paridad definida dada por ( 1)n y que sus n
races son todas reales. Por lo tanto n tiene n nodos.
Las autofunciones normalizadas son:

n ( ) =

m
2 n n! h
1

1/ 4

Hn ( )e

/2

=x

m
h

En la bibliografa citada el lector puede encontrar grficos de las autofunciones (9.98).

117

(9.98)

10. Fuerzas centrales, momento angular y tomo de hidrgeno

10. FUERZAS CENTRALES, MOMENTO ANGULAR Y TOMO DE HIDRGENO


Introduccin
Nos ocuparemos ahora del movimiento de una partcula en tres dimensiones. En la Mecnica
Cuntica, del mismo modo que en la Mecnica Clsica hay una clase muy importante de problemas que surgen cuando las fuerzas son centrales, esto es, cuando la energa potencial depende
slo de la distancia r desde la partcula a un punto fijo (que tomaremos como el origen de coordenadas). El Hamiltoniano es entonces ( indica la masa de la partcula)

H=

p2
h2 2
+ V (r ) =
+ V (r )
2
2

(10.1)

Puesto que una fuerza central no produce momento respecto del origen, clsicamente se conserva el momento angular (orbital), que se define como
L=rp

(10.2)

En la Mecnica Clsica, la conservacin del momento angular para problemas de fuerzas centrales tiene importantes consecuencias: la rbita de la partcula est contenida en un plano (normal a la direccin del momento angular) y se cumple la Ley de las reas (la velocidad areolar es
constante y proporcional al mdulo del momento angular). De resultas de ello, si se describe el
movimiento en el plano de la rbita, el problema es separable en coordenadas polares con origen
en el centro de fuerzas. Gracias a esto el anlisis del movimiento en tres dimensiones se simplifica enormemente, pues queda reducido esencialmente al estudio del movimiento radial, esto es,
un movimiento unidimensional bajo la accin de la fuerza central ms la fuerza centrfuga (cuyo
valor est determinado por el mdulo del momento angular). De acuerdo con el principio de correspondencia cabe esperar que el momento angular juegue tambin un rol muy importante en la
Mecnica Cuntica. Veremos, en efecto, que debido a la conservacin del momento angular se
simplifica considerablemente la solucin del problema, ya que la ecuacin de Schrdinger independiente del tiempo se separa en coordenadas polares esfricas. En consecuencia las autofunciones de la energa se pueden escribir como el producto una funcin de los ngulos (que depende del momento angular y no depende de la forma de la energa potencial V (r ) ) y una funcin radial donde est comprendida la totalidad de los efectos de V (r ) .

Propiedades del momento angular


El operador L que representa el momento angular se obtiene reemplazando p en la (10.2) por
ih . Aqu no hay dificultad con operadores que no conmutan, pues en la (10.2) slo aparecen
productos como xpy , ypx , etc.. Comenzamos por obtener las relaciones de conmutacin del momento angular usando las reglas de conmutacin entre las componentes de r y p. Por ejemplo, es
fcil verificar que

[ Lx , x ] = 0

, [ Lx , px ] = 0

[ Lx , y] = ihz
, [ Lx , py ] = ihpz
[ Lx , z ] = ihy , [ Lx , pz ] = ihpy

118

(10.3)

10. Fuerzas centrales, momento angular y tomo de hidrgeno


Relaciones semejantes valen para los conmutadores de Ly y Lz con las componentes de r y p. A
partir de ellas podemos calcular las relaciones de conmutacin de las componentes de L entre s:

[ Lx , Ly ] = ihLz

, [ Ly , Lz ] = ihLx

, [ Lz , Lx ] = ihLy

(10.4)

El hecho que las componentes de L no conmutan implica que no existen en general estados en
que todas las componentes del momento angular tengan valores bien definidos.
Si aplicamos la relacin general (8.51):

FG 12 | [ F, G] |

(10.5)

Lx Ly 2h | Lz | , Ly Lz 2h | Lx | , Lz Lx 2h | Ly |

(10.6)

obtenemos que

Las (10.6) muestran que las tres componentes de L se pueden determinar con exactitud slo si
los valores esperados de las mismas son nulos, esto es si
L =0

(10.7)

Adems, si las componentes de L estn bien definidas se debe cumplir


L2j = ( L j L j )2 = L2j = 0 ,

j = x, y, z

(10.8)

y por lo tanto para tener L = 0 es preciso que adems de la (10.7) se cumpla tambin
L2x = L2y = L2z = 0

(10.9)

En consecuencia el nico estado en el cual se pueden conocer con exactitud las tres componentes de L es un autoestado de las tres componentes con autovalores nulos, tal que:
L = 0

(10.10)

L2 = L2x + L2y + L2z

(10.11)

Magnitud del momento angular


El cuadrado de la magnitud de L es

El valor medio de L2 en un estado cualquiera es siempre mayor o igual que el valor medio del
cuadrado de una cualquiera de las componentes de L, digamos Lz , esto es:
L2 = L2x + L2y + L2z L2z

(10.12)

L2x , L2y 0

(10.13)

puesto que

119

10. Fuerzas centrales, momento angular y tomo de hidrgeno


El signo = en (10.12) vale slo si L = 0 . En efecto

L2x = ( , L2x ) = ( Lx , Lx ) = 0 Lx = 0
L2y = ( , L2y ) = ( Ly , Ly ) = 0

Ly = 0

(10.14)

y entonces usando
Lz = hi [ Lx , Ly ]

(10.15)

Lz = 0

(10.16)

encontramos que

y en vista de (10.14) y (10.16) concluimos que


L2 > L2z

(10.17)

para todo , excepto cuando se cumple la condicin (10.10). Vemos entonces que, salvo cuando
todas las componentes de L son nulas, la magnitud del momento angular supera el mximo valor
de cualquiera de sus componentes.
Es fcil verificar que L2 conmuta con todas las componentes de L:

[ L2 , L] = 0

(10.18)

Por lo tanto L2 y una cualquiera de sus componentes, digamos Lz , poseen un sistema completo
de autofunciones en comn.

Traslaciones y rotaciones infinitesimales y sus generadores


Hay una estrecha relacin entre el impulso y las traslaciones, y entre el momento angular y las
rotaciones rgidas. Sea ( r ) una funcin escalar diferenciable arbitraria. Si desplazamos el valor
de a un nuevo punto r + a (Fig. 10.1) obtenemos una nueva funcin ( r ) tal que

( r + a) = ( r )

(10.19)

Para una traslacin infinitesimal a:

q(r)
r

( r ) = ( r a) = ( r ) a ( r )
a

\(r+a)=q(r)
b

y por lo tanto

i
( r ) = ( r ) ( r ) = a p ( r ) (10.21)
h

r+a

Fig. 10.1. Rotacin rgida.

(10.20)

Por este motivo el operador p se denomina generador de traslaciones infinitesimales.


Si el desplazamiento es una rotacin infinitesimal
de un ngulo alrededor de un eje que pasa por el
origen,
120

10. Fuerzas centrales, momento angular y tomo de hidrgeno


a =
r

(10.22)

donde
es un vector cuya magnitud es y que tiene la direccin del eje de rotacin. La variacin de es entonces:

( r ) = ( r ) ( r ) = ( r ) ( r ) = ( r ) ( r )

(10.23)

i
( r ) = L ( r )
h

(10.24)

es decir

Por este motivo el operador L se denomina generador de rotaciones infinitesimales.


De la (10.10) y la (10.24) se desprende que la funcin de onda del estado en el cual las tres
componentes de L estn bien definidas es invariante ante una rotacin infinitesimal arbitraria.
Por lo tanto = (r ) depende slo de r y no de los ngulos y describe un estado esfricamente
simtrico. Tales estados de momento angular nulo se denominan estados S.
Dejamos como ejercicio para el lector comprobar que la relacin fundamental (10.24) implica
las relaciones de conmutacin (10.3).

Fuerzas centrales y conservacin del momento angular


Es fcil verificar usando las relaciones de conmutacin (10.3) (lo dejamos como ejercicio) que

[ L, p 2 ] = 0

(10.25)

Adems, poniendo = V (r ) ( r ) en la (10.24) obtenemos

i
i
[V (r ) ( r )] = V (r ) ( r ) LV (r ) ( r ) = V (r ) L ( r )
h
h

(10.26)

Puesto que
y ( r ) son arbitrarios, concluimos que
[ L, V (r )] = 0

(10.27)

Si V = V (r ) , en virtud de las (10.25) y (10.27) obtenemos


[ L, H ] = 0

(10.28)

y por lo tanto en presencia de fuerzas centrales el momento angular es una constante del movimiento, tal como ocurre en la Mecnica Clsica.

Energa cintica y momento angular


En Mecnica Clsica se usa la identidad

L2 = ( r p)2 = r 2 p2 ( r p)2

121

(10.29)

10. Fuerzas centrales, momento angular y tomo de hidrgeno


para expresar la energa cintica en trminos de la componente radial del impulso y de L2 que es
constante del movimiento, y as el problema de fuerzas centrales se reduce a un problema
unidimensional equivalente. Aqu tenemos que proceder con cuidado, pues

( r p )2 r 2 p 2 ( r p )2

(10.30)

debido a que r y p no conmutan. La expresin correcta es

L2 = ( r p) ( r p) = r 2 p2 r ( r p) p + 2ihr p

(10.31)

lo cual se verifica con un poco de paciencia desarrollando el producto ( r p) ( r p) . Puesto


que

r p = ihr

(10.32)

la (10.31) se escribe

L2 = r 2 p 2 + h 2 r 2

2

2
= r 2 p2 + h2 r 2
2 + 2h r
r
r
r r

(10.33)

y como L conmuta con cualquier funcin de r, podemos escribir la energa cintica en la forma

h2 2
p2
L2
=

2 2 r 2 2 r 2 r r

(10.34)

Debemos recordar que para llegar a esta expresin hemos dividido la (10.33) por r 2 ; por lo tanto
la (10.34) no vale para r = 0 , salvo en el caso especial de los estados de momento angular nulo,
para los cuales L = 0 .

Reduccin del problema de fuerzas centrales


Cuando L2 es constante del movimiento existe un sistema de autofunciones E, ( r ) de H y de
L2 con autovalores E y h 2 , respectivamente:
H E, ( r ) = E E, ( r ) , L2 E, ( r ) = h 2 E, ( r )

(10.35)

Aqu es un nmero puro, pues h tiene dimensiones de momento angular.


Usando la (10.34) la ecuacin de Schrdinger independiente del tiempo se escribe en la forma
h2 2 h2

2 r 2 r r r + 2 r 2 + V (r ) E, ( r ) = E E, ( r )

(10.36)

Puesto que L2 conmuta con cualquier funcin de r, todas las soluciones de la (10.36) se pueden
obtener como combinaciones lineales de soluciones separables en coordenadas esfricas, de la
forma

E, ( r ) = RE, (r )Y ( , )

122

(10.37)

10. Fuerzas centrales, momento angular y tomo de hidrgeno


donde Y ( , ) es una solucin de

L2Y ( , ) = h 2Y ( , )

(10.38)

y la autofuncin radial RE, (r ) satisface la ecuacin diferencial ordinaria


h2 d 2 d h2

2 r 2 dr r dr + 2 r 2 + V (r ) RE, (r ) = ERE, (r )

(10.39)

Si hacemos la sustitucin
RE, (r ) =

uE , ( r )

(10.40)

encontramos que u satisface la ecuacin radial:


2

h 2 d uE , h 2
V
r

+
+
(
)

uE, = EuE,
2
2 dr 2
2 r

(10.41)

Notar el trmino h 2 / 2 r 2 que se suma a la energa potencial. Este trmino se denomina potencial centrfugo pues representa el potencial del cual deriva la fuerza centrfuga.
La (10.41) se parece a la ecuacin de Schrdinger independiente del tiempo en una dimensin
que estudiamos en el Captulo 9, pero las condiciones de contorno para uE, son diferentes pues
r no puede ser negativo. Por ejemplo, para que sea finita en todas partes, u se debe anular en
r = 0 . Dado que las condiciones de contorno dependen de V (r ) dejaremos para ms adelante su
discusin y estudiaremos primero los autovalores y autofunciones del momento angular, que son
aspectos comunes a todos los problemas de fuerzas centrales.

Dependencia angular de las autofunciones


Conviene expresar el momento angular en coordenadas polares esfricas (Fig. 10.2)
z

x = rsen cos
y = rsensen

z
x

(10.42)

z = rcos

El operador se escribe entonces


= r

1
1
+
+
r
r
rsen

(10.43)

donde

x
Fig. 10.2. Coordenadas polares esfricas.

r = xsen cos + y sensen + z cos


= x cos cos + y cossen zsen

(10.44)

= xsen + y cos
La (10.43) muestra que (a diferencia de las compo-

123

10. Fuerzas centrales, momento angular y tomo de hidrgeno


nentes cartesianas) las componentes polares del impulso no conmutan entre s.
El momento angular se puede expresar como


1
L = r p = ihrr = ih

sen

(10.45)

De la (10.45) es evidente que L conmuta con cualquier funcin de r y con cualquier derivada
con respecto de r como ya sabamos.
Usando (10.45) y (10.44) obtenemos


Lx = ih sen
cos cot


Ly = ih cos
sen cot

Lz = ih

(10.46)

y finalmente obtenemos la expresin de L2 en coordenadas polares esfricas:


1
1 2

L2 = h 2

sen
+

sen 2 2
sen

(10.47)

El problema de autovalores de L2 es entonces


1
1 2

sen sen + sen 2 2 Y ( , ) = Y ( , )

(10.48)

Podemos resolver esta ecuacin por separacin de variables poniendo


Y( , ) = ( ) ( )

(10.49)

sen 2 1 d
d
1 d 2

sen

sen d
d
d 2

(10.50)

y resulta

Si indicamos la constante de separacin como m 2 (veremos en seguida que m es real en virtud


de las condiciones de contorno que impondremos) obtenemos una ecuacin diferencial ordinaria
para :

d 2
+ m 2 = 0
d 2

(10.51)

1 d
d
m2
+ = 0
sen

d sen 2
sen d

(10.52)

y otra para :

124

10. Fuerzas centrales, momento angular y tomo de hidrgeno

El problema de autovalores para Lz y la cuantificacin espacial


Para resolver la (10.51) vamos a requerir que

( + 2 ) = ( )

(10.53)

para que la funcin de onda sea univaluada. Esto nos restringe a las soluciones

( ) = eim

, m = 0, 1, 2,

(10.54)

que son autofunciones del operador Lz , pues de acuerdo con la (10.46):


Lz eim = ih

im
e
= mheim

, m = 0, 1, 2,

(10.55)

Puesto que Lz conmuta con L2 ambos operadores tienen un sistema de autofunciones en comn,
por lo cual el resultado (10.55) no es sorprendente.
Incidentalmente, se puede observar que la (10.51) admite soluciones de la forma cos m y
senm que tambin cumplen la condicin (10.53), pero no son autofunciones de Lz . Asimismo
Lx y Ly conmutan con L2 y por lo tanto tambin cualquiera de ellas tiene un sistema de autofunciones en comn con L2 , pero esas autofunciones tienen una forma mucho ms complicada
debido a que usamos el eje z como el eje de las coordenadas polares esfricas y por eso en las
expresiones de Lx y Ly figuran y , mientras que en la de Lz figura solamente .
La ec. (10.55) muestra que los autovalores de Lz son mh ; por consiguiente una medicin de Lz
puede dar como resultado nicamente mltiplos enteros de h . Puesto que la direccin del eje z
es arbitraria, esto implica que el momento angular respecto de cualquier eje est cuantificado y
que una medicin del mismo slo puede dar como resultado uno de los valores discretos
0, h, 2 h, 3h,

(10.56)

Este hecho se conoce como cuantificacin espacial.


El nmero m se suele denominar nmero cuntico magntico debido al papel que juega en la
descripcin del efecto de un campo magntico uniforme B sobre una partcula cargada que se
mueve en un campo de fuerzas centrales.

Teora elemental del efecto Zeeman


Cuando un tomo est sometido a un campo magntico externo, se observa que las lneas espectrales se subdividen en varias componentes. Este fenmeno se denomina efecto Zeeman.
Se puede demostrar que cuando una partcula cuya carga es q se mueve en un campo magntico
externo descripto por el potencial vectorial A, el operador p se debe reemplazar por

p p

q
A
c

(10.57)

Por consiguiente el Hamiltoniano H se debe reemplazar por:

H=

q 2
1 2
1
p + V H =
p A + V
c
2
2

125

(10.58)

10. Fuerzas centrales, momento angular y tomo de hidrgeno


Para un campo magntico uniforme A = ( B r ) / 2 ; la ecuacin de Schrdinger independiente
del tiempo se escribe entonces (despreciando trminos cuadrticos en B) como
p2

q
2 2 c B L + V (r ) = E

(10.59)

Por lo tanto en primera aproximacin el efecto de un campo magntico es agregar a la energa un


trmino de energa magntica M B , donde M es el momento magntico efectivo del sistema y
est relacionado con el momento angular por
M=

q
L
2 c

(10.60)

Esta ecuacin muestra que la relacin entre las magnitudes del momento magntico y del momento angular de un electrn ( q = e ) es la constante e / 2 c . Es usual expresar dicha constante
como
e
g
= L B
2 c
h

, gL = 1 , B =

eh
= 0.927 10 20 erg/gauss
2 c

(10.61)

La cantidad B se denomina magnetn de Bohr y es la unidad natural para los momentos magnticos atmicos; el nmero gL se llama factor giromagntico (o factor de Land) orbital y lo
introducimos explcitamente pese a ser igual a la unidad, pues veremos que hay otros factores
giromagnticos que tienen un valor diferente.
Si se toma el eje z en la direccin del campo magntico, la perturbacin magntica M B contiene slo el operador Lz y por lo tanto las autofunciones simultneas de H y Lz son tambin
autofunciones de H . Entonces es inmediato comprobar que en presencia del campo magntico
los autovalores de la energa de un electrn pasan a ser:
E E = E

q
mh = E + B m
2 c

(10.62)

Este resultado explica el origen del trmino nmero cuntico magntico para designar a m. La
ecuacin (10.62) implica que los estados con el mismo E y diferente m, que en ausencia del
campo magntico estaban degenerados, se separan debido a que la interaccin con el campo depende de la orientacin de L (y por lo tanto del momento magntico M) con respecto de B.
Esta es la teora elemental del efecto Zeeman. Para la mayora de las aplicaciones es necesario
refinarla, para tomar en cuenta el spin del electrn y otras correcciones a la energa que son importantes a menos que B sea muy grande.

Autovalores y autofunciones de L2
Volvemos ahora al estudio de la ec. (10.52):
1 d
d
m2
+ = 0
sen

d sen 2
sen d

Conviene hacer el cambio de variable

126

(10.63)

10. Fuerzas centrales, momento angular y tomo de hidrgeno

= cos

F( ) = ( )

(10.64)

que nos lleva a la ecuacin

d
m2
2 dF
F + F = 0
(1 )
d
d 1 2

(10.65)

En el caso particular m = 0 la (10.65) se reduce a la conocida ecuacin de Legendre:

d
dF
(1 2 ) + F = 0

d
d

(10.66)

Puesto que la ecuacin de Legendre es invariante frente al cambio (es decir )


basta buscar soluciones de paridad definida (esto es funciones simtricas o antisimtricas
respecto del plano z = 0 ).
La solucin regular de la (10.66) se puede expandir en serie
F( ) = ak k

(10.67)

Sustituyendo (10.67) en (10.66) obtenemos una relacin de recurrencia para los coeficientes de
la serie:
ak + 2 =

k ( k + 1)
ak
( k + 1)(k + 2)

(10.68)

La (10.68) muestra que para k par se cumple a2 = 0 y para k impar a1 = 0 , de acuerdo a la hiptesis que F es regular en = 0 . Por otra parte, si la serie no termina para algn valor finito de
k, se tiene que
ak + 2
1

ak k

(10.69)

y por lo tanto la serie diverge para 1. Por la misma razn excluimos la segunda solucin
linealmente independiente de la (10.66) que diverge logartmicamente en 1.
Concluimos que para tener una solucin aceptable, la serie se debe cortar en un valor finito
k = l , donde l es un entero no negativo, y en ese caso F es un polinomio de grado l. Entonces los
valores permitidos de son:

= l(l + 1) , l = 0, 1, 2,

(10.70)

El nmero l se llama nmero cuntico del momento angular orbital. Por tradicin los correspondientes autoestados del momento angular orbital se designan con los smbolos S, P, D, F, G,
H,. Si hay varias partculas en el campo de fuerzas centrales se usan las minsculas s, p, d, f,

127

10. Fuerzas centrales, momento angular y tomo de hidrgeno


g, h,. para designar los estados de momento angular de cada partcula y se reservan las
maysculas S, P, D, F, G, H,. para el momento angular orbital total1.
Los autovalores de L2 son por lo tanto

l(l + 1)h 2 = 0, 2 h 2 , 6h 2 , 12 h 2 ,

(10.71)

Las soluciones polinomiales de la (10.66) se suelen definir como

Pl ( ) =

1 dl 2
( 1)l
2l l! d l

(10.72)

y se denominan polinomios de Legendre. El factor constante en (10.72) se introduce para que

Pl ( 1) = ( 1)l

(10.73)

Los primeros polinomios de Legendre son

P0 ( ) = 1

P3 ( ) = 12 (5 3 3 )

P1 ( ) =

P4 ( ) = 18 (35 4 30 2 + 3)

P2 ( ) = 12 (3 2 1)

P5 ( ) = 18 (63 5 70 3 + 15 )

(10.74)

Puesto que los Pl ( ) son autofunciones del operador Hermitiano L2 , es evidente que son ortogonales:
+1

Pl ( ) Pl ( )d

= l l

2
2l + 1

(10.75)

Una vez conocidas las soluciones de la ecuacin de Legendre (10.66) no es difcil encontrar
tambin las soluciones de la (10.65) con m 0. Para eso usaremos una tcnica semejante a la
que empleamos en el Captulo 9 al estudiar el oscilador armnico. Consideremos los operadores
no Hermitianos

L+ = Lx + iLy , L = Lx iLy

(10.76)

cuya forma explcita es



L+ = hei
+ i cot



, L = he i
i cot

(10.77)

Es fcil comprobar que L+ y L cumplen las siguientes relaciones de conmutacin:

[ L2 , L ] = 0 , [ Lz , L+ ] = hL+

, [ Lz , L ] = hL

(10.78)

y satisfacen las siguientes identidades que nos sern de utilidad:


1

Los primeros cuatro smbolos son las iniciales de los nombres de las series espectrales Sharp, Principal, Diffuse y

Fundamental.

128

10. Fuerzas centrales, momento angular y tomo de hidrgeno

L L+ = L2 L2z hLz

, L+ L = L2 L2z + hLz

(10.79)

Indicamos ahora con

Ylm ( , ) = lm ( )eim

(10.80)

las autofunciones de L2 y Lz . Conocemos ya algunas de ellas, las que corresponden a m = 0:

Yl0 ( , ) = l0 ( ) = Pl (cos )

(10.81)

y ahora mostraremos como se obtienen las dems.


Si aplicamos Lz a la funcin L+ Ylm y usamos la (10.78) obtenemos:

Lz ( L+ Ylm ) = {L+ Lz + [ Lz , L+ ]}Ylm = {L+ Lz + hL+}Ylm = ( m + 1)h( L+ Ylm )

(10.82)

Esto muestra que L+ Ylm es una autofuncin de Lz correspondiente al autovalor ( m + 1)h , y por
lo tanto es proporcional a Ylm+1 . Escribimos entonces

L+ Ylm = C+ (l, m)hYlm +1

(10.83)

donde C+ (l, m) es la constante de proporcionalidad. De igual modo si aplicamos Lz a la funcin


L Ylm . resulta

Lz ( L Ylm ) = {L Lz + [ Lz , L ]}Ylm = {L Lz hL}Ylm = ( m 1)h( L Ylm )

(10.84)

y por lo tanto L Ylm es una autofuncin de Lz correspondiente al autovalor ( m 1)h , y debe ser
proporcional a Ylm1 ; entonces

L Ylm = C (l, m)hYlm 1

(10.85)

donde C (l, m) es una constante.


Por consiguiente, aplicando reiteradamente los operadores L+ y L podemos obtener a partir de
Yl0 todas las diferentes Ylm para el l dado.
Observemos que para cada l, la condicin (10.17):
L2 > L2z

(10.86)

= l(l + 1) m 2

(10.87)

implica

En consecuencia para cada l debe haber un valor mximo de m, m = q , tal que la aplicacin de
L+ a Ylq no nos da una nueva autofuncin, es decir
L+ Ylq = 0
Multiplicando la (10.88) por L y usando la (10.79) obtenemos

129

(10.88)

10. Fuerzas centrales, momento angular y tomo de hidrgeno


L L+ Ylq = ( L2 L2z hLz )Ylq = h 2 [l(l + 1) q(q + 1)]Ylq = 0

(10.89)

q(q + 1) = l(l + 1)

(10.90)

de donde resulta que

La (10.90) nos da dos posibles valores de q: l y (l + 1) . Obviamente debemos descartar el segundo y por lo tanto el mximo valor de m es m = l .
Anlogamente debe haber un valor mnimo de m, m = q tal que
L Ylq = 0

(10.91)

Multiplicando la (10.91) por L+ y usando la (10.79) obtenemos


L+ L Ylq = ( L2 L2z + hLz )Ylq = h 2 [l(l + 1) q (q 1)]Ylq = 0

(10.92)

de donde resulta que


q (q 1) = l(l + 1)

(10.93)

Las races de (10.93) son l y l + 1 y puesto que la segunda de ellas se debe descartar, el mnimo
valor de m es m = l .
En consecuencia los posibles valores de m para un l dado son:
m = 0, 1, L, l

(10.94)

o sea en total 2l + 1 valores.


Usando las identidades (10.79) podemos calcular los valores de las constantes C+ (l, m) y
C (l, m) , los resultados son:

C+ (l, m) = (l m)(l + m + 1) , C (l, m) = (l + m)(l m + 1)

(10.95)

Las autofunciones normalizadas Ylm ( , ) de L2 y Lz se denominan armnicos esfricos y su


forma explcita para m 0 es

Ylm ( , ) =

2l + 1 (l m)!
( 1)m eim Plm (cos ) ( m 0)
4 (l + m)!

(10.96)

Los armnicos esfricos con superndice negativo se definen como

Ylm = ( 1)m (Yl m )* ( m < 0)

(10.97)

En la (10.96) Plm indica las funciones asociadas de Legendre, que son soluciones de la ecuacin
(10.65), y se definen a partir de los polinomios de Legendre como

Plm ( ) = (1 )m / 2

130

dm
Pl ( )
d m

(10.98)

10. Fuerzas centrales, momento angular y tomo de hidrgeno


Los armnicos esfricos forman un sistema ortonormal completo, de modo que
2

=0

[Ylm ( , )]* Ylm ( , )send

= ll mm

(10.99)

=0

Podemos observar que en una inversin de coordenadas, en la cual

, +

(10.100)

la funcin eim queda multiplicada por ( 1)m y Plm (cos ) por ( 1)l + m . Por consiguiente la paridad de los armnicos esfricos est dada por ( 1)l .
Los primeros armnicos esfricos son
1
4
3
3 z
cos =
Y10 =
4
4 r
3 i
Y11 = m
e sen = m
8
5
(3 cos2 1) =
Y20 =
16
15 i
Y21 = m
e cos sen
8
15 2i
Y22 =
e
sen 2 =
32
Y00 =

3 x iy
8 r
5 2 z 2 x 2 y2
16
r2
15 ( x iy)z
=m
8
r2
15 ( x iy)2
32
r2

(10.101)

La ecuacin radial
Volvemos ahora a la discusin de la ecuacin radial. De lo visto antes, concluimos que en presencia de fuerzas centrales las soluciones de la ecuacin de Schrdinger independiente del
tiempo son de la forma

( r, , ) =

u( r ) m
Yl ( , )
r

(10.102)

Puesto que r no cambia por una inversin de coordenadas, esas funciones de onda tienen la
misma paridad que los armnicos esfricos. Por lo tanto para l par tendremos estados de paridad
par y para l impar estados de paridad impar.
La funcin de onda radial u(r ) debe ser solucin de la ec. (10.41):
2

h 2 d uE, h 2l(l + 1)
V
r
(
)

+
+

uE, = EuE,
2
2 dr 2
2 r

(10.103)

Puesto que los armnicos esfricos estn normalizados, la normalizacin de la funcin de onda
para las autofunciones correspondientes a los autovalores discretos de la (10.103) requiere que

131

10. Fuerzas centrales, momento angular y tomo de hidrgeno

*r 2 drd

= u*udr = 1

(10.104)

La normalizacin de las autofunciones del espectro continuo requiere

u*EuE dr

= ( E E )

(10.105)

En la mayora de los casos de inters podemos suponer que V (r ) es finito en todas partes, salvo
eventualmente en el origen, y que cerca de r = 0

V (r ) cr

, (r 0 , = entero 1)

(10.106)

Adems vamos a suponer que


V 0 , (r )

(10.107)

Recordemos que la (10.34) no vale en el origen y por lo tanto la (10.103) vale slo para r 0 y
la debemos complementar con una condicin de contorno en r = 0 . Sin entrar en mayores detalles podemos decir que la condicin de contorno adecuada se obtiene imponiendo que H sea
Hermitiano. En los casos que nos interesan aqu, esto se consigue usando la condicin
u(0) = 0

(10.108)

Vale la pena aclarar que esta sencilla condicin es suficiente pero no necesaria. En ciertos casos,
por ejemplo en la teora relativstica del tomo de hidrgeno, se pueden aceptar funciones de
onda con una singularidad dbil en el origen.
Cuando l 0, en muchos casos podemos despreciar V (r ) cerca del origen en comparacin con
el potencial centrfugo ( r 2 ). Si esto ocurre, la (10.103) se reduce a
d 2u l(l + 1)

u = 0 , (l 0 , r 0 )
dr 2
r2

(10.109)

u = Ar l +1 + Br l

(10.110)

cuya solucin general es

Puesto que l 1 en la (10.110), la condicin de contorno (10.108) exige que B = 0. Por lo tanto
para todos los estados con l 1 tenemos que

u = Ar l +1 , (l 0 , r 0)

(10.111)

Para los estados S no hay trmino centrfugo en la (10.103) y entonces el comportamiento de


u(r ) cerca del origen depende de la forma de V (r ) .
Si V 0 para r la ecuacin radial se reduce para r grande a:
d 2u 2 E
+ 2 u = 0 , (r )
dr 2
h
132

(10.112)

10. Fuerzas centrales, momento angular y tomo de hidrgeno


Cuando E > 0 las soluciones de esta ecuacin son oscilatorias, por consiguiente todos los valores de E estn permitidos y el espectro de autovalores es continuo. En cambio cuando E < 0 las
soluciones de la (10.112) son exponenciales y para que sea normalizable debemos excluir la
solucin exponencialmente creciente. Luego en este caso tendremos
u(r ) e r

2 E
h2

, =+

(r )

(10.113)

Las autofunciones que tienen este comportamiento representan estados ligados y las condiciones
de contorno permiten en general slo ciertos valores discretos de la energa.
Para estudiar los estados ligados conviene transformar la ecuacin radial poniendo

u(r ) = l +1e w( ) , = r

(10.114)

pues de esta forma eliminamos de la funcin incgnita w(r ) las partes que describen el comportamiento ya conocido de u(r ) para r 0 y r . Sustituyendo (10.114) en (10.103) obtenemos la ecuacin

l + 1 dw V
d 2w
l + 1
+
2

1
+

w = 0
d 2


d E

(10.115)

entre cuyas soluciones deberemos elegir las que satisfacen las condiciones de contorno en el origen y en el infinito.

Estados ligados de tomos con un solo electrn


En este caso la energa potencial es
V (r ) =

Ze2
r

(10.116)

donde Ze es la carga del ncleo y e la del electrn (para el tomo de hidrgeno Z = 1).
En virtud de la discusin precedente u(r ) se comporta como r l +1 cerca del origen, y, dada la
forma (10.116) de V (r ) , resulta que tambin para los estados S tenemos ese comportamiento.
Conviene introducir el parmetro

Ze2 Ze2
=
|E|
h

2
|E|

(10.117)

de modo que
V 0
=
E

(10.118)

y entonces la (10.115) se escribe como:

d 2w
dw
+ [ 0 2(l + 1)]w = 0
2 + 2(l + 1 )
d
d

133

(10.119)

10. Fuerzas centrales, momento angular y tomo de hidrgeno


Autovalores de la energa
Para resolver la ecuacin (10.119) ensayamos un desarrollo en serie de la forma
w( ) = ak k

(10.120)

Introduciendo esta expresin en la (10.119) obtenemos la relacin de recurrencia


ak +1 =

2( k + l + 1) 0
ak
( k + 1)(k + 2l + 1)

(10.121)

De la (10.121) se desprende que a1 = 0 y por lo tanto la serie comienza con un trmino constante a0 0 . Por otra parte, para valores grandes de k

ak +1

2
ak
k

, k >> 1

(10.122)

y entonces para resulta

w( ) e 2

(10.123)

Este comportamiento es inaceptable, pues nos da

u(r ) l +1e w( ) e

(10.124)

Por lo tanto la serie debe terminar de modo que w( ) sea un polinomio.


Si N es el grado de dicho polinomio, tendremos que aN 0 y aN +1 = 0 y la (10.121) nos da la
condicin

0 = 2( N + l + 1) con N = 0, 1, 2, , l = 0, 1, 2,

(10.125)

Esta condicin implica la cuantificacin de la energa y es equivalente a la frmula (5.17) a partir de la cual se obtiene la frmula de Rydberg para las series espectrales de tomos hidrogenoides.
Para ver esto conviene definir

n N + l +1 =

0
2

(10.126)

y reemplazar 0 por su expresin (10.117). Resulta entonces


E = En =

Z 2e 4
2h 2 n 2

(10.127)

que es idntica a la frmula (5.17) que obtuvimos aplicando la condicin de cuantificacin de


Bohr de la Teora Cuntica Antigua.
Tambin vemos que la extensin radial de la regin donde est localizado el electrn est determinada por

134

10. Fuerzas centrales, momento angular y tomo de hidrgeno


1 n
h2
= a , a= 2
Z
e

(10.128)

donde a es el radio de Bohr.


Puesto que por definicin N es un entero no negativo, es obvio que n es un entero positivo que
cumple
n 1

(10.129)

El estado fundamental corresponde n = 1 y l = 0 y su energa es de 13.6 eV para el


hidrgeno. Hay infinitos niveles discretos de energa, con punto de acumulacin en E = 0 para
n .
De acuerdo con los resultados de nuestro estudio, las autofunciones del Hamiltoniano del electrn de un tomo hidrogenoide se pueden elegir para que sean adems autofunciones de L2 y de
Lz y en tal caso estn caracterizadas por los tres nmeros cunticos n, l m. Puesto que En depende slo del nmero cuntico principal, todos los niveles de energa, exceptuando el nivel
fundamental, son degenerados. Para cada nivel En ( n > 1) hay n valores posibles de l:
l = 0, 1, 2, , n 1

(10.130)

y para cada uno de ellos hay 2l + 1 valores posibles del nmero cuntico magntico m. En consecuencia para cada nivel de energa hay
n 1

(2l + 1) = n 2

(10.131)

l=0

autofunciones nlm linealmente independientes. Se dice en este caso que el grado de degeneracin de cada nivel es n2. En realidad, si se toma en cuenta el spin del electrn el grado de degeneracin se duplica (tambin para el estado fundamental).
La aparicin de degeneracin est siempre asociada con las simetras del sistema. La mayora de
las veces las simetras son evidentes. Por ejemplo, la degeneracin con respecto del nmero
cuntico magntico se origina en la ausencia de una orientacin privilegiada y refleja la invariancia del sistema con respecto de las rotaciones alrededor del origen. Claramente esta degeneracin est presente para cualquier potencial central. En cambio, la degeneracin de los estados
con un mismo n y diferente l es peculiar del potencial Coulombiano. Cualquier apartamiento del
potencial de la dependencia 1/ r elimina esta degeneracin, porque en ese caso los autovalores
de la energa dependen no slo de n sino tambin de l. Por este motivo esta degeneracin se
suele llamar degeneracin accidental, pero esta denominacin no debe llevar a confusin pues
no ocurre por casualidad. Su origen se encuentra en una sutil simetra en el espacio de los impulsos, y se relaciona con el hecho que para el potencial de Coulomb la ecuacin de Schrdinger
independiente del tiempo no slo es separable en coordenadas esfricas, sino tambin en coordenadas parablicas.
Estudio de las autofunciones
Resumiremos sin demostracin algunas de las propiedades ms importantes de las autofunciones
radiales de los estados ligados del potencial de Coulomb.

135

10. Fuerzas centrales, momento angular y tomo de hidrgeno


Las soluciones polinomiales de la (10.119) se relacionan con cierta clase de polinomios ortogonales LpN ( z ) = Lqp p ( z ) denominados polinomios asociados de Laguerre.
Los polinomios de Laguerre de grado q se pueden definir como
Lq ( z ) = e z

d q z q
(e z )
dz q

(10.132)

y los polinomios asociados de Laguerre de grado q p como:


Lqp p ( z ) = ( 1) p

dp
Lq ( z )
dz p

(10.133)

Se encuentra que

Lqp p (0) =

(q!)2
(q p)! p!

(10.134)

El nmero de ceros de Lqp p ( z ) es N = q p = n l 1, y la integral de normalizacin es

e z z 2l + 2 [ L2nl+l11( z)]2 dz

2 n(n + 1)!
(n l 1)!

(10.135)

Finalmente, reuniendo todos los resultados que obtuvimos podemos escribir las autofunciones
normalizadas para los estados ligados de tomos hidrogenoides en la forma:
1/ 2

(n l 1)!

nlm (r, , ) = (2 )3

2 n(n + l )!

e r (2r )l L2nl+l11 (2r )Ylm ( , ) , =

Z
na

(10.136)

A veces en lugar de las (10.136) se usan las autofunciones reales:


cos m
nlm (r, , ) e r (2r )l L2nl+l11 (2r ) Plm ( , ){
senm

(10.137)

Se puede ver que, salvo en el caso de los estados S, las nlm (r, , ) tienen n superficies nodales
(contando r = 0 como una superficie). En efecto L2nl+l11 (2r ) se anula para n l 1 valores de r,
Plm ( ) se anula para l m valores de , cos m y sen m se anulan para m valores de , y por
ltimo r l tiene un nodo en r = 0 si l 0.
El hecho que la funcin de onda es nula en el origen para todos los estados menos para los estados S tiene consecuencias muy importantes, pues por este motivo slo los electrones atmicos en
los estados S tienen una probabilidad apreciable de encontrarse en el interior del ncleo atmico.
Por lo tanto son los nicos que pueden interactuar con el ncleo, dando lugar a procesos como la
captura electrnica (una forma de decaimiento + alternativa a la emisin de un positrn) y la
conversin interna (una forma se desexcitacin nuclear en la cual en vez de emitir radiacin , el
ncleo transfiere su exceso de energa a un electrn atmico).
El significado cuntico del radio de Bohr se puede apreciar si se observa que la funcin de onda
del estado fundamental es

136

10. Fuerzas centrales, momento angular y tomo de hidrgeno

Z3
1, 0, 0 (r, , ) = 3
a

1/ 2

e Zr / a

(10.138)

3a
2Z

(10.139)

y el valor esperado de r en este estado es


Z
r = 4
a

e 2 Zr / ar 3dr

La densidad de probabilidad en el estado fundamental es mxima en r = a / Z .


Existen por supuesto varias correcciones a la simple frmula (10.127) de los niveles de energa:
El efecto de la masa finita del ncleo, que se puede tomar en cuenta usando en lugar de la
masa reducida del sistema electrn-ncleo.
Los efectos del spin del electrn y las correcciones relativsticas por la velocidad del electrn
(estructura fina).
Los efectos de la interaccin magntica entre el electrn y el ncleo (estructura hiperfina).
Los efectos debidos a la interaccin entre el electrn y el campo electromagntico (corrimiento de Lamb).
No nos ocuparemos de los ltimos dos en este curso.

137

11. El Spin

11. EL SPIN
El momento angular intrnseco
Hasta aqu nos ocupamos de la descripcin cuntica de una partcula, considerada como una
masa puntiforme sin estructura interna. En consecuencia supusimos que el estado de la misma se
puede especificar por completo mediante la funcin de onda , que es una funcin escalar de
las variables espaciales x, y, z y del tiempo.
Es ciertamente notable que esta imagen tan simple permite explicar muchos aspectos de la fsica
del tomo y del ncleo. Sin embargo, estos logros no nos deben hacer perder de vista que este
modelo slo explica los aspectos ms gruesos del tomo y del ncleo. Muchos detalles se pudieron entender recin a partir del descubrimiento que muchas partculas, incluyendo electrones,
protones y neutrones no estn completamente descriptas por el modelo de masa puntiforme sin
estructura1. En otras palabras, el estado de esas partculas no est especificado por completo por
una funcin escalar de las coordenadas y del tiempo. En efecto, la evidencia emprica muestra
que es necesario atribuir a esas partculas un momento angular intrnseco o spin, y asociado con
l, un momento magntico intrnseco.

La evidencia espectroscpica
Mencionaremos primero la evidencia espectroscpica acerca del spin y del momento magntico
intrnseco, dado que fue a partir de ella que se introdujeron esos atributos del electrn.
La expresin que obtuvimos para los niveles de energa del tomo de hidrgeno (ec. (10.127))
no explica por completo el espectro observado, por cuanto muchas de las lneas muestran desdoblamientos en varias componentes, dando lugar a una estructura fina de los niveles de energa
que no se puede explicar mediante la teora que desarrollamos en el Captulo 10.
En 1916, en el marco de la Teora Cuntica Antigua, Sommerfeld dio una explicacin aparentemente satisfactoria de la estructura fina (ver el Captulo 5), basada sobre las correcciones relativsticas, en virtud de las cuales la energa de los niveles (que en el caso no relativstico depende
slo del nmero cuntico principal) pasa a depender tambin del nmero cuntico azimutal. La
separacin de los niveles as obtenida coincide con la que se observa en el hidrgeno y el helio
ionizado y tambin con la que se observa en las lneas de rayos X de los tomos pesados. Por ese
motivo la explicacin de Sommerfeld fue aceptada durante varios aos.
Sin embargo, poco antes del desarrollo de la Mecnica Cuntica, aparecieron problemas con la
teora de Sommerfeld, en relacin con el espectro de los tomos alcalinos. El estado fundamental
de un tomo alcalino tiene una estructura electrnica muy simple, y su espectro ptico se puede
interpretar suponiendo que el tomo consiste esencialmente de un ion inerte alrededor del cual se
mueve el nico electrn de valencia. Por lo tanto se comporta bsicamente como un tomo de
hidrgeno, con la salvedad que el potencial en el que se mueve el electrn de valencia no es
Coulombiano, pues la carga del ncleo est apantallada por los electrones del ion. Entonces, an
sin tener en cuenta el efecto relativstico (que en este caso se puede despreciar), la energa de los
niveles depende del nmero cuntico azimutal.
Sin embargo, en los tomos alcalinos se observa que los niveles correspondientes a valores dados de ambos nmeros cunticos (principal y azimutal) aparecen a veces desdoblados ulterior-

Por mucho tiempo los protones y neutrones se consideraron elementales. Hoy sabemos que son compuestos.

138

11. El Spin
mente. Tambin se encontr que las separaciones de esos dobletes se pueden representar (formalmente) mediante la frmula relativstica de Sommerfeld. Pero Millikan y Bowen, y tambin
Alfred Land, que hicieron este descubrimiento en 1924, sealaron que dicha frmula no se
poda aceptar en este caso, por cuanto el nmero cuntico azimutal es el mismo para ambas
componentes del doblete y por lo tanto la causa del fenmeno no se poda explicar.

La hiptesis de Uhlenbeck y Goudsmit


En 1926 Samuel A. Uhlenbeck y George E. Goudsmit, dos estudiantes graduados, explicaron del
misterio y mostraron que las dificultades se resolvan si se atribua al electrn una nueva propiedad: la de poseer un momento angular S y un momento magntico Ms intrnsecos, tal como ocurrira si un cuerpo cargado elctricamente girara alrededor de un eje que pasa por l2.
La evidencia espectroscpica muestra que la magnitud del momento angular intrnseco del electrn est dada por

S2 = s( s + 1)h 2

(11.1)

s = 1/ 2

(11.2)

donde s, el nmero cuntico de spin, vale

y que la componente Sz del momento angular intrnseco alrededor de un eje z de orientacin arbitraria slo puede tomar los valores

Sz = hms , ms = s = 1 / 2

(11.3)

Para explicar los desdoblamientos de la estructura fina y del efecto Zeeman, se encontr que el
momento magntico intrnseco asociado con el spin del electrn debe valer
Ms =

e
S
c

(11.4)

de manera que ( B = eh / 2 c indica el magnetn de Bohr, ec. (10.61)):


e
g
= S B
h
c

, gS = 2

(11.5)

y por lo tanto el factor giromagntico de spin es el doble del factor giromagntico orbital.
En breve tiempo Uhlenbeck y Goudsmit (y otros como Wolfgang Pauli, Heisenberg, Jordan,
Sommerfeld, etc.) mostraron que la introduccin del spin resuelve todas las dificultades entonces
conocidas y por lo tanto este nuevo atributo del electrn se acept, junto a los ya conocidos de
carga y masa. En efecto, se encontr que la aparicin de dobletes en el espectro de los metales
alcalinos se debe exclusivamente a la interaccin entre el momento magntico orbital y el
momento magntico intrnseco del electrn de valencia. En cuanto a la estructura fina de los
niveles de los tomos hidrogenoides, se vio que resulta de una particular combinacin de los

Se puede mencionar que en 1921 Compton haba ya especulado sobre la posibilidad que el electrn tuviera un

momento angular y un momento magntico intrnsecos, pero no elabor ulteriormente la idea.

139

11. El Spin
la relatividad, que por una curiosa coincidencia dan un resultado idntico al que obtuvo originalmente Sommerfeld a partir de la Teora Cuntica Antigua.
El spin qued as incorporado a la Mecnica Cuntica como un postulado adicional, que es perfectamente compatible con los dems postulados de la teora pero no es una consecuencia lgica
de los mismos, sino que se introduce en base a la evidencia experimental. Hay que aclarar aqu
que el spin del electrn no se puede imaginar como el resultado de la rotacin de una distribucin de cargas. Es imposible formular un modelo de ese tipo sin incurrir en graves dificultades.
Adems, la evidencia experimental ms reciente tiende a indicar que el electrn es una partcula
puntual3. Por consiguiente no es lcito interpretar el spin en trminos de modelos clsicos, como
esferas de carga en rotacin o cosas parecidas.
Posteriormente (1928) Dirac desarroll una teora relativstica del electrn, en la que no es preciso postular el spin sino que ste aparece en forma natural como una consecuencia de la invariancia Lorentz de las ecuaciones que lo describen. La ecuacin de Dirac tambin predice correctamente el valor del factor giromagntico4. Estos resultados muestran que el spin est ntimamente relacionado con la relatividad. Con la teora de Dirac el spin adquiri una firme base
terica.

El experimento de Stern y Gerlach


Si bien en su momento no se tuvo conciencia de ello, en realidad el momento magntico intrnseco del electrn ya haba sido medido en 1922 por Otto Stern y Walter Gerlach, en un experimento muy interesante que ilustra varios conceptos importantes para la interpretacin de la Mecnica Cuntica. En el experimento se intentaba medir el momento magntico de tomos y molculas haciendo pasar un haz atmico (o molecular) colimado a travs de un campo magntico
fuertemente inhomogneo (Fig. 11.1).
De acuerdo con la fsica clsica, sobre un momento
magntico M sometido a un campo magntico no uniforme B se ejerce una fuerza dada por
S
spin arriba
(11.6)
F = ( M B)
N

spin abajo

Fig. 11.1. Esquema del experimento


de Stern y Gerlach.

La fuerza (11.6) es la nica que acta sobre un tomo ya


que ste es neutro. En el experimento, las partculas se
hacan pasar por una regin en la cual la variacin de la
direccin de B era muy pequea, pero su magnitud variaba muy fuertemente con la posicin. En ese caso la
(11.6) nos da (aproximadamente)
F = M BB

(11.7)

donde M B indica la proyeccin de M en la direccin de B.

La cota superior del tamao del electrn que resulta de los experimentos de dispersin a muy altas energas es

menor que 1016 cm.


4

Al orden ms bajo en la constante de la estructura fina. El valor exacto de g s se calcula por medio de la

Electrodinmica Cuntica.

140

11. El Spin
La deflexin se mide estudiando las trazas que el haz de partculas deja en una pantalla, y a partir de ella se puede determinar F y de ah finalmente M B .
Los resultados de los experimentos fueron notables. Clsicamente se esperara obtener en la
pantalla una traza continua, correspondiente a los valores de M B entre M y +M. En cambio, se
observaron varias trazas equidistantes. Este resultado es una clara demostracin de la naturaleza
cuntica del momento magntico del tomo. Puesto que el vector M puede asumir solamente
ciertas direcciones discretas en el espacio, dicho fenmeno se denomina cuantificacin espacial.
Stern y Gerlach tambin obtuvieron resultados cuantitativos (aunque de poca precisin). Encontraron que los valores permitidos de M B variaban en pasos iguales desde un mnimo M a un
mximo +M. Por convencin, se suele designar al valor mximo de la proyeccin de M como el
momento magntico de la partcula.
De acuerdo con la ley de Ampre el movimiento de los electrones atmicos, adems de producir
el momento angular orbital L, tambin produce un momento magntico M que cumple la relacin clsica
M=

e
L
2 c

(11.8)

Aplicando el principio de correspondencia, esperamos entonces que en Mecnica Cuntica valga


la relacin
M=

e
g
L= L BL
2 c
h

(11.9)

Puesto que cualquier componente de L tiene 2l + 1 autovalores


m = 0, 1, 2, , l

(11.10)

esperamos que los autovalores de M B sean

MB =

gL B
g
g
g
m = 0, L B , 2 L B , , l L B
h
h
h
h

(11.11)

y como en el experimento de Stern y Gerlach l es entero, esperamos un nmero impar de trazas.


Sin embargo, en un experimento clsico realizado con tomos de Ag (que tiene un nico electrn de valencia) se observaron dos trazas, esto es, un nmero par, y el valor del momento magntico result ser
M=

eh
= B
2 c

(11.12)

Las extraordinarias implicaciones de este experimento no fueron comprendidas de inmediato. En


cambio se intent interpretar los resultados en trminos de las relaciones (11.9) y (11.10), suponiendo que el electrn de valencia estaba en un estado P (con l = 1) y que por alguna razn el
estado con m = 0 no se presentaba. Se trataba as de explicar porqu se observan solamente dos
trazas. Esta hiptesis tan artificiosa tiene la virtud que tambin explica el valor del momento
magntico medido, pero igualmente es implausible, pues normalmente el estado de ms baja
energa de un tomo no es P sino S.
141

11. El Spin
Antes de proseguir conviene examinar la validez de algunos de los argumentos que usamos para
interpretar los resultados del experimento de Stern y Gerlach. La ec. (11.7) es puramente clsica
y podra caber la duda que no sea lcito aplicarla al momento magntico cuantificado. La respuesta a esta duda es que en todo experimento hay aspectos que se describen correctamente mediante las leyes clsicas, pues stas son las leyes que gobiernan lo que experimentan nuestros
sentidos, por medio de los cuales (en ltima instancia y en forma indirecta) nos relacionamos
con lo que sucede en los tomos y los ncleos. Puesto que las partculas del haz empleado en el
experimento de Stern y Gerlach tienen masa grande, es correcto representarlas mediante paquetes que se dispersan muy lentamente y por lo tanto ese movimiento se puede describir mediante
las leyes clsicas. Ese es el motivo por el cual el electrn, que es en realidad el objeto de estudio
en el experimento, debe viajar junto al tomo. Si se intentara realizar el mismo experimento con
electrones libres, los efectos de interferencia cuntica destruiran el patrn de trazas y no se podra obtener un resultado til.
Volviendo a los resultados del experimento de Stern y Gerlach con tomos de Ag, las varias interpretaciones que se intentaron al principio fueron harto insatisfactorias y solamente la hiptesis
de Uhlenbeck y Goudsmit permiti dar una explicacin adecuada.
En efecto, si suponemos que el tomo de Ag est en un estado S (como es lgico), entonces,
puesto que l = 0, la (12.12) mide en realidad el valor mximo de la componente (en la direccin
de B) del momento magntico intrnseco. Pero a diferencia del momento magntico orbital, en
virtud de (11.3) y (11.4) el momento magntico intrnseco puede tener solamente dos proyecciones:
MB =

eh
2 c

(11.13)

Por lo tanto se explica tanto la aparicin de dos trazas como su separacin.


Esta interpretacin qued confirmada en 1927 con el experimento de Phipps y Taylor, quienes
emplearon la tcnica de Stern y Gerlach para medir el momento magntico de tomos de hidrgeno. Este experimento es muy significativo, pues la teora del tomo de hidrgeno es bien conocida y predice sin lugar a dudas que el estado fundamental es un estado S y entonces el nico
valor posible de m es m = 0. Por lo tanto, en ausencia de otro momento magntico diferente del
que proviene del movimiento orbital del electrn, se tendra M B = 0 y el campo magntico no
afectara al haz. Sin embargo Phipps y Taylor encontraron que el haz se separa en dos componentes desviadas simtricamente.
Se puede descartar que el momento magntico debido al cual se produce la divisin del haz provenga del ncleo, puesto que un momento magntico nuclear tendra una magnitud del orden de
eh / 2 N c , donde N es la masa del ncleo5 (del protn en el caso del hidrgeno). Pero el momento magntico nuclear es tres rdenes de magnitud menor que el que midieron Phipps y
Taylor. Por lo tanto es inevitable concluir que el momento magntico responsable de la separacin del haz reside en el electrn.

El spin como una variable dinmica


De acuerdo con lo anterior vamos a introducir el spin en la teora, para lo cual agregamos a las
variables dinmicas x, y, z que describen la posicin del electrn una cuarta variable de spin, que
5

La cantidad N = eh/2Nc se denomina magnetn nuclear.

142

11. El Spin
indicaremos con . A le asignamos sentido fsico asociando las dos posibles proyecciones del
momento magntico intrnseco Ms que se miden en el experimento de Stern y Gerlach con dos
diferentes valores de . De esta forma asociaremos (arbitrariamente):
eh
2 c
eh
=+
2 c

= +1 con Ms, B =
= 1 con Ms, B

(11.14)

Frecuentemente se dice spin arriba para indicar a = +1 y spin abajo para indicar a = 1
(Fig. 11.1). La funcin de onda depende ahora tambin de la variable de spin y suponemos que
los postulados de la Mecnica Cuntica se aplican a la nueva variable independiente del mismo
modo que a las dems variables. Por ejemplo

| ( x, y, z, +1, t ) |2 dxdydz

(11.15)

es la probabilidad que en el instante t la partcula se encuentre cerca de x, y , z y que, adems,


tenga spin arriba, esto es, que la proyeccin de su momento magntico intrnseco en la direccin de B sea Ms, B = B .
Esta pequea generalizacin de la teora es suficiente. Todas las frmulas de los Captulos precedentes se pueden extender sin dificultad a la Mecnica Cuntica con spin. Donde antes integrbamos sobre las variables espaciales, ahora tenemos que introducir tambin una suma sobre
los dos valores que puede asumir la variable de spin. Por ejemplo, la normalizacin de la funcin
de onda es ahora

dxdydz | ( x, y, z, , t ) |2 =

dxdydz | ( x, y, z, +1, t ) |2

(11.16)
+

dxdydz | ( x, y, z, 1, t ) |2

=1

Igual que antes, a cada variable dinmica le corresponde un operador lineal Hermitiano.
Entre todos los estados estacionarios ( x, y, z, ) hay una clase especial que es muy fcil de tratar. Son aquellos en que es separable en la forma

( x, y, z, ) = ( x, y, z ) ( )

(11.17)

Nos interesan dos particulares funciones ( ) que llamamos ( ) y ( ) y que se definen


como

( ) = ( ) si ( +1) = 1 , ( 1) = 0
( ) = ( ) si ( +1) = 0 , ( 1) = 1

(11.18)

Es decir, corresponde a spin arriba y describe una partcula con un valor definido = 1.
Anlogamente corresponde a spin abajo y describe una partcula con = 1.
El estado ms general es una combinacin lineal de estados separables, cosa que permite enormes simplificaciones. Por lo tanto, para una ( x, y, z, ) arbitraria tendremos

( x, y, z, ) = ( x, y, z, +1) ( ) + ( x, y, z, 1) ( )
143

(11.19)

11. El Spin
De todo esto podemos extraer una importante conclusin: las variables espaciales por un lado, y
la variable de spin por el otro, se pueden estudiar por separado y reunir en cualquier estadio del
proceso.

Los spinores y la teora del spin en forma matricial


Por dicho anteriormente podemos dejar de lado por el momento las variables de posicin y desarrollar una mecnica cuntica de spin para una partcula cuyo estado est determinado por una
funcin ( ) que depende solamente de la variable de spin. Esta teora es simple porque toma
solamente dos valores, pero muy til pues es el paradigma para la descripcin cuntica de cualquier sistema cuyos estados se pueden representar como la superposicin de un nmero finito de
estados independientes (dos en el caso del spin), y hay muchos problemas de la Mecnica Cuntica en los cuales un formalismo de dos estados es una buena aproximacin.
Para desarrollar esta teora es muy conveniente usar matrices. Para ello representaremos los estados especiales y como matrices de una columna:

1
0
,
0
1

(11.20)

c1
( +1)
( ) =
= ( +1) + ( 1) = = c1 + c2
( 1)
c2

(11.21)

y el estado general de spin ( ) como

En la (11.21) hemos puesto


c1 = ( +1) , c2 = ( 1)

(11.22)

donde c1, c2 son nmeros complejos, el cuadrado de cuyo mdulo representa la probabilidad de
encontrar la partcula con spin arriba y abajo, respectivamente. Por lo tanto la normalizacin de
( ) es

c1
| c1 |2 + | c2 |2 = (c1* , c2* ) = 1
c2

(11.23)

La matriz (11.21) de una columna y dos filas se denomina spinor6, y es un ente matemtico con
peculiares y bien definidas propiedades de transformacin bajo rotaciones. Se lo puede considerar como un vector de componentes complejas en un espacio vectorial lineal de dos dimensiones. Esta ltima denominacin no debe llevar a confusin ya que ( ) no es un vector en el espacio ordinario.
Si definimos el spinor adjunto de como

(c1* , c2* )

(11.24)

la (11.23) se puede escribir como


6

Los spinores fueron introducidos en 1912 por lie-Joseph Cartan al estudiar las representaciones del grupo de las

rotaciones.

144

11. El Spin

= 1

(11.25)

Dados dos spinores , , su producto escalar (complejo) se define como

c1
= (c1* , c2* ) = c1*c1 + c2*c2
c2

(11.26)

Dos spinores son ortogonales cuando su producto escalar es nulo. Por ejemplo y son dos
spinores ortonormales. Todo par de spinores ortonormales forma una base, en trminos de la
cual se puede representar cualquier otro spinor (ver la ec. (11.21)).
Hemos postulado que las magnitudes fsicas se representan mediante operadores lineales
Hermitianos. Consideremos primero los operadores lineales en general. Si F es un operador lineal, su efecto sobre cualquier spinor se puede definir en trminos de su efecto sobre los spinores bsicos y :
F = F11 + F12 , F = F21 + F22

Es inmediato verificar que los coeficientes Fij


efecto

(11.27)

(i, j = 1, 2) caracterizan por completo a F. En

= F = c1F + c2 F = c1 ( F11 + F12 ) + c2 ( F21 + F22 )


= d1 + d2

(11.28)

donde d1 y d2 son las componentes de .


La ec. (11.28) se puede escribir en forma matricial como

d1 F11
=
d2 F21

F12 c1

F22 c2

(11.29)

y por lo tanto F se representa mediante la ecuacin matricial (11.29). De aqu en ms usaremos


el mismo smbolo para designar el estado y el spinor que lo representa y tambin el mismo smbolo para designar la magnitud fsica y el operador y la matriz que la representan.
El operador adjunto o conjugado Hermitiano F del operador F se define como el operador
cuya matriz es la matriz transpuesta y conjugada de F:
F*
F = 11
*
F12

*
F21
*
F22

(11.30)

El valor esperado de F se define como

F11
F = F = (c1* , c2* )
F21

F12 c1

F22 c2

(11.31)

El valor esperado de una magnitud fsica F en cualquier estado debe ser real. Es fcil verificar
que la condicin necesaria y suficiente para que esto ocurra es que la matriz F sea Hermitiana.
Todos los resultados que ya conocemos para los operadores Hermitianos (Captulos 7 y 8) se
pueden trasladar las matrices Hermitianas, simplemente reemplazando la palabra operador por
145

11. El Spin
matriz. En efecto, dada una base en el espacio de los spinores, existe una correspondencia biunvoca entre los operadores lineales y las matrices de 2 2 . En realidad el presente formalismo
es ms simple que el de los Captulos 7 y 8 porque el nmero mximo de spinores linealmente
independientes es 2 y por lo tanto no surgen problemas con la completitud y por supuesto tampoco con el espectro continuo.

Spin y rotaciones
La primera magnitud fsica que vamos a considerar es el momento magntico intrnseco7 Ms , y
en particular su componente en la direccin del campo magntico B. Tomaremos el eje z en la
direccin de B y en consecuencia la componente z de Ms est representada por la matriz
Hermitiana

1 0
M s, z = B

0 1

(11.32)

puesto que sus autovalores son m B y sus autovectores son y . Nos preguntamos ahora cmo
se representan las dems componentes de Ms .
Para determinar las matrices Ms, x y Ms, y vamos a estipular que las tres componentes del valor
esperado Ms del momento magntico intrnseco se deben transformar por efecto de una rotacin
del mismo modo que las tres componentes de un vector.
Para imponer esta condicin debemos determinar primero cmo se transforma un spinor bajo
una rotacin. Consideremos una rotacin de un ngulo alrededor del eje n y sean

c1
c1
= , =
c2
c2

(11.33)

el spinor antes de la rotacin y el spinor rotado, respectivamente.


Claramente la relacin entre y debe ser lineal, para preservar la superposicin lineal de dos
estados, y por lo tanto estar representada por una matriz U:

= U

(11.34)

cuyos elementos dependen solamente de los parmetros de la rotacin, esto es y n.


Puesto que debe estar normalizado si lo est se debe cumplir que

= U U =

(11.35)

y como es arbitrario la (11.35) implica que


U U = 1

(11.36)

donde con 1 (en cursiva) indicamos la matriz identidad. Una matriz que cumple la (11.36) se
dice unitaria.
7

Procedemos as porque Ms es una magnitud que se puede medir directamente, cosa que no ocurre con el momento

angular intrnseco. Es mejor dejar para ms adelante la discusin de cmo se introduce en la teora el momento
angular intrnseco.

146

11. El Spin
De la (11.36) resulta que el determinante de una matriz unitaria es un nmero complejo de mdulo 1:
| det U |2 = 1

(11.36)

U 1 = U

(11.37)

y que la inversa de U es

en la cual
Se acostumbra decir que la matriz unitaria U, que corresponde a la rotacin (, n)
, representa dicha rotacin.
Si U1 representa una rotacin R1, y U2 representa una rotacin R2 , entonces la matriz U2U1 representa la rotacin que resulta de realizar primero R1 y luego R2 . Pero el mismo efecto se
puede obtener directamente efectuando una nica rotacin R3 , representada por U3 . Por lo tanto,
las matrices unitarias que representan rotaciones deben tener la propiedad grupal

U3 = ei U2U1

(11.38)

donde hemos introducido una fase arbitraria, dado que todos los spinores ei representan el
mismo estado.
Tal rotacin debe diferir muy poco de la
Consideremos ahora una rotacin infinitesimal (d, n).
matriz identidad. Por lo tanto hasta el orden d tendremos:

i
U R = 1 d n
2

(11.39)

donde con indicamos tres matrices Hermitianas constantes x , y , z , an no determinadas


(deben ser Hermitianas para que U R sea unitaria al primer orden en d ; en cuanto al factor 1/2,
lo hemos puesto por conveniencia).
Si conocemos estas tres matrices podemos construir U para cualquier rotacin finita por aplicacin sucesiva de muchas rotaciones infinitesimales, es decir por integracin de la (11.39). Efectivamente, gracias al Teorema de Euler (que establece que para cualquier rotacin dada en tres
dimensiones se puede siempre encontrar un eje fijo de modo que la rotacin se puede reducir a
una rotacin alrededor de dicho eje) es suficiente considerar rotaciones finitas alrededor de un
eje fijo ( n constante). Entonces la (11.39) se integra fcilmente y da
i

N
n
i

U R = lim N 1
n = e 2

2N

(11.40)

Para que la matriz (u operador) (11.40) represente una rotacin an falta satisfacer la condicin
(11.38), que impone fuertes restricciones sobre la forma de las matrices x , y , z an desconocidas. Pero en vez de proceder directamente elaborando dicha condicin, es mejor seguir una
va alternativa que nos llevar al mismo resultado, y se basa en estudiar las propiedades de transformacin bajo rotaciones de un operador vectorial, esto es, un operador A tal que
A = x Ax + y Ay + z Ay se transforma como un vector ordinario.
Es importante observar que es un operador vectorial. En efecto, para una rotacin infinitesimal tenemos que
147

11. El Spin
i
= 1 d n

(11.41)

Si tomamos el producto escalar de la (11.41) por resulta

i
i
= dn = d n
2
2

(11.42)

donde el valor esperado de se toma respecto del estado . Consideremos ahora el efecto de
realizar una rotacin finita arbitraria de y . Los productos escalares y son invariantes bajo la transformacin unitaria que representa esta rotacin. Por lo tanto el producto escalar n es tambin invariante ante rotaciones. Puesto que n es un vector, eso significa que
tambin es un vector y por lo tanto es un operador vectorial.
Un operador vectorial A debe satisfacer ciertas relaciones matemticas que vamos a obtener
ahora mismo. Una rotacin R se representa en el espacio ordinario por medio de una matriz ortogonal

Rxx
R = Ryx

R
zx

Rxy
Ryy
Rzy

Rxz
Ryz

Rzz

(11.43)

Bajo la misma rotacin, los spinores se transforman mediante la correspondiente matriz unitaria
U R , esto es

= UR

(11.44)

A = U R AU R = R A

(11.45)

Por lo tanto se debe cumplir que

Esto es:

U R AxU R Rxx
U A U = R
R y R
yx

U A U R

zx
R z R

Rxy
Ryy
Rzy

Rxz Ax
Ryz Ay

Rzz Az

(11.46)

de donde obtenemos

(U R AxU R ) = ( Rxx Ax + Rxy Ay + Rxz Az )


y ecuaciones semejantes para (U R AyU R )
resulta finalmente

(11.47)

(U R AzU R ) . Puesto que es arbitrario,

U R AxU R = Rxx Ax + Rxy Ay + Rxz Az


U R AyU R = Ryx Ax + Ryy Ay + Ryz Az
U R AzU R = Rzx Ax + Rzy Ay + Rzz Az
148

(11.48)

11. El Spin
Las (11.48) valen para cualquier rotacin. Consideremos ahora una rotacin infinitesimal de un
ngulo alrededor del eje z, para la cual

1
1
R =

0
0

0
0

i
, U R = 1 z
2

(11.49)

Si sustituimos (11.49) en (11.48) vemos que las componentes de un operador vectorial deben
satisfacer las siguientes condiciones necesarias:

z Ax Ax z = 2iAy
z Ay Ay z = 2iAx

(11.50)

z Az Az z = 0
Del mismo modo, considerando rotaciones infinitesimales alrededor del eje x y del eje y obtenemos las condiciones:

x Ay Ay x = 2iAz
x Az Az x = 2iAy

(11.51)

x Ax Ax x = 0
y

y Az Az y = 2iAx
y Ax Ax y = 2iAz

(11.52)

y Ay Ay y = 0
En particular, como mismo es un operador vectorial, poniendo A en las (11.50)-(11.52)
obtenemos las siguientes relaciones de conmutacin entre las matrices x , y , z :

x y y x = 2i z
y z z y = 2i x

(11.53)

z x x z = 2i y
Estas relaciones se suelen escribir en forma compacta como

= 2i

(11.54)

Las relaciones fundamentales (11.53) son las condiciones que deben cumplir las matrices x ,
y , z , para que matrices del tipo
UR = e

i
n
2

(11.55)

representen rotaciones. Se puede mostrar que estas condiciones son necesarias y suficientes.

149

11. El Spin
Es importante destacar que, en realidad, los argumentos que presentamos en esta discusin de las
rotaciones (desde la ec. (11.34) en adelante) no dependen de la dimensionalidad de las matrices
, , y U R . Es decir, valen tambin si y son matrices de n filas y una columna y entonces y U R son matrices de n n . Por lo tanto nuestros resultados son generales y valen para
todos los operadores de momento angular.

Las matrices de Pauli


Nos restringimos ahora al caso n = 2 y nos ocuparemos de determinar las matrices Hermitianas
x , y , z de 2 2 que satisfacen las relaciones de conmutacin (11.53).
Claramente, z est determinada en gran medida por nuestra eleccin de los spinores bsicos
y . En efecto, corresponde a spin arriba y describe una partcula con un valor definido
= 1 (es decir Ms, B = B ) y corresponde a spin abajo y describe una partcula con = 1
(o sea Ms, B = + B ). Por lo tanto en un estado cualquiera

c1
=
c2

(11.56)

| c1 |2 y | c1 |2 son las probabilidades de encontrar spin arriba y spin abajo, respectivamente.


Es obvio que una rotacin alrededor del eje z (que por convencin hamos tomado en la direccin
del campo magntico) no tiene ningn efecto sobre estas probabilidades. Por lo tanto si realizamos una rotacin infinitesimal de un ngulo alrededor del eje z, | c1 |2 y | c1 |2 no deben cambiar. Eso significa que
i
U R = 1 z
2

(11.57)

es una matriz diagonal, luego tambin z es diagonal. Adems, si tomamos la traza de la primera de las (11.53) obtenemos
Tr( z ) = 0

(11.58)

puesto que Tr( AB) = Tr( BA) . Por consiguiente z tiene la forma

z =
, ( real)
0

(11.59)

Para determinar x , y y el valor de conviene definir las matrices auxiliares no Hermitianas

+ = x + i y , = x i y = +

(11.60)

Se verifica fcilmente que estas matrices cumplen las siguientes reglas de conmutacin

[ z , + ] = 2 +
[ z , ] = 2
[ + , ] = 4 z
Ahora ponemos

150

(11.61)

11. El Spin

a b
+ =

c d

(11.62)

con a, b, c, d a determinar, y sustituimos (11.59) y (11.62) en la primera de las (11.61). Resulta:

2b
0
a b

= 2
c d
2c 0

(11.63)

Por lo tanto debe ser a = d = 0, ( 1)b = 0 y ( + 1)c = 0 .


De estas ecuaciones inferimos que puede valer +1 1. La eleccin es arbitraria pues el otro
valor est presente en la (11.59). Elegimos entonces = +1 y por lo tanto resulta c = 0 . Obtenemos as

0 b
0 0

+ =
, = + = *

0 0
b 0

(11.64)

Por ltimo, sustituyendo estas matrices en la ltima de las (11.61) encontramos que | b |2 = 4 . La
fase de b no se puede inferir de las relaciones de conmutacin fundamentales (11.53) y por consiguiente es arbitraria. Elegimos entonces b = 2 y de esta forma llegamos al resultado final:

0 1
0 i
1 0
x =
, y =
, z =

1 0
i 0
0 1

(11.65)

Las (11.65) son las matrices de spin de Pauli. Estn completamente determinadas (a menos del
orden de filas y columnas, que corresponde a la eleccin entre = +1 y = 1, y a menos de la
fase de b) por las relaciones de conmutacin (11.53) y por nuestra eleccin de los autospinores
y de z como spinores bsicos.
Es fcil verificar (lo dejemos como ejercicio) las siguientes propiedades de las matrices de Pauli:

x y = i z

x2 = y2 = z2 = 1
, y z = i x , z x = i y

(11.66)

Vemos entonces que las matrices de Pauli adems de Hermitianas son tambin unitarias y que
tienen traza nula (por las (11.65)). Asimismo, cualquier par de matrices de Pauli diferentes anticonmutan, por ejemplo

x y + y x = 0

(11.67)

Adems las cuatro matrices 1, x , y , z son linealmente independientes, y por lo tanto cualquier matriz A de 2 2 se puede expresar como

A = 0 1 + x x + y y + z z = 0 1 +

(11.68)

Si A es Hermitiana, todos los coeficientes deben ser reales. Si U es unitaria, se puede mostrar
(con un poco de paciencia) a partir de la (11.68) que se la puede expresar siempre en la forma

U = ei (1 cos + in sen )
151

(11.69)

11. El Spin
donde y son ngulos reales y n es un versor. Se puede tambin mostrar que la (11.69) se
puede escribir en la forma
U = ei + i n

(11.70)

Cualquier matriz unitaria de 2 2 se puede escribir de esta forma. Comparando estas expresiones con la (11.40) vemos que cualquier matriz unitaria de la forma (11.69) u (11.70) con = 0
Para = 0 se tiene detU = 1
representa una rotacin de un ngulo = 2 alrededor del eje n.
y se dice que U es unimodular. El conjunto de todas las matrices unitarias y unimodulares de
2 2 constituye el grupo SU(2).
Usando la (11.69), la matriz (11.40) que representa una rotacin se puede escribir en la forma

UR =

i
n
2
e

= 1 cos in sen
2
2

(11.71)

Una consecuencia inmediata de la (11.71) es que para una rotacin de 2 se obtiene U = 1, es


decir, una rotacin de 360 alrededor de cualquier eje cambia el signo de todas las componentes
de un spinor, a diferencia de lo que ocurre con los vectores (y tensores en general) que vuelven a
sus valores originales al dar una vuelta completa. Debe notarse que esta propiedad no afecta los
valores esperados ni los elementos de matriz pues stos dependen cuadrticamente de los spinores. Para comparar el diferente comportamiento de spinores y vectores bajo rotaciones consideremos por ejemplo lo que ocurre para una rotacin de un ngulo alrededor del eje x: para un
spinor se tiene de (11.71), (11.45) y (11.34):

c1 = c1 cos ic2sen
2
2

c2 = ic1sen + c2 cos
2
2

(11.72)

mientras que para un vector se tiene

Ax = Ax
Ay = Ay cos Azsen
Az = Aysen + Az cos

(11.73)

Hemos visto previamente que es un operador vectorial. Se puede mostrar que en el espacio de
los spinores es el nico operador vectorial, a menos de un factor constante. En efecto, tomando la traza de las (11.50)-(11.52) se verifica que la traza de todas las componentes de un
operador vectorial cualquiera A es nula. A partir de ah se encuentra que
A = k , k = cte.

(11.74)

Operadores de momento magntico y momento angular intrnseco


Puesto que el operador vectorial es esencialmente nico, a partir de la (11.32) concluimos que
el momento magntico intrnseco est dado por

152

11. El Spin

Ms = B

(11.75)

Hasta ahora no hemos hablado todava del momento angular intrnseco, que tambin fue postulado por Uhlenbeck y Goudsmit. Esto se debe a que, a diferencia del momento magntico, no es
una magnitud que se pueda medir en forma directa con facilidad, y no quisimos entrar en el detalle de los argumentos originales de Uhlenbeck y Goudsmit, pues se fundan en aspectos de la
teora de los espectros atmicos que no hemos estudiado. Pero con base a lo que ya vimos, podemos presentar dos argumentos que muestran que el electrn debe poseer un momento angular
intrnseco:
Tiene un momento magntico, y si este momento magntico proviene de alguna clase de corriente interna debida a la circulacin de materia cargada, entonces cabe esperar que junto
con el momento magntico exista tambin un momento angular.
Si el electrn que se mueve alrededor del ncleo tiene un momento magntico, no se puede
conservar el momento angular, a menos que posea un momento angular intrnseco adems
del momento angular orbital.
Veamos ms en detalle el segundo de estos argumentos. Un momento magntico que se mueve
en un campo elctrico experimenta una fuerza que deriva de una energa potencial dada por

v
V = Ms E
c

(11.76)

Para un campo central, E = f (r )r , y entonces V es proporcional a Ms v r o, lo que es equivalente, a

V Ms r p = Ms L = B L

(11.77)

en virtud de la (11.75). El factor de proporcionalidad depende solamente de la coordenada radial


r. De resultas de esto, adems del potencial central, aparece en el Hamiltoniano un trmino de
interaccin proporcional a Ms L , que implica que la energa del electrn depende de la orientacin relativa del momento magntico y del momento angular orbital L. Es evidente entonces que
L, cuyas componentes no conmutan entre s, no es una constante del movimiento. Por lo tanto el
momento angular no se conservar, a menos que el electrn participe en el balance del momento
angular en virtud de un momento angular intrnseco asociado con Ms.
Un trmino del Hamiltoniano proporcional a L se suele llamar interaccin spin-rbita, y
como dijimos al comienzo del Captulo, esta clase de interaccin aparece en los tomos como
una correccin magntica y relativstica al potencial electrosttico central. En los ncleos aparece tambin una interaccin spin-rbita, pero su origen es distinto que en el tomo, pues proviene de la interaccin fuerte entre los nucleones y tiene por consiguiente efectos muy importantes.
Veamos ahora cmo debe ser el momento angular intrnseco para que haya conservacin del
momento angular en presencia de la interaccin spin-rbita. Puesto que sabemos que L no es
constante del movimiento, procuraremos definir el momento angular intrnseco S de modo tal
que el momento angular total
J = L+S

153

(11.78)

11. El Spin
sea una constante del movimiento.
Dado que S debe ser un operador vectorial, tiene que ser proporcional a . Ponemos entonces
S = a

(11.79)

Para entender como opera J, recordamos que la funcin de onda del electrn es un spinor de la
forma

1 ( x, y, z )
=

2 ( x, y, z )

(11.80)

y en consecuencia la (11.78) significa que


J = L 1 + a

(11.81)

Por lo tanto el operador L acta slo sobre las coordenadas x, y, z mientras que acopla las dos
componentes del spinor. Claramente L y conmutan.
Determinamos ahora a requiriendo que J conmute con L , lo cual asegura que sea una constante del movimiento. Por ejemplo, para la componente z tenemos

[ L, Jz ] = x [ Lx , Lz ] + y [ Ly , Lz ] + a[ x , z ]Lx + a[ y , z ]Ly
= ih x Ly + ih y Lx 2ia y Lx + 2ia x Ly

(11.82)

= i(2 a h)( x Ly y Lx ) = 0
Por consiguiente debemos tener a = h / 2 , lo que nos da

S=

(11.83)

Por lo tanto, como ya anticipamos al comienzo de este Captulo, cualquier componente del momento angular intrnseco tiene los dos autovalores

ms h , ms = s = 1 / 2

(11.84)

El mximo valor de una componente del spin S es s = 1/2 (en unidades de h ), y por eso se dice
que el electrn tiene spin 1/2.
Usando la primera de las (11.66) obtenemos tambin que
S2 =

h2
3h 2
= s(s + 1)h 2 1 =
1
4
4

(11.85)

y por lo tanto cualquier spinor es autospinor de S 2 con autovalor 3h 2 / 4


A partir de las relaciones de conmutacin de la matrices de Pauli es inmediato verificar que las
componentes de S cumplen las relaciones de conmutacin

154

11. El Spin

Sx Sy Sy Sx = ihSz
Sy Sz Sz Sy = ihSx

(11.86)

Sz Sx Sx Sz = ihSy
y que las relaciones de conmutacin entre las componentes del momento angular total J son

J x J y J y J x = ihJz
J y Jz Jz J y = ihJ x

(11.87)

Jz J x J x Jz = ihJ y
Tanto las (11.86) como las (11.87) son idnticas a las relaciones de conmutacin (10.4) del momento angular orbital L. En general el operador que representa el momento angular de cualquier sistema cuntico satisface reglas de conmutacin de la forma (11.87).
El operador unitario que transforma la de un electrn con spin bajo una rotacin infinitesimal
est dado por

i
U R = 1 n i n L = 1 i n S i n L = 1 i n J
2

(11.88)

donde hemos usado la (10.24) y la (11.39). La (11.88) muestra que cuando se toma en cuenta el
spin, el generador de rotaciones infinitesimales es el momento angular total J, y la conservacin
del momento angular (total) es simplemente una consecuencia de la invariancia del Hamiltoniano bajo rotaciones.
Para una rotacin finita tendremos

U R = e i n J

(11.89)

Para cualquier sistema cuntico el operador momento angular J es por definicin el generador de
rotaciones infinitesimales y toda rotacin finita se puede expresar de la forma (11.89).

155

12. tomos con varios electrones

12. TOMOS CON


TABLA PERIDICA

VARIOS ELECTRONES, EL

P RINCIPIO

DE

E XCLUSIN

Y LA

En el Captulo 10 estudiamos los tomos con un solo electrn, y vimos que con la introduccin
del spin (Captulo 11) la Mecnica Cuntica proporciona una teora perfectamente satisfactoria,
si se toman en cuenta todas las correcciones (que nosotros no hemos desarrollado en sus detalles
por razones de brevedad, pero que el lector puede encontrar tratadas en extenso en la bibliografa). Ahora queremos ver, al menos en forma cualitativa, cmo se puede aplicar la Mecnica
Cuntica a los tomos con varios electrones. En particular, nos gustara entender en trminos generales los esquemas de niveles de energa de tomos ms complicados y explicar, por ejemplo,
la tabla peridica de los elementos, la existencia de elementos qumicamente inertes como los
gases nobles, etc.. Veremos que la Mecnica Cuntica, tal como la desarrollamos hasta aqu, no
es todava suficiente para esos fines, y que es necesario introducir un postulado adicional: el
principio de exclusin de Pauli.

Descripcin de un tomo con varios electrones


Consideremos los estados estacionarios de un tomo con N electrones. La correspondiente funcin de onda es solucin de la ecuacin de Schrdinger independiente del tiempo, que en primera aproximacin, despreciando el efecto spin-rbita y otras interacciones magnticas se puede
escribir como:

H N

N
N p 2 Ze2
e2
= i
+
ri i, j =1 ri rj
i =1 2
i> j

N = E N

(12.1)

Aqu ri y pi son la posicin y la cantidad de movimiento del i-simo electrn y Ze es la carga


del ncleo. Cabe observar que N depende de las 3N variables de posicin y N variables de
spin del conjunto de los electrones.
Este problema es el anlogo cuntico del problema de muchos cuerpos de la Mecnica clsica, e
igual que ste, no tiene solucin en forma cerrada, ni siquiera para N = 2 . Si bien en principio se
puede resolver numricamente la (12.1), tal proceder tendra poca utilidad pues sera difcil, o
imposible, interpretar el significado de los resultados que se obtuvieran, como as calcular otras
propiedades del tomo, adems de los niveles de energa. En casos complicados como ste, es
preferible formular un modelo aproximado, que retenga la esencia del problema exacto, pero que
al mismo tiempo permita entender la naturaleza fsica de la solucin y estudiar la influencia de
los diversos parmetros. Como no existe una solucin exacta en forma cerrada, la confianza que
el modelo es correcto se funda sobre el xito que tenga en predecir con razonable exactitud las
magnitudes fsicas de inters.
La complicacin de la (12.1) proviene de la repulsin electrosttica entre los electrones

e2

i, j =1 | ri rj |
N

i> j

debido a que cada trmino de la (12.2) depende de las coordenadas de dos partculas.

156

(12.2)

12. tomos con varios electrones


Si no existieran esos trminos, la (12.1) sera la ecuacin de Schrdinger para N electrones, cada
uno de los cuales se mueve en el campo producido por la carga nuclear Ze, sin interactuar con
los dems. Este problema ms simple es separable, y cada electrn se puede describir por medio
de una funcin de onda del tipo estudiado en el Captulo 10, con el agregado de la variable de
spin. La funcin de onda total N se puede expresar entonces en trminos del producto de las
funciones de onda de los electrones individuales, y la energa total es la suma de las energas de
cada uno de ellos, con lo que el problema queda resuelto.
Esta observacin sugiere el programa a seguir para desarrollar nuestro modelo: tenemos que procurar aproximar la expresin (12.2) para transformarla en una suma, cada uno de cuyos trminos
sea funcin de las coordenadas de un slo electrn, esto es, reemplazar
N

e2

i, j =1 | ri rj |

por

Vi(ri )

(12.3)

i =1

i> j

donde cada Vi(ri ) es un potencial central1 que representa en forma aproximada el efecto sobre el
i-simo electrn de la repulsin que ejercen sobre l los N 1 electrones restantes. Con esta
aproximacin tenemos que
N

H Hi
i =1

con

Hi =

Ze2
pi2
Vi (ri ) , Vi (ri ) =
+ Vi(ri )
ri
2

(12.4)

y entonces la ecuacin de Schrdinger (aproximada) independiente del tiempo es


N
Hi N = E N
i =1

(12.5)

La (12.5) admite soluciones separables de la forma

N ( r1, r2 ,, rN ) = k1 ( r1 ) k2 ( r2 ) ki ( ri ) k N ( rN )

(12.6)

correspondientes al autovalor

E = Ek1 + Ek2 + + Eki + + Ek N

(12.7)

donde las ki (ri ) son soluciones de las ecuaciones

p2

Hi ki ( ri ) = i Vi (ri ) ki ( ri ) = Eki ki ( ri ) , i = 1, , N
2

(12.8)

Esta suposicin involucra dos aproximaciones. La primera consiste en reemplazar la interaccin sobre el i-simo

electrn debida a los dems electrones por el campo elctrico debido a la distribucin media de carga de los
mismos. La segunda estriba en suponer que dicha distribucin media de carga tiene simetra esfrica. Es verdad que
la distribucin de carga de un electrn en un estado s es esfricamente simtrica, y tambin es cierto que lo es la que
proviene de una subcapa (n, l) llena. Pero cuando hay subcapas parcialmente llenas, la correspondiente distribucin
media de carga no es simtrica. Por lo tanto la segunda aproximacin implica reemplazar estas distribuciones de
carga no simtricas por un promedio sobre todas las direcciones.

157

12. tomos con varios electrones


En la (12.6) y la (12.8) hemos omitido escribir en las ki la variable de spin, que daremos por
sobreentendida en lo que sigue, cuando corresponda. Cada una de las (12.8) es la ecuacin de
Schrdinger independiente del tiempo para una nica partcula en un campo de fuerzas centrales
dado por Vi (ri ) . Se puede notar que las ecuaciones (12.8) no cambian si se permutan entre s las
variables ri ( i = 1, 2, , N ). Por lo tanto podemos omitir los subndices de las variables y escribir

p2
Hi k i ( r ) =
Vi (r ) ki ( r ) = Eki ki ( r ) , i = 1, , N
2

(12.9)

Por lo que vimos en los Captulos 10 y 11, las soluciones de las (12.9) se pueden escribir como

ki ( r , ) = nlml ms ( r , ) = R i, nl (r )Ylml ( , ) ms ( )

(12.10)

donde las R i, nl (r ) son las soluciones de las ecuaciones radiales apropiadas y es la variable de
spin. Por lo tanto el estado de cada electrn queda especificado por los cuatro nmeros cunticos
n, l, ml , ms y el conjunto de N de tales cuaternas (que indicamos con k), una para cada electrn,
especifica el estado del tomo. Claramente, esta promete ser una manera sencilla de atacar el
problema, y vale la pena examinar si se puede llevar adelante nuestro programa de manera razonable.
Conviene ahora detenerse un momento para analizar el significado de lo que estamos haciendo y
hacer varias aclaraciones. En primer lugar es importante observar que (habiendo despreciado los
efectos de spin) la energa Eki de cada electrn depende solamente de los nmeros cunticos n y
l, y no de ml y ms . Cada par de valores (n, l) define lo que se denomina una subcapa del tomo,
la cual se designa por medio de un nmero (que es el valor de n) seguido de una letra (s, p, d, f,
, de acuerdo con el valor 0, 1, 2, 3, de l). As, por ejemplo, 3d designa la subcapa n = 3,
l = 2 . Por lo dicho, la energa de cada electrn es la misma para todos los 2(2l + 1) estados de
cada subcapa y por consiguiente la energa total del tomo est determinada si se conoce cuntos
electrones hay en cada subcapa. Esto es lo que se denomina la configuracin del estado atmico
que estamos considerando. La configuracin se indica nombrando las subcapas ocupadas e indicando el nmero de electrones que reside en cada una de ellas por medio de un suprandice. Por
ejemplo 1s22s22p designa una configuracin en la cual hay dos electrones en la subcapa 1s, dos
en la 2s y uno en la 2p, y para esta configuracin la energa total del tomo es entonces
E = 2 E1s + 2 E2 s + E2 p . Debe quedar claro que cada configuracin comprende varios estados
diferentes N de la forma (12.6), todos los cuales tienen la misma energa, y que corresponden
a los distintos valores que pueden tener los nmeros cunticos ml y ms de cada electrn.
Tambin debemos notar que los Vi , y por lo tanto los Vi que figuran en las (12.9) dependen de
la configuracin, porque el efecto sobre el i-simo electrn de la repulsin de los dems electrones depende de en qu subcapas residen stos. Adems, todos los Vi estn ligados entre s, pues
la distribucin de carga de cada electrn deriva del respectivo R i, nl (r ) y contribuye a determinar
la de los dems.
Hasta ahora no hemos dicho nada acerca de como calcular los Vi y por lo tanto como obtener las
autofunciones ki y los autovalores Eki . Eso lo veremos ms adelante. Pero debe quedar claro
que tanto la forma de las ki como los valores de los Eki dependen de la configuracin que estamos considerando, dado que sta determina el conjunto de los Vi que se deben emplear en las

158

12. tomos con varios electrones


(12.9). Si se cambia la configuracin es preciso entonces calcular de nuevo todas las ki y los
Eki . Por ejemplo, la energa de un electrn 1s no es la misma en la configuracin 1s22s22p que
en la 1s22s2p2 y las correspondientes funciones de onda, si bien son ambas 1s, son distintas.
Asimismo, debemos destacar que las diferentes ki que se obtienen resolviendo las (12.9) no
son ortogonales, puesto que son autofunciones de diferentes Hamiltonianos.
Por ltimo es importante aclarar que cada uno de los estados N de la forma (12.6) pertenecientes a una dada configuracin tiene una degeneracin adicional. En efecto, si indicamos con
P ( r1, r2 ,, rN ) una permutacin de los argumentos de N , la funcin

PN ( r1, r2 ,, rN ) = n (P ( r1, r2 ,, rN ))

(12.11)

es tambin una solucin de (12.5), correspondiente al mismo autovalor E (un ejemplo podra ser
la funcin N ( r1, r2 ,, rN ) = k1 ( r2 ) k2 ( r1 ) k j ( ri ) k N ( rN ) , obtenida a partir de N por la
transposicin de los argumentos r1 y r2 ). Por consiguiente, todas las N! funciones PN , obtenidas a partir de la (12.6) permutando sus N argumentos de todas las maneras posibles, son soluciones de la (12.5) correspondiente al mismo autovalor. Tendramos entonces N! autofunciones
degeneradas de H correspondientes al autovalor E. Por lo que sabemos hasta ahora, cualquier
combinacin lineal de ellas podra describir un posible estado del sistema. Veremos, sin embargo, que debido a que los electrones no se pueden distinguir el uno del otro, tan slo una particular combinacin lineal entre todas es admisible. En el resto de este Captulo no intentaremos
escribir la N , dado que podemos avanzar sin necesidad de hacerlo, y recin en el Captulo 13
volveremos sobre este asunto.

El mtodo del campo autoconsistente


Por el momento concentraremos nuestra atencin sobre la dependencia de las funciones de onda
k de un electrn en las variables espaciales, que es la que determina la distribucin en el espacio de la carga elctrica del tomo (y por lo tanto la repulsin Coulombiana entre los electrones).
Para ver como se puede llevar adelante nuestro programa, consideremos un problema concreto.
Imaginemos el estado fundamental de un tomo de helio ionizado, en el cual el nico electrn
tiene una funcin de onda 1s dada por la ec. (10.138) con Z = 2 , cuya parte espacial es

1, 0, 0 = Ae 2 r1 / a0

, A = cte.

(12.12)

donde a0 es el radio de Bohr. Supongamos ahora que el ion captura otro electrn, en un estado
dbilmente ligado de momento angular grande, por ejemplo 3d. Debido a que su momento angular es grande, este electrn tiene una probabilidad despreciable de encontrarse cerca del ncleo, lo cual implica dos cosas:
puesto que el segundo electrn est casi siempre lejos del ncleo y fuera de la regin donde
se puede encontrar el primer electrn con una probabilidad apreciablemente diferente de
cero, se mueve esencialmente en el campo Coulombiano de una nica carga (la carga nuclear apantallada por el primer electrn). Por lo tanto, la parte espacial de su funcin de onda
debe ser muy semejante a la correspondiente funcin hidrogenoide n,l, ml ( r2 ) calculada
ahora con Z = 1;
puesto que el segundo electrn no se acerca a la regin ocupada por el primer electrn, su
presencia perturba muy poco la funcin de onda de este ltimo, la cual entonces difiere muy
poco de la (12.12).
159

12. tomos con varios electrones


Por lo tanto es razonable suponer que con buena aproximacin las funciones de onda del primer
y segundo electrn sean, respectivamente,

1,1s 1, 0, 0 , 2 ,( n,l, ml ) n,l, ml

(12.13)

Para llegar a este resultado, lo que en realidad hicimos fue sustituir la interaccin entre los electrones (dada por los trminos (12.2)) por el potencial elctrico debido a la distribucin de carga
dada por la funcin de onda del otro electrn. Adems, como el segundo electrn est siempre
lejos, hemos supuesto que la carga del primer electrn est concentrada en el origen.
Esto sugiere que se puedan obtener soluciones bastante aproximadas de la (12.1) para cada configuracin de inters sustituyendo los trminos de repulsin entre los electrones por una serie de
potenciales Vi (r ) , uno para cada electrn, calculados a partir de la distribucin de carga que resulta de las funciones de onda de los dems electrones. Claramente, el mtodo de solucin debe
ser iterativo. Se comienza con una hiptesis acerca del potencial que siente cada electrn, como
hicimos recin en el ejemplo del tomo de helio excitado. A partir de esos potenciales obtenemos las funciones de onda de cada electrn resolviendo las N ecuaciones de Schrdinger independientes del tiempo (12.9). A continuacin calculamos un nuevo potencial para cada electrn
a partir de la carga nuclear, ms la distribucin de carga que resulta de las funciones de onda de
los dems electrones que se acaban de calcular. Con estos nuevos potenciales calculamos nuevas
funciones de onda, y as seguimos realizando sucesivas iteraciones. Siempre y cuando nuestro
punto de partida no haya sido muy errado, despus de varias iteraciones encontraremos que el
proceso converge, y las nuevas funciones de onda reproducen las distribuciones de carga a partir
de la cual fueron calculadas. Esta es la esencia del mtodo del campo autoconsistente, o mtodo
de Hartree, que fue introducido por Douglas Hartree en 1928.
En la prctica resulta que el mtodo del campo autoconsistente es una aproximacin de gran valor, pues permite atribuir una funcin de onda a cada electrn y por lo tanto describir un tomo
dando los nmeros cunticos de las funciones de onda de cada uno de sus electrones. Adems,
estas funciones de onda no difieren mucho de las funciones de onda de tomos hidrogenoides.
La parte angular es, naturalmente, la misma, porque no depende de la forma del potencial (siempre que ste sea central). En cuanto a la parte radial, para un dado n (que determina el nmero de
nodos de R i, nl (r ) ), es cualitativamente parecida a la de un tomo hidrogenoide.
En resumidas cuentas, podemos concluir lo siguiente:
En un tomo con varios electrones la interaccin de un dado electrn con los dems se puede
sustituir, con buena aproximacin, por el potencial Vi(r ) que resulta de la distribucin media
de carga de los dems electrones.
Se puede considerar entonces que cada electrn se mueve independientemente en el potencial Vi (r ) que resulta de la carga nuclear ms la que se debe a los dems electrones, y que se
suele llamar potencial Coulombiano apantallado.
Los niveles de energa del tomo se pueden determinar a partir del conjunto de nmeros
cunticos (n, l) de las N funciones de onda individuales de cada electrn. Este conjunto
constituye lo que se llama la configuracin electrnica del tomo.
Las funciones de onda individuales de cada electrn no son muy diferentes de las funciones
de onda hidrogenoides correspondientes a los mismos (n, l).
Esperamos que el modelo aproximado que hemos esbozado describa razonablemente bien las
propiedades de los tomos con varios electrones. Una de las razones para esperar que el modelo

160

12. tomos con varios electrones


funcione es que la interaccin entre los electrones es una funcin que vara lentamente con la
distancia y por lo tanto al sustituir la interaccin real por un promedio no se est cometiendo un
error demasiado grande. Veremos, sin embargo, que el modelo del tomo, como lo desarrollamos hasta aqu, ni por asomo puede reproducir las caractersticas que se observan en la tabla peridica. Para resolver la dificultad es necesario introducir un nuevo postulado en la teora.

Propiedades de los elementos


La caracterstica ms notable del conjunto de los elementos qumicos es que se pueden ordenar
en la forma de una tabla peridica, lo cual como ya se dijo en el Captulo 3 fue hecho por primera vez en 1869 por Dmitri Mendeleev. Existen diferentes versiones o maneras de presentar la
tabla peridica, una de las cuales se muestra en la Fig. 12.1. Cuando los elementos se ordenan en
la tabla de izquierda a derecha y de arriba abajo por orden de nmero atmico (Z) creciente, se
observa que los elementos que pertenecen a la misma columna (o grupo) tienen propiedades
qumicas semejantes, pero hay una rpida variacin de propiedades a medida que se recorren las
filas (perodos y series) de la tabla. As, todos los elementos del Grupo I (primera columna) son
monovalentes, los del Grupo II son bivalentes, y los del Grupo 0 (ltima columna) son gases nobles, qumicamente inertes.
Ahora bien, segn la teora que hemos esbozado, el estado fundamental de cada tomo es aqul
en que cada electrn est en el estado de menor energa en el campo elctrico producido por la
carga nuclear y la distribucin de carga de los dems electrones. Por otra parte, el estado ms
bajo de cualquier potencial es siempre un estado s, y por consiguiente las funciones de onda de
cada electrn sern todas iguales. En efecto, si las funciones de onda de todos los electrones son
idnticas, los potenciales en que se mueve cada electrn son idnticos, y por lo tanto dan lugar a
funciones de onda idnticas respetando la autoconsistencia. Por lo tanto la configuracin del estado fundamental de un tomo con N electrones sera 1sN, en la cual todos los electrones tendran
funciones de onda idnticas, iguales a la funcin del estado s de ms baja energa que se puede
presentar en el campo producido por el ncleo y por los dems electrones.
De ser cierta la anterior conclusin resulta lgico pensar que, al pasar de un elemento al siguiente, la naturaleza de esa funcin de onda cambiar muy poco, ya que sigue siendo del
mismo tipo, y el agregado de una carga nuclear y un nuevo electrn no implica una variacin
sustancial del potencial. Por lo tanto, si bien se puede imaginar que haya cierta variacin de las
propiedades qumicas entre los primeros elementos, a medida que Z aumenta los cambios deberan ser cada vez ms pequeos.
Por lo tanto salta a la vista de inmediato que el modelo, as como est, no podr nunca reproducir las caractersticas regulares y repetitivas de la tabla peridica, como ser la recurrencia de los
metales alcalinos y de los gases nobles, y el aumento constante de la valencia al atravesar un perodo. Por lo tanto no sirve para explicar las caractersticas ms evidentes de la qumica de los
elementos.
Podemos tener indicios sobre la causa de las fallas del modelo si examinamos las primeras energas de ionizacin Ei de los tomos (Fig. 12.2), que dan la diferencia de energa entre el estado
fundamental del tomo neutro y el estado fundamental del tomo ionizado una vez (es decir, que
ha perdido un electrn).

161

12. tomos con varios electrones


Grupo

II

III

IV

VI

VII

VIII

Perodo Serie
1

1
1H

7
3 Li

9
4 Be

23
11 Na

4
2 He
11
5B

12
6C

14
7N

16
8O

19
9F

20
10 Ne

24
27
12 Mg 13 Al

28
14 Si

31
15 P

32
16 S

35
17 Cl

40
18 A

72
19 K

72
20 Ca

72
21 Sc

72
22 Ti

72
23 V

72
24 Cr

72
72
25 Mn 26 Fe

64
29 Cu

65
30 Zn

70
31 Ga

72
73 Ge

75
33 As

79
34 Se

80
35 Br

85
37 Rb

88
38 Sr

89
39 Y

91
40 Zr

93
41 Nb

96
99
101
103
106
42 Mo 43 Tc 44 Ru 45 Rh 46 Pd

72
27 Co

108
112
115
47 Ag 48 Cd 49 In

119
122
128
127
50 Sn 51 Sb 52 Te 53 I

133
137
55 Cs 56 Ba

178
181
184
186
190
192
72 Hf 73 Ta 74 W 75 Re 76 Os 77 Ir

197
201
204
79 Au 80 Hg 81 Tl

10

223
87 Fr

226
88 Ra

57-71

72
28 Ni
84
36 Kr

131
54 Xe
195
78 Pt

207
209
210
210
82 Pb 83 Bi 84 Po 85 At

222
86 Rn

89-103 261
262
266
264
269
268
271
104 Rf 105 Db 106 Sg 107 Bh 108 Hs 109 Mt 110 --

**

* Lantnidos:
139
140
141
57 La 58 Ce 59 Pr

144
145
150
152
157
159
162
165
167
169
173
175
60 Nd 61 Pm 62 Sm 63 Eu 64 Gd 65 Tb 66 Dy 67 Ho 68 Er 69 Tm 70 Yb 71 Lu

** Actnidos:
227
232
231
238
89 Ac 90 Th 91 Pa 92 U

237
244
243
247
247
251
252
257
258
259
262
93 Np 94 Pu 95 Am 96 Cm 97 Bk 98 Cf 99 Es 100 Fm 101 Md 102 No 103 Lr

Fig. 12.1. La tabla peridica de los elementos. Los elementos se identifican por su smbolo
qumico, el nmero atmico Z (subndice) y el nmero de masa A (suprandice), que es el
valor del peso atmico expresado en unidades del peso atmico del hidrgeno, redondeado
al entero ms prximo cuando el elemento tiene ms de un istopo estable. Los nmero de
masa de los elementos con Z > 83 corresponden al istopo ms estable. El elemento 110
todava no tiene nombre ni smbolo aceptado internacionalmente. Los elementos 111 y 112
han sido descubiertos pero no los hemos incluido en la tabla.
Consideremos el estado de menor energa de un electrn en un tomo con Z electrones. Cuando
se encuentra lejos del ncleo, la energa potencial del electrn es esencialmente igual a
V (r ) =

e2
r

, r

(12.14)

porque la carga positiva Ze del ncleo est apantallada por los Z 1 electrones restantes que lo
rodean. Por otra parte, muy cerca del ncleo el apantallamiento debido a los dems electrones es
despreciable y la energa potencial de un electrn es
V0 (r ) =

Ze2
r

Por lo tanto tendremos que

162

, r0

(12.15)

12. tomos con varios electrones

Ze2
e2
< V (r ) <
r
r

(12.16)

Claramente, si la energa potencial fuera V (r ) en todas partes, la energa de ionizacin sera de


13.6 eV como en el tomo de hidrgeno; si en cambio la energa potencial fuese V0 (r ) para todo
r, tendramos que Ei Z 13.6 eV . El hecho que V0 (r ) < V (r ) < V (r ) implica que

13.6 eV < Ei < Z 13.6 eV

(12.17)

y por lo tanto si las funciones de onda de todos los electrones fuesen la que corresponde a la menor energa, sera razonable pensar que Ei crezca con Z, pero ms lentamente que lo que resulta
de una relacin lineal. Sin embargo mirando la Fig. 12.2 se observa que en lugar de mostrar un
constante y paulatino incremento con Z, los valores de Ei tienen el mismo tipo de comportamiento peridico que las propiedades qumicas.

25

He
Ne

20
Ar

Ei

15

Kr
Xe

Rn

10

Li

Na

20

Rb

Cs

40

Fr
60

80

100

Fig. 12.2. Energas de ionizacin (en eV) de las diferentes especies atmicas.
Estudiando los valores correspondientes a los primeros elementos se puede entender lo que est
ocurriendo. Para el He, Ei = 24.5 eV , algo menos del doble que para el hidrgeno. Hasta aqu
no hay problemas, pero el elemento siguiente, el litio, tiene Ei = 4.6 eV , que es un valor llamativamente pequeo, muy inferior al del hidrgeno, mientras que en base a la (12.17) se esperara
un valor entre 30 y 40 eV. Es imposible tener una energa de ionizacin tan baja si todos los
electrones tienen un nmero cuntico principal n = 1. Sin embargo, si uno de los electrones estuviera en un estado con n = 2 , se entendera mejor el resultado experimental. En efecto, supongamos que el Li tiene dos de sus tres electrones en el estado ms bajo (1s) y el tercero en el
siguiente estado disponible que es el 2s (se prefiere este estado y no el 2p pues el experimento de
Stern-Gerlach con tomos neutros de Li muestra que el estado fundamental es un estado s). La
funcin de onda 2s en el campo de una sola carga da una densidad de probabilidad muy pequea
para r < 2 a0 (Fig. 12.3); por lo tanto el electrn pasa la mayor parte del tiempo a distancias mayores que 2 a0 , mientras que los dos electrones 1s tienen ms del 99% de probabilidad de estar
163

12. tomos con varios electrones


en r < 2 a0 . Por consiguiente cabe esperar que el tercer electrn del Li tenga una funcin de onda
muy parecida a la 2s del tomo de hidrgeno. Luego su energa de ionizacin debe ser semejante
a la del estado 2s del hidrgeno, que es de 3.4 eV, un valor mucho ms cercano a los 4.6 eV
reales que no los 30-40 eV que estimamos antes. La diferencia entre la nueva estimacin y el
valor verdadero tiene adems el signo correcto, pues el electrn 2s del litio tiene una probabilidad pequea pero no nula de estar ms cerca del ncleo, lo cual tiende a aumentar la energa de
ionizacin por encima de los 3.4 eV. Este modelo del tomo de litio resulta an ms plausible si
se considera la segunda energa de ionizacin, esto es, la diferencia de energa entre el ion Li+ y
el ion Li++, que es de 75.3 eV, lo que muestra que los dos electrones del Li+ estn mucho ms
fuertemente ligados que el tercer electrn del Li neutro, como se debe esperar si estn en el estado 1s.
Veamos ahora el comportamiento de la primera energa de ionizacin de los ocho tomos siguientes (Be, B, C, N, O, F, Ne y Na). Aunque se observan pequeas irregularidades, Ei tiende a
aumentar con Z, hasta que se llega al Ne. Este comportamiento es el que cabe esperar si los electrones que se van agregando estn todos en estados con n = 2 , puesto que la presencia de los
otros electrones con n = 2 slo neutraliza parcialmente el aumento de la carga nuclear. Pero al
pasar del Ne al Na, se observa nuevamente una notable reduccin de Ei , y con argumentos semejantes a los que usamos para el caso del litio podemos explicar esta disminucin suponiendo
que el ltimo electrn del Na est en un estado con n = 3.
Por consiguiente el comportamiento de las primeras energas de ionizacin sugiere que en un
sistema atmico formado por electrones que se mueven en un campo autoconsistente con funciones de onda caracterizadas por los nmeros cunticos n, l, ml , ms puede haber, cuanto mucho,
dos electrones con n = 1 y ocho con n = 2 . De dnde surgen esos nmeros? Es inmediato ver
que para n = 1 hay 2 estados diferentes, los estados 1s con ms = +1 / 2 y ms = 1 / 2 . Asimismo,
para n = 2 hay exactamente 8 estados diferentes: los dos estados 2s y los 6 estados 2p (ya que si
l = 1, ml puede tomar los valores 1, 0, +1, y para cada uno de ellos ms puede valer 1/2
+1/2). Todo esto sugiere algo muy simple, pero al mismo tiempo nuevo e inexplicable en base a
los conocimientos que se tenan all en 1920: que en cada estado ( n, l, ml , ms ) slo cabe, por as
decir, un electrn.

El Principio de Exclusin
Durante varios aos, la interpretacin de la estructura de los tomos con ms de un electrn fue
causa de perplejidad para los fsicos. Ya Bohr, en sus trabajos iniciales, haba reconocido que la
pregunta de porqu los electrones no se encontraban todos ligados en la capa ms profunda
constitua un problema fundamental, cuya respuesta no se poda encontrar en la Mecnica Clsica. La respuesta a este interrogante la dio Wolfgang Pauli en 1925, con base en un anlisis de
los datos de los niveles de energa de los tomos, del tipo que hemos comentado. Est contenida
en un nuevo postulado, o principio, que en su enunciacin primitiva estableca:
Principio de Exclusin:
En un tomo multielectrnico, nunca puede existir ms de un electrn en cada estado
cuntico.
Es interesante mencionar que cuando Pauli formul este principio an no se conoca el spin del
electrn. Si no se cuenta el spin, los estados de un electrn atmico se caracterizan por tres nmeros cunticos: n, l y ml. Sin embargo Pauli en su artculo asign cuatro nmeros cunticos al
164

12. tomos con varios electrones


electrn. Lo hizo de manera puramente formal, sin basarse en un esquema concreto, simplemente porque le haca falta para obtener el resultado que buscaba. Fue precisamente al leer ese
artculo que Uhlenbeck y Goudsmit, ponderando sobre cul podra ser el significado fsico del
misterioso cuarto nmero cuntico, concibieron la idea del spin (Captulo 11).
Tambin resulta curioso que Bohr, quien en su momento tuvo la audacia de apartarse de la Mecnica y la Electrodinmica Clsicas para establecer sus clebres postulados, no haya dado el
paso que dio Pauli, pese a tener plena conciencia de la importancia del problema a resolver.
Veremos en el prximo Captulo que el Principio de Exclusin se relaciona con la indistinguibilidad de las partculas en la Mecnica Cuntica. Asimismo, como lo demostr 15 aos despus
el mismo Pauli, se puede deducir a partir de la Teora Cuntica de Campos. Pero todo eso no se
saba en 1925. Cuando fue formulado, el Principio de Exclusin no era ms que un decreto,
promulgado con el propsito introducir la regla que estaba faltando en la teora de la estructura
atmica y as legitimar el comportamiento que muestra la experiencia. Pero el de Pauli fue un
decreto ciertamente muy inspirado, pues no slo logr su objetivo original, sino que adems
puso orden en las propiedades de la materia en todas las escalas. En efecto, gracias al Principio
de Exclusin hoy podemos entender desde las propiedades de la materia en el interior de las estrellas hasta la estructura de las partculas del ncleo, pasando por la impenetrabilidad de los slidos, la razn de porqu ciertos medios conducen la electricidad mientras otros son aislantes,
etc..
Antes de analizar la indistinguibilidad de las partculas y sus implicancias, vamos a mostrar que
gracias al Principio de Exclusin podemos explicar la estructura de los tomos con varios electrones, y entender la lgica que est detrs de la Tabla Peridica de los elementos.

El Principio de Exclusin y la estructura atmica


Debido al Principio de Exclusin, en el estado fundamental de un tomo los electrones no tienen
la misma energa y funcin de onda, sino que sus nmeros cunticos n, l, ml , ms (y las correspondientes funciones de onda) son todos distintos. Los valores de ml y ms dependen de la eleccin
arbitraria de la direccin del eje z; por lo tanto los electrones que tienen iguales n y l, pero diferentes ml y ms , tienen la misma energa En,l , que depende tanto de n como de l pues el campo
autoconsistente no es Coulombiano.
Ahora bien, los electrones con diferente n tienen funciones de onda con extensiones espaciales
distintas, como se ve en la Fig. 12.3 donde se muestra la distribucin radial de probabilidad
P(r ) =| u(r ) |2 de los tres primeros estados s del hidrgeno. La diferencia es an mayor en tomos con muchos electrones, ya que los electrones con n pequeo pasan ms tiempo cerca del
ncleo, donde la carga nuclear no est apantallada, luego su distribucin radial de probabilidad
se distorsiona respecto de la del tomo de hidrgeno, desplazndose hacia r menores.
Para los electrones con mayor n, la carga nuclear est fuertemente apantallada por los electrones
con n menor, pero la recproca, por supuesto, no es cierta. Luego los electrones que estn en la
capa 1s tienen una energa potencial que es prcticamente igual a V0 (r ) , la que produce la carga
Ze del ncleo. Por lo tanto se pueden representar bastante bien por medio de la funcin de onda

1, 0, 0 = Ae Zr / a0

, A = cte.

(12.18)

cuya extensin radial es 1/ Z veces la que corresponde al hidrgeno. En cambio, los electrones
exteriores con el mayor n se mueven en un campo que vara entre V0 (r ) para r pequeo y V (r )
165

12. tomos con varios electrones


para r grande. Luego la parte interior de la funcin de onda (y por ende la distribucin radial de
probabilidad) se contrae, pero la parte externa queda casi igual a la del tomo de hidrgeno, y se
acenta la diferencia de energa entre electrones con diferente n. El resultado neto es que los
electrones externos de todos los tomos tienen casi exactamente la misma extensin (dos o tres
veces el radio de Bohr) como lo indica el valor casi constante de los radios atmicos.

1s
0.5
0.4
P+r/ 0.3
2s

0.2

3s

0.1

10
rZsa0

15

20

Fig. 12.3. Distribucin de probabilidad radial para los tres primeros estados s del hidrgeno.

0.20

2p

2s

0.15
P+r/
0.10

0.05

10
rZsa0

15

Fig. 12.4. Distribucin de probabilidad radial de los estados 2s y 2p del hidrgeno.

166

20

12. tomos con varios electrones

3d

3p 3s

0.10
P+r/
0.05

10
rZsa0

15

20

Fig. 12.5. Distribucin de probabilidad radial de los estados 3s, 3p y 3d del hidrgeno.
Las Figs. 12.4 y 12.5 muestran las distribuciones de probabilidad radial de los estados de diferente l de las capas con n = 2 y n = 3 del hidrgeno, respectivamente. Es importante observar el
comportamiento de P(r ) para r pequeo. Se ve que a medida que l aumenta, la barrera centrfuga empuja al electrn cada vez ms lejos del ncleo. Recordemos, en efecto, que para r 0
se tiene que u(r ) ~ r l +1 y entonces P(r ) ~ r 2l + 2 . Esto implica que a igual n, el apantallamiento
de la carga nuclear (debido a los electrones que estn ms cerca del ncleo) es tanto mayor
cuanto ms grande es l. Este efecto rompe la degeneracin de los niveles con igual n y diferente l
que existe para el potencial Coulombiano: la energa de los niveles aumenta con l, de modo que

E2 s < E2 p

E3s < E3 p < E3d

(12.19)

Tambin resulta que

E4 s < E3d

E5s < E4 d

E6 s < E5d

(12.20)

Esto es, por efecto de la barrera centrfuga los niveles de las capas con diferente n se separan lo
suficiente como para intercalarse entre s.
Los efectos de la extensin espacial de las funciones de onda de diferente n, y de la barrera centrfuga para las funciones de onda del mismo n y diferente l que acabamos de comentar se combinan para producir el ordenamiento de niveles que se indica esquemticamente en la Fig. 12.6.
De acuerdo con el Principio de Exclusin cada subcapa n, l puede contener 2(2l + 1) electrones.
Por lo tanto a medida que se recorre la Tabla Peridica a partir del hidrgeno, las subcapas se
van llenando comenzando por la 1s y en orden de energa creciente. En la figura se consignan
los elementos cuyos electrones de mayor energa se encuentra en cada subcapa.

167

12. tomos con varios electrones


Nmero de electrones que caben en cada subcapa
(2)

(6)

(10)

(14)

6d
104A

7s
Fr, Ra

5f
AcALr
86

6p
6s
Cs, Ba

TlARn

5d

4f

HfAHg

LaALu
54

5p
5s
Rb, Sr

4d

InAXe

YACd
36

4p
4s
K, Ca

GaAKr

3d
ScAZn
18

3p
3s

AlAA

Na, Mg
10
2s
Li, Be

2p
BANe
2

1s
H, He

energa

Fig. 12.6. Orden de las subcapas. Los efectos de la extensin espacial de las funciones de
onda de diferente n y de la barrera centrfuga de las funciones de onda del mismo n y diferente l hacen que los niveles se ordenen como se indica en la figura (la energa crece de
abajo hacia arriba, la escala no es lineal). Cada nivel con n, l dados se denomina subcapa.
A medida que se recorre la Tabla Peridica a partir del hidrgeno, las subcapas se van llenando en orden de energa creciente empezando por la 1s. En la figura se mencionan los
elementos para los cuales el electrn de mayor energa se encuentra en la subcapa indicada.

168

12. tomos con varios electrones


0.10
+a/
0.08
4f 4d
0.06
P+r/

5p 5s
0.04

6s

0.02

10

20

30

40
rZsa0

+b/

0.03

50

60

70

80

4d
4f

0.02
P+r/

0.01

5p

5s
6s
5
rZsa0

10

Fig. 12.7. Densidad de probabilidad radial para el nivel 4f y para los niveles 5s, 6s, 5p y 4d
del tomo de hidrgeno. En (a) se puede apreciar que los electrones 4f se mueven en el interior del tomo, pues su extensin es menor que la de los electrones de los dems niveles
representados. En (b) se puede apreciar que la barrera centrfuga no permite que los electrones 4f se acerquen al ncleo y entonces en los tomos con muchos electrones son fuertemente apantallados por los que ocupan las otras subcapas. Por lo tanto estn dbilmente
ligados y la energa de la subcapa 4f es ms alta que las de las subcapas 5s, 6s, 5p y 4d,
como se muestra en la Fig. 12.6. Los lantnidos (el grupo constituido por el La y los siguientes 14 elementos en los cuales se va llenando la subcapa 4f) tienen propiedades qumicas muy semejantes entre s, porque los electrones 4f, que se mueven en el interior del
tomo, tienen una influencia casi nula sobre ellas.

169

12. tomos con varios electrones


Por ejemplo, la configuracin del estado fundamental del K es 1s22s22p63s23p64s1. Las lneas
horizontales de trazos de la Fig. 12.6, entre las subcapas 1s y 2s, 2p y 3s, 3p y 4s, etc., indican
que la separacin en energa entre cada uno de esos pares de subcapas es siempre grande.
Nuestro diagrama es cualitativo, pues en realidad si se quieren hacer predicciones cuantitativas
exactas es necesario calcular un esquema como el de la Fig. 12.6 para cada tomo (con el mtodo de Hartree). Cuando se hace eso, al pasar de un tomo a otro aparecen pequeas diferencias
respecto del orden de algunas de las subcapas, respecto del que se ve en la Fig. 12.6. Por ejemplo, las subcapas 4f y 5d, que estn muy prximas en energa, no siempre se encuentran en el
orden indicado en la Fig. 12.6. Lo que s es siempre correcto es el orden (por l creciente) de las
diferentes subcapas de una dada capa y el orden (por n creciente) de subcapas del mismo l pero
distinto n, que se presentan encolumnadas en la Fig. 12.6.
Los elementos cuya subcapa llena de mayor energa es np (como Ne, A, Kr, Xe y Rn) son los
gases nobles. Puesto que dos de sus electrones exteriores estn en la subcapa ns, no proporcionan un apantallamiento eficaz de la carga del ncleo. Por lo tanto los electrones np estn ligados
muy fuertemente. La energa de ionizacin es entonces muy alta y esos tomos son qumicamente inertes pues no comparten fcilmente sus electrones externos con otros tomos como es
necesario para que se formen compuestos. El He tambin es un gas noble, dado que sus dos
electrones 1s estn muy fuertemente ligados.
Se dice que los gases nobles tienen una configuracin de capas cerradas, dado que el siguiente
electrn se tiene que acomodar en la subcapa cuyo nmero cuntico principal es n = n + 1,
como se advierte observando la Fig. 12.6. Se debe notar, sin embargo, que debido al ordenamiento de energa (12.18), para todo n > 2 la capa n se cierra antes de que se llenen los niveles
con l ms alto (es decir, las subcapas nd y nf), como se ve en la Fig. 12.6. Esta circunstancia explica la aparicin de los lantnidos y los actnidos, que son dos grupos de 15 elementos que comienzan, respectivamente, a partir del La y el Ac. En los lantnidos se va llenando la subcapa 4f,
que como se puede apreciar en la Fig. 12.7 se encuentra en el interior del tomo pese a tener ms
energa que las subcapas externas 6s, 5p y 4d que estn llenas. Por este motivo los elementos del
grupo de los lantnidos tienen propiedades qumicas casi idnticas, lo cual hace difcil separarlos. El caso de los actnidos es anlogo, y en ellos se va llenando la subcapa 5f, que se encuentra
en el interior del tomo igual que la 4f.
El ordenamiento de niveles de la Fig. 12.6, junto con el Principio de Exclusin, permiten entender las principales caractersticas de la Tabla Peridica y las interacciones entre los tomos de
diferentes elementos.

La unin qumica y otras interacciones entre tomos


Las fuerzas interatmicas son sumamente complejas. En estas notas nos limitaremos a una discusin cualitativa pues un tratamiento detallado sera demasiado extenso. La idea bsica es que
en presencia de otro tomo, debido a las fuerzas electrostticas y al Principio de Exclusin, las
funciones de onda de los electrones de cada tomo se distorsionan, lo cual modifica la energa de
los electrones. Si la nueva distribucin tiene menor energa, ser el estado preferido del sistema
y la interaccin interatmica ser atractiva. Viceversa, si la nueva distribucin lleva a un incremento de energa, la fuerza resultante ser repulsiva. Los efectos de este mecanismo se manifiestan de diversas maneras en diferentes rangos de distancias, pero a grandes rasgos podemos
reconocer tres clases fundamentales de fuerzas interatmicas. Cuando la distancia es muy pequea todos los tomos se repelen mutuamente. A distancias intermedias prevalecen fuerzas que
170

12. tomos con varios electrones


dan lugar a enlaces qumicos, de resultas de los cuales los tomos se mantienen unidos formando
molculas o estructuras ms complejas como cristales. Finalmente, a distancias muy grandes,
todos los tomos y molculas se atraen dbilmente. Todas estas interacciones se explican mediante la Mecnica Cuntica de los electrones atmicos. Examinaremos a continuacin estas tres
clases de interacciones.
La impenetrabilidad de la materia
La repulsin universal que se presenta para distancias muy pequeas es responsable de que los
tomos ocupen un volumen definido, lo que se manifiesta en la escala macroscpica como la
incompresibilidad de la materia condensada. Esto se debe a que la fuerza repulsiva crece muy
rpidamente a medida que disminuye la distancia entre los centros de los tomos, de modo tal
que a muchos efectos prcticos los podemos considerar como esferas rgidas con un valor definido del radio. La repulsin a pequeas distancias tiene dos causas. En primer lugar, cuando dos
tomos se procuran interpenetrar, el apantallamiento de las cargas nucleares por parte de los
electrones se torna menos efectivo, y la fuerza electrosttica entre los ncleos los repele. La segunda causa radica en el Principio de Exclusin. No solamente no est permitido que dos electrones tengan la misma funcin de onda, sino que tambin sus funciones de onda deben ser suficientemente diferentes como para construir una funcin de onda total completamente antisimtrica, como se ver en el Captulo 13. Cuando dos tomos estn tan prximos que sus nubes
electrnicas se comienzan a superponer, los electrones de la regin de superposicin, para satisfacer el Principio de Pauli se ven obligados a pasar parte del tiempo fuera de sus rbitas originales, en orbitales de mayor energa2. Esto implica un aumento de la energa del sistema al disminuir la distancia interatmica, que equivale a una fuerza repulsiva.
La unin qumica
Cuando dos tomos se unen para formar un compuesto qumico el rearreglo afecta algunos de
sus electrones externos, y deja al sistema compuesto en un estado cuya energa total es menor
que la suma de las energas de los estados fundamentales de sus tomos por separado. De resultas de ello el compuesto adquiere una configuracin estable cuya geometra est bien definida y
en la cual los tomos estn a distancias fijas entre s. Tal configuracin corresponde al estado de
mnima energa del sistema, respecto de variaciones de los parmetros que caracterizan la configuracin. La energa asociada con los enlaces qumicos est tpicamente comprendida entre 1 y
10 eV. El rearreglo de los electrones atmicos puede ocurrir de varias maneras y los enlaces resultantes reciben diferentes denominaciones. El estudio detallado de la unin qumica es sumamente complejo. Incluso cuando hay un solo electrn en la subcapa ms externa, la situacin se
puede complicar porque a veces los estados de la siguiente subcapa tienen una energa apenas
mayor; esto ocurre con las subcapas 4s y 3d que estn muy prximas en energa, y tambin con
la 5s y la 4d, as como con las subcapas 6s, 4f y 5d.
En forma elemental, la valencia se define como el nmero de tomos de hidrgeno que se combinan con (o que son desplazados por) un tomo del elemento que se est considerando. Como el
hidrgeno tiene un solo electrn, cabe esperar que los tomos que tienen un solo electrn fuera
de una capa cerrada fuertemente ligada sean monovalentes. As ocurre efectivamente con los
2

Esto es, su nueva funcin de onda es una combinacin lineal de la funcin de onda original y funciones de onda

de los estados electrnicos no ocupados, que son de mayor energa.

171

12. tomos con varios electrones


metales alcalinos (Li, Na, K, Rb, Cs y Fr). Del mismo modo cabe esperar que los tomos que
necesitan un electrn adicional para cerrar una capa sean monovalentes. Tal es el caso de los
halgenos (F, Cl, Br, I y At), que preceden a los gases nobles y tienen por lo tanto energas de
ionizacin elevadas; en consecuencia no comparten con facilidad sus electrones con otros tomos, pero pueden recibir un electrn adicional (y slo uno) para cerrar la capa. De manera semejante los tomos con dos electrones fuera de una capa cerrada (Be, Mg, Ca, Sr, Ba y Ra) o
que necesitan dos electrones ms para cerrar una capa (O, S, Se y Te) suelen ser bivalentes. Ms
all de estos casos sencillos, la variedad de modos en que se pueden ordenar los electrones implica que generalmente puede existir ms de una valencia, y que la valencia del elemento que
estamos considerando puede depender de la naturaleza de los tomos con los cuales se combina.
No obstante, se encuentra que los elementos con el mismo nmero de electrones externos y con
estructura semejante de sus capas internas tienen propiedades qumicas parecidas.
Se conocen varias clases de enlaces qumicos. Si el rearreglo produce un desplazamiento neto de
parte de la nube electrnica de un tomo a otro, el enlace se denomina heteropolar; el caso extremo de una unin de esta clase es el enlace inico, en el cual un electrn de un orbital del primer tomo pasa a ocupar un orbital del segundo tomo. Si no hay transferencia neta de carga de
un tomo a otro la unin se denomina homopolar, o covalente. Discutiremos ahora brevemente
los enlaces inico y covalente.
5

4
F

Cl

Br
I

At

Ea
2

1 H
Li

Na

20

Rb

Cs

40

Fr

60

80

100

Fig. 12.8. Afinidades electrnicas de los elementos (en eV). La afinidad electrnica se define como la energa Ea liberada cuando el elemento adquiere un electrn adicional para
convertirse en un ion negativo. No se dan datos para los lantnidos ( 58 Z 71) ni para
los elementos que siguen al Fr ( Z 87). El Be, N, Mg, Mn, Zn, Cd y Hg y los gases nobles no forman iones negativos (se podra pensar que su afinidad es negativa).
El enlace inico
La transferencia de un electrn de un tomo a otro deja al primero con una carga neta positiva y
al segundo con una carga neta negativa. Los iones as obtenidos se mantienen unidos por la

172

12. tomos con varios electrones


atraccin electrosttica entre cargas de signo opuesto. Es interesante recordar que el concepto
original de unin qumica se bas justamente en la atraccin entre cargas de signo opuesto.
El enlace inico se da en los cristales de los haluros alcalinos, por ejemplo en la sal comn
(NaCl). Los metales alcalinos se ionizan fcilmente, pues su energa de ionizacin es baja (ver
Fig. 12.2). Por otra parte los halgenos tienen una fuerte afinidad para electrones adicionales
(ver Fig. 12.8).
Para que una unin inica en la que el tomo A cede un electrn al tomo B sea energticamente
posible es preciso que la variacin E de energa que resulta de ello sea negativa, de modo que

E = Ei, A Ea, B + VAB < 0

(12.21)

donde VAB es la energa potencial electrosttica de la molcula formada por los iones A+ y B.
Na+ , e y Cl

Na+ , e y Cl

Cl + e A Cl
486.3

Na A Na+ + e

Cl + e A Cl

351.2
486.3

Na A Na+ + e

Na+ y Cl

Na+ y Cl

vapor de Na y gas Cl

Na y Cl atmicos
Entalpa de
formacin
303.12 de molculas
aisladas
de NaCl

351.2

Na+ + Cl A NaCl

121.7 Cl2 A Cl + Cl
vapor de Na y gas Cl2

495.9
107.3

Vaporizacin
del Na

Na metlico y gas Cl2

Formacin
del cristal
787.3

Entalpa de
formacin
411.15
del cristal
de NaCl

Molcula de NaCl

Cristal de sal

(a)

(b)

Fig. 12.9. (a) Formacin de una molcula aislada de NaCl a partir de tomos aislados de
Na y Cl. (b) El ciclo de Born-Fajan-Haber para la formacin de un cristal de sal a partir de
sodio metlico y gas cloro en condiciones standard. Las entalpas especficas para los diferentes procesos se expresan en KJ/mol.
Consideremos la sal comn. Tenemos que Ei, Na = 5.39 , Ea,Cl = 3.613 . Para calcular VNaCl necesitamos conocer la distancia d entre los iones, que es igual a la suma de los radios de los iones

173

12. tomos con varios electrones


Na+ y Cl que valen, respectivamente, 0.99 y 1.81 . Luego d = 2.8 de donde obtenemos
VNaCl = 5.14 eV. Resulta entonces E = 3.36 eV, que equivalen3 a 303.12 KJ/mol (Fig.
12.9a). Por otra parte, de acuerdo con las tablas4 la entalpa de formacin del NaCl es de 411.2
KJ/mol. La diferencia se debe a que se estn considerando, en realidad, diferentes procesos.
Nuestro clculo se refiere a la formacin de una molcula aislada de NaCl a partir de tomos
aislados de Na y Cl, un proceso de inters puramente terico dado que no ocurre en la naturaleza
ni en el laboratorio. En cambio, la entalpa de formacin que figura en las tablas se define como
el calor absorbido en un proceso real, que a partir del sodio metlico y el cloro gaseoso en sus
estados en las condiciones standard de temperatura y presin, lleva a un cristal de sal en las
mismas condiciones de temperatura y presin. En este caso, se puede imaginar una serie de procesos ideales (que representamos en la Fig. 12.9b, donde se consignan las variaciones de entalpa
de cada uno de ellos) que permiten calcular la entalpa de formacin. Esta serie de procesos (que
se denomina ciclo de Born-Fajan-Haber) consiste en: (1) vaporizar el sodio metlico, (2) disociar las molculas del gas cloro para tener tomos aislados, (3) ionizar el sodio gaseoso para
formar los cationes Na+ y liberar electrones, (4) combinar los tomos de cloro con los electrones
para formar los aniones Cl, y por ltimo (5) reunir los cationes Na+ y los aniones Cl para formar el cristal de sal. Al comparar nuestro clculo anterior con el resultado del ciclo de BornFajan-Haber, cabe observar que la liberacin de energa en la formacin del cristal, no es igual
al producto de nuestro VAB por el nmero de pares de cationes y aniones presentes en el cristal.
En efecto, en el cristal cada catin (o anin) no interacta con un nico anin (o catin), sino
con todos los dems iones del cristal. En tal sentido, se puede pensar que el cristal se comporta
como si fuese una nica molcula. Los clculos muestran entonces que la energa potencial
electrosttica por ion (4.08 eV) en un cristal de sal es considerablemente mayor que
VNaCl / 2 = 2.57 eV.
A partir de este ejemplo podemos reconocer dos caractersticas bsicas del enlace inico, que lo
diferencian del enlace covalente que discutiremos a continuacin. En primer lugar, el enlace inico no es saturable, porque la energa de unin por ion vara (en el caso de la sal, entre 2.47 y
4.08 eV) con el nmero de cationes y aniones que forman el cristal. Esto se debe a que las fuerzas electrostticas son de largo alcance. En segundo lugar, estas fuerzas son istropas5, pues su
intensidad es la misma en todas las direcciones. Por lo tanto la unin inica no es direccional, y
en consecuencia no determina la configuracin geomtrica del cristal. Esta ltima depende del
tamao de los iones, que a su vez determina de qu forma se deben disponer para minimizar la
energa del cristal.
El enlace covalente
En este caso no hay transferencia neta de carga de un tomo a otro, y el rearreglo de la distribucin electrnica responsable del enlace es ms sutil. En un enlace covalente participan dos electrones, uno de cada tomo, cuya distribucin espacial se desplaza desde la superficie externa de
los tomos hacia la regin situada entre los centros atmicos. Se podra pensar que esto es con3

1 eV = 96.4853 KJ/mol = 23.0605 kcal/mol.

Ver por ejemplo Handbook of Physics and Chemistry, Editor en Jefe D. E. Lide (82a edicin 2001-2002, CRC

Press).
5

En efecto, tanto el catin como el anin son estructuras de capas cerradas y por lo tanto su distribucin de carga es

esfricamente simtrica.

174

12. tomos con varios electrones


trario al Principio de Pauli, ya que ste tiende a apartar los electrones el uno del otro. Sin embargo, el Principio de Exclusin se puede satisfacer si los spines de los dos electrones son
opuestos, pues en tal caso las partes espaciales de las funciones de onda se combinan de modo
que los electrones se acercan.
plano de simetra

electrn

ra
rb
eje de simetra
a

b
d

Fig. 12.10. Geometra del problema de la molcula ion hidrgeno H 2+ .


Para ver los aspectos fsicos bsicos de la unin covalente, consideremos el caso ms simple, la
molcula ion hidrgeno H 2+ . Este sistema consiste de dos protones a y b separados por una distancia d y un nico electrn (ver Fig. 12.10). Trataremos a los ncleos como si fueran puntos
fijos del espacio, ignorando sus movimientos6. El Hamiltoniano del electrn es

H=

p2 e2 e2
e2
e2

= Ha
= Hb
rb
ra
2 m ra rb

(12.22)

donde ra y rb son la distancia entre el electrn y los protones a y b, respectivamente, y

Ha =

p2 e2

2 m ra

, Hb =

p2 e2

2 m rb

(12.23)

son los Hamiltonianos de tomos de hidrgeno ubicados en a y b, respectivamente. Estamos interesados en el estado fundamental del electrn en el campo Coulombiano de ambos protones.
Es evidente que cuando d hay dos estados de mnima energa, equivalentes entre s, pues el
electrn puede estar ligado al protn a o al protn b. Sus funciones de onda normalizadas (ver el
Captulo 10) son, respectivamente

1 1/ 2
a = 1, 0, 0 (ra , , ) = 3 e Zra / a0
a

1 1/ 2
, b = 1, 0, 0 (rb , , ) = 3 e Zrb / a0 (12.24)
a

En ambos casos la energa del sistema est dada por

Se puede proceder as dado que su masa de es enormemente mayor que la de los electrones, y por lo tanto se

mueven mucho ms lentamente. Por consiguiente no es preciso considerar tambin el movimiento de los ncleos y
se los puede considerar fijos. Esta importante simplificacin del problema se denomina aproximacin de BornOppenheimer.

175

12. tomos con varios electrones

Ea = Eb = E0 =

e2
= 13.6 eV
2 a0

(12.25)

Supongamos, para fijar ideas, que el electrn est ligado al protn a. Si el protn b se acerca a
una distancia finita del protn a, hay una probabilidad no nula que el electrn pase a moverse
cerca del protn b, atravesando por efecto tnel la barrera de potencial entre ambos. Por lo tanto
su funcin de onda ya no es a , sino una superposicin de a y b . En consecuencia vamos a
suponer que cuando d es finito la funcin de onda del electrn tiene aproximadamente la forma

( r , t ) = ca (t ) a + cb (t ) b

(12.26)

donde ca y cb son funciones del tiempo. La (12.26) es solamente una aproximacin, pues la
descripcin exacta del estado del electrn requiere superponer todas las autofunciones de Ha y
Hb ; sin embargo la inclusin de todos los estados atmicos excitados complica el clculo sin
ayudar para nada a la comprensin fsica del problema. Nosotros no estamos interesados aqu en
obtener un resultado cuantitativo exacto, tan slo queremos estudiar el problema en forma cualitativa para entender sus aspectos fundamentales.
Sustituyendo la (12.26) en la ecuacin de Schrdinger ih / t = H resulta

e2
e2
ihca a + ihcb b = ca E0 a + cb E0 b
rb
ra

(12.27)

Si ahora tomamos el producto escalar7 de a y b por la (12.27) obtenemos las siguientes ecuaciones diferenciales para los coeficientes ca y cb :

ihca + ihcb = ca ( E0 W ) + cb ( E0 X )
ihca + ihcb = ca ( E0 X ) + cb ( E0 W )

(12.28)

= ( a , b ) = ( b , a ) = e D (1 + D + 13 D2 ) , D = d / a0

(12.29)

Aqu

es un nmero real menor que la unidad pues las funciones (12.24) son reales, y

1
2
2
1
W = e2 a dV = e2 b dV = E0 e 2 D 1 +

D
D
ra
rb
a b
a b
X = e2
dV = e2
dV = E0 e D (1 + D)

ra
rb

(12.30)

son funciones de la distancia d entre los protones, siempre positivas y que disminuyen al aumentar d. Las segundas igualdades en las (12.30) se verifican fcilmente recordando que a y
b tienen paridad definida por reflexiones en planos perpendiculares al eje de simetra y que
pasan por a y b (en nuestro caso son funciones pares, pero igual resultado se obtendra si fuesen
impares, como puede ocurrir, para estados p). La cantidad W ( d ) es el valor medio de la ener-

Se debe tener presente que a y b no son ortogonales.

176

12. tomos con varios electrones


ga potencial del electrn de un tomo en a debido a la presencia de un ion en b, o viceversa, la
energa potencial del electrn de un tomo en b debido a la presencia de un ion en a. La cantidad
X ( d ) es una suerte de energa potencial que depende del solapamiento de las funciones de
onda a y b , y se suele llamar integral de resonancia o de intercambio.
Conviene combinar las (11.28) y obtener ecuaciones separadas para ca y cb , para lo cual multiplicamos la segunda por y la restamos de la primera, y luego multiplicamos la primera por y
la restamos de la segunda. Resulta:

ihca (1 2 ) = ca [ E0 (1 2 ) W + X ] + cb ( X + W )
ihcb (1 2 ) = cb [ E0 (1 2 ) W + X ] + ca ( X + W )

(12.31)

Estas ecuaciones muestran que ca y cb estn acopladas. Podemos obtener dos ecuaciones
desacopladas si introducimos las nuevas variables c+ y c definidas por

c+ = ca + cb , c = ca cb

(12.32)

En efecto, sumando y restando las (12.30) obtenemos


ihc+ = E+ c+

, ihc = E c

W
X

1+ 1+

, E ( d ) = E0

c+ = A+ e ihE+

, c = A e ihE

(12.33)

donde

E+ ( d ) = E0

W
X
+
1 1

(12.34)

Integrando las (12.33) obtenemos


(12.35)

donde A+ y A son constantes de normalizacin.


Las ecuaciones no acopladas (12.33) nos dicen que c+ y c son las amplitudes de dos estados
estacionarios + y del Hamiltoniano H del sistema, correspondientes a los autovalores E+
y E . En efecto, si + ( r , t ) = c+ (t ) + ( r ) , se tiene que

ihc+ + = ih

+
= H+ = c+ (t ) E+ +
t

(12.36)

que es la primera de las (12.33), y anlogamente si ( r , t ) = c (t ) ( r ) se obtiene la segunda


de las (12.33). Para encontrar la funcin de onda + , observemos que si el sistema se encuentra
en ese estado, entonces se debe tener c = 0 , o sea cb = ca . Del mismo modo, si el sistema se
encuentra en el estado ( r , t ) se debe tener c+ = 0 , y entonces cb = ca . Por lo tanto, reemplazando en la (12.26) obtenemos, respectivamente:

+ ( r , t ) = + ( r )e ihE+

, + (r ) =

( r , t ) = ( r )e ihE

, (r ) =

1
( a
2(1+ )
1
( a
2(1 )

La diferencia de energa entre de los estados estacionarios + y es


177

+b)
b)

(12.37)

12. tomos con varios electrones

= E E+ =

2
( X W ) > 0
12

(12.38)

El estado estacionario simtrico + tiene menos energa que el estado antisimtrico ya que
la energa potencial del electrn en ese estado es menor porque en la regin de bajo potencial
entre los ncleos | + |2 > | |2 , y su energa cintica es ms baja pues en esa misma regin
| + |2 < | |2 , y es casi igual en el resto del espacio, como se puede ver en la Fig. 12.11 en
la que mostramos las variaciones espaciales de + y a lo largo del eje de simetra.

\b

\a

\

eje de simetra

b
\

V Va Vb

plano de simetra

Fig. 12.11. Las funciones de onda + y de los estados estacionarios del H 2+ .


Como ya dijimos, nuestro clculo no es exacto porque en las ecs. (12.31) no consideramos los
estados atmicos excitados. Sin embargo los resultados anteriores son una buena aproximacin
siempre y cuando d no sea muy pequeo. Asimismo, nuestro anlisis permite inferir algunos
valores lmite exactos de la energa, aprovechando las propiedades de simetra de las soluciones
(12.36), dado que tales simetras se deben mantener para todo d. El estado simtrico + no tiene
nodos, igual que un estado s atmico. Por lo tanto, en el lmite d 0 cabe esperar que + se
convierta en el estado 1s del ion He+ ( Z = 2 ), cuya energa es 4 E0 = 54.4 eV . Por otra parte
tiene un nico plano nodal, que coincide con el plano de simetra del H 2+ . Esta simetra es la
misma que la de un estado atmico 2p, y por consiguiente cabe esperar que en el lmite d 0 el
estado se convierta en el estado 2p del ion He+, de energa E0 = 13.6 eV .
En la Fig. 12.12a hemos reproducido el resultado del clculo exacto8 de las energas de los estados simtrico y antisimtrico del H 2+ , en funcin de d. Se puede observar que los valores lmite
que inferimos son correctos.

El lector interesado puede encontrar una exposicin detallada de los refinamientos que permiten realizar un clculo

exacto en el libro Introduction to Quantum Mechanics de L. Pauling y E. B. Wilson (Mc Graw-Hill 1935).

178

12. tomos con varios electrones


Por ltimo, para obtener la energa total del ion, tenemos que sumar a E+ y E la energa potencial debida a la interaccin electrosttica entre los dos protones9, que vale
Vab = +

Z 2e2
d

(12.38)

Se obtienen as las curvas de la Fig. 12.12.b. Se puede observar que la curva E+ + Vab muestra
un mnimo para d 2 a0 , que corresponde al estado ligado estable de la molcula H 2+ . Por este
motivo la funcin de onda simtrica + se denomina orbital ligante, o de enlace. En cambio
E + Vab no tiene mnimo, y por eso se denomina orbital antiligante, o de antienlace.
1

0.4

0.6

E+Vab

0.8

E/E0

E/E0
2
1.0

E+

E++Vab

1.2
4

d/a0

d/a0

(a)

(b)

Fig. 12.12. (a) Energas de los estados estacionarios + y del H 2+ . (b) Energas de la
molcula H 2+ . Las lneas llenas representan el resultado exacto. Las lneas de puntos
muestran el resultado del clculo aproximado.
El enlace de dos protones por medio de un nico electrn que acabamos de estudiar muestra que
el origen de la unin covalente es la disminucin de la energa debida a la concentracin de
carga negativa en la regin entre los dos ncleos. Sin embargo no es un caso tpico, dado que la
molcula H 2+ est cargada. La unin de tomos neutros por medio de electrones compartidos
implica que cada uno de ellos aporta un electrn para formar el enlace. Consideremos el ejemplo ms sencillo, que es la molcula neutra H 2 . Si ignoramos la repulsin Coulombiana entre
los electrones, los podemos tratar como independientes10 y entonces podemos aplicar de inmediato los resultados anteriores para el H 2+ . El estado de menor energa se obtiene entonces poniendo los dos electrones en el orbital de enlace, lo cual est permitido por el principio de exclusin, siempre y cuando los dos electrones tengan spin opuesto. Si queremos ser precisos, de-

Esto no se debe hacer cuando d = 0, esto es cuando los protones se han unido para formar el ncleo del He+.

10

Esta aproximacin de partcula independiente se usa ampliamente en la Fsica de Slidos. Es una aproximacin

bastante razonable, y adems es la nica tratable en problemas en los que intervienen muchos electrones. Una
discusin de la clase de errores a los que da lugar para la molcula de hidrgeno (que permite formarse una idea de
cun confiable es la aproximacin) se puede encontrar en R. E. Hall, Fsica del Estado Slido (Limusa 1978).

179

12. tomos con varios electrones


bemos calcular de nuevo la funcin de onda del orbital de enlace con el mtodo del campo autoconsistente, para as tomar en cuenta la interaccin de los electrones.
Por consiguiente, una caracterstica esencial del enlace covalente es que involucra una pareja de
electrones (uno de cada tomo). Por lo tanto el hidrgeno solo puede formar un enlace covalente
y, en general, un tomo no puede formar ms enlaces covalentes que electrones tiene fuera de
capas cerradas. En virtud de esto es que se dice que el enlace covalente es saturable.
Un enlace covalente entre dos tomos se puede formar si en cada uno de ellos hay un electrn no
apareado, lo que a su vez depende de la degeneracin de las subcapas externas. Por ejemplo el
N tiene 5 electrones externos distribuidos en los 4 orbitales de las subcapas 2s y 2p. Dos de ellos
ocupan la subcapa 2s formando un par, pero los tres restantes estn desapareados en diferentes
orbitales 2p y por este motivo el N es trivalente.

2px
2py
2s
2pz
(a)

(b)

2pz

hbridos 2s2p3

hbridos 2s2p2

(c)

(d)

(a )

(b)

Fig. 12.13. La estructura espacial de las molculas cuyos tomos estn unidos por enlaces
covalentes depende de la forma de los orbitales, que tienen lbulos que apuntan en diferentes direcciones. Aqu hemos representado cualitativamente forma de la distribucin espacial de probabilidad para: (a) el orbital 2s puro, (b) los tres orbitales 2p puros, que son
mutuamente ortogonales, (c) los cuatro orbitales hbridos 2s2p3, que se disponen en forma
de tetraedro, (2) los tres orbitales hbridos 2s2p2, que se disponen en el plano (x, y) a 120
entre s y el restante orbital 2 pz , que no se modifica.
180

12. tomos con varios electrones


La geometra de los compuestos qumicos, con ngulos definidos entre los enlaces de las molculas con tres o ms tomos, depende de la forma de los orbitales, que tienen lbulos que apuntan en diferentes direcciones. Si las uniones se forman a partir de orbitales p puros, los enlaces se
orientan en direcciones mutuamente ortogonales, como lo hacen las funciones de onda p (Fig.
12.13b).
En realidad, sin embargo, muchos enlaces qumicos reales se forman a partir de funciones de
onda que son combinaciones lineales de orbitales p y s. Este fenmeno se llama hibridizacin, y
da lugar a funciones de onda de geometra diferente. Por ejemplo, el carbono, cuyo estado fundamental tiene la configuracin 1s22s22p2, puede formar hasta cuatro enlaces covalentes, pues a
partir de la nica funcin de onda 2s y las tres funciones 2px, 2py, 2pz se forman cuatro combinaciones lineales independientes (orbitales hbridos sp3) cada uno de los cuales est ocupado por
uno de los cuatro electrones externos (Fig. 12.13c). En el carbono, esta hibridizacin da lugar a
cuatro enlaces dirigidos hacia los vrtices de un tetraedro regular. El ngulo entre dos cualesquiera de esos enlaces es de 109.5. Esta circunstancia es la que da lugar a la estructura cristalina
del diamante.
La hibridizacin sp3 no es la nica posible en el carbono, aunque es la ms usual. Por ejemplo,
se da tambin la hibridizacin sp2, en la cual la funcin de onda 2s se combina con dos de las
funciones 2p para dar tres orbitales hbridos equivalentes cuyos lbulos se disponen en un plano
formando entre s ngulos de 120 (Fig. 12.13d); el restante orbital 2p no se modifica y tiene sus
lbulos orientados perpendicularmente a dicho plano. Este tipo de hibridizacin es responsable
de la estructura cristalina del grafito.
De lo dicho se desprende que cuando un tomo forma ms de un enlace covalente, estos enlaces
forman entre s ngulos bien definidos. Por lo tanto los enlaces covalentes son dirigidos, adems
de saturables. Estas propiedades son fundamentales porque determinan la geometra de las molculas y el tipo de estructura cristalina del compuesto.
Los enlaces inico y covalente son dos casos extremos en lo que hace al comportamiento de los
enlaces qumicos, y se dan situaciones intermedias. Asimismo, las funciones de onda responsables del enlace no necesariamente estn localizadas en el entorno de dos tomos vecinos. Existen
enlaces no localizados, en los cuales las funciones de onda de los electrones involucrados se extienden sobre varios tomos.
Todas estas propiedades se describen muy bien a partir de la teora de Hartree. Primero se determinan en forma grosera las posiciones de los centros de los tomos. Despus se resuelve la
ecuacin de Schrdinger para cada electrn, en forma autoconsistente con la densidad de carga
debida a los dems electrones. Cuando se han encontrado las funciones de onda de todos los
electrones se calcula la energa de la molcula. Luego se repite el mismo procedimiento para
otras posiciones de los centros atmicos hasta encontrar la que corresponde al mnimo de la
energa de la molcula. La disposicin espacial de centros y funciones de onda que se obtiene de
este modo es la configuracin geomtrica de la molcula. Segn sea el comportamiento de las
funciones de onda de Hartree se pueden encontrar varios tipos de enlace qumico. Las predicciones de la geometra de las molculas y el carcter de los enlaces basadas teora de Hartree son
muy confiables. Sin embargo la teora no siempre predice con exactitud las energas de unin.
Interacciones atmicas de largo alcance
Cuando los tomos y molculas han ya establecido entre si sus posibles uniones qumicas,
subsisten interacciones ms dbiles y de largo alcance. Dichas fuerzas tienen dos orgenes.
181

12. tomos con varios electrones


Cuando una molcula tiene una distribucin heteropolar de electrones (esto es cuando tiene un
momento dipolar elctrico permanente) existe una fuerza de largo alcance debida a los campos
elctricos asociados con dicha distribucin. Un ejemplo es la molcula de agua, en la cual hay
una transferencia neta de carga desde los tomos de hidrgeno al oxgeno. El campo elctrico
dipolar que resulta de ello atrae tanto a iones cargados positivamente como negativamente, dependiendo de la orientacin de la molcula da agua. Esto explica porqu el agua es tan buen solvente para las molculas polares y las molculas con uniones inicas.
Otra fuerza de largo alcance es la fuerza de van der Waals, que es una atraccin dbil que se
ejerce entre toda clase de tomos o molculas no polares. Esta fuerza es la que da cohesin a los
lquidos no polares (como el aire lquido y la nafta). Tales lquidos tienen un punto de ebullicin
bajo, porque las energas de unin debidas a las fuerzas de van der Waals son muy pequeas
(apenas unas dcimas de eV). Las fuerzas de van der Waals provienen de un sutil efecto cuntico: la existencia de campos elctricos fluctuantes fuera de un tomo, pese a que la nube electrnica rodea al ncleo y neutraliza su carga. Estos campos fluctuantes estn asociados con las
posibles posiciones de los electrones que se mueven en sus orbitales.
No entraremos aqu en ms detalles para no extender en demasa este Captulo, y remitimos al
lector interesado a la abundante literatura que existe sobre estos temas. Pero debe quedar claro
que el modelo atmico de capas, junto con el Principio de Exclusin, permiten explicar satisfactoriamente la estructura atmica de los elementos y sus propiedades.

182

13. Partculas idnticas

13. PARTCULAS IDNTICAS


En el Captulo 12 introdujimos el Principio de Exclusin en base a la evidencia emprica, y vimos que permite explicar satisfactoriamente la configuracin del estado fundamental de los tomos con ms de un electrn y entender las propiedades de los elementos qumicos que se expresan en la Tabla Peridica. Esto es posible porque disponemos del modelo del campo autoconsistente, segn el cual los electrones atmicos se mueven independientemente y por lo tanto sus
estados se pueden caracterizar mediante los nmeros cunticos n, l, ml , ms . Sin embargo nuestro
modelo del tomo no es exacto.
Por otra parte, si bien nuestra identificacin de las configuraciones atmicas es correcta, esto no
implica que la funcin de onda del conjunto de los electrones de un tomo se pueda escribir en la
forma (12.6), o sea como
N

N = k1 ( r1, 1 ) k 2 ( r2 , 2 ) kN ( rN , N ) = ki ( ri , i ) , ki (n, l, ml , ms )i (13.1)


i =1

En efecto, al escribir N de esta manera no slo estamos especificando los estados (n, l, ml , ms )i
que estn ocupados: tambin estamos asignando a cada estado un electrn en particular. Esto no
es lcito, porque en la Mecnica Cuntica no es posible distinguir entre s las partculas idnticas
como los electrones.
Por ltimo no est claro todava cmo aplicar el Principio de Exclusin a otras situaciones en las
que no podemos identificar los nmeros cunticos que corresponden a cada partcula.
Por todas estas razones la formulacin del Principio de Exclusin que dimos en el Captulo 12
no es an satisfactoria y es necesario encontrar un planteo ms general, que se pueda aplicar a
todos los casos. Eso es lo que haremos en este Captulo. Para ello es necesario primero examinar
ms profundamente las implicancias de la indistinguibilidad de las partculas idnticas, que es
una caracterstica fundamental de su descripcin cuntica.

La indistinguibilidad y la funcin de onda de un sistema de varias partculas


idnticas
En la Mecnica Clsica se puede siempre (al menos en lnea de principio) identificar una dada
partcula y seguirla en su movimiento, porque mientras no la perdamos de vista conserva su
identidad y la podemos distinguir de las dems partculas aunque stas sean idnticas a ella.
Pero en la Mecnica Cuntica esto no se puede hacer, pues debido al principio de incerteza, la
extensin espacial de la funcin de onda que describe nuestra partcula es finita, lo cual conduce
inevitablemente a un solapamiento con las funciones de onda de otras partculas idnticas a ella.
En esas circunstancias, cuando observamos una partcula no podemos identificar de cul de ellas
se trata. Este hecho produce efectos muy importantes, que no tienen un anlogo clsico, pues la
indistinguibilidad de las partculas idnticas es una caracterstica exclusivamente cuntica. Examinaremos ahora las consecuencias de la indistinguibilidad inherente a la descripcin cuntica
de un sistema de partculas idnticas.
Vamos a suponer que un sistema de N partculas idnticas (por ejemplo N electrones) se describe
mediante una funcin de onda de la forma

N = (1, 2 ,, N , t )

183

(13.2)

13. Partculas idnticas


Aqu con i ( i = 1, 2, , N ) indicamos simblicamente todas las variables que describen una
nica partcula (las tres coordenadas en el caso de partculas sin spin, las tres coordenadas ms la
variable de spin en el caso de los electrones y otras partculas con spin).
Observemos que esta suposicin implica que las mismas variables que sirven para describir una
partcula aislada, son tambin adecuadas para describirla cuando forma parte de un sistema con
otras partculas idnticas a ella. En otras palabras, estamos dando por cierto que la partcula
mantiene su individualidad cuando pasa a integrar el sistema. No es obvio que esto deba suceder
siempre, pero la experiencia indica que as ocurre en muchos casos de inters. Por ejemplo, es un
hecho experimental que los electrones que forman parte de un tomo se pueden siempre
identificar como electrones, independientemente de cuntos haya en el tomo.
Tambin debemos tener presente que hay una arbitrariedad inherente a la definicin del trmino
partcula tal como lo estamos usando, y que la identidad de dos partculas es en gran medida
una cuestin de convencin. Por ejemplo, los protones y neutrones se suelen considerar como
dos especies (que se distinguen por diferencias de masa, carga elctrica, momento magntico y
propiedades de estabilidad). Sin embargo a veces se los describe como dos distintos estados de
una misma especie, el nuclen; en tal caso todos los nucleones se consideran idnticos, y los
estados protn y neutrn se caracterizan por diferentes valores de una nueva variable dinmica,
el spin isobrico o isospin (lo cual requiere introducir un nmero cuntico adicional, que representa el autovalor de la nueva variable dinmica). En ciertos problemas, tambin, conviene
considerar como partculas a sistemas compuestos como ncleos, tomos o molculas. Su naturaleza compuesta da lugar a grados de libertad internos que se deben incluir entre las variables
dinmicas que describen dichas partculas. Esta amplitud de la definicin de partcula no es un
obstculo para el desarrollo de la Mecnica Cuntica de sistemas de partculas idnticas, y los
principios de la teora se pueden aplicar a cualquier especie de partcula, con tal que se utilicen
las variables (y los nmeros cunticos) adecuadas a cada caso.
La interpretacin de la (12.1) es que

N* N d1d2 d N = | (1,, N , t ) |2 d1 d N = P(1,, N , t )d1 d N

(13.3)

representa la probabilidad1 P(1, 2 ,, N , t ) de encontrar en un dado instante t una partcula en


el intervalo ( 1, 1 + d1), otra partcula en el intervalo ( 2 , 2 + d2 ), , y finalmente la ltima
partcula en el intervalo ( N , N + d N ).
Ahora bien, puesto que las partculas son indistinguibles, debemos tener que

P(P (1, 2 ,, N ), t ) = P(1, 2 ,, N , t )

(13.4)

para cualquier permutacin P (1, 2 ,, N ) de los argumentos de P, dado que siendo idnticas,
el orden en que se citan los intervalos donde se encuentran es claramente irrelevante.
La (12.22) implica que se debe cumplir

(P (1, 2 ,, N ), t ) = ei P (1, 2 ,, N , t )

(13.5)

El lector debe tener presente que ahora P es una densidad de probabilidad en un espacio de 3N dimensiones para

cada una de las N(2s+1) componentes spinoriales de N y por lo tanto no se puede visualizar en el espacio ordinario
de tres dimensiones como en el caso de una nica partcula.

184

13. Partculas idnticas


donde P es un nmero real. Mostraremos ahora que este requerimiento impone restricciones
muy importantes sobre la forma de .
Para ver esto, recordemos que las permutaciones P (1, , N ) de N elementos forman un grupo,
y que toda permutacin se puede expresar como el producto de transposiciones, esto es de intercambios de dos elementos del conjunto (1,, N ) . Por lo tanto no hace falta considerar las N!
permutaciones posibles, sino que basta considerar las N ( N 1) / 2 transposiciones.
Consideremos una transposicin T ( j, k ) que consiste en el intercambio j k del j-simo argumento con el k-simo argumento de . Su efecto sobre es
T ( j, k ) = (1, 2 ,, k ,, j ,, N , t ) = ei jk (1, 2 ,, j ,, k ,, N , t ) (13.6)

Como T ( j, k )T ( j, k ) = 1 (pues si reiteramos la transposicin volvemos al orden inicial), es evi2 i


dente que e jk = 1. Esto da dos posibilidades: jk = ei jk = 1 y jk = ei jk = 1. Ahora bien,
es fcil verificar que si T ( j, k ) y T (l, m) son dos transposiciones cualesquiera, se cumple que

jk = lm

(13.7)

de modo que se dan solamente dos casos: (a) = +1, y entonces cualquier transposicin deja
invariante a , (b) = 1 y entonces cualquier transposicin cambia en .
En el primer caso tendremos

(P (1, 2 ,, N ), t ) = (1, 2 ,, N , t )

(13.8)

y no se modifica cuando se permutan sus argumentos. Se dice entonces que es simtrica


respecto del intercambio de sus argumentos.
En el segundo caso tendremos

(P (1, 2 ,, N ), t ) = ( 1)qP (1, 2 ,, N , t )

(13.9)

donde qP es el nmero de transposiciones que es necesario efectuar para realizar la permutacin


P. Se dice entonces que es antisimtrica respecto del intercambio de sus argumento. En particular

(1, 2 ,, j ,, k ,, N , t ) = (1, 2 ,, k ,, j ,, N , t )

(13.10)

y cambia de signo cuando se intercambian dos cualesquiera de sus argumentos j y k .


Por consiguiente resulta que la funcin de onda de un sistema de partculas idnticas es o simtrica o antisimtrica respecto del intercambio de sus argumentos. Esto es consecuencia de la indistinguibilidad.

Funciones de onda simtricas y antisimtricas


Vamos a ver ahora que la propiedad que la funcin de onda es o simtrica o antisimtrica se
conserva en el tiempo. La evolucin de est dada por la ecuacin de Schrdinger

ih

N
= H N
t

185

(13.11)

13. Partculas idnticas


donde el Hamiltoniano del sistema es la suma de las energas cinticas de las N partculas ms
las energas potenciales de las fuerzas externas que actan sobre cada una de ellas, ms las energas potenciales Vjk de las fuerzas de interaccin entre las partculas:

p 2j

H =
+ V ( rj ) +
j =1 2

Vjk

(13.12)

j , k =1
i> j

Est claro que H debe ser simtrico respecto del intercambio de la designacin de las partculas.
Esto implica que H N tiene la misma simetra (o antisimetra) que N y por consiguiente de la
(13.11) se desprende que N (t + dt ) tiene la misma simetra (o antisimetra) que N . Continuando el proceso de integracin se encuentra entonces que la simetra o antisimetra se preserva
para todo tiempo.
En el caso de un estado estacionario de energa total E se tiene que

(1, 2 ,, N , t ) = e iEt / h (1, 2 ,, N ) = e iEt / h N

(13.13)

y vemos que el carcter de simetra por intercambio de N es igual al de la funcin de onda.


De resultas de lo que hemos visto, surge la pregunta de si es posible que un sistema de partculas
idnticas pueda tener estados de ambas clases de simetra por intercambio, es decir, tanto estados simtricos como antisimtricos. La respuesta es que esto no es posible. En efecto, sean dos
sistemas A y B, ambos formados por partculas idnticas de la misma especie (por ejemplo, dos
tomos). El sistema C constituido por el conjunto de A y B debe tener, por lo que vimos recin,
una funcin de onda cuya simetra por intercambio es definida (o simtrica, o antisimtrica). Por
otra parte, acabamos de ver que la simetra de A y B no puede cambiar2 por el mero hecho de
entrar a formar parte de C. Por lo tanto se deduce que A, B y C deben tener la misma simetra de
intercambio. Por extensin, inferimos entonces que todos los sistemas de partculas de una dada
especie deben tener la misma simetra.
En conclusin:
Los estados de un sistema de partculas idnticas o son todos simtricos, o son todos antisimtricos, dependiendo de la clase de partculas de que se trate.
Hasta aqu podemos llegar partiendo de los postulados de la Mecnica Cuntica no relativstica
de que tratan estas notas. Para avanzar ms, y averiguar qu tipo de funcin de onda (simtrica o
antisimtrica) describe un sistema de partculas de una dada clase, es preciso salir del mbito de
nuestra teora.

Bosones y Fermiones
En el marco de la Teora Cuntica Relativstica de Campos se demuestra que existe una relacin
entre la simetra o antisimetra de la funcin de onda que describe un sistema de partculas idnticas y el spin de las partculas. La demostracin, que no daremos aqu pues excede el mbito de
estas notas, se funda en que dicha relacin es necesaria, de lo contrario no es posible formular
una teora cuntica de campos que tenga sentido, y que no lleve a predicciones absurdas.
La relacin entre spin y simetra por intercambio es la siguiente:
2

Esto es verdad independientemente de si A y B interactan o no.

186

13. Partculas idnticas


Relacin entre spin y simetra por intercambio:
los sistemas de partculas de spin semientero (electrones, protones, neutrones y otras
ms) se describen por medio de funciones de onda antisimtricas; tales partculas se
denominan Fermiones pues obedecen a la estadstica de Fermi-Dirac;
los sistemas de partculas de spin entero (fotones y otras ms) se describen por medio
de funciones de onda simtricas; tales partculas se denominan Bosones porque obedecen a la estadstica de Bose-Einstein.
Este resultado (que en el presente contexto tenemos que asumir como un postulado adicional) se
denomina relacin entre spin y estadstica. Las estadsticas de Bose-Einstein y de Fermi-Dirac
se tratarn en el Captulo 15.

Sistemas de partculas independientes


Consideremos los estados estacionarios de un sistema de N partculas idnticas. Supongamos
que la ecuacin de Schrdinger independiente del tiempo tiene la forma

N
H N = Hi ( ri , pi ) N = E N

j =1

(13.14)

donde Hi ( r , p) es el Hamiltoniano de una nica partcula3. La funcin de onda k ( ) de un estado estacionario de una partcula (recordamos que indica todas las variables que la describen,
es decir las tres coordenadas ms la variable de spin) es solucin de la ecuacin

Hi k ( ) = Ek k ( )

(13.15)

y se caracteriza por ciertos nmeros cunticos, que en conjunto indicamos con k.


Queremos escribir la funcin de onda N del sistema, cuando las N partculas ocupan los estados k1 , , k N con nmeros cunticos k1, , k N . Claramente, N no puede ser de la forma
(13.1), que no tiene simetra definida por intercambio. La forma correcta de proceder es la siguiente: sea

(1, 2 N ) = k1 (1 ) k2 (2 ) k N ( N )

(13.16)

Sea ahora P (1, 2 ,, N ) una permutacin de los argumentos de (1, 2 N ) . Entonces

Ns =

1
Ns

(P (1, 2 ,, N ))

(13.17)

toda P

donde la suma abarca todas las N! permutaciones de los argumentos de , es simtrica por el
intercambio de dos cualesquiera de sus argumentos. Por lo tanto (a menos del factor e iEt / h ) la
(13.17) es la funcin de onda correcta para Bosones.
En cambio
3

Esto significa que consideramos que cada partcula se mueve independientemente de las dems, esto es, que no

interacta con ellas, o bien que esas interacciones se pueden describir por medio de un potencial efectivo que
depende solamente de las variables de la partcula (como ocurre para el modelo del tomo que tratamos en el
Captulo 12).

187

13. Partculas idnticas

Na =

1
Na

(1)qP (P (1, 2 ,, N ))

(13.18)

toda P

donde qP es el nmero de transposiciones que es necesario efectuar para realizar la permutacin


P, es antisimtrica por el intercambio de dos cualesquiera de sus argumentos. Por lo tanto (siempre a menos del factor e iEt / h ) la (13.18) es la funcin de onda correcta para Fermiones. Los
factores 1/ N s,a se introdujeron en (13.17) y (13.18) para normalizar4 las funciones de onda.

El principio de exclusin de Pauli


El hecho que un sistema de Fermiones, como los electrones de un tomo, se describe mediante
una funcin de onda antisimtrica tiene importantsimas consecuencias, entre las cuales se
cuenta el Principio de Exclusin.
Consideremos en efecto los estados estacionarios de un tomo con N electrones. Como vimos en
el Captulo 12, el tomo se puede describir por medio del modelo aproximado de Hartree, en el
cual la ecuacin de Schrdinger independiente del tiempo tiene la forma
N

H N = Hi ( ri , pi ) N = E N
i =1

(13.19)

donde
Hi ( r , p) =

p2
Ze2
Vi (r ) , Vi (r ) =
+ Vi(r )
r
2

(13.20)

es el Hamiltoniano de una nica partcula en un campo de fuerzas centrales dado por Vi (r ) (el
potencial Coulombiano apantallado, que resulta de la carga nuclear ms la que se debe a los dems electrones). La funcin de onda pi ( r ) del i-simo electrn es solucin de la ecuacin

p2

Hi pi ( ) =
Vi (r ) pi ( ) = E pi pi ( )
2

(13.21)

y se caracteriza por los cuatro nmeros cunticos pi (n, l, ml , ms ) pi .


La funcin de onda N del tomo, cuyos N electrones ocupan los estados p1, p2 , , pN
con nmeros cunticos p1 (n, l, ml , ms ) p1, p2 (n, l, ml , ms ) p2 , , etc. est dada por la (13.18).
Una forma equivalente de escribirla es

p1 (1 )
p2 (1 )

1
=
N pi (1 )

pN (1 )

p1 (2 )
p2 (2 )

pi (2 )

pN (2 )

Si las k son ortonormales se tiene que Ns,a = N!.

188

p1 ( j ) p1 ( N )
p2 ( j ) p2 ( N )

pi ( j ) pi ( N )

pN ( j ) pN ( N )

(13.22)

13. Partculas idnticas


En efecto, al desarrollar el determinante (13.22) (que se denomina determinante de Slater) vemos que N es una combinacin lineal de productos del tipo (13.1), en la cual figuran todas las
N! permutaciones de los N argumentos 1, 2 ,, N ; por lo tanto es una solucin de la (13.19)
correspondiente al autovalor

E = E p1 + E p2 + + E pi + + E pN

(13.23)

y adems es antisimtrica frente a cualquier intercambio j k . Esto ltimo es evidente, pues


el intercambio de los argumentos equivale a intercambiar las correspondientes columnas del determinante (13.22).
El determinante de Slater es idnticamente nulo si cualquier par de partculas se encuentran en el
mismo estado. En efecto, si dos conjuntos de nmeros cunticos pi , pk coinciden, el determinante tiene dos filas iguales y por lo tanto es nulo. Luego al postular que N es completamente
antisimtrica se garantiza que se cumpla el Principio de Exclusin. Sin embargo, el postulado de
la antisimetra de la funcin de onda es ms general, ya que se puede aplicar a todo tipo de situacin, incluso cuando no se puede asignar nmeros cunticos a las partculas.
Claramente, N se anula tambin cuando dos de sus argumentos son iguales (en tal caso dos de
las columnas del determinante de Slater son iguales). Esto significa que dos electrones (o dos
Fermiones, en general) no pueden estar en el mismo lugar del espacio si tienen el mismo spin.

Las interacciones de intercambio


La circunstancia que el spin de las partculas no intervenga en la ecuacin de Schrdinger no
invalida dicha ecuacin ni los resultados que de ella se obtienen. En realidad la interaccin elctrica entre las partculas no depende de su spin5. Del punto de vista matemtico esto implica que
(en ausencia de campos magnticos) el Hamiltoniano de un sistema de partculas cargadas no
contiene operadores de spin, de manera que cuando opera sobre la funcin de onda no produce
ningn efecto sobre las variables de spin. Por ese motivo, cada una de las componentes de la
funcin de onda (ver la ec. (11.80)) satisface la ecuacin de Schrdinger por separado de la otra.
Por consiguiente la funcin de onda N del sistema se puede escribir como el producto de una
funcin de las coordenadas por una funcin de las variables de spin, de la forma

N ( r1, 1; r2 , 2 ;) = ( r1, r2 ,) ( 1, 2 ,)

(13.24)

Llamaremos funcin de onda orbital, o de las coordenadas, a , y funcin de onda de spin a .


La ecuacin de Schrdinger, en la aproximacin no relativstica, determina nicamente la funcin de onda de las coordenadas dejando arbitraria la funcin de onda de spin. Entonces cuando
no nos interesa el spin de las partculas podremos aplicar la ecuacin de Schrdinger e identificar la funcin de onda con la funcin de onda orbital.
Veremos ahora una importante consecuencia de la indistinguibilidad: pese a que la interaccin
entre las partculas no involucra su spin, la energa del sistema depende igualmente del spin total. Esto se debe a que, por ser idnticas las partculas, N tiene una simetra de intercambio
definida.

Esto es cierto dentro de la aproximacin no relativstica. Si se toman en cuenta los efectos relativsticos, la

interaccin entre partculas cargadas depende de sus spines.

189

13. Partculas idnticas


Consideremos para simplificar un sistema de dos partculas idnticas. Al resolver la ecuacin de
Schrdinger, encontraremos una serie de niveles de energa, a cada uno de los cuales le corresponde una cierta funcin de onda de las coordenadas ( r1, r2 ) que es o simtrica o antisimtrica.
En efecto, debido a la identidad de las partculas, el Hamiltoniano H del sistema (y entonces la
ecuacin de Schrdinger) es invariante frente a permutaciones de las mismas. Entonces, si el nivel de energa E que estamos considerando no es degenerado, al permutar las variables r1 y r2 la
autofuncin ( r1, r2 ) no puede cambiar sino por un factor constante. Reiterando la permutacin
es inmediato ver que ese factor no puede ser sino 1 o 1. En el primer caso es simtrica por
intercambio, y en el segundo es antisimtrica. Si hay degeneracin, de modo que al nivel E le
corresponden dos o ms autofunciones i ( r1, r2 ) , se pueden siempre elegir oportunas combinaciones lineales de simetra definida. Examinemos ahora algunos casos.
Sistema de dos partculas sin spin
En este caso no hay factor de spin en la , y la funcin de onda se reduce a la funcin orbital .
Puesto que las partculas sin spin son Bosones, ( r1, r2 ) debe ser simtrica. Esto significa que no
todos los niveles de energa que se obtienen resolviendo la ecuacin de Schrdinger se pueden
realizar, porque aquellos que corresponden a funciones antisimtricas no son admisibles.
Para ver lo que esto implica recordemos lo visto en el Captulo 10. Para tratar el sistema conviene separar el movimiento relativo de las partculas del movimiento del centro de masa, poniendo ( r1, r2 ) = cm ( rcm ) rel ( r ) , donde rcm es la posicin del centro de masa y r = r2 r1 es la
posicin relativa de las partculas. El momento angular L del movimiento relativo es constante
del movimiento y entonces rel ( r ) = R n,l (r )Ylm ( , ) . Ahora bien, el intercambio de las partculas equivale a la inversin de coordenadas relativas r r , y sabemos que la paridad de los
armnicos esfricos est dada por ( 1)l . Resulta por consiguiente que:
Un sistema de dos partculas idnticas sin spin slo puede tener estados de momento angular
orbital relativo par.
Sistema de dos partculas de spin 1/2
Por tratarse de Fermiones la funcin de onda del sistema = ( r1, r2 ) ( 1, 2 ) debe ser antisimtrica ante el intercambio de las partculas. Luego si ( r1, r2 ) es simtrica, ( 1, 2 ) debe ser
antisimtrica, y viceversa. Buscaremos entonces las funciones de spin de simetra definida.
La funcin de onda de spin de cada electrn es

( ms = 1 / 2)
ms ( ) =
( ms = 1 / 2)

(13.25)

luego ( 1, 2 ) debe ser una combinacin lineal de

1 2 , 12 , 1 2 , 1 2

(13.26)

S = S1 1 + 1 S2

(13.27)

Definimos ahora el spin total como

donde la notacin indica que el primer factor de los productos cartesianos S1 1 y 1 S2 opera
sobre el primer factor, y el segundo factor opera sobre el segundo factor de los (13.26). Puesto
190

13. Partculas idnticas


que S conmuta con H, elegiremos las ( 1, 2 ) de modo que sean autofunciones de S 2 y Sz ,
correspondiente a los autovalores h 2 S( S + 1) y hMS ( MS = S, S 1, K, S ). Usando las tcnicas
de operadores de los Captulos 10 y 11 es fcil verificar que S puede valer 0 o 1.
La nica autofuncin correspondiente a S = 0 es

0, 0 = 12 (12 1 2 ) ( S = 0, MS = 0)

(13.28)

y es antisimtrica respecto del intercambio de las variables de spin de las dos partculas. Los estados con S = 0 se denominan singletes.
Las tres autofunciones correspondientes a S = 1 son

1,1 = 1 2
( S = 1, MS = 1)
1
1, 0 = 2 (12 + 1 2 ) ( S = 1, MS = 0)
1, 1 = 12
( S = 1, MS = 1)

(13.29)

y son simtricas respecto del intercambio de las variables de spin de las dos partculas. Los estados con S = 1 se llaman tripletes.
Llegamos entonces a los siguientes resultados:
Los niveles de energa que corresponden a funciones orbitales simtricas se realizan cuando
el spin total del sistema es nulo (estados singlete).
Los niveles de energa que corresponden a funciones orbitales antisimtricas se presentan
cuando el spin total del sistema es igual a 1 (estados triplete).
Sistema de dos partculas de spin arbitrario s
En este caso se trata de Bosones si s es entero o de Fermiones si es semientero y claramente la
simetra de la funcin de onda total debe ser ( 1)2s . Por otra parte se puede demostrar que S
puede tener los valores 2 s, 2 s 1, , 0 (y para cada uno de ellos MS = S, S 1, K, S ), y que la
simetra de las S, MS est dada por ( 1)2s S . Resulta entonces que:
Para garantizar que tenga la simetra correcta, la simetra de la funcin orbital ( r1, r2 )
debe ser ( 1)S .
Por ejemplo si s = 1 el spin total S puede valer 2 (quintupletes, con 2,MS y ( r1, r2 ) simtricas),
1 (tripletes, con 1,MS y ( r1, r2 ) antisimtricas) o 0 (singletes, con 0, 0 y ( r1, r2 ) simtricas).
Correlaciones espaciales en un sistema de dos partculas idnticas
El hecho que la funcin de onda espacial de un sistema de partculas idnticas (Bosones o Fermiones) tiene simetra de intercambio definida hace que sus posiciones estn correlacionadas.
Para ver esto, consideremos dos partculas en estados cuyas funciones orbitales son p ( r ) y
q ( r ) (normalizadas pero no necesariamente ortogonales). Las funciones de onda espaciales
normalizadas simtrica y antisimtrica del sistema son, respectivamente

s =

a =

1
2(1 + * )
1
2(1 * )

[ p ( r1 ) q ( r2 ) + q ( r1 ) p ( r2 )]

(13.30)

[ p ( r1 ) q ( r2 ) q ( r1 ) p ( r2 )]

(13.31)

191

13. Partculas idnticas


donde el producto escalar = ( p , q ) da una medida de la falta de ortogonalidad de p y q .
Las correspondientes densidades de probabilidad son
Ps ( r1, r2 ) = s* s
=

(13.32)

1
| p ( r1 ) |2 | q ( r2 ) |2 + | q ( r1 ) |2 | p ( r2 ) |2 +2 Re[ *p ( r1 ) q ( r1 ) q* ( r2 ) p ( r2 )]
*
2(1 + )

y
Pa ( r1, r2 ) = s* s

(13.33)
1
=
| p ( r1 ) |2 | q ( r2 ) |2 + | q ( r1 ) |2 | p ( r2 ) |2 2 Re[ *p ( r1 ) q ( r1 ) q* ( r2 ) p ( r2 )]
2(1 + * )

Estas densidades de probabilidad determinan la probabilidad de encontrar una de las partculas


en el entorno de r1 , cuando la otra partcula est en el entorno de r2 .
Consideremos ahora el resultado (que podramos llamar clsico) que se obtendra si las dos partculas fuesen distinguibles. En este caso, los estados

pq ( r1, r2 ) = p ( r1 ) q ( r2 ) y qp ( r1, r2 ) = q ( r1 ) p ( r2 )

(13.34)

se deberan considerar distintos, e igualmente probables. Luego, la probabilidad que el sistema


est en cada uno de ellos valdra 1/2. Pero cuando el sistema est en el estado pq , la probabilidad de encontrar una partcula en el entorno de r1 y la otra en el entorno de r2 es
Ppq ( r1, r2 ) = | p ( r1 ) |2 | q ( r2 ) |2

(13.35)

Del mismo modo cuando el sistema est en el estado qp , la probabilidad de encontrar una partcula en el entorno de r1 y la otra en el entorno de r2 es
Pqp ( r1, r2 ) = | q ( r1 ) |2 | p ( r2 ) |2

(13.36)

Por consiguiente la expresin clsica de la densidad de probabilidad de un sistema de dos partculas idnticas pero distinguibles, cuando una de ellas est en el estado p y la otra en el estado
q , sin que sepamos a priori en qu estado est cada una de ellas es

1
1
PD ( r1, r2 ) = [ Ppq ( r1, r2 ) + Pqp ( r1, r2 )] = | p ( r1 ) |2 | q ( r2 ) |2 + | q ( r1 ) |2 | p ( r2 ) |2
2
2

(13.37)

Si comparamos esta expresin con las (13.32) y las (13.33) vemos que en general

Ps ( r1, r2 ) PD ( r1, r2 ) Pa ( r1, r2 )

(13.38)

y que las diferencias provienen del factor de normalizacin f = (1 + * )1 y de los trminos de


interferencia Is, a ( r1, r2 ) = 2 Re[ *p ( r1 ) q ( r1 ) q* ( r2 ) p ( r2 )].
Es importante notar que estas cantidades dependen del solapamiento de las funciones de onda
orbitales. Si p ( r ) y q ( r ) no se superponen (Fig. 13.1a) es evidente que = 0, luego f = 1, y
que adems Is, a ( r1, r2 ) = 0 . En este caso, se tiene que
192

13. Partculas idnticas

Ps ( r1, r2 ) = PD ( r1, r2 ) = Pa ( r1, r2 )

(13.39)

Por lo tanto los efectos de la indistinguibilidad se ponen de manifiesto solamente cuando las
funciones de onda de las dos partculas se solapan (como en la Fig. 13.1b). Si no hay solapamiento, esto es, en el lmite clsico, las partculas se comportan como si fuesen distinguibles.
(a)

(b)

Mq +x/

M p +x/

Mq +x/

M p +x/

Fig. 13.1. Cuando las funciones de onda de dos partculas idnticas no se solapan, como en
(a), p y q son ortogonales y los trminos de interferencia son nulos. Por lo tanto las posiciones de las partculas no estn correlacionadas, Ps = PD = Pa , y todo ocurre como si
fuesen distinguibles. En cambio cuando sus funciones de onda se solapan, como se indica
en (b), no es posible distinguir una de otra, y al calcular Ps y Pa aparecen trminos de interferencia entre pq y qp . Debido a ello las posiciones de las partculas estn correlacionadas y Ps PD Pa . En comparacin con lo que sucedera si fuesen distinguibles, todo
ocurre como si las partculas se repelieran cuando ( r1, r2 ) es antisimtrica, y se atrajeran
cuando es simtrica.
Es interesante ver cunto vale la probabilidad de encontrar las partculas en la misma posicin,
es decir cuando r1 = r2 = r . De las (13.32), (13.33) y (13.37) resulta
Ps ( r , r ) =

2
| p ( r1 ) |2 | q ( r2 ) |2 , PD ( r , r ) = | p ( r1 ) |2 | q ( r2 ) |2
*
(1 + )

, Pa ( r , r ) = 0 (13.40)

Luego cuando la funcin de onda espacial es antisimtrica, la probabilidad que las partculas se
encuentren en el mismo lugar es nula. En cambio, cuando la funcin de onda espacial es simtrica, la probabilidad que las partculas se encuentren en el mismo lugar es mayor que la que se
tendra si fuesen distinguibles. Todo ocurre como si las partculas se repelieran cuando ( r1, r2 )
es antisimtrica, y se atrajeran cuando es simtrica, se entiende respecto de lo que sucedera si
fuesen distinguibles.
Las densidades de probabilidad (13.32) y (13.33) son funciones de seis variables y no se pueden
visualizar en el espacio ordinario. Para que el lector se pueda hacer una idea intuitiva de las correlaciones espaciales entre dos partculas, consideremos un caso unidimensional, en que p ( x )
y q ( x ) son Gaussianas (Fig. 13.2), normalizadas y de igual ancho, separadas por una distancia
d (x y d se expresan en mltiplos del ancho de la Gaussiana).

p =

1/ 4

e 2 ( x d / 2)

, q =

193

1/ 4

e 2 ( x + d / 2)

(13.41)

13. Partculas idnticas


j q +x/

4

3

2

j p +x/

1

Fig. 13.2. Funciones de onda orbitales de dos partculas idnticas que se mueven en una
dimensin.
En la Fig. 13.3 se pueden apreciar las densidades de probabilidad clsicas Ppq ( x1, x2 ) y
Pqp ( x1, x2 ) dadas por las ecs. (13.35) y (13.36) y correspondientes a los dos estados igualmente
probables pq y qp . En la Fig. 13.4 se pueden apreciar los resultados cunticos (ecs. (13.32) y
(13.33)) para Ps ( x1, x2 ) y Pa ( x1, x2 ) , calculados para diferentes valores de d. Es fcil verificar
que el solapamiento de p ( x ) y q ( x ) disminuye exponencialmente con d. Para d = 4 el efecto
de la indistinguibilidad es insignificante, pero para valores de d prximos a la unidad, o menores, el efecto es muy importante.
La generalizacin de los resultados de esta Seccin a sistemas de ms de dos partculas idnticas
no es difcil, pero lleva a ciertas complicaciones. Por lo tanto no la presentamos aqu para no
extender demasiado este Captulo6.
d

4: M pq

0.4

0.4

0.3

0.3

Ppq +x1 ,x2 /s2 0.2


0.1

Pqp +x1 ,x2 /s2 0.2


0.1

4
2
x2 0

2
2
4

4

2

4: Mqp

2
x2 0

x1

2
2
4

4

2

x1

Fig. 13.3. Densidad de probabilidad para un sistema unidimensional de dos partculas


idnticas pero distinguibles descriptas por funciones de onda orbitales de forma Gaussiana,
separadas por una distancia d = 4. Los diagramas corresponden a los dos estados igualmente probables pq y qp .

El lector interesado puede encontrar una discusin de este tema en el libro Quantum Mechanics de L. D. Landau y

L. M. Lifschitz (Pergamon).

194

13. Partculas idnticas


d

4: j s

0.4

0.4

0.3

0.3

Ps+x1 ,x2 / 0.2


0.1

Pa+x1 ,x2 / 0.2


0.1

4
x2 0

2
0
2

x2 0

x1

2

2

4

4

4

1:j s

1:j a

0.4

0.3

0.3

Ps+x1 ,x2 / 0.2


0.1

Pa+x1 ,x2 / 0.2


0.1

4
0
2

2
2

x2 0

x1

2
0

2

2

4

4

4

4

0: j s

0:j a

0.4

0.4

0.3

0.3

Ps+x1 ,x2 / 0.2


0.1

Pa+x1 ,x2 / 0.2


0.1

2
0

2
4

2

x1

x2 0

4

0.4

x2 0

2
2

4:j a

2
x2 0

x1

2
0

2
4

4

x1

2

x1

4

Fig. 13.4. Densidad de probabilidad para un sistema unidimensional de dos partculas descriptas por funciones de onda orbitales de forma Gaussiana, separadas por diferentes distancias d. Los diagramas de la izquierda corresponden a funciones simtricas y los de la
derecha a funciones antisimtricas.
195

13. Partculas idnticas

El tomo de helio
Como aplicacin de la teora que hemos expuesto vamos a estudiar los estados estacionarios del
tomo de helio. Observamos que el Hamiltoniano H del sistema no depende de las variables de
spin de las partculas, puesto que hemos despreciado los efectos de spin y otras interacciones
magnticas en los Hi ( r , p) . Para simplificar el tratamiento vamos ignorar en un primer momento
la repulsin entre los electrones, ya que no queremos aqu hacer un tratamiento exacto, y de esa
forma resultar ms claro el rol de la indistinguibilidad. Con esta aproximacin, que llamaremos
de orden 0, la energa total depende solamente de n1 y n2 .
La funcin de onda del sistema se puede escribir como el producto de una funcin de las variables espaciales ( r1, r2 ) por una funcin S, M de las variables de spin, de la forma

( r1, 1, r2 , 2 ) = ( n,l, ml )1 ,( n,l, ml )2 ( r1, r2 ) S, M

(13.42)

Pero debe ser antisimtrica ante el intercambio ( r1, 1 ) ( r2 , 2 ) , y S, M es simtrica si


S = 1 y antisimtrica si S = 0 . Luego ( n,l, ml )1 ,( n,l, ml )2 , debe ser antisimtrica para los estados
triplete y simtrica para los estados singlete.
Por lo tanto, si los electrones ocupan los estados (n, l, ml )1 y (n, l, ml )2 , la funcin de onda espacial del sistema es

triplete =

1 [
( nlml )1 ( r1 ) ( nlml ) 2 ( r2 ) ( nlml ) 2 ( r1 ) ( nlml )1 ( r2 )]
2

(13.43)

1 [
( nlml )1 ( r1 ) ( nlml ) 2 ( r2 ) + ( nlml ) 2 ( r1 ) ( nlml )1 ( r2 )]
2

(13.44)

para los estados triplete, y

singlete =

para los estados singlete. En estas frmulas

nlml ( r ) = Rnl (r )Ylml ( , )

(13.45)

donde Rnl (r ) es la funcin radial hidrogenoide correspondiente a Z = 2 e Ylml ( , ) es un armnico esfrico.


El hecho que ( r1, r2 ) es antisimtrica para los estados triplete y simtrica para los estados singlete trae aparejada una profunda diferencia entre los primeros (que se suelen denominar ortohelio) y los segundos (parahelio). Veremos, en efecto, que la energa de los estados depende
del spin, a pesar que las variables de spin no aparecen en H.
Antes de proseguir es oportuno hacer una breve digresin para aclarar al lector en qu consiste la
notacin espectroscpica, dado que se usa muy frecuentemente en la literatura. Se trata de una
forma compacta de designar los niveles de energa de los tomos con varios electrones. Para ello
se cita primero la configuracin a la que pertenecen, y a continuacin se indica el autovalor del
momento angular orbital total L = L1 + L2 + con las letras maysculas S, P, D, F, que llevan como superndice el spin total S = S1 + S2 + (representado por el nmero 1 si es singlete,
3 si es triplete, etc.). Queda definido as lo que se denomina un trmino espectral7, por ejemplo

Ms precisamente, un trmino LS, pues hay otras formas de acoplar los momentos angulares orbitales y de spin de

los varios electrones

196

13. Partculas idnticas


3

P es un trmino caracterizado por S = 1 y L = 1. Como veremos en seguida, debido a la repulsin Coulombiana entre los electrones los diferentes trminos de una configuracin tienen distintas energas. Si adems se toman en cuenta los efectos relativsticos (efecto spin-rbita), los
estados pertenecientes a un mismo trmino se separan ulteriormente en energa, de acuerdo con
el autovalor J de su momento angular total J = L + S ( L2 , S 2 y J son constantes del movimiento
para un tomo aislado que no est sometido a campos magnticos externos). Por lo tanto, para
terminar de identificar el nivel de energa, se agrega a la designacin del trmino el valor de J
como subndice, por ejemplo el trmino 3P da lugar a tres niveles diferentes: 3P2, 3P1, y 3P0. A
cada uno de estos niveles le pertenecen 2 J + 1 estados, que se identifican por el autovalor MJ
( = J , J 1, , J ) correspondiente a la proyeccin de J sobre el eje z (arbitrario). As 1S0 indica que el nivel tiene spin total nulo, momento angular orbital nulo y momento angular total
nulo (siempre que J = 0 el nivel tiene un nico estado). Del mismo modo 3P1 indica los tres estados con L = 1, S = 1, J = 1 y M J = 1, 0, 1 . En ausencia de campos externos, los 2 J + 1 estados de un dado nivel estn degenerados. De esta manera, la notacin espectroscpica identifica
inequvocamente los niveles de energa atmicos, y las transiciones que ocurren entre ellos que
dan lugar a las lneas espectrales.
Hechas estas aclaraciones, volvemos a los estados estacionarios del tomo de helio. El estado
fundamental corresponde a la configuracin 1s2, en la cual ambos electrones estn en el estado
de partcula individual de menor energa, esto es cuando (n, l, ml )1 = (n, l, ml )2 = (1, 0, 0) . En esta
configuracin hay un nico estado, que es obviamente un singlete, y en la notacin espectroscpica se designa como 1s2 1S0 (no hay estados triplete cuando (n, l, ml )1 = (n, l, ml )2 ).
Los estados excitados de menor energa se originan en configuraciones del tipo 1s2s, 1s2p, 1s3s,
1s3p, 1s3d, etc., y como se ve consisten en dejar un electrn del estado fundamental 1s2 1S0 en el
estado 1s y excitar el segundo electrn a un estado de mayor energa. Los trminos que resultan
pueden ser tanto singletes como tripletes. En esos casos, los tripletes tienen menor energa que
los correspondientes singletes. Esto se puede ver si se calcula el efecto de la repulsin Coulombiana entre los electrones, que hasta ahora no hemos considerado. Podemos estimar fcilmente
este efecto calculando el valor medio del potencial de interaccin entre los electrones

Vi =

e2
| r1 r2 |

(13.46)

Si calculamos el valor esperado de Vi para los estados de un triplete obtenemos


Vi,triplete = tripleteVi triplete dr1dr2 = D I

(13.47)

donde hemos introducido la notacin

D = 1* ( r1 ) 2* ( r2 )Vi1 ( r1 ) 2 ( r2 )dr1dr2
I = 2* ( r1 )1* ( r2 )Vi1 ( r1 ) 2 ( r2 )dr1dr2

(13.48)

y para abreviar las frmulas escribimos (n, l, ml )1 1 y (n, l, ml )2 2 .


Del mismo modo para los estados del singlete que proviene de la misma configuracin resulta
Vi,singlete = singleteVi singlete dr1dr2 = D + I

197

(13.49)

13. Partculas idnticas


Las integrales D e I se denominan respectivamente integral directa e integral de intercambio y
son positivas. La integral directa representa el valor medio clsico de la energa potencial de interaccin electrosttica entre dos distribuciones de carga de densidades ( r1 ) = e | 1 ( r1 ) |2 y
( r2 ) = e | 2 ( r2 ) |2 y es el resultado que se tendra si los electrones se pudieran distinguir uno
de otro. Su efecto es romper la degeneracin entre las configuraciones con el mismos n pero diferente l. La integral de intercambio es un efecto puramente cuntico debido a la indistinguibilidad de los electrones.
La presencia de la integral de intercambio I aumenta la energa potencial de repulsin de los estados del singlete y disminuye la de los pertenecientes al triplete respecto del valor clsico dado
por la integral directa. Por tal motivo los tripletes que provienen de una configuracin 1snl tienen siempre menor energa que los singletes de la misma configuracin. Es fcil comprender
porqu debe ser as. En efecto, la funcin de onda orbital de los tripletes es antisimtrica, por lo
tanto trmino medio los electrones estn ms lejos el uno del otro que en los singletes, que tienen una funcin de onda orbital simtrica. Por consiguiente el efecto de repulsin es menor en
los tripletes que en los singletes. La Fig. 13.5 muestra en forma esquemtica como se rompe la
degeneracin de los diferentes trminos espectrales de las configuraciones 1s2s y 1s2p del tomo
de helio.
E

Orden 0

Repulsin Coulombiana
1s2p 1P1

Efecto spin-rbita
1s2p 1P1

I
1s2p
1s2p 3P2
1s2p 3P1
1s2p 3P0

1s2p 3P2,1,0
D
1s2s

1s2s 1S0

1s2s 1S0

1s2s 3S1

1s2s 3S1

D
1s2s

1s2p

Fig. 13.5. Diagrama cualitativo que muestra como se rompe la degeneracin de los niveles
de las configuraciones 1s2s y 1s2p del tomo de helio. Al orden 0, esto es si ignoramos la
repulsin entre los electrones, todos estos estados tienen la misma energa. El trmino directo D aumenta de manera diferente las energas de estas dos configuraciones. El trmino
de intercambio I separa los trminos triplete y singlete de cada configuracin. Por ltimo
el efecto spin-rbita separa los diferentes niveles de cada trmino.
Las caractersticas que acabamos de comentar se observan tambin en los resultados de clculos
ms exactos que el que hemos presentado aqu. En la Fig. 13.6 se muestra un esquema de los
primeros trminos del tomo de helio (la separacin de los niveles de cada trmino por el efecto
spin-rbita es demasiado pequea para ser apreciada en el diagrama). Los clculos tericos ms
198

13. Partculas idnticas


precisos de los niveles de energa muestran un excelente acuerdo con los datos observacionales
(la discrepancia es apenas del orden de una parte en 107).
parahelio (S = 0)

E (eV)

ortohelio (S = 1)

54
54.4
55
4s
55.41
56

3s
56.08

4p
55.27

4d
55.27

3p
55.93

3d
55.92

4f
55.27

4s
55.53
3s
56.29

4p
55.30

4d
55.27

3p
56.00

3d
55.93

4f
55.27

2p
57.79
57

2p
58.04

58
2s
58.39
59

2s
59.18

60

1s
79

Fig. 13.6. Esquema de los primeros trminos espectrales del tomo de helio, provenientes
de configuraciones del tipo 1snl. Para mayor claridad se han colocado en la parte izquierda
los singletes (parahelio) y a la derecha los tripletes (ortohelio). Para que el grfico resulte
ms legible omitimos escribir en las leyendas que identifican cada trmino el 1s que est
presente en todas estas configuraciones, dndolo por sobreentendido. Tampoco hemos escrito el nombre del trmino, porque es obvio. Por ejemplo el trmino designado 3d del parahelio, cuya energa es de 55.92 eV es claramente 1D y el trmino del ortohelio designado 4p (a 55.3 eV) es 3P. La zona gris por encima de 54.4 eV corresponde al espectro
continuo (el potencial de ionizacin del helio es de 24.6 eV, que sumados a la energa de
79 eV del estado fundamental dan precisamente 54.4 eV).

199

14. Segunda cuantificacin

14. SEGUNDA CUANTIFICACIN


En este Captulo presentaremos las tcnicas para tratar sistemas cunticos de muchas partculas
idnticas (Bosones o Fermiones). Cuando se estudian sistemas de muchas partculas idnticas
con interacciones arbitrarias es til emplear un formalismo especial, denominado segunda cuantificacin, que fue desarrollado en 1927 por Paul A. M. Dirac para los Bosones y extendido a los
Fermiones por Eugene Wigner y Pascual Jordan en 1928. La importancia y utilidad de la segunda cuantificacin estriba en que permite tomar en cuenta automticamente en los clculos los
aspectos combinatorios que derivan de la estadstica apropiada al tipo de partculas del sistema.
Adems facilita extender la Mecnica Cuntica no relativstica a sistemas en los cuales el
nmero de partculas no es una constante del movimiento. Dicha extensin es necesaria para
describir los fenmenos que se presentan en el dominio relativstico.
No es imprescindible usar ese formalismo (que de hecho no se suele tratar en los textos introductorios) para presentar las estadsticas cunticas, pero los argumentos empleados para deducirlas son de todos modos equivalentes a los que se usan para introducir la segunda cuantificacin, por lo tanto creemos que se justifica el esfuerzo necesario para aprender esta tcnica.

Segunda cuantificacin de sistemas de Bosones


Trataremos primero los sistemas de Bosones. Como punto de partida supongamos conocer un
sistema completo de autofunciones ortonormales de una partcula:

1 ( ), 2 ( ),

(14.1)

Estas autofunciones pueden corresponder, por ejemplo, a los estados estacionarios de la partcula
en un campo de fuerzas externas v( ) . Destacamos que dicho campo se puede elegir arbitrariamente, y no tiene porqu coincidir con el campo real al cual estn sometidas las partculas
del sistema bajo estudio. La variable indica el conjunto de las variables espaciales r y de spin
de una partcula, y los subndices 1, 2, representan los nmeros cunticos que identifican la
autofuncin.
Consideremos ahora del punto de vista puramente formal un sistema de n Bosones que no interactan y que estn sometidos a v( ) . Si el sistema est en un estado estacionario, cada una de
las partculas que lo componen se encuentra en uno de los estados 1 ( ), 2 ( ), . Sea ni el
nmero de partculas que estn en el estado i ; ni se denomina el nmero de ocupacin o la poblacin de dicho estado y puede ser nulo (si n es finito, as ocurre para infinitos i) o tomar cualquier valor entero positivo n . Claramente, la enunciacin de todos los nmeros de ocupacin
de los estados i determina el estado del sistema, que queda especificado por

n1, n2 , enteros no negativos tales que

ni = n

(14.2)

Los usaremos entonces para designar la funcin de onda del sistema, y escribiremos

n = n;n1 , n2 ,

(14.3)

Nos proponemos ahora construir un formalismo en el cual los nmeros de ocupacin jueguen el
rol de variables independientes, en vez de las variables habituales 1, 2 , , n de las partculas.

200

14. Segunda cuantificacin


El espacio de nmeros de ocupacin para Bosones
De acuerdo a lo ya visto n;n1 , n2 , se debe expresar como la suma simetrizada (ec. (13.17)) de
los productos de todas las i cuyo nmero de ocupacin no es nulo. Tendremos N s = n! pues
las i son ortonormales. Por lo tanto

n;n1 , n2 , =

1
P [ p1(1 ) p2 (2 ) pn (n )]
n! P

(14.4)

donde la sumatoria abarca todas las n! permutaciones de los n argumentos 1, 2 ,, n . Para que
no haya confusin con los subndices de las y de los nmeros de ocupacin, tendremos cuidado con la notacin. Esto es engorroso, pero lo precisamos solamente para introducir el formalismo, ya que una vez completada esa tarea quedar una notacin simple, sinttica y elegante.
Con los subndices 1, 2, , i, designamos los infinitos estados (14.1) de una partcula. Con
los subndices p1, p2, , pn indicamos los nmeros cunticos del estado ocupado por cada una
de las partculas. Como en un dado estado puede haber ms de una partcula, usamos los subndices r1, r 2, , rq ( 1 q n ) para designar los q diferentes estados r1, r 2 , , rq ocupados
por las partculas. Entonces en la lista de nmeros de ocupacin que identifican a , aparecen
ceros para todos los ni con i r1, r 2, , rq . Como el estado rj est ocupado por nrj partculas,
rj aparece nrj veces (con diferentes argumentos) en los productos p1 (1 ) p2 (2 ) pn (n )
de la (14.4). Por lo tanto tendremos que

p1 = p2 == pnr1 r1
p(nr1 + 1) = p(nr1 + 2) == p(nr1 + nr 2 ) r 2

p(nr1 + nr 2 ++ nr ( q 1) + 1) = p(nr1 + nr 2 ++ nr ( q 1) + 2) == pn rq

(14.5)

La (14.4) no es todava una forma til de escribir n;n1 , n2 , porque no figuran explcitamente en
ella los nmeros de ocupacin n1, n2 , , que queremos usar como variables independientes.
Adems (salvo cuando todos los ni no nulos son iguales a la unidad) en la (14.4) hay muchos
trminos iguales, que resultan de permutar entre s las variables asignadas a cada uno de los q
conjuntos ( p1, p2 ,, pnr1 ), ( p( nr1 +1) , p( nr1 + 2 ) ,, p( nr1 + nr 2 ) ), etc. de autofunciones
idnticas. En vista de esto escribiremos n;n1 , n2 , de forma que no figuren trminos repetidos.
Para eso consideraremos todas las maneras distintas de repartir los argumentos 1, 2 ,, n en q
grupos de nr1, nr 2 , , nrq elementos cada uno (sin que importe el orden dentro de cada grupo),
para asignar esos grupos como argumentos de los conjuntos de nr1, nr 2 , , nrq autofunciones
idnticas r1, r 2 ,, rq de los q diferentes estados ocupados. Para saber cuntos trminos distintos hay en la expresin de n;n1 , n2 , calcularemos el nmero de tales reparticiones.
Recordemos algunas nociones de combinatoria. Un conjunto de r objetos elegidos (sin que importe en que orden) de un conjunto de n objetos ( r n ) es una combinacin C(n; r ) de n objetos
tomados de a r por vez. El nmero N [C (n; r )] de combinaciones diferentes es1

El primer objeto se puede elegir de n maneras diferentes, el segundo de n 1 maneras, y as siguiendo hasta llegar

al r-simo que se puede elegir de n r + 1 maneras. Como no importa el orden en que se elijan, hay que dividir el
producto n(n 1)( n r + 1) por r! y resulta la (14.6). N[C(n,r)] es igual al coeficiente binomial, esto es, el
coeficiente de urvn r en la expansin de ( u + v)n.

201

14. Segunda cuantificacin

N [C (n; r )] =

n!
n

r!(n r )! r

(14.6)

Despus de realizar una cualquiera de las posibles C(n; r ) , nuestro conjunto inicial queda reducido a n r elementos. Si entre estos elementos elegimos ahora s (sin que importe en que orden)
tendremos N [C (n r; s)] combinaciones C(n r; s) diferentes. Del conjunto residual de
n r s elementos podemos elegir t elementos (siempre sin que importe en que orden) y tendremos N [C (n r s; t )] combinaciones C(n r s; t ) distintas. De esta forma podemos continuar hasta agotar el ltimo conjunto residual y habremos repartido los n elementos del conjunto
inicial entre Q conjuntos de r, s, t, elementos cada uno. Designaremos con R (n; r, s, t,) a
cada una de estas reparticiones2. Claramente, el nmero de reparticiones diferentes
N [R (n; r, s, t,)] est dado por
N [R (n; r, s, t,)] = N [C (n; r )] N [C (n r; s)] N [C (n r s; t )]

(14.7)

Por lo tanto, usando la (14.6) obtenemos3

N [R (n; r, s, t,)] =

n!
n

r! s!t! r, s, t,

(14.8)

Volviendo a n;n1 , n2 , , la escribiremos entonces como


1/ 2
nr1! nr 2 ! nrq !
n;n1 , n2 , =
R [ p1 (1 ) p2 (2 ) pn (n )]

R
n!

(14.9)

donde la suma abarca todas las diferentes reparticiones R (n; nr1, nr 2 ,, nrq ) de los argumentos
1, 2 ,, n en q conjuntos de nr1, nr 2 , , nrq elementos cada uno (sin que importe el orden),
para asignarlos a las nr1, nr 2 , , nrq autofunciones idnticas r1, r 2 ,, rq correspondientes a
los q estados ocupados. Por lo que acabamos de ver, el nmero de reparticiones diferentes, esto
es, el nmero de trminos de la sumatoria en la (14.9) es
N [R (n; nr1, nr 2 ,, nrq )] =

n!
nr1! nr 2 ! nrq !

(14.10)

Por consiguiente n;n1 , n2 , est correctamente normalizada, pues en virtud de la ortonormalidad


de las i , al calcular (n;n1 , n2 , ,n;n1 , n2 , ) los nicos trminos que dan una contribucin no
nula son los cuadrados de los mdulos de los sumandos de la (14.9), y cada uno de ellos da una
contribucin igual a la unidad4. La (14.9) es la expresin que necesitamos: tiene la simetra
correcta, y en ella figuran explcitamente los nmeros de ocupacin n1, n2 , .
El conjunto de las funciones (14.9) para todos los (infinitos) posibles juegos de valores de los
nmeros de ocupacin, con
2
3

Tambin llamadas distribuciones.


El nmero de reparticiones diferentes N[R(n;r,s,t,)] es igual al coeficiente multinomial, esto es, el coeficiente de

u v wt en la expansin de ( u + v + w +)n.
r s

En efecto, es fcil ver que los trminos de la sumatoria (14.9) son ortogonales.

202

14. Segunda cuantificacin

n1, n2 , enteros no negativos tales que

ni = n

(14.11)

cumple las relaciones de ortonormalidad

(n;n1 , n2 , ,n;n1 , n2 , ) = n1 , n1 n2 ,n2

(14.12)

y es una base ortonormal completa en trminos de la cual podemos representar cualquier estado
de n Bosones. El espacio generado por las funciones bsicas n;n1 , n2 , se llama espacio de nmeros de ocupacin de n partculas y se indica con En.
Procediendo de esta manera podemos construir los espacios de nmeros de ocupacin para cualquier valor de n: 0, 1, 2, ., etc., que corresponden a los estados de sistemas con 0 (el vaco),
1, 2, , etc. partculas. El espacio E definido como

E = E0 E1 E2 En

(14.13)

se llama espacio de nmeros de ocupacin. En este espacio los n1, n2 , juegan el rol de variables independientes. Los diferentes En son subespacios de E y claramente son ortogonales entre
s. Las variables ordinarias 1, 2 ,, n del espacio de configuraciones no figuran explcitamente
en el formalismo basado en el espacio de nmeros de ocupacin, aunque naturalmente siguen
estando presentes como argumentos de las funciones bsicas. Estas ltimas, por supuesto, estn
definidas en el espacio de configuraciones de las n partculas.
Elementos de matriz de operadores en el espacio de nmeros de ocupacin
Veremos ahora de qu manera se expresan en el espacio En los operadores que representan los
observables de un sistema de n partculas.
Consideremos un operador f (1) que representa una variable dinmica f de una partcula (por
ejemplo el impulso p). Su efecto sobre cualquier estado de la partcula se puede calcular a partir
de sus elementos de matriz calculados con las autofunciones de nuestro sistema ortonormal
completo (14.1). Estos elementos de matriz son
i

f (1) k = ( i ( ), f (1) k ( )) = i* ( ) f (1) k ( )d

(14.14)

y por lo tanto son cantidades conocidas una vez que se ha fijado el sistema (14.1). Claramente,
i
los elementos diagonales f (1)i representan los valores esperados de f (1) en los estados i ( ) y
i
los elementos fuera de la diagonal f (1) k ( i k ) representan las transiciones de los estados k ( )
a los estados i ( ) inducidas por el operador f (1) .
Sea fa(1) al operador que representa f para la a-sima partcula, esto es, el operador que acta
solamente sobre las variables a ( a = 1, 2, , n ). El correspondiente operador simtrico respecto de todas las partculas del sistema (por ejemplo el impulso total P) se define como
F (1) = fa(1)

(14.15)

El efecto de F (1) sobre cualquier estado del sistema de n partculas se puede calcular si se conoce su efecto sobre las funciones bsicas n;n1 , n2 , . Determinaremos por consiguiente los
elementos de matriz de F (1) , que se definen como

203

14. Segunda cuantificacin


n; n , n ,

F (1)n;n11 , n22 , = (n;n1 , n2 , , F (1)n;n1 , n2 , )

(14.16)

Cada uno de los sumandos de la (14.15) opera sobre las variables de una partcula, luego tiene
efecto solamente sobre una de las funciones de los productos p1 (1 ) p2 (2 ) pn (n ) que
figuran en las n . Consideremos la contribucin al elemento de matriz (14.16) debida a uno
cualquiera de los fa(1) , que opera sobre las variables a . Claramente los elementos diagonales de
fa(1) contribuyen solamente a los elementos diagonales
n; n , n ,

F (1)n;n11 , n22 , = (n;n1 , n2 , , F (1)n;n1 , n2 , )

(14.17)

que corresponden a que los nmeros de ocupacin n1, n2 , quedan inalterados. En cambio, los
elementos fuera de la diagonal de fa(1) , que corresponden a transiciones de la partcula desde uno
de los estados 1 , 2 , a otro, van a contribuir solamente a aquellos elementos de la matriz
(14.16) para los cuales el nmero de ocupacin del estado inicial de la partcula disminuye en
una unidad y el nmero de ocupacin del estado final aumenta en una unidad.
Es evidente entonces que los nicos elementos de matriz (14.16) no nulos van a ser: (a) los elementos diagonales, y (b) aquellos elementos fuera de la diagonal tales que uno de los nmeros
de ocupacin aumenta en 1 y otro disminuye en 1. Al hacer las cuentas hay que tener presente
que las integrales (14.14) no dependen de como se designe la variable de integracin, y por lo
i
tanto ( i (a ), fa(1) k (a )) = f (1) k para todo a.
El elemento diagonal (14.17) es el valor esperado de F (1) en el estado n;n1 , n2 , . Se obtiene
n , n ,

F (1) = F (1)n11 , n12 , = ni f (1)i

(14.18)

Los elementos no diagonales diferentes de cero son


n , n 1

F (1)nii 1k, nk = ni nk f (1) k

(14.19)

Aqu para aligerar la notacin hemos omitido escribir en la designacin del elemento de matriz
los nmeros de ocupacin que no cambian, dndolos por sobreentendidos. La (14.19) es la expresin del elemento de matriz de F (1) correspondiente a la transicin de una partcula desde el
estado k al estado i . Por lo tanto el nmero de ocupacin5 del estado k disminuye en una
unidad pasando de nk a nk 1, el del estado i pasa de ni 1 a ni , y los dems nmeros de
ocupacin no cambian.
Dada la importancia de estos resultados, mostraremos como se llega a ellos. El clculo es un
tanto engorroso pero simple. Para calcular F (1) vamos a escribir n;n1 , n2 , en la forma
1/ 2
nr1! nrq !
n;n1 , n2 , =
n,R

R
n!

, n,R = R [ p1 (1 ) pn (n )]

donde R = R (n; nr1,, nrq ) . Entonces

De la forma que hemos escrito los nmeros de ocupacin en la (14.19) se tiene que n = ni 1.

204

(14.20)

14. Segunda cuantificacin

F (1) =

nr1! nrq !
n!

( n,R , fa(1) n,R ) =


R R

nr1! nrq !
n!

( n,R , fa(1) n,R )


R

(14.21)

La ltima igualdad de la (14.21) se cumple porque


( n,R , fa(1) n,R ) = 0 si R R

(14.22)

Por otra parte, es fcil verificar que para toda R (n; nr1,, nrq ) resulta
q

( n,R , fa(1) n,R ) =


a

nrj f (1)q jj = ni f (1)i


j =1

(14.23)

Recordando que N [R (n; nr1, nr 2 ,, nrq )] est dado por (14.10) se llega al resultado (14.18).
Calculemos ahora el elemento de matriz no diagonal (14.19). Al usar la expresin (14.9) para
escribir n;n1 , n2 , debemos recordar que uno de los estados ocupados r1, r 2 ,, rq es i
(digamos, por ejemplo, que rs = i ), adems nk = nk 1, ni = ni y nj = n j para todo rj i, k ,
luego en el coeficiente de normalizacin figura (nk 1)!. Del mismo modo al escribir n;n1 , n2 ,
debemos poner rt = k (pues el estado k est ocupado) y recordar que el nmero de ocupacin
del estado i es ni 1 , luego en el coeficiente de normalizacin figura (ni 1)!. Por lo tanto
n , n 1

F (1)nii 1k, nk =

nr1! nrq !
n!

1
ni nk

( ni , nk 1, fa(1) ni 1, nk )

(14.24)

donde hemos escrito

ni 1, nk = R [ p 1 (1 ) p 2 (2 ) p n (n )]
R

ni , nk 1 = R [ p1 (1 ) p2 (2 ) pn (n )]

(14.25)

y usamos para recordar que debido al cambio de estado de una partcula algunos de los nmeros cunticos de los estados ocupados de n;n1 , n2 , , ni 1, , nk , difieren de los que designan
los estados ocupados de n;n1 , n1 , , ni , , nk 1, .
Calculemos un trmino cualquiera de la sumatoria de la (14.24), por ejemplo la contribucin de
f1(1) , esto es ( ni , nk 1, f1(1) ni 1, nk ) . Puesto que f1(1) acta sobre las variables 1, debemos tener
p1 (1 ) = k (1 ) y p1 (1 ) = i (1 ) . Asimismo, debido a la ortogonalidad de las j , las nicas reparticiones R y R de los argumentos de las otras j ( j i, k ) de ni 1, nk y ni , nk 1 que
dan contribuciones no nulas son aquellas para las cuales p 2 = p2 , p 3 = p3 , ,
p n = pn . Estas reparticiones consisten en distribuir los n 1 argumentos restantes
( 2 , 3 ,, n ) entre ni 1 estados i , nk 1 estados k , y los dems estados cuyos nmeros de
ocupacin no han cambiado. El nmero de reparticiones diferentes que contribuyen es entonces

(n 1)!
nr1!(ni 1)!(nk 1)!, nrq !
ni nk (n 1)!
=
nr1! ni ! nk !, nrq !

N [R (n 1; nr1,, ni 1,, nk 1,, nrq )] =

205

(14.26)

14. Segunda cuantificacin


i

Cada una de ellas aporta el elemento de matriz f (1) k . Idntico resultado se obtiene al calcular la
i
contribucin de f2(1) , f3(1) , , etc. (pues el valor de f (1) k no depende de como se designe la variable de integracin en la (14.14)). Puesto que hay n de estas contribuciones, obtenemos que
ni nk n!
i
f (1) k
r1!, nrq !

( ni , nk 1, fa(1) ni 1, nk ) = n
a

(14.27)

Sustituyendo (14.27) en (14.24) obtenemos finalmente la (14.19).


Los resultados (14.18) y (14.19) nos muestran que los elementos de matriz de cualquier operador
de una partcula del tipo F (1) entre los estados base de un sistema de n partculas estn determinados por los nmeros de ocupacin n1, n2 , y por los elementos de matriz (14.14) entre estados de una partcula, que son cantidades conocidas. Las expresiones (14.18) y (14.19) permiten
entonces calcular el efecto de F (1) sobre cualquier estado n de n partculas, pues en virtud de
la completitud del sistema de estados base es siempre posible expresar n como un combinacin
lineal de las n;n1 , n2 , .
La expresin del valor esperado de F (1) tiene una interpretacin sencilla: cada partcula contribuye a F (1) con el valor esperado de f (1) correspondiente al estado en que se encuentra. Puesto
que para cada i hay ni partculas en el estado i , se obtiene la (14.18).
En cuanto al elemento de matriz no diagonal (14.19), que corresponde a la transicin k i
de una partcula, vemos que depende solamente de los nmeros de ocupacin nk y ni de los estados involucrados, y es independiente de los dems nmeros de ocupacin y del nmero total
de partculas n del sistema. Es, adems, proporcional al elemento de matriz de una partcula
i
f (1) k correspondiente a esa transicin.
La probabilidad Pk i que el operador F (1) induzca la transicin k i es igual al cuadrado
del mdulo del correspondiente elemento de matriz. Como f (1) es Hermitiano tenemos entonces
i 2

Pk i = ni nk f (1) k = ni nk f (1) k f (1)i

(14.28)

Recordemos que nk es el nmero de partculas que ocupaban el estado k antes que se produjera la transicin y que ni es el nmero de partculas que ocupan el estado i despus que tuvo
lugar. Por lo tanto, la (14.28) nos dice que la probabilidad que se produzca una transicin de una
partcula del sistema a partir de un estado k es proporcional al nmero de partculas que ocupan dicho estado, lo cual es lgico. Tambin es lgico que Pk i no dependa de la poblacin de
los estados que no estn involucrados en la transicin. Pero adems Pk i es proporcional a ni
(que es la cantidad de partculas que quedan en el estado de llegada i de resultas de la transicin: una ms de las que haba antes). Este resultado (cuyo origen puede parecer misterioso)
muestra que cuanto mayor es la poblacin de un estado, tanto ms probable es una transicin
que agregue una partcula ms. La tendencia de las partculas a acumularse6 es caracterstica de
los Bosones. El origen de esta tendencia se aclara si se considera la probabilidad Pi k de la transicin inversa i k . Evidentemente
k2

Pi k = ni nk f (1)i
6

= ni nk f (1) k f (1)i = Pk i

(14.29)

Se entiende que se trata de una acumulacin, o condensacin, en el espacio de nmeros de ocupacin. El lector no

se debe confundir y pensar que es una condensacin en el espacio fsico ordinario.

206

14. Segunda cuantificacin


de modo que

Pi k = Pk i

(14.30)

Este ltimo resultado se conoce como la condicin de balance detallado, y se puede demostrar
que debe valer si la dinmica del sistema es invariante frente a la reversin temporal. Comparando (14.28) y (14.29) debe resultar claro entonces que si la probabilidad que se produzca una
transicin es proporcional al nmero de partculas que ocupan el estado de partida, necesariamente debe ser tambin proporcional al nmero de partculas que quedan en el estado de llegada.
Si as no fuera, no se podra cumplir la condicin de balance detallado.
Operadores de aniquilacin y de creacin de Bosones
Para continuar nuestro desarrollo de un formalismo cuyas variables independientes son los nmeros de ocupacin, es preciso encontrar la forma de representar las variables dinmicas del
sistema por medio de operadores que acten sobre los nmeros de ocupacin (y no sobre funciones de las variables j del espacio de configuraciones). Para eso vamos a introducir los operadores fundamentales ai de la segunda cuantificacin, que operan directamente sobre las variables
n1, n2 , (usamos para indicar que el operador acta sobre los nmeros de ocupacin, y distinguirlo de los operadores que actan sobre las variables del espacio de configuraciones). Los
definiremos especificando su efecto sobre las funciones bsicas n;n1 , n2 , del espacio de nmeros de ocupacin E del modo siguiente
ain;n1 , n2 , , ni , = ni n 1;n1 , n2 , , ni 1,

(14.31)

Es decir: el efecto de ai es reducir en una unidad el nmero de ocupacin del estado i y multiplicar la nueva funcin por ni . Por este motivo ai se denomina operador de aniquilacin (de una
partcula en el estado i). Notar que ai reduce en una unidad el nmero total de partculas, de
modo que transforma funciones del subespacio En en funciones del subespacio En1 . Podemos
representar ai por medio de una matriz, cuyos nicos elementos no nulos son

ai nni 1 = (n 1;n1 , , ni 1, , ain;n1 , , ni , ) = ni


i

(14.32)

De acuerdo con la definicin (7.92) el operador ai adjunto de ai cumple


( ain 1;n1 , , ni 1, ,n;n1 , , ni , ) = (n 1;n1 , , ni 1, , ain;n1 , , ni , )

(14.33)

Tomando el complejo conjugado de esta expresin encontramos que


(n;n1 , , ni , , ain 1;n1 , , ni 1, ) = ( ain;n1 , , ni , ,n 1;n1 , , ni 1, ) = ni (14.34)

Por lo tanto se tiene que los nicos elementos de matriz no nulos de ai son
n

aini 1 = (n;n1 , , ni , , ain 1;n1 , , ni 1, ) = ni


i

de modo que

207

(14.35)

14. Segunda cuantificacin


a in 1;n1 , , ni 1, = ni n;n1 , , ni ,

(14.36)

que con el cambio ni ni 1 podemos escribir de la forma


ain;n1 , , ni , = ni + 1 n +1;n1 , , ni +1,

(14.37)

Luego el efecto de ai es aumentar en una unidad la poblacin del estado i y multiplicar la nueva
funcin por ni + 1. Por lo tanto ai transforma funciones de En en funciones de En+1 . Por este
motivo ai se denomina operador de creacin (de una partcula en el estado i).
Consideremos ahora el efecto del operador ni = aiai sobre n;n1 , n2 , . De (14.31) y (14.36) obtenemos de inmediato
aiain;n1 , n2 , , ni , = ni n;n1 , n2 , , ni ,

(14.38)

Por lo tanto ni est representado por una matriz diagonal cuyos elementos son ni . Podemos entonces decir que ni es el operador nmero de partculas en el estado i. Claramente, n;n1 , n2 ,
es autofuncin de ni y el correspondiente autovalor es ni . Asimismo, el operador
n = ni = aiai
i

(14.39)

es el operador nmero total de partculas, y n;n1 , n2 , es autofuncin de n con autovalor n.


Estos resultados pueden parecer triviales pero son de utilidad cuando se consideran estados ms
generales del espacio de nmeros de ocupacin (por ejemplo superposiciones de diferentes estados bsicos) en los cuales los nmeros de ocupacin de los estados 1 ( ), 2 ( ), y el nmero
total de partculas no estn bien definidos.
De manera semejante a como obtuvimos la (14.38), a partir de la (14.37) y de la ecuacin (que
no escribimos) obtenida de la (14.31) mediante la sustitucin ni ni 1, es fcil verificar que
ai ain;n1 , n2 , , ni , = (ni + 1) n;n1 , n2 , , ni ,

(14.40)

Restando la (14.38) de la (14.40) obtenemos la relacin de conmutacin entre ai y ai :

[ai , ai ] = ai ai aiai = 1

(14.41)

En cuanto a los operadores de creacin y de aniquilacin que operan sobre nmeros de ocupacin diferentes, es obvio que conmutan, de modo que podemos escribir que para todo i, j
[ai , a j ] = ij

, [ai , a j ] = [ai , a j ] = 0

(14.42)

Dados los operadores ai podemos generar todas las funciones bsicas de E. En efecto, a partir
del estado de vaco 0 0;01 , 0 2 , (nico estado de E0 ) podemos obtener las funciones bsicas
de una partcula (es decir E1) como ai0 ( i = 1, 2, ), luego las funciones bsicas de E2 como
akai0 ( i, k = 1, 2, ) y as sucesivamente. Las relaciones de conmutacin (14.42) garantizan
que las funciones bsicas de E tienen la simetra correcta para los Bosones.

208

14. Segunda cuantificacin


Las relaciones de conmutacin (14.42) son fundamentales. Nosotros las obtuvimos a partir de la
definicin (14.31) de los operadores de aniquilacin. Pero se podra haber procedido a la inversa,
esto es, tomar las (14.42) como punto de partida y postular que aiai es el operador nmero de
partculas del estado i. De esa forma se pueden deducir las (14.31) y (14.37). Es interesante
comparar el presente tratamiento con el mtodo que usamos en el Captulo 9 para tratar el oscilador armnico simple. Se puede observar que los operadores ai y ai juegan el mismo rol que
los operadores de bajada y subida a y a+ que definimos entonces.
Operadores en el espacio de nmeros de ocupacin
Los operadores de creacin y de aniquilacin permiten expresar cualquier variable dinmica de
un sistema de muchas partculas por medio de un operador que acta sobre los nmeros de ocupacin. En efecto, consideremos el operador de una partcula
F (1) = fa(1)

(14.43)

que ya estudiamos previamente. Es inmediato verificar, usando las propiedades (14.32) y (14.35)
de los ai y ai que el operador
i
F (1) = f (1) k aiak

(14.44)

i, k

coincide con F (1) . En efecto, todos los elementos de matriz de F (1) entre los estados base de E
coinciden con los elementos de matriz (14.18) y (14.19) de F (1) .
La (14.44) es un resultado fundamental de la segunda cuantificacin, porque en la (14.44) los
i
f (1) k son simplemente cantidades (nmeros con dimensiones) conocidas. Por lo tanto hemos
logrado expresar un operador ordinario (por ahora limitado a la forma (14.43)) que acta sobre
funciones de las coordenadas bajo la forma de un operador que acta sobre las nuevas variables
del espacio de nmeros de ocupacin E.
Se pude notar que la expresin (14.44) se parece a la expresin

f = fki ai*ak

(14.45)

i, k

del valor medio de una variable dinmica f en un dado estado, escrito en trminos de los coeficientes ai del desarrollo de la funcin de onda como superposicin de estados estacionarios. De
all proviene el nombre segunda cuantificacin.
Es fcil generalizar el resultado (14.44) a operadores de la forma

F(2) =

fab(2)

(14.46)

a>b

(2)
donde fab
indica el operador que representa una magnitud que depende de un par de partculas
(por ejemplo, la energa potencial de interaccin entre dos partculas cargadas) y que por lo tanto
acta sobre funciones de a y b . Por medio de clculos anlogos a los que hicimos antes se encuentra que F ( 2 ) (que expresa F ( 2 ) en el espacio de nmeros de ocupacin) est dado por

209

14. Segunda cuantificacin


F ( 2 ) =

ik

f (2)lm aiak al a m

1
2

(14.47)

i, k ,l , m

donde los elementos de matriz


ik

f ( 2 )lm = i* (1 ) k* (2 ) f ( 2 ) l (1 ) m (2 )d1d2

(14.48)

son cantidades conocidas.


En efecto, las matrices de F ( 2 ) y F ( 2 ) coinciden. Las frmulas (14.44) y (14.47) se pueden generalizar para operadores F ( n ) que involucran cualquier nmero n de partculas, y que son simtricos respecto de las n partculas.
De esta forma podemos expresar en funcin de los operadores ai y ai el Hamiltoniano H del
sistema de n partculas en interaccin. El operador H es, evidentemente, simtrico respecto de
todas las partculas y en la aproximacin no relativstica no depende de los spines de las partculas. Por lo tanto lo podemos escribir en general en la forma

H = ha(1) +
a

(2)
( 3)
+ vabc
+
vab

a>b

(14.49)

a>b>c

Aqu ha(1) es la parte de H que depende de las coordenadas de la a-sima partcula y tiene la
forma
ha(1) =

h2
a + v(1) ( ra )
2m

(14.50)

donde v(1) ( ra ) es la energa potencial de la partcula en el campo externo. Los otros trminos de
la (14.49) corresponden a las interacciones entre las partculas, y hemos separado por comodidad
los trminos que dependen de las coordenadas de dos, tres, etc. partculas.
Podemos entonces usar la frmulas (14.34), (14.47), y otras anlogas para escribir H :
i
H = h(1) k aiak + 12
i, k

ik

v(2)lm aiakal am +

(14.51)

i, k ,l , m

que escrito de esta forma es un operador que acta sobre las funciones de los nmeros de ocupacin. En el caso de partculas que no interactan el nico trmino de la (14.51) que subsiste es el
primero, de modo que
i
H = h(1) k aiak

(14.52)

i, k

Si las 1 ( ), 2 ( ), son las autofunciones del Hamiltoniano de una partcula, de modo que
h(1) i = ei i , la matriz H ki es diagonal y se tiene

H = ei aiai = ei ni
i

(14.53)

de donde reemplazando los operadores ni por sus autovalores ni obtenemos los niveles de energa del sistema como

210

14. Segunda cuantificacin


En;n1 , n2 , = ei ni

(14.54)

como era de esperar.


El espectro continuo y los operadores del campo de Bosones
Hasta aqu hemos supuesto que el sistema completo (14.1) corresponde a un operador con un
espectro discreto de autovalores. Es importante extender el formalismo a los sistemas completos
de autoestados de una partcula pertenecientes al espectro continuo de un observable. El ejemplo
ms comn de una base continua es, naturalmente, el de las autofunciones del operador , definidas por = y que estn normalizadas como
( , ) = ( ) = ( r r )

(14.55)

Aqu con indicamos los autovalores continuos r del operador posicin r, que junto con los
autovalores discretos de una cualquiera de las componentes del spin de la partcula, identifican las autofunciones bsicas. Para evitar confusiones conviene aclarar nuestra notacin pese a
que su significado es obvio. Por un lado indica el operador que representa los observables r y
de la partcula. Por otro lado, cuando escribimos ( ) , es la variable que representa las coordenadas y el spin en el espacio de configuracin de la partcula. Con , , , indicamos
los autovalores de . Por lo tanto al escribir ( ) estamos designando un particular estado de
la partcula: aqul en el cual los observables r y tienen valores bien definidos r y . Al considerar todos los estados de nuestra base ortonormal , (es decir r y ) toma todos los
valores posibles, pero no debemos confundir los autovalores que identifican cada uno de los estados bsicos con la variable .
El formalismo que desarrollamos hasta aqu se adapta fcilmente al espectro continuo, pero en
este caso no es prctico usar los nmeros de ocupacin para designar los estados de un sistema
de varias partculas, a menos que dividamos artificialmente el espacio (x, y, z) en un nmero infinito de celdas, pequeas pero no infinitesimales (con lo cual, de hecho, volveramos al espectro
discreto). Vamos a ver que la segunda cuantificacin se puede aplicar a una base continua introduciendo los operadores del campo , definidos por

( ) = i ( ) ai , ( ) = i* ( ) ai
i

(14.56)

Para cada particular valor = de la variable , las (14.56) definen un par de operadores ( )
y ( ) . El conjunto de los mismos, para todos los posibles valores de forma un infinito
continuo que designamos con ( ) y ( ) (aqu la variable se considera un parmetro, ya
que no acta sobre los nmeros de ocupacin). En virtud de la ortonormalidad de la base
1 ( ), 2 ( ), es fcil ver que ai y ai se expresan en trminos de los ( ) y ( ) como
ai = i* ( ) ( ) d

, ai = i ( ) ( ) d

(14.57)

Claramente, en virtud de las propiedades de ai y ai , los operadores ( ) y ( ) disminuyen y


aumentan en una unidad, respectivamente, el nmero total de partculas del sistema.

211

14. Segunda cuantificacin


Es fcil ver que ( ) crea una partcula en el punto . Efectivamente, ai crea una partcula
cuya funcin de onda es i ( ) . Luego ( ) crea una partcula cuya funcin de onda es

i* ( ) i ( ) = ( )

(14.58)

donde ( ) = ( r r ) ( ) , y para escribir el resultado hemos usado la relacin de


clausura (7.75). Por lo tanto, ( ) crea una partcula cuya posicin es r y cuyo spin es .
Vemos entonces que los operadores del campo ( ) y ( ) equivalen al conjunto de todos los
operadores ai y ai ( i = 1, 2, 3, ) ya que dando a diferentes valores se puede aniquilar o
crear una partcula en cualquier punto del espacio y con cualquier valor del spin.
Las reglas de conmutacin de y se obtienen de inmediato a partir de las reglas de conmutacin de ai y ai . Es evidente que

[ ( ), ( )] = 0 , [ ( ), ( )] = 0

(14.59)

Por otra parte

( ) ( ) ( ) ( ) = i ( ) *k ( )(ai a k a k a i ) = i ( )*i ( )
i

(14.60)

de donde resulta

[ ( ), ( )] = ( )

(14.61)

La expresin (14.44) del operador F (1) se escribe en trminos de los nuevos operadores como
F (1) = ( ) f (1) ( ) d

(14.62)

donde se entiende que f (1) acta sobre las funciones i ( ) del operador ( ) . En efecto, sustituyendo las (14.56) en (14.62) resulta
i
F (1) = i* ( ) f (1) k ( ) d aiak = f (1) k aiak
i, k

(14.63)

i, k

que coincide con la (14.44). En particular si f (1) es una funcin g( ) , de la (14.62) obtenemos
G (1) = g( ) ( ) ( ) d

(14.64)

Por lo tanto ( ) ( ) d es el operador nmero de partculas en el intervalo ( , + d ).


Del mismo modo que obtuvimos la (14.62) se encuentra que
F ( 2 ) =

1
2

ik

f (2)lm aiakal am = 12 ( ) ( ) f (2) ( ) ( ) dd

(14.65)

i, k ,l , m

Usando la (14.62), la (14.66), la expresin (14.50) de ha(1) e integrando por partes (sobre las coordenadas) al trmino que contiene los Laplacianos, podemos expresar al Hamiltoniano (14.49)
en trminos de los nuevos operadores:

212

14. Segunda cuantificacin


i
H = h(1) k aiak + 12
i, k

ik

v(2)lm aiakal am

i, k ,l , m

} d

h2
(1)

2 m ( ) ( ) + v ( ) ( ) ( )

(14.66)

+ 12 ( ) ( )v( 2 ) ( , ) ( ) ( ) d d

El resultado (14.66) se torna ms intuitivo gracias al siguiente argumento. Sea un sistema de


partculas, todas descriptas en un dado instante t por una misma funcin de onda ( ) , que suponemos normalizada de acuerdo con

| |2 d

=n

(14.67)

Si en la (14.66) reemplazamos los operadores ( ) y ( ) por las funciones ( ) y * ( ) ,


respectivamente, la expresin que resulta es el valor medio de la energa del sistema cuando las
n partculas estn en el estado ( ) . A partir de esto obtenemos una regla para deducir la forma
del Hamiltoniano en el formalismo de la segunda cuantificacin: se escribe la expresin del valor medio de la energa, expresndolo por medio de la funcin de onda de una partcula ( ) ,
normalizada en la forma (14.65); luego se reemplazan ( ) por el operador ( ) y * ( ) por
( ) , teniendo cuidado de escribir los operadores en el orden llamado normal, esto es con
( ) a la izquierda de ( ) .
Si el sistema est constituido por varias clases de Bosones, hay que introducir en el formalismo
a o bien , para cada clase de partculas. Es
de segunda cuantificacin los operadores a,
evidente que los operadores correspondientes a partculas de diferente clase conmutan entre s.

Segunda cuantificacin de sistemas de Fermiones


Todas las ideas bsicas del mtodo de segunda cuantificacin se mantienen para los sistemas
constituidos por Fermiones idnticos. En lo que hace a las expresiones concretas de los operadores que representan las magnitudes fsicas, y los operadores de aniquilacin y de creacin, hay
cambios, naturalmente.
El espacio de nmeros de ocupacin para Fermiones
La funcin de onda n;n1 , n2 , de un sistema de n Fermiones tiene la forma

r1 (1 )
r 2 (1 )

1
n;n1 , n2 , =
n! ri (1 )

rn (1 )

r1 (2 )
r 2 (2 )

ri (2 )

rn (2 )

r1 ( j )
r 2 ( j )

ri ( j )

r1 (n )
r 2 (n )

ri (n )

(14.68)

rn ( j ) rn (n )

donde hemos empleado la notacin r1, r 2 ,, ri ,, rn para subrayar que los estados ocupados son todos diferentes. Dada la antisimetra de n;n1 , n2 , es importante establecer una convencin para determinar su signo (esta cuestin no se plantea en el caso de Bosones, pues debido
213

14. Segunda cuantificacin


a la simetra de , el signo, una vez elegido, se mantiene para cualquier permutacin de las i ).
Para ello vamos a convenir en numerar consecutivamente de una vez y para siempre todos los
estados i de una partcula. En base a tal numeracin, llenaremos las lneas del determinante
(14.68) en orden de ri creciente, esto es:
r1 < r 2 < r 3 < < rn

(14.69)

y la columnas las llenaremos con funciones de diferentes variables, en el orden 1, 2 , , n .


No puede haber dos nmeros iguales entre r1, r2 , , rn , pues el determinante sera nulo. En
otras palabras, los nmeros de ocupacin ni pueden valer solamente 0 1.
Elementos de matriz de operadores en el espacio de nmeros de ocupacin
Consideremos un operador de la forma (14.15), esto es
F (1) = fa(1)

(14.70)

donde fa(1) es el operador de una partcula correspondiente a la partcula a, esto es, que opera
sobre las variables a . Por las mismas razones que invocamos antes, los nicos elementos de
matriz no nulos de F (1) son: (a) los elementos diagonales, que corresponden a que los nmeros
de ocupacin ni no cambian, (b) aquellos elementos fuera de la diagonal tales que uno de los
nmeros de ocupacin ( ni ) pasa de 0i a 1i y otro ( nk ) disminuye de 1k a 0 k (ponemos los subndices para que quede claro a qu estado se refiere cada nmero de ocupacin).
Para los elementos diagonales es fcil ver (no haremos los clculos) que se obtiene un resultado
anlogo al que obtuvimos antes para los Bosones, esto es
i

F (1) = ni f (1)i

(14.71)

La nica diferencia de la (14.71) respecto de la (14.18) es que los nmeros de ocupacin ni de


los Fermiones pueden tomar solamente los valores 0 y 1.
Consideremos ahora el elemento de matriz no diagonal
1 ,0

F (1)0ii ,1kk = (n;n1 , , 1i , , 0 k , , F (1)n;n1 , , 0 i , , 1k , )


= (n;n1 , , 1i , , 0 k , , fa(1)n;n1 , , 0 i , , 1k , )

(14.72)

En la (14.70) n;n1 , , 1i , , 0 k , tiene la forma

r1 (1 ) r1 (2 )
r 2 (1 ) r 2 (2 )

1
n;n1 , , 1i , , 0 k , =
n! i (1 ) i (2 )

rn (1 ) rn (2 )

r1 (a )
r 2 (a )

i (a )

rn (a )

Por supuesto no existe en (14.73) una fila k , dado que nk = 0 .


214

r1 (n )
r 2 (n )

i (n )

rn (n )

(14.73)

14. Segunda cuantificacin


Del mismo modo n;n1 , , 0 i , , 1k , est dado por

r1 (1 )
r 2 (1 )

1
n;n1 , , 0 i , , 1k , =
n! k (1 )

rn (1 )

r1 (2 )
r 2 (2 )

k (2 )

rn (2 )

r1 (a )
r 2 (a )

k (a )

rn (a )

r1 (n )
r 2 (n )

k (n )

rn (n )

(14.74)

y lgicamente no existe en (14.74) una fila i .


Al desarrollar estos determinantes conviene hacerlo por las filas i y k, respectivamente. Para ello
es importante tener presente los signos de los adjuntos7 (o complementos algebraicos) de los
elementos de dichas filas. Sea A(i, a) el adjunto del elemento i (a ) del determinante (14.73),
y B( k, a) el adjunto del elemento k (a ) del determinante (14.74). Es fcil ver que los determinantes que resultan de suprimir la fila i en (14.73) y la fila k en (14.74), y la columna a en ambos
son idnticos. Pero los adjuntos A(i, a) y B( k, a) corresponden a elementos que pertenecen a filas diferentes de (14.73) y (14.74). Sea Ti el nmero de orden de la fila i en (14.73); claramente Ti es igual al nmero de estados rj ocupados de la sucesin 1, 2 , con rj < i y por
lo tanto
i 1

Ti =

nj

(14.75)

j =1

Luego el signo de A(i, a) est dado por ( 1)Ti + a y del mismo modo el signo de B( k, a) est dado
por ( 1)Tk + a . Esto trae una diferencia de signo entre dichos adjuntos dada por ( 1)Tk Ti , donde
Tk Ti es igual al nmero de estados ocupados de la sucesin 1, 2 , comprendidos entre i
y k . En definitiva

B( k, a) = ( 1)Tk Ti A(i, a) = ( 1)Tk + Ti A(i, a)

(14.76)

pues es evidente que los signos que se pongan delante de Ti y Tk en (14.74) son irrelevantes.
Calculemos un trmino de la suma (14.72), por ejemplo el que corresponde a fa(1) . Claramente,
las nicas contribuciones no nulas provienen de los trminos

1
i (a ) A(i, a) y
n!

1
1
k (a ) B( k, a) =
( 1)Tk + Ti k (a ) A(i, a)
n!
n!

(14.77)

de los desarrollos de n;n1 , , 1i , , 0 k , y de n;n1 , , 0 i , , 1k , , respectivamente. La contribucin buscada es entonces


(n;1i , 0 k , fa(1)n;0 i ,1k ) =

( 1)Tk + Ti
( 1)Tk + Ti (1)i
( i (a ) A(i, a), fa(1) k (a ) A(i, a)) =
f k
n!
n

(14.78)

Sea D un determinante, y d(f,c) el determinante que se obtiene suprimiendo la fila f y la columna c de D. Entonces

a(f,c) = (1)f+c d(f,c) es el adjunto del elemento (f,c) de D.

215

14. Segunda cuantificacin


Para obtener este resultado, tenemos que recordar que el desarrollo de A(i, a) consta de (n 1)!
productos de las rl (m ) , todos ortonormales. Puesto que en el elemento de matriz (14.71) hay n
contribuciones iguales a la (14.77) obtenemos finalmente
1 ,0

F (1)0ii ,1kk = ( 1)Tk + Ti f (1) k

(14.79)

Operadores de aniquilacin y de creacin de Fermiones


Para que el operador de una partcula F (1) se pueda escribir en la forma (14.44), es preciso definir los operadores de aniquilacin y de creacin de Fermiones de manera que se respete el signo
de la (14.79). Por lo tanto se debe tomar en cuenta qu lugar ocupa el estado de la partcula que
se est aniquilando y cual ocupar el de la partcula que se est creando dentro de las listas
r1 < r 2 < r 3 < < rn de los estados ocupados del sistema, antes y despus de la transicin. Esto
se logra con las siguientes definiciones:
ain;n1 , n2 , , ni , = ( 1)Ti ni n 1;n1 , n2 , , ni 1,
ain;n , , n , = ( 1)Ti ni + 1 n +1;n , , n +1,
1

(14.80)

Las (14.80) se pueden escribir ms simplemente como


ain;n1 , n2 , , 1i , = ( 1)Ti n 1;n1 , n2 , , 0 i ,
ain;n , , 0 , = ( 1)Ti n +1;n , , 1 ,
1

(14.81)

los nicos elementos no nulos de la matriz que representa ai son, evidentemente,

ai 0 i = (n 1;n1 , , 0 i , , ain;n1 , , 1i , ) = ( 1)Ti


1i

(14.82)

Recordando la definicin (7.92) del adjunto de un operador es inmediato verificar que el operador de creacin ai definido por la (14.81) es, efectivamente, el adjunto de ai , y que sus elementos de matriz no nulos son
1

ai 0i = (n;n1 , , 1i , , ain 1;n1 , , 0 i , ) = ( 1)Ti


i

(14.83)

Consideremos ahora los elementos de matriz del operador


i
F (1) = f (1) k aiak

(14.84)

i, k

entre los estados base del espacio de nmeros de ocupacin. Claramente, los nicos elementos
no nulos son
1 ,0
i
F (1)0ii ,1kk = (n;n1 , , 1i , , 0 k , , F (1) n;n1 , , 0 i , , 1k , ) = ( 1)Ti + Tk f (1) k

(14.85)

y por lo tanto F (1) coincide con F (1) .


Consideremos ahora el efecto del operador ni = aiai sobre n;n1 , n2 , . Usando las definiciones
(14.81) obtenemos de inmediato
216

14. Segunda cuantificacin

n;n1 , n2 , , 1i , si ni = 1
nin;n1 , n2 , , ni , = a iain;n1 , n2 , , ni , =
0
si ni = 0

(14.86)

nin;n1 , n2 , , ni , = aiain;n1 , n2 , , ni , = nin;n1 , n2 , , ni ,

(14.87)

es decir

Por lo tanto ni es el operador nmero de partculas en el estado i. Asimismo, el operador


n = ni = aiai
i

(14.88)

es el operador nmero total de partculas, igual que para los Bosones.


Veamos el efecto del operador ai ai sobre n;n1 , n2 , . Claramente:
0
si ni = 1

ai ain;n1 , n2 , , ni , =
n;n1 , n2 , , 1i , si ni = 0

(14.89)

Luego podemos escribir simplemente


ai ain;n1 , n2 , , ni , = (1 ni )n;n1 , n2 , , ni ,

(14.90)

Adems, de la (14.87) y la (14.90) resulta la siguiente relacin entre los operadores de aniquilacin y de creacin del mismo estado de una partcula:

ai ai + aiai = 1

(14.91)

Consideremos ahora el efecto del operador aiak ( i k ) sobre n;n1 , n2 , . Usando las definiciones (14.81) obtenemos de inmediato

aiakn;n1 , n2 ,, , 0 i , 1k , = ( 1)Tk + Ti n 1;n1 , n2 , , 1i , , 0 k ,


aiakn;n1 , n2 ,, , 1k , 0 i ,

= ( 1)

Tk + Ti

si i < k

n 1;n1 , n2 , , 0 k , , 1i , si i > k

(14.92)

Notar el signo que aparece para i > k , que se debe a que al haber aniquilado la partcula que
ocupaba el estado k , la cantidad de estados ocupados con rj < i ha disminuido en una unidad.
Por ltimo calculemos el efecto del operador ak ai ( i k , es el mismo producto que antes, pero
en el orden inverso) sobre n;n1 , n2 , . Encontramos que

ak ain;n1 , n2 ,, , 0 i , 1k , = ( 1)Tk + Ti n 1;n1 , n2 , , 1i , , 0 k , si i < k


ak ain;n1 , n2 ,, , 1k , 0 i , = ( 1)Tk + Ti n 1;n1 , n2 , , 0 k , , 1i ,

si i > k

(14.93)

Resulta por consiguiente que

ak ai + aiak = 0 , i k

(14.94)

Las dos igualdades (14.91) y (14.94) se pueden resumir en una sola escribiendo para todo i, k:

217

14. Segunda cuantificacin

ak a i + ai a k = ik

(14.95)

Efectuando clculos anlogos es sencillo verificar tambin que para todo i, k se cumple que

ak ai + ai ak = 0 , akai + aiak = 0

(14.96)

Las (14.95) y (14.96) se suelen llamar relaciones de anticonmutacin, para distinguirlas de las
relaciones de conmutacin (14.42) que se cumplen para los Bosones. Vemos, por consiguiente,
que los operadores de aniquilacin y creacin de Fermiones son anticonmutativos, a diferencia
de los operadores de aniquilacin y creacin de Bosones, que son conmutativos.
Es importante destacar otra diferencia entre los operadores de aniquilacin y creacin de Bosones y de Fermiones. Los operadores ai , ak de Bosones son completamente independientes: cada
uno de ellos opera sobre una sola variable ni y el resultado de su accin no depende de los valores de los dems nmeros de ocupacin. Para los Fermiones, en cambio, el efecto del operador
ai no depende solamente del nmero de ocupacin ni , sino que tambin depende de los nmeros
de ocupacin de todos los estados j precedentes ( j < i ), como resulta de la definicin (14.81).
Por este motivo, la accin de operadores ai , ak distintos no se puede considerar independiente.
Operadores en el espacio de nmeros de ocupacin y operadores del campo de Fermiones
Habiendo definido las propiedades de los operadores de aniquilacin y creacin de Fermiones en
la forma precedente, todas las frmulas desde la (14.43) hasta la (14.54) que obtuvimos para los
Bosones subsisten ntegramente para los Fermiones. Los operadores del campo de Fermiones se
definen (del mismo modo que para los Bosones) como

( ) = i ( ) ai , ( ) = i* ( ) ai
i

(14.97)

donde las variables se consideran como parmetros. Del mismo modo que antes, se ve que
( ) crea una partcula en el punto .
Las reglas de anticonmutacin de y se obtienen de inmediato a partir de las reglas de anticonmutacin de ai y ai . Es evidente que

( ) ( ) + ( ) ( ) = 0 , ( ) ( ) + ( ) ( ) = 0

(14.98)

( ) ( ) + ( ) ( ) = ( )

(14.99)

Por otra parte

Las expresiones de los operadores de las magnitudes fsicas de un sistema de Fermiones se expresan entonces en trminos de y por medio de las ecuaciones (14.62) a (14.66), que no
reproducimos aqu.
Si el sistema est constituido por diferentes especies de Fermiones y Bosones, hay que introducir
para cada especie los correspondientes operadores de segunda cuantificacin ( ai y ai o bien
y ). Los operadores de Fermiones conmutan con los operadores de Bosones. En cuanto a los
operadores de Fermiones de distinta especie, dentro de los lmites de la presente teora no relativstica, es licito suponer que conmuten, y tambin que anticonmuten. En ambos casos, la aplicacin de la segunda cuantificacin lleva a los mismos resultados.
218

14. Segunda cuantificacin


Sin embargo, puesto que eventualmente la teora se va a extender al caso relativstico, en el cual
se admiten las transmutaciones de partculas de una especie en otra, conviene postular que los
operadores de segunda cuantificacin de Fermiones de distinta especie anticonmutan. La conveniencia de proceder as resulta evidente si se tiene presente que a veces dos especies distintas
se consideran como dos estados internos distintos de una nica especie (como ocurre con el
protn y el neutrn, que se consideran como distintos estados de una sola especie, el nuclen).
Con estos resultados el lector puede por fin apreciar la elegancia y sencillez de la segunda cuantificacin. Todo lo que hace falta para implementar el formalismo es conocer un sistema completo cualquiera 1 ( ), 2 ( ), de autoestados de una partcula y los elementos de matriz
i
ik
f (1) k , f ( 2 )lm , , etc. de los operadores de inters. A partir de esos datos y mediante los operadores de aniquilacin y creacin ai y ai apropiados (o bien por medio de los operadores del
campo y ), se puede construir el espacio de nmeros de ocupacin E y calcular cualquier
cantidad de inters para sistemas con un nmero arbitrario (que puede ser variable) de partculas
idnticas. No hace falta ya preocuparse por los aspectos combinatorios que derivan de la estadstica apropiada a Bosones y Fermiones porque los mismos se toman en cuenta automticamente en los clculos gracias a las relaciones de conmutacin fundamentales (14.42), (14.59) y
(14.61) para los Bosones y las relaciones de anticonmutacin (14.95), (14.96), (14.98) y (14.99)
para los Fermiones.

Ecuaciones de movimiento para los operadores de campos de Fermiones y


Bosones
Recordemos que en el Captulo 8 definimos el operador derivada total con respecto del tiempo
dF / dt de un operador F por medio de la ec. (8.60), que podemos escribir como

ih

F
dF
= [ F, H ] + ih
t
dt

(14.100)

donde H es el Hamiltoniano del sistema. La (14.100) se reduce a

ih

dF
= [ F, H ]
dt

(14.101)

si F no depende explcitamente del tiempo. La (14.100) o la (14.101), segn corresponda, es la


ecuacin de movimiento de F.
Aplicaremos estas frmulas para obtener la ecuacin de movimiento de los operadores de aniquilacin ai y de los operadores del campo ( ) . Claramente ai no depende del tiempo, y
puesto que las funciones bsicas i ( ) tampoco dependen del tiempo, ( ) no depende explcitamente del tiempo. Por lo tanto corresponde usar la (14.101). El Hamiltoniano de nuestro sistema se puede escribir en la forma (14.51):
j
H = h(1)l a j al + 12
j ,l

jk

v(2)lm a j akal am + = H 1 + H 2 +

(14.102)

j , k ,l , m

Calculemos el conmutador [ai , H ] , para lo cual recordemos que para todo i, k se cumple

ak ai m aiak = ik , , ak ai m ai ak = 0 , akai m aiak = 0

219

(14.103)

14. Segunda cuantificacin


donde los signos corresponden a Bosones y los signos + a Fermiones. Aplicando las reglas
(14.103) es muy sencillo verificar que tanto para Bosones como para Fermiones resulta que
[ai , a j al ] = ij al

, [ai , a j akal am ] = ij akal am + ik a j am al

(14.104)

donde el lector tiene que prestar atencin al orden en que se escriben los operadores. Resulta
entonces que
i
ai H 1 H 1ai = h(1)l al

(14.105)

y que
ai H 2 H 2 ai =

1
2

ij

ji

ij

(v(2)lm + v(2)ml ) a j al am = v(2)lm a j al am

j ,l , m
ij

(14.106)

j ,l , m

ji

puesto que v( 2 )lm = v( 2 ) ml , como se verifica fcilmente recordando la (14.48).


De (14.105) y (14.106) resulta entonces la ecuacin de movimiento para ai

ih

dai
i
= h(1)l al +
dt
l

ij

v(2)lm a j al am

(14.107)

j ,l , m

La ecuacin de movimiento para los operadores del campo es


ih

d ( )
= [ ( ), H ] = i ( )[ai , H ]
dt
i
i
ij
(
1
)
= i ( )h l al + i ( )v( 2 )lm a j al am
i,l

(14.108)

i, j ,l , m

Recordando la (14.57), el primer trmino del miembro derecho es


i

* ( )h(1)l i ( ) ( ) d
i ( )h(1)l al =
l
i,l

i,l

(14.109)

Usando la (14.14) y la relacin de clausura (7.75) resulta


i

i ( )h(1)l al = h(1) ( ) ( )

(14.110)

i,l

Del mismo modo, usando la (14.48) y la relacin de clausura (7.75) obtenemos con un poco de
paciencia que
ij

i ( )v(2)lm a j al am = v(2) (, ) ( ) ( ) d

( )

(14.111)

i, j ,l , m

de modo que la ecuacin de movimiento queda en la forma


ih

d ( )
= h(1) ( ) ( ) + v( 2 ) ( , ) ( ) ( ) d ( ) = [h(1) ( ) + Vef ( )] ( )
dt
220

(14.112)

14. Segunda cuantificacin


La (14.112) es una ecuacin integrodiferencial en el espacio ordinario y en el tiempo, y se aplica
tanto a Bosones como a Fermiones. Debido a la presencia del trmino de interaccin Vef ( )
proveniente de H 2 , se trata de una ecuacin no lineal. Se puede interpretar que este trmino describe el efecto sobre una partcula de sus interacciones con las dems partculas. El potencial
efectivo que describe dichas interacciones est dado por
Vef ( ) = v( 2 ) ( , ) ( ) ( ) d

(14.113)

y se puede calcular solamente si se conoce previamente la solucin de la (14.112). Esto sugiere


el empleo de procedimientos iterativos para encontrar soluciones autoconsistentes de la ecuacin
del movimiento. Esas tcnicas son, en efecto, de uso frecuente para resolver problemas de muchos cuerpos.

Conexin de la segunda cuantificacin con la Teora Cuntica de Campos


Si no hay interacciones entre las partculas, la (14.112) se reduce a
ih

d ( )
= h(1) ( ) ( )
dt

(14.114)

Esta ecuacin es formalmente idntica a la ecuacin de Schrdinger para una partcula8 (ec.
(7.10)):

ih

d ( )
= h(1) ( ) ( )
dt

(14.115)

Debemos recordar, sin embargo, que ( ) es un operador del campo y no una funcin de onda
ordinaria. La ecuacin (14.114) se puede considerar como la versin cuantificada de la ecuacin
de Schrdinger (14.115), si interpretamos esta ltima como la ecuacin de un campo clsico
( ) (el campo que describe la onda asociada con una partcula, digamos, por ejemplo, un electrn). Este es precisamente el punto de contacto entre la Teora Cuntica de Campos y la segunda cuantificacin, que hemos desarrollado para tratar problemas de muchos cuerpos.
De la segunda cuantificacin a la Teora Cuntica de Campos hay un solo paso, fundamentalmente de interpretacin. Existen dos maneras equivalentes de dar ese paso.
La primera toma como punto de partida las ecuaciones clsicas que describen un campo ( )
(como la 14.115), e interpreta que dichas ecuaciones rigen la dinmica de los operadores del
campo ( ) y ( ) , operadores que cumplen las reglas de conmutacin fundamentales
(14.42), (14.59) y (14.61) si el campo describe Bosones o bien las relaciones de anticonmutacin
(14.95), (14.96), (14.98) y (14.99) si se trata de Fermiones. El campo queda entonces cuantificado, pues los operadores ( ) y ( ) destruyen y crean partculas. Las partculas, es decir
los cuantos del campo, aparecen o desaparecen de a una por vez (y no en fracciones arbitrariamente pequeas). Que esto sea obvio para el electrn, se debe en realidad a que siempre hemos
dado por sentado que se trata de una partcula, incluso cuando lo describimos por medio de una
funcin de onda. No es igualmente obvio, sin embargo, para el campo de la radiacin electro-

La notacin que empleamos para los operadores del campo fue elegida precisamente teniendo presente esta

identidad formal.

221

14. Segunda cuantificacin


magntica, que estamos acostumbrados a imaginar como una onda, aunque la evidencia experimental que discutimos en el Captulo 4 muestra que en sus interacciones con la materia se comporta como un sistema de partculas (los fotones). La Teora Cuntica de Campos toma en
cuenta as los dos aspectos (onda y partcula) de los entes de escala atmica y subatmica, que
quedan ambos incorporados a la esencia misma del formalismo, implementando de este modo el
Principio de Complementaridad del cual hablamos al final del Captulo 6.
La segunda manera parte de considerar nuestro formalismo en el espacio de los nmeros de ocupacin. En esencia, dicho formalismo analiza un sistema de muchas partculas como un sistema
mecnico dotado de infinitos grados de libertad, cada uno de los cuales est representado por
uno de los estados bsicos 1 ( ), 2 ( ), de una partcula. Cada grado de libertad se puede
excitar, lo que corresponde a que est ocupado por una partcula (o ms, si se trata de Bosones).
De acuerdo con la segunda cuantificacin, cada grado de libertad equivale formalmente a un oscilador armnico simple: recordemos en efecto que los estados excitados del oscilador se pueden
obtener a partir del estado fundamental por aplicacin reiterada del operador de subida a (como
hicimos en el Captulo 9), del mismo modo que aplicando repetidas veces el operador de
creacin ai podemos ir poblando con partculas el estado i .
De acuerdo con este punto de vista, el procedimiento a seguir para cuantificar un campo (por
ejemplo el campo de la radiacin electromagntica) consiste en analizar el campo en trminos de
un sistema ortonormal completo de autofunciones, esto es, de modos propios de oscilacin (tal
como hicimos en el Captulo 4 para deducir la distribucin de Planck), lo que equivale a representar el campo como una superposicin de infinitos osciladores. Luego es preciso cuantificar
esos osciladores, lo que se consigue postulando oportunas reglas de conmutacin (o de anticonmutacin) para los operadores de aniquilacin y de creacin ai y ai .
Ambas maneras de proceder son equivalentes, y llevan a los mismos resultados. Esto es lgico,
dado que en realidad estamos describiendo la misma cosa, esto es, los estados de un sistema de
muchas partculas, pero usando bases diferentes. En el primer caso, nuestras funciones bsicas
pertenecen al espectro continuo (las autofunciones del operador ) y en el segundo pertenecen al
espectro discreto.
Nuestro tratamiento ha sido no relativstico, lo cual limita el presente formalismo a sistemas de
muchas partculas de inters para la Fsica del Estado Slido y la Fsica Nuclear, pero excluye el
estudio de procesos de alta energa, de inters para la Fsica de Partculas. No haremos en estas
notas un tratamiento de la Teora Cuntica Relativstica de Campos. Pero se debe sealar que los
pasos conceptuales que hay que dar para desarrollar dicha teora son los mismos que hemos expuesto aqu. Se presentan importantes complicaciones, desde luego, pues es preciso modificar el
formalismo para que sea covariante.
En el tratamiento relativstico surge una importante diferencia respecto de lo que hemos visto
aqu. En nuestro tratamiento hemos postulado la simetra de la funcin de onda de un sistema de
Bosones, y su antisimetra para sistemas de Fermiones. Hicimos as porque es un dato de la realidad que los Fermiones cumplen el Principio de Pauli, mientras que cualquier nmero de Bosones pueden ocupar el mismo estado. Este postulado nos llev a las relaciones fundamentales de
conmutacin para los Bosones y de anticonmutacin para los Fermiones. Sin embargo, cabe sealar que en el marco de una teora no relativstica no estamos obligados a proceder as: en
efecto, es posible formular una teora consistente de muchas partculas postulando relaciones de
conmutacin (o de anticonmutacin) para todas las clases de partculas, sean ellas de spin entero
o semientero. La forma correcta de proceder no surge a partir de un requisito de consistencia l222

14. Segunda cuantificacin


gica de la teora, sino de la evidencia experimental. No es as, en cambio, en la Teora Cuntica
Relativstica de Campos. En el marco de la teora relativstica es preciso satisfacer dos requerimientos9 sin los cuales la teora es absurda y se debe descartar:
Los observables que corresponden a puntos del espacio-tiempo separados por una distancia
tipo de espacio10 deben conmutar, de lo contrario se violara el principio de causalidad.
La energa del sistema debe ser semidefinida positiva.
Resulta entonces que si se intenta cuantificar un campo de spin entero por medio de relaciones
de anticonmutacin, se viola el primer requerimiento. Por lo tanto la consistencia de la teora
obliga a cuantificar los campos de spin entero por medio de conmutadores.
Tambin se encuentra que si se trata de cuantificar un campo de spin semientero por medio de
relaciones de conmutacin, se viola el segundo requerimiento. Luego la consistencia de la teora
obliga a cuantificar los campos de spin semientero por medio de anticonmutadores.
Este es pues el origen de la relacin entre spin y simetra de intercambio que mencionamos en el
Captulo 13.

El mtodo de Hartree-Fok
En el Captulo 12 mencionamos el mtodo de Hartree del campo autoconsistente, con el cual se
calculan en forma aproximada las energas de los estados fundamentales de tomos con varios
electrones. Dicha aproximacin tiene el defecto que las funciones de onda de varios electrones
usadas en el clculo no estn antisimetrizadas como corresponde. Como un ejemplo de la aplicacin de la segunda cuantificacin vamos a presentar el mtodo de Hartree-Fok11, que es una
mejora del mtodo de Hartree, que toma en cuenta la correcta simetra de intercambio de las
funciones de onda del sistema. El mtodo se aplica no slo a los tomos sino tambin a todo
sistema de muchos Fermiones que interactan de una forma cualquiera. Por lo tanto nuestra presentacin ser general, y slo al final la particularizaremos al caso de los tomos.
Consideremos entonces un sistema de n Fermiones descripto por el Hamiltoniano
H =

h(1)

b b +

1
2

v(2)

, , ,

b b b b

(14.116)

Aqu b y b ( = 1, 2,) son los operadores de aniquilacin y creacin de una sistema ortonormal completo de autoestados de una partcula, correspondientes a un observable cualquiera. Lo que nos interesa es encontrar una nueva base 1, 2 , con operadores de aniquilacin y creacin ak y ak , tales que el estado

n = anan1 a2a10

(14.117)

donde 0 es el estado de vaco, tenga la propiedad que el valor esperado de H sea el mnimo.
Claramente, el estado fundamental verdadero de H no es n , pero se puede pensar que ser una
combinacin lineal de estados de n partculas en la cual n es el trmino dominante, y en tal
caso el valor medio de H en el estado n :
9

Formulados por W. Pauli. En la teora no relativstica estos requerimientos se satisfacen siempre.

10

Esto es que ninguno de los dos puntos estn dentro del cono de luz del otro.

11

El fsico ruso Vladimir Fok fue quien desarroll la extensin del mtodo de Hartree de la que nos estamos ocu-

pando aqu.

223

14. Segunda cuantificacin

( , H n )
H = n
(n ,n )

(14.118)

ser una buena aproximacin (por exceso) de la energa del estado fundamental del sistema.
En la nueva base tendremos que
k
H = h(1)l akal + 12
k ,l

qr

v(2)st

aqaras at

(14.119)

q , r , s, t

Si n es tal que minimiza el valor esperado de H , entonces para todo n = n + n , donde


n es una variacin infinitesimal cualquiera de n se debe cumplir que

( , H n ) (n , H n )
H = n

=0
(n,n )
(n ,n )

(14.120)

Si despreciamos trminos del segundo orden y usamos la propiedad Hermitiana de H , la


(14.120) nos lleva a la condicin
(n ,n )[(H n ,n ) + (n , H n )] (n , H n )[(n ,n ) + (n ,n )] = 0

(14.121)

Consideremos ahora la variacin de n . Evidentemente n se obtiene de resultas de un cambio


desde la base 1, 2 , a la base 1 , 2 , , en la cual los nuevos operadores de creacin ak
estn dados por

ak = ak + ak = a j ( jk + i jk )

(14.122)

donde las jk son cantidades pequeas ( | jk | << 1 ) y el factor i se introdujo para asegurar que la
transformacin 1, 2 , 1 , 2 , sea unitaria. De la (14.122) resulta

ak = i a j jk

(14.123)

La variacin general n se puede expresar entonces como una combinacin lineal de variaciones independientes

jk = jk a j akn

(14.124)

donde se debe tener presente que ak aniquila un Fermin de uno de los estados ocupados
1, n y a j crea una partcula en uno de los estados previamente desocupados n+1, . La
unitariedad de la transformacin (14.122) requiere que los coeficientes jk formen una matriz
Hermitiana, pero esto no trae restricciones puesto que por el principio de exclusin resulta que

kj = kj aka jn = 0

(14.125)

dado que el estado j = n + 1, est vaco y el estado k = 1,, n est ocupado. Luego el requerimiento kj = *jk no restringe las posibles variaciones, cuya independencia est asegurada. Las

224

14. Segunda cuantificacin


variaciones con j = k no cambian el estado y por lo tanto son irrelevantes. En consecuencia
basta considerar las variaciones n de la forma (14.124) que son ortogonales al mejor estado
n de la forma (14.117).
Volviendo ahora a la condicin (14.121), vemos que (n , n ) y (n ,n ) son combinaciones
lineales de trminos de la forma (n , jk ) y ( jk ,n ) , y son nulos puesto que nuestras variaciones son siempre ortogonales a n . Adems (n ,n ) = 1 , y por lo tanto la (14.121) se reduce
a las siguientes condiciones
( H n , jk ) + ( jk , H n ) = 0 con

j = n + 1, y k = 1,, n

(14.126)

Si ahora usamos la expresin (14.119) de H en las (14.126) es fcil ver (con un poco de orden y
paciencia) que se obtienen las condiciones
j

(1)
h(1) k + vef
= 0 con
k

j = n + 1, y k = 1,, n

(14.127)

donde los
n

jt

jt

(1)
vef
= (v( 2 ) kt v( 2 )tk )
k

(14.128)

t =1

(1)
se pueden pensar como los elementos de matriz de un potencial efectivo vef
de una partcula
debido a sus interacciones con las dems. En las (14.127) y (14.128) los ndices k y t recorren
solamente los estados ocupados, mientras que j recorre nicamente los estados desocupados.
Conviene introducir el Hamiltoniano efectivo de una partcula como el operador

jt

jt

(1)
hHF = h(1) + vef
= h(1) + (v( 2 ) kt v( 2 )tk )

(14.129)

t =1

En trminos de hHF las condiciones (14.127) se escriben en la forma compacta

( j , hHF k ) = 0

(14.130)

Las condiciones (14.130) se satisfacen si las k y las j son autofunciones de hHF , es decir si
son soluciones del problema de autovalores

hHF k = ek k

(14.131)

Las (14.131) son las ecuaciones de Hartree-Fok. De las mismas resulta de inmediato que
k

kt

kt

(1)
( k , hHF k ) = h(1) k + vef
= h(1) k + (v( 2 ) kt v( 2 )tk ) = ek k
k

(14.132)

t =1

Se debe notar que los estados ocupados en (14.127), (14.129) y (14.132) no son arbitrarios, pues
se deben elegir entre los autoestados (14.131) de manera de minimizar el valor esperado de H .
Frecuentemente la mejor eleccin se obtiene usando las autofunciones correspondientes a los n
autovalores ek ms bajos.

225

14. Segunda cuantificacin


Es interesante ver que el mnimo del valor esperado de H no es igual a la suma de las energas
ek de partcula individual de los estados ocupados. En la aproximacin de Hartree-Fok la energa del estado fundamental est dada por
n

En = H = (n , H n ) =
=

1
2

k =1
n

k
(ek + h(1) k )
k =1

h(1)k + 12
1
2

ik

i, k =1

ik
(v( 2 )ik
i, k =1

ek

k =1

ik

(v(2)ik v(2)ki )
(14.133)
ik
v( 2 ) ki )

Este resultado es razonable pues al sumar los ek estamos contando dos veces la contribucin que
proviene de las interacciones entre las partculas.
(1)
A los efectos prcticos del clculo de los elementos de matriz del potencial efectivo vef
, es til
escribirlos en trminos del sistema completo original de autoestados ( = 1, 2,), en el cual

k = ( , k )

(14.134)

si en la base original b la interaccin es diagonal, o sea si


v( 2 ) = v

(14.135)

es fcil ver que se obtiene


j

jt

jt

(1)
vef
= (v( 2 ) kt v( 2 )tk )
k
t =1
n

= ( j , )( t , )v ( , t )( , k )
t =1 ,

(14.136)

( j , )( t , )v ( , t )( , k )
t =1 ,

Las ecuaciones de Hartree-Fok (14.131) se escriben entonces como


n

hHF k = h(1) k + ( t , )v ( , t )( , k )
t =1 ,

(14.137)

( t , )v ( , t )( , k ) = ek k
t =1 ,

y multiplicando escalarmente por resulta

h(1) ( , k ) + ( t , )v ( , t )( , k )

t =1

(14.138)

( t , )v ( , t )( , k ) = ek ( , k )
t =1

226

14. Segunda cuantificacin


El aspecto de las ecuaciones de Hartree-Fok es engaosamente simple, y la tarea necesaria para
resolverlas dista mucho de ser trivial. Las (14.131) aparentan ser un problema comn de auto(1)
valores, pero los elementos de matriz de vef
, que intervienen en el Hamiltoniano efectivo hHF
no se pueden calcular si no se conocen previamente las n autofunciones apropiadas k , soluciones de las mismas (14.131). Se trata por lo tanto de un sistema de n ecuaciones integrodiferenciales no lineales que se deben resolver simultneamente en forma iterativa, a partir de un conjunto de n estados de prueba ocupados t . Usando estos estados de prueba se comienza el
proceso, calculando los elementos de matriz (14.136) y luego se resuelven las ecuaciones de
Hartree-Fok (14.137). Si se tiene la suerte que la eleccin de las t fue acertada, habr n de las
soluciones de (14.137) que no diferirn mucho de las funciones de prueba elegidas. Si, como es
ms probable, las soluciones de las ecuaciones de Hartree-Fok no reproducen las funciones de
prueba iniciales, se usan para la siguiente iteracin las autofunciones correspondientes a los n
(1)
autovalores ek ms bajos para calcular nuevamente los elementos de matriz de vef
, y se repite el
procedimiento hasta hallar un conjunto de n soluciones autoconsistentes. Generalmente se
cuenta con buenos puntos de partida y por lo tanto las iteraciones convergen con razonable rapidez.
Aplicacin a un tomo con n electrones
En este caso tenemos que
h(1) =

p 2 Ze2

r
2m

(14.139)

El potencial de interaccin v( 2 ) es diagonal en la representacin coordenadas y se escribe


v( 2 ) ( r , ; r , ) =

e2
| r r |

(14.140)

Las ecuaciones de Hartree-Fok se escriben entonces en la forma

Ze2
h2 2
k (r, )
k (r, )
r
2m
n
1
+ e2
t ( r , ) k ( r , )dr
t* ( r , )
| r r |
t =1

e2

(14.141)

k ( r , ) t ( r , )dr = ek k ( r , )
t* ( r , )

| r r |

t =1

con k = 1,, n . Este sistema de ecuaciones integrodiferenciales acopladas es la aplicacin ms


conocida de la teora de Hartree-Fok. Si se ignora el ltimo trmino del miembro izquierdo de la
(14.141), que se debe a los elementos de matriz de intercambio de la interaccin y se omite el
trmino t = k en la suma sobre los elementos de matriz directos12, las ecuaciones que quedan
son

12

Ese trmino representara la interaccin de un electrn consigo mismo. Obviamente, los trminos con t = k de la

suma directa y la suma de intercambio son idnticos y se cancelan, de modo que no tienen efecto.

227

14. Segunda cuantificacin

h2 2
Ze2
k (r, )
k (r, )
2m
r
+ e2

1
t ( r , ) k ( r , )dr = ek k ( r , )
t* ( r , )

| r r |
t =1,t k

(14.142)

que no son otra cosa que las ecuaciones de Hartree. Antes del advenimiento de las veloces computadoras actuales, estas ecuaciones, ms sencillas que las (14.141), tenan mayor inters prctico que las ecuaciones ms precisas de Hartree-Fok.
Este ejemplo muestra claramente las virtudes de la segunda cuantificacin, su concisin y su
elegancia. Piense el lector, en efecto, que sera harto engorroso (aunque no imposible) desarrollar los argumentos de esta Seccin, si tuviramos que escribir n y n explcitamente en
forma de determinantes de Slater. Todo ese tedio se evita gracias a nuestro formalismo.
Existen otras importantes e interesantes aplicaciones de la segunda cuantificacin a problemas
de muchos cuerpos, entre la cuales podemos citar el tratamiento de las interacciones de apareamiento en Fsica de Slidos (el mtodo de Bardeen, Cooper y Schrieffer para estudiar los pares
de Cooper, que se relacionan con el fenmeno de la superconductividad) y en Fsica Nuclear
(importantes para interpretar el origen de ciertos estados de excitacin colectiva del ncleo atmico), la teora de las ondas de spin y de los magnones, la teora de perturbaciones en sistemas
de muchos cuerpos, etc..

228

15. Estadsticas Cunticas

15. LAS ESTADSTICAS CUNTICAS


El lmite clsico
Hemos visto en el Captulo 13 que cuando las funciones de onda de dos partculas idnticas no
se solapan, stas se comportan como partculas clsicas, esto es distinguibles. Esto ocurre porque
los efectos cunticos de la indistinguibilidad se ponen de manifiesto solamente cuando hay solapamiento entre las funciones de onda. Consideremos entonces un sistema de n partculas que no
interactan entre s y que ocupan un volumen V, y supongamos que estn en equilibrio trmico a
una temperatura T. De acuerdo con el Teorema de Equiparticin de la Mecnica Estadstica clsica1, la energa cintica media de traslacin de cada partcula de masa m es entonces

= 23 kT

(15.1)

donde k es la constante de Boltzmann, y el valor medio del impulso de una partcula es

p = 2 m = 3mkT

(15.2)

Luego su longitud de onda de Broglie, que da la medida de la extensin espacial del paquete de
ondas que la describe, vale

B =

h
h
=
p
3mkT

(15.3)

Por otra parte, la distancia media l entre las partculas est dada por

l = (V / n)1 / 3

(15.4)

Por lo tanto, las partculas se podrn considerar distinguibles si se cumple que

B << l

(15.5)

nh3
<< 1
V (3mkT )3 / 2

(15.6)

esto es, si

Esta es la condicin de validez de la Mecnica Estadstica Clsica. Si se cumple la (15.6), las


partculas se comportan clsicamente, y se puede aplicar el Teorema de Equiparticin. Esto es lo
que ocurre con los gases en las condiciones habituales en la naturaleza y en el laboratorio. Sin
embargo, cuando la temperatura es muy baja y/o cuando la densidad es muy elevada, la (15.6)
no se cumple; entonces los resultados clsicos no son vlidos y se manifiestan interesantes
efectos cunticos. Examinemos un poco ms la condicin (15.6), para entender mejor su significado. La probabilidad que una partcula se encuentre en un particular estado de energa de traslacin i est dada por la distribucin de Boltzmann
1

Ver el Captulo 17 de Termodinmica e Introduccin a la Mecnica Estadstica.

229

15. Estadsticas Cunticas


pi =

1 i / kT
e
Ztr

(15.7)

donde Ztr es la funcin de particin traslacional


Ztr = e i / kT

(15.8)

que para una partcula clsica2 est dada por

Ztr =

V
(2mkT )3 / 2
h3

(15.9)

Si nuestro sistema consta de n partculas el nmero de ocupacin medio ni de cada estado i es


ni = npi =

nh3
e i / kT
V (2mkT )3 / 2

(15.10)

Por lo tanto, la condicin (15.6) implica que

ni << 1

(15.11)

Luego en el lmite clsico la gran mayora de los estados de una partcula estn vacos, y slo
unos pocos estn ocupados por una sola partcula. La probabilidad que un estado est ocupado
por dos o ms partculas es insignificante. En este lmite desaparece la diferencia entre Bosones
y Fermiones: ambos se comportan como partculas clsicas, idnticas pero distinguibles.
Cuando no se cumple la (15.6) (o lo que es lo mismo la (15.11)) hay que tomar en cuenta los
efectos cunticos, y eso es lo que haremos en este Captulo. Pero primero queremos sealar
dnde est la falla de la Estadstica Clsica. La distribucin de Boltzmann (15.7) es correcta,
pues deriva de consideraciones generales sobre el equilibrio de un sistema bajo determinadas
restricciones. El inconveniente est en la funcin de particin (15.9), que se calcul suponiendo
que la probabilidad que una partcula ocupe un determinado estado no depende de si otras
partculas estn ocupando (o no) ese mismo estado. Sabemos que esto no es cierto, pues debido a
la indistinguibilidad cuntica de las partculas idnticas hay correlaciones entre ellas, de distinto
carcter segn sean Bosones o Fermiones. Por este motivo las distribuciones que se obtienen
para Bosones y Fermiones son diferentes. Pero cuando las condiciones del sistema son tales que
las correlaciones cunticas se tornan irrelevantes, ambas distribuciones coinciden con la
distribucin clsica de Maxwell-Boltzmann.

La funcin de particin de un sistema de partculas idnticas sin interaccin


Para deducir las distribuciones apropiadas para los sistemas cunticos conviene partir de la distribucin gran cannica o distribucin de Gibbs3, que se obtiene de considerar un sistema de
volumen fijo V, sumergido en un bao calorfico a la temperatura T, y con el cual puede intercambiar partculas. En estas condiciones la energa E y el nmero de partculas n del sistema

La expresin (15.9) se obtiene en el Captulo 17 de Termodinmica e Introduccin a la Mecnica Estadstica.

Ver el Captulo 16 de Termodinmica e Introduccin a la Mecnica Estadstica.

230

15. Estadsticas Cunticas


fluctan, pero en general dichas fluctuaciones son despreciables para un sistema macroscpico.
El sistema se describe entonces en trminos de T, V y del potencial qumico .
Usando la notacin = 1/ kT , la distribucin de probabilidad correctamente normalizada de encontrar el sistema en un estado con n partculas cuya energa es En, r est dada por
pn, r =

e ( n En, r )
Z

(15.12)

donde Z es la gran funcin de particin del sistema, dada por


Z Z (T , V , ) e ( n En, r )

(15.13)

n, r

A partir de Z se pueden obtener todas las propiedades termodinmicas del sistema. Consideraremos solamente un gas perfecto cuntico, es decir un sistema de partculas sin interacciones.
En este caso el estado del sistema est especificado por los nmeros de ocupacin
n1, n2 ,

(15.14)

de los estados de partcula individual 1 ( ), 2 ( ), . Los ni son enteros no negativos tales que

ni = n

(15.15)

Vamos a suponer que los estados i estn ordenados por energa creciente4, esto es

1 2 i

(15.16)

Por lo tanto
Z=

e [ (n1 + n2 +)(n11 + n2 2 +)] = Z i

n1 , n2 ,

(15.17)

donde hemos escrito


Z i = e ( i )ni

(15.18)

ni

y la sumatoria en Z i se extiende a todos los valores posibles de ni . Aqu vemos la ventaja de


partir de la distribucin de Gibbs, pues en el ensemble gran cannico los ni no estn restringidos
por la condicin (15.15), y eso permite factorizar Z, porque la distribucin estadstica para cada
estado de una partcula, dada por la (15.18), no depende de lo que ocurre con los dems estados5.
Esta simplificacin tiene su precio, sin embargo: tuvimos que introducir el potencial qumico,
que no conocemos de antemano y que hay que determinar a posteriori imponiendo la condicin

4
5

En general debido a la degeneracin de los niveles de energa hay muchos trminos iguales en la sucesin (15.15).
Este problema no existe en la estadstica de Maxwell-Boltzmann pues al no considerar las correlaciones entre las

partculas, la funcin de particin del ensemble cannico se factoriza sin dificultad.

231

15. Estadsticas Cunticas

ni = n

(15.19)

es decir, la condicin (15.15), pero restringida a los valores medios.

Las distribuciones de Bose-Einstein y de Fermi-Dirac


Las frmulas anteriores valen tanto para sistemas de Bosones como de Fermiones. En lo que sigue vamos a indicar con B las frmulas que valen para los Bosones y con F las que corresponden a Fermiones. En un sistema de Bosones ni puede tomar cualquier valor entero positivo a
partir de 0. Por lo tanto, sumando la serie geomtrica que resulta de (15.18) obtenemos

Zi =

(ni = 0, 1, 2, )

1 e ( i )

(15.20)

En un sistema de Fermiones ni toma solamente los valores 0 y 1 y la (15.18) se reduce a


Z i = 1 + e ( i )

(ni = 0, 1)

(15.21)

La probabilidad que el nmero de ocupacin del estado i tenga el valor ni est dada por

pi (ni ) =

e ( i )ni
Zi

(15.22)

y entonces el nmero de ocupacin medio del estado i est dado por


ni =

ln Z i

T ,V

ni pi (ni ) = kT

todo ni

(15.23)

Usando la (15.20) y la (15.23) se obtiene la distribucin de Bose-Einstein para los Bosones:

ni =

1
e ( i )

(15.24)

(15.25)

donde el potencial qumico se determina pidiendo que


n = ni =
i

1
e ( i )

En la (15.25) pusimos n = n dado que las fluctuaciones se pueden suponer despreciables.


Del mismo modo usando la (15.21) y la (15.23) se obtiene para Fermiones la distribucin de
Fermi-Dirac:

ni =

1
e ( i )

+1

y el potencial qumico se encuentra a partir de la condicin

232

(15.26)

15. Estadsticas Cunticas


n=
i

1
e ( i )

+1

(15.27)

A continuacin vamos a estudiar el significado de estos resultados.

El gas perfecto de Bosones


De acuerdo con los resultados anteriores tenemos que para un gas de Bosones
ni =

1
e ( i )

, n=
i

1
e ( i )

(15.28)

Puesto que ni 0 siempre, se debe cumplir que i > para todo i. Por otra parte, el estado de
ms baja energa de una partcula libre tiene 1 = 0 . Por lo tanto el potencial qumico de un gas
de Bosones es siempre negativo.
La temperatura de degeneracin
Introduciendo la densidad de estados por unidad de intervalo de energa f ( ) , la sumatoria de la
segunda de las (15.28) se puede escribir como una integral

f ( )d
2 m 3 / 2 1 / 2 d

= 2V 2
e ( i ) 1 =
h
e ( ) 1
e ( ) 1
i
1

(15.29)

donde usamos la expresin (9.19) de f ( ) , que se dedujo contando los estados estacionarios de
una partcula libre de masa m que se mueve en una caja de volumen V, y hemos supuesto
Bosones de spin nulo (si s 0 hay que multiplicar (15.29) por 2 s + 1 ). Tenemos por lo tanto

2 m 3 / 2 1 / 2 d
n

= 2 2
h
V
e ( ) 1

(15.30)

Como el miembro izquierdo de la (15.30) no depende de T, (n, T ) debe ser tal que la integral
en (15.30) sea independiente de T. Supongamos variar la temperatura del gas, con n / V constante. Es evidente que a medida que T disminuye, | | debe disminuir, hasta llegar a = 0 para
una temperatura mnima Tc determinada por la condicin

n
2 m 3 / 2 1 / 2 d

= 2 2
h
V
e / kTc 1

(15.31)

Tc se denomina temperatura de degeneracin, o de condensacin, por motivos que veremos en


breve. Para evaluar la integral hacemos el cambio de variable = kTc z y queda

n 2mkTc 3 / 2 2 z1 / 2 dz
=

V h2
ez 1
0

De tablas se encuentra que


233

(15.32)

15. Estadsticas Cunticas

2 z1 / 2 dz
= (3 / 2) 2.61239

ez 1

(15.33)

donde con (q ) indicamos la funcin Zeta de Riemann, definida por

(q) =

kq

, Re(q ) > 1

(15.34)

k =1

Resulta entonces que


1 nh3
Tc =

2mk (3 / 2)V

2/3

(15.35)

De la (15.35) obtenemos que


3/ 2
nh3
2
=

(
3
/
2
)
7.92
3
V (3mkTc )3 / 2

(15.36)

Comparando (15.36) con la condicin de validez (15.6) de la estadstica clsica vemos que la
anulacin de del gas de Bosones a la temperatura Tc es un fenmeno netamente cuntico.
La condensacin de Bose-Einstein
Puesto que < 0 siempre, parecera que no se puede enfriar a densidad constante un gas de Bosones hasta T Tc , lo que no es cierto pues la ec. (15.29) se cumple para T > Tc pero no para
T Tc . El origen del problema es que en la (15.29) reemplazamos la suma discreta sobre los estados de una sola partcula por una integral. A medida que la temperatura del gas disminuye y se
acerca a Tc el nmero de ocupacin del estado 1 , cuya energa es nula, comienza a aumentar
rpidamente. Pero precisamente este estado no est tomado en cuenta en la (15.29) porque al reemplazar la suma por una integral, el factor 1 / 2 del integrando hace que se le asigne un peso
nulo. Para temperaturas ms altas, eso no trae aparejado un error significativo. Pero cuando la
temperatura es muy baja no se puede omitir 1 : lo correcto es conservar explcitamente su contribucin, y reemplazar los dems trminos por la integral6. En lugar de (15.30) escribiremos

n=

1
e

2m 3 / 2
1 / 2 d
+ 2V 2
h
1
e ( ) 1

(15.37)

En esta ecuacin

n1 =

1
e

(15.38)

es el nmero de partculas en el estado 1 , con energa nula y cantidad de movimiento nulo, y


6

Se puede mostrar que siempre que n sea muy grande es suficiente tratar de manera especial solamente el primer

trmino de la suma, y reemplazar todos los dems por la integral.

234

15. Estadsticas Cunticas

n > 0

2m 3 / 2
1 / 2 d
= 2V 2
h
e ( ) 1

(15.39)

es el nmero de partculas cuya energa y cantidad de movimiento no son nulos. Para T > Tc ,
tendremos que n1 << n y entonces lo podemos despreciar. Por lo tanto el potencial qumico est
dado con excelente aproximacin por la ec. (15.30). Para T Tc , el potencial qumico es negativo y muy prximo a 0, pero nunca se anula exactamente. Si T Tc , podemos usar la (15.39)
con = 0 para calcular n >0 con buena aproximacin y se obtiene

n > 0

3/ 2
2 m 3 / 2 1 / 2 d
2 z1 / 2 dz
2mkT
2V 2
=
V

h
h2
ez 1
e 1
0

(15.40)

Dividiendo la (15.40) por la (15.32) obtenemos entonces una sencilla frmula que nos da la fraccin de partculas cuya energa y cantidad de movimiento no son nulos:

n > 0 T
=
n
Tc

3/ 2

(T < Tc )

(15.41)

La partculas restantes estn en el estado fundamental 1 , y representan una fraccin

T
n1
=1
n
Tc

3/ 2

(T < Tc )

(15.42)

del nmero total (Fig. 15.1). En sntesis, para T > Tc la fraccin de partculas en el estado fundamental 1 es despreciable. Cuando T < Tc , n1 / n crece rpidamente al disminuir T y tiende a
1 para T 0 . Estas partculas tienen energa nula y cantidad de movimiento nulo. Luego no
contribuyen a la presin7, y tampoco a la viscosidad del gas. El fenmeno de concentracin de
las partculas en el estado fundamental se llama condensacin de Bose-Einstein. Un gas de
Bosones se dice degenerado8 cuando presenta condensacin de Bose-Einstein.
Un gas de Bosones degenerado tiene cierta analoga con un vapor clsico en equilibrio con su
lquido (de all el trmino condensacin). Por ejemplo, se puede ver que cuando T < Tc la presin de un gas de Bosones depende solamente de T y es independiente del volumen, de manera
semejante a lo que ocurre en el equilibrio lquido-vapor. Se debe notar, sin embargo, que en la
condensacin de Bose-Einstein no hay una separacin de fases en el espacio. Pero se puede interpretar que hay una separacin de fases en el espacio de los impulsos, pues las partculas con
energa y cantidad de movimiento nulas (la fase condensada) y las partculas con energa y
cantidad de movimiento no nulas (la fase vapor) tienen propiedades muy diferentes.

En el cero absoluto la presin del gas de Bosones es nula. Tambin es nula le entropa, de acuerdo con la Tercera

Ley de la Termodinmica.
8

El trmino degenerado se usa aqu en un sentido diferente del que tiene cuando se habla de la degeneracin de

un nivel.

235

15. Estadsticas Cunticas

n1 sn

1
TsTc

Fig. 15.1. Condensacin de Bose-Einstein: cuando T < Tc la fraccin de partculas en el


estado fundamental crece rpidamente al disminuir T, y tiende a 1 para T 0 .
Potencial qumico de un gas de Bosones
Para calcular las propiedades del gas de Bosones es preciso conocer el potencial qumico. Para
ello hay que resolver para (n, T ) la ec. (15.37), que con el cambio z = se escribe como

n=

1
e

2 mkT
+ 2V 2
h
1

3/ 2

1/ 2
z dz
z
1
e

(15.43)

La integral en (15.43) es un caso particular de las integrales de la forma general

q 1

z dz = m (q ) Li ( mt ) , Re(q ) > 0
1 z
q
t e 1

(15.44)

Aqu Li q (t ) es la funcin polilogartmica, definida por la serie

Li q (t ) =

tk
q
k =1 k

(15.45)

Algunas propiedades tiles de Li q (t ) son:


Li q (1) = (q ) (q > 1) , Li q (t ) = t + O(t 2 ) ,
Notar que Li q (t ) diverge en t = 1 para q 1.
Volviendo al clculo de , vemos que la (15.43) se convierte en
236

Li q 1 (t )
d
Li q (t ) =
dt
t

(15.46)

15. Estadsticas Cunticas

n=

1
e

2mkT
+ V
h2
1

3/ 2

Li 3 / 2 (e )

(15.47)

la cual, recordando que

2mkTc
h2

3/ 2

n
V (3 / 2)

(15.48)

Li 3 / 2 (e )
1
, n1 =
e
1
(3 / 2 )

(15.49)

se escribe finalmente como

n T
1= 1 +
n Tc

3/ 2

Para un sistema macroscpico n es un nmero enormemente grande (del orden del nmero de
Avogadro), de modo que n1 / n es despreciable frente a la unidad, para todo T T c ; por lo tanto,
tenemos que, con buena aproximacin

T
1=
Tc

3/ 2

Li 3 / 2 (e )
(3 / 2 )

(T > Tc )

(15.50)

Invirtiendo esta relacin obtenemos finalmente el potencial qumico (Fig. 15.2). Se puede ver
(no damos aqu los detalles) que en el intervalo 0 < T Tc , es negativo y no se anula nunca
(salvo para T = 0); su valor absoluto es muy pequeo, siendo del orden de kT / n .

0
1
PskTc 2
3
4

2
TsTc

Fig. 15.2. Potencial qumico de un gas de Bosones no interactuantes. Con la lnea de trazos
se muestra el valor clsico de , dado por la ec. (15.51).

237

15. Estadsticas Cunticas


El lmite e << 1 de la (15.50) permite obtener la expresin de para un gas perfecto clsico.
Usando la segunda de las (15.46) obtenemos

clsico

1 T 3 / 2
V 2mkT 3 / 2
kT
=

= kT ln
ln


h2
(3 / 2) Tc
n

(15.51)

Los nmeros medios de ocupacin


Es interesante calcular los nmeros medios de ocupacin, dados por la (14.28). La Fig. 15.3
muestra n( ) para diferentes temperaturas del gas. El grfico es semilogartmico pues as se
aprecian mejor los apartamientos desde la distribucin clsica de Maxwell-Boltzmann, que se
representa por medio de rectas de pendiente 1/ kT .
100
10

1.5
2

0.1
3
0.01
4
0.001
5
1

3
HskTc

Fig. 15.3. Nmero de ocupacin medio en funcin de la energa del estado para un gas de
Bosones. Las curvas corresponden a T / Tc = 1, 1.5, 2, 3, 4 y 5 .
Se puede observar que las curvas para T / Tc = 3, 4 y 5 son prcticamente rectas, lo que indica
que el comportamiento del gas para esas temperaturas es clsico, como es de esperar porque en
esos casos n( ) es siempre mucho menor que la unidad. En cambio, las curvas correspondientes
a T / Tc = 1, 1.5 y 2 se apartan de las rectas clsicas para por debajo de 2 - 2.5 kTc , donde n( )
ya no se puede despreciar frente a la unidad.
El calor especfico de un gas de Bosones
Vamos a estudiar ahora el calor especfico de un gas de Bosones. Recordando que nk = NR ,
donde N es el nmero de moles, tenemos que el calor especfico molar est dado por

cV =

R E

nk T V

238

(15.52)

15. Estadsticas Cunticas


Por lo tanto para determinar cV tenemos que calcular primero la energa interna del gas, dada
por

f ( )d
2 m 3 / 2 3 / 2 d

E = i ni = ( )

= 2V 2
h
i
1 e ( ) 1
e ( ) 1
i
i e
i

(15.53)

Haciendo el cambio de variable = z y usando la (15.35) y la (15.44) resulta

3 nkT T
E=

2 (3 / 2) Tc

3/ 2

Li 5 / 2 (e )

(15.54)

Aqu conviene considerar por separado los casos T <T c y T T c .


Cuando T <T c , podemos suponer que 0 y por lo tanto Li 5 / 2 (e ) Li 5 / 2 (1) = (5 / 2) . Resulta entonces que

E = nk

3 (5 / 2 ) T 5 / 2
2 (3 / 2) Tc3 / 2

(T < Tc )

(15.55)

y por lo tanto

cV =

15 (5 / 2) T
R

4 (3 / 2) Tc

3/ 2

(T < Tc )

(15.56)

Cuando T >T c , obtenemos de la (15.52)

cV =

3 R T

2 (3 / 2) Tc

3/ 2

5
1


Li 5 / 2 (e ) Li3 / 2 (e )
2
kT k T n

(15.57)

Para obtener la expresin de ( / T )n derivamos la (15.50). Resulta

1
3 Li 3 / 2 (e )
=
kT k T n 2 Li1 / 2 (e )

(15.58)

Obsrvese que tanto como ( / T )n tienden a cero para T Tc pues Li1 / 2 (t ) diverge en
t = 1. Usando la (15.58) obtenemos finalmente

3 R T
cV =

2 (3 / 2) Tc

3/ 2

2
5
) 3 Li 3 / 2 (e )
e
Li
(

(T Tc )
5/ 2
2 Li1 / 2 (e )
2

(15.59)

Cuando T = Tc tanto la (15.56) como la (15.59) convergen a


cV (Tc ) =

15 (5 / 2)
= 1.92567 R
R
4 (3 / 2 )

En la Fig. 15.4 se muestra el comportamiento de cV .

239

(15.60)

15. Estadsticas Cunticas

3s2
caV sR
1

1s2

TsTc

Fig. 15.4. Calor especfico molar a volumen constante de un gas de Bosones. La lnea de
trazos indica el valor clsico 3 R / 2 . Para T > Tc el calor especfico del gas de Bosones es
mayor que el valor clsico, y aumenta al disminuir T hasta alcanzar en Tc el mximo dado
por la ec. (15.60). Al disminuir la temperatura por debajo de Tc , el calor especfico del gas
degenerado disminuye rpidamente con T. En T = Tc la derivada cV / T es discontinua.
Es interesante comparar las propiedades que acabamos de estudiar con el comportamiento del
4
He lquido a bajas temperaturas. Como el 4He tiene spin cero cumple la estadstica de BoseEinstein y por ser un gas inerte, las fuerzas interatmicas son las de van der Waals, que son muy
dbiles. Por ese motivo el helio se lica a una temperatura muy baja (el punto normal de ebullicin del 4He es de 4.2 K), y slo se solidifica bajo presiones muy grandes. Al enfriar el 4He lquido en contacto con su vapor, sus propiedades cambian bruscamente a T = 2.17 K. Para
T > 2.17 K se comporta como un lquido normal, llamado helio I. Para T < 2.17 K presenta
propiedades muy llamativas, por ejemplo fluye por capilares muy finos como si no tuviese viscosidad. Esta forma se llama helio II, y sus caractersticas se describen por medio del modelo de
dos fluidos, que trata el helio II como una mezcla de un fluido normal y otro superfluido, sin interaccin viscosa entre s. El fluido normal tiene todas las propiedades familiares de los fluidos.
El superfluido, en cambio, tiene caractersticas muy curiosas: su entropa es nula, y no tiene viscosidad. El hecho que en un gas de Bosones degenerado hay dos clases de partculas cuyo comportamiento es muy diferente sugiere que las propiedades del helio II se relacionan con el fenmeno de la degeneracin. Hay muchas analogas entre el helio II y el gas de Bosones degenerado, adems de las que vamos a comentar. En la transicin helio I-helio II se observa un comportamiento anormal del calor especfico (Fig. 15.5). Como la curva experimental recuerda la
letra griega (lambda), el paso de helio I a helio II se denomina transicin , y la temperatura
de transicin se llama punto . La semejanza entre las Fig. 15.4 y 15.5 llev a London9 a inter-

Fritz Wolfgang London y Walter Heitler desarrollaron en 1927 el primer tratamiento cuntico de la molcula de

hidrgeno. F. London y su hermano Heinz formularon en 1935 le teora fenomenolgica de la superconductividad,


un fenmeno estrechamente relacionado con la superfluidez.

240

15. Estadsticas Cunticas


pretar que la transicin del 4He es una manifestacin de la condensacin de Bose-Einstein.
Usando la ec. (15.35) calcul la temperatura de condensacin de un gas perfecto de tomos de
helio, para una densidad igual a la del helio I en el punto experimental. Con V / n = 27.6
cm3/mol obtuvo Tc = 3.13 K, lo cual no est demasiado lejos del valor medido T = 2.17 K.
3.0

2.0
c (cal/g K)
1.0

0.0
1.6

2.0
T (K)

2.4

2.8

Fig. 15.5. Comportamiento del calor especfico del 4He, tal como resulta de las mediciones. Se puede apreciar la transicin a T = 2.17 K.
Hay diferencias importantes entre el comportamiento del helio II y el gas de Bosones. Entre ellas
se cuenta que la dependencia en la presin de la temperatura de transicin es distinta. Adems,
las mediciones ms precisas muestran que en el punto , cV no se mantiene acotado como ocurre para el gas de Bosones, sino que tiene un infinito logartmico. Si embargo estas diferencias
no deben sorprender, pues la teora que hemos desarrollado corresponde a un gas perfecto, y no
se puede aplicar tal cual al helio lquido, en el cual hay interacciones interatmicas, que (evidentemente) no se pueden ignorar. Por consiguiente es razonable concluir que la transicin del
4
He es lo anlogo para un lquido de la condensacin de Bose-Einstein de un gas perfecto. Esta
conclusin se refuerza si se tiene en cuenta que el 3He, cuyos tomos tienen spin 1/2 y por lo
tanto son Fermiones, no presenta transicin10 en el punto del 4He.
La superconductividad (que no tratamos por razones de espacio) es un fenmeno anlogo a la
superfluidez. Segn la teora BCS (formulada en 1957 por John Bardeen, Leon N. Cooper y
John R. Schrieffer), a temperaturas muy bajas los electrones de conduccin se agrupan de a pares (pares de Cooper) formando una suerte de cuasimolcula. Como los pares se comportan
como Bosones, se pueden condensar y esto explica las propiedades de los superconductores.
10

Para el 3 He, la superfluidez se observa a temperaturas inferiores a 310 3 K. Esto se debe a que a esas

temperaturas tan bajas los tomos del 3He se unen formando pares, de igual modo que los electrones en un
superconductor. Los pares tienen spin entero y por lo tanto obedecen a la estadstica de Bose-Einstein. Tan pronto
se forman los pares, stos sufren una condensacin, y por lo tanto todo lo dicho para el 4He se aplica tambin al 3He
cuando ste se encuentra a temperaturas para las cuales se han formado los pares.

241

15. Estadsticas Cunticas


Durante muchos aos se careci de evidencia directa de la existencia de la condensacin de
Bose-Einstein, aunque se crea que ocurra en el helio lquido. La situacin cambi en 1995
cuando Michael H. Anderson, Jason Enscher, Michael Matthews, Carl Wieman y Eric Cornell,
observaron la condensacin de Bose-Einstein en un gas de 87Rb con una densidad de 2.51018
tomos/m3, enfriado por debajo de 0.17106 K. El gas estaba confinado por un campo magntico, y para detectar la condensacin se desconectaba dicho campo y poco despus se registraba
la densidad espacial de las partculas. Aquellas cuya velocidad es apreciable se alejan rpidamente de la regin de confinamiento, pero los tomos del condensado, cuya cantidad de movimiento es nula, permanecen en dicha regin. Si hay muchas partculas en ese estado, se esperaba
ver un pico de la densidad en la regin donde el gas haba estado confinado. Esto fue efectivamente observado, pero slo si la temperatura est por debajo de Tc . Al enfriar el gas por debajo
de Tc se encuentra que el pico se refuerza, tal como est previsto por la teora. Ese mismo ao,
en forma independiente, Wolfgang Ketterle y sus colaboradores realizaron experimentos similares pero algo ms sofisticados con tomos de sodio y de litio, y tambin observaron la condensacin de Bose-Einstein. Por estos trabajos Cornell, Ketterle y Wieman fueron galardonados con el
Premio Nobel para la Fsica en 2001.

El gas de fotones y la radiacin de cuerpo negro


Vamos a estudiar ahora la radiacin de cuerpo negro, considerndola como un gas perfecto de
fotones en equilibrio trmico. De acuerdo con la hiptesis de Einstein (ver el Captulo 4) vamos
a suponer que los fotones son partculas de masa nula y energa dada por la ec. (4.16), esto es

i = h i

(15.61)

Como los fotones tienen spin 1, son Bosones y corresponde aplicar la estadstica de BoseEinstein. Al usar la distribucin (15.24) hay que tener en cuenta que los fotones pueden ser emitidos y absorbidos por las paredes de la cavidad (este es el mecanismo que garantiza el equilibrio
de la radiacin de cuerpo negro a T y V fijos), y entonces n no est determinado a priori, a diferencia del gas de Bosones que tratamos antes. En este caso n est determinado por la condicin
de equilibrio a T y V fijos11. Esto implica que el potencial qumico del gas de fotones es idnticamente nulo. En efecto, para todo cambio espontneo T y V fijos se cumple

F 0

(15.62)

donde F es la funcin de Helmholtz. Luego en el equilibrio F es mnimo, lo que lleva a la condicin necesaria (F / n)T ,V = 0 . De aqu se obtiene entonces

F
=
=0
n T ,V

(15.63)

Teniendo en cuenta este hecho la distribucin (15.24) queda de la forma

ni =

11

1
e i

fotones

ver el Captulo 8 de Termodinmica e Introduccin a la Mecnica Estadstica.

242

(15.64)

15. Estadsticas Cunticas


A partir de la (15.64) es muy sencillo deducir la distribucin espectral de Planck. En efecto, recordemos que la densidad de estados por unidad de intervalo de frecuencia es (ec. (4.1)):

N ( ) =

8V 2

c3

(15.65)

Por lo tanto la densidad de energa u ( , T ) (energa por unidad de volumen en el intervalo de


frecuencia entre y + d ) est dada por

u ( , T ) = V 1 N ( )n ( )

(15.66)

Sustituyendo (15.63) y (15.64) en (15.66) se obtiene la distribucin espectral de Planck (ec.


(4.12)).
u ( , T ) =

8 2
h
h

/
3
c e kT 1

(15.66)

Es fcil verificar que el mximo de u ( , T ) ocurre para

= m = 2.82144

kT
h

(15.67)

La (15.67) expresa la Ley de desplazamiento de Wien, que fue obtenida originalmente en la


forma m ~ T en base a un argumento puramente termodinmico.
Integrando la (15.66) sobre todas las frecuencias obtenemos la densidad de energa radiante

E
8h
8 5k 4 4
3
d =
T
= u ( , T )d = 3
h / kT
V 0
c e
15c3h3
1

(15.68)

La (15.68) es la Ley de Stefan-Boltzmann12 E / V = ( 4 / c)T 4 , y podemos entonces expresar la


constante de Stefan-Boltzmann como

2 5k 4
15c 2 h3

(15.69)

Es oportuno comentar brevemente el significado fsico de la distribucin (15.64) para aclarar


algunos aspectos de la radiacin mencionados en captulos anteriores. La Fig. 15.6 muestra la
distribucin de Planck (15.66) y la Fig. 15.7 los nmeros de ocupacin medios (ec. (15.64)) por
medio de curvas universales, obtenidas adimensionalizado le energa de los fotones con el factor
kT y u ( , T ) con el factor T 3 , donde = 60 h / 4 k c . Para comparar, mostramos tambin en
esas figuras la posicin de m , y los resultados de la teora clsica de Rayleigh-Jeans (lneas de
trazos) y de la frmula emprica de Wien mencionada en el Captulo 4 (lneas de puntos).
Por de pronto, comparando las Figs. 15.3 y 15.7 vemos que el comportamiento de n es anlogo
al de un gas de Bosones a T = Tc (pues en ambos casos = 0 ). Por lo tanto, cualquiera sea su
temperatura, el gas de fotones se comporta de manera semejante a un gas de Bosones a T = Tc .

12

Ver el Captulo 15 de Termodinmica e Introduccin a la Mecnica Estadstica.

243

15. Estadsticas Cunticas


2

usDT
1

3
4
hQskT

Fig. 15.6. La distribucin de Planck. Representamos tambin la distribucin de RayleighJeans (lnea de trazos), que reproduce para bajas frecuencias el resultado de Planck, y la
distribucin de Wien (lnea de puntos), que tiene el comportamiento correcto para frecuencias altas.

100

10

1
n
0.1

0.01

0.001
1

3
4
hQskT

Fig. 15.7. Nmero medio de ocupacin de los estados de fotones para la radiacin de
cuerpo negro. Las lneas de trazos y puntos corresponden a las frmulas de Rayleigh-Jeans
y de Wien, respectivamente.
Comparando las Figs. 15.6 y 15.7 notamos que el mbito de validez de la frmula de Wien corresponde al rango de frecuencias para el cual n << 1, esto es, el rango en el cual los fotones
244

15. Estadsticas Cunticas


cumplen la condicin (15.11) y entonces se comportan como partculas clsicas (esto es, distinguibles). En efecto, la frmula de Wien no es otra cosa que la distribucin clsica para un sistema de partculas de masa nula y energa = h . Este rango, que podramos llamar entonces
de partcula clsica, abarca las frecuencias mayores que 2 kT / h y comprende un 80% de la
energa radiante total. Para comprender lo que esto implica daremos algunos valores. La radiacin electromagntica que proviene de casi todas las fuentes naturales es de origen trmico13 y
su distribucin espectral es, grosso modo, del mismo tipo que la del cuerpo negro. La luz solar
corresponde a 5700 K, y todos los fotones de longitud de onda ms corta que la del cercano infrarrojo estn en el rango > 2 kT / h ; para una temperatura de 300K, lo estn todos los fotones
de longitud de onda menor que unos 25 m. Por lo tanto, del infrarrojo en adelante, los fotones
provenientes de fuentes naturales se comportan como partculas clsicas, y se describen mediante paquetes o trenes de ondas que no se solapan; se trata entonces de radiacin incoherente14. En estas condiciones los fenmenos de interferencia y difraccin a que dan lugar se deben al comportamiento de cada fotn individual (cuyo paquete de ondas, por ejemplo, al pasar
por las rendijas del experimento de Young interfiere consigo mismo). Asimismo, estos fotones
interactan con la materia de a uno por vez, como vimos en el Captulo 4 al tratar el efecto fotoelctrico, el efecto Compton y otros fenmenos.
En cambio la Ley de Rayleigh-Jeans vale para frecuencias bajas, para las cuales n >> 1. En este
rango el conjunto de los fotones que ocupan cada estado de energa i = h i est descripto por
un paquete de ondas que es una superposicin coherente de los paquetes de onda individuales.
Por este motivo, cuando n es muy grande los campos elctricos y magnticos del conjunto tienen las propiedades de una onda clsica, caracterizada por la fase, adems de la frecuencia y la
amplitud. Puesto que en este dominio los cuantos interactan con la materia en conjuntos coherentes, es decir colectivamente y no individualmente, la nocin misma de fotn pierde significacin. De hecho, en este rgimen los fotones son inobservables. El rango de onda clsica15 abarca
las frecuencias por debajo de 0.01 kT / h y comprende menos del 3% de la energa radiante total. Para 5700 K corresponde a > 0.025 cm y para 300K, > 0.5 cm.
Los dos comportamientos que se acaban de comentar representan los casos extremos de altas y
bajas frecuencias. La radiacin trmica de frecuencias intermedias ( 0.01 kT / h < < 2 kT / h )
tiene parte de las caractersticas de onda clsica y parte de las caractersticas de partcula clsica,
ya que la transicin entre ambos regmenes es continua. Vemos as que la descripcin cuntica
de la radiacin incorpora la dualidad onda-corpsculo de la cual hablamos en el Captulo 4, y le
da un significado ms preciso.
Para terminar esta discusin de la radiacin de cuerpo negro, observemos que si bien la presente
deduccin de la (15.66) y la que dimos en el Captulo 4 son esencialmente equivalentes, hay una
diferencia conceptual entre ellas que conviene subrayar. Mientras en el Captulo 4 consideramos
13

Hay algunas excepciones, como por ejemplo la radiacin de sincrotrn emitida por fuentes csmicas

(radiogalaxias y quasars).
14

Aqu estamos empleando los trminos coherente e incoherente en un sentido algo diferente del habitual en la

ptica clsica.
15

Puesto que ste es el rango donde se ponen de manifiesto los efectos de la indistinguibilidad de los fotones, es

aqu donde ocurren los efectos cunticos de la estadstica de los fotones. Desde este punto de vista se puede afirmar
que la onda electromagntica clsica es, en realidad, un efecto cuntico debido a la presencia de muchos fotones
coherentes.

245

15. Estadsticas Cunticas


que cada modo normal del campo de radiacin est cuantificado, de modo que su energa toma
solamente los valores discretos 0, h , 2 h , , ahora estamos considerando la radiacin como un
sistema de partculas idnticas (los cuantos del campo, es decir los fotones), cada una de las
cuales tiene una energa h .

La emisin y absorcin de fotones


La naturaleza Bosnica de los fotones tiene importantes consecuencias sobre los fenmenos de
interaccin entre la radiacin y la materia. Si bien para el estudio detallado de estos procesos
hace falta la Electrodinmica Cuntica (EDC), que no vamos a tratar en estas notas, es posible
deducir algunos aspectos fundamentales de la interaccin radiacin-materia en base a argumentos sencillos, sin necesidad de invocar la EDC. Eso es lo que vamos a hacer aqu.
Emisin y absorcin de fotones y la distribucin de Planck
Nuestra deduccin de la estadstica (15.64) del gas de fotones se bas en la distribucin de BoseEinstein, que se obtiene de la Mecnica Estadstica considerando la distribucin gran cannica
de un sistema de Bosones en equilibrio a temperatura y volumen fijos, con el requerimiento adicional que el potencial qumico del gas de fotones es nulo (porque la emisin y absorcin de fotones por la materia determina el nmero total de fotones de la cavidad, de modo que ste no
est determinado a priori). Vamos a mostrar ahora que se puede llegar a la (15.64) directamente,
considerando explcitamente los procesos de emisin y absorcin.
eb

eb

hi = eb ea

hi = eb ea

ea

ea
emisin

absorcin

Fig. 15.8. Dos estados estacionarios particulares a y b de un tomo. En la transicin


a b el tomo absorbe un fotn de energa = h = eb ea . Viceversa, en la transicin
b a el tomo emite un fotn de la misma energa.
Sean dos estados estacionarios particulares a y b de un tomo de las paredes de la cavidad,
de energas16 ea y eb , con ea < eb (Fig. 15.8). Entonces, en la transicin a b el tomo absorbe un fotn de energa

= h = eb ea
16

(15.70)

Aqu a y b indican el conjunto de los nmeros cunticos que identifican el estado. Para cada nivel de energa hay,

en general, varios estados degenerados, pero nosotros estamos considerando ahora uno entre ellos en particular.

246

15. Estadsticas Cunticas


viceversa, en la transicin b a el tomo emite un fotn de la misma energa. Ahora bien, hay
muchos estados fotnicos i con energa (su nmero est dado por la (15.65)), que describen
las diferentes direcciones de propagacin y polarizacin del mismo. Nosotros estamos interesados ahora en uno slo de ellos, correspondiente a una particular direccin de propagacin y una
polarizacin determinada, que designaremos con k . Consideremos entonces una transicin
a b en la cual el tomo que inicialmente est en el estado a absorbe un fotn en el estado
k . La probabilidad Pa b que en la unidad de tiempo ocurra esta transicin est dada por

Pa b = pa Ta, nk b, nk 1

(15.71)

Aqu pa = e ea / Z es la probabilidad que el tomo est en el estado a , y


Ta, nk b, nk 1 =| ( b nk 1, hint, k a nk ) |2

(15.72)

es la probabilidad de transicin por unidad de tiempo desde el estado inicial a nk al estado


final b nk 1 del sistema (tomo + radiacin17) y hint,k es el trmino del Hamiltoniano que describe la interaccin del tomo con el fotn k . Del mismo modo, la probabilidad Pb a que en la
unidad de tiempo el tomo que se encuentra en el estado b emita un fotn en el estado k es

Pb a = pb Tb, nk a, nk +1

(15.73)

donde pb = e eb / Z es la probabilidad que el tomo est en el estado b , y


Tb, nk a, nk +1 =| ( a nk +1, hint, k b nk ) |2

(15.74)

es la probabilidad de transicin del estado inicial b nk al estado final a nk +1 .


No conocemos hint,k , pero claramente, es razonable suponer que debe ser de la forma

hint, k = hint, k ak + hint,
k ak

(15.75)

donde ak y ak son los operadores de creacin y de aniquilacin de un fotn en el estado k , cuyos elementos de matriz (ecs. (14.32) y (14.35)) son, respectivamente
ak nnk 1 = ( nk 1, ak nk ) = nk
k

n +1

y aknk
k

= ( nk , ak nk , ) = nk + 1

(15.76)

18

y hint, k y su conjugado Hermitiano hint,


k son operadores que actan sobre las funciones de

onda del tomo. La forma exacta de hint, k y hint,


k depende de las variables dinmicas que describen las cargas y corrientes elctricas atmicas y de la funcin de onda k del fotn que describe los campos electromagnticos asociados con el mismo; veremos que para nuestros fines no
hace falta conocerla en detalle. Sustituyendo entonces (15.75) y (15.76) en (15.72) resulta

Ta, nk b, nk 1 =| ( b , hint, k a ) |2 ( nk 1, ak nk ) |2 = nk | ( b , hint, k a ) |2

(15.77)

17

En la designacin de damos por sobreentendidos los nmeros de ocupacin que no cambian en la transicin.

18

Estos operadores describen la interaccin de las cargas y corrientes atmicas con el campo electromagntico del

fotn.

247

15. Estadsticas Cunticas


Haciendo las mismas sustituciones en (15.74) y observando que

2
2
2
| ( a , hint,
k b ) | =| ( hint, k a , b ) | =| ( b , hint, k a ) |

(15.78)

2
2
2
Tb, nk a, nk +1 =| ( a , hint,
k b ) | | ( nk +1, a k nk ) | = ( nk + 1) | ( b , hint, k a ) |

(15.79)

obtenemos

Se puede notar que las (15.77) y (15.79) implican que las probabilidades de transicin por unidad de tiempo de un proceso y su inverso son iguales, es decir

Ta, nk b, nk 1 = Tb, nk 1 a, nk

(15.80)

lo cual significa que en los procesos de emisin y absorcin se cumple el principio del balance
detallado que mencionamos en el Captulo 14. Esto es consecuencia de la Hermiticidad de hint,k ,
que se advierte en la (15.75). La presencia de los factores nk y nk + 1 en (15.77) y (15.79) se
debe a la naturaleza Bosnica del fotn.
Ahora bien, si la radiacin est en equilibrio trmico a la temperatura T se debe cumplir que
Pa b = Pb a . Resulta por lo tanto que
nk e k = nk + 1

(15.81)

Es importante observar que puesto que Pa b y Pb a contienen ambos el factor ( b , hint, k a ) |2 ,


ste se cancela al imponer la condicin Pa b = Pb a , lo cual implica que el mismo resultado
(15.81) se obtiene al considerar las transiciones entre cualquier par de los estados atmicos degenerados de energas ea y eb que llevan a la emisin y absorcin de un fotn k .
De la (15.81) obtenemos de inmediato

nk =

1
e k

(15.82)

que es la (15.64). Vemos por lo tanto que la distribucin de Planck es una consecuencia de tres
hechos: (a) que la dinmica de los procesos de emisin y absorcin de fotones cumple con el
principio del balance detallado, (b) que los fotones son Bosones y (c) que hay equilibrio trmico.
La fsica de la interaccin entre tomos y fotones: emisin espontnea y estimulada
Imaginemos un tomo que est efectuando una transicin del estado a al estado b en la cual
absorbe un fotn k de frecuencia = (eb ea ) / h (o viceversa, una transicin del estado b al
estado a en la cual emite un fotn de esa frecuencia). En un instante dado durante la transicin
su estado est descripto por una funcin de onda de la forma

(t ) = ca (t ) ae iea t / h + cb (t ) be ieb t / h

(15.83)

donde ca (t ) y cb (t ) son ciertos coeficientes que dependen del tiempo (no nos interesa por el
momento la normalizacin de ). La densidad de probabilidad es entonces proporcional a

| (t ) |2 =| ca (t ) |2 | a |2 + | cb (t ) |2 | b |2 +2 Re[ca* (t )cb (t ) a* be i( eb ea )t / h ]

248

(15.84)

15. Estadsticas Cunticas


y como se ve tiene una parte que oscila con la frecuencia = (eb ea ) / h . Del mismo modo, si
se calcula la corriente de probabilidad, se encuentra que contiene una parte que oscila con la
misma frecuencia . Puesto que la densidad de probabilidad y la corriente de probabilidad estn
relacionadas con las distribuciones espaciales de carga y corriente elctrica del tomo, vemos
que el estado describe distribuciones de cargas y corrientes que oscilan con la misma frecuencia que lo hacen los campos electromagnticos del fotn que est siendo absorbido (o emitido).
Esta observacin sugiere que el fenmeno de absorcin (o de emisin) de radiacin por parte de
un tomo es anlogo al aumento (o disminucin) de la energa de un oscilador que est siendo
forzado a oscilar por una fuerza aplicada, en resonancia con su frecuencia natural. Que el oscilador gane o pierda energa en este proceso, depende de la fase relativa entre sus oscilaciones y las
de la fuerza excitadora. Esta es la imagen clsica de la absorcin y emisin de radiacin por
parte de un tomo. De acuerdo con esta imagen es natural pensar que tanto la absorcin como la
emisin de radiacin son procesos estimulados (o inducidos) por la presencia del campo de radiacin de la frecuencia que corresponde a la transicin, y que su probabilidad debe ser proporcional a la intensidad del mismo.
Por otra parte los resultados anteriores (15.77) y (15.79) nos muestran que las probabilidades de
transicin por unidad de tiempo para la absorcin y emisin de un fotn k estn dadas por
Ta, nk b, nk 1 = nk | ( b , hint, k a ) |2
Tb, nk a, nk +1 = (nk + 1) | ( b , hint, k a ) |2

absorcin
emisin

(15.85)

Observemos que la intensidad del campo de radiacin de frecuencia (y direccin de propagacin y polarizacin correspondientes a k ) es proporcional a la energa del mismo, esto es, a
nk h . Vemos por lo tanto que la tasa de absorcin es efectivamente proporcional a la intensidad
del campo, tal como esperbamos. No ocurre lo mismo con la emisin, cuya tasa resulta proporcional a nk + 1, lo que implica que el tomo puede emitir un fotn an cuando la energa del
campo de radiacin de frecuencia es nula. Este es un resultado puramente cuntico, que proviene del principio de incerteza, que prohibe que el campo electromagntico sea estrictamente
nulo19. Debido a ello, en ausencia de fotones el campo tiene igualmente fluctuaciones, y son estas fluctuaciones las que provocan la emisin del tomo cuando nk = 0 .
Es lgico entonces escribir Tb, nk a, nk +1 como la suma de dos contribuciones: la que se debe a la
emisin espontnea provocada por las fluctuaciones de vaco del campo electromagntico y la
emisin estimulada por los fotones k presentes, esto es
Tb, nk a, nk +1 = Tbe, nk a, nk +1 + Tbi, nk a, nk +1
emisin espontnea
Tbe, nk a, nk +1 = | ( b , hint, k a ) |2
2
i
emisin estimulada
Tb, nk a, nk +1 = nk | ( b , hint, k a ) |

19

(15.85)

Sin entrar en detalles, al tratar en forma cuntica el campo electromagntico, de acuerdo con los lineamientos

expuestos en el Captulo 14, se deben interpretar las ecuaciones de Maxwell como las ecuaciones de los operadores
del campo. De resultas de ello las componentes de los campos E y B son operadores que satisfacen ciertas
relaciones de conmutacin, las cuales tienen como consecuencia (entre otras) que en el estado de vaco los campos
elctrico y magntico no son estrictamente nulos sino que fluctan.

249

15. Estadsticas Cunticas


Por otra parte, como es obvio, la absorcin es siempre estimulada.
Tal como vimos anteriormente, el grueso del espectro de la radiacin que proviene de fuentes
naturales es incoherente pues corresponde a nmeros de ocupacin nk << 1. Por lo tanto la emisin estimulada es inobservable en esas condiciones: la emisin es en su totalidad espontnea.
Veremos en breve bajo qu condiciones es posible observar la emisin estimulada y cuales son
sus peculiares caractersticas.
Los coeficientes de Einstein
Las tasas segn las cuales tienen lugar los procesos de absorcin y emisin de radiacin por
parte de un tomo estn determinadas, como acabamos de ver, por las probabilidades de transicin. Cabe observar, sin embargo, que las probabilidades de transicin que consideramos en la
Seccin anterior se refieren a transiciones entre dos particulares estados atmicos a y b , elegidos entre los ga estados degenerados del nivel ea y los gb estados degenerados del nivel eb ,
asociadas con la emisin o absorcin de un fotn de energa = h = eb ea y con una determinada direccin de propagacin y una dada polarizacin, correspondientes a un particular estado
k . Por otra parte el estudioso est muchas veces interesado en conocer la intensidad de la radiacin de una dada frecuencia absorbida o emitida por un conjunto de muchos tomos debido a
transiciones entre los niveles ea y eb , y no le importa saber en cules estados particulares a y
b se encuentra cada tomo antes y despus de la transicin, ni tampoco en conocer la direccin
de propagacin y la polarizacin de los fotones involucrados. En este caso, las probabilidades de
transicin relevantes para la absorcin (A) y la emisin (E) son

TA = Tea eb

y TE = Teb ea

(15.86)

donde Tea eb es la probabilidad que el tomo que se encuentra en uno cualquiera de los estados
del nivel ea efecte una transicin a uno cualquiera de los estados del nivel eb , sin que importe
ni la direccin de propagacin ni la polarizacin del fotn absorbido y Teb ea es la probabilidad
que el tomo que est en un estado del nivel eb efecte una transicin a un estado del nivel ea ,
cualesquiera sean la direccin de propagacin y la polarizacin del fotn emitido. Estas probabilidades de transicin se relacionan con las Ta, nk b, nk 1 y Tb, nk a, nk +1 dadas por la (15.77) y la
(15.79) por medio de

Tea eb =

2
Ta,nk b,nk 1 dk
ga a b k

y Teb ea =

2
Tb,nk a,nk +1 dk
gb a b k

(15.87)

Aqu las sumas comprenden los ga estados degenerados del nivel ea y los gb estados degenerados del nivel eb , y la integral se extiende sobre todas las direcciones de propagacin del fotn; el
factor 2 toma en cuanta las dos polarizaciones del fotn, y la divisin por el factor de degeneracin del estado inicial se debe a que hay que promediar sobre los diferentes estados iniciales degenerados puesto que todos ellos son igualmente probables.
Es importante observar que debido a las transiciones originadas por los procesos radiativos y por
las colisiones que ocurren en el medio, los estados atmicos no son estrictamente estacionarios,
sino que tienen una vida media i , que depende del estado i y de la densidad y temperatura
del medio, que determinan la frecuencia de las colisiones. Por este motivo las energas de los
estados atmicos estn indeterminadas dentro de una incerteza ei h / i . Por lo tanto las lneas
espectrales (sea de emisin como de absorcin) no son estrictamente monocromticas, pues los
250

15. Estadsticas Cunticas


fotones provenientes de distintos tomos tienen energas que difieren en cantidades del orden de
ei . Las integrales en (15.87) se tienen que extender entonces sobre un intervalo de energas del
fotn del orden de e alrededor de . Esto da lugar a un perfil de lnea de ancho no nulo, descripto por una funcin f ( ) cuya forma precisa depende los procesos que determinan la vida
media del nivel. La funcin f ( ) tiene un mximo en = 0 = / h y tiende rpidamente a cero
al crecer | 0 | ; es habitual normalizarla de modo que

f ( )d = 1

(15.88)

Para tratar estos problemas es til emplear los coeficientes de Einstein, que se relacionan con TA
y TE , y que se pueden determinar a partir de magnitudes fcilmente medibles. As, escribiremos
que la probabilidad que en ausencia de radiacin el tomo que est en un estado del nivel eb
emita espontneamente un fotn de frecuencia comprendida entre y + d est dada por

Ab a f ( )d

(15.89)

donde Ab a es el coeficiente de Einstein de emisin espontnea, y representa la probabilidad


que en la unidad de tiempo el tomo efecte espontneamente la transicin b a , cualquiera
sea la frecuencia del fotn emitido.
Supongamos ahora que el tomo est en presencia de radiacin, cuya densidad espectral de
energa es u( ) . La presencia del campo de radiacin cambia la situacin anterior de dos maneras: (a) si el tomo est en el nivel eb la probabilidad de la transicin b a cambia; (b) si el
tomo est en el estado ea se torna posible la transicin a b por absorcin de un fotn. Puesto
que ambos efectos se deben al campo es lgico suponer que en el primer caso la probabilidad de
emitir un fotn de frecuencia entre y + d sea ahora

[ Ab a f ( ) + Bb au( ) f ( )]d

(15.90)

y en el segundo caso, la probabilidad de absorcin sea

Ba bu( ) f ( )d

(15.91)

Las nuevas funciones f ( ) y f ( ) tienen sus mximos en = 0 = / h , tienden rpidamente


a cero al crecer | 0 | y estn normalizadas del mismo modo que f ( ) . A priori, las tres funciones f, f y f pueden ser diferentes, pero hay por lo menos un caso, aqul en que el tomo
forma parte de un sistema en equilibrio termodinmico, en que f = f = f y por ese motivo de
supone que son siempre idnticas. Las cantidades Bb a y Ba b son, respectivamente, los coeficientes de Einstein de emisin estimulada y de absorcin. Los coeficientes de Einstein son
constantes caractersticas de los niveles a y b, y se pueden calcular tericamente en trminos de
los elementos de matriz de hint, k usando las expresiones (15.87), o en su defecto se pueden determinar experimentalmente.
Es fcil mostrar que entre los tres coeficientes de Einstein deben existir dos relaciones20, y por
ese motivo una vez que se conoce uno de ellos se pueden calcular de inmediato los otros dos. En

20

Estas relaciones son consecuencia del principio del balance detallado y de la naturaleza Bosnica de los fotones.

251

15. Estadsticas Cunticas


efecto, consideremos la radiacin en una cavidad y los tomos de sus paredes, en equilibrio termodinmico a la temperatura T. La relacin entre el nmero de tomos en niveles a y b est dada
por la distribucin de Boltzmann
Nb gb ( eb ea ) gb
= e
= e
Na ga
ga

(15.92)

El nmero de tomos que en la unidad de tiempo efectan la transicin b a (por emisin


tanto espontnea como estimulada, y suponiendo f = f ) resulta ser

Nb [ Ab a + Bb au( )] f ( )d = Nb [ Ab a + Bb au( 0 )]

(15.93)

dado que u( ) vara muy lentamente con . Del mismo modo, el nmero de tomos que en la
unidad de tiempo efectan la transicin a b (suponiendo f = f ) es

Na Ba bu( ) f ( )d = Na Ba bu( 0 )

(15.94)

En el equilibrio termodinmico estos nmeros deben ser iguales entre s, de modo que
Nb
Ba bu( 0 )
=
Na Ab a + Bb au( 0 )

(15.95)

Usando la (15.92) y omitiendo el subndice 0, obtenemos


gb
Ba bu( )
e
=
Ab a + Bb au( )
ga

(15.96)

La densidad espectral de energa radiante u( , T ) est dada por la (15.66) y entonces tenemos
gb
e
=
ga

Ba b
(e

1) Ab a

8h 3
c3

8h 3
+ Bb a
c3

(15.97)

Esta ecuacin vale para toda T; en particular, para T se tiene que e 1 y e 1 y


por lo tanto se debe tener que

gb Bb a = ga Ba b

(15.98)

Sustituyendo este resultado en la (15.97) se obtiene una identidad si


Ab a = Bb a

8h 3
c3

(15.99)

Las relaciones (15.98) y (15.99) son las relaciones buscadas. Las obtuvimos para el caso del
equilibrio termodinmico, pero puesto que se trata de relaciones entre constantes valen siempre.

252

15. Estadsticas Cunticas


Relacin entre los coeficientes de Einstein y las magnitudes macroscpicas
La variacin de la intensidad de un haz de radiacin de frecuencia que atraviesa un espesor dx
de un medio en el cual no tienen lugar procesos de emisin o de difusin es, por definicin
dI ( ) = u( )dx

(15.100)

donde es el coeficiente de absorcin. La contribucin del haz a la densidad de energa radiante


est dada por 4I ( ) / c , luego la variacin de u( ) en el lapso dt = dx / c que emplea el haz en
atravesar el espesor dx es
du( ) = u( )c dt

(15.100)

Por otra parte, si la atenuacin se debe a las transiciones a b de los tomos que se encuentran
en el nivel ea , usando la definicin (15.91) del coeficiente de Einstein Ba b , se debe tener que

du( ) = hNa Ba bu( )c dt

(15.101)

puesto que cada transicin sustrae del haz un fotn de energa h . Comparando (15.100) con
(15.101) se obtiene la siguiente relacin entre y Ba b :

h
Na Ba b
c

(15.102)

En nuestro argumento no tomamos en cuenta, sin embargo, que el haz de radiacin estimula la
emisin de los tomos del nivel eb , que se manifiesta como una absorcin negativa. Luego para
obtener el verdadero coeficiente de absorcin tenemos que restar del miembro derecho de la
(15.102) la cantidad h Nb Bb a / c . Por lo tanto el coeficiente de absorcin correcto es

h
h
N B
g N
Na Ba b 1 b b a =
Na Ba b 1 a b (15.103)
( Na Ba b Nb Bb a ) =
c
c
Na Ba b
c
gb Na

donde usamos la relacin (15.98). Si los tomos estn en equilibrio termodinmico a la temperatura T obtenemos entonces

h
Na Ba b (1 e h / kT )
c

(15.104)

De momento que hemos incluido la emisin estimulada en el coeficiente de absorcin, la emisividad j est dada solamente por la emisin espontnea. Por lo tanto

j=

1
Nb Ab a h
4

(15.105)

de donde resulta, recordando las relaciones entre los coeficientes de Einstein, la Ley de
Kirchhoff-Planck:
j 2 h 3
1
= 2 h / kT
= B (T )
c e

253

(15.106)

15. Estadsticas Cunticas


Si se ignora la emisin inducida, es decir, si se usa la expresin (15.102) del coeficiente de absorcin en lugar de la (15.104), se obtiene en lugar de la (15.106) la expresin
j 2 h 3 h / kT
= 2 e
= B (T )
c

(h >> kT )

(15.107)

que es una aproximacin de la Ley de Kirchhoff-Planck que vale para h >> kT , es decir en el
lmite en que los fotones se comportan como partculas clsicas.
En el lmite opuesto, cuando h << kT , la emisin estimulada domina al punto que se puede ignorar la emisin espontnea. En este caso, de la (15.104) resulta que

h 2 2
Na Ba b
ckT

(h << kT )

(15.108)

a partir de la cual se obtiene la bien conocida relacin de Rayleigh-Jeans para la relacin entre la
emisividad y el coeficiente de absorcin

j
2
= 2 kT = B (T )
c

(h << kT )

(15.108)

en este lmite de onda clsica la constante de Planck no interviene en B (T ) .


El efecto laser
Consideremos la expresin (15.03) del coeficiente de absorcin, que tiene validez general:

h
g N
Na Ba b 1 a b
c
gb Na

(15.109)

ga Nb
= 1 e h / kT > 0
gb Na

(15.110)

En el equilibrio trmico tenemos que


1

de manera que > 0 , lo que significa que la absorcin domina sobre la emisin estimulada y
por lo tanto el coeficiente de absorcin es positivo, lo que significa que el haz de luz se atena al
atravesar el medio. Sin embargo, en condiciones particulares, puede ocurrir que
ga Nb
>1
gb Na

(15.111)

y en este caso se tiene que la emisin estimulada domina sobre la absorcin: el coeficiente de
absorcin es entonces negativo. De resultas de ello el haz de luz se amplifica al atravesar el medio. Este fenmeno se denomina efecto laser21 y toda fuente luminosa que aprovecha este efecto
se denomina laser. Para que tenga lugar el efecto laser es preciso que las poblaciones de los niveles eb y ea que intervienen en la transicin estn fuera del equilibrio trmico, de manera que
21

El trmino laser es un acrnimo derivado de la frase light amplification by stimulated emission of radiation que

describe en ingls el fenmeno de la amplificacin de luz por emisin estimulada de radiacin.

254

15. Estadsticas Cunticas


se pueda satisfacer la condicin (15.110). Dicho en pocas palabras, la poblacin del nivel de ms
alta energa ( eb ) debe ser significativamente mayor que la que correspondera al equilibrio, circunstancia que en la jerga se denomina inversin de poblaciones. Hay diferentes tcnicas22 para
conseguir este resultado, que no vamos a comentar porque el lector interesado las puede estudiar
en la literatura especializada. Aqu nos limitaremos a describir brevemente las peculiares caractersticas de la luz laser y algunos interesantes y novedosos fenmenos a que da lugar, debido a
los cuales el laser es un frtil campo de investigacin sea pura como aplicada, adems de tener
numerosas aplicaciones (que es imposible tratar en el breve espacio de estas notas).
El elemento esencial de todo laser es el medio activo, que puede ser slido, lquido o gaseoso,
donde se produce la inversin de poblaciones de los niveles de inters mediante una tcnica
oportuna (descargas elctricas, bombeo ptico, reacciones qumicas, etc.). El funcionamiento del
laser puede ser tanto continuo (como el familiar laser de He-Ne) como pulsado. En ambos casos
el medio activo tiene que estar colocado dentro de un resonador ptico (esencialmente un
interfermetro de Fabry-Prot) que selecciona una particular direccin, de modo que los fotones
emitidos en esa direccin atraviesan el medio activo muchas veces estimulando la emisin de
ms fotones en cada pasada. De esa forma la poblacin de un particular estado fotnico k se
torna muy numerosa, y parte de la misma sale del dispositivo como un haz coherente (pues todos
los fotones, que ocupan el mismo estado, estn en fase entre si) y perfectamente colimado. Para
muchas aplicaciones este haz es suficiente. Si se necesitan haces de mayor intensidad, se emplean dispositivos ms complejos que consisten de cadenas cuyo eslabn primario es el laser
que acabamos de describir (que se llama oscilador) el cual genera un haz que luego pasa sucesivamente por una serie de amplificadores, que son unidades cada una de las cuales contiene el
medio activo, pero que a diferencia del oscilador no poseen resonador ptico. Como el nombre
lo indica la funcin de estas unidades es amplificar el haz que sale del oscilador hasta alcanzar la
intensidad que se desea.
La radiacin laser tiene caractersticas diferentes de la radiacin que proviene de las fuentes naturales (trmicas). Puesto que los fotones estn en el mismo estado, son coherentes (mientras que
los que provienen de fuentes trmicas son mayormente incoherentes). Esto hace que se comporten como una onda electromagntica clsica (dado que nk >> 1) lo que permite, entre otras
cosas, observar con suma facilidad los fenmenos de interferencia y difraccin, que normalmente no se ponen en evidencia con la luz ordinaria a menos de tomar los particulares recaudos
descriptos en los textos de ptica a fin de evitar los efectos de la falta de coherencia de los fotones. La otra consecuencia de la coherencia es que los fotones de un rayo laser pueden interactuar
colectivamente (y no slo individualmente, como ocurre con la luz ordinaria) con la materia.
Esto da lugar a fenmenos no lineales peculiares cuando la intensidad del haz laser es muy
grande.
Sin entrar en detalles, se puede decir que no hay lmite (salvo en lo que se refiere al costo) a la
potencia mxima del laser, y que enfocando el haz que produce es posible alcanzar enormes
densidades de energa, imposibles de obtener con fuentes trmicas. Por ejemplo, con un laser
22

Si bien la emisin estimulada fue reconocida por Einstein en su famoso trabajo de 1917, tuvieron que pasar cuatro

dcadas antes que Charles Townes, A. I. Schawlow, Nikolay Basov y Aleksandr Prokhorov demostraran la
posibilidad de construir un laser ptico y que en 1960 Theodore Maiman desarrollara el primer laser de rub. Desde
entonces el progreso fue vertiginoso, y hoy existe una gran variedad de laser que se emplean en las ms variadas
aplicaciones, en las que se aprovecha la altsima colimacin, la coherencia y la gran potencia de la radiacin laser.

255

15. Estadsticas Cunticas


pulsado de vidrio-Nd, que emite luz de = 1.06 m, se han obtenido intensidades de 1018
W/cm2 en el foco23. Una sencilla cuenta muestra que esta intensidad corresponde a tener una
densidad de energa de 200 eV/3 (1 3 es el orden de magnitud del volumen de un tomo), que
implica campos elctricos del orden de 1012 V/m.
Sin necesidad de llegar a valores tan extremos, la interaccin luz laser-materia con haces de gran
intensidad se caracteriza porque se tiene siempre un gran nmero de fotones coherentes que interactan simultneamente24 sobre cada tomo iluminado por el haz. Ocurren entonces una variedad de fenmenos no lineales que no se observan con la luz ordinaria. Algunos de ellos han encontrado importantes aplicaciones. Mencionaremos aqu el efecto fotoelctrico multifotnico, la
excitacin multifotnica y la ionizacin multifotnica de niveles atmicos.
En el efecto fotoelctrico producido con luz ordinaria (incoherente) cada fotoelectrn absorbe un
nico fotn y se cumple la relacin de Einstein (4.18) entre la frecuencia de la radiacin y la
energa cintica Kmax de los fotoelectrones

Kmax = h w0

(15.112)

donde w0 es la funcin trabajo, que es una caracterstica del metal empleado como fotoctodo.
Si < 0 = w0 / h , los fotones no tienen energa suficiente para extraer fotoelectrones y no hay
efecto fotoelctrico, por grande que sea la intensidad (o sea el flujo de fotones) del haz de luz.
Pero cuando los fotones son coherentes, y si la intensidad del haz es suficiente, se puede producir el efecto fotoelctrico multifotnico, en el cual cada fotoelectrn absorbe simultneamente
cierto nmero N de fotones. En este caso, la (15.112) se debe modificar, y se tiene que

Kmax = N h w0

(15.113)

y entonces la frecuencia mnima necesaria no es 0 sino 0N = 0 / N = w0 / N h . Si el haz es


muy intenso, N puede ser un nmero muy grande, y entonces el efecto fotoelctrico ocurre para
(casi) cualquier frecuencia, tal como sera de acuerdo con la teora ondulatoria clsica del campo
electromagntico.
En la excitacin multifotnica se provoca una transicin atmica desde un nivel ea a un nivel eb
de mayor energa usando fotones cuya energa es una fraccin (la mitad, un tercio, ) de la diferencia = eb ea (Fig. 15.9a). En efecto, si N fotones idnticos (en el caso de la absorcin N fotnica) cada uno de los cuales tiene la energa h N = / N llegan al tomo dentro de un intervalo de tiempo suficientemente breve, el tomo responde como si fuesen un nico fotn de la
frecuencia correcta = / h = N N y puede absorberlos, realizando la transicin ea eb . Se
trata de un proceso no lineal, y por lo tanto depende de la intensidad del haz laser. Si el nivel eb
pertenece al continuo (Fig. 15.9b), el proceso se denomina ionizacin multifotnica. Adems del
inters puramente cientfico que presentan estos procesos, la excitacin multifotnica tiene hoy
una importante aplicacin, la microscopa por fluorescencia multifotnica, que permite obtener
imgenes tridimensionales de muy alta resolucin.
23

Segn la ley de Stefan-Boltzmann la radiancia de un cuerpo negro a la temperatura de la superficie del Sol (5700

K) es de 6103 W/cm2. Para alcanzar una intensidad de 1018 W/cm2 (pero distribuida en todo el espectro) con una
fuente trmica, se precisa T > 2107 K. Tan slo una mnima fraccin de la misma se encontrara en el intervalo de
frecuencias correspondiente al entorno de = 1.06 m.
24

Puesto que estos fotones son coherentes, se pueden describir por medio de un campo electromagntico clsico.

256

15. Estadsticas Cunticas

eb

hiN = (eb ea)/N

eb

hiN = (eb ea)/N

ea

ea

(b)

(a)

Fig. 15.9. Procesos no lineales en la interaccin entre la luz laser y los tomos: (a) excitacin multifotnica; (b) ionizacin multifotnica.

El gas perfecto de Fermiones


De acuerdo con las ecs. (15.26) y (15.27), en un gas de Fermiones que no interactan se tiene
ni =

1
e ( i )

, n=

+1

1
e ( i )

(15.113)

+1

Introduciendo la densidad de estados por unidad de intervalo de energa f ( ) , la sumatoria de la


segunda de las (15.113) se puede escribir como una integral

3/ 2
1/ 2
f ( )d
2 m d
=
+

n = ( )
= (2 s + 1)
(
s
)
V
2
1
2

h2
i
e ( ) + 1
+1
e ( ) + 1
i e

(15.114)

donde s es el spin, y usamos la expresin (9.19) de f ( ) , que se dedujo considerando los estados
estacionarios de una partcula libre de masa m que se mueve en una caja de volumen V. El factor
2 s + 1 en (15.114) tiene en cuenta los diferentes estados de spin de las partculas. En lo sucesivo
vamos a suponer que s = 1 / 2 . Haciendo el cambio de variable z = , la (15.114) se escribe
como

3/ 2
1/ 2
2 mkT 3 / 2
z1 / 2 dz
2 mkT e z dz
=
n = 4V 2
4

V
z
h2
h
e + e
e z + 1
0

(15.115)

Esta es entonces la ecuacin que determina el potencial qumico , que como se ve, es funcin
de T, V y n.
La energa de Fermi y las propiedades del gas de Fermiones en el cero absoluto
Llamaremos energa de Fermi, por definicin, a

F = (T = 0, V , n)
257

(15.116)

15. Estadsticas Cunticas


Vamos a ver ahora que F debe ser positivo. En efecto, si se tuviera F < 0 , en el lmite T 0
tendramos que F , y puesto que

1/ 2
z dz z1 / 2e z dz =
z

2
e + e
0

(15.117)

se tendra que en ese lmite el miembro derecho de la (15.115) se anulara, lo que es absurdo
pues implicara n = 0 . Por lo tanto debe ser F > 0 . Tenemos entonces que para T = 0 los nmeros de ocupacin medios de los estados valen

ni =

1
e ( i F )

1 si i < F
=
+ 1 0 si i > F

(T = 0 )

(15.118)

Este resultado tiene una clara interpretacin: cuando T = 0 el gas de Fermiones est en el estado
de mnima energa, en el cual las partculas ocupan los n estados i de menor energa, pues el
principio de exclusin no permite que haya ms de una partcula en cada estado (las diferentes
orientaciones del spin estn tenidas en cuenta por el factor 2 s + 1 en la (15.114)). Estos estados
son aquellos cuya energa es menor que F , que es la energa del nivel ms alto ocupado para
T = 0. Esto permite determinar F , pues para T = 0 la (15.114) (con s = 1 / 2 ) se reduce a
2m 3 / 2
n = 4V 2
h

1 / 2 d =

8 2 m 3 / 2 3 / 2
V
F
3 h2

(T = 0 )

(15.119)

de donde obtenemos

F =

h2 3 n 2 / 3
2 m 8 V

(15.120)

De la (15.120) se ve que la energa de Fermi es inversamente proporcional a la masa de las partculas, y proporcional a la potencia 3/2 de su concentracin media n / V .
La temperatura de Fermi se define por medio de F kTF y vale

TF =

h2 3 n 2 / 3
2 mk 8 V

(15.121)

y la velocidad de Fermi se define por medio de vF 2 F / m . En la Tabla 15.1 damos los valores de F , TF y vF para los electrones de conduccin de algunos metales.
Es fcil calcular el valor de la energa interna del gas de Fermiones en el cero absoluto:
2m
E = 2 i ni = 4V 2
h
i

3/ 2 F

3 / 2 d

3
n F = E0
5

(T = 0 )

(15.122)

Se puede mostrar (no lo haremos aqu) que la entropa del gas de Fermiones es nula en el cero
absoluto, de acuerdo con la Tercera Ley de la Termodinmica. Usando la relacin de Euler25
25

Ver el Captulo 8 de Termodinmica e Introduccin a la Mecnica Estadstica.

258

15. Estadsticas Cunticas


E = TS pV + n

(15.123)

es fcil calcular que en el cero absoluto la presin vale

p = pF =

2n
F
5V

(T = 0 )

(15.124)

Por lo tanto un gas de Fermiones tiene una presin no nula en el cero absoluto.
Tabla 15.1: Valores de F , TF y vF para los electrones de conduccin de algunos metales.
Elemento

n / V (1022 cm3)

F (eV)

TF (104 K)

vF (108 cm/s)

Li
K
Cu
Au

4.60
1.34
8.50
5.90

4.7
2.1
7.0
5.5

5.5
2.4
8.2
6.4

1.30
0.85
1.56
1.39

El potencial qumico del gas de Fermiones


Para calcular el potencial qumico conviene expresar el nmero de partculas en funcin de la
temperatura de Fermi. De la (15.121) obtenemos que

n=

8 2 mkTF 3 / 2
V
3 h2

(15.125)

Introduciendo esta expresin en la (15.115) y usando la (15.44) obtenemos entonces


3 T
1=

4 TF

3/ 2

Li 3 / 2 ( e )

(15.126)

Invirtiendo esta relacin se llega al resultado buscado, que se muestra en la Fig. 15.10, donde
tambin representamos el valor clsico de , que se obtiene en el lmite e << 1 y resulta ser26
V 2mkT 3 / 2
clsico = kT ln 2
h2
n

(15.127)

Para T << TF , la dependencia de en T es muy dbil. En esta regin vale27 la aproximacin

q 1
q
2
z dz = m (q ) Li ( m e ) 1 + 2 q(q 1)

z
q
q
1
3(3 1) 2
e

, ( )

(15.128)

Usando la (15.128) se obtiene fcilmente una expresin aproximada del potencial qumico que
vale para temperaturas bajas:
26
27

La (15.127) difiere de la (15.51) debido al factor 2 (que proviene del spin) en el argumento del logaritmo.
El clculo no es difcil pero algo engorroso y por eso no lo reproducimos aqu. El lector interesado lo puede

encontrar en Landau y Lifschitz, Statistical Physics, Pergamon.

259

15. Estadsticas Cunticas


2 T 2
F 1

12 TF

(T << TF )

(15.129)

Para T >> TF el potencial qumico tiende a clsico (ya para T > 2TF la diferencia es muy pequea).
1
0
1
2
PsHF
3
4
5

TsTF

Fig. 15.10. Potencial qumico de un gas de Fermiones no interactuantes. Con la lnea de


trazos se muestra el valor clsico de , dado por la ec. (15.127).
Los nmeros medios de ocupacin
Es interesante calcular los nmeros medios de ocupacin, dados por la primera de las (15.113).
La Fig. 15.11 muestra n( ) para diferentes temperaturas del gas. El grfico es semilogartmico
pues as se aprecian mejor los apartamientos desde la distribucin clsica de MaxwellBoltzmann, que se representa por medio de rectas de pendiente 1/ kT . Se puede observar que a
medida que se eleva la temperatura a partir de T = 0 K, las partculas que estaban ocupando los
estados de energa ms alta, prxima a la energa de Fermi, se excitan y pasan desde los estados
con < a estados con > . Para T << TF la mayor parte de estas excitaciones afectan partculas con energa cercana a = .
Un gas de Fermiones se dice degenerado cuando su temperatura es inferior a la temperatura de
Fermi; en el cero absoluto el gas est completamente degenerado. En un gas degenerado, el
principio de exclusin, que no permite ms de una partcula por estado, obliga las partculas a
ocupar estados de mayor energa. Si la temperatura es muy alta ( T >> TF ), el sistema no es degenerado puesto que los nmeros medios de ocupacin de los estados son mucho menores que la
unidad, y en ese caso el principio de exclusin tiene poco efecto en la prctica. El gas se comporta entonces como un gas clsico. La transicin entre el gas completamente degenerado en
T = 0 y el gas clsico para T >> TF es continua, pero la descripcin matemtica del gas en este
rango de temperaturas es complicada.
260

15. Estadsticas Cunticas

0.01

1
0.1
0.5
0.1

1.0
1.5

2.0
0.01

3.0

0.001

0.0001
1

HsHF

Fig. 15.11. Nmero de ocupacin medio en funcin de la energa del estado para un gas de
Fermiones. Las curvas corresponden a T / TF = 0.01, 0.1, 0.5, 1, 1.5, 2 y 3. La lnea horizontal de trazos corresponde a n( = ) = 1 / 2 . Se puede observar que las curvas para
T / TF = 1.5, 2 y 3 son casi rectas, lo que indica que el comportamiento del gas es clsico,
como es de esperar porque n( ) << 1. En cambio las curvas para T / TF = 0.01, 0.1 y 0.5
difieren de las rectas clsicas donde n( ) ya no se puede despreciar frente a la unidad.
Calor especfico de un gas de Fermiones
Para calcular el calor especfico molar a volumen constante procederemos de manera semejante
a como lo hicimos para el gas de Bosones. Calculamos primero la energa interna del gas

3
3 / 2 d
E = 2 i ni = 2 ( )
n F3 / 2
( )
i
+1
+1 2
e
i
i e

(15.130)

Usando la (15.44) obtenemos


T
9
E=
nkT
8
TF

3/ 2

Li 5 / 2 ( e )

(15.131)

Usando ahora la definicin (15.52) de cV , y la expresin

1 3 Li3 / 2 ( e )

=
kT k T 2 Li1 / 2 ( e )
que se obtiene derivando la (15.126) con respecto de T, obtenemos entonces

261

(15.132)

15. Estadsticas Cunticas

c~

9 T
=
R
8
TF

3/ 2

2
5
) 3 Li 3 / 2 ( e )

e
Li
(

5/ 2
2 Li1 / 2 ( e )
2

(15.133)

En la Fig. 15.12 se puede apreciar el comportamiento del calor especfico.

1.5

1.0
caV sR

0.5

1
TsTF

Fig. 15.12. Calor especfico molar a volumen constante de un gas de Fermiones. Se ve que
cV es siempre menor que el valor clsico 3 R / 2 (representado por la lnea de trazos) y para
T < TF disminuye rpidamente con T. Para T << TF la dependencia de cV en T es lineal.
Usando la (15.128) se obtienen fcilmente las expresiones aproximadas de E y cV para temperaturas bajas:
5 2 T 2
3
E n F 1 +

5
12 TF

(T << TF )

(15.134)

cV

2 T
R
2 TF

(T << TF )

(15.135)

El valor bajo de cV para T << TF se debe a que para un cambio de temperatura del orden de T,
cabe esperar que la energa de una partcula aumente en kT. Pero para la mayora de las partculas, con excepcin de aquellas cuya energa es prxima a la energa de Fermi, los estados hacia
los cuales se tendran que excitar estn ocupados (como se puede ver de la curva correspondiente
a T = 0.01 TF en la Fig. 15.11). Por lo tanto, de acuerdo con el principio de exclusin, esas partculas no se pueden excitar. Slo se pueden excitar las partculas que estn en un intervalo de
energa del orden de kT alrededor de F , cuyo nmero es del orden de

nexc f ( F )kT
262

(15.136)

15. Estadsticas Cunticas


Por otra parte

f ( F ) =

4V
(2 m)3 / 2 1F/ 2
3
h

(15.137)

Dividiendo esta ecuacin por la (15.119) resulta entonces


nexc 3 T

n
2 TF

(15.138)

de manera que la fraccin de partculas que es excitada es del orden de T / TF . Puesto que cada
una de ellas se lleva una energa del orden de kT, tenemos que
E(T ) E0 + kT nexc

5 T 2
3
= n F 1 +
5
2 TF

(T << TF )

(15.139)

y el calor especfico molar resulta entonces


cV 3 R

T
TF

(T << TF )

(15.140)

Comparando la (15.139) y la (15.140) con los resultados exactos (15.134) y (15.135) vemos que
nuestra estimacin es correcta dentro de un factor del orden de la unidad.
Discutiremos ahora brevemente un par de aplicaciones de la teora que hemos desarrollado.

El modelo de electrn libre de los metales


En el estado slido los tomos de un metal forman una red cristalina y los electrones de valencia,
que estn dbilmente ligados, se pueden mover libremente en todo el cristal. Por eso cuando se
aplica una diferencia de potencial elctrico al metal, esos electrones producen una corriente, y
por lo mismo se denominan electrones de conduccin. Los electrones de conduccin se mueven
como partculas casi libres y su camino libre medio es muy grande (bajo condiciones adecuadas
puede ser del orden del cm); en efecto, son poco perturbados por la presencia de los iones positivos y slo sufren escasas colisiones con los dems electrones de conduccin.
Las razones de este comportamiento son de carcter cuntico, y las vamos a mencionar brevemente sin dar demostraciones, que el lector puede encontrar si lo desea en la bibliografa. Si se
resuelve la ecuacin de Schrdinger para un electrn en el potencial creado por una distribucin
peridica de iones positivos, se encuentra que la parte espacial de la funcin de onda de un
electrn de energa tiene la forma

k ~ gk ( r )eik r

, k 2 = 2 m* / h 2

(15.141)

Aqu la funcin gk ( r ) es un factor de modulacin que tiene la misma periodicidad espacial que
la red, y el parmetro m* = m* ( k ) , que se denomina la masa efectiva del electrn, depende del
vector de onda k y de la geometra de la red. Si la red es infinita, resulta que no todos los valores
de estn permitidos, sino que el espectro de energa consiste de una serie de tramos continuos,
llamados bandas, separados casi siempre por intervalos finitos aunque puede ocurrir en determinados casos que dos bandas se superpongan parcialmente. Cada banda surge de la ruptura de la
263

15. Estadsticas Cunticas


degeneracin de los infinitos niveles que consisten en que el electrn est ligado en un particular
nivel a un determinado ion de la red. Si el cristal no es infinito y consiste de N iones, entonces
cada banda no es continua, sino que consiste de un conjunto de N niveles discretos, muy
prximos entre s.
Lo anterior tiene una importante consecuencia en lo referente a la conductividad elctrica del
cristal. En efecto, para que la aplicacin de un campo elctrico externo de intensidad moderada
produzca una corriente, es preciso que se pueda producir un movimiento neto de los electrones.
Si todos los N niveles de una banda estn ocupados, esto no es posible, pues los estados correspondientes a todos los valores de k estn ocupados y no hay forma de que tenga lugar un flujo
neto de electrones. Este es el caso de todas las bandas que se originan a partir de los niveles
atmicos internos. La nica banda que puede dar lugar a conduccin de la electricidad es entonces la banda de valencia que surge a partir de los niveles atmicos ms externos de los tomos, y
las propiedades elctricas del cristal dependen esencialmente de dos circunstancias: (1) cuntos
electrones de valencia tiene cada tomo y (2) cun separada en energa se encuentra la banda de
valencia de la banda inmediatamente superior (originada a partir del primer nivel excitado
atmico). Se pueden dar dos situaciones: (a) que la banda de valencia est parcialmente llena,
(b) que la banda de valencia est completamente llena. En el primer caso, el cristal es un conductor, pues la aplicacin de un campo elctrico an de muy baja intensidad puede excitar algunos electrones a estados vacos de la banda, de modo tal que haya un flujo neto de electrones;
esto es lo que ocurre con los elementos de valencia impar. En el segundo caso, que ocurre para
los elementos de valencia par, si la separacin en energa de la banda inmediatamente superior
es considerable, el cristal es un aislante, pues la aplicacin de un campo elctrico moderado no
produce corriente; esto sucede hasta que el campo es tan intenso que puede causar que algunos
electrones pasen a la banda de energa ms alta, que est vaca, en tal caso se produce la ruptura
(o breakdown) del aislante. Pero si la banda inmediatamente superior est muy prxima en
energa, si bien el cristal es aislante a T = 0, cuando la temperatura aumenta algunos electrones
de la banda de valencia pueden pasar a la banda superior si kT , donde es la separacin
en energa de las bandas; entonces el cristal puede conducir la electricidad. Este es el caso de los
semiconductores. Finalmente, si la banda de valencia est llena pero hay una superposicin parcial con la banda inmediatamente superior, el cristal es conductor; este es el caso de algunos
metales bivalentes.
Volviendo ahora a los metales, un electrn de conduccin en un cristal perfecto a 0 K no est
localizado, sino que se propaga libremente. Slo las imperfecciones de la red (debidas a la presencia de impurezas, los defectos de la red y las vibraciones de los iones) perturban la propagacin de los electrones. Adems el fondo de carga positiva debido a los iones compensa en promedio las cargas de los electrones, y las interacciones residuales entre ellos tienen escasa importancia. Esto ltimo es una consecuencia del principio de exclusin. En efecto, consideremos
una colisin entre dos electrones que estn inicialmente en los estados k y k , y que despus
de la misma estn en los estados k y k . Esta colisin puede ocurrir solamente si los estados k y k no estn ocupados, pues en el caso contrario este proceso est prohibido por el
principio de Pauli. Por otra parte, la mayora de los estados finales k y k que son energticamente posibles estn ocupados. Por lo tanto estos procesos no ocurren y por este motivo es
razonable pensar que en primera aproximacin los electrones de conduccin se comporten como
si fuesen libres.

264

15. Estadsticas Cunticas


Esta es la justificacin del modelo de electrn libre, que trata los electrones de conduccin de un
metal como un gas perfecto de Fermiones, ignorando su interaccin con los iones positivos de la
red, y las interacciones entre los electrones mismos. Pese a su simplicidad este modelo es muy
til pues explica en forma cualitativa muchas caractersticas de los metales.
El modelo de electrn libre de los metales fue desarrollado originalmente por Paul Drude (1900)
y Hendrik Antoon Lorentz (1905) usando la estadstica clsica de Maxwell-Boltzmann. Se pudo
as deducir la ley de Wiedemann-Franz (que da la dependencia con T del cociente entre las conductividades trmica y elctrica), pero esto se debe a una coincidencia fortuita. Desde el inicio la
teora de Drude enfrent un grave problema, pues tratados en forma clsica los electrones libres
aportaran a la capacidad calorfica del metal una cantidad 23 k por electrn, que se tendra que
sumar a la capacidad calorfica debida a las vibraciones de la red cristalina. De resultas de esto, a
la temperatura ambiente se debera tener cV = (3 + 3 / 2) R para un metal monovalente (con un
solo electrn de conduccin por tomo). Sin embargo los metales cumplen muy bien la Ley de
Dulong y Petit, esto es cV = 3 R .
La Mecnica Cuntica permite resolver esta dificultad. En efecto, lo correcto es tratar los electrones como Fermiones, lo cual fue hecho por primera vez por Sommerfeld en 1928. De la Tabla
15.1 vemos que la temperatura de Fermi de los metales es de ms de 104 K. Por lo tanto, a temperaturas inferiores a la temperatura de fusin, se tiene que T << TF y entonces los electrones de
conduccin estn degenerados. Podemos entonces usar la expresin aproximada (15.135) para
calcular la contribucin de los electrones a cV . Esta contribucin es muy pequea en comparacin con la que proviene de las vibraciones de la red, lo cual explica porqu los metales cumplen
muy bien la Ley de Dulong y Petit.
La situacin es diferente a temperatura muy baja. Cerca del cero absoluto, la capacidad calorfica de la red cristalina es proporcional a T 3 , mientras que la capacidad calorfica electrnica es
proporcional a T. Por lo tanto a temperaturas suficientemente bajas domina la contribucin electrnica, cosa que en efecto se verifica experimentalmente.

El equilibrio de las enanas blancas


Se denomina enana blanca una estrella que al final de su evolucin se ha transformado en un
objeto muy denso, pequeo y poco luminoso. En una estrella normal (como el Sol) ocurren una
serie de reacciones nucleares cuyo resultado neto es la fusin de 4 ncleos de hidrgeno para
producir un ncleo de helio. En cada instante se producen gran nmero de tales reacciones, y en
consecuencia se libera una enorme cantidad de energa. Esto es lo que mantiene a la estrella caliente e impide que se contraiga debido a la gravedad, mantenindola en equilibrio con una densidad media baja (1.416 g cm3 para el Sol). Cuando la estrella agota su hidrgeno y pierde su
fuente de energa, se enfra y finalmente se contrae. Cuando esto ocurre los tomos de helio se
comprimen muy fuertemente. Los electrones que orbitan un tomo tienden a quedar ms localizados y por lo tanto, debido al principio de incerteza, su energa cintica aumenta. Si la densidad
aumenta suficientemente, la energa cintica de los electrones supera la energa potencial que
tiende a ligarlos a los ncleos, y se convierten en partculas libres. De resultas de esto cada
tomo de helio se transforma en una partcula ms dos electrones libres. Hay entonces una
densidad enorme de electrones, que estn relativamente fros pues el combustible nuclear qued
agotado. Este es el estado de enana blanca.
Para estimar la energa cintica por electrn cuando es una partcula libre podemos razonar del
modo siguiente: cada electrn ocupa como mnimo un volumen del orden de
265

15. Estadsticas Cunticas


h
ve = 3B =
p

(15.142)

donde B es la longitud de onda de Broglie. Si tenemos n electrones no podrn ocupar un volumen menor que V = nve /2 (dividimos por 2 pues dos electrones con spin opuesto pueden ocupar
el mismo lugar) y entonces la energa cintica debe ser mayor que

p2
h2 n 2 / 3
=
2 me 2 me 2V

(15.143)

Por otra parte la concentracin de los electrones es n / V = Z / d 3 donde d es la distancia entre los
ncleos y Z su carga. Por lo tanto la energa cintica tpica de un electrn es

p2
21 / 3 2 h 2 Z 2 / 3
=
me d 2
2 me

(15.144)

el valor tpico de la energa potencial es 2 Ze2 / d . Por lo tanto el valor absoluto de la energa
potencial es menor que la energa cintica si

21 / 3 2 h 2 Z 2 / 3 2 Ze2
>
me d 2
d

o sea si d < 2 2 / 3 2 Z 1 / 3a0

(15.145)

donde a0 = h 2 / mee 2 es el radio de Bohr. Cuando esta desigualdad se satisface (a menos de un


factor numrico del orden de la unidad) los electrones no pueden quedar ligados a los ncleos. A
partir de la misma podemos estimar qu densidad debe tener la estrella para que los electrones
queden libres. Sea m la masa de la estrella por electrn. Puesto que al ionizarse cada tomo
produce Z electrones, la masa de la estrella por ncleo es Zm; por lo tanto la densidad tiene que
cumplir (a menos de un factor numrico del orden de la unidad) la desigualdad

Zm Z 2 m
> 3
d3
a0

(15.146)

Para enanas blancas constituidas por helio Z = 2 , luego m = 2 mH = 3.345 10 24 g y por lo


tanto la densidad tiene que ser mayor que 100 g/cm3.
Las consideraciones anteriores presuponen que los electrones no son relativsticos, y para que
esta sea una aproximacin razonable se debe cumplir que vF << c , una restriccin que implica
que la densidad no debe superar unos 2106 g/cm3. Para estrellas cuya densidad se encuentra
entre 100 y 2106 g/cm3, lo electrones se comportan como un gas degenerado de Fermi no relativstico, en el cual las interacciones Coulombianas con los ncleos se pueden despreciar.
La densidad de una tpica enana blanca es de 106 g/cm3, la masa es de 1033 g, y la temperatura
(interior) es de 107 K. Para estos valores, TF 2 10 9 K , de modo que los electrones forman
un gas de Fermi degenerado. La enana blanca ms conocida es Sirio B, cuya masa de 21033 g
es apenas menor que la del Sol; su radio es de 5600 km, algo ms pequeo que el de la Tierra.
Para ver cmo queda determinado el radio de una enana blanca, consideraremos primero el caso
en que los electrones no son relativsticos. La presin en una estrella de masa M y radio R, debida a la gravitacin, es del orden de

266

15. Estadsticas Cunticas

pG = GM 2 / R 4

(15.147)

donde G = 6.673 10 8 dy cm 2 / g es la constante universal de la gravitacin y es un factor


numrico del orden de la unidad. La estabilidad mecnica requiere que esta presin sea equilibrada por la presin del gas de electrones, dada por la ec. (15.124). El nmero de electrones es
n = M / m ( m es la masa de la estrella por electrn) y V = 4R3 / 3 . Por lo tanto
h2 M 5 / 3
pF =
me m 5 / 3 R5

1 38
= 5
5 4

1/ 3

(15.148)

La condicin de equilibrio pF + pG = 0 requiere entonces que

M1 / 3 R =

h2
Gme m 5 / 3

, =

(15.149)

Un clculo preciso muestra que 4.5 . La (15.149) muestra que R ~ M 1 / 3 , y que es mucho
menor que el radio de una estrella normal de la misma masa, de aqu la denominacin de enana
que se da a estas estrellas.
La ley R ~ M 1 / 3 se cumple mientras la densidad de equilibrio sea tal que los electrones no sean
relativsticos. Pero ~ MR3 ~ M 2 , y por lo tanto si la masa es muy grande, al contraerse la estrella los electrones se tornan relativsticos, lo cual invalida nuestro anterior clculo del radio de
equilibrio. Veamos qu sucede entonces, para lo cual conviene considerar el lmite ultrarelativstico en el cual p2 / me >> mec 2 , y por lo tanto la energa cintica est dada por

= ( p2 c 2 + me2c 4 )1 / 2 mec 2 cp

(15.150)

y no por la expresin clsica p2 / 2 me . En este caso no podemos usar la expresin (9.19) de la


densidad de estados por unidad de intervalo de energa, y es preciso calcular nuevamente f ( )
teniendo en cuanta que = cp . Por medio de un razonamiento anlogo al que nos permiti obtener la (9.19) es fcil verificar (lo dejamos como ejercicio para el lector) que ahora se obtiene la
siguiente expresin de la densidad de estados por unidad de intervalo de energa:

(15.151)

3 n 1/ 3
F = hc
8 V

(15.152)

f ( ) = 8

h3c3

Usando la (15.151) resulta

La energa cintica total es entonces

E=

3
n F
4

La presin se puede calcular a partir de la (15.123) y resulta

267

(15.153)

15. Estadsticas Cunticas

p=

1E 1n
=
F
3V 4V

(15.154)

Para el caso de la estrella obtenemos

p=

hc M 4 / 3
9 4/3
,

R4 m
2 32 2

(15.155)

Vemos entonces que cuando los electrones son ultrarelativsticos, la situacin es completamente
diferente al caso no relativstico, pues ahora la presin del gas de electrones es proporcional a
R4 , igual que la presin debida a la gravitacin. La condicin que ambas presiones sean iguales
en valor absoluto determina un valor crtico de la masa

M*

hc
=
Gm 4 / 3

3/ 2

, =

(15.156)

tal que si M < M * el equilibrio es posible, pero si M > M * la presin del gas de electrones no
puede nunca equilibrar la presin debida a la gravedad, y la contraccin de la estrella contina.
Un clculo exacto permite determinar que = 2.13 . La masa crtica M * se denomina masa de
Chandrasekhar28, y su valor es de aproximadamente 1.45 masas solares. Toda estrella cuya
masa es menor que la masa de Chandrasekhar termina su existencia como una enana blanca
estable, una vez que ha agotado su combustible nuclear29.
Si M > M * , cuando la estrella ha agotado el hidrgeno colapsa bajo la accin de la gravedad. A
medida que se produce dicho colapso, la densidad electrnica crece y por lo tanto el potencial
qumico de los electrones aumenta. Eventualmente, llega el momento en que se torna posible la
reaccin nuclear e + p n + e , en la cual un protn captura un electrn para transformarse en
un neutrn y se emite un neutrino (esta reaccin es la inversa del decaimiento usual). De resultas de esto la estrella se convierte en una estrella de neutrones. La estabilidad de una estrella
de neutrones30 se puede estudiar del mismo modo que la de una enana blanca. Mientras la densidad no es demasiado elevada, se llega al equilibrio para un radio dado por una ley del tipo
R ~ M 1 / 3 , como en el caso de una enana blanca. Pero si la masa es muy grande los neutrones
se tornan relativsticos y hay entonces un valor crtico de la masa, ms all del cual no hay equilibrio posible. Los clculos se complican en este caso, pues es preciso usar la Teora General de
la Relatividad dado que el campo gravitatorio es muy intenso. No existe certidumbre sobre el
valor crtico de la masa de una estrella de neutrones, pero se cree que es menor que 5, y ms
probablemente sea de alrededor de 3 masas solares.
Las estrellas cuya masa es demasiado grande como para formar estrellas de neutrones estables
no pueden detener el colapso y acaban su existencia como agujeros negros.

28

Subrahmanyan Chandrasekhar, quien determin dicho valor lmite, obtuvo en 1983 el Premio Nobel por haber

formulado la teora de los estadios tardos de la evolucin de estrellas masivas.


29
30

En particular, el Sol se convertir en una enana blanca con un radio de unos 7000 km.
En el curso del colapso la estrella puede explotar como una supernova, con lo cual pierde una fraccin

importante de su masa; en tal caso el residuo que se convierte en estrella de neutrones tiene una masa mucho menor
de la que inicialmente tena la estrella.

268

También podría gustarte