Está en la página 1de 89

Átomos y Moléculas

Marcela Lagos F.
Instituto de Ciencias Fı́sicas y Matemáticas, Universidad Austral de Chile, Valdivia, Chile.
marcelagosf@gmail.com

16 de diciembre de 2020

Detalles del curso y de la clase


Objetivos
Estudiar la estructura y propiedades fı́sicas de la materia a través de la teorı́a atómica.

Unidad 1
Fundamentos y postulados de la mecánica cuántica

Ecuación de Schrödinger

Revisión de problemas clásicos

• Oscilador armónico
• Partı́cula en la caja
• Etc.

Breve revisión del momento angular

Átomo de Hidrógeno

Clase 1: Revisión de la mecánica cuántica


Introducción: Motivación y experimentos clásicos

Fundamentos de la mecánica cuántica

• Operadores, autovectores y autovalores


• Conmutadores
• Integrales sobre operadores
• Operadores hermı́ticos

Postulados de la mecánica cuántica

1
Bibliografı́a
Atkins-Friedman “Molecular Quantum Mechanics” Oxford University Press, ISBN: 978-0-19-927498-7.

1. Introducción: Motivación y Experimentos clásicos


Estudio moderno de la estructura de la materia comienza con el asentamiento de la teorı́a atómica, a principios
del siglo XIX, gracias a los descubrimientos en quı́mica que manifestaban la naturaleza atómica de la materia. A
finales del mismo siglo, los experimentos fı́sicos, involucrando principalmente electromagnetismo, comenzaron a
dar luz sobre la estructura interna de estas “partı́culas indivisibles”, con el descubrimiento de varias partı́culas
subatómicas.
Los resultados que surgen al intentar describir la estructura atómica y fenómenos asociados, a partir de la
mecánica clásica y la electrodinámica fueron por decir lo menos, desconcertantes. Importantes ejemplos de estos
son

Estabilidad del átomo

La dualidad de la materia

Radiación de cuerpo negro y la “catástrofe ultravioleta”

Medición de la capacidad calorı́fica de la materia

El efecto fotoeléctrico y Compton

El espectro atómico

Primeros y muy importantes experimentos que mostrarı́an la necesidad de una nueva “formulación”de la fı́sica
y motivarı́an la revolución cuántica.
El surgimiento de la ideas detrás de la mecánica cuántica, principalmente propuestas por Planck, Einstein,
Heisenberg, Schröndinger, Dirac, entre otros, y su posterior formalización es uno de los logros cientı́ficos más
importantes de la fı́sica.
La mecánica cuántica es el formalismo matemático que actualmente explica y predice fenómenos atómicos con
precisión extraordinaria. Abarca la descripción del comportamiento de todas las formas de materia, incluı́das
las moléculas, átomos, electrones.

2
2. Los fundamentos de la mecánica cuántica
2.1. Operadores en mecánica cuántica
Observable: cualquier variable dinámica que pueda ser medida.
Diferencia entre persepectiva clásica de la cuántica: clásicamente los observables fı́sicos son representados por
funciones (posición como función del tiempo), cuánticamente son representados por operadores matemáticos.
Operador, Ω: sı́mbolo para una instrucción de cometer una acción, una operación, sobre una función. En la
mayorı́a de los ejemplo que veremos, tal acción no será más que una multiplicación o derivación; tı́picamente,
multiplicación por x, representada por el operador x×, o la derivación respecto a x, representada por el operador
d
dx . Usualmente no se distingue entre el observable fı́sico y el operador que lo representa.

2.1.1. Operadores lineales

Todos los operadores en mecánica cuántica son operadores lineales, que cumplen

Ω(af + bg) = aΩf + bΩg , (1)

donde a y b son constantes y f y g son funciones. La derivación es una operación lineal, la función logaritmo
no lo es.

2.1.2. Autofunciones y autovalores


d(sin x)
En general, el operar sobre una función resulta en una nueva función; dx = cos x, pero en ciertos casos,
ax
d(e )
el resultado es la misma función reescalada dx = aeax . Estas funciones son llamadas autofunciones del
operador.
Formalmente, una función f ∈ C es una autofunción del operador Ω si satisface la siguiente ecuación de
autovalores
Ωf = ωf , (2)

donde ω es una constante conocida como el autovalor de Ω. El conjunto de todos los autovalores de un operador
d2
es llamado el espectro del operador. Ejemplo: ¿Es f = cos (ax) autofunción del operador dx2 ?

Sı́, ya que podemos escribir el resultado de la acción de este operador sobre f como una ecuación de autovalores;

d2 d2 f d sin (ax)
2
f = − 2 = −a = −a2 cos (ax) .
dx dx dx
d2
Luego, f = cos (ax) sı́ es autofunción del operador dx2 , y tiene por autovalor −a2 . 
Una función general puede ser expandida en términos de todas las autofunciones de un operador, esto es, las
autofunciones de un operador forman un conjunto completo de funciones. Luego, si fn es una autofunción de
un operador Ω con autovalor ωn , es decir
Ωfn = ωn fn , (3)

luego, una función general g puede ser expresada como una combinación lineal de dichas autofunciones, según
X
g= cn fn , (4)
n

3
donde las constantes cn son coeficientes y la suma es sobre el conjunto completo de funciones. ¿De qué sirve
escribir una función en términos de otras? Hacer esto nos permite deducir el efecto de un operador sobre una
función que no es una de sus autofunciones; el efecto de Ω sobre g, usando la propiedad de linealidad es
X X X
Ωg = Ω cn fn = cn Ωfn = cn ωn fn . (5)
n n n

Caso especial: conjunto degenerado de autofunciones, un subconjunto de autofunciones con el mismo autovalor.
Toda combinación lineal de autofunciones degeneradas es también una autofunción con el mismo auto valor;

k
X k
X k
X k
X
Ωg = Ω cn fn = cn Ωfn = cn ωfn = ω cn fn = ωg . (6)
n n n n

De n funciones bases es posible construir n combinaciones linealmente independientes. Un conjunto de n fun-


ciones g1 , g2 , ...gn se dice linealmente independiente si no podemos encontrar un conjunto de constantes
c1 , c2 , ..., cn (más que el conjunto trivial c1 = c2 = ... = cn = 0) en el que
X
ci gi = 0 . (7)
n

Un conjunto de funciones que no es linealmente independiente se dice linealmente dependiente. De un


conjunto de n funciones linealmente independientes es posible construir un número infinito de conjuntos de
combinaciones linealmente independientes, pero cada conjunto no puede tener más que n elementos.

2.2. Representaciones
Diferentes elecciones de las formas explı́citas de los operadores representando a un observable particular.
La representación de posición, una de las representaciones más comunes, en la que el operador posición
es representado por la multiplicación por la coordenada (denotada por x generalmente) y el momento lineal
paralelo a la coordenada es representado por la derivación respecto a la coordenada (como consecuencia de un
postulado básico de la mecánica cuántica). Explı́citamente

~ ∂
Representación de posición: x→x× px → , (8)
i ∂x

donde ~ = h/2π.
Otra representación, la representación de momemtum, en la que el momento lineal paralelo a una coor-
denada es presentado por la operación de multiplicación por tal componente (paralelo a la coordenada x serı́a
denotado por px ) y el operador posición serı́a representado por la derivación respecto a px . Explı́citamente

~ ∂
Representación de momentum: x→− px → px × . (9)
i ∂px

2.3. Conmutación y anticonmutación


Caracterı́stica imporante de los operadores es que en general, el resultado de sucesivas operaciones (operador A
seguido de operar con B, que se denotarı́a como BA) depende del orden en el que las operaciones son llevadas
a cabo. Esto es, en general AB 6= BA. Decimos que en general, los operadores no conmutan.

4
Ejemplo 1: Consideremos los operadores x y px que operan sobre una función especı́fica f = x2 . En la repre-
sentación de posición,
~ ∂ 2 2~ 2~ 2
(xpx )x2 = x x =x x= x , (10)
i ∂x i i
mientras que
~ ∂ 3 3~ 2
(px x)x2 = px x3 = x = x . (11)
i ∂x i
Los operadores x y px no conmuntan. 

La cantidad AB − BA = [A, B] es llamada el conmutador de A con B.

Ejemplo 2: Calcular conmutador de x con px en la representación de posición. Sea f una función arbitraria
de prueba

[x, px ]f = (xpx − px x)f (12)


~ ∂f ~ ∂(xf )
=x× − (13)
i ∂x i  ∂x 
~ ∂f ~ ∂f
=x× − f +x× (14)
i ∂x i ∂x
~
=− f (15)
i
= i~f , (16)

Luego
[x, px ] = i~ . (17)

2.4. Construcción de operadores


Podemos construir operadores para otros observables de interés a partir de los operadores de posición y mo-
mentum.
Algunos ejemplos:

El operador de energı́a cinética T puede ser construido notando que la energı́a cinética está relacionada
con el momentum lineal según
p2
T = , (18)
2m
con m la masa de la partı́cula. Se sigue que, en tres dimensiones y en la representación de posición, el
operador energı́a cinética tiene la forma

~2
 2
∂2 ∂2 ~2 2


T =− + + = − ∇ . (19)
2m ∂x2 ∂y 2 ∂z 2 2m

El operador energı́a potencial de una partı́cula en una o más dimensiones es la multiplicación por la
función V (x) en la representación de posición.

5
El operador de la energı́a total de un sistema es llamado el operador hamiltoniano, denotado por H

H =T +V . (20)

Como ejemplo, el operador hamiltoniano para un electrón de masa me en un átomo de hidrógeno es

~2 2 e2
H=− ∇ − . (21)
2me 4π0 r

Prescripción general para la construcción de operadores en la representación de posición:

1. Escribir la expresión clásica de un observable en términos de la coordenadas de posición y su momentum


lineal.
~ ∂
2. Reemplazar x por la multiplición por x y px por i ∂x (y de la misma forma para las otras coordenadas).

2.5. Integrales sobre operadores


Cuando queremos hacer contacto entre cálculos hechos usando operadores y el real resultado de un experimento
necesitamos evaluar ciertas integrales. Estas integrales tienen la forma general
Z

I= fm Ωfn dτ , (22)


donde fm es la compleja conjugada de fm , y dτ el elemento de volumen. La integral se toma en todo el espacio
que ocupa el sistema. Casos especiales de este tipo de integrales.
Cuando Ω = 1, Z

S= fm fn dτ , (23)

útil como medida de la “similaridad”de dos funciones; cuando S = 0 las funciones se fm y fn se dicen ortogonales.
Cuando S es cercano a 1 las funciones son casi idénticas. Reconocer estas propiedades de las funciones sirve a
la hora de simplificar el cálculo.
Cuando m = n tenemos la integral de normalización. Una función fm se dice normalizada si
Z

fm fm dτ = 1 , (24)

Un conjunto de funciones fn que son (a) normalizadas y b mutuamente ortogonales se dice que satisfacen la
condición de ortonormalización Z

fm fn dτ = δmn , (25)

donde δmn denota la delta de Kronecker.

2.6. Notación del paréntesis de Dirac


Sirve para simplicar la notación de los cálculos que involucran integrales del tipo anterior. El paréntesis de
Dirac denota Z

hm| Ω |ni = fm Ωfn dτ . (26)

6
El sı́mbolo |ni, llamado ket, denota el estado descrito por la función fn , similarmente el sı́mbolo hn|, llamado
bra, denota el complejo conjugado de la función, fn∗ . Cuando el operador es la identidad Ω = 1, se omite y se
usa la convención Z

hm|ni = fm fn dτ . (27)

Con esta notación, la condición de ortonormalidad queda escrita como

hn|mi = δnm . (28)

De la definición del paréntesis de Dirac, tenemos la siguiente propiedad

hm|ni = hn|mi ∗ . (29)

2.7. Operadores hermı́ticos


Un operador es hermı́tico si satisface la siguiente relación
Z Z ∗

fm Ωfn dτ = fn∗ Ωfm dτ , (30)

lo que en la notación de Dirac queda como


hm| Ω |ni = hn| Ω |mi , (31)

para cualquier par de dos funciones fm y fn .


El que un operador sea hermı́tico tiene varias implicancias en las propiedades de sus autovectores y sus corres-
pondientes autovalores.

Propiedad 1: Los autovalores un operador hermı́tico son reales.


Prueba: Consideremos una ecuación de autovalores

Ω |ωi = ω |ωi . (32)

El ket |ωi denota un autoestado del operador Ω en el sentido de que la correspondiente función fω
asociada a |ωi es una autofunción de Ω. Estamos etiquetando los autoestados con el autovalor ω del
operador Ω.
Multiplicando por la izquierda por hω|, tenemos

hω| Ω |ωi = ω hω|ωi = ω , (33)

siempre que |ωi sea normalizado.


Conjugando la ecuación anterior

hω| Ω |ωi = ω ∗ . (34)

Lo anterior es válido para todo operador. Sin embargo, si Ω es hermı́tico, cumple que


hω| Ω |ωi = hω| Ω |ωi , (35)

7
luego, se sigue que
ω = ω∗ , (36)

que implica que ω ∈ R. 

Propiedad 2: Las autofunciones correspondientes a diferentes autovalores de un operador hermı́tico son


ortogonales.
Esto es, si tenemos dos autofunciones de un operador hermı́tico Ω con autovalores ω y ω 0 , con ω 6= ω 0 , luego
hω|ω 0 i = 0. Por ejemplo, todas las autofunciones de un oscilador armónico son mutuamente ortogonales
ya que todos los autovalores definen a una energı́a diferente.
0
Prueba: Supongamos que tenemos dos autoestados |ωi y |ωi satisfaciendo las correspondientes ecuaciones
de autovalores
0 0
Ω |ωi = ω |ωi , Ω |ωi = ω 0 |ωi . (37)
0
Multiplicamos la primera ecuación por |ωi y la segunda por |ωi

0 0
hω| Ω |ωi = ω hω 0 |ωi , hω| Ω |ωi = ω 0 hω|ω 0 i . (38)

Tomamos el complejo conjungado de la primera ecuación y restamos, usando que ω 0∗ = ω 0

0 ∗ ∗
hω| Ω |ωi − hω| Ω |ω 0 i = ω hω 0 |ωi − ω 0 hω|ω 0 i . (39)

Debido a que Ω es hermı́tico (y que sus autovalores son reales) tenemos que

0 = ω hω 0 |ωi − ω 0 hω 0 |ωi = (ω − ω 0 ) hω 0 |ωi . (40)

Finalmente, si los autovalores son diferentes, la única opción para satisfacer la ecuación anterior es que

hω 0 |ωi = 0 , (41)

es decir, las autofunciones son ortogonales. 

8
Clase 2: Postulados de la mecánica cuántica
Resumen Clase 1

Pruebas propiedades operadores hermı́ticos

Postulados de la mecánica cuántica

• Sobre los estados y las autofunciones


• Sobre la selección de operadores
• Sobre la relación entre el cálculo formal y las observaciones experimentales
• Sobre la interpretación de la función de onda
• Sobre la evolución dinámica de la función de onda

3. Los postulados de la mecánica cuántica


Un sistema fı́sico está descrito de forma general por tres ingredientes básicos; estados, observables y la dinámica
o ley de evolución temporal, o de forma más general, un grupo de simetrı́as fı́sicas. Clásicamente, la descripción
del sistema es dado de forma directa mediante el modelo de mecánica del espacio de fase: los estados son
puntos en un espacio de fase, observables son funciones real-valuadas sobre este, la evolución temporal es dada
por un grupo uniparamétrico de transformaciones del espacio de fase, y las simetrı́as fı́sicas están realizadas
por transformaciones. Cuánticamente, una descripción fı́sica normalmente consiste de un espacio de estados de
Hilbert (un espacio vectorial abstracto que posee la estructura de producto interno que permite la medición
de longitud y el ángulo), observables son operadores autoadjuntos (hermı́ticos) en el espacio de los estados,
evolución temporal es dada por un grupo uniparamétrico de transformaciones unitarias en el espacio de estados
de Hilbert, y las simetrı́as fı́sicas son realizadas por transformaciones unitarias.
A continuación se resume el marco matemático de mecánica cuántica que puede ser trazados hasta los axiomas
de Dirac-von Neumann.

A: observable (operador) o propiedad del sistema.

ri : la coordenada espacial de la i-ésima partı́cula.

t: el tiempo t.

Ψ: función de onda del sistema dependiente del tiempo.

ψ: función de onda independiente del tiempo.

3.1. Estados y autofunciones


El primer postulado habla de la información que podemos conocer de un estado. Postulado 1: El estado de

un sistema está completamente descrito por una función Ψ(r1 , r2 , ...t). La función de onda del sistema puede

también depender de variables internas de las partı́culas. La función de onda contiene información de todas las
propiedades del sistema que pueden ser determinadas experimentalmente.

9
La función de onda de un sistema estará especificada por un conjunto de etiquetas llamadas números cuánticos
del sistema, lo que podrá ser denotado como Ψa,b,... donde a, b, .. corresponden a los número cuánticos. Los valores
de estos número cuánticos especificarán a la función de onda, permitiendo calcular una variedad de observables
fı́sicos.
Es a menudo conveniente referirnos al estado del sistema sin hablar de la correspondiente función de onda; el
estado está especificado al listar los valores que los número cuánticos que lo definen.

3.2. La prescripción fundamental


Y la selección de los operadores. Postulado 2: Los observables fı́sicos están representados por operadores

lineales hermı́ticos escogidos tal que satisfagan las siguientes relaciones de conmutación

[q, pq0 ] = i~δqq0 , [q, q 0 ] = 0 , [, pq , pq0 ] = 0 , (42)

donde q y q 0 denotan coordenadas x, y y z y pq y pq0 los momentum lineales correspondientes. El que los ope-

radores fı́sicos sean hermı́ticos asegura que los observables tengan valores reales. Cada relación de conmutación
es un postulado básico, que no se puede probar ni derivar de postulados.
El postulado 2 es la base para la selección de la forma de los operadores en las representaciones de posición y
momentum, para todos los observables que dependan de la posición y del momentum (excluye a observables
intrı́nsicos, como el espı́n). Por ejemplo, si definimos la representación de posición como la representación en la
que el operador de posición es la multiplicaición por la coordenada posición, luego, del postulado 2 se sigue que
el operador de momentum debe involucrar derivación con respecto a x. De forma similar en la representación de
momentum; si en esta representación el operador momentum lineal está representado por la multiplicación por
sus componentes, luego, la forma del operador posición queda como una derivada respecto al tales componentes.
Las coordenadas x, y y z conmutan entre ellas, tal como lo hacen las componentes del momentum lineal px , py
y pz .

3.3. El resultado de la medición


Sobre la función de onda y los operadores y establecer la relación entre el cálculo formal y las observaciones
experimentales.

Postulado 3: Cuando un sistema está descrito por una función de onda Ψ, el valor medio de un observable Ω
en una serie de medidas es igual al valor de expectación del operador correspondiente.
El valor de expectación de un operador Ω para un estado arbitrario Ψ se denota como hΩi y se define como
R ∗
Ψ ΩΨdτ hΨ| Ω |Ψi
hΩi = R ∗ = . (43)
Ψ Ψdτ hΨ|Ψi

Si la función de onda está normalizada, el valor de expectación es simplemente


Z
hΩi = Ψ∗ ΩΨdτ = hΨ| Ω |Ψi . (44)

A menos que se diga lo contrario, se debe asumir de ahora en adelante que la función de onda está normalizada.

10
El significado del Postulado 3 puede ser desarrollado como sigue. Supongamos que el sistema está en el estado
Ψ, autofunción de Ω con un autovalor ω, ΩΨ = ωΨ, luego
Z Z Z
∗ ∗
hΩi = Ψ ΩΨdτ = Ψ ωΨdτ = ω Ψ∗ Ψdτ = ω . (45)

Una serie de experimentos sobre sistemas idénticos para determinar Ω entregará el valor (promedio) ω (una
cantidad real, debido a que Ω es hermı́tico). Ahora supongamos que aunque el sistema está en un autoestado del
hamiltoniano que no es un autoestado de Ω. En este caso, y ya que las autofunciones de Ω forman un conjunto
completo, la función de onda puede ser expresada como una combinación lineal de autofunciones de Ω, según

X
Ψ= c n Ψn , donde ΩΨn = ωn Ψn . (46)
n

En este caso, el valor de expectación es

Z X ∗ X 
hΩi = cm Ψm Ω cn Ψn dτ (47)
m n
X Z
= c∗m cn Ψ∗m ΩΨn dτ (48)
m,n
X Z
= c∗m cn ωn Ψ∗m Ψn dτ (49)
m,n
X
= c∗m cn ωn δmn (50)
m,n
X
= c∗n cn ωn (51)
n
X
= |cn |2 ωn . (52)
n

Esto es, el valor de expectación corresponde a una suma ponderada de las autofunciones de Ω, siendo la
contribución a la suma de un autovalor particular ωn determinada por el módulo cuadrado de su correspondiente
coeficiente en la expansión de la función de onda, cn .
Ahora podemos interpretar la diferencia entre los resultados en Eq (45) y (52) en el siguiente postulado.

Postulado 3’: Cuando Ψ es una autofunción de un operador Ω, la determinación de la propiedad Ω siempre


entrega un único resultado, a saber, el autovalor ω correspondiente. El valor de expectación será simplemente
el autovalor ω. Cuando Ψ no es una autofunción de Ω, una única medición de la propiedad entregará un único
resultado que será uno de los autovalores de Ω, y la probabilidad de que un autovalor particular ωn sea medido
es igual a |cn |2 , donde cn es el coeficiente de la autofunción Ψn en la expansión de la función de onda.
Una medida puede dar un solo resultado. Una serie de mediciones llevará a una serie de resultados con algún
valor medio. El postulado anterior asegura que una medida del observable Ω siempre resulta en uno de los
autovalores del operador correspondiente. Si la función que describe el estado del sistema es una autofunción
de Ω, luego, cada medición entregará precisamente ω y el valor medio será también ω. Si el sistema ha sido
preparado en un estado que no es una autofunción de Ω, luego diferentes medidas darán diferentes valores, pero
cada medida individual es uno de los autovalores de Ω y la probabilidad de que un resultado particular ωn
sea obtenido está deteminada por el valor |cn |2 . En este caso, el valor medio de todas las observaciones es el

11
promedio ponderado (pesado) de los autovalores. Notemos que en cualquiera de los casos, la hermiticidad de
los operadores garantiza que los observables serán reales. Ejemplo de como usar el postulado 3’.

Sea A un operador con autofunciones f1 , f2 , ... fn con los correspondientes autovalores a1 , a2 ,... an , o bien

Afi = ai fi . (53)

El estado de un sistema está descrito por la función de onda normalizada (Ejercicio: probar esto) Ψ dada por
  12   12
1 3 3
Ψ = f1 − f2 + i f3 , (54)
2 8 8

o bien
X
Ψ= ci fi , (55)
i
  21   12
1 3
con c1 = 2, c2 = − 8 y c3 = 38 i . ¿Cuál será el resultado de medir el observable A? ¿Es posible que Ψ
sea una autofunción de A? ¿En qué caso Ψ serı́a autofunción de A?
Veamos el resultado de operar con A sobre Ψ.
   12   12 
1 3 3
AΨ = A f1 − f2 + i f3
2 8 8
  21   21
1 3 3
= Af1 − Af2 + i Af3
2 8 8
  12   12
1 3 3
= a1 f1 − a2 f2 + i a3 f3
2 8 8
6= c × Ψ ,

con c una constante arbitraria. Luego, Ψ no es una autofunción de A. Si a1 = a2 = a3 = a (conjunto degenerado)


luego

  12   12
1 3 3
AΨ = a1 f1 − a2 f2 + i a3 f3
2 8 8
  12   12
1 3 3
= af1 − af2 + i af3
2 8 8
   21   12 
1 3 3
= a f1 − f2 + i f3
2 8 8
= aΨ .

Nos quedaremos en el caso en el que a1 6= a2 6= a3 . Entonces, aunque Ψ no es autofunción de A, sı́ es una


combinación lineal de sus autofunciones, por lo que en diferentes medidas obtendremos los valores a1 , a2 y a3
(los autovalores de las autofunciones de A que contribuyen en Ψ). Las probabilidad de obtener a1 , a2 y a3 ,

12
respectivamente |c1 |2 = 14 , |c2 |2 = 3
8 y |c3 |2 = 38 . El valor promedio definido en Ec. (52) será

1 3 3
hAi =
a1 + a2 + a3 . (56)
4 8 8
1
Observación: La normalización de Ψ se refleja en la condición i |ci |2 = 1. En este caso, se cumple + 2 38 = 1.
P
4
Dado que las autofunciones f4 , f5 ,... no contribuyen a Ψ (sus pesos son c4 = c5 = ... = 0), la probabilidad de
encontrar los valores a4 , a5 ,... es cero. 

3.4. La interpretación de la función de onda


Conocida comunmente como la interpretación de Born.

Postulado 4: La probabilidad que una partı́cula sea encontrada en un elemento de volumen dτ en la posición
r es proporcional a |Ψ(r)|2 dτ .
Se sigue de esta intepretación que |Ψ(r)|2 es una densidad de probabilidad, en el sentido que esta nos entrega
una probabilidad cuando es multiplicada por el volumen dτ de una región infinitesimal. La función de onda es
una amplitud de probabilidad, y no tiene un significado fı́sico directo. Notemos que mientras la densidad de
probabilidad es real y no negativa, la función de onda puede ser compleja y negativa. Usualmente es conveniente
usar una función de onda normalizada; luego, la interpretación de Born se vuelve una igualdad en vez de una
proporcionalidad.
Lo que implica la interpretación de Born es que la función de onda debe ser cuadrado-integrable, esto es
Z
|Ψ|2 dτ < ∞ , (57)

debido a que la partı́cula se debe encontrar en alguna parte de todo el espacio, la probabilidad de onda debe
ser finita (e igual a 1 para una función de onda normalizada). Este postulado implica las siguientes condiciones
de borde para la función de onda,
Ψ→0 cuando x → ±∞ , (58)

de otra forma la integral de |Ψ|2 serı́a infinita. A lo largo del curso se hará uso frecuente de esta implicación.

3.5. La ecuación para la función de onda


Sobre la evolución dinámica de la función de onda con el tiempo.

Postulado 5: La función de onda Ψ(r1 , r2 , ..., t) evoluciona en el tiempo según la ecuación

∂Ψ
i~ = HΨ , (59)
∂t

con el operador H el operador hamiltoniano (operador energı́a total) del sistema.


La ecuación diferencial parcial es la famosa ecuación de Schrödinger introducida por Erwin Schrödinger en
1926.
Hasta ahora, estamos tratando a la ecuación como postulado sin motivación. Sin embargo, al revisar la transición
a la mecánica cuántica, se argumentará sobre su plausabilidad fı́sica.

13
2 2
~ ∂
Ejemplo: La ecuación de Schrödinger para una única partı́cula en una dimensión, donde H = T +V = − 2m ∂x2 +
V (x, t), será
∂Ψ ~2 ∂ 2 Ψ
i~ =− + V (x, t)Ψ . (60)
∂t 2m ∂x2
Esta ecuación y sus soluciones serán la base de lo desarrollado en lo que sigue del curso.

3.6. Ejemplo: Separación de la ecuación de Schrödinger y estados estacionarios


En el ejemplo anterior, cuando la energı́a potencial del sistema es independiente del tiempo, la ecuación de
Schrödinger puede resuelta usando el método de separación de variables. En una dimensión, el ansatz para
la solución tendrá la forma
Ψ(x, t) = ψ(x)φ(t) . (61)

Al hacer la sustitución en Ec. (60) tenemos

~2 d 2 ψ dφ
− φ 2 + V (x)ψφ = i~ψ .
2m dx dt

Dividiendo ambos lados por Ψ = ψφ tenemos

~2 1 d2 ψ 1 dφ
− + V (x) = i~ .
2m ψ dx2 φ dt

El lado izquierdo de la ecuación es una función de x, por lo que cuando x cambia, solo cambia el lado izquierdo.
Pero, como el lado izquierdo es igual al derecho, que no cambia, el lado izquierdo debe ser igual a una constante.
Ya que las dimensiones de la constante son las de una energı́a (las mismas que para V ), la llamaremos E. Se
sigue que la ecuación dependiente del tiempo se separa en las siguientes dos ecuaciones diferenciales

~2 d2 ψ
− + V (x)ψ = Eψ, (62)
2m dx2
1 dφ
i~ = Eφ . (63)
φ dt

Ec. (63) tiene la solución


φ ∝ e−iEt/~ . (64)

Luego, la función de onda completa Ψ = ψφ tiene la forma

Ψ(x, t) = ψ(x)e−iEt/~ , (65)

donde la constante de proporcionalidad en φ ha sido absorbida por la función (aún a determinar) ψ, que deberá
definir la apropiada constante de normalización de Ψ.
La función de onda independiente del tiempo satisface Ec. (62), la que puede ser escrita como

Hψ = Eψ . (66)

Esta expresión de la ecuación de Schrödinger independiente del tiempo, en la que se basará mucho de
lo que desarrollaremos más adelante.
Observaciones:

14
Ec. (62) tiene la forma de una ecuación de onda estacionaria. Luego, siempre que estemos interesados
solo en la dependencia espacial de la función de onda, es legı́timo considerar la ecuación de Schrödinger
independiente del tiempo como una ecuación de onda.

Cuando la energı́a potencial del sistema no dependa del tiempo, y el sistema esté en un estado de energı́a
E, es bastante simple construı́r la función de onda dependiente del tiempo a partir de la función de onda
independiente del tiempo, simplemente mutiplicando por e−iEt/~ . La dependencia temporal de tal función
de onda es simplemente una modulación de su fase, ya que podemos escribir

e−iEt/~ = cos(Et/~) − i sin(Et/~) . (67)

Se sigue que el factor con dependencia temporal oscila periódicamente entre 1 a −i luego de −1 a i y de
vuelta a 1, con una frecuencia E/h, y periodo h/E. Este comportamiento se muestran en la Fig. 1. Luego,
para imaginar la variación temporal de una función de onda de una energı́a definida, hay que pensarla
como “oscilando” entre valores de amplitud positivos a imaginarios y a negativos, con una frecuencia
proporcional a la energı́a.
Aunque la fase de la función de onda Ψ con energı́a definida E oscila en el tiempo, el producto Ψ∗ Ψ
permanece constante,
Ψ∗ Ψ = (ψ ∗ eiEt/~ )(ψe−iEt/~ ) = ψ ∗ ψ . (68)

Estados de este tipo son llamados estados estacionarios. En lo que hemos visto hasta ahora, se sigue
que los sistemas con una energı́a especı́fica y precisa, y en los que la energı́a potencial no varı́a en el
tiempo, se encuentran en estados estacionarios. Aunque sus funciones de onda varı́a de una fase a otra,
de forma repetitiva, el valor de Ψ∗ Ψ permanece constante en el tiempo.

Figura 1: Una función de onda correspondiente a una energı́a E rota en el plano complejo de un valor real a
uno imaginario y de vuelta a uno real, con una frecuencia circular E/h.

15
Clase 3
Cambios en apunte: concepto de espectro de operadores

Resumen Clase 2: Postulados de la mecánica cuántica

Sobre la especificación y evolución de los estados

Matrices en mecánica cuántica

Resumen: Postulados de la mecánica cuántica


Postulado 1: El estado de un sistema fı́sico está completamente descrito por la función de onda Ψ(r1 , r2 , ...t).

Postulado 2: Los observables fı́sicos están representados por operadores lineales hermı́ticos escogidos tal
que satisfagan las siguientes relaciones de conmutación

[q, pq0 ] = i~δqq0 , [q, q 0 ] = 0 , [, pq , pq0 ] = 0 , (69)

donde q y q 0 denotan coordenadas x, y y z, y pq y pq0 los momentum lineales correspondientes.

Postulado 3: Cuando un sistema está descrito por una función de onda Ψ, el valor medio de un observable
Ω en una serie de medidas es igual al valor de expectación del operador correspondiente hΩi, dado por
R ∗
Ψ ΩΨdτ hΨ| Ω |Ψi
hΩi = R ∗ = . (70)
Ψ Ψdτ hΨ|Ψi

Postulado 4: La probabilidad que una partı́cula sea encontrada en un elemento de volumen dτ en la


posición r es proporcional a |Ψ(r)|2 dτ .

Postulado 5: La función de onda Ψ(r1 , r2 , ..., t) evoluciona en el tiempo según la ecuación

∂Ψ
i~ = HΨ , (71)
∂t

con el operador H el operador hamiltoniano (operador energı́a total) del sistema.

4. La especificación y evolución de los estados


Supongamos que el estado de un sistema puede ser especificado como |a, b, ...i, donde cada uno de los autovalores
a, b, .. corresponden a los operadores representado diferentes observables A, B, ... del sistema. Si el sistema está
en el estado |a, b, ...i, luego, cuando medimos la propiedad A debemos obtener de forma exacta el valor a
como resultado, y de la misma forma para las otras propiedades. Pero, ¿puede este estado ser especificado
completamente? ¿Puede este estado ser un autoestado de todos los posibles observables A, B, ..., de forma
simultánea y sin restricciones sobre los observables? Con esta pregunta entramos al dominio del principio de
indeterminación.

16
4.1. Observables simultáneos
Primeramente, estableceremos las condiciones en las que dos observables pueden ser especificados simultánea-
mente con precisión arbitraria. Esto es, estableceremos las condiciones para un estado |Ψi, correspondiente a la
función de onda Ψ, pueda ser simultáneamente autoestado de dos operadores A y B. Explı́citamente, probare-
mos que:

Propiedad 3: Si dos observables pueden tener valores precisos simultáneamente definidos, luego sus correspon-
dientes operadores deben conmutar.

Prueba: Asumamos que |Ψi es un autoestado de dos operadores, esto es

A |Ψi = a |Ψi , y B |Ψi = b |Ψi . (72)

Con esto, podemos escribir la siguiente cadena de relaciones

AB |Ψi = Ab |Ψi = bA |Ψi = ba |Ψi = ab |Ψi = aB |Ψi = Ba |Ψi = BA |Ψi . (73)

Luego, si Ψ es un autoestado tanto de A como de B, y si lo mismo es cierto para todas las funciones Ψ de un
conjunto completo, luego es necesario que [A, B] = 0.
Sin embargo, ¿la condición [A, B] = 0 realmente garantiza que A y B tengan autovalores simultáneamente? En
otras palabras, si A |Ψi = a |Ψi y [A, B] = 0, ¿podemos confiarnos en que |Ψi es también autoestado de B.
Confirmamos esto como sigue. Dado que A |Ψi = a |Ψi, podemos escribir

BA |Ψi = Ba |Ψi = aB |Ψi . (74)

Ya que A y B conmutan, el primer término a la izquierda es igual a AB |Ψi. Luego, esta relación tiene la forma

A(B |Ψi) = a(B |Ψi) . (75)

Sin embargo, el comparar esta ecuación con la ecuación de autovalores A |Ψi = a |Ψi, podemos concluir que
B |Ψi ∝ |Ψi, o que B |Ψi = b |Ψi, donde b es un coeficiente de proporcionalidad. Esto es |Ψi es un autoestado
de B. 

Con esta discusión estamos en posición de determinar los operadores que pueden ser especificados de forma
simultánea. Todo lo que necesitamos hacer es inspeccionar el conmutador [A, B]: si este es cero, luego A y B
pueden ser especificados simultáneamente.

Pares de observables que no pueden ser determinados simultáneamente se dicen observables complementarios.
Ası́, la posición a lo largo del eje x y el momentum lineal paralelo al mismo eje son observables complementarios.
La fı́sica clásica comete el error de asumir que no existen restricciones sobre simultaneidad de la determinación
de observables, ignorando la complementariedad. La mecánica cuántica nos obliga a escoger un conjunto de
posibles observables si es que buscamos especificar un estado de forma completa.

17
4.2. El principio de indeterminación
Aun cuando no podamos especificar de forma simultánea los autovalores de dos operadores que no conmutan,
es posible renunciar a la precisión en la especificación de una de las propiedades con el objeto de adquirir gran
precisión en la especificación de la propiedad complementaria. Por ejemplo, si sabemos la localización de una
partı́cula dentro de un rango ∆x, luego podemos especificar el momentum lineal paralelo a x dentro de un rango
∆px sujeto a la restricción
1
∆x∆px ≥ ~. (76)
2
Ası́, a medida que ∆x aumenta, la indeterminación en px puede disminuir, y viceversa. Esta relación entre
indeterminaciones (incertidumbres) en la especificación de dos observables complementarios es un caso especial
del principio de indeterminación propuesto por Werner Heinsenberg en 1927. Una forma general del principio
de indeterminación fue desarrollado por H.P. Robertson en 1929 para dos observables A y B:

1
∆A∆B ≥ | h[A, B]i | , (77)
2

donde la raı́z de la desviación cuadrática media de A está definida como


q
2
∆A = hA2 i − hAi . (78)

Este es una forma exacta y precisa del principio de intederminación: la forma precisa de las “indeterminaciones”
∆A y ∆B están dadas (estas son raı́ces de la desviación cuadrática media) y el lado derecho da una cota por
abajo precisa del valor del producto de estas indeterminaciones.

4.3. Consecuencias del principio de indeterminación


El primer punto a notar es que el principio de indeterminación es consistente con la “Propiedad 3” de los
operadores hermı́ticos, en la que si A y B conmutan, luego la parte derecha del principio es cero y no hay
restricciones para la indeterminaciones: no hay inconsistencia en tener tanto ∆A = 0 y ∆B = 0. Por otro lado,
cuando A y B no conmutan, los valores ∆A y ∆B estan relacionados. Por ejemplo, aún cuando es posible
preparar un sistema en un estado en el que ∆A = 0, la indeterminación luego implica que ∆B debe ser de orden
infinito para asegurar que ∆A∆B no sea menor que 1 h[A, B]i |. En el caso particular delas especificaciones
simultáneas de x y px , como hemos visto, [x, px ] = i~, por lo que la cota por abajo en la especificación
simultánea de estos dos observables complementarios es 12 ~. El principio de indeterminación puede ser aplicado

a cualquier par de observables complementarios.

4.4. La indeterminación en la energı́a y el tiempo


Finalmente, en este punto es apropiado hacer algunas observaciones sobre la llamada relación de indeter-
minación energı́a-tiempo, la que es comunmente expresada en la forma ∆E∆t ≥ ~ e interpretadas como la
implicancia de una complementariedad entre la energı́a y el tiempo. Como hemos visto, para que esta relación
sea una real relación de indeterminación, serı́a necesario que hubiera un conmutador distinto de cero para la
energı́a y el tiempo. Sin embargo, aunque el operador energı́a está bien definido (corresponde al hamiltoniano
del sistema), no existe ningún operador para el tiempo en la mecánica cuántica. El tiempo es un parámetro, no
un observable. Por lo tanto, estrictamente hablando, no existe una relación de indeterminación entre la energı́a y

18
el tiempo. El real significado del “principio de indeterminación” de la energı́a y el tiempo es que es una relación
entre la indeterminación en la energı́a de un sistema que tiene un tiempo de vida finito τ , que es de la forma
δE ∼ ~
2τ .

4.5. La evolución temporal y las leyes de conservación


Tanto como la determinación de cuáles operadores son complementarios, el conmutador de dos operadores
también juega un rol en la determinación de la evolución temporal de los sistemas, y en particular, en la
evolución de los valores de expectación de observables. La relación precisa para operadores que no tienen una
∂Ω
dependencia explı́cita en el tiempo (en el sentido que ∂t = 0) es

d hΩi i
= h[H, Ω]i . (79)
dt ~

Vemos que si el operador para el observable conmuta con el hamiltoniano, luego, el valor de expectación del
operador no cambia con el tiempo. Un observable que conmuta con el hamiltoniano del sistema, y que por lo
tanto tiene un valor de expectación que cambia con el tiempo, es llamado una constante del movimiento, y
su valor de expectación se dice conservado.

Prueba: Diferenciación de hΩi con respecto al tiempo no da

∂Ψ∗
Z    
d hΩi
Z
d ∂Ψ
= hΨ| Ω |Ψi = ΩΨdτ + Ψ∗ Ω dτ , (80)
dt dt ∂t ∂t

ya que solo el estado Ψ depende del tiempo. La ecuación de Schrödinger nos permite escribir

∂Ψ∗
Z   Z    Z
1 1
ΩΨdτ = − (HΨ)∗ ΩΨdτ = − Ψ∗ HΩΨdτ (81)
∂t i~ i~
Z   Z    Z
∂Ψ 1 1
Ψ∗ Ω dτ = Ψ∗ Ω HΨdτ = Ψ∗ ΩHΨdτ . (82)
∂t i~ i~

En la primera lı́nea hemos usado la hermiticidad del hamiltoniano. Se sigue luego, combinando estas dos expre-
siones, que   
d hΩi 1 i
=− hHΩi − hΩHi = h[H, Ω]i , (83)
dt i~ ~
tal lo que querı́amos probar. 

Como ejemplo importante, consideremos la tasa de cambio del valor de expectación del momentum linear de
una partı́cula en un sistema unidimensional. El conmutador de H y px es

~2 d 2
   
~ d ~ d
[H, px ] = − + V, = V, , (84)
2m dx2 i dx i dx

ya que las derivadas conmutan. El conmutador resultante puede ser evaluado con una función de prueba arbi-
traria Ψ    
~ dΨ d(V Ψ) ~ dΨ dΨ dV ~ dV
[H, px ]Ψ = V − = V −V − Ψ =− Ψ, (85)
i dx dx i dx dx dx i dx

19
luego,
~ dV
[H, px ] = − . (86)
i dx
Se sigue que el momentum lineal es una constante del movimiento si la energı́a potencial no varı́a con la posición.
De forma especı́fica, podemos concluir que la tasa de cambio del valor de expectación del momentum lineal es

d i dV
hpx i = h[H, px ]i = − h i . (87)
dt ~ dx

Esto es, la tasa de cambio del valor de expectación del momentum lineal es igual al valor de expectación de la
fuerza. Es también bastante fácil probar que de la misma forma que

d hpx i
hxi = , (88)
dt m

lo que muestra que la tasa de cambio de la posición media puede ser identificada con la velocidad media a
lo largo del eje x. Estas dos relaciones conjuntamente constituyen el teorema de Ehrenfest. El teorema de
Ehrenfest clarifica la relación entre la mecánica clásica y la mecánica cuántica; la mecánica clásica trata con
valores promedios (valores de expectación); la mecánica cuántica trata con los detalles subyacentes.

5. Matrices en mecánica cuántica


La relación de conmutación fundamental en mecánica cuántica, [x, px ] = i~, implica que x y px sean trata-
dos como operadores. Sin embargo, existen una interpretación alternativa: que x y px sean representados por
matrices, puesto que la multiplicación matricial también es conmutativa.

5.1. Elementos matriciales


Una matriz, M es un arreglo de números complejos, llamados elementos matriciales. Cada elemento está
especificado al llamar la fila (r) y la columna (c) que este ocupa, y se denota como Mrc .
La operación de multiplicación matricial se define como; el producto de dos matrices M y N resulta en una
nueva matriz P = MN cuyos elementos están dados por
X
Prc = Mrs Nsc . (89)
s

Heisenberg formuló su propia versión de la mecánica cuántica, llamada mecánica matricial, al representar la
posición y el momentum lineal por las matrices x y requiriendo que [x, px ] = i~1, con 1 la matriz identidad.
Las cantidades hm| Ω |ni son comunmente abreviadas como Ωmn , sugiriendo que estos corresponden a los ele-
mentos de una matriz definida por el operador Ω.

Usualmente nos encontraremos en los cálculos con sumas sobre productos de paréntesis de Dirac, de la forma
X
hr| A |si hs| B |ci . (90)
s

20
Si estos paréntesis son interpretados como elementos matriciales, podemos reescribirlos como
X X
hr| A |si hs| B |ci = Ars Bsc = (AB)rc = hr| AB |ci . (91)
s s

Esto es, tal suma es igual al elemento matricial (o el paréntesis) del producto de operadores AB. Comparando
el primer con el último término de la relación anterior podemos definir la siguientes relación simbólica
X
|si hs| = 1 . (92)
s

Esta relación de completitud es muy útil al desarrollar las ecuaciones de la mecánia cuántica.

Ejemplo: Use la relación de completitud para probar que los autovalores del cuadrado de un operador hermı́tico
son no-negativos.
Tenemos que mostrar que Ω2 |ωi = ω |ωi con ω ≥ 0 siempre que Ω sea hermı́tico. Si multiplicamos la ecuación
de autovalores por hω|
hω| Ω2 |ωi = ω hω|ωi = ω , (93)

tenemos que la prueba requiere que mostremos que el valor de expectación de la izquierda es no-negativo.

hω| Ω2 |ωi = hω| Ω Ω |ωi


= hω| Ω 1 Ω |ωi
X 
= hω| Ω |si hs| Ω |ωi
s
X
= hω| Ω |si hs| Ω |ωi
s

X
= hω| Ω |si hω| Ω |si
s
X 2
= |hω| Ω |si| ≥ 0 .
s

La desigualdad final sigue del hecho de que todos los términos en la sumas son no-negativos. 

El origen de la relación de completitud puede ser demostrado con el siguiente argumento. Supongamos que
tenemos un conjunto completo de estados ortonormales |si i. Luego, por definición de completitud, podemos
P
expandir un estado arbitrario |Ψi como una combinación lineal |Ψi = i ci |si i. La multiplicación por la
izquierda por hsj | y el uso de la ortonormalidad de la base de estados completa nos da cj = hsj |Ψi. Luego
X X
|Ψi = hsi |Ψi |si i = |si i hsi |Ψi (94)
i i

lo que inmediatamente implica la relación de completitud.

21
Clase 4
Diagonalización del hamiltoniano

Partı́cula en la caja

El oscilador armónico

5.2. Diagonalización del hamiltoniano


La ecuación de Schrödinger independiente del tiempo, Hψ = Eψ, puede ser escrita según la interpretación
matricial. Primero, expresamos ψ como una combinación lineal de un set completo de estados |ni:
X X
H |ψi = H cn |ni = cn H |ni ,
n n
X
E |ψi = E cn |ni .
n

Multiplicamos por la izquierda por una estado arbitrario hm| y usamos la ortonormalidad de los estados para
obtener
X X
cn hm| H |ni = E cn hm|ni = Ecm .
n n

En notación matricial esta ecuación serı́a


X
Hmn cn = Ecm .
n

Supongamos ahora que hemos encontrado un conjunto de estados tales que Hmn = δmn ; esto es, cuando usamos
este set, el hamiltoniano tiene una matriz diagonal. Luego, la expresión anterior tiene la forma

Hmm cm = Ecm ,

y la energı́a E se entiende como el elemento diagonal de la matriz hamiltoniana. En otras palabras, resolver la
ecuación de Schrödinger es equivalente a diagonalizar la matriz hamiltoniana. Esto nos entrega otra relación
entre las formulaciones de la mecanica cuántica de Schrödinger y Heisenberg.

22
6. Partı́cula en la caja
Consideremos el caso de una partı́cula confinada por paredes en una región del espacio. Las paredes están
representadas por un potencial que es cero dentro de la caja, pero que se crece abruptamente a infinito en los
bordes. Este sistema es llamado un potencial cuadrado infinito o partı́cula en la caja. Dado que la partı́cula
está confinada, la energı́a está cuantizada, y las condiciones de borde determinan las energı́as permitidas.

6.1. Caso unidimensional: soluciones


El hamiltoniano del sistema es
~2 d 2
H=− + V (x) ,
2m dx2
con V (x) = 0 para 0 ≤ x ≤ L, pero infinito de otra forma (ver Fig. 2).

Figura 2: Potencial de pozo cuadrado infinito caracterı́stico para una partı́cula en la caja.

Ya que energı́a potencial de una partı́cula que toca las paredes es infinito, la partı́cula no puede traspasarlas
(repasar potencial infinito). Se sigue que el hamiltoniano para la región donde el potencial es finito, y por lo
tanto, la única región donde la función de onda es no-nula, es

~2 d2
H=− .
2m dx2

Esta expresión es la misma que el hamiltoniano para le movimiento traslacional libre (repasar), que tiene como
solución general a la ecuación de Schrödinger

~2 d2 ψ
− = Eψ ,
2m dx2

la función de onda
 1/2
ikx −ikx 2mE
ψ = Ã0 e + B̃0 e = A0 cos (kx) + B0 sin (kx) , con k = ,
~2

23
donde A0 = Ã0 + B̃0 y B0 = i(Ã0 − B̃0 ). La gran diferencia entre ambos casos son las condiciones de borde,
que terminarán eliminando la mayorı́as de las posibles soluciones.
Sabemos que las funciones de onda son cero fuera de la caja, con x < 0 o x > L. Las funciones de onda deben
ser continuas en todo punto, por lo tanto, las soluciones deben ser cero en las paredes, en x = 0 y x = L. Las
condiciones de borde son por lo tanto ψ(0) = 0 y ψ(L) = 0. Ahora aplicamos cada condición para obtener una
solución general. Primero, en x = 0 ,

ψ(0) = A0 cos 0 + B0 sin 0 = A0 = 0 .

Para x = L, luego de haber fijado A0 = 0,

ψ(L) = B0 sin (kL) = 0 .

Hay dos formas de satisfacer la segunda condición, la primera, B0 = 0, no nos sirve pues anula la función de onda
en todos lados. La segunda, kL = nπ con n = 1, 2, .... El valor n = 0 se excluye dado que anuları́a la función de
onda para todo x, y la partı́cula no ser encontrarı́a en ninguna parte. El entero n es un ejemplo de un número
cuántico, un número que etiqueta el estado de un sistema y que, mediante el uso de una fórmula apropiada,
puede ser usado para calcular el valor de un observable del sistema. Por ejemplo, ya que E = k 2 ~2 /2m, se sigue
que la energı́a está relacionada con n por

n 2 ~2 π 2 n2 h2
En = = , n = 1, 2, ...
2mL2 8mL2

La mayor conclusión de este cálculo en este punto es que la energı́a de la partı́cula está cuantizada; esto es,
confinada a una serie de valores discretos. Hasta ahora solo queda una constante B0 que determinar antes de
que la solución esté completa. La probabilidad de encontrar la partı́cula en alguna parte dentro de la caja debe
ser igual a 1, por lo tanto, la integral de ψ 2 sobre la región entre x = 0 y x = L debe ser igua a 1,
Z L Z L     
∗ 2 2 nπx 2 x L 2nπx x=L 1
ψ ψdx = B0 sin dx = B0 − sin |x=0 = LB0 2
0 0 L 2 4πn L 2
p
luego B0 = 2/L. La solución completa es
r
n2 h2
 
2 nπx
ψn (x) = sin , En = , con n = 1, 2, ...
L L 8mL2

Vemos que existe un único número cuántico, n, que determina las funciones de onda y las energı́as.

24
La Figura 3 muestra algunas de las primeras soluciones y la Figura 4 muestra los cuadrados de las funciones
de onda, la densidad de probabilidad de encontrar la partı́cula en cada posición. Notemos como la partı́cula
parece evitar las paredes en los estados de más baja energı́a, pero la distribución se vuelve más uniforme a
medida que n aumenta. La distribución en altos valores de n corresponde a los esperado clásicamente, que las
partı́culas estarı́an, en promedio, la misma cantidad de tiempo en todas las posiciones producto de los rebotes
con las paredes. Este comportamiento es un ejemplo del principio de correspondencia, que establece que la
mecánica clásica debe emerger de la mecánica cuántica en valores altos de los número cuánticos.

Figura 3: Los primeros seis niveles de energı́a y las correspondientes funciones de onda para una partı́cula en
una caja. Notemos que los niveles están más separados a medida que la energı́a aumenta; la amplitud máxima
de las funciones de onda es la misma en todos los casos.

Figura 4: La probabilidad de distribución de la partı́cula en la caja. Note que la distribución se vuelve uniforme
a medida que la energı́a aumenta.

Un punto donde una función de onda pasa por un cero (no simplemente que tienda a cero) es llamado nodo.
Vemos en la Figura 2 que el estado de más baja energı́a no tiene nodos, y que el número de nodos aumenta a
medida que n aumenta; en general, el número de nodos es n − 1. Es una caracterı́stica común de las funciones
de onda que mientras más alto el número de nodos, más alta la energı́a.

25
6.2. Propiedades de las soluciones
La más baja energı́a que la partı́cula puede tener corresponde al estado con n = 1, y su valor es E1 = h2 /8mL2 .
Esta energı́a irremovible es llamada la energı́a de punto cero. Es una propiedad puramente cuántica, y en
un universo hipotético, en el que h = 0, no existirı́a energı́a de punto cero.

La energı́a de separación de los estados vecinos decrece a medida que las pareces se alejan entre ellas y le dan
más libertad a la partı́cula:

h2 h2
   
2 2
En+1 − En = (n + 1) − n = 2n + 1 .
8mL2 8mL2

A medida que el largo de la caja se aproxima a infinito (lo que corresponde a una caja de dimensiones ma-
croscópicas), la separación de los niveles vecinos se acerca a cero, y los efectos de la cuantización se vuelven
completamente despreciables. En efecto, la partı́cula se vuelve libre. Los mismo es cierto cuando la masa, m,
se vuelve muy grande. Consecuentemente, la mecánica clásica puede ser usada para describir el movimiento
traslacional de objetos macroscópicos.

6.3. Pozo potencial bidimensional


Nuevas e interesantes propiedades surgen cuando consideramos una partı́cula confinada a un superficie plana
rectangular con dimensiones lineales L1 en la dirección x y L2 en la dirección y, ver Fig. 5. Tal como en el caso
unidimensional, donde la funciones de onda se pueden pensar como aquellas vibraciones de una cuerda con sus
extremos fijos, en dos dimensiones podemos esperar que estas correspondan a las vibraciones de una manta con
sus cuatro bordes sujetos.

Figura 5: Energı́a potencial de una partı́cula en pozo potencial bidimensional.

26
El hamiltoniano para el pozo potencial infinito dos-dimensional, en el interior del pozo (la única región donde
la partı́cula puede ser hallada, y donde la energı́a potencial es cero) es

~2
 2
∂2


H=− + 2 .
2m ∂x2 ∂y

La ecuación de Schrödinger para la partı́cula dentro de las paredes entonces queda

∂2ψ ∂2ψ 2mE


2
+ 2
=− 2 ψ .
∂x ∂y ~

Las condiciones de borde son que la función de onda debe anularse en las cuatro paredes.

Para resolver esta ecuación en dos variables, usamos el método de separación de variables, con el ansatz ψ(x, y) =
X(x)Y (y). La ecuación de Schrödinger queda

∂2X ∂2Y 2mE


Y 2
+ X 2 = − 2 XY .
∂x ∂y ~

Luego, dividiendo por ψ = XY


1 ∂2X 1 ∂2Y 2mE
2
+ 2
=− 2 .
X ∂x Y ∂y ~
Lo que nos lleva de forma obligada que la ecuación original deba ser separada en las siguientes dos ecuaciones

∂2X 2mEX ∂2Y 2mEY


=− X , =− Y ,
∂x2 ~2 ∂y 2 ~2

donde EX + EY = E. Ambas ecuaciones tienen la misma forma de la ecuación del sistema unidimensional, y
las condiciones de borde son las mismas. Por lo tanto, podemos escribir las soluciones inmediatamente (usando
ψ = XY ):
   
2 n1 πx n2 πy
ψn1 n2 (x, y) = p sin sin
Lx Ly L1 L2
2
 2 2

h n1 n
En1 n2 = + 22 , con n1 = 1, 2, .. n2 = 1, 2...
8m L21 L2

Notemos que para definir los estados de una partı́cula en un sistema dos-dimensional necesitamos especificar
los valores de dos número cuánticos; n1 y n2 pueden tomar cualquier valor entero en su rango de forma inde-
pendiente.

Muchas de las propiedades de sistema unidimensional son reproducidas en dimensiones más altas. Existe una
energı́a de punto cero (E1,1 ), y la separación de las energı́as decrece a medida que las paredes se separan entre
ellas y el sistema está menos confinado. La energı́a está cuantizada como consecuencia de las condiciones de
borde. La forma de algunas de las funciones de onda de más baja energı́a están ilustradas en la Fig. 6 y sus
correspondientes densidades de probabilidad se muestran en la Fig. 7. Tal como en el caso unidimensional, la
partı́cula se distribuye de forma más uniforme a mayores energı́as.

27
Figura 6: Tres funciones de onda para una partı́cula en potencial bidimensional: (a) n1 = 1, n2 = 1 (b) n1 = 2,
n2 = 1 y (c) n1 = 2, n2 = 2.

Figura 7: Tres distribución de probabilidades para una partı́cula en potencial bidimensional: (a) n1 = 1, n2 = 1
(b) n1 = 2, n2 = 1 y (c) n1 = 2, n2 = 2 (como en la Figura 4).

28
6.4. Degeneración
Una caracterı́stica presente en dos o más dimensiones aparece cuando la caja es cuadrada; L1 = L2 = L, y las
energı́as quedan dadas como
h2
En1 n2 = (n2 + n22 ) .
8mL2 1
Esta expresión implica que un estado con número cuántico n1 = a y n2 = b (que podemos denotar como |a, bi)
tiene exactamente la misma energı́a que uno con números cuánticos n1 = b y n2 = a (el estado |b, ai), incluso
cuando a 6= b. Este es un ejemplo de la degeneracion de estados mencionada en la primera sección del curso.
Por ejemplo, los dos estados |1, 2i y |2, 1i tienen la misma energı́a 5h2 /8mL2 pero sus funciones de onda son
diferentes        
2 πx 2πy 2 2πx πy
ψ1,2 (x, y) = sin sin , ψ2,1 (x, y) = sin sin .
L L L L L L
La Figura 8 nos muestra el origen de esta degeneración: una función de ondas puede ser transformada en la otra
mediante una rotación de la caja en 90◦ . Siempre debemos esperar la presencia de degeneración en sistemas que
tienen un alto grado de simetrı́a.
En el caso de una caja rectagular, no cuadrada, la simetrı́a y la degeneración se pierden. Sin embargo, algunas
veces la degeneración se encuentra incluso cuando no existe una rotación que transforme una función de onda en
otra; esto se llama una degeneración accidental. En ciertos casos, la degeneración accidental ocurre cuando
la simetrı́a completa del sistema aún no se ha reconocido, y un análisis más profundo del sistema mostrarı́a
la presencia de una simetrı́a escondida que relaciona a las funciones degeneradas. Puede ser el caso de que
todas las degeneraciones accidentales puedan ser relacionadas con la existencia de una simetrı́a escondida. Una
degeneración accidental ocurre en el átomo de hidrógeno.

Figura 8: Representación de contorno de dos estados degenerados (a) n1 = 2, n2 = 1 y (b) n1 = 1, n2 = 2


para una partı́cula en un pozo potencial cuadrado. Notemos que una función de onda está rotada por una
transformación de simetrı́a de la caja (su rotación en 90◦ alrededor del eje vertical).

29
7. El oscilador armónico
Este caso es uno de los temas más importantes en la mecánica cuántica. Las oscilaciones armónicas ocurren
cuando un sistema contiene una parte que experimenta una fuerza restauradora proporcional al desplazamiento
desde el equilibrio. Los péndulos y el movimiento vibracional de las cuerdas son ejemplos familiares. Un ejemplo
importante en quı́mica es la vibración de los átomos en una molécula. Otro ejemplo es el campo electromagnético,
que puede ser tratado como un conjunto de osciladores armónicos, uno por cada frecuencia de radiación presente.
La importancia del oscilador armónico también recae en que la misma álgebra aparece en una amplia variedad
de problemas; por ejemplo, también aparece en el tratamiento del movimiento rotacional.
La fuerza restauradora en un oscilador armónico unidimensional es dado por la ley de Hooke como F = −kx,
donde la constante de proporcionalidad k es llamada la constante de fuerza o constante del resorte. Un resorte
rı́gido tiene una constante de fuerza grande; un resorte débil tiene una k pequeña. Dado que la fuerza actuando
sobre una partı́cula corresponde al gradiente negativo de la energı́a potencial (F = −dV /dx), se sigue que la
energı́a potencial del oscilador varı́a con el desplazamiento x desde el equilibrio como

1 2
V (x) = kx ,
2

y un gráfico de la energı́a potencial versus el desplazamiento es una parábola. La diferencia entre este potencial
y el pozo potencial cuadrado es la rapidez con la que estos suben hasta infinito; las “paredes” de un oscilador
son mucho más suaves, y por eso podemos esperar que sus funciones de onda las traspasen levemente. En
otros aspectos ambos potenciales tienen ciertas similitudes y podemos imaginar la suave deformación de un
potencial a otro, tal como sus funciones de onda: estas deben tener la misma forma general, pero entrará en
desplazamientos clásicamente prohibidos.
Otro punto acerca del oscilador armónico es que es mucho más simple. Su simplicidad surge de las simetrı́as del
momentum y el desplazamiento en la expresión de la energı́a total. Clásicamente, la energı́a es E = p2 /2m+kx2 /2
, y tanto p y x aparecen al cuadrado. Esta simetrı́a escondida tiene importantes implicancias, una de las cuales
involucra principio de indeterminacion; en el estado base del oscilador armónico tenemos que ∆p∆x = ~/2.

7.1. Solución por factorización


Dado que la energı́a potencial es V = 21 kx2 , el operador hamiltoniano para el oscilador armónico de masa m y
constante de fuerza k es
~2 d2 1
H=− 2
+ kx2 .
2m dx 2
Luego, la ecuación de Schrödinger es
~2 d2 ψ 1 2
− + kx ψ = Eψ . (95)
2m dx2 2
La mejor forma de resolver esta ecuación -un método que también funciona para el movimiento rotacional y el
átomo de hidrógeno- consiste en encontrar una forma de factorizar el hamiltoniano e introducir los conceptos
de “operadores de creación y destrucción”. La solución convencional involucra expresar las soluciones como
polinomios en los desplazamientos.

La Ec. (95) se simplifica enormemente si hacemos la sustitución


 1/2  1/2
2E mω k
λ= , y= x, ω= . (96)
~ω ~ m

30
La ecuación de Schrödinger queda
d2
 
2
− y ψ = −λψ .
dy 2
El lado izquierdo de esta ecuación se factoriza si notamos que
    2 
d d d 2
+y −y ψ = −y −1 ψ ,
dy dy dy 2
    2 
d d d 2
−y +y ψ = −y +1 ψ .
dy dy dy 2

Ahora introducimos los siguientes operadores


   
1 d + 1 d
a= √ y+ , a = √ y− ,
2 dy 2 dy

de tal forma que los operadores a y a+ son pares de operadores hermı́ticos conjugados (operadores que satisfacen

ha| A |bi = hb| B |ai ).
Luego, dado que los resultados anteriores pueden ser expresados como

d2
 
2
− y ψ = −(2aa+ − 1)ψ = −(2a+ a + 1)ψ ,
dy 2

la ecuación de Schrödinger puede ser escrita de las siguientes formas:

1
aa+ ψλ = (λ + 1)ψλ
2
1
a+ aψλ = (λ − 1)ψλ , (97)
2

donde ψλ es la función de onda correspondiente a la energı́a equivalente a λ.


Se sigue que
(aa+ − a+ a)ψλ = ψλ .

Esta ecuación es válida para cualquier valor de λ, de forma que se puede expresar como una identidad para los
operadores
[a, a+ ] = 1 . (98)

Veamos ahora qué podemos desarrollar de la relación de conmutación anterior.


De la Ec. (97) multiplicada por la izquierda por a, tenemos

1
aa+ aψλ = (λ − 1)aψλ .
2

Con el uso de la relación de conmutación entre a+ y a, la siguiente ecuación queda

a+ aaψλ = (aa+ − 1)aψλ = aa+ aψλ − aψλ = a(a+ aψλ ) − aψλ


     
1 1 1
= a (λ − 1)ψλ −aψλ = (λ − 1)aψλ −aψλ = (λ − 1) − 1 ψλ
2 2 2
1
= (λ − 3)aψλ .
2

31
Sin embargo, se sigue de (97) que la ecuación de Schrödinger para el estado de energı́a equivalente a λ − 2 es

1
a+ aψλ−2 = (λ − 3)ψλ−2 .
2

Luego, por comparación de las dos últimas ecuaciones,

aψλ ∝ ψλ−2 .

Esta proporcionalidad es válida solo para estados no-degenerados; pero, por simetrı́a, todos los estados de un os-
cilador uni-dimensional son no-degenerados. Concluimos que las funciones de onda correspondientes a la energı́a
λ − 2 es generada a partir de la función de onda correspondiente a la energı́a λ al operar con a. Este proceso
puede continuar, y las funciones de onda correspondientes a las energı́as λ − 4, λ − 6, ... pueden ser construidas
de forma similar. De la misma forma, es directo mostrar que sucesivas operaciones con a+ sobre la función de
onda ψλ genera las funciones de onda correspondientes a λ + 2, λ + 4, .... El hecho que a “baje” las funciones de
onda en una escalera de niveles de energı́a da origen a su nombre, el operador aniquilación. Similarmente,
a+ es llamado operador creación.

La generación de estados de más baja energı́a producto de la aplicación repetida del a no puede ser continuada
indefinidamente dado que la energı́a del oscilador armónico es no-negativa (corresponde al autovalor de un
hamiltoniano que es la suma de cuadrados de dos operadores hermı́ticos). Por lo tanto, debe existir un valor
mı́nimode λ, que llamaremos λmin . Dado que no existe una función de onda correspondiente a una energı́a más
baja, se siguie que aψλmin = 0. Si ambos lados de esta ecuación son operados con a+ , obtenemos a+ aψλmin = 0.
Luego, usando (97), esta expresión queda

1
0 = a+ aψλmin = (λmin − 1)ψλmin .
2

Consecuentemente, λmin = 1, y los valores permitidos de λ serı́an 1, 3, 5, ..., o λ = 2v + 1, con v ∈ N =


{0, 1, 2, 3, ...}.
Concluimos que los niveles de energı́a permitidos son
 
~ω 1
E = (2v + 1) = v+ ~ω ,
2 2

con v ∈ N.
La función de onda para un estado de valor de energı́a cualquiera puede ser encontrada aplicando a+ el número
apropiado de veces a la función de onda correspondiente a v = 0 (esto es, λ = 1). Desde ahora, etiquetaremos
las funciones con v en lugar de λ. Se sigue que necesitamos determinar la forma de ψ0 . Dado que sabemos que
aψ0 = 0, entonces  
1 d
√ + y ψ0 = 0 .
2 dy
La ecuación diferencial de primer order se puede reescribir como

dψ0
= −ydy ,
ψ0

y su solución es
2
ψ0 = N0 e−y /2
,

32

con N0 una constante de normalización. Aplicaciones sucesivas de a+ = 1/ 2(y − d/dy) (con las constantes de
proporcionalidad absorbidas por las constantes de normalización) nos entregan
√ 2
ψ1 = a+ ψ0 = 2N0 ye−y /2

2
ψ2 = a+ ψ1 = N0 (2y 2 − 1)e−y /2
√ 2
ψ3 = a+ ψ2 = 2N0 (2y 3 − 3y)e−y /2
..
.

o bien

2
ψ1 = N1 ye−y /2

2
ψ2 = N2 (4y 2 − 2)e−y /2

2
ψ3 = N3 (8y 3 − 12y)e−y /2

..
.

y como sigue. Cada función de onda tiene la forma de una función gaussiana multiplicada por un polinomio de
Hermite, como demostraremos explı́citamente en la siguiente sección.

7.2. La solución estándar


Recordemos que la ecuación de Schrödinger para el oscilador armónico es

d2 ψ
− y 2 ψ = −λψ ,
dy 2

con las convenciones definidas en Ec. (96). La forma más común de resolver este tipo de ecuaciones es primero
establecer una solución para y → ∞. En tal lı́mite, el término en y 2 domina por sobre el término con factor λ,
por lo que la forma asintótica de la ecuación es

d2 ψ
− y2 ψ ' 0 ,
dy 2

donde ' significa “asintóticamente igual a ” en el lı́mite de una variable (en este caso y) tomando valores
infinitamente grandes. Las soluciones tienen la forma

2
ψ± ' e±y /2
,

como se puede verificar al insertarla en la ecuación

d2 ψ 2 2
− y 2 ψ ' (±)2 y 2 e±y /2 − y 2 e±y /2 ' 0 .
dy 2

La solución ψ+ no es cuadrado-integrable, por lo que la descartamos y nos quedamos con ψ ' ψ− .


El siguiente paso es postular un ansatz para la función completa a partir de la solución asintótica ψ− , de la

33
forma
2
ψ = f (y)ψ− = f (y)e−y /2
, (99)

con f (y) un polinomio en y.


Sustituyendo nuestro ansatz en la ecuación de Schrödinger, tenemos

d2 ψ d2
 
2 2
− y ψ = f (y)ψ − −y f (y)ψ−
dy 2 dy 2
d2
 
2 2
= 2 f (y)e−y /2 −y 2 f (y)e−y /2
dy
2 2
= (f 00 − 2yf 0 + y 2 f − f )e−y /2
− y 2 f e−y /2

2
= (f 00 − 2yf 0 − f )e−y /2

= −λψ
2
= −λf e−y /2
,

o bien
2 2
(f 00 − 2yf 0 − f )e−y /2
= −λf e−y /2
.

Esto es, la ecuación a resolver se transforma en

f 00 − 2yf 0 + (λ − 1)f = 0 . (100)

Para asegurarnos que la función de onda ψ en Ec. (99) sea cuadrado-integrable, el polinomio f no puede ir
2
a infinito más rápidamente que ey /2 , de otra forma la función de onda se volverı́a infinita cuando |y| → ∞.
Ahora, sustituyendo la forma polinomial f = n an y n en Ec. (100), tenemos la ecuación
P

X  
n−2 n n
an n(n − 1)y − 2ny + (λ − 1)y = 0 .
n

Del lado izquierdo vemos que coeficientes de y m (para n = m + 2 en el primer término y n = m en los dos
últimos) es
(m + 1)(m + 2)am+2 + (λ − 2m − 1)am .

Entonces, para que la suma se anule para cualquier valor de y, este coeficiente debe ser cero para todos los
valores de m. Se sigue que  
2n − λ + 1
an+2 = an . (101)
(n + 1)(n + 2)
Esta expresión es una fórmula recursiva para los coeficientes, ya que permite a todos los an con n par ser
expresados en términos de a0 , y a todos los an con n impar ser expresados en términos de a1 . Notemos que esto
implica que todas las potencias de y que aparecen en f son bien pares o impares, no una mezcla (consideraciones
de simetrı́as también requerirı́an la misma conclusión).

Para que f sea un polinomio y no una serie infinita, los coeficientes se deben anular luego de cierto valor de n,
al que llamaremos v. Según Ec. (101), el término de la serie se garantiza si λ = 2v + 1. Se sigue, de Ec. (96),

34
Tabla I: Polinomios de Hermite
v Hv (z)
0 1
1 2z
2 4z 2 − 2
3 8z 3 − 12z
4 16z 4 − 48z 2 + 12
5 32z 5 − 160z 3 + 120z
6 64z 6 − 480z 4 + 720z 2 − 120
7 128z 7 − 1344z 5 + 3360z 3 − 1680z
8 256z 8 − 3584z 6 + 13440z 4 − 13440z 2 + 1680

que los valores permitidos de energı́a son


   
~ω ~ω 1
E=λ = (2v + 1) = v+ ~ω , (102)
2 2 2

con v ∈ Z (mismo resultado de la sección anterior).

La relación recursiva nos permite escribir el polinomio para cualquier valor de v y este procedimiento desarrolla
los polinomios en la Tabla I, polinomio conocidos como polinomios de Hermite, Hv (z).

La siguiente definición de los polinomios de Hermite es a veces más útil que su definición en términos de la
relación recursiva:
2 dv −y2
Hv (y) = (−1)v ey e . (103)
dy v

7.3. Energı́a del oscilador armónico


La energı́a de un oscilador armónico está cuantizada (como es de esperarse de la forma del potencial) y limitada
a los valores  1/2
1 k
Ev = (v + )~ω , donde ω = , v = 0, 1, 2, ...
2 m
Estos niveles de energı́a están ilustrados en la Fig. 9. Las funciones de onda ya no son las simples funciones tri-
gonométricas del potencial cuadrado, pero muestran cierta similitud. Estas pueden ser pensadas como funciones
onda sinusoidales que colapsan a cero para desplazamientos grandes (Fig. 10).
2
Su forma precisa es la de una función gaussiana con forma de campana, de la forma e−x , multiplicada por un
polinomio de Hermite en el desplazamiento:
   1/2
2
x2 /2 mk α
ψv (x) = Nv Hv (αx)e−α , α= , Nv = √ .
~2 v
2 v! π

El parámetro α tiene dimensiones de L−1 . Dado que H0 (z) = 1, las funciones de onda para el estado con v = 0
2 2
es proporcional a la función gaussiana e−α c /2
:
 1/2
α 2
x2 /2
ψ0 (x) = √ e−α .
π

35
Figura 9: Energı́a potencial parabólica caracterı́stica de un oscilador armónico y la escalera equiespaciada de
energı́as permitidas (que continúa hasta infinito).

Figura 10: Funciones de onda de un oscilador armónico para (a) v = 0, 2, 4, (b) v = 1, 3. Notemos que el número
de nodos aumenta con v, y que funciones con v par son simétricas mientras alrededor de x = 0 que funciones
con v impar son antisimétricas.

36
Cuando v = 1, como H1 (z) = 2z, la función de onda es la misma función gaussiana multiplicada por 2αx, con
un factor de normalización diferente:
1/2 1/2
2α3
 
α −α2 x2 /2 2
x2 /2
ψ1 (x) = √ 2αxe = √ xe−α .
2 π π

7.4. Propiedades de las soluciones


El punto más notable acerca de los niveles de energı́a es que estos forman una escalera equiespaciada. La
diferencia de energı́a entre vecinos es r
k
Ev+1 − Ev = ~ω = ~ , (104)
m
independiente del valor de v. El equiespaciado en los niveles de energı́a es otra consecuencia de la simetrı́a
escondida de x2 , p2 del oscilador armónico. A medida que la constante de fuerza k aumenta, aumenta la
separación entre niveles de energı́a vecinos. Si k disminuye o aumenta la masa, ω disminuye y la separación
entre vecinos también disminuye. En el lı́mite de constante de fuerza nula, la energı́a potencial parabólica falla
al confinar a la partı́cula (lo que corresponde a un resorte infinitamente débil) y la energı́a puede varı́ar de forma
contı́nua. No existe cuantización en este lı́mite de partı́cula libre y sin restricciones.
Un oscilador armónico tiene una energı́a de punto cero de magnitud

1
E0 = .
2~ω

La interpretación clásica de tal resultado es que el oscilador nunca para de fluctuar alrededor de su posición
de equilibrio. La razón de la existencia de la energı́a de punto cero es la misma que para la partı́cula en la
caja: las funciones de onda deben ser cero para grandes desplazamientos en ambas direcciones (dado que la
energı́a potencial confina), distintas de cero entre las “paredes” (la partı́cula tiene que estar en alguna parte)
y contı́nuas (como todo función de onda). Estas condiciones pueden ser satisfechas solo si la función de onda
tiene curvatura; luego, el valor de expectación de la energı́a cinética del oscilar debe ser no-nulo en todos sus
estados.

7.5. El lı́mite clásico


La Fig. 10 muestra la forma de las funciones de onda del oscilador armónico y su la similaridad con las funciones
de onda del potencial cuadrado. La mayor diferencia entre estos casos es la penetración de las funciones de onda
del oscilador armónico en regiones clásicamente prohibidas, donde E < V . De la misma forma que para el
potencial cuadrado, las partı́culas se agrupan alejándose de las paredes, quedándose cerca de x = 0 (o en el
centro de la caja, para el potencial cuadrado) en sus estados de energı́a más bajas. Este es el comportamiento
que esperarı́amos de una partı́cula estacionaria clásica, dado que tal partı́cula se encontrarı́a con desplazamiento
cero y en ninguna otra parte. Cuando un oscilador se mueve, la predicción clásica es que la partı́cula tiene la
probabilidad más alta de ser encontrada en su desplazamiento máximo, los puntos de retorno de su trayectoria
clásica, donde es brevemente estacionaria. El comportamiento de un oscilador cuántico es bastante diferente
para niveles de energı́a bajos, pero ambas descripciones se vuelven cada vez más similares a medida que el
sistema pasa a niveles de energı́a más altos. De la Fig. 11 vemos que para valores altos de v, las funciones de
onda tienen su máximo dominante cerca a los puntos de retorno clásicos y se parece a la distribución clásica,
como espararı́amos del principio de correspondencia.

37
Figura 11: Comparación de la distrubución de probabilidad para un estado altamente excitado de un oscilador
armónico (v = 12) y para un oscilador clásico con la misma energı́a. Notemos cómo la primera comienza a
parecerse a la segunda.

38
8. Movimiento rotacional y el átomo de Hidrógeno
Consideraremos el movimiento de un objeto alrededor de un punto fijo que introducirá uno de los conceptos
más importantes de la mecánica cuántica, el “momentum angular”. Lo que desarrollaremos en esta sección
nos servirá para describir amplia variedad de fenómenos en cuántica y siempre que nos interese el movimiento
de una partı́cula en un potencial central, en el que la energı́a potencial dependa solo de la distancia a un
único punto. Un ejemplo de esto es el potencial central que siente un electrón en un átomo de hidrógeno. Este
problema se puede resolver de forma exacta y es lo que estudiaremos a continuación.

8.1. Movimiento en un campo de Coulomb


El movimiento de un electrón en un campo Coulombiano, en el que el potencial varı́a como 1/r, es de gran
importancia en la quı́mica ya que incluye la estructura de átomos hidrogenoides, átomos formados por un
núcleo, de número atómico Z arbitrario, y un único electrón. El movimiento del sistema puede reducirse al
movimiento de un electrón en una serie de esferas concéntricas (Fig. 12). Se sigue que las funciones de onda
pueden contener factores que correspondan al movimiento de una partı́cula en una esfera y de movimiento
radial.

Figura 12: El movimiento de una partı́cula en un campo de fuerza central como el movimiento sobre una pila
de esferas junto a la habilidad de saltar entre las esferas.

8.1.1. La ecuación de Schrödinger para átomos hidrogenoides

El hamiltoniano para el sistema de dos partı́culas electrón-núcleo es

~2 2 ~2 Ze2
H=− ∇e − ∇2N − , (105)
2me 2mN 4π0 r

donde me es la masa del electrón, mN es la masa del núcleo, 0 la permitividad del vacı́o, y ∇2e y ∇2N son
los operadores laplacianos que actúan sobre las coordenadas del electrón y del núcleo, respectivamente. Sin
considerar el término potencial Coulombiano, este hamiltoniano es equivalente al sistema de un rotor de dos
partı́culas. Si nos cambiamos a las coordenadas del centro de masa y de movimiento relativo, el término de
energı́a potencial, al depender solo de la separación de las partı́culas, permanece sin cambios. Luego, podemos
escribir
~2 2 ~2 2 Ze2
H=− ∇cm − ∇ − , (106)
2m 2µ 4π0 r

39
1 1 1
donde m = me + mN y µ = me + mN . La resultante ecuación de Schrödinger es separable, gracias a la
dependencia del potencial. Ası́, para el movimento relativo del electrón respecto del núcleo tenemos

~2 2 Ze2
− ∇ ψ− ψ = Eψ . (107)
2µ 4π0 r

La otra componente de la ecuación de Schrödinger es la para el movimiento traslacional del átomo como un
todo, que para este estudio no es relevante. A diferencia del caso de un rotor rı́gido, el electrón y el núcleo
no están restringidos a tener una distancia de separación fija. Luego, en coordenadas esféricas la ecuación de
Schrödinger queda como
1 ∂2 Ze2 µ
 
1 2 2µE
(rψ) + 2 Λ ψ + ψ=− ψ, (108)
r ∂r2 r 2π0 ~2 r ~2
donde Λ2 , el legendriano, corresponde a la parte angular del laplaciano y es dado por

1 ∂2 1 ∂
Λ2 = 2 ∂φ2 + sin θ ∂θ . (109)
sin θ

8.1.2. La separación de las coordenadas relativas

La ecuación de Schrödinger para el movimiento relativo es separable en sus componentes radiales y angulares,
siendo esta última la ecuación para la partı́cula en la esfera. Proponemos el ansatz

ψ(r, θ, φ) = R(r)Y (θ, φ) , (110)

con R la función de onda radial e Y , la función de onda angular. Cuando esta solución de prueba se
introduce en la ecuación de Schrödinger, y aplicando las apropiadas condiciones de borde periódicas, obtenemos
las ecuaciones

Λ2 Ylml = −l(l + 1)Ylml (111)


1 ∂2 Ze2 µ
   
l(l + 1) 2µE
rR − − R = . (112)
r ∂r2 2π0 ~2 r r2 ~2

con l = 0, 1, 2, ... el número cuántico de momentum angular y ml = l, l −1, ..., −l. En este punto escribimos
u = rR, y obtenemos
d2 u Ze2 l(l + 1)~2
    
2µ 2µE
+ − u = − u. (113)
dr2 ~2 4π0 r 2µr2 ~2
Esta es la ecuación de Schrödinger unidimensional en la coordenada r que se puede obtener si, en vez del
potencial de Coulomb usamos una energı́a potencial efectiva Veff

Ze2 l(l + 1)~2


Veff = − + . (114)
4π0 r 2µr2

8.1.3. La ecuación de radial de Schrödinger

La interpretación fı́sica de la energı́a potencial efectiva es simple. La primera parte corresponde a la energı́a
potencial atractiva de Coulomb. La segunda parte es una contribución repulsiva que corresponde a la existencia
de una fuerza centrı́fuga que impele al electrón hacia afuera del núcleo, debido a su movimiento. La magnitud del
p
momentum angular de la partı́cula será proporcional a l(l + 1). Cuando l = 0 el electrón no tiene momentum
angular orbital y la fuerza, ahora únicamente debido a Coulomb, es totalmente atractiva, ver Fig. 13. Cuando

40
Figura 13: Potencial efectivo que siente un electrón en un átomo de hidrógeno. Cuando l > 0 existe una contri-
bución centrı́fuga al potencial que previene del acercamiento del electrón al núcleo, al crecer más rápidamente
(como 1/r2 ) que la atracción de Coulomb (que varı́a como −1/r).

l > 0 el electrón posee un momentum angular orbital que tiende a arrojarlos lejos de la vecindad del núcleo, y
existe una competencia entre este efecto y la parte atractiva del potencial. A distancias pequeñas del núcleo,
la componente repulsiva tiende más fuertemente a infinito (como 1/r2 ) que la parte atractiva (que varı́a como
1/r), y la primera parte domina. Los dos potenciales efectivos (para l = 0 y l 6= 0) son cualitativamente bastante
diferentes cerca de r = 0, y deben ser analizados de forma separada.
Cuando l = 0, la parte repulsiva de la energı́a potencial efectiva está ausente y el potencial es en todas partes
atractivo, incluso cerca de r = 0. Cuando r está cercano a cero, la magnitud de la energı́a potencial es localmente
mucho mayor que E y esta última puede ser despreciada en Ec. (113), quedando

d2 u Ze2
  

+ u≈0, (115)
dr2 ~2 4π0 r

para l = 0 y r ≈ 0. Una solución para esta ecuación es

u ≈ Ar + Br2 + O(3) , (116)

como puede ser verificado por sustitución de la solución, tomando el lı́mite r → 0 y considerando la relación
B = −AµZe2 /4π0 ~2 . Luego, cerca de r = 0 la función de onda radial tiene la forma R = u/r ≈ A, que puede
ser distinta de cero; esto es, cuando l = 0, puede existir una probabilidad no nula de encontrar el electrón en el
núcleo.
Cuando l 6= 0, la componente repulsiva de la energı́a potencial efectiva del electrón a distancias cercanas al
núcleo es grande y tiene el efecto de excluı́rlo de esa región. En términos clásicos, a distancias cortas la fuerza
centrı́fuga sobre un electrón con momentum angular no nulo es lo suficientemente fuerte para superar la fuerza
atractiva de Coulomb. Cuando l 6= 0 y r se aproxima a cero, la Ec. (113) se vuelve

d2 u l(l + 1)
− u≈0, (117)
dr2 r2

41
ya que 1/r2 es el término dominante. La solución tiene la forma

B
u ≈ Arl+1 + , (118)
rl

para l 6= 0 y r ≈ 0, como puede ser verificado por sustitución. Ya que u = rR, en r = 0 sabemos que u = 0; se
sigue luego que B = 0. Luego, la función de onda radial tiene la forma

u
R= ≈ Arl , (119)
r

para l 6= 0 y r ≈ 0. Esta función implica que la amplitud es cero en r = 0 para todas las funciones de onda con
l 6= 0, y que el electrón descrito por tal función de onda no será encontrado en el núcleo. La función de onda
radial no tiene un nodo en r = 0, dado que un nodo se define como un punto donde la función pasa a través de
cero.

42
Soluciones explı́citas de la ecuación de onda radial en Ec. (113) pueden ser encontradas usando el método del
análisis asintótico, como en el caso estudiado del oscilador armónico. Las soluciones aceptables de esta ecuación
son las funciones asociadas de Laguerre. Algunas de las primeras funciones de onda hidrogenoides están
listadas en la Tabla II. Estas consisten de una función exponencial que decae multiplicada por un polinomio
simple en r. Cada una es especificada por las etiquetas n y l, con

n = 1, 2, ... l = 0, 1, ..., n − 1 . (120)

Tabla II : Funciones de onda radiales hidrogenoides


n l Orbital Rnl (r)
1 0 1s (Z/a)3/2 2e−ρ/2
2 0 2s (Z/a)3/2 (1/8)1/2 (2 − ρ)e−ρ/2
1 2p (Z/a)3/2 (1/24)1/2 ρe−ρ/2
3 0 3s (Z/a)3/2 (1/243)1/2 (6 − 6ρ + ρ2 )e−ρ/2
1 3p (Z/a)3/2 (1/486)1/2 (4 − ρ)ρe−ρ/2
2 3d (Z/a)3/2 (1/2430)1/2 ρ2 e−ρ/2
ρ = (2Z/na)r con a = 4π0 ~2 /µe2 . Para un núcleo infinitamente pesado, µ = me y a = a0 , el radio de Bohr.
 3 
(n−l−1)! 2l+1
Relación de las funciones asociadas de Laguerre: Rnl (r) = − 2Z ρl L (ρ)e−ρ/2 .
na 2n[(n+l)!]3 n+l

Algunas de las funciones de onda radiales están graficadas como funciones de ρ = 2Zr/na0 en la Fig. 14, donde
a0 es el radio de Bohr en términos de me :

4π0 ~2
a0 = , (121)
m e e2

con valor numérico de a0 ≈ 52,0 × 10−12 m.


Notemos que las funciones con l = 0 son no nulas (y finitas) en r = 0, mientras que todas las funciones con
l 6= 0 son cero en r = 0.
Cada función de onda radial tiene n − l − 1 nodos (la amplitud cero en r = 0 para funciones con l 6= 0 no son
nodos). La localización de estos nodos se encuentran al determinar donde los polinomios en la función asociada
de Laguerre son iguales a cero.
Introducir las funciones de onda radial en la Ec. (113) nos entrega la siguiente expresión de la energı́a
 2 4 
Z µe 1
En = − , (122)
32π 2 20 ~2 n2

con n = 1, 2, .... Los mismos valores se obtienen independientemente de los valores de l o ml . Luego, en áto-
mos hidrogenoides (pero no en cualquier otro tipo de átomos) la energı́a depende solo del número cuántico
principal n y es independiente de los valores de l y ml ; ası́, cada nivel, como se discutirá más adelante, es
degenerado n2 -fold (este siendo el número total de funciones de onda para cada n dado). Esta degeneración es
particular al potencial de Coulomb en un sistema no-relativista.

El rol de los números cuánticos en el átomo de hidrógeno puede ser resumido como sigue:

1. El número cuántico principal, n, especifica la energı́a a través de la Ec. (122) y controla el rango de valores
de l = 0, 1, ..., n − 1; también nos da el número total de orbitales con el valor especı́fico de n como n2 y
nos da el número total de nodos radiales y angulares como n − 1.

43
Figura 14: Funciones de onda radiales hidrogenoides: (a) 1s, (b) 2s, (c) 3s, (d) 2p,(e) 3p, (f) 3d.

2. El número cuántico de momentum angular orbital, l, especifica el momentum angular orbital del electrón
(próxima sección), y determina el número de orbitales con un n y l dado, según 2l + 1. Existen l nodos
angulares en la función de onda; el número de nodos radiales es n − l − 1.

3. El número cuántico magnético, ml , especifica la componente de momentum angular orbital de un electrón


(próxima sección) y, para n y l dados, especifica la función de onda individual de un electrón.

8.1.4. Probabilidades y la función de distribución radial

La funciones de onda completas del electrón en el átomo hidrogenoide tiene la forma

ψnlml = Rnl Ylml , (123)

donde las funciones Rnl están asociadas a las funciones asociadas de Laguerre (reales) y las Ylml son los armónicos
esféricos (en general, complejas, ver Tabla III). La probabilidad de encontrar un electrón en un elemento de
volumen dτ = r2 sin θdφdr en un punto especificado por las coordenadas polares esféricas (r, θ, φ) cuando el
2
estado de un electrón está descrito por la función de onda ψnlml es |ψnlml (r, θ, φ)| .
Aún cuando la funciones de onda nos da la probabilidad de encontrar un electrón en un punto especı́fico, a
veces es más útil el conocer la probabilidad de encontrar la partı́cula a un determinado radio, independiente de
la dirección. Esta probabilidad se obtiene al integrar sobre el volumen contenido entre dos esferas concéntricas
de radios r y r + dr (Fig. 15):
Z Z π Z 2π
2 2
P (r)dr = |ψnlml | dτ = Rnl 2 |Ylml | r2 sin θdrdθdφ . (124)
superficie 0 0

44
Tabla III: Armónicos esféricos
l ml Ylml (θ, φ)
0 0 1/2π 1/2
1 0 1/2(3/π)1/2 cos θ
±1 ∓(3/2π)1/2 sin θe±iφ
2 0 1/4(5/π)1/2 (3 cos2 θ − 1)
±1 ∓1/4(15/2π)1/2 cos θ sin θe±iφ
±2 1/4(15/2π)1/2 sin2 θe±2iφ
3 0 1/4(7/π)1/2 (2 − 5 sin2 θ) cos θ
±1 ∓1/8(21/π)1/2 (5 cos2 θ − 1) sin θe±iφ
±2 1/4(105/2π)1/2 cos θ sin2 θe±2iφ
±3 ∓1/8(35/π)1/2 sin3 θe±3iφ

Figura 15: La función de distribución radial nos da la probabilidad de que un electrón sea encontrado en cualquier
parte entre dos esferas concéntricas de radios que difieren por dr.

Los armónicos esféricos están normalizados a la unidad en el sentido que


Z π Z 2π
2
|Ylml | sin θdθdφ = 1 . (125)
0 0

Luego,
P (r)dr = R2 r2 dr . (126)

La cantidad P (r) = R2 r2 es la función de distribución radial: cuando se multiplica por dr esta nos entrega
la probabilidad de que el electrón se encuentre entre r y r + dr. Para una función de onda con l = 0 (un orbital
2
s), R2 r2 es equivalente a 4πr2 |ψ| . Para un orbital con n = 1 y l = 0, se sigue de la Tabla II que
 3
Z
P (r) = 4 r2 e−2Zr/a0 . (127)
a0

Esta función se ilustra en la Fig. 16. Notemos que esta es cero en r = 0 (en cuenta del factor r2 ) y se acerca
a cero a medida que r → ∞ debido al factor exponencial. Derivando con respecto a r y haciendo dP/dr = 0 es
fácil mostrar que P pasa por un máximo en
a0
rmax = . (128)
Z
Para un átomo de hidrógeno (Z = 1), rmax = a0 . Luego, el radio que Bohr calculó para el estado de energı́a más
bajo en el átomo de hidrógeno en su modelo del átomo previo a la mecánica cuántica es de hecho la distancia
entre el electrón y el núcleo más probable en el modelo mecánico cuántico. Notemos que este radio más probable

45
Figura 16: La función de distribución radial para un electrón en 1s. La función pasa a través de un máximo en
el radio de Bohr, a0 .

decrece en átomos hidrogenoides a medida que Z aumenta, dado que el electrón se acerca al núcleo a medida
que la carga de este último aumenta.

8.1.5. Orbitales atómicos

Las funciones de onda para un único electrón en el potencial generado por átomos son llamadas orbitales
atómicos, dando un sentido de menor certeza que el término “órbita” que aparece en la teorı́a clásica. Por
razones históricas, orbitales con l = 0 se llaman s-orbitales, l = 1 p-orbitales, l = 2 d-orbitales y l = 3
f -orbitales. Cuando un electrón está descrito por una función de onda ψnlml decimos que el electrón ocupa
tal orbital. Un electrón que ocupa un s-orbital es llamado un s-electrón, y similarmente para electrones que
ocupan otros tipos de orbitales.
La forma de los orbitales atómicos puede ser expresadas en varias formas. Una manera es denotar la probabilidad
de encontrar un electrón en una región mediante la densidad de sombra en la región (Fig. 17). Un procedimiento
más simple y generalmente adecuado es dibujar la superficie de borde, la superficie de probabilidad constante
dentro de la que existe una proporción especı́fica de la densidad de probabilidad (tı́picamente un 90 %). Para
formas reales de los orbitales, el signo de la función de onda a menudo se indica tanto tiñendo la parte de amplitud
positiva de la superficie de borde o bien incluyendo signos + o − a las zonas relevantes de los orbitales. Son pocas
las ocasiones en las que se requiere una representación precisa de la amplitud o de la densidad de probabilidad,
y las superficies de borde cualitativas mostradas en Fig. 17 son generalmente adecuadas.
Las superficies de borde en Fig. 17 muestan que los s-orbitales son esféricamente simétricos, mientras Y00 es
una constante independiente de los ángulos; ya antes hemos visto que los orbitales s difieren de otros tipos
de orbitales en la medida en que estos tienen una amplitud no nula en el núcleo. Esta caracteristica se deriva
de la falta de momentum angular. Puede ser confuso el por qué, al no tener momentum angular, un orbital s
pueda existir, dado que un electrón clásico sin momentum angular decaerı́a hacia el núcleo como resultado de la

46
Figura 17: Dos representaciones de la densidad de probabilidad correspondiente a un orbital 1s: (a) la densidad
representada por oscuridad del sombreado, (b) la superficie de borde del orbital.

atracción nuclear. La respuesta se encuenta en la competencia cuántica entre las energı́as cinéticas y potenciales.
Para que un electrón s se “agrupe” cerca del núcleo, minimizando ası́ su energı́a potencial, este necesita una
función de onda que se acentúe fuertemente en el núcleo y sea cero en todo el resto del dominio. Sin embargo,
tal función de onda estarı́a altamente curvada, correspondiendo entonces a un electrón con una energı́a cinética
muy alta. Si en cambio, la función de onda se dispersa sobre una región lo suficientemente amplia con una
curvatura suave, luego aunque su energı́a cinética será baja, su energı́a potencial será alta, ya que pasará mucho
más tiempo lejos del núcleo. La energı́a total más baja se obtiene cuando la función de onda es una mezcla entre
confinada-pero curvada y dispersa-pero levemente curvada.
Las superficies de borde para los primeros l orbitales para sus valores permitidos de ml se ilustran en la Fig. 18.
Los tres orbitales p con un determinado valor de n corresponden a los tres valores que ml puede tomar, a
saber 0 y ±1. El orbital con ml = 0 es real (ver Y10 en la Tabla III) y su componente de momentum angular
alrededor del eje z nula; es llamado un orbital pz . Los dos orbitales restantes, p+ y p− , son complejos, y tienen
su amplitud máxima en el plano xy (ver Fig. 18):

 1/2
3
ψn,1,0 = pz = Rn1 (r) cos θ ,

 1/2
3
ψn,1,1 = p+ = − Rn1 (r) sin θeiφ ,

 1/2
3
ψn,1,−1 = p− = Rn1 (r) cos θe−iφ .

Es usual representar las componentes reales e imaginarias, y llamar a estos orbitales px y py :

47
2
Figura 18: Las superficies de borde para |ψ| correspondientes a l = 0, 1, 2 y los valores permitidos para |ml | en
cada caso.

 1/2
1 3
px = √ (p− − p+ ) = Rn1 (r) sin θ cos φ ,
2 4π
 1/2
i 3
py = √ (p− + p+ ) = Rn1 (r) sin θ sin φ .
2 4π

Los orbitales complejos son de la forma apropiada para usar en átomos y moléculas lineales cuando no existen
ejes x e y bien definidos; las formas reales son más apropiadas cuando los ejes x e y están bien definidos, tal
como en moléculas no lineales. Los tres orbitales reales (px , py y pz ) tienen la misma forma de doble lóbulo,
pero alineados a lo largo de los ejes x, y y z, respectivamente.
Existen cinco orbitales d (l = 2) para n ≥ 3. Todos los orbitales, excepto aquellos con ml = 0, son complejos, y
corresponden a un estado definido de momentum angular orbital alrededor del eje z. Estos orbitales complejos
tiene una simetrı́a cilı́ndrica alrededor del eje z; sin embargo, es más común mostrarlos como su parte real,
como en la Fig. 19:

48
Figura 19: Superficies de borde para orbitales p y d.

 1/2  1/2
5 5
dz2 = d0 = Rn2 (r)(3 cos2 θ − 1) = Rn2 (r)(3z 2 − r2 )/r2 ,
16π 16π
 1/2
1 15
dx2 −y2 = √ (d+2 + d−2 ) = Rn2 (r)(x2 − y 2 )/r2 ,
2 16π
 1/2
1 15
dxy = √ (d+2 − d−2 ) = Rn2 (r)xy/r2 ,
i 2 4π
 1/2
1 15
dyz = √ (d+1 + d−1 ) = − Rn2 (r)yz/r2 ,
i 2 4π
 1/2
1 15
dzx = √ (d+1 − d−1 ) = Rn2 (r)zx/r2 .
2 4π

La notación se deriva de la identificación de la dependencia angular de los orbitales con las relaciones x =
r sin θ cos φ, y = r sin θ sin φ y z = r cos θ. Derivando estos resultados, hemos usado las fases de los armónicos

49
Figura 20: Las partes reales de las funciones de onda para los siete orbitales atómicos con l = 3. Notemos que
graficados de esta manera la forma única de la función de onda con ml = 0 parece ser parte de una familia de
funciones cilı́ndricamente simétricas.

esféricos especificados en la Tabla III. La forma de los orbitales f se muestran en la Fig. 20.
Una vez que las funciones de onda de los orbitales son encontradas es directo calcular varias propiedades de las
distribuciones del electrón que estas representan. Por ejemplo, el radio medio de un orbital puede ser evaluado
calculando el valor de expectación de r usando una de las funciones de onda dadas en la Tabla II. Sin embargo,
usualmente es mucho más fácil usar una de las siguientes expresiones generales que se obtienen usando las
propiedades generales de las funciones asociadas de Laguerre para evaluar los valores de expectación:

a0 n2
  
1 l(l + 1)
hrinlml = 1+ 1− ,
Z 2 n2
1 Z
h i = 2 .
r nlml n a0

Notemos que la primera de estas expresiones muestra que el radio medio de un orbital ns es mayor que el de un
orbital np, lo que es contrario a lo que uno esperarı́a sobre la base del efecto centrı́fugo del momentum angular
orbital. Esto es debido a la existencia de un nodo radial adicional en el orbital ns, que tiende a extender su
función de distribución radial a distancias mayores. El hecho de que el valor promedio de 1/r es independiente
de l se alı́nea con la degeneración de los átomos hidrogenoides; la energı́a potencial de Coulomb de un electrón
es proporcional al valor medio de 1/r, y el resultado implica que todos los orbitales de una determinada cáscara

50
tienen la misma energı́a potencial.

8.1.6. La degeneración del átomo de hidrógeno

Ya hemos visto que las energı́as de los orbitales hidrogenoides dependen solo del número cuántico principal n.
Para apreciar esta conclusión, invocamos el teorema virial, que nos dice que si la energı́a potencial de un cierto
sistema puede ser expresada en la forma V = axs , donde a y s son constantes, luego, la energı́a cinética y
potencial medias; EK , y EP están relacionadas según

2 hEK i = s hEP i . (129)

Luego, en nuestro caso, cuando el potencial es tipo Coulomb (s = −1), el teorema virial implica que

1
hEK i = − hEP i . (130)
2

Sin embargo, justo hemos visto que el valor medio de 1/r es independiente de l; luego, tanto el promedio de la
energı́a potencial y (por el teorema virial) el promedio de la energı́a cinética son independientes de l. Ası́, la
energı́a total es independiente de l, y todos los orbitales de un determinado cascarón tienen la misma energı́a.
Debido a que los valores permitidos de l son l = 0, 1, ..., n − 1, y para cada valor de l existen 2l + 1 orbitales, la
degeneración de un nivel con número cuántico n es

n−1
X
gn = (2l + 1) = n2 , (131)
l=0

como se adujo anteriormente. La degeneración de los orbitales con el mismo valor de n pero diferentes l es única
para átomos hidrogenoides y se pierde en presencia de más de un electrón. Sin embargo, la degeneración de los
orbitales con diferentes valores de ml pero los mismos valores de n y l permanece incluso en la presencia de
muchos electrones ya que orbitales con diferentes ml difieren solo en la orientación de su momentum angular
relativo a un eje arbitrario. La degeneración de estados con diferentes valores de ml puede ser removida con la
presencia de un campo eléctrico o magnético externo.
La alta degeneración de un átomo hidrogenoide es un ejemplo de una degeneración accidental, debido a que no
existe una rotación obvia del átomo que permita que un orbital s sea transformado en un orbital p, o algún otro.
Sin embargo, el potencial de Coulomb tiene una simetrı́a que no es inmediatamente aparente. Esta simetrı́a
escondida se muestra en espacios de dimensión mayores a 3. Esto implica que un ser cuadridimensional podrı́a
ver a simple vista que un orbital 2s rote de tal forma de obtener un orbital 2p, y luego no le serı́a sorprendente su
degeneración. Una manera de ilustrar esta simetrı́a oculta se ilustra en la Fig. 21, donde tenemos que imaginar
como un ser bidimensional podrı́a experimentar la proyección de una esfera con patrones. Es bastante fácil para
nosotros ver que una de las rotaciones de la esfera resulta en un cambio en la proyección de la esfera que llevarı́a
a un “terraplanista” a pensar que un orbital p ha sido transformado en un orbital s. Nosotros, en nuestro espacio
tridimensional, podemos ver fácilmente que los orbitales están relacionados por una simetrı́a; el ser de más bajas
dimensiones, sin embargo, podrı́a no verlo, y permanecerı́a desconcertado acerca de la degeneración. El átomo
de hidrógeno tiene exactamente el mismo tipo de simetrı́a en dimensiones más altas.

51
Figura 21: Representación del origen de la degeneración de los orbitales 2s y 2p en los átomos hidrogenoides. El
objeto (a) puede ser rotado en (b), correspondiendo (cuando se analiza la proyección en el plano bidimensional) a
la rotación de un orbital 2py en uno 2px . Sin embargo, la rotación respecto a otro eje resulta en una proyección que
corresponde a un orbital 2s (c). Ası́, en un espacio de dimensiones más altas, las rotaciones pueden interconvertir
orbitales 2s y 2p.

9. Momentum angular
Ahora desarrollaremos el material de la sección anterior mostrando que muchos de los resultados obtenidos
ahı́ pueden ser inferidos de las propiedades de ciertos operadores. Por ejemplo, aun cuando ya hemos visto que
resolver la ecuación de Schrödinger nos lleva a la conclusión de que el momentum angular orbital está cuantizado,
la misma conclusión se puede obtener del operador, sin la necesidad de resolver la ecuación diferencial.

9.1. Los operadores de momentum angular y sus relaciones de conmutación


Como mencionamos en la sección 2.4, podemos construir el operador momentum reemplazando los operadores
posición q y momentum lineal pq , que satisfacen [q, pq0 ] = i~δqq0 , en la definición clásica de momentum angular,
según
~l = ~r × p~ = (ypz − zpy )î + (zpx − xpz )ĵ + (xpy − ypx )k̂ = lx î + ly ĵ + lz k̂ , (132)

donde î, ĵ y k̂ son los vectores unitarios ortogonales a lo largo de los ejes x, y y z de un sistema cartesiano. Ası́,
en la representación de posición
     
~ ∂ ∂ ~ ∂ ∂ ~ ∂ ∂
lx = y −z , ly = z −x , lz = x −y . (133)
i ∂z ∂y i ∂x ∂z i ∂y ∂x

La propiedad de hermiticidad de estos operadores, al ser observables (como veremos más adelante) se puede
comprobar fácilmente en esta representación (Tarea??) y sabemos que esto debe ser cierto en cualquier repre-
sentación si los operadores representan observables. Sin embargo, desarrollar las propiedades de este operador
puede ser mucho más poderoso sin el uso de una representación especı́fica.
Para esto, partamos con establecer las relaciones de conmutación de los operadores lq . Consideremos inicialmente

52
el par lx y ly :

[lx , ly ] = [ypz − zpy , zpx − xpz ]


= [ypz , zpx ] − [ypz , xpz ] − [zpy , zpx ] + [zpy , xpz ]
= y[pz , z]px − 0 − 0 + xpy [z, pz ]
= i~(−ypx + xpy )
= i~lz . (134)

Lo mismo para todos los otros conmutadores. Luego, los conmutadores no nulos son

[lx , ly ] = i~lz , [ly , lz ] = i~lx , [lz , lx ] = i~ly . (135)

Podemos construir otro operador, el operador l2 = lx2 + ly2 + lz2 , correspondiente al cuadrado de la magnitud del
momentum angular. Calculamos la relación de conmutación que tiene con el resto de operadores del momentum
angular:

[l2 , lz ] = [lx2 + ly2 + lz2 , lz ] = [lx2 , lz ] + [ly2 , lz ] .

Notamos que

[lx2 , lz ] = lx2 lz − lz lx2


= lx2 lz − lx lz lx + lx lz lx − lz lx2
= lx (lx lz − lz lx ) + (lx lz − lz lx )lx
= lx [lx , lz ] + [lx , lz ]lx
= −i~(lx ly + ly lx )
= −i~{lx , ly } .

Similarmente,
[ly2 , lz ] = i~{ly , lx } = i~{lx , ly } , (136)

esto último por propiedad el anticonmutador. Luego

[l2 , lz ] = [lx2 , lz ] + [ly2 , lz ] = −i~{lx , ly } + i~{lx , ly } = 0 .

Concluimos que el conmutador de l2 con lz es cero. Aún más, dado que lx , ly y lz aparecen de forma simétrica
en la definición de l2 , los tres operadores deben conmutar con l2 si uno de los tres lo hace. Esto es,

[l2 , lq ] = 0 , (137)

para todo q. Las relaciones de conmutación en Ecs. (135) y (137) son los fundamentos de toda la teorı́a del
momentum angular. Siempre que nos encontremos con cuatro operadores que satisfagan estas relaciones de con-
mutación sabremos que las propiedades de los observables que estos representan son idénticas a las propiedades
que estamos a punto de derivar. Por esto, diremos que un observables es un momentum angular si sus operadores
satisfacen estas relaciones de conmutación, aunque esto tiene sutilezas; el caso de los operadores asociadas a la

53
carga eléctrica, o el del spin del electrón.

9.2. Observables del momentum angular


Anteriormente hemos discutido sobre lo que ocurre con los observables que no conmutan; estos son comple-
mentarios y están restringidos por el principio de indeterminación. De Ec. (135) tenemos por ejemplo que lz no
conmuta ni con lx ni con ly . Luego, aunque cuando podemos especificar una de las componentes del momentum
angular, no podemos especificar más de una. Sin embargo, l2 conmuta con las tres componentes, luego, la mag-
nitud del momentum angular puede ser especificada simultáneamente con cualquiera de sus componentes. Esta
conclusión genera la interpretación cuántica del “modelo vectorial” de momentum angular, donde representamos
un estado de momentum angular por un vector con una orientación indeterminada sobre un cono con un lado
dado (la magnitud del momentum) y su altura (el autovalor de lz ), idea ilustrada en Fig. 22

Figura 22: El cono usado para representar un estado de momentum angular con magnitud y componente z
especificada.

En este punto, sin embargo, empezamos a ver que el modelo vectorial debe ser tomado con cautela. Las relaciones
de conmutación en Ec. (135) pueden ser escritas de forma resumida como sigue:

~l × ~l = i~~l .

Sin embago, es una caracteristica elemental del álgebra vectoral que el producto vectorial de un vector consigo
mismo es cero. Luego, dado que el producto vectorial de l consigo mismo no es cero, debemos concluir que l
no es un vector. El modelo vectorial es útil siempre y cuando nos demos cuanta que no es del todo “cierto” y
notemos que un operador vectorial, no un vector clásico.

9.3. Operadores de corrimiento


Resulta conveniente introducir combinaciones lineales de los operadores de momentum angular, llamados ope-
radores de corrimiento. Estos operadores resultarán particularmente útiles al establecer las propiedades del
momentum angular y en la evaluación de los elementos matriciales de los operadores de momentum angular.
Un operador, l+ , es llamado operador de subida; el otro l− , es llamado operador de bajada y se definen
como sigue
l+ = lx + ily , l− = lx − ily . (138)

54
Las relaciones inversas son
1 1
lx = (l+ + l− ) , ly = (l+ − l− ). (139)
2 2i
Necesitaremos los conmutadores de los operadores de corrimiento. Son fácilmente derivables de las relaciones
de conmutación fundamentales. Por ejemplo,

[lz , l+ ] = [lz , lx ] + i[lz , ly ] = i~ly + ~lx = ~l+ .

Las otras relaciones de conmutación son obtenidas de forma similar;

[lz , l+ ] = ~l+ , [lz , l− ] = −~l− , [l+ , l− ] = 2~lz . (140)

Aún más, dado que l2 conmuta con cada una de sus componentes, también conmuta con l± . Ası́, podemos
incluir en estas relaciones la regla
[l2 , l± ] = 0 . (141)

9.4. Definición de los estados


Lo que sigue es ver la forma en la que las relaciones de conmutación gobiernan los valores de los autovalores
permitidos de l2 y de cualquiera de las componentes lq . Veremos que las soluciones anteriormente encontradas
están incompletas en un aspecto bastante importante, además de construir los armónicos esféricos de una forma
diferente y encontrar una forma simple de evaluar los elementos matriciales del operador momentum angular.

9.4.1. El efecto de los operadores de corrimiento

Supondremos que los autoestados simultáneos de l2 y lz están identificados por dos número cuánticos, que por
el momento denotaremos por λ y ml , sin ninguna razón aparente. Luego, los autoestados se denotarán como
|λ, ml i. Definimos ml a través de la relación

lz |λ, ml i = ml ~ |λ, ml i . (142)

Ya que ~ tiene dimensiones de momentum angular (M L2 T −1 ), el autovalor de lz debe ser un múltiplo numérico
de ~; no estamos suponiendo que ml está restringuido a valores discretos, esto emergerá solo más adelante. Todo
lo que sabemos es que ml es un número real, por la hermiticidad de lz .
Dado que l2 conmuta con lz , el estado |λ, ml i es también un autoestado de l2 . En este punto debemos permitir
la posibilidad de que el autovalor de l2 dependa de ambos número cuánticos, por lo que escribimos

l2 |λ, ml i = f (λ, ml )~2 |λ, ml i , (143)

donde f es una función que necesitamos determinar. De lo visto en la sección anterior sabemos que este valor
será l(l + 1), donde l es el valor máximo de |ml |, pero esto es algo que derivaremos. Todo lo sabemos hasta este
punto es que dado que l2 es hermı́tico, f es real. Aún más, dado que l2 es la suma de cuadrados de operadores
hermı́ticos, también sabemos que sus autovalores son no-negativos.
Ya que l2 − lz2 = lx2 + ly2 , se sigue que los autovalores del operador l2 − lz2 son no-negativos:

(l2 − lz2 ) |λ, ml i = (lx2 + ly2 ) |λ, ml i ≥ 0 . (144)

55
Sin embargo, también sabemos

(l2 − lz2 ) |λ, ml i = [f (λ, ml ) − m2l ]~2 |λ, ml i . (145)

Para que estas relaciones sean consistentes, se sigue

f (λ, ml ) ≥ m2l . (146)

El siguiente paso es usar las relaciones de conmutación para determinar el efecto de los operadores de corrimiento
(y entender finalmente su nombre). Consideremos el efecto del operador l+ sobre |λ, ml i. Dado que |λ, ml i no
es un autoestado de lx ni de ly , cuando l+ actúa sobre este, se genera un nuevo estado. Primero, mostramos
que l+ |λ, ml i = |λ0 , m0l i es un autoestado de l2 con el mismo valor de f ; esto es |λ, ml i y l+ |λ, ml i comparten
el mismo autovalor de l2 . Para hacer esto, consideremos el efecto de l2 sobre el estado obtenido de la acción de
l+ :

l2 |λ0 , m0l i = l2 l+ |λ, ml i = l+ l2 |λ, ml i = l+ f (λ, ml )~2 |λ, ml i = f (λ, ml )~2 l+ |λ, ml i (147)
= f (λ, ml )~2 |λ0 , m0l i , (148)

donde la primera igual proviene del hecho de que l2 y l+ conmutan. Se sigue, dado que el autovalor de l2 para
el estado l+ |λ, ml i es el mismo que del estado original |λ, ml i, que l+ deja la magnitud del momentum angular
sin cambios cuando este actúa.
Ahora, consideremos el mismo argumento aplicado sobre |λ, ml i como un autoestado de lz . La conclusión será
diferente, ya que l+ y lz no conmutan. En vez de esto, debemos usar las siguientes igualdades para encontrar el
efecto de lz sobre |λ, ml i:

lz |λ0 , m0l i = lz l+ |λ, ml i = (l+ lz + [lz , l+ ]) |λ, ml i = (l+ lz + ~l+ ) |λ, ml i


= (l+ ml ~ + ~l+ ) |λ, ml i = (ml + 1)~l+ |λ, ml i
= (ml + 1)~ |λ0 , m0l i . (149)

Sin embargo, de Ec. (142) haciendo ml → ml + 1, sabemos que

lz |λ, ml + 1i = (ml + 1)~ |λ, ml + 1i . (150)

Luego, el estado l+ |λ, ml i debe ser proporcional al estado |λ, ml + 1i y podemos escribir

l+ |λ, ml i = c+ (λ, ml )~ |λ, ml + 1i , (151)

donde c+ (λ, ml ) es un coeficiente númerico que debemos encontrar. Ahora vemos por qué l+ es llamado el
operador de subida: cuando este opera sobre un estado con componente z ml ~, genera un estado con la misma
magnitud de momentum angular pero con una componente z una unidad más grande, (ml + 1)~ (Fig. 23). De
esta misma forma, el efecto del operador l− es el de bajar la componente z desde ml ~ a (ml − 1)~:

l− |λ, ml i = c− (λ, ml )~ |λ, ml − 1i , (152)

donde c− (λ, ml ) es otro coeficiente numérico adimensional.

56
Figura 23: El efecto de los operadores de corrimiento l+ y l− .

9.4.2. Los autovalores del momentum angular

Los operadores de corrimiento cambian ml por ±1 cada vez que operan. Sin embargo, ya hemos establecido de
su hermiticidad que m2l no puede exceder f (λ, ml ) (Ec. (146)); se sigue que ml debe tener un valor máximo,
que denotaremos por l. Cuando operamos con l+ sobre un estado en el que ml = l, generamos nada, dado que
no existe un estado con un valor más grande de ml :

l+ |λ, li = 0 . (153)

Esta relación nos entregará el valor de la función f hasta ahora desconocida. Cuando aplicamos l− , tenemos

l− l+ |λ, li = 0 . (154)

Sin embargo, el producto l− l+ puede ser expandido como

l− l+ = (lx − ily )(lx + ily ) = lx2 + ly2 + ilx ly − ily lx = lx2 + ly2 + i[lx , ly ] = l2 − lz2 + i(i~lz ) . (155)

Ası́, la última ecuación puede ser escrita como

(l2 − lz2 − ~lz ) |λ, li = 0 . (156)

Cuando usamos la definición del efecto de l2 y lz sobre un estado, obtenemos

l2 |λ, li = f (λ, l) |λ, li , (lz2 + ~lz ) |λ, li = (l2 + l)~2 |λ, li ,

y se sigue que
f (λ, l) = l(l + 1) . (157)

57
Ya hemos establecido que cuando l− actúa sobre un estado este no cambia el autovalor de l2 (de la comparación
de Ec. (143) y la Ec.(147) análoga para el operador l− ). Por lo tanto, todos los estados |λ, li, |λ, l − 1i, etc.
tienen los mismos autovalores de l2 . Ası́
f (λ, ml ) = l(l + 1) , (158)

para ml = l, l − 1, ... . Sabemos que existe una cota baja sobre ml debido a que el autovalor de lz2 no puede
exceder al autovalor de l2 , y por el momento denotaremos a esta cota baja por k. Es bastante fácil mostrar
que k = −l. Para ver que este es el caso, empezamos de l− |λ, ki = 0, y por un argumento similar pero usando
l+ l− |λ, ki = 0, concluı́mos que f (λ, k) = k(k − 1). Sin embargo, dado que f (λ, ml ) es independiente de ml ,
debemos tener l(l + 1) = k(k − 1). De las dos soluciones k = −l y k = l + 1, solo la primera es aceptable (la
cota baja debe ser menor que la cota por arriba!). Por lo tanto

f (λ, ml ) = l(l + 1) , (159)

para ml = l, l − 1, ..., −l .
En este punto, podemos poner al número cuántico que queda λ en uso, e identificarlo como l, el valor máximos
de |ml |. Luego,
f (l, ml ) = l(l + 1) , (160)

para ml = 1, l − 1, ..., −l .
Esto es, sabemos que
l2 |l, ml i = l(l + 1)~2 |l, ml i , (161)

y vemos que el valor de l (el valor máximo de ml ) determina la magnitud del momentum angular. Junto a lo
que ya sabemos
lz |l, ml i = ml ~ |l, ml i , (162)

tenemos una descripción completa del momentum angular.


Finalmente, necesitamos decidir sobre los valores permitidos de l y ml . Como hemos visto, los operadores de
corrimiento mueven los estados |l, ml i desde |l, +li a |l, −li en pasos de una unidad. La simetrı́a de esta escalera
de estados permite solo dos tipos de valores para l: puede ser entero o semi-entero. Por ejemplo, podemos tener
l = 2, que nos da la escalera ml = +2, +1, 0, −1, −2, o podemos tener l = 32 , que nos da ml = + 32 , 12 , − 12 , − 23 .
No podemos obtener una escalera simétrica con ningún otro tipo de valor (l = 34 por ejemplo, nos darı́a un a
escalera asimétrica ml = + 34 , − 14 ).

Podemos resumir las conclusiones hasta ahora. Sobre la base de la hermiticidad de los operadores del momentum
angular y sus relaciones de conmutación, hemos mostrado que
p
1. La magnitud del momentum angular está confinada a los valores l(l + 1)~, con l = 0, 12 , 1, ... .

2. La componente sobre el eje z arbitrario está limitado a los 2l + 1 valores ml ~ con ml = l, l − 1, ... − 1.

Estas conclusiones difieren en un detalle con las obtenidas al resolver la ecuación de Schrödinger en la sección
anterior. Ahı́ vimos que l está confinada a valores enteros l = 0, 1, 2, .... En tal análisis, obtuvimos los valores
permitidos de l imponiendo condiciones de borde cı́clicas. Lo que el presente análisis hace es mostrar que el
momentum angular puede ser descrito por número cuánticos semi-enteros, pero tales número cuánticos no nece-
sariamente aplican a una situación fı́sica particular. Para el momentum angular orbital, donde la interpretación
de Born requiere que condiciones de borde cı́clicas sean satisfechas, solo valores enteros son admisibles. Cuando

58
condiciones de borde cı́clicas no son relevantes, como para el momentum angular intrı́nseco conocido como espı́n,
los valores semi-enteros pueden ser apropiados.
Usaremos la siguiente notación para enfatizar que existe una distinción entre el momentum angular según las
condiciones de borde que deben ser satisfechas. Para el momentum angular orbital, cuando las condiciones de
borde de la función de onda permiten solo números cuánticos enteros, usaremos la notación l y ml y escribiremos
estados como |l, ml i. Cuando consideramos el momentum angular interno (espı́n) usamos s y ms para los número
cuánticos (posiblemente semi-enteros) y escribiremos los estados como |s, ms i. Cuando la discusión es general
y aplicable a cualquier tipo de momentum angular, usaremos j y mj , y escribimos los estados como |j, mj i. La
expresión que hemos deducido hasta ahora puede luego ser escrita en esta notación general como

j 2 |j, mj i = j(j + 1)~2 |j, mj i , jz |j, mj i = mj ~ |j, mj i , (163)

con mj = j, j − 1, ..., −j.

9.4.3. Elementos matriciales del momentum angular

En este punto, un problema relevante es el de los valores de los coeficientes c± introducidos al estudiar el efecto
de los operadores de corrimiento:

j± |j, mj i = c± (j, mj )~ |j, mj ± 1i . (164)

Dado que los estados |j, mj i forman un conjunto ortonormal, multiplicando por la izquierda por hj, mj ± 1|,
tenemos
hj, mj ± 1| j± |j, mj i = c± (j, mj )~ . (165)

Luego, necesitamos saber los coeficientes si queremos conocer los valores de estos elementos matriciales. Ele-
mentos matriciales de este tipo aparecen en el cálculo de propiedades magnéticas e intensidades de transición
en resonancia magnética.
El primer paso involucra el encontrar dos expresiones para los elementos matriciales del operador j− j+ . Primero,
podemos usar Eq. (155) y escribir

j− j+ |j, mj i = (j 2 − jz2 − ~jz ) |j, mj i = [j(j + 1) − mj (mj + 1)]~2 |j, mj i . (166)

De forma alternativa, podemos usar (164)

j− j+ |j, mj i = j− c+ (j, mj )~ |j, mj + 1i = c+ (j, mj )c− (j, mj + 1)~2 |j, mj i . (167)

Comparando ambas expresiones, tenemos que

c+ (j, mj )c− (j, mj + 1) = j(j + 1) − mj (mj + 1) . (168)

El siguiente paso es encontrar una relación entre los dos coeficientes que aparecen en la última expresión.
Baseremos el cálculo en el siguiente elemento matricial

hj, mj | j− |j, mj + 1i = c− (j, mj + 1)~ , (169)

59
y en la hermiticidad de jx y jy . Consideremos el siguiente conjunto de manipulaciones:

hj, mj | j− |j, mj + 1i = hj, mj | jx − ijy |j, mj + 1i


= hj, mj | jx |j, mj + 1i − i hj, mj | jy |j, mj + 1i
∗ ∗
= hj, mj + 1| jx |j, mj i − i hj, mj + 1| jy |j, mj i
 ∗
= hj, mj + 1| jx |j, mj i + i hj, mj + 1| jy |j, mj i

= hj, mj + 1| j+ |j, mj i .

Esto es


hj, mj | j− |j, mj + 1i = hj, mj + 1| j+ |j, mj i , (170)

lo que demuestra que j− y j+ son el conjugado hermı́tico el uno del otro. Ninguno de los operadores es
hermı́tico, y luego ninguno de los dos operadores corresponde a un observable fı́sico. En general, dos operadores
A y B son conjugados hermı́ticos el uno del otra si


ha| A |bi = hb| B |ai . (171)

La relación que hemos derivado implica una relación entre los coeficientes c± . Debido a que el elemento matricial
en la izquierda de Ec. (170) es igual a c− (j, mj + 1)~ y aquel a la derecha es igual a c∗+ (j, mj )~, se sigue que

c− (j, mj + 1) = c∗+ (j, mj ) . (172)

Luego, se sigue de Ec. (168) que

2
|c+ (j, mj )| = j(j + 1) − mj (mj + 1) . (173)

Si escogemos de forma conveniente la fase (escogiendo c+ real y positivo), tenemos que


q
c+ (j, mj ) = j(j + 1) − mj (mj + 1) . (174)

Aún más, dado que c− (j, mj ) = c∗+ (j, mj − 1), también podemos escribir
q
c− (j, mj ) = j(j + 1) − mj (mj − 1) . (175)

Establecidos estos elementos matriciales podemos calcular un amplio conjunto de otras cantidades. Ejemplo
4.1?? Tarea??

9.4.4. Autofunciones del momentum angular

Ahora consideraremos el momentum angular orbital de forma explı́cita. Esta versión de la teorı́a general se
refiere al momentum angular que surge de la distribución de una partı́cula en el espacio, por lo que está sujeta
a condiciones de borde periódicas para la función de onda. Como vimos al resolver el átomo hidrogenoide, estas
condiciones limitan los números cuánticos a valores enteros, que denotamos como l y ml . En la Tarea 1 vimos
como las funciones de onda angulares del electrón en un átomo hidrogenoide son soluciones de una ecuación

60
diferencial de segundo orden y que corresponden a armónicos esféricos. Con lo desarrollado en la presente sección
podemos mostrar que este resultado también puede ser obtenido al resolver una ecuación diferencial de primer
orden, lo que corresponde a una tarea mucho más fácil.
Comenzamos encontrando la función de onda para el estado |l, li (para el que ml = l). Una vez que esta función
de onda ha sido determinada, las funciones de onda para los estados |l, ml i pueden ser generadas actuando sobre
|l, li con l− el número apropiado de veces. La ecaución que tenemos que resolver es

l+ |l, li = 0 . (176)

Para expresar esta ecuación como una ecuación diferencial debemos adoptar una representación para los ope-
radores. En la representación de posición (y coordenadas esféricas), los operadores de momentum angular son
 
~ ∂ ∂
lx = − sin φ + cot θ cos φ , (177)
i ∂θ ∂φ
 
~ ∂ ∂
ly = cos φ − cot θ sin φ , (178)
i ∂θ ∂φ
~ ∂
lz = . (179)
i ∂φ

Estos operadores se obtienen de la forma cartesiana dada en Ec. (133) luego de realizar el cambio de coordenadas
a esféricas. Se sigue que los operadores de corrimiento en la representación de posición son
 
∂ iφ ∂
l+ = ~e + i cot θ , (180)
∂θ ∂φ
 
−iφ ∂ ∂
l− = −~e − i cot θ . (181)
∂θ ∂φ

De la ecuación l+ |l, li = 0 se sigue que


 
iφ ∂ ∂
~e + i cot θ ψl,l (θ, φ) = 0 . (182)
∂θ ∂φ

Esta ecuación diferencial parcial puede ser separada con el ansatz ψ(θφ) = Θ(θ)Φ(φ), de la que obtendremos
luego de la manipulación usual
tan θ dΘ i dΦ
=− . (183)
Θ dθ Φ dφ
De acuerdo al argumento usual de la sepación de variables, ambos lados deben ser iguales a una constante, que
denotaremos por c. Luego, la ecuación se separa en las siguientes dos ecuaciones diferenciales de primer orden:

dΘ dΦ
tan θ = cΘ , = icΦ . (184)
dθ dφ

Estas dos ecuaciones se integran de forma inmediata a

Θ ∝ sinc θ , Φ ∝ eicφ . (185)

El valor de c se fija a l al requerir que lz φl,l = lψl,l . Por lo tanto, la solución completa es

ψl,l = N sinl θeilφ , (186)

61
donde N es una constante de normalización. Esta es la forma explı́cita de los armónicos esféricos Yll dados en la
Tabla III, sin considerar la constante de normalización, la cual se puede obtener al integrar sobre la superficie de
una esfera. Con esta función encontrada, es directo aplicar el operador l− para obtener el resto de las funciones
con un valor de l dado. Tarea??

9.4.5. Espı́n

En 1925, los trabajos de los fı́sicos daneses G. Uhlenbeck y S. Goudsmit mostraron que se puede lograr una
importante simplificación en la descripción del espectro atómico si se asume que el electrón posee un momentum
1
angular intrı́nseco con número cuántico s = 2 y que puede estar en dos estados con ms = + 12 , denotado como
α o ↑, y ms = − 12 , denotado por β o ↓. Este momentum angular intrı́nseco es llamado espı́n del electrón. Esta
realización nos entrega luces sobre un experimento realizado varios años antes por O. Stern y W. Gerlach. El
experimento de Stern-Gerlach consiste en preparar un haz de átomos de plata haciéndolos pasar a travéz de
un fuerte campo magnético inhomogéneo, como ilustra la Fig. 24. Stern y Gerlach encontraron que el haz es
deflectado en dos direcciones y atribuyeron este efecto a la cuantización espacial y momentum magnético del
electrón (en un átomo de plata, existe un único electrón fuera de un cascarón cerrado, por lo que los átomos
se comportan como un único electrón sobre una “plataforma” pesada, el resto del átomo). Sin embargo, Stern
y Gerlach no se dieron cuenta de que habı́an descubierto el espı́n del electrón, solo crearon su experimento
basados en sus consideraciones sobre el momentum angular orbital. Aún más, aunque el espı́n del electrón fue
descubierto en 1925, pareciera que recién en 1927 la separación de Stern-Gerlach fue atribuı́da al espı́n del
electrón estando en una de dos direcciones, lo que ahora interpretamos como los estados con ms = ± 21 .

Figura 24: Experimento de Stern-Gerlach con haz de partı́culas de plata.

El espı́n es un fenómeno puramente cuántico; en un universo en el que h → 0 el momentum angular de espı́n


deberı́a ser cero. El momentum angular orbital sobrevive en un mundo clásico, ya que l tiene permitido acercarse
p
a infinito a medida que h → 0 y la cantidad l(l + 1)~ ≈ l~ puede ser no nulo. La propuesta de Uhlenbeck
y Goudsmit inicialmente no fue más que una hipótesis, pero cuando Dirac mostró cómo combinar la mecánica
cuántica y la relatividad especial, la existencia de partı́culas con número cuánticos de momentum angular
semi-enteros aparece automáticamente.
1
Los operadores de momentum angular describen espı́n arbitrario, pero para s = 2 lo hacen de una forma

62
bastante simple. Si denotamos el estado | 12 , + 12 i por α y el estado | 12 , − 21 i por β, luego las expresiones generales
dadas anteriormente en Ec. (163) se vuelven

1 1 3 2 3 2
sz α = + ~α , sz β = − ~β , s2 α = ~ α, s2 β = ~ β, (187)
2 2 4 4

y los efectos de los operadores de corrimiento, usando los resultados de Ecs. (174) y (175), son

s+ α = 0 , s+ β = ~α , s− α = ~β , s− β = 0 . (188)

Se sigue que los únicos elementos matriciales no nulos de los operadores de corrimiento son

αs+ β = βs− α = ~ . (189)

Los operadores pueden ser escritos de forma sucinta en términos de matrices al considerar sus efectos en el
conjunto base ortonormal {α, β}: ! !
1 0
α= , β= . (190)
0 1
Con esta notación, el efecto del operador sz puede ser reproducido por el efecto de una matriz de 2 × 2:
! ! !
1 1 0 1 1 1 1
sz α = + ~ =+ ~ = + ~α , (191)
2 0 −1 0 2 0 2

con una expresión similar para el efecto de sz sobre β. De forma similar, el efecto de sx sobre α, que de acuerdo
a Ecs. (139) y (188) es sx α = 21 ~β, puede ser expresado como sigue
! ! !
1 0 1 1 1 0 1
sx α = + ~ =+ ~ = + ~β , (192)
2 1 0 0 2 1 2

con una expresión similar para los efectos de sx sobre β. De hecho, todas las propiedades de los operadores de
espı́n- 12 , sq , incluı́das sus relaciones de conmutación son reproducidas por las siguientes matrices;
! ! !
0 1 0 −i 1 0
σx = , σy = , σz = , (193)
1 0 i 0 0 −1

y donde ! !
0 2 0 0
σ+ = , σ− = , (194)
0 0 2 0
con la relación
1
sq = ~σq , (195)
2
con q = x, y, z, +, − . El conjunto de matrices σx , σy , σz son conocidas colectivamente como las matrices de
Pauli. Estas matrices juegan un rol importante en el desarrollo de las propiedades de sistemas de espı́n- 21 , y las
usaremos más adelante.

63
9.5. Momentum angular de sistemas compuestos
Ahora consideraremos un sistema en que el existen dos fuentes del momentum angular, que denotaremos como
j1 y j2 . El sistema puede ser compuesto por una única partı́cula que posee tanto espı́n como momentum angular
orbital, o puede consistir de dos partı́culas con espı́n o de dos partı́culas con momentum angular orbital. Acá
investigaremos las implicancias de las reglas de conmutación para el momentum angular total j del sistema.

9.5.1. Especificación de estados acoplados

El estado de la partı́cula 1 está completamente especificado al reportar los números cuánticos j1 y mj1 , y lo
mismo es cierto para la partı́cula 2, en términos de sus números cuánticos j2 y mj2 . Si nos es posible especificar
el estado completo como |j1 , mj1 ; j2 , mj2 i, necesitamos saber si todos los operadores correspondientes conmutan
entre ellos. De hecho, operadores para fuentes independientes de momentum angular sı́ conmutan entre ellos, y
podemos escribir
[j1q , j2q0 ] = 0 , (196)

para todas las componentes q = x, y, z y q 0 = x, y, z. Una forma de confirmar esta conclusión es notando que
en la representación de posición los operadores están expresados en términos de las coordenadas y derivadas
de cada partı́cula, separadamente, y las derivadas para una partı́cula trata a las coordenadas de la otra como
constantes. Operadores que hacen referencia a componentes independientes de un sistema siempre conmutan
entre ellos. Debido a que los operadores j12 y j22 están definidos en términos de sus componentes, las cuales
conmutan, entonces estos dos operadores también conmutan. Luego, los cuatro operadores j12 , j1z , j22 y j2z
conmutan entre ellos, y es permisible expresar el estado como |j1 , mj1 ; j2 , mj2 i.

Ahora exploramos si es que el momentum angular total del sistema, j = j1 + j2 , también puede ser especifi-
cado. Primero, investigamos cuando j es en efecto un momentum angular (¿qué significa que un observable sea
un momentum angular?). Para hacer esto, evaluamos los conmutadores de sus componentes, como

[jx , jy ] = [j1x + j2x , j1y + j2y ]


= [j1x , j1y ] + [j2x , j2y ] + [j1x , j2y ] + [j2x , j1y ]
= i~j1z + i~j2z + 0 + 0
= i~jz . (197)

Estas relaciones de conmutación, junto a las otras dos que se pueden derivar de esta haciendo permutaciones
cı́clicas de las etiquetas para las coordenadas, son caracterı́sticas del momentum angular, ası́ j es un momentum
angular (j1 − j2 , por otro lado, no lo es). Ya que j es un momentum angular podemos concluir sin más que su
p
magnitud es j(j + 1)~ con j entero o semi-entero (¿por qué?), y su componente z tiene los valores mj ~ con
mj = j, j − 1, ..., −j.

Ahora necesitamos encontrar qué valores de j pueden existir en el sistema. La pregunta inicial es si es posible
especificar j si j1 y j2 han sido especificados. Debido a que j12 conmuta con todas sus componentes y j22 con
todas las suyas, y dado qe j 2 puede ser expresado en términos de las mismas componentes (como j 2 = j12 + j22 =
2 2 2 2 2 2
j1x + j1y + j1z + j2x + j2y + j2z ), se sigue que

[j 2 , j12 ] = [j 2 , j22 ] = 0 . (198)

64
Luego, podemos concluir que los autovalores de j12 , j22 y j 2 puede ser simultáneamente especificados. Por ejemplo,
un electrón p (para el que l = 1 y s = 12 ) puede ser pensado como teniendo un momentum angular total bien
definido con una magnitud dada por algún valor de j (los valores permitidos de aún necesitamos encontrar).
Ya que j 2 conmuta con sus propias componentes, en particular conmuta con jz = j1z + j2z . Ası́, sabemos
que podemos especificar los valores de mj y también j. Hasta este punto hemos establecido que un estado de
momentum angular acoplado puede ser denotado como |j1 j2 ; jmj i. Sin embargo, notemos que aún no hemos
establecido que se puede especificar de forma más completa como |j1 mj1 j2 mj2 ; jmj i ya que aún no hemos
establecido si j 2 conmuta con j1z y j2z . Para explorar este punto procedemos como sigue:

[j1z , j 2 ] = [j1z , jx2 ] + [j1z , jy2 ] + [j1z , jz2 ]


= [j1z , (j1x + j2x )2 ] + [j1z , (j1y + j2y )2 ] + [j1z , (j1z + j2z )2 ]
2 2
= [j1z , j1x + 2j1x j2x ] + [j1z , j1y + 2j1y j2y ]
2 2
= [j1z , j1x + j1y ] + 2[j1z , j1x ]j2x + 2[j1z , j1y ]j2y
= [j1z , j12 − j1z
2
] + 2i~j1y j2x − 2i~j1x j2y
= 2i~(j1y j2x − j1x j2y ) . (199)

El conmutador no es cero, y entonces no podemos especificar mj1 (o mj2 ) si especificamos j. De este análisis se
sigue que tenemos que hacer una elección cuando especificamos el sistema. O bien usamos el marco desaco-
plado |j1 mj1 ; j2 mj2 i, que deja el momentum angular total sin especificar y por lo tanto, en efecto, no dice nada
acerca de la orientación relativa de los dos momentos, o bien usamos el marco acoplado |j1 j2 ; jmj i, que deja
las componentes individuales sin especificar. Hasta este punto, qué elección de marco hagamos es arbitraria. Más
adelante, cuando consideremos la energı́a de interacción entre diferentes momentos angulares veremos que un
marco es más natural que el otro. Por ahora, ambos marcos son simplemente formas alternativas de especificar
un sistema compuesto.

9.6. Valores permitidos del momentum angular total


Si decidimos usar el marco acoplado, la pregunta natural que surge es respecto a los valores permitidos de
j y mj . Sabemos que las relaciones de conmutación permiten a j tener cualquier valor entero o semi-entero
positivo, pero necesitamos determinar cuales de estos muchos valores realmente ocurren para un j1 y j2 dados.
Por ejemplo, el momentum angular total de un electrón p (l = 1 y s = 12 ) es poco probable que exceda j = 23 .
Los valores permitidos de mj se obtienen de forma inmediata a partir de la relación jz = j1z + j2z , y son

mj = mj1 + mj2 . (200)

Esto es, la componente total del momentum angular alrededor de un eje es la suma de las componentes de las
dos contribuciones de momentos (Fig. 25). Para determinar los valores permitidos de j, primero notamos que el
número total de estados en el marco desacoplado es (2j1 + 1)(2j2 + 1) = 4j1 j2 + 2j1 + 2j2 + 1 (por ejemplo, para
el electrón p, donde j1 = l = 1 y j2 = s = 21 , tenemos 6 estados independientes ¿cuáles son estos?). Existe solo
un único estado en el que ambas componentes tiene sus valores máximos, mj1 = j1 y mj2 = j2 , y este estado
corresponde a mj = j1 + j2 . Sin embargo, el máximo valor de mj es por definición j, luego, el máximo valor de
j es j = j1 + j2 . Existen 2j + 1 = 2j1 + 2j2 + 1 estados correspondientes a este valor de j, por lo que aún hay
4j1 j2 más estados que encontar.

65
Figura 25: Representación de la condición mj = mj1 + mj2 .

Aunque el estado con mj = j1 + j2 puede surgir de una única manera, el estado con mj = j1 + j2 − 1 se puede
dar de dos formas; a partir de mj1 = j1 − 1 y mj2 = j2 y desde mj1 = j1 y mj2 = j1 − 1. El estado con
j = j1 + j2 cuenta para solo uno de estos estados (o para una de sus dos combinaciones lineales), entonces debe
existir otro estado acoplado para el que el valor máximo de mj es mj = j1 + j2 − 1. Este estado corresponde a
un estado con j = j1 + j2 − 1. Un sistema con este valor de j cuenta para 2j + 1 = 2j1 + 2j2 − 1 estados. El
proceso puede continuar al considerar el siguiente valor más bajo de mj , el que es mj = j1 + j2 − 2, que puede
ser producido de tres formas diferentes. Los dos estados con j = j1 + j2 y j = j1 + j2 − 1 cuentan dos de estos;
el tercero (o la tercera combinación lineal) debe surgir del estado con j = j1 + j2 − 2. Este argumento puede
continuar, y todos los estados son contandos una vez alcanzado j = |j1 − j2 | (j es un número positivo, es por
esto el valor absoluto). Por lo tanto, los estados permitidos del momentum angular son dados por la serie de
Clebsch-Gordan:
j = j1 + j2 , j1 + j2 − 1, ..., |j1 − j2 | . (201)

La serie de Clebsch-Gordan puede ser ilustrada de una forma simple. Supongamos que tenemos baras de lon-
gitudes j1 y j2 y se nos pregunta por la longitud j del tercer lado de un triángulo que puede ser “formado”
usando estas dos baras (con todas las tres longitudes enteras o semi-enteras). Luego, la respuesta serı́a preci-
samente aquellas dadas por la serie de Clebsch-Gordan (Fig. 26). Por ejemplo, j1 = 1 y j2 = 1 requiere baras
de longitudes j = 2, 1, 0 para formar un triángulo. Aunque la condición triangular no es más que una simple
regla mnemotécnica, sı́ nos sugiere que el momentum angular en mecánica cuántica sı́ se comporta como vector
y que el momentum angular total puede ser pensado como el resultado de los momentos contribuyentes. La
exploración de este punto nos lleva al “modelo vectorial” del momentum angular acoplado.

66
Figura 26: La condición triangular correspondiente a la serie de Clebsch-Gordan. Los valores permitidos de j
son aquellos para los que las lı́neas de longitud j, j1 , y j2 pueden ser usadas para formar un triángulo.

9.7. Modelo vectorial del momentum angular acoplado


El modelo vectorial del momentum angular acoplado es un intento de ilustrar las propiedades del momentum
angular acoplado que hemos deducido a partir de las relaciones de conmutación. El enfoque nos da pistas acerca
del significado de varios esquemas acoplados y es a menudo una útil guı́a para la imaginación: nos da una idea
más concreta del rol de los operadores.
Las propiedades que los diagramas vectoriales de momentum acoplado deben expresar son las siguientes:
p
1. La longitud del vector que representa al momentum angular total es j(j + 1), con j uno de los valores
permitidos por la serie de Clebsch-Gordan.

2. Este vector debe yacer sobre un ángulo indeterminado sobre un cono alrededor del eje z (debido a que jx
y jy no pueden ser especificados una vez que jz ha sido especificado).
p p
3. Las longitudes de los vectores momentos angulares que contribuyen son j1 (j1 + 1) y j2 (j2 + 1). Estas
longitudes tienen valores definidos incluso cuando j está especificado.

4. La proyección del momentum angular total sobre el eje z es mj ; en el marco acoplado (en el que j está
especificado), los valores de mj1 y mj2 son indefinidos, pero su suma es igual a mj .

5. En el marco desacoplado (en el que j no está especificado), las componentes individuales mj1 y mj2 pueden
ser especificadas, y su suma es igual a mj .

Los diagramas de las Figs. 27 capturan estos puntos. La Fig. 27 izquierda muestra uno de los estados en el marco
desacoplado: tanto mj1 como mj2 están especificados, pero no hay ninguna indicación acerca de la orientación
relativa de j1 y j2 más allá del hecho de que yacen sobre sus respectivos conos. El momentum angular total
es por lo tanto indeterminado, puede ser cualquiera de los resultados mostrados en (a) o en (b), o cualquiera
contenido entre ambos. En la derecha de la Fig. 27 se muestra uno de los estados del marco acoplado. Ahora
el resultante, el momentum angular total, tiene una magnitud y componente sobre el eje z bien definidas,
pero las componentes individuales mj1 y mj2 están indeterminadas. Es importante no imaginar a los vectores

67
activamente en movimiento de precesión alrededor de sus conos: en este punto de la descripción, el modelo
vectorial es una exhibición de posibles pero indeterminables orientaciones.

Figura 27: Izquierda: Dos posibles estados del momentum angular total que pueden surgir a partir de dos
contribuciones de momentos especificas con número cuánticos j1 y j2 . Las orientaciones relativas de los momentos
contribuyentes sobre sus conos determinan la magnitud total. Derecha: Si los dos momentos contribuyentes
son “unidos” o “sumados” de tal forma que generen un total especı́fico, las proyecciones de los momentos
contribuyentes expanden un rango (como ilustran las barras verticales) y aunque su suma puede ser especificada,
sus valores individuales no.

1
Un ejemplo importante es el caso de dos partı́culas con espı́n s = 2, como dos electrones o bien un par de
1
protones. Para cada partı́cula, s = 2 y ms = ± 12 . En el marco desacoplado los electrones podrı́an estar en
cualquiera de los cuatro estados

α1 α2 , α1 β2 , β1 α2 , β1 β2 . (202)

Estos cuatro estados están especificados en la Fig. 28. Los momentos angulares individuales yacen en posiciones
indeterminadas sobre sus conos, y el momentum angular total es indeterminado.
Ahora consideremos el marco acoplado. La condición triangular (o la serie de Clebsch-Gordan) nos dice que el
espı́n total S (mayúsculas son usadas para denotar el momentum angular de conjuntos de partı́culas) puede
tomar los valores 1 o 0. Cuando S = 0, existe solo un único valor posible de la componente z, a saber 0,
correspondiendo a MS = 0. Tal estado acoplado es llamado un singlete. Cuando S = 1, MS = +1, 0, −1, y ası́
este arreglo acoplado es llamado un triplete.

68
Figura 28: Los cuatros estados desacoplados de un sistema compuesto por dos partı́culas de espı́n- 12 (como los
electrones), ilustrados por los conos sobre los que los espines individuales yacen.

El modelo vectorial del triplete es mostrado en la Fig. 29. Los conos han sido dibujados a escala, y de esta
ilustración muchas observaciones se hacen evidentes. El primero, para obtener un resultado correspondiente a
√ p
S = 1 (de longitud 2) usando vectores componentes correspondientes a s = 12 (de longitud 3/4), los vectores
deben yacer sobre un ángulo relativo definido. De hecho, deben yacer en el mismo plano, como se muestra en
la ilustración, solo esa orientación resulta en un vector de la longitud correcta. Notemos que aunque los espines
se dicen “paralelos” en un estado triplete (lo que representa como ↑↑), en realidad están en un ángulo agudo
(cercano a 70◦ ). Los dos espines hacen el mismo ángulo entre ellos en los estados con MS = ±1; esto es necesario
si es que queremos obtener el mismo resultante.

Figura 29: Tres de los cuatro estados acoplados de un sistema compuesto por dos partı́culas de espı́n- 12 . Todos
estos estados corresponden a S = 1. Las orientaciones relativas de los momentos angulares individuales son los
mismos en todos los casos (el ángulo es arc cos(1/3) = 70,53◦ ).

69
Figura 30: El estado acoplado restante del sistema de dos partı́culas de espı́n- 12 . Este estado corresponde a
S = 0. Notemos que los dos momentos contribuyentes son perfectamente antiparalelos.

El modelo vectorial del singlete debe representar un estado en el que los vectores del momentum angular de
espı́n se sumen para entregar un resultante nulo (Fig. 30). De la ilustración es claro que los dos espines en
este estado son realmente antiparalelos (↑↓). Como en los estados de triplete, solo la orientación relativa de los
vectores está fija; la orientación absoluta está completamente indeterminada.

9.8. La relación entre los esquemas


El estado |j1 j2 ; jmj i se construye a partir de todos los valores de mj1 y mj2 tal que mj1 + mj2 = mj . Esta
observación sugiere que deberı́a ser posible expresar el estado acoplado como una suma sobre todos los estados
desacoplados |j1 mj1 ; j2 mj2 i que satisfacen mj1 + mj2 = mj . Se sigue que debemos poder escribir
X
|j1 j2 ; jmj i = C(mj1 , mj2 ) |j1 mj1 ; j2 mj2 i . (203)
mj1 ,mj2

Los coeficientes C(mj1 , mj2 ) son llamados coeficientes de acoplamiento vectorial. Nombres alternativos
son “coeficientes de Clebsch-Gordan”, “coeficientes de Wigner” o “sı́mbolos 3j”.
Ilustraremos el uso de estos coeficientes considerando los estados de singlete y triplete de dos partı́culas de
espı́n- 21 . Los valores están dados en la Tabla IV (revisar Apéndice 2 del libro guı́a del curso para más valores
en otros casos). Los valores en la tabla implican que, usando la notación |S, MS i,
 
1
|1, +1i = α1 α2 , |1, 0i = √ α1 β2 + β1 α2 , (204)
2
 
1
|1, −1i = β1 β2 , |0, 0i = √ α1 β2 − β1 α2 . (205)
2

Hay dos puntos que notar. El primero, incluso un estado triplete “espı́n paralelo” (↑↑) puede estar compuesto de
espines “opuestos” (ver composición de |1, 0i). Segundo, el signo + en |1, 0i se interpreta como que los espines
contribuyentes, α y β, están en fase entre ellos (como es sugerido por el diagrama vectorial para este estado),
mientras que el signo − en |0, 0i significa que estos están desfasados. Esta caracterı́stica también es capturada
por el arreglo antiparalelo de vectores en el diagrama vectorial.

70
1
Tabla IV: Coeficientes de acoplamiento vectorial para s1 = s2 = 2
ms1 ms2 |1, +1i |1, 0i |0, 0i |1, −1i
+ 12 + 12 1 0q 0q 0
1 1 1 1
+2 −2 0 0
q2 2
q
− 12 + 12 0 1
2 − 12 0
1 1
−2 −2 0 0 0 1

Expresiones generales para los coeficientes de acoplamiento vectorial pueden ser derivadas, pero son bastante
complicadas y usualmente lo más simple es usar tablas de valores numéricos. Estos valores pueden ser derivados
de forma bastante simple en casos especiales. En la siguiente subsección se detallará el procedimiento para
encontrar los valores en la Tabla IV (o no?, Tarea? Todo depende del tiempo).

9.8.1. Ejemplo coeficientes de acoplamiento vectorial

Tarea??

9.9. El acoplamiento de varios momentos angulares


El punto final es discutir qué pasa cuando tres o más momentos están acoplados. En el caso de tres momentos,
tenemos la elección de primero acoplar j1 con j2 para formar j1,2 , y luego acoplarlo a j3 , para con esto obtener
el resultante j.
Cuando hay más de dos fuentes de momentum angular, los estados completos pueden ser formados de diferentes
maneras. Ası́, en vez del esquema descrito anteriormente, j1 y j3 pueden ser acoplados primero, para formar
j1,3 , y luego acoplamos j2 a j1,3 para formar j. La condición triangular aplica en cada paso en el proceso de
acoplamiento, pero las composiciones de estados obtenidas son diferentes. Los estados obtenidos por el primer
procedimiento de acople pueden ser expresados como combinaciones lineales de los estados obtenidos por el
segundo procedimiento, y los coeficientes de expansión son conocidos como coeficientes de Racah o como
‘sı́mbolos 6j”. La pregunta acerca de esquemas de acoplamiento alternativos, y de como seleccionar los más
apropiados, surge en discusiones de espectro atómico y molecular.

71
10. Teorı́a de grupos
El tema de esta sección -la teorı́a matemática de la simetrı́a- es uno de los más notables de la mecánica
cuántica. Su aplicación no solo simplifica los cálculos, sino que también revela conexiones inesperadas entre
fenómenos aparentemente dispares. Tópicos de estudios completos se logran unir en términos de estos conceptos.
El momentum angular es parte de la teorı́a de grupos; también las propiedades del oscilador armónico. La
conservación de la energı́a y del momentum pueden ser discutidas en términos de la teorı́a de grupos. La teorı́a
de grupos se usa para clasificar las partı́culas fundamentales, para discutir las reglas de selección que gobiernan
qué transiciones espectroscópicas son permitidas, y para formular los orbitales moleculares. Este tema es de
gran importancia en el desarrollo de la fı́sica y también en la quı́mica, como veremos más adelante.

10.1. La simetrı́a de objetos


Comenzamos estableciendo los aspectos cualitativos de las simetrı́as de objetos. Esto nos permitirá clasificar
moléculas de acuerdo a sus simetrı́as. Una vez que las moléculas han sido clasificadas, muchas propiedades se
desprenden de forma inmediata. Aún más, este es el primer paso a una formulación matemática de la teorı́a, de
la que deriva su completo potencial.

10.1.1. Operaciones de simetrı́a y elementos

Una operación aplicada sobre un objeto corresponde al acto de hacer algo a este, tal como rotarlo un de-
terminado ángulo, o trasladarlo, etc. Una operación de simetrı́a es una operación que deja a un objeto
aparentemente sin cambios. Por ejemplo, la rotación de una esfera alrededor de cualquier eje que incluya su
centro la deja aparentemente sin cambios, y es luego una operación de simetrı́a. La traslación de la función
sin(x) en un intervalo de 2π la deja aparentemente sin cambios, luego esta es una operación de simetrı́a de la
función. No todas las operaciones son operaciones de simetrı́a. La rotación en 90◦ de un rectángulo es solo una
operación de simetrı́a si es que el rectángulo resulta también ser un cuadrado. Cada objeto tiene al menos una
operación de simetrı́a: la identidad, la operación que no hace nada.
A cada operación de simetrı́a le corresponde un elemento de simetrı́a, el punto, la lı́nea o plano respecto al que
la operación se realiza. Por ejemplo, una rotación se realiza respecto a una lı́nea llamada “eje de simetrı́a”, una
reflexión se lleva a cabo respecto a un plano, llamado “plano de reflexión” o “plano especular”. Sin considerar
las operaciones de simetrı́a traslacionales, existen cinco tipos de operaciones de simetrı́a que podrı́an dejar a un
objeto aparentemente sin cambios, y cinco correspondientes tipos de elementos de simetrı́a: E, Cn , σ, i y Sn .

E: La operación identidad, el acto de hacer nada. El correspondiente elemento de simetrı́a es el mismo


objeto.

Cn : Una rotación de orden n, la operación es una rotación en 2π/n alrededor de su elemento, el eje de
simetrı́a.

Un hexágono, o una molécula hexágonal, como el benceno, tiene ejes de orden 2, 3 y 6 (C2 , C3 y C6 , respecti-
vamente), perpendiculares al plano y varios ejes de orden 2 (C2 ) en el plano que define al molécula (Fig. 31).
Para n > 2 la dirección de rotación es importante, y las n orientaciones de un objeto se encuentran en un orden
diferente dependiendo si la rotación es horaria, vista desde abajo (Cn+ ), o antihoraria (Cn− ). Luego, para n > 2,
existen dos rotaciones asociadas con cada eje de simetrı́a. Si un objeto (como por ejemplo, un hexágono) tiene
varios ejes de rotación, luego aquel con el mayor valor de n es llamado el eje principal, siempre que sea único.
Ası́, para el benceno, C6 es el eje principal.

72
Figura 31: Algunos de los ejes de rotación de un hexágono regular, como la molécula de benceno.

σ: Una reflexión, la operación tiene como elemento el plano especular.

Cuando el plano especular incluye el eje principal de simetrı́a, se denomina plano vertical y se denota como
σv . Si el eje principal es perpendicular al plano especular, luego el elemento de la reflexión es llamado un plano
horizontal, y se denota por σh . Un plano diédrico, σd , es un plano vertical que biseca el ángulo entre dos
ejes C2 que yacen perpendiculares al eje principal (Fig. 32).

i: Una inversión, operación cuyo elemento es un centro de simetrı́a.

Figura 32: (a) Dos planos especulares verticales, (b) un plano especular horizontal, y (c) un plano especular
diédrico.

La operación de inversión es una operación hipotética que consiste en tomar cada punto de un objeto a través
de su centro y hacia afuera una distancia igual hacia el otro lado (Fig. 33).

Figura 33: El centro de inversión de un octaedro regular.

Sn : Una rotación impropia de orden n, la operación (que es también llamada una “reflexión-rotatoria”)
ocurre alrededor de un eje de rotación impropio, el elemento de simetrı́a (o “eje de reflexión-rotatoria”).

73
Una rotación impropia es una operación compuesta que consiste de una rotación de orden n seguida por una
reflexión horizontal en un plano perpendicular al eje de orden n (el order de las operaciones Cn y σh realmente
no es importante, dado que estas operaciones conmutan, como veremos más adelante). En general, aún cuando
ambas operaciones por si solas pueden no ser operaciones de simetrı́a del objeto, pero el resultado final compuesto
sı́ lo serı́a. Una molécula de metano, por ejemplo, tiene tres ejes S4 (Fig. 34). Se debe tener cuidado al reconocer
rotaciones impropias “disfrazadas”. Ası́, S1 es equivalente a una reflexión, y S2 es equivalente a una inversión.

Figura 34: Un eje de una rotación impropia en una molécula tetraédrica (como el metano).

10.2. Clasificación de moléculas


Para clasificar una molécula de acuerdo a sus simetrı́as, listamos todas sus operaciones de simetrı́a, y luego
asignamos una etiqueta basada en la lista de estas operaciones. En otras palabras, usamos la lista de las opera-
ciones de simetrı́a para identificar el grupo puntual de la molécula. El término “puntual” indica que hemos
considerado solo las operaciones correspondientes a elementos de simetrı́a que intersectan en al menos un punto.
Tal punto no es movido por ninguna operación. Para clasificar cristales, también necesitaremos considerar la
simetrı́a traslacional, que nos llevará a clasificarlos de acuerdo a su grupo espacial.

Figura 35: Notación en sistema Schoenflies e Internacional para grupos puntuales. Las entradas en la tabla
están en la forma Schoenflies: Internacional. El Sistema Internacional es también conocido como el sistema
Hermann-Mauguin. El grupo D2 :222 es a menudo denotado por V y llamado el grupo Vierer (grupo de cuatro).

El nombre del grupo puntual se expresa usando el Sistema Schoenflies o bien el Sistema Internacional.

74
Es común usar el primero para moléculas individuales y el último cuando consideramos especies en sólidos. Acá
usaremos el sistema Schoenflies, pero una tabla de traducción entre sistema es dada en la Fig. 35. En el sistema
Schoenflies, el nombre del grupo puntual se basa en alguna propiedad dominante de la simetrı́a de la molécula,
y la etiqueta dada al grupo es en algunos casos la misma etiqueta de la propiedad. Este doble uso de un sı́mbolo
es bastante útil, y raramente lleva a confusión.

1. Los grupos C1 , Cs y Ci : estos grupos consisten de solo la identidad (C1 ), la identidad y una reflexión (Cs ),
y la identidad y una inversión (Ci ) (Fig. 36).

2. Los grupos Cn : consisten de una identidad y una rotación de orden n (Fig. 37).

3. Los grupos Cnv : además de las operaciones de los grupos Cn , estos grupos también contienen n reflexiones
verticales (Fig. 38). Un ejemplo importante es el grupo C∞v , el grupo al que pertenen el cono y la molécula
diatómica heteronuclear.

4. Los grupos Cnh : además de las operaciones de los grupos Cn , estos grupos también contienen una reflexión
horizontal junto con cualquier operación que la presencia de estas últimas implique (Fig. 39).

Figura 37: Un objeto que pertenece al grupo C4 .

Figura 36: Objetos pertenecientes a los grupos (a) C1 ,


(b) Cs y (c) Ci .

Figura 38: Un objeto que pertenece al grupo C4v .

Figura 39: Un objeto que pertenece al grupo C4h .

75
Es importante notar, como observación en la última definición, que la presencia de un conjunto particular
de operaciones puede implicar la presencia de otras operaciones que no son mencionadas explı́citamente en la
definción. Por ejemplo, C2h automáticamente posee una inversión, debido a que rotaciones por 180◦ seguidas
por una reflexión horizontal es equivalente a una inversión. El conjunto completo de operaciones en cada grupo
se puede encontrar en las “tablas de carácter”, algunas de ellas listadas en el Apéndice 1 del libro guı́a del
curso. Estas tablas contienen mucha información adicional y tomarán cada vez más importancia a medida que
el capı́tulo progrese.

5. Los grupos Dn : además de las operaciones de los grupos Cn , estos grupos poseen n rotaciones de orden 2
perpendiculares a los n ejes (principales) de orden n, junto con cualquier operación que estas impliquen
(Fig. 40).

6. Los grupos Dnh : consisten de las operaciones presentes en Dn junto a una reflexión horizontal, además de
cualquiera de las operaciones que estas impliquen (Fig. 41). Un ejemplo importante es D∞h , el grupo al
que pertenece un cilindro uniforme y una molécular diatómica homonuclear.

7. Los grupos Dnd : contienen las operaciones de los grupos Dn y n reflexiones diédricas, junto a todas las
operaciones que se implican (Fig. 42).

8. Los grupos Sn , con n par: contienen la identidad y una rotación impropia de orden n, junto a todas las
operaciones que la presencia de estas operaciones implique (Fig. 43).

Figura 40: D4 . Figura 41: D4h .

Figura 42: D4d . Figura 43: S4 .

Solo los valores pares de n necesitan ser considerados, dado que grupos con n impar son idénticos a los grupos
Cnh , que ya han sido clasificados. Notemos también que el grupo S2 es equivalente al grupo Ci .

76
9. Los grupos cúbicos e icosaedros: contienen más de una rotación de orden n, con n ≥ 3. Los grupos cúbicos
están etiquetados por T (por tetraedro) y O por octaedro; el grupo icosaedro es etiquetado por I. El grupo
Td es el grupo del tetraedro regular; T es el mismo grupo pero sin las reflexiones del tetraedro; Th es un
grupo tetraédrico con una inversión. El grupo del octaedro regular es llamado Oh ; si no tiene reflexiones
es llamado O. El grupo del icosaedro es llamado Ih ; si no tiene inversión se llama I. Algunos objetos que
pertenecen a estos grupos puntuales están ilustrados en las Figs. 44, 45 y 46, respectivamente.

Figura 44: Objetos que pertenecen a los grupos (a) Td , (b) T y (c) Th .

Figura 46: Objeto que pertenece


al grupo I.

Figura 45: Objetos que pertene-


cen a los grupos (a) Oh y (b) O.

10. El grupo de rotación completa R3 : consiste en todas las rotaciones en cualquier ángulo y en cualquier
orientación. Es el grupo de simetrı́a de la esfera.

Los átomos pertenecen a R3 , pero las moléculas no. Las propiedades de R3 resultan ser las propiedades del
momentum angular. Esta es la relación profunda entre este capı́tulo y el anterior, que exploraremos más adelante.

77
Existen dos formas simples de determinar a qué grupo puntual pertenece una molécula. Una manera es usar el
árbol de decisión ilustrado en Fig. 47. La otra es reconocer el grupo al comparar la molécula con los objetos en
Fig. 48.

Figura 47: Diagrama de flujo para decidir el nombre del grupo puntual al que un objeto pertenece.

78
Figura 48: Formas representativas para una variedad de grupos puntuales.

Cómo asignar un grupo puntual a una molécula: ¿cuál es el grupo puntual de la molécula de
benceno, C6 H6 ?

Método: Use el diagrama de flujo dado en Fig. 47, reconociendo que el benceno tiene un único eje principal C6
que es perpendicular al plano de la molécula.

Respuesta: El benceno, una molécula no-lineal, no contiene dos (o más) ejes principales: C6 es un eje prin-
cipal único y existen seis ejes C2 en el plano molecular y perpendiculares a C6 ; tres ejes intersectan átomos de
carbono en vértices opuestos y tres ejes bisecan enlaces carbono-carbono sobre aristas opuestas (Fig. 49). El
plano molecular es σh . De Fig. 47, el grupo puntual es D6h .

Tarea: Asignar un grupo puntual a la molécula 1, 4-diclorobenceno.

Figura 49: Estructura de una molécula de benceno, C6 H6 .

Figura 50: Estructura de una molécula de 1, 4-diclorobenceno.

79
10.3. El cálculo de simetrı́a
El poder de la teorı́a de grupos viene de su estructura matemática. La siguiente sección estará dividida en dos
partes. La primera considera las operaciones de simetrı́a mismas y muestra como estas pueden ser combinadas.
La segunda etapa muestra como asociar matrices con cada operación de simetrı́a y a obtener las propiedades
de las matrices para establecer varios resultados importantes.

10.3.1. Definición de grupo

Las operaciones de simetrı́a pueden ser realizadas de forma consecutiva. Usaremos la convención de que la
operación R seguida de la operación S se denota como SR. El orden de las operaciones es importante dado que
en general el resultado de la operación SR no es el mismo que el resultado de la operación RS. Cuando los
resultados de RS y SR son equivalentes, se dice que las operaciones conmutan. Una propiedad general de las
operaciones de simetrı́a es que el resultado de una operación de simetrı́a compuesta es siempre equivalente a
una alguna operación de simetrı́a. Ya hemos visto esta propiedad cuando notamos que una rotación de orden 2
seguida por una reflexión en un plano perpendicular al eje de orden 2 es equivalente a una inversión:

σh C 2 = i . (206)

Tarea: Mostrar que 1) σh C2 = i, 2) iσh = C2 y 3) C2 i = σh .


En general, esto es cierto para todas las operaciones de simetrı́a R y S sobre un objeto, y podemos escribir

RS = T , (207)

con T una operación del grupo.


Un punto más sobre las operaciones de simetrı́a es que no hay diferencia entre el resultado de las operaciones
(RS)T y R(ST ), donde (RS) es la operación compuesta S seguida por R y (ST ) corresponde a la operación T
seguida por S. En otras palabras, (RS)T = R(ST ) y la multiplicación de operaciones de simetrı́a es asociativa.

Ejemplo: Propiedad asociativa de multiplicación de operaciones de simetrı́a

Consideremos un objeto cuadrado y las operaciones de simetrı́a C2 (coincidente con el eje principal (C4 )), i y
σh . Luego, C2 (iσh ) = C2 C2 = E y (C2 i)σh = σh σh = E y la propiedad de asociatividad se cumple. 

Estas observaciones, junto con otras dos que pueden ser comprobadas por inspección, son resumidas como sigue:

1. La identidad es una operación de simetrı́a.

2. Operaciones de simetrı́a se combinan de acuerdo con la regla asociativa de multiplicación.

3. Si R y S son operaciones de simetrı́a, luego RS es también una operación de simetrı́a.

4. La inversa de cada operación de simetrı́a es también una operación de simetrı́a.

La tercera observación implica que R2 (que es una forma corta de escribir RR) es una operación de simetrı́a.
En observación 4, la inversa de una operación R, generalmente denotada por R−1 , se define tal que

RR−1 = R−1 R = E . (208)

80
Definición de un grupo.

El punto notable es que en matemáticas un conjunto de entidades (junto a una determinada operación interna)
llamadas elementos forman un grupo si (bajo la operación interna) estas satisfacen las siguientes condiciones:

1. La identidad es un elemento del conjunto.

2. Los elementos se multiplican asociativamente.

3. Si R y S son elementos del conjunto, luego RS es también un elemento del conjunto.

4. La inversa de cada elemento pertenece también al conjunto.

Esto es, el conjunto de operaciones de simetrı́a (junto a la determinada operación interna) es un objeto que
satisface las condiciones que aseguran que este forma un grupo desde el punto de vista matemático. Como
consecuencia, la teorı́a matemática de los grupos, llamada teorı́a de grupos, puede ser aplicada al estudiar la
simetrı́a de las moléculas.

10.3.2. Tablas de multiplicación de grupos

Una tabla que muestra el resultado de las operaciones compuestas RS para todas las operaciones de simetrı́a
en un grupo es llamada una tabla de multiplicación de grupo. El procedimiento usado para construir estas
tablas será ilustrado usando el grupo C3v . Las operaciones de simetrı́a para este grupo están ilustradas en la
Fig. 51. Vemos que hay seis elementos en este grupo, ası́ que decimos que el grupo tiene orden 6, lo que se
puede escribir como h = 6.

+
Figura 51: Los elementos de simetrı́a del grupo C3v . Figura 52: El efecto de la operación C3 seguida por σv
es equivalente a la operación σv 00 .

Para determinar el resultado de una secuencia de operaciones de simetrı́a, consideramos diagramas como los
de la Fig. 52. Debemos notar que la secuencia de cambios son respecto a posiciones fijas de los elementos de
simetrı́a, en el sentido que si se realiza una operación C3+ , la lı́nea representando el plano σv en la Fig. 51
permanece en la misma posición en la página y no es rotada en 120◦ por la operación σv . Luego, se sigue que

C3− C3+ = E , σv C3− = σv00 , σv00 σv0 = C3+ . (209)

81
El conjunto completo de 36 (en general, h2 ) productos se muestra en la Tabla V. Como podemos ver, cada
producto es equivalente a un único elemento del grupo. Notemos que RS no es siempre el mismo que SR; esto
es, no todas las operaciones de simetrı́a conmutan. Tablas similares pueden ser construidas para todos los grupos
puntuales.

Tabla V : Tabla multiplicativa de C3v


Primer: E C+3 C−3 σv σv0 σv00
Segundo:
E E C3+ C3− σv σv0 σv00
C+ 3 C3+ C3− E σv0 σv00 σv
C− 3 C3− E C3+ σv00 σv σv0
σv σv σv00 σv0 E C3− C3+
σv0 σv0 σv σv00 C3+ E C3−
σv00 σv00 σv0 σv C3− C3+ E

Observación: Notar que de la Tabla V podemos encontrar un subgrupo de C3v .


Tarea: Buscar un par de ejemplos de operaciones del grupo C3v que no conmutan. Verificar estos resultados
con diagramas del tipo mostrado en Fig. 52.

Ejemplo: Construcción de una tabla multiplicativa de un grupo.

Construya la tabla de multiplicación para el grupo C2v , los elementos son mostrados en Fig. 53.

Figura 53: Los elementos de simetrı́a del grupo C2v .

Método: Consideremos un único punto sobre el objeto de un determinado grupo puntual, y el efecto sobre tal
punto de cada par de operaciones de simetrı́a (RS). Identifique la única operación que reproduce el efecto de
las operaciones conjuntas (RS = T ), y regı́strela en la tabla. Note que ER = RE = R, para todo R, donde E
es la operación identidad. La orientación de los elementos de simetrı́a sobre la página permanece sin cambios
bajo todas las operaciones.
Resultado: La tabla de multiplicación del grupo es

Tabla VI : C2v
Primer: E C2 σ v σv0
Segundo:
E E C 2 σv σv0
C2 C2 E σv0 σv
0
σv σv σv E C2
σv0 σv0 σv C 2 E

Observación: Notemos que en este grupo RS = SR para todas las entradas en la tabla. Grupos de este tipo,

82
en los que los elementos conmutan, son llamados grupos Abelianos. El grupo C3v es un ejemplo de un grupo
no-Abeliano.
Tarea: Construya la tabla multiplicativa para el grupo D3 , con los elementos dados en Fig. 54.

Figura 54: Los elementos de simetrı́a del grupo D3 .

10.3.3. Representación matricial

Relaciones como RS = T son representaciones simbólicas del efecto de la acción generada sobre los objetos.
Podemos enriquecer esta representación simbólica de las operaciones de simetrı́a mediante el uso de entidades
que pueden ser manipuladas algebráicamente. Sin embargo, debido a que las operaciones de simetrı́a son en
general no-conmutativas (esto es, su resultado depende del orden en el que se aplican), debemos considerar la
necesidad de usar matrices en vez de simples números, ya que en general la multiplicación matricial es también
no-conmutativa. El representante matricial de una operación de simetrı́a es una matriz que reproduce el
efecto de la operación de simetrı́a (de una manera que describiremos más adelante). Una representación
matricial es un conjunto de representantes, uno por cada elemento del grupo, que se multiplican entre ellos
siguiendo las reglas establecidas por la tabla de multiplicación del grupo.

Figura 55: Una base para la discusión de la representación del grupo C3v ; cada esfera puede ser pensada como
un orbital s centrado en un átomo.

Para establecer un representante matricial para una operación particular de un grupo, necesitamos escoger
una base, un conjunto de funciones sobre las que las operaciones actúan. Para ilustrar este procedimiento,
consideremos un conjunto de orbitales s; sN , sA , sB y sC en una molécula de NH3 (Fig. 55), que pertenece al
grupo C3v . Escogemos esta base en parte debido a que es lo suficientemente simple para ilustrar un número

83
de propiedades de una manera directa pero también debido a que será usada en la discusión de la estructura
electrónica de una molécula de amonı́aco cuando construyamos orbitales moleculares. La dimensión de esta base
(el número de miembros) es 4. Podemos escribir la base como un vector de cuatro componentes (sN , sA , sB , sC ).
En general, una base de dimensión d puede ser escrita como un vector fila f , donde

f = (f1 , f2 , · · · , fd ) . (210)

Bajo la operación σv , el vector cambia de (sN , sA , sB , sC ) a σv (sN , sA , sB , sC ) = (sN , sA , sC , sB ). Esta transfor-


mación puede ser representada por una multiplicación matricial:
 
1 0 0 0
 
0 1 0 0
σv (sN , sA , sB , sC ) = (sN , sA , sB , sC ) 
0
 . (211)
 0 0 1
0 0 1 0

Esta representación del efecto de la operación de simetrı́a puede ser verificado realizando la multiplicación
matricial. La matriz en esta expresión es la representante de la operación σv para la base elegida, y es denotada
por D(σv ). Notemos que una base cuadridimensional da pie a una representante 4 × 4-dimensional, y que en
general una base d-dimensional generará una representante d×d-dimensional. En términos de las reglas explı́citas
de la multiplicación matricial, el efecto de una operación R sobre la base general f es convertir la componente
fi en
X
Rfi = fj Dij (R) , (212)
j

donde Dij (R) es un elemento matricial de la representante D(R) de la operación R. Por ejemplo,

σv sB = sN × 0 + sA × 0 + sB × 0 + sC × 1 = sC , (213)

como es requerido.
Las representantes de las otras operaciones del grupo pueden ser encontradas de la misma forma. Notemos que
debido a que Ef = f , la representante de la operación identidad es siempre la matriz unitaria.
El set completo de representantes para esta base está dado en la tabla de la Fig. (56). Ahora nos toca discutir
sobre un tema de central importancia. Consideremos el efecto de las operaciones consecutivas C3+ seguida por
σv . De la tabla multiplicatica del grupo sabemos que el efecto de la operación conjunta σv C3+ es el mismo que
el efecto de la reflexión σv00 . Esto es,
σv C3+ = σv00 . (214)

Consideremos ahora esta operación en términos de las matrices representantes.


   
1 0 0 0 1 0 0 0 1 0 0 0
    
0 1 0 0 0 0 0 1 0 0 0 1 = D(σv00 ) .
D(σv )D(C3+ ) = 
    
0 = (215)
 0 0 1 0
 1 0 0 0 0 1 0
0 0 1 0 0 0 1 0 0 1 0 0

Esto es, las representantes matriciales se multiplican en exactamente la misma forma que las operaciones del
grupo. Esto es cierto para cualquier operación que sea considerada, y ası́, el conjunto de seis matrices 4 × 4 en

84
la Tabla de la Fig. (56) forman una representación matricial del grupo para la base elegida en el sentido que,

si RS = T , luego D(R)D(S) = D(T ) , (216)

para todos los elementos R, S y T del grupo.

Figura 56: Representación matricial de C3v en la base (sN , sA , sB , sC ).

Del hecho que las representantes se multiplican como los elementos del grupo se desprende que las representantes
de una operación R y su inversa R−1 están relacionadas por

D(R−1 ) = (D(R))−1 , (217)

donde (D(R))−1 denota la matriz inversa de D(R). Como caso particular, dado que RR−1 = E, se sigue que

D(R)D(R−1 ) = D(R)D(R)−1 = 1 = D(E) , (218)

donde 1 es la matriz unidad.

10.3.4. Las propiedades de las representaciones matriciales

Para desarrollar el tema de representaciones matriciales, necesitamos introducir algunas de sus propiedades. En
cada caso introduciremos el concepto usando la base del orbital s para C3v para fijar ideas, y luego generaliza-
remos el concepto usando una base arbitraria de un grupo arbitrario.

Comenzamos con el concepto de transformación de similitud. Supongamos que en vez de la base del orbital
s, elegimos una combinación lineal de estos orbitales como base. Un posible conjunto podrı́a ser (sN , s1 , s2 , s3 ),
donde s1 = sA +sB +sC , s2 = 2sA −sB −sC , y s3 = sB −sC (además del requerimiento de que las combinaciones
sean linealmente independientes, la elección es arbitraria, pero veremos más adelante que este conjunto tiene un
significado especial). Estas combinaciones son ilustradas en la Fig. 57. Debemos esperar que la representación
matricial en esta base sea similar a la de la base original. Esta similaridad es dada por una definición formal:
decimos que estas representaciones son similares si las representantes para las dos bases están relacionadas

85
mediante una transformación de similaridad,

D(R) = c D0 (R) c−1 , (219)

donde c es la matriz formada por los coeficientes relacionando las dos bases. La relación inversa se obtienen al
multiplicar por la izquierda por c−1 y por la derecha por c:

D0 (R) = c−1 D(R) c . (220)

Figura 57: Las combinaciones lineales adaptadas a la simetrı́a de los orbitales átomicos periféricos en una
molécula C3v .

Ejemplo: Cómo construir una transformación de similitud.

La representante de la operación C3+ en C3v para la base s orbital es dada en la tabla en la Fig. 56. Derive una
expresión para la representante en la base transformada dada al comienzo de esta subsección.

Método: Para implementar la receta de la Ec. (219) necesitas construir las matrices c y c−1 . Luego, comenzamos
expresando la relación entre las dos bases en forma matricial (como f 0 = f c), y encontrando el recı́proco de c
según los métodos del álgebra matricial. Finalmente, evaluamos el producto matricial c−1 D(R) c.

Resultado: La relación entre las dos bases,

sN = sN , s1 = sA + sB + sC , s2 = 2sA − sB − sC , s3 = sB − sC , (221)

86
puede ser escrita como la siguiente matriz:
 
1 0 0 0
 
0 1 2 0
(sN , s1 , s2 , s3 ) = (sN , sA , sB , sC )   , (222)
0
 1 −1 1
0 1 −1 −1

lo que nos lleva a identificar a la matriz c. La inversa de esta matrix es


 
6 0 0 0
 
1 0 2 2 2
c−1

=   . (223)
6
0 2 −1 −1

0 0 3 −3

La representante de C3v en la nueva base es luego

D0 (C3+ ) = c−1 D(C3+ ) c


   
6 0 0 0 1 0 0 0 1 0 0 0
   
1 0 2 2
 2  0
  0 0 1 0
  1 2 0
=  
60 2 −1 −1 0
 1 0 0 0
 1 −1 1

0 0 3 −3 0 0 1 0 0 1 −1 −1
 
2 0 0 0
 
1 0 2 0
 0
=   .
20 0 −1 −1
0 0 3 −1

Tarea: Encuentre el representante de la operación σv en la base transformada.

Figura 58: Representación matricial de C3v en la base (sN , s1 , s2 , s3 ).

La misma técnica que se ilustró en el ejemplo puede ser aplicado a otras representante, y los resultados se
muestran en la tabla de la Fig. 58.

87
10.3.5. El carácter de las representaciones

Existe una caracteristica clave en las dos represetanciones en las tablas de las Figs. 56 y 58. Aún cuando las
matrices difieren para ambas bases, para una determinada operación la suma de los elementos de la diagonal
de los representantes es la misma en ambas bases. La suma diagonal de los elementos matriciales es llamada el
carácter de una matriz, y es denotada por χ(R);
X
χ(R) = Dii (R) . (224)
i

En álgebra matricial, la suma de los elementos de la diagonal es llamada la traza de la matriz, y se denota por
tr. Luego, una definción sucinta del carácter de la operación R serı́a

χ(R) = tr{D(R)} . (225)

Ahora, el carácter de una operación es invariante bajo una transformación de similaridad de la base. La prueba
de esta propiedad se base en el hecho de que la traza de un producto de matrices es invariante bajo la permutación
cı́clica de las matrices:
tr{ABC} = tr{CAB} = tr{BCA} . (226)

Tarea: Probar la propiedad de invariancia de la traza de una matriz y del carácter de un representante.

10.3.6. Caracteres y clases

Una propiedad mostrada en las tablas de las Figs. 56 y 58 es que los caracteres de las dos rotaciones son los
mismos, tal como son los caracteres de las tres reflexiones. Estas igualdades sugiere que las operaciones caen en
diferentes clases que pueden ser distinguidas por sus caracteres.

La definición formal de la clase de una operación de simetrı́a es que dos operaciones R y R0 pertenecen a la
misma clase si existe alguna operación de simetrı́a S del grupo tal que

R0 = S −1 R S . (227)

Los elementos R y R−1 se dicen conjugados. Los miembros conjugados pertenecen a la misma clase. La
interpretación fı́sica de la conjugación y de la pertenencia a clases es que R y R0 son el mismo tipo de operación
(tal como una rotación) pero actúan con respecto a elementos de simetrı́a que están relacionados por una
operación de simetrı́a.

Ejemplo: Cómo mostrar que dos operaciones de simetrı́a son conjugadas.

Muestre que las operaciones de simetrı́a C3+ y C3− son conjugadas en el grupo C3v .

Método: Necesitamos mostrar que existe una transformación de simetrı́a del grupo que transforma C3+ en C3− ,
según Ec. (227). Intuitivamente, sabemos que la reflexión de una rotación en un plano vertical invierte el sentido
de rotación, por lo que podemos sospechar que una reflexión es la operación que necesitamos. Para encontrar
el efecto de una sucesión de operaciones, usamos la información en la tabla de multiplicación de grupo (Tabla
V); para encontrar el recı́proco de una operación tenemos que buscar al elemento que produce una identidad E

88
en la tabla de multiplicación de grupo.

Resultado: Consideramos que S = σv y luego la operación conjunta σv−1 C3+ σv . De acuerdo a la Tabla V, la
inversa de σv es la misma σv . Por lo tanto, de la tabla de multiplicación de grupo, podemos escribir

σv−1 C3+ σv = σv (C3+ σv ) = σv σv0 = C3− . (228)

Ası́, las dos rotaciones pertenecen a la misma clase.

Tarea: Muestre que σv y σv0 son miembros de la misma clase en C3v .

Con el concepto de conjugación establecido, ahora es directo demostrar que las operaciones de simetrı́a perte-
necientes a la misma clase tienen el mismo carácter en una determinada representación.

Tarea: Pruebe la invariancia del carácter.

Una observación para tener cuidado: aunque es cierto que en una determinada representación todos los miembros
de la misma clase tienen el mismo carácter, los caracteres de diferentes clases pueden ser los mismos entre ellos.

89

También podría gustarte