Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Marcela Lagos F.
Instituto de Ciencias Fı́sicas y Matemáticas, Universidad Austral de Chile, Valdivia, Chile.
marcelagosf@gmail.com
16 de diciembre de 2020
Unidad 1
Fundamentos y postulados de la mecánica cuántica
Ecuación de Schrödinger
• Oscilador armónico
• Partı́cula en la caja
• Etc.
Átomo de Hidrógeno
1
Bibliografı́a
Atkins-Friedman “Molecular Quantum Mechanics” Oxford University Press, ISBN: 978-0-19-927498-7.
La dualidad de la materia
El espectro atómico
Primeros y muy importantes experimentos que mostrarı́an la necesidad de una nueva “formulación”de la fı́sica
y motivarı́an la revolución cuántica.
El surgimiento de la ideas detrás de la mecánica cuántica, principalmente propuestas por Planck, Einstein,
Heisenberg, Schröndinger, Dirac, entre otros, y su posterior formalización es uno de los logros cientı́ficos más
importantes de la fı́sica.
La mecánica cuántica es el formalismo matemático que actualmente explica y predice fenómenos atómicos con
precisión extraordinaria. Abarca la descripción del comportamiento de todas las formas de materia, incluı́das
las moléculas, átomos, electrones.
2
2. Los fundamentos de la mecánica cuántica
2.1. Operadores en mecánica cuántica
Observable: cualquier variable dinámica que pueda ser medida.
Diferencia entre persepectiva clásica de la cuántica: clásicamente los observables fı́sicos son representados por
funciones (posición como función del tiempo), cuánticamente son representados por operadores matemáticos.
Operador, Ω: sı́mbolo para una instrucción de cometer una acción, una operación, sobre una función. En la
mayorı́a de los ejemplo que veremos, tal acción no será más que una multiplicación o derivación; tı́picamente,
multiplicación por x, representada por el operador x×, o la derivación respecto a x, representada por el operador
d
dx . Usualmente no se distingue entre el observable fı́sico y el operador que lo representa.
Todos los operadores en mecánica cuántica son operadores lineales, que cumplen
donde a y b son constantes y f y g son funciones. La derivación es una operación lineal, la función logaritmo
no lo es.
donde ω es una constante conocida como el autovalor de Ω. El conjunto de todos los autovalores de un operador
d2
es llamado el espectro del operador. Ejemplo: ¿Es f = cos (ax) autofunción del operador dx2 ?
Sı́, ya que podemos escribir el resultado de la acción de este operador sobre f como una ecuación de autovalores;
d2 d2 f d sin (ax)
2
f = − 2 = −a = −a2 cos (ax) .
dx dx dx
d2
Luego, f = cos (ax) sı́ es autofunción del operador dx2 , y tiene por autovalor −a2 .
Una función general puede ser expandida en términos de todas las autofunciones de un operador, esto es, las
autofunciones de un operador forman un conjunto completo de funciones. Luego, si fn es una autofunción de
un operador Ω con autovalor ωn , es decir
Ωfn = ωn fn , (3)
luego, una función general g puede ser expresada como una combinación lineal de dichas autofunciones, según
X
g= cn fn , (4)
n
3
donde las constantes cn son coeficientes y la suma es sobre el conjunto completo de funciones. ¿De qué sirve
escribir una función en términos de otras? Hacer esto nos permite deducir el efecto de un operador sobre una
función que no es una de sus autofunciones; el efecto de Ω sobre g, usando la propiedad de linealidad es
X X X
Ωg = Ω cn fn = cn Ωfn = cn ωn fn . (5)
n n n
Caso especial: conjunto degenerado de autofunciones, un subconjunto de autofunciones con el mismo autovalor.
Toda combinación lineal de autofunciones degeneradas es también una autofunción con el mismo auto valor;
k
X k
X k
X k
X
Ωg = Ω cn fn = cn Ωfn = cn ωfn = ω cn fn = ωg . (6)
n n n n
2.2. Representaciones
Diferentes elecciones de las formas explı́citas de los operadores representando a un observable particular.
La representación de posición, una de las representaciones más comunes, en la que el operador posición
es representado por la multiplicación por la coordenada (denotada por x generalmente) y el momento lineal
paralelo a la coordenada es representado por la derivación respecto a la coordenada (como consecuencia de un
postulado básico de la mecánica cuántica). Explı́citamente
~ ∂
Representación de posición: x→x× px → , (8)
i ∂x
donde ~ = h/2π.
Otra representación, la representación de momemtum, en la que el momento lineal paralelo a una coor-
denada es presentado por la operación de multiplicación por tal componente (paralelo a la coordenada x serı́a
denotado por px ) y el operador posición serı́a representado por la derivación respecto a px . Explı́citamente
~ ∂
Representación de momentum: x→− px → px × . (9)
i ∂px
4
Ejemplo 1: Consideremos los operadores x y px que operan sobre una función especı́fica f = x2 . En la repre-
sentación de posición,
~ ∂ 2 2~ 2~ 2
(xpx )x2 = x x =x x= x , (10)
i ∂x i i
mientras que
~ ∂ 3 3~ 2
(px x)x2 = px x3 = x = x . (11)
i ∂x i
Los operadores x y px no conmuntan.
Ejemplo 2: Calcular conmutador de x con px en la representación de posición. Sea f una función arbitraria
de prueba
Luego
[x, px ] = i~ . (17)
El operador de energı́a cinética T puede ser construido notando que la energı́a cinética está relacionada
con el momentum lineal según
p2
T = , (18)
2m
con m la masa de la partı́cula. Se sigue que, en tres dimensiones y en la representación de posición, el
operador energı́a cinética tiene la forma
~2
2
∂2 ∂2 ~2 2
∂
T =− + + = − ∇ . (19)
2m ∂x2 ∂y 2 ∂z 2 2m
El operador energı́a potencial de una partı́cula en una o más dimensiones es la multiplicación por la
función V (x) en la representación de posición.
5
El operador de la energı́a total de un sistema es llamado el operador hamiltoniano, denotado por H
H =T +V . (20)
~2 2 e2
H=− ∇ − . (21)
2me 4π0 r
∗
donde fm es la compleja conjugada de fm , y dτ el elemento de volumen. La integral se toma en todo el espacio
que ocupa el sistema. Casos especiales de este tipo de integrales.
Cuando Ω = 1, Z
∗
S= fm fn dτ , (23)
útil como medida de la “similaridad”de dos funciones; cuando S = 0 las funciones se fm y fn se dicen ortogonales.
Cuando S es cercano a 1 las funciones son casi idénticas. Reconocer estas propiedades de las funciones sirve a
la hora de simplificar el cálculo.
Cuando m = n tenemos la integral de normalización. Una función fm se dice normalizada si
Z
∗
fm fm dτ = 1 , (24)
Un conjunto de funciones fn que son (a) normalizadas y b mutuamente ortogonales se dice que satisfacen la
condición de ortonormalización Z
∗
fm fn dτ = δmn , (25)
6
El sı́mbolo |ni, llamado ket, denota el estado descrito por la función fn , similarmente el sı́mbolo hn|, llamado
bra, denota el complejo conjugado de la función, fn∗ . Cuando el operador es la identidad Ω = 1, se omite y se
usa la convención Z
∗
hm|ni = fm fn dτ . (27)
∗
hm| Ω |ni = hn| Ω |mi , (31)
El ket |ωi denota un autoestado del operador Ω en el sentido de que la correspondiente función fω
asociada a |ωi es una autofunción de Ω. Estamos etiquetando los autoestados con el autovalor ω del
operador Ω.
Multiplicando por la izquierda por hω|, tenemos
Lo anterior es válido para todo operador. Sin embargo, si Ω es hermı́tico, cumple que
∗
hω| Ω |ωi = hω| Ω |ωi , (35)
7
luego, se sigue que
ω = ω∗ , (36)
0 0
hω| Ω |ωi = ω hω 0 |ωi , hω| Ω |ωi = ω 0 hω|ω 0 i . (38)
0 ∗ ∗
hω| Ω |ωi − hω| Ω |ω 0 i = ω hω 0 |ωi − ω 0 hω|ω 0 i . (39)
Debido a que Ω es hermı́tico (y que sus autovalores son reales) tenemos que
Finalmente, si los autovalores son diferentes, la única opción para satisfacer la ecuación anterior es que
hω 0 |ωi = 0 , (41)
8
Clase 2: Postulados de la mecánica cuántica
Resumen Clase 1
t: el tiempo t.
un sistema está completamente descrito por una función Ψ(r1 , r2 , ...t). La función de onda del sistema puede
también depender de variables internas de las partı́culas. La función de onda contiene información de todas las
propiedades del sistema que pueden ser determinadas experimentalmente.
9
La función de onda de un sistema estará especificada por un conjunto de etiquetas llamadas números cuánticos
del sistema, lo que podrá ser denotado como Ψa,b,... donde a, b, .. corresponden a los número cuánticos. Los valores
de estos número cuánticos especificarán a la función de onda, permitiendo calcular una variedad de observables
fı́sicos.
Es a menudo conveniente referirnos al estado del sistema sin hablar de la correspondiente función de onda; el
estado está especificado al listar los valores que los número cuánticos que lo definen.
lineales hermı́ticos escogidos tal que satisfagan las siguientes relaciones de conmutación
donde q y q 0 denotan coordenadas x, y y z y pq y pq0 los momentum lineales correspondientes. El que los ope-
radores fı́sicos sean hermı́ticos asegura que los observables tengan valores reales. Cada relación de conmutación
es un postulado básico, que no se puede probar ni derivar de postulados.
El postulado 2 es la base para la selección de la forma de los operadores en las representaciones de posición y
momentum, para todos los observables que dependan de la posición y del momentum (excluye a observables
intrı́nsicos, como el espı́n). Por ejemplo, si definimos la representación de posición como la representación en la
que el operador de posición es la multiplicaición por la coordenada posición, luego, del postulado 2 se sigue que
el operador de momentum debe involucrar derivación con respecto a x. De forma similar en la representación de
momentum; si en esta representación el operador momentum lineal está representado por la multiplicación por
sus componentes, luego, la forma del operador posición queda como una derivada respecto al tales componentes.
Las coordenadas x, y y z conmutan entre ellas, tal como lo hacen las componentes del momentum lineal px , py
y pz .
Postulado 3: Cuando un sistema está descrito por una función de onda Ψ, el valor medio de un observable Ω
en una serie de medidas es igual al valor de expectación del operador correspondiente.
El valor de expectación de un operador Ω para un estado arbitrario Ψ se denota como hΩi y se define como
R ∗
Ψ ΩΨdτ hΨ| Ω |Ψi
hΩi = R ∗ = . (43)
Ψ Ψdτ hΨ|Ψi
A menos que se diga lo contrario, se debe asumir de ahora en adelante que la función de onda está normalizada.
10
El significado del Postulado 3 puede ser desarrollado como sigue. Supongamos que el sistema está en el estado
Ψ, autofunción de Ω con un autovalor ω, ΩΨ = ωΨ, luego
Z Z Z
∗ ∗
hΩi = Ψ ΩΨdτ = Ψ ωΨdτ = ω Ψ∗ Ψdτ = ω . (45)
Una serie de experimentos sobre sistemas idénticos para determinar Ω entregará el valor (promedio) ω (una
cantidad real, debido a que Ω es hermı́tico). Ahora supongamos que aunque el sistema está en un autoestado del
hamiltoniano que no es un autoestado de Ω. En este caso, y ya que las autofunciones de Ω forman un conjunto
completo, la función de onda puede ser expresada como una combinación lineal de autofunciones de Ω, según
X
Ψ= c n Ψn , donde ΩΨn = ωn Ψn . (46)
n
Z X ∗ X
hΩi = cm Ψm Ω cn Ψn dτ (47)
m n
X Z
= c∗m cn Ψ∗m ΩΨn dτ (48)
m,n
X Z
= c∗m cn ωn Ψ∗m Ψn dτ (49)
m,n
X
= c∗m cn ωn δmn (50)
m,n
X
= c∗n cn ωn (51)
n
X
= |cn |2 ωn . (52)
n
Esto es, el valor de expectación corresponde a una suma ponderada de las autofunciones de Ω, siendo la
contribución a la suma de un autovalor particular ωn determinada por el módulo cuadrado de su correspondiente
coeficiente en la expansión de la función de onda, cn .
Ahora podemos interpretar la diferencia entre los resultados en Eq (45) y (52) en el siguiente postulado.
11
promedio ponderado (pesado) de los autovalores. Notemos que en cualquiera de los casos, la hermiticidad de
los operadores garantiza que los observables serán reales. Ejemplo de como usar el postulado 3’.
Sea A un operador con autofunciones f1 , f2 , ... fn con los correspondientes autovalores a1 , a2 ,... an , o bien
Afi = ai fi . (53)
El estado de un sistema está descrito por la función de onda normalizada (Ejercicio: probar esto) Ψ dada por
12 12
1 3 3
Ψ = f1 − f2 + i f3 , (54)
2 8 8
o bien
X
Ψ= ci fi , (55)
i
21 12
1 3
con c1 = 2, c2 = − 8 y c3 = 38 i . ¿Cuál será el resultado de medir el observable A? ¿Es posible que Ψ
sea una autofunción de A? ¿En qué caso Ψ serı́a autofunción de A?
Veamos el resultado de operar con A sobre Ψ.
12 12
1 3 3
AΨ = A f1 − f2 + i f3
2 8 8
21 21
1 3 3
= Af1 − Af2 + i Af3
2 8 8
12 12
1 3 3
= a1 f1 − a2 f2 + i a3 f3
2 8 8
6= c × Ψ ,
12 12
1 3 3
AΨ = a1 f1 − a2 f2 + i a3 f3
2 8 8
12 12
1 3 3
= af1 − af2 + i af3
2 8 8
21 12
1 3 3
= a f1 − f2 + i f3
2 8 8
= aΨ .
12
respectivamente |c1 |2 = 14 , |c2 |2 = 3
8 y |c3 |2 = 38 . El valor promedio definido en Ec. (52) será
1 3 3
hAi =
a1 + a2 + a3 . (56)
4 8 8
1
Observación: La normalización de Ψ se refleja en la condición i |ci |2 = 1. En este caso, se cumple + 2 38 = 1.
P
4
Dado que las autofunciones f4 , f5 ,... no contribuyen a Ψ (sus pesos son c4 = c5 = ... = 0), la probabilidad de
encontrar los valores a4 , a5 ,... es cero.
Postulado 4: La probabilidad que una partı́cula sea encontrada en un elemento de volumen dτ en la posición
r es proporcional a |Ψ(r)|2 dτ .
Se sigue de esta intepretación que |Ψ(r)|2 es una densidad de probabilidad, en el sentido que esta nos entrega
una probabilidad cuando es multiplicada por el volumen dτ de una región infinitesimal. La función de onda es
una amplitud de probabilidad, y no tiene un significado fı́sico directo. Notemos que mientras la densidad de
probabilidad es real y no negativa, la función de onda puede ser compleja y negativa. Usualmente es conveniente
usar una función de onda normalizada; luego, la interpretación de Born se vuelve una igualdad en vez de una
proporcionalidad.
Lo que implica la interpretación de Born es que la función de onda debe ser cuadrado-integrable, esto es
Z
|Ψ|2 dτ < ∞ , (57)
debido a que la partı́cula se debe encontrar en alguna parte de todo el espacio, la probabilidad de onda debe
ser finita (e igual a 1 para una función de onda normalizada). Este postulado implica las siguientes condiciones
de borde para la función de onda,
Ψ→0 cuando x → ±∞ , (58)
de otra forma la integral de |Ψ|2 serı́a infinita. A lo largo del curso se hará uso frecuente de esta implicación.
∂Ψ
i~ = HΨ , (59)
∂t
13
2 2
~ ∂
Ejemplo: La ecuación de Schrödinger para una única partı́cula en una dimensión, donde H = T +V = − 2m ∂x2 +
V (x, t), será
∂Ψ ~2 ∂ 2 Ψ
i~ =− + V (x, t)Ψ . (60)
∂t 2m ∂x2
Esta ecuación y sus soluciones serán la base de lo desarrollado en lo que sigue del curso.
~2 d 2 ψ dφ
− φ 2 + V (x)ψφ = i~ψ .
2m dx dt
~2 1 d2 ψ 1 dφ
− + V (x) = i~ .
2m ψ dx2 φ dt
El lado izquierdo de la ecuación es una función de x, por lo que cuando x cambia, solo cambia el lado izquierdo.
Pero, como el lado izquierdo es igual al derecho, que no cambia, el lado izquierdo debe ser igual a una constante.
Ya que las dimensiones de la constante son las de una energı́a (las mismas que para V ), la llamaremos E. Se
sigue que la ecuación dependiente del tiempo se separa en las siguientes dos ecuaciones diferenciales
~2 d2 ψ
− + V (x)ψ = Eψ, (62)
2m dx2
1 dφ
i~ = Eφ . (63)
φ dt
donde la constante de proporcionalidad en φ ha sido absorbida por la función (aún a determinar) ψ, que deberá
definir la apropiada constante de normalización de Ψ.
La función de onda independiente del tiempo satisface Ec. (62), la que puede ser escrita como
Hψ = Eψ . (66)
Esta expresión de la ecuación de Schrödinger independiente del tiempo, en la que se basará mucho de
lo que desarrollaremos más adelante.
Observaciones:
14
Ec. (62) tiene la forma de una ecuación de onda estacionaria. Luego, siempre que estemos interesados
solo en la dependencia espacial de la función de onda, es legı́timo considerar la ecuación de Schrödinger
independiente del tiempo como una ecuación de onda.
Cuando la energı́a potencial del sistema no dependa del tiempo, y el sistema esté en un estado de energı́a
E, es bastante simple construı́r la función de onda dependiente del tiempo a partir de la función de onda
independiente del tiempo, simplemente mutiplicando por e−iEt/~ . La dependencia temporal de tal función
de onda es simplemente una modulación de su fase, ya que podemos escribir
Se sigue que el factor con dependencia temporal oscila periódicamente entre 1 a −i luego de −1 a i y de
vuelta a 1, con una frecuencia E/h, y periodo h/E. Este comportamiento se muestran en la Fig. 1. Luego,
para imaginar la variación temporal de una función de onda de una energı́a definida, hay que pensarla
como “oscilando” entre valores de amplitud positivos a imaginarios y a negativos, con una frecuencia
proporcional a la energı́a.
Aunque la fase de la función de onda Ψ con energı́a definida E oscila en el tiempo, el producto Ψ∗ Ψ
permanece constante,
Ψ∗ Ψ = (ψ ∗ eiEt/~ )(ψe−iEt/~ ) = ψ ∗ ψ . (68)
Estados de este tipo son llamados estados estacionarios. En lo que hemos visto hasta ahora, se sigue
que los sistemas con una energı́a especı́fica y precisa, y en los que la energı́a potencial no varı́a en el
tiempo, se encuentran en estados estacionarios. Aunque sus funciones de onda varı́a de una fase a otra,
de forma repetitiva, el valor de Ψ∗ Ψ permanece constante en el tiempo.
Figura 1: Una función de onda correspondiente a una energı́a E rota en el plano complejo de un valor real a
uno imaginario y de vuelta a uno real, con una frecuencia circular E/h.
15
Clase 3
Cambios en apunte: concepto de espectro de operadores
Postulado 2: Los observables fı́sicos están representados por operadores lineales hermı́ticos escogidos tal
que satisfagan las siguientes relaciones de conmutación
Postulado 3: Cuando un sistema está descrito por una función de onda Ψ, el valor medio de un observable
Ω en una serie de medidas es igual al valor de expectación del operador correspondiente hΩi, dado por
R ∗
Ψ ΩΨdτ hΨ| Ω |Ψi
hΩi = R ∗ = . (70)
Ψ Ψdτ hΨ|Ψi
∂Ψ
i~ = HΨ , (71)
∂t
16
4.1. Observables simultáneos
Primeramente, estableceremos las condiciones en las que dos observables pueden ser especificados simultánea-
mente con precisión arbitraria. Esto es, estableceremos las condiciones para un estado |Ψi, correspondiente a la
función de onda Ψ, pueda ser simultáneamente autoestado de dos operadores A y B. Explı́citamente, probare-
mos que:
Propiedad 3: Si dos observables pueden tener valores precisos simultáneamente definidos, luego sus correspon-
dientes operadores deben conmutar.
Luego, si Ψ es un autoestado tanto de A como de B, y si lo mismo es cierto para todas las funciones Ψ de un
conjunto completo, luego es necesario que [A, B] = 0.
Sin embargo, ¿la condición [A, B] = 0 realmente garantiza que A y B tengan autovalores simultáneamente? En
otras palabras, si A |Ψi = a |Ψi y [A, B] = 0, ¿podemos confiarnos en que |Ψi es también autoestado de B.
Confirmamos esto como sigue. Dado que A |Ψi = a |Ψi, podemos escribir
Ya que A y B conmutan, el primer término a la izquierda es igual a AB |Ψi. Luego, esta relación tiene la forma
Sin embargo, el comparar esta ecuación con la ecuación de autovalores A |Ψi = a |Ψi, podemos concluir que
B |Ψi ∝ |Ψi, o que B |Ψi = b |Ψi, donde b es un coeficiente de proporcionalidad. Esto es |Ψi es un autoestado
de B.
Con esta discusión estamos en posición de determinar los operadores que pueden ser especificados de forma
simultánea. Todo lo que necesitamos hacer es inspeccionar el conmutador [A, B]: si este es cero, luego A y B
pueden ser especificados simultáneamente.
Pares de observables que no pueden ser determinados simultáneamente se dicen observables complementarios.
Ası́, la posición a lo largo del eje x y el momentum lineal paralelo al mismo eje son observables complementarios.
La fı́sica clásica comete el error de asumir que no existen restricciones sobre simultaneidad de la determinación
de observables, ignorando la complementariedad. La mecánica cuántica nos obliga a escoger un conjunto de
posibles observables si es que buscamos especificar un estado de forma completa.
17
4.2. El principio de indeterminación
Aun cuando no podamos especificar de forma simultánea los autovalores de dos operadores que no conmutan,
es posible renunciar a la precisión en la especificación de una de las propiedades con el objeto de adquirir gran
precisión en la especificación de la propiedad complementaria. Por ejemplo, si sabemos la localización de una
partı́cula dentro de un rango ∆x, luego podemos especificar el momentum lineal paralelo a x dentro de un rango
∆px sujeto a la restricción
1
∆x∆px ≥ ~. (76)
2
Ası́, a medida que ∆x aumenta, la indeterminación en px puede disminuir, y viceversa. Esta relación entre
indeterminaciones (incertidumbres) en la especificación de dos observables complementarios es un caso especial
del principio de indeterminación propuesto por Werner Heinsenberg en 1927. Una forma general del principio
de indeterminación fue desarrollado por H.P. Robertson en 1929 para dos observables A y B:
1
∆A∆B ≥ | h[A, B]i | , (77)
2
Este es una forma exacta y precisa del principio de intederminación: la forma precisa de las “indeterminaciones”
∆A y ∆B están dadas (estas son raı́ces de la desviación cuadrática media) y el lado derecho da una cota por
abajo precisa del valor del producto de estas indeterminaciones.
18
el tiempo. El real significado del “principio de indeterminación” de la energı́a y el tiempo es que es una relación
entre la indeterminación en la energı́a de un sistema que tiene un tiempo de vida finito τ , que es de la forma
δE ∼ ~
2τ .
d hΩi i
= h[H, Ω]i . (79)
dt ~
Vemos que si el operador para el observable conmuta con el hamiltoniano, luego, el valor de expectación del
operador no cambia con el tiempo. Un observable que conmuta con el hamiltoniano del sistema, y que por lo
tanto tiene un valor de expectación que cambia con el tiempo, es llamado una constante del movimiento, y
su valor de expectación se dice conservado.
∂Ψ∗
Z
d hΩi
Z
d ∂Ψ
= hΨ| Ω |Ψi = ΩΨdτ + Ψ∗ Ω dτ , (80)
dt dt ∂t ∂t
ya que solo el estado Ψ depende del tiempo. La ecuación de Schrödinger nos permite escribir
∂Ψ∗
Z Z Z
1 1
ΩΨdτ = − (HΨ)∗ ΩΨdτ = − Ψ∗ HΩΨdτ (81)
∂t i~ i~
Z Z Z
∂Ψ 1 1
Ψ∗ Ω dτ = Ψ∗ Ω HΨdτ = Ψ∗ ΩHΨdτ . (82)
∂t i~ i~
En la primera lı́nea hemos usado la hermiticidad del hamiltoniano. Se sigue luego, combinando estas dos expre-
siones, que
d hΩi 1 i
=− hHΩi − hΩHi = h[H, Ω]i , (83)
dt i~ ~
tal lo que querı́amos probar.
Como ejemplo importante, consideremos la tasa de cambio del valor de expectación del momentum linear de
una partı́cula en un sistema unidimensional. El conmutador de H y px es
~2 d 2
~ d ~ d
[H, px ] = − + V, = V, , (84)
2m dx2 i dx i dx
ya que las derivadas conmutan. El conmutador resultante puede ser evaluado con una función de prueba arbi-
traria Ψ
~ dΨ d(V Ψ) ~ dΨ dΨ dV ~ dV
[H, px ]Ψ = V − = V −V − Ψ =− Ψ, (85)
i dx dx i dx dx dx i dx
19
luego,
~ dV
[H, px ] = − . (86)
i dx
Se sigue que el momentum lineal es una constante del movimiento si la energı́a potencial no varı́a con la posición.
De forma especı́fica, podemos concluir que la tasa de cambio del valor de expectación del momentum lineal es
d i dV
hpx i = h[H, px ]i = − h i . (87)
dt ~ dx
Esto es, la tasa de cambio del valor de expectación del momentum lineal es igual al valor de expectación de la
fuerza. Es también bastante fácil probar que de la misma forma que
d hpx i
hxi = , (88)
dt m
lo que muestra que la tasa de cambio de la posición media puede ser identificada con la velocidad media a
lo largo del eje x. Estas dos relaciones conjuntamente constituyen el teorema de Ehrenfest. El teorema de
Ehrenfest clarifica la relación entre la mecánica clásica y la mecánica cuántica; la mecánica clásica trata con
valores promedios (valores de expectación); la mecánica cuántica trata con los detalles subyacentes.
Heisenberg formuló su propia versión de la mecánica cuántica, llamada mecánica matricial, al representar la
posición y el momentum lineal por las matrices x y requiriendo que [x, px ] = i~1, con 1 la matriz identidad.
Las cantidades hm| Ω |ni son comunmente abreviadas como Ωmn , sugiriendo que estos corresponden a los ele-
mentos de una matriz definida por el operador Ω.
Usualmente nos encontraremos en los cálculos con sumas sobre productos de paréntesis de Dirac, de la forma
X
hr| A |si hs| B |ci . (90)
s
20
Si estos paréntesis son interpretados como elementos matriciales, podemos reescribirlos como
X X
hr| A |si hs| B |ci = Ars Bsc = (AB)rc = hr| AB |ci . (91)
s s
Esto es, tal suma es igual al elemento matricial (o el paréntesis) del producto de operadores AB. Comparando
el primer con el último término de la relación anterior podemos definir la siguientes relación simbólica
X
|si hs| = 1 . (92)
s
Esta relación de completitud es muy útil al desarrollar las ecuaciones de la mecánia cuántica.
Ejemplo: Use la relación de completitud para probar que los autovalores del cuadrado de un operador hermı́tico
son no-negativos.
Tenemos que mostrar que Ω2 |ωi = ω |ωi con ω ≥ 0 siempre que Ω sea hermı́tico. Si multiplicamos la ecuación
de autovalores por hω|
hω| Ω2 |ωi = ω hω|ωi = ω , (93)
tenemos que la prueba requiere que mostremos que el valor de expectación de la izquierda es no-negativo.
La desigualdad final sigue del hecho de que todos los términos en la sumas son no-negativos.
El origen de la relación de completitud puede ser demostrado con el siguiente argumento. Supongamos que
tenemos un conjunto completo de estados ortonormales |si i. Luego, por definición de completitud, podemos
P
expandir un estado arbitrario |Ψi como una combinación lineal |Ψi = i ci |si i. La multiplicación por la
izquierda por hsj | y el uso de la ortonormalidad de la base de estados completa nos da cj = hsj |Ψi. Luego
X X
|Ψi = hsi |Ψi |si i = |si i hsi |Ψi (94)
i i
21
Clase 4
Diagonalización del hamiltoniano
Partı́cula en la caja
El oscilador armónico
Multiplicamos por la izquierda por una estado arbitrario hm| y usamos la ortonormalidad de los estados para
obtener
X X
cn hm| H |ni = E cn hm|ni = Ecm .
n n
Supongamos ahora que hemos encontrado un conjunto de estados tales que Hmn = δmn ; esto es, cuando usamos
este set, el hamiltoniano tiene una matriz diagonal. Luego, la expresión anterior tiene la forma
Hmm cm = Ecm ,
y la energı́a E se entiende como el elemento diagonal de la matriz hamiltoniana. En otras palabras, resolver la
ecuación de Schrödinger es equivalente a diagonalizar la matriz hamiltoniana. Esto nos entrega otra relación
entre las formulaciones de la mecanica cuántica de Schrödinger y Heisenberg.
22
6. Partı́cula en la caja
Consideremos el caso de una partı́cula confinada por paredes en una región del espacio. Las paredes están
representadas por un potencial que es cero dentro de la caja, pero que se crece abruptamente a infinito en los
bordes. Este sistema es llamado un potencial cuadrado infinito o partı́cula en la caja. Dado que la partı́cula
está confinada, la energı́a está cuantizada, y las condiciones de borde determinan las energı́as permitidas.
Figura 2: Potencial de pozo cuadrado infinito caracterı́stico para una partı́cula en la caja.
Ya que energı́a potencial de una partı́cula que toca las paredes es infinito, la partı́cula no puede traspasarlas
(repasar potencial infinito). Se sigue que el hamiltoniano para la región donde el potencial es finito, y por lo
tanto, la única región donde la función de onda es no-nula, es
~2 d2
H=− .
2m dx2
Esta expresión es la misma que el hamiltoniano para le movimiento traslacional libre (repasar), que tiene como
solución general a la ecuación de Schrödinger
~2 d2 ψ
− = Eψ ,
2m dx2
la función de onda
1/2
ikx −ikx 2mE
ψ = Ã0 e + B̃0 e = A0 cos (kx) + B0 sin (kx) , con k = ,
~2
23
donde A0 = Ã0 + B̃0 y B0 = i(Ã0 − B̃0 ). La gran diferencia entre ambos casos son las condiciones de borde,
que terminarán eliminando la mayorı́as de las posibles soluciones.
Sabemos que las funciones de onda son cero fuera de la caja, con x < 0 o x > L. Las funciones de onda deben
ser continuas en todo punto, por lo tanto, las soluciones deben ser cero en las paredes, en x = 0 y x = L. Las
condiciones de borde son por lo tanto ψ(0) = 0 y ψ(L) = 0. Ahora aplicamos cada condición para obtener una
solución general. Primero, en x = 0 ,
Hay dos formas de satisfacer la segunda condición, la primera, B0 = 0, no nos sirve pues anula la función de onda
en todos lados. La segunda, kL = nπ con n = 1, 2, .... El valor n = 0 se excluye dado que anuları́a la función de
onda para todo x, y la partı́cula no ser encontrarı́a en ninguna parte. El entero n es un ejemplo de un número
cuántico, un número que etiqueta el estado de un sistema y que, mediante el uso de una fórmula apropiada,
puede ser usado para calcular el valor de un observable del sistema. Por ejemplo, ya que E = k 2 ~2 /2m, se sigue
que la energı́a está relacionada con n por
n 2 ~2 π 2 n2 h2
En = = , n = 1, 2, ...
2mL2 8mL2
La mayor conclusión de este cálculo en este punto es que la energı́a de la partı́cula está cuantizada; esto es,
confinada a una serie de valores discretos. Hasta ahora solo queda una constante B0 que determinar antes de
que la solución esté completa. La probabilidad de encontrar la partı́cula en alguna parte dentro de la caja debe
ser igual a 1, por lo tanto, la integral de ψ 2 sobre la región entre x = 0 y x = L debe ser igua a 1,
Z L Z L
∗ 2 2 nπx 2 x L 2nπx x=L 1
ψ ψdx = B0 sin dx = B0 − sin |x=0 = LB0 2
0 0 L 2 4πn L 2
p
luego B0 = 2/L. La solución completa es
r
n2 h2
2 nπx
ψn (x) = sin , En = , con n = 1, 2, ...
L L 8mL2
Vemos que existe un único número cuántico, n, que determina las funciones de onda y las energı́as.
24
La Figura 3 muestra algunas de las primeras soluciones y la Figura 4 muestra los cuadrados de las funciones
de onda, la densidad de probabilidad de encontrar la partı́cula en cada posición. Notemos como la partı́cula
parece evitar las paredes en los estados de más baja energı́a, pero la distribución se vuelve más uniforme a
medida que n aumenta. La distribución en altos valores de n corresponde a los esperado clásicamente, que las
partı́culas estarı́an, en promedio, la misma cantidad de tiempo en todas las posiciones producto de los rebotes
con las paredes. Este comportamiento es un ejemplo del principio de correspondencia, que establece que la
mecánica clásica debe emerger de la mecánica cuántica en valores altos de los número cuánticos.
Figura 3: Los primeros seis niveles de energı́a y las correspondientes funciones de onda para una partı́cula en
una caja. Notemos que los niveles están más separados a medida que la energı́a aumenta; la amplitud máxima
de las funciones de onda es la misma en todos los casos.
Figura 4: La probabilidad de distribución de la partı́cula en la caja. Note que la distribución se vuelve uniforme
a medida que la energı́a aumenta.
Un punto donde una función de onda pasa por un cero (no simplemente que tienda a cero) es llamado nodo.
Vemos en la Figura 2 que el estado de más baja energı́a no tiene nodos, y que el número de nodos aumenta a
medida que n aumenta; en general, el número de nodos es n − 1. Es una caracterı́stica común de las funciones
de onda que mientras más alto el número de nodos, más alta la energı́a.
25
6.2. Propiedades de las soluciones
La más baja energı́a que la partı́cula puede tener corresponde al estado con n = 1, y su valor es E1 = h2 /8mL2 .
Esta energı́a irremovible es llamada la energı́a de punto cero. Es una propiedad puramente cuántica, y en
un universo hipotético, en el que h = 0, no existirı́a energı́a de punto cero.
La energı́a de separación de los estados vecinos decrece a medida que las pareces se alejan entre ellas y le dan
más libertad a la partı́cula:
h2 h2
2 2
En+1 − En = (n + 1) − n = 2n + 1 .
8mL2 8mL2
A medida que el largo de la caja se aproxima a infinito (lo que corresponde a una caja de dimensiones ma-
croscópicas), la separación de los niveles vecinos se acerca a cero, y los efectos de la cuantización se vuelven
completamente despreciables. En efecto, la partı́cula se vuelve libre. Los mismo es cierto cuando la masa, m,
se vuelve muy grande. Consecuentemente, la mecánica clásica puede ser usada para describir el movimiento
traslacional de objetos macroscópicos.
26
El hamiltoniano para el pozo potencial infinito dos-dimensional, en el interior del pozo (la única región donde
la partı́cula puede ser hallada, y donde la energı́a potencial es cero) es
~2
2
∂2
∂
H=− + 2 .
2m ∂x2 ∂y
Las condiciones de borde son que la función de onda debe anularse en las cuatro paredes.
Para resolver esta ecuación en dos variables, usamos el método de separación de variables, con el ansatz ψ(x, y) =
X(x)Y (y). La ecuación de Schrödinger queda
donde EX + EY = E. Ambas ecuaciones tienen la misma forma de la ecuación del sistema unidimensional, y
las condiciones de borde son las mismas. Por lo tanto, podemos escribir las soluciones inmediatamente (usando
ψ = XY ):
2 n1 πx n2 πy
ψn1 n2 (x, y) = p sin sin
Lx Ly L1 L2
2
2 2
h n1 n
En1 n2 = + 22 , con n1 = 1, 2, .. n2 = 1, 2...
8m L21 L2
Notemos que para definir los estados de una partı́cula en un sistema dos-dimensional necesitamos especificar
los valores de dos número cuánticos; n1 y n2 pueden tomar cualquier valor entero en su rango de forma inde-
pendiente.
Muchas de las propiedades de sistema unidimensional son reproducidas en dimensiones más altas. Existe una
energı́a de punto cero (E1,1 ), y la separación de las energı́as decrece a medida que las paredes se separan entre
ellas y el sistema está menos confinado. La energı́a está cuantizada como consecuencia de las condiciones de
borde. La forma de algunas de las funciones de onda de más baja energı́a están ilustradas en la Fig. 6 y sus
correspondientes densidades de probabilidad se muestran en la Fig. 7. Tal como en el caso unidimensional, la
partı́cula se distribuye de forma más uniforme a mayores energı́as.
27
Figura 6: Tres funciones de onda para una partı́cula en potencial bidimensional: (a) n1 = 1, n2 = 1 (b) n1 = 2,
n2 = 1 y (c) n1 = 2, n2 = 2.
Figura 7: Tres distribución de probabilidades para una partı́cula en potencial bidimensional: (a) n1 = 1, n2 = 1
(b) n1 = 2, n2 = 1 y (c) n1 = 2, n2 = 2 (como en la Figura 4).
28
6.4. Degeneración
Una caracterı́stica presente en dos o más dimensiones aparece cuando la caja es cuadrada; L1 = L2 = L, y las
energı́as quedan dadas como
h2
En1 n2 = (n2 + n22 ) .
8mL2 1
Esta expresión implica que un estado con número cuántico n1 = a y n2 = b (que podemos denotar como |a, bi)
tiene exactamente la misma energı́a que uno con números cuánticos n1 = b y n2 = a (el estado |b, ai), incluso
cuando a 6= b. Este es un ejemplo de la degeneracion de estados mencionada en la primera sección del curso.
Por ejemplo, los dos estados |1, 2i y |2, 1i tienen la misma energı́a 5h2 /8mL2 pero sus funciones de onda son
diferentes
2 πx 2πy 2 2πx πy
ψ1,2 (x, y) = sin sin , ψ2,1 (x, y) = sin sin .
L L L L L L
La Figura 8 nos muestra el origen de esta degeneración: una función de ondas puede ser transformada en la otra
mediante una rotación de la caja en 90◦ . Siempre debemos esperar la presencia de degeneración en sistemas que
tienen un alto grado de simetrı́a.
En el caso de una caja rectagular, no cuadrada, la simetrı́a y la degeneración se pierden. Sin embargo, algunas
veces la degeneración se encuentra incluso cuando no existe una rotación que transforme una función de onda en
otra; esto se llama una degeneración accidental. En ciertos casos, la degeneración accidental ocurre cuando
la simetrı́a completa del sistema aún no se ha reconocido, y un análisis más profundo del sistema mostrarı́a
la presencia de una simetrı́a escondida que relaciona a las funciones degeneradas. Puede ser el caso de que
todas las degeneraciones accidentales puedan ser relacionadas con la existencia de una simetrı́a escondida. Una
degeneración accidental ocurre en el átomo de hidrógeno.
29
7. El oscilador armónico
Este caso es uno de los temas más importantes en la mecánica cuántica. Las oscilaciones armónicas ocurren
cuando un sistema contiene una parte que experimenta una fuerza restauradora proporcional al desplazamiento
desde el equilibrio. Los péndulos y el movimiento vibracional de las cuerdas son ejemplos familiares. Un ejemplo
importante en quı́mica es la vibración de los átomos en una molécula. Otro ejemplo es el campo electromagnético,
que puede ser tratado como un conjunto de osciladores armónicos, uno por cada frecuencia de radiación presente.
La importancia del oscilador armónico también recae en que la misma álgebra aparece en una amplia variedad
de problemas; por ejemplo, también aparece en el tratamiento del movimiento rotacional.
La fuerza restauradora en un oscilador armónico unidimensional es dado por la ley de Hooke como F = −kx,
donde la constante de proporcionalidad k es llamada la constante de fuerza o constante del resorte. Un resorte
rı́gido tiene una constante de fuerza grande; un resorte débil tiene una k pequeña. Dado que la fuerza actuando
sobre una partı́cula corresponde al gradiente negativo de la energı́a potencial (F = −dV /dx), se sigue que la
energı́a potencial del oscilador varı́a con el desplazamiento x desde el equilibrio como
1 2
V (x) = kx ,
2
y un gráfico de la energı́a potencial versus el desplazamiento es una parábola. La diferencia entre este potencial
y el pozo potencial cuadrado es la rapidez con la que estos suben hasta infinito; las “paredes” de un oscilador
son mucho más suaves, y por eso podemos esperar que sus funciones de onda las traspasen levemente. En
otros aspectos ambos potenciales tienen ciertas similitudes y podemos imaginar la suave deformación de un
potencial a otro, tal como sus funciones de onda: estas deben tener la misma forma general, pero entrará en
desplazamientos clásicamente prohibidos.
Otro punto acerca del oscilador armónico es que es mucho más simple. Su simplicidad surge de las simetrı́as del
momentum y el desplazamiento en la expresión de la energı́a total. Clásicamente, la energı́a es E = p2 /2m+kx2 /2
, y tanto p y x aparecen al cuadrado. Esta simetrı́a escondida tiene importantes implicancias, una de las cuales
involucra principio de indeterminacion; en el estado base del oscilador armónico tenemos que ∆p∆x = ~/2.
30
La ecuación de Schrödinger queda
d2
2
− y ψ = −λψ .
dy 2
El lado izquierdo de esta ecuación se factoriza si notamos que
2
d d d 2
+y −y ψ = −y −1 ψ ,
dy dy dy 2
2
d d d 2
−y +y ψ = −y +1 ψ .
dy dy dy 2
de tal forma que los operadores a y a+ son pares de operadores hermı́ticos conjugados (operadores que satisfacen
∗
ha| A |bi = hb| B |ai ).
Luego, dado que los resultados anteriores pueden ser expresados como
d2
2
− y ψ = −(2aa+ − 1)ψ = −(2a+ a + 1)ψ ,
dy 2
1
aa+ ψλ = (λ + 1)ψλ
2
1
a+ aψλ = (λ − 1)ψλ , (97)
2
Esta ecuación es válida para cualquier valor de λ, de forma que se puede expresar como una identidad para los
operadores
[a, a+ ] = 1 . (98)
1
aa+ aψλ = (λ − 1)aψλ .
2
31
Sin embargo, se sigue de (97) que la ecuación de Schrödinger para el estado de energı́a equivalente a λ − 2 es
1
a+ aψλ−2 = (λ − 3)ψλ−2 .
2
aψλ ∝ ψλ−2 .
Esta proporcionalidad es válida solo para estados no-degenerados; pero, por simetrı́a, todos los estados de un os-
cilador uni-dimensional son no-degenerados. Concluimos que las funciones de onda correspondientes a la energı́a
λ − 2 es generada a partir de la función de onda correspondiente a la energı́a λ al operar con a. Este proceso
puede continuar, y las funciones de onda correspondientes a las energı́as λ − 4, λ − 6, ... pueden ser construidas
de forma similar. De la misma forma, es directo mostrar que sucesivas operaciones con a+ sobre la función de
onda ψλ genera las funciones de onda correspondientes a λ + 2, λ + 4, .... El hecho que a “baje” las funciones de
onda en una escalera de niveles de energı́a da origen a su nombre, el operador aniquilación. Similarmente,
a+ es llamado operador creación.
La generación de estados de más baja energı́a producto de la aplicación repetida del a no puede ser continuada
indefinidamente dado que la energı́a del oscilador armónico es no-negativa (corresponde al autovalor de un
hamiltoniano que es la suma de cuadrados de dos operadores hermı́ticos). Por lo tanto, debe existir un valor
mı́nimode λ, que llamaremos λmin . Dado que no existe una función de onda correspondiente a una energı́a más
baja, se siguie que aψλmin = 0. Si ambos lados de esta ecuación son operados con a+ , obtenemos a+ aψλmin = 0.
Luego, usando (97), esta expresión queda
1
0 = a+ aψλmin = (λmin − 1)ψλmin .
2
con v ∈ N.
La función de onda para un estado de valor de energı́a cualquiera puede ser encontrada aplicando a+ el número
apropiado de veces a la función de onda correspondiente a v = 0 (esto es, λ = 1). Desde ahora, etiquetaremos
las funciones con v en lugar de λ. Se sigue que necesitamos determinar la forma de ψ0 . Dado que sabemos que
aψ0 = 0, entonces
1 d
√ + y ψ0 = 0 .
2 dy
La ecuación diferencial de primer order se puede reescribir como
dψ0
= −ydy ,
ψ0
y su solución es
2
ψ0 = N0 e−y /2
,
32
√
con N0 una constante de normalización. Aplicaciones sucesivas de a+ = 1/ 2(y − d/dy) (con las constantes de
proporcionalidad absorbidas por las constantes de normalización) nos entregan
√ 2
ψ1 = a+ ψ0 = 2N0 ye−y /2
2
ψ2 = a+ ψ1 = N0 (2y 2 − 1)e−y /2
√ 2
ψ3 = a+ ψ2 = 2N0 (2y 3 − 3y)e−y /2
..
.
o bien
2
ψ1 = N1 ye−y /2
2
ψ2 = N2 (4y 2 − 2)e−y /2
2
ψ3 = N3 (8y 3 − 12y)e−y /2
..
.
y como sigue. Cada función de onda tiene la forma de una función gaussiana multiplicada por un polinomio de
Hermite, como demostraremos explı́citamente en la siguiente sección.
d2 ψ
− y 2 ψ = −λψ ,
dy 2
con las convenciones definidas en Ec. (96). La forma más común de resolver este tipo de ecuaciones es primero
establecer una solución para y → ∞. En tal lı́mite, el término en y 2 domina por sobre el término con factor λ,
por lo que la forma asintótica de la ecuación es
d2 ψ
− y2 ψ ' 0 ,
dy 2
donde ' significa “asintóticamente igual a ” en el lı́mite de una variable (en este caso y) tomando valores
infinitamente grandes. Las soluciones tienen la forma
2
ψ± ' e±y /2
,
d2 ψ 2 2
− y 2 ψ ' (±)2 y 2 e±y /2 − y 2 e±y /2 ' 0 .
dy 2
33
forma
2
ψ = f (y)ψ− = f (y)e−y /2
, (99)
d2 ψ d2
2 2
− y ψ = f (y)ψ − −y f (y)ψ−
dy 2 dy 2
d2
2 2
= 2 f (y)e−y /2 −y 2 f (y)e−y /2
dy
2 2
= (f 00 − 2yf 0 + y 2 f − f )e−y /2
− y 2 f e−y /2
2
= (f 00 − 2yf 0 − f )e−y /2
= −λψ
2
= −λf e−y /2
,
o bien
2 2
(f 00 − 2yf 0 − f )e−y /2
= −λf e−y /2
.
Para asegurarnos que la función de onda ψ en Ec. (99) sea cuadrado-integrable, el polinomio f no puede ir
2
a infinito más rápidamente que ey /2 , de otra forma la función de onda se volverı́a infinita cuando |y| → ∞.
Ahora, sustituyendo la forma polinomial f = n an y n en Ec. (100), tenemos la ecuación
P
X
n−2 n n
an n(n − 1)y − 2ny + (λ − 1)y = 0 .
n
Del lado izquierdo vemos que coeficientes de y m (para n = m + 2 en el primer término y n = m en los dos
últimos) es
(m + 1)(m + 2)am+2 + (λ − 2m − 1)am .
Entonces, para que la suma se anule para cualquier valor de y, este coeficiente debe ser cero para todos los
valores de m. Se sigue que
2n − λ + 1
an+2 = an . (101)
(n + 1)(n + 2)
Esta expresión es una fórmula recursiva para los coeficientes, ya que permite a todos los an con n par ser
expresados en términos de a0 , y a todos los an con n impar ser expresados en términos de a1 . Notemos que esto
implica que todas las potencias de y que aparecen en f son bien pares o impares, no una mezcla (consideraciones
de simetrı́as también requerirı́an la misma conclusión).
Para que f sea un polinomio y no una serie infinita, los coeficientes se deben anular luego de cierto valor de n,
al que llamaremos v. Según Ec. (101), el término de la serie se garantiza si λ = 2v + 1. Se sigue, de Ec. (96),
34
Tabla I: Polinomios de Hermite
v Hv (z)
0 1
1 2z
2 4z 2 − 2
3 8z 3 − 12z
4 16z 4 − 48z 2 + 12
5 32z 5 − 160z 3 + 120z
6 64z 6 − 480z 4 + 720z 2 − 120
7 128z 7 − 1344z 5 + 3360z 3 − 1680z
8 256z 8 − 3584z 6 + 13440z 4 − 13440z 2 + 1680
La relación recursiva nos permite escribir el polinomio para cualquier valor de v y este procedimiento desarrolla
los polinomios en la Tabla I, polinomio conocidos como polinomios de Hermite, Hv (z).
La siguiente definición de los polinomios de Hermite es a veces más útil que su definición en términos de la
relación recursiva:
2 dv −y2
Hv (y) = (−1)v ey e . (103)
dy v
El parámetro α tiene dimensiones de L−1 . Dado que H0 (z) = 1, las funciones de onda para el estado con v = 0
2 2
es proporcional a la función gaussiana e−α c /2
:
1/2
α 2
x2 /2
ψ0 (x) = √ e−α .
π
35
Figura 9: Energı́a potencial parabólica caracterı́stica de un oscilador armónico y la escalera equiespaciada de
energı́as permitidas (que continúa hasta infinito).
Figura 10: Funciones de onda de un oscilador armónico para (a) v = 0, 2, 4, (b) v = 1, 3. Notemos que el número
de nodos aumenta con v, y que funciones con v par son simétricas mientras alrededor de x = 0 que funciones
con v impar son antisimétricas.
36
Cuando v = 1, como H1 (z) = 2z, la función de onda es la misma función gaussiana multiplicada por 2αx, con
un factor de normalización diferente:
1/2 1/2
2α3
α −α2 x2 /2 2
x2 /2
ψ1 (x) = √ 2αxe = √ xe−α .
2 π π
1
E0 = .
2~ω
La interpretación clásica de tal resultado es que el oscilador nunca para de fluctuar alrededor de su posición
de equilibrio. La razón de la existencia de la energı́a de punto cero es la misma que para la partı́cula en la
caja: las funciones de onda deben ser cero para grandes desplazamientos en ambas direcciones (dado que la
energı́a potencial confina), distintas de cero entre las “paredes” (la partı́cula tiene que estar en alguna parte)
y contı́nuas (como todo función de onda). Estas condiciones pueden ser satisfechas solo si la función de onda
tiene curvatura; luego, el valor de expectación de la energı́a cinética del oscilar debe ser no-nulo en todos sus
estados.
37
Figura 11: Comparación de la distrubución de probabilidad para un estado altamente excitado de un oscilador
armónico (v = 12) y para un oscilador clásico con la misma energı́a. Notemos cómo la primera comienza a
parecerse a la segunda.
38
8. Movimiento rotacional y el átomo de Hidrógeno
Consideraremos el movimiento de un objeto alrededor de un punto fijo que introducirá uno de los conceptos
más importantes de la mecánica cuántica, el “momentum angular”. Lo que desarrollaremos en esta sección
nos servirá para describir amplia variedad de fenómenos en cuántica y siempre que nos interese el movimiento
de una partı́cula en un potencial central, en el que la energı́a potencial dependa solo de la distancia a un
único punto. Un ejemplo de esto es el potencial central que siente un electrón en un átomo de hidrógeno. Este
problema se puede resolver de forma exacta y es lo que estudiaremos a continuación.
Figura 12: El movimiento de una partı́cula en un campo de fuerza central como el movimiento sobre una pila
de esferas junto a la habilidad de saltar entre las esferas.
~2 2 ~2 Ze2
H=− ∇e − ∇2N − , (105)
2me 2mN 4π0 r
donde me es la masa del electrón, mN es la masa del núcleo, 0 la permitividad del vacı́o, y ∇2e y ∇2N son
los operadores laplacianos que actúan sobre las coordenadas del electrón y del núcleo, respectivamente. Sin
considerar el término potencial Coulombiano, este hamiltoniano es equivalente al sistema de un rotor de dos
partı́culas. Si nos cambiamos a las coordenadas del centro de masa y de movimiento relativo, el término de
energı́a potencial, al depender solo de la separación de las partı́culas, permanece sin cambios. Luego, podemos
escribir
~2 2 ~2 2 Ze2
H=− ∇cm − ∇ − , (106)
2m 2µ 4π0 r
39
1 1 1
donde m = me + mN y µ = me + mN . La resultante ecuación de Schrödinger es separable, gracias a la
dependencia del potencial. Ası́, para el movimento relativo del electrón respecto del núcleo tenemos
~2 2 Ze2
− ∇ ψ− ψ = Eψ . (107)
2µ 4π0 r
La otra componente de la ecuación de Schrödinger es la para el movimiento traslacional del átomo como un
todo, que para este estudio no es relevante. A diferencia del caso de un rotor rı́gido, el electrón y el núcleo
no están restringidos a tener una distancia de separación fija. Luego, en coordenadas esféricas la ecuación de
Schrödinger queda como
1 ∂2 Ze2 µ
1 2 2µE
(rψ) + 2 Λ ψ + ψ=− ψ, (108)
r ∂r2 r 2π0 ~2 r ~2
donde Λ2 , el legendriano, corresponde a la parte angular del laplaciano y es dado por
1 ∂2 1 ∂
Λ2 = 2 ∂φ2 + sin θ ∂θ . (109)
sin θ
La ecuación de Schrödinger para el movimiento relativo es separable en sus componentes radiales y angulares,
siendo esta última la ecuación para la partı́cula en la esfera. Proponemos el ansatz
con R la función de onda radial e Y , la función de onda angular. Cuando esta solución de prueba se
introduce en la ecuación de Schrödinger, y aplicando las apropiadas condiciones de borde periódicas, obtenemos
las ecuaciones
con l = 0, 1, 2, ... el número cuántico de momentum angular y ml = l, l −1, ..., −l. En este punto escribimos
u = rR, y obtenemos
d2 u Ze2 l(l + 1)~2
2µ 2µE
+ − u = − u. (113)
dr2 ~2 4π0 r 2µr2 ~2
Esta es la ecuación de Schrödinger unidimensional en la coordenada r que se puede obtener si, en vez del
potencial de Coulomb usamos una energı́a potencial efectiva Veff
La interpretación fı́sica de la energı́a potencial efectiva es simple. La primera parte corresponde a la energı́a
potencial atractiva de Coulomb. La segunda parte es una contribución repulsiva que corresponde a la existencia
de una fuerza centrı́fuga que impele al electrón hacia afuera del núcleo, debido a su movimiento. La magnitud del
p
momentum angular de la partı́cula será proporcional a l(l + 1). Cuando l = 0 el electrón no tiene momentum
angular orbital y la fuerza, ahora únicamente debido a Coulomb, es totalmente atractiva, ver Fig. 13. Cuando
40
Figura 13: Potencial efectivo que siente un electrón en un átomo de hidrógeno. Cuando l > 0 existe una contri-
bución centrı́fuga al potencial que previene del acercamiento del electrón al núcleo, al crecer más rápidamente
(como 1/r2 ) que la atracción de Coulomb (que varı́a como −1/r).
l > 0 el electrón posee un momentum angular orbital que tiende a arrojarlos lejos de la vecindad del núcleo, y
existe una competencia entre este efecto y la parte atractiva del potencial. A distancias pequeñas del núcleo,
la componente repulsiva tiende más fuertemente a infinito (como 1/r2 ) que la parte atractiva (que varı́a como
1/r), y la primera parte domina. Los dos potenciales efectivos (para l = 0 y l 6= 0) son cualitativamente bastante
diferentes cerca de r = 0, y deben ser analizados de forma separada.
Cuando l = 0, la parte repulsiva de la energı́a potencial efectiva está ausente y el potencial es en todas partes
atractivo, incluso cerca de r = 0. Cuando r está cercano a cero, la magnitud de la energı́a potencial es localmente
mucho mayor que E y esta última puede ser despreciada en Ec. (113), quedando
d2 u Ze2
2µ
+ u≈0, (115)
dr2 ~2 4π0 r
como puede ser verificado por sustitución de la solución, tomando el lı́mite r → 0 y considerando la relación
B = −AµZe2 /4π0 ~2 . Luego, cerca de r = 0 la función de onda radial tiene la forma R = u/r ≈ A, que puede
ser distinta de cero; esto es, cuando l = 0, puede existir una probabilidad no nula de encontrar el electrón en el
núcleo.
Cuando l 6= 0, la componente repulsiva de la energı́a potencial efectiva del electrón a distancias cercanas al
núcleo es grande y tiene el efecto de excluı́rlo de esa región. En términos clásicos, a distancias cortas la fuerza
centrı́fuga sobre un electrón con momentum angular no nulo es lo suficientemente fuerte para superar la fuerza
atractiva de Coulomb. Cuando l 6= 0 y r se aproxima a cero, la Ec. (113) se vuelve
d2 u l(l + 1)
− u≈0, (117)
dr2 r2
41
ya que 1/r2 es el término dominante. La solución tiene la forma
B
u ≈ Arl+1 + , (118)
rl
para l 6= 0 y r ≈ 0, como puede ser verificado por sustitución. Ya que u = rR, en r = 0 sabemos que u = 0; se
sigue luego que B = 0. Luego, la función de onda radial tiene la forma
u
R= ≈ Arl , (119)
r
para l 6= 0 y r ≈ 0. Esta función implica que la amplitud es cero en r = 0 para todas las funciones de onda con
l 6= 0, y que el electrón descrito por tal función de onda no será encontrado en el núcleo. La función de onda
radial no tiene un nodo en r = 0, dado que un nodo se define como un punto donde la función pasa a través de
cero.
42
Soluciones explı́citas de la ecuación de onda radial en Ec. (113) pueden ser encontradas usando el método del
análisis asintótico, como en el caso estudiado del oscilador armónico. Las soluciones aceptables de esta ecuación
son las funciones asociadas de Laguerre. Algunas de las primeras funciones de onda hidrogenoides están
listadas en la Tabla II. Estas consisten de una función exponencial que decae multiplicada por un polinomio
simple en r. Cada una es especificada por las etiquetas n y l, con
Algunas de las funciones de onda radiales están graficadas como funciones de ρ = 2Zr/na0 en la Fig. 14, donde
a0 es el radio de Bohr en términos de me :
4π0 ~2
a0 = , (121)
m e e2
con n = 1, 2, .... Los mismos valores se obtienen independientemente de los valores de l o ml . Luego, en áto-
mos hidrogenoides (pero no en cualquier otro tipo de átomos) la energı́a depende solo del número cuántico
principal n y es independiente de los valores de l y ml ; ası́, cada nivel, como se discutirá más adelante, es
degenerado n2 -fold (este siendo el número total de funciones de onda para cada n dado). Esta degeneración es
particular al potencial de Coulomb en un sistema no-relativista.
El rol de los números cuánticos en el átomo de hidrógeno puede ser resumido como sigue:
1. El número cuántico principal, n, especifica la energı́a a través de la Ec. (122) y controla el rango de valores
de l = 0, 1, ..., n − 1; también nos da el número total de orbitales con el valor especı́fico de n como n2 y
nos da el número total de nodos radiales y angulares como n − 1.
43
Figura 14: Funciones de onda radiales hidrogenoides: (a) 1s, (b) 2s, (c) 3s, (d) 2p,(e) 3p, (f) 3d.
2. El número cuántico de momentum angular orbital, l, especifica el momentum angular orbital del electrón
(próxima sección), y determina el número de orbitales con un n y l dado, según 2l + 1. Existen l nodos
angulares en la función de onda; el número de nodos radiales es n − l − 1.
donde las funciones Rnl están asociadas a las funciones asociadas de Laguerre (reales) y las Ylml son los armónicos
esféricos (en general, complejas, ver Tabla III). La probabilidad de encontrar un electrón en un elemento de
volumen dτ = r2 sin θdφdr en un punto especificado por las coordenadas polares esféricas (r, θ, φ) cuando el
2
estado de un electrón está descrito por la función de onda ψnlml es |ψnlml (r, θ, φ)| .
Aún cuando la funciones de onda nos da la probabilidad de encontrar un electrón en un punto especı́fico, a
veces es más útil el conocer la probabilidad de encontrar la partı́cula a un determinado radio, independiente de
la dirección. Esta probabilidad se obtiene al integrar sobre el volumen contenido entre dos esferas concéntricas
de radios r y r + dr (Fig. 15):
Z Z π Z 2π
2 2
P (r)dr = |ψnlml | dτ = Rnl 2 |Ylml | r2 sin θdrdθdφ . (124)
superficie 0 0
44
Tabla III: Armónicos esféricos
l ml Ylml (θ, φ)
0 0 1/2π 1/2
1 0 1/2(3/π)1/2 cos θ
±1 ∓(3/2π)1/2 sin θe±iφ
2 0 1/4(5/π)1/2 (3 cos2 θ − 1)
±1 ∓1/4(15/2π)1/2 cos θ sin θe±iφ
±2 1/4(15/2π)1/2 sin2 θe±2iφ
3 0 1/4(7/π)1/2 (2 − 5 sin2 θ) cos θ
±1 ∓1/8(21/π)1/2 (5 cos2 θ − 1) sin θe±iφ
±2 1/4(105/2π)1/2 cos θ sin2 θe±2iφ
±3 ∓1/8(35/π)1/2 sin3 θe±3iφ
Figura 15: La función de distribución radial nos da la probabilidad de que un electrón sea encontrado en cualquier
parte entre dos esferas concéntricas de radios que difieren por dr.
Luego,
P (r)dr = R2 r2 dr . (126)
La cantidad P (r) = R2 r2 es la función de distribución radial: cuando se multiplica por dr esta nos entrega
la probabilidad de que el electrón se encuentre entre r y r + dr. Para una función de onda con l = 0 (un orbital
2
s), R2 r2 es equivalente a 4πr2 |ψ| . Para un orbital con n = 1 y l = 0, se sigue de la Tabla II que
3
Z
P (r) = 4 r2 e−2Zr/a0 . (127)
a0
Esta función se ilustra en la Fig. 16. Notemos que esta es cero en r = 0 (en cuenta del factor r2 ) y se acerca
a cero a medida que r → ∞ debido al factor exponencial. Derivando con respecto a r y haciendo dP/dr = 0 es
fácil mostrar que P pasa por un máximo en
a0
rmax = . (128)
Z
Para un átomo de hidrógeno (Z = 1), rmax = a0 . Luego, el radio que Bohr calculó para el estado de energı́a más
bajo en el átomo de hidrógeno en su modelo del átomo previo a la mecánica cuántica es de hecho la distancia
entre el electrón y el núcleo más probable en el modelo mecánico cuántico. Notemos que este radio más probable
45
Figura 16: La función de distribución radial para un electrón en 1s. La función pasa a través de un máximo en
el radio de Bohr, a0 .
decrece en átomos hidrogenoides a medida que Z aumenta, dado que el electrón se acerca al núcleo a medida
que la carga de este último aumenta.
Las funciones de onda para un único electrón en el potencial generado por átomos son llamadas orbitales
atómicos, dando un sentido de menor certeza que el término “órbita” que aparece en la teorı́a clásica. Por
razones históricas, orbitales con l = 0 se llaman s-orbitales, l = 1 p-orbitales, l = 2 d-orbitales y l = 3
f -orbitales. Cuando un electrón está descrito por una función de onda ψnlml decimos que el electrón ocupa
tal orbital. Un electrón que ocupa un s-orbital es llamado un s-electrón, y similarmente para electrones que
ocupan otros tipos de orbitales.
La forma de los orbitales atómicos puede ser expresadas en varias formas. Una manera es denotar la probabilidad
de encontrar un electrón en una región mediante la densidad de sombra en la región (Fig. 17). Un procedimiento
más simple y generalmente adecuado es dibujar la superficie de borde, la superficie de probabilidad constante
dentro de la que existe una proporción especı́fica de la densidad de probabilidad (tı́picamente un 90 %). Para
formas reales de los orbitales, el signo de la función de onda a menudo se indica tanto tiñendo la parte de amplitud
positiva de la superficie de borde o bien incluyendo signos + o − a las zonas relevantes de los orbitales. Son pocas
las ocasiones en las que se requiere una representación precisa de la amplitud o de la densidad de probabilidad,
y las superficies de borde cualitativas mostradas en Fig. 17 son generalmente adecuadas.
Las superficies de borde en Fig. 17 muestan que los s-orbitales son esféricamente simétricos, mientras Y00 es
una constante independiente de los ángulos; ya antes hemos visto que los orbitales s difieren de otros tipos
de orbitales en la medida en que estos tienen una amplitud no nula en el núcleo. Esta caracteristica se deriva
de la falta de momentum angular. Puede ser confuso el por qué, al no tener momentum angular, un orbital s
pueda existir, dado que un electrón clásico sin momentum angular decaerı́a hacia el núcleo como resultado de la
46
Figura 17: Dos representaciones de la densidad de probabilidad correspondiente a un orbital 1s: (a) la densidad
representada por oscuridad del sombreado, (b) la superficie de borde del orbital.
atracción nuclear. La respuesta se encuenta en la competencia cuántica entre las energı́as cinéticas y potenciales.
Para que un electrón s se “agrupe” cerca del núcleo, minimizando ası́ su energı́a potencial, este necesita una
función de onda que se acentúe fuertemente en el núcleo y sea cero en todo el resto del dominio. Sin embargo,
tal función de onda estarı́a altamente curvada, correspondiendo entonces a un electrón con una energı́a cinética
muy alta. Si en cambio, la función de onda se dispersa sobre una región lo suficientemente amplia con una
curvatura suave, luego aunque su energı́a cinética será baja, su energı́a potencial será alta, ya que pasará mucho
más tiempo lejos del núcleo. La energı́a total más baja se obtiene cuando la función de onda es una mezcla entre
confinada-pero curvada y dispersa-pero levemente curvada.
Las superficies de borde para los primeros l orbitales para sus valores permitidos de ml se ilustran en la Fig. 18.
Los tres orbitales p con un determinado valor de n corresponden a los tres valores que ml puede tomar, a
saber 0 y ±1. El orbital con ml = 0 es real (ver Y10 en la Tabla III) y su componente de momentum angular
alrededor del eje z nula; es llamado un orbital pz . Los dos orbitales restantes, p+ y p− , son complejos, y tienen
su amplitud máxima en el plano xy (ver Fig. 18):
1/2
3
ψn,1,0 = pz = Rn1 (r) cos θ ,
4π
1/2
3
ψn,1,1 = p+ = − Rn1 (r) sin θeiφ ,
8π
1/2
3
ψn,1,−1 = p− = Rn1 (r) cos θe−iφ .
8π
47
2
Figura 18: Las superficies de borde para |ψ| correspondientes a l = 0, 1, 2 y los valores permitidos para |ml | en
cada caso.
1/2
1 3
px = √ (p− − p+ ) = Rn1 (r) sin θ cos φ ,
2 4π
1/2
i 3
py = √ (p− + p+ ) = Rn1 (r) sin θ sin φ .
2 4π
Los orbitales complejos son de la forma apropiada para usar en átomos y moléculas lineales cuando no existen
ejes x e y bien definidos; las formas reales son más apropiadas cuando los ejes x e y están bien definidos, tal
como en moléculas no lineales. Los tres orbitales reales (px , py y pz ) tienen la misma forma de doble lóbulo,
pero alineados a lo largo de los ejes x, y y z, respectivamente.
Existen cinco orbitales d (l = 2) para n ≥ 3. Todos los orbitales, excepto aquellos con ml = 0, son complejos, y
corresponden a un estado definido de momentum angular orbital alrededor del eje z. Estos orbitales complejos
tiene una simetrı́a cilı́ndrica alrededor del eje z; sin embargo, es más común mostrarlos como su parte real,
como en la Fig. 19:
48
Figura 19: Superficies de borde para orbitales p y d.
1/2 1/2
5 5
dz2 = d0 = Rn2 (r)(3 cos2 θ − 1) = Rn2 (r)(3z 2 − r2 )/r2 ,
16π 16π
1/2
1 15
dx2 −y2 = √ (d+2 + d−2 ) = Rn2 (r)(x2 − y 2 )/r2 ,
2 16π
1/2
1 15
dxy = √ (d+2 − d−2 ) = Rn2 (r)xy/r2 ,
i 2 4π
1/2
1 15
dyz = √ (d+1 + d−1 ) = − Rn2 (r)yz/r2 ,
i 2 4π
1/2
1 15
dzx = √ (d+1 − d−1 ) = Rn2 (r)zx/r2 .
2 4π
La notación se deriva de la identificación de la dependencia angular de los orbitales con las relaciones x =
r sin θ cos φ, y = r sin θ sin φ y z = r cos θ. Derivando estos resultados, hemos usado las fases de los armónicos
49
Figura 20: Las partes reales de las funciones de onda para los siete orbitales atómicos con l = 3. Notemos que
graficados de esta manera la forma única de la función de onda con ml = 0 parece ser parte de una familia de
funciones cilı́ndricamente simétricas.
esféricos especificados en la Tabla III. La forma de los orbitales f se muestran en la Fig. 20.
Una vez que las funciones de onda de los orbitales son encontradas es directo calcular varias propiedades de las
distribuciones del electrón que estas representan. Por ejemplo, el radio medio de un orbital puede ser evaluado
calculando el valor de expectación de r usando una de las funciones de onda dadas en la Tabla II. Sin embargo,
usualmente es mucho más fácil usar una de las siguientes expresiones generales que se obtienen usando las
propiedades generales de las funciones asociadas de Laguerre para evaluar los valores de expectación:
a0 n2
1 l(l + 1)
hrinlml = 1+ 1− ,
Z 2 n2
1 Z
h i = 2 .
r nlml n a0
Notemos que la primera de estas expresiones muestra que el radio medio de un orbital ns es mayor que el de un
orbital np, lo que es contrario a lo que uno esperarı́a sobre la base del efecto centrı́fugo del momentum angular
orbital. Esto es debido a la existencia de un nodo radial adicional en el orbital ns, que tiende a extender su
función de distribución radial a distancias mayores. El hecho de que el valor promedio de 1/r es independiente
de l se alı́nea con la degeneración de los átomos hidrogenoides; la energı́a potencial de Coulomb de un electrón
es proporcional al valor medio de 1/r, y el resultado implica que todos los orbitales de una determinada cáscara
50
tienen la misma energı́a potencial.
Ya hemos visto que las energı́as de los orbitales hidrogenoides dependen solo del número cuántico principal n.
Para apreciar esta conclusión, invocamos el teorema virial, que nos dice que si la energı́a potencial de un cierto
sistema puede ser expresada en la forma V = axs , donde a y s son constantes, luego, la energı́a cinética y
potencial medias; EK , y EP están relacionadas según
Luego, en nuestro caso, cuando el potencial es tipo Coulomb (s = −1), el teorema virial implica que
1
hEK i = − hEP i . (130)
2
Sin embargo, justo hemos visto que el valor medio de 1/r es independiente de l; luego, tanto el promedio de la
energı́a potencial y (por el teorema virial) el promedio de la energı́a cinética son independientes de l. Ası́, la
energı́a total es independiente de l, y todos los orbitales de un determinado cascarón tienen la misma energı́a.
Debido a que los valores permitidos de l son l = 0, 1, ..., n − 1, y para cada valor de l existen 2l + 1 orbitales, la
degeneración de un nivel con número cuántico n es
n−1
X
gn = (2l + 1) = n2 , (131)
l=0
como se adujo anteriormente. La degeneración de los orbitales con el mismo valor de n pero diferentes l es única
para átomos hidrogenoides y se pierde en presencia de más de un electrón. Sin embargo, la degeneración de los
orbitales con diferentes valores de ml pero los mismos valores de n y l permanece incluso en la presencia de
muchos electrones ya que orbitales con diferentes ml difieren solo en la orientación de su momentum angular
relativo a un eje arbitrario. La degeneración de estados con diferentes valores de ml puede ser removida con la
presencia de un campo eléctrico o magnético externo.
La alta degeneración de un átomo hidrogenoide es un ejemplo de una degeneración accidental, debido a que no
existe una rotación obvia del átomo que permita que un orbital s sea transformado en un orbital p, o algún otro.
Sin embargo, el potencial de Coulomb tiene una simetrı́a que no es inmediatamente aparente. Esta simetrı́a
escondida se muestra en espacios de dimensión mayores a 3. Esto implica que un ser cuadridimensional podrı́a
ver a simple vista que un orbital 2s rote de tal forma de obtener un orbital 2p, y luego no le serı́a sorprendente su
degeneración. Una manera de ilustrar esta simetrı́a oculta se ilustra en la Fig. 21, donde tenemos que imaginar
como un ser bidimensional podrı́a experimentar la proyección de una esfera con patrones. Es bastante fácil para
nosotros ver que una de las rotaciones de la esfera resulta en un cambio en la proyección de la esfera que llevarı́a
a un “terraplanista” a pensar que un orbital p ha sido transformado en un orbital s. Nosotros, en nuestro espacio
tridimensional, podemos ver fácilmente que los orbitales están relacionados por una simetrı́a; el ser de más bajas
dimensiones, sin embargo, podrı́a no verlo, y permanecerı́a desconcertado acerca de la degeneración. El átomo
de hidrógeno tiene exactamente el mismo tipo de simetrı́a en dimensiones más altas.
51
Figura 21: Representación del origen de la degeneración de los orbitales 2s y 2p en los átomos hidrogenoides. El
objeto (a) puede ser rotado en (b), correspondiendo (cuando se analiza la proyección en el plano bidimensional) a
la rotación de un orbital 2py en uno 2px . Sin embargo, la rotación respecto a otro eje resulta en una proyección que
corresponde a un orbital 2s (c). Ası́, en un espacio de dimensiones más altas, las rotaciones pueden interconvertir
orbitales 2s y 2p.
9. Momentum angular
Ahora desarrollaremos el material de la sección anterior mostrando que muchos de los resultados obtenidos
ahı́ pueden ser inferidos de las propiedades de ciertos operadores. Por ejemplo, aun cuando ya hemos visto que
resolver la ecuación de Schrödinger nos lleva a la conclusión de que el momentum angular orbital está cuantizado,
la misma conclusión se puede obtener del operador, sin la necesidad de resolver la ecuación diferencial.
donde î, ĵ y k̂ son los vectores unitarios ortogonales a lo largo de los ejes x, y y z de un sistema cartesiano. Ası́,
en la representación de posición
~ ∂ ∂ ~ ∂ ∂ ~ ∂ ∂
lx = y −z , ly = z −x , lz = x −y . (133)
i ∂z ∂y i ∂x ∂z i ∂y ∂x
La propiedad de hermiticidad de estos operadores, al ser observables (como veremos más adelante) se puede
comprobar fácilmente en esta representación (Tarea??) y sabemos que esto debe ser cierto en cualquier repre-
sentación si los operadores representan observables. Sin embargo, desarrollar las propiedades de este operador
puede ser mucho más poderoso sin el uso de una representación especı́fica.
Para esto, partamos con establecer las relaciones de conmutación de los operadores lq . Consideremos inicialmente
52
el par lx y ly :
Lo mismo para todos los otros conmutadores. Luego, los conmutadores no nulos son
Podemos construir otro operador, el operador l2 = lx2 + ly2 + lz2 , correspondiente al cuadrado de la magnitud del
momentum angular. Calculamos la relación de conmutación que tiene con el resto de operadores del momentum
angular:
Notamos que
Similarmente,
[ly2 , lz ] = i~{ly , lx } = i~{lx , ly } , (136)
Concluimos que el conmutador de l2 con lz es cero. Aún más, dado que lx , ly y lz aparecen de forma simétrica
en la definición de l2 , los tres operadores deben conmutar con l2 si uno de los tres lo hace. Esto es,
[l2 , lq ] = 0 , (137)
para todo q. Las relaciones de conmutación en Ecs. (135) y (137) son los fundamentos de toda la teorı́a del
momentum angular. Siempre que nos encontremos con cuatro operadores que satisfagan estas relaciones de con-
mutación sabremos que las propiedades de los observables que estos representan son idénticas a las propiedades
que estamos a punto de derivar. Por esto, diremos que un observables es un momentum angular si sus operadores
satisfacen estas relaciones de conmutación, aunque esto tiene sutilezas; el caso de los operadores asociadas a la
53
carga eléctrica, o el del spin del electrón.
Figura 22: El cono usado para representar un estado de momentum angular con magnitud y componente z
especificada.
En este punto, sin embargo, empezamos a ver que el modelo vectorial debe ser tomado con cautela. Las relaciones
de conmutación en Ec. (135) pueden ser escritas de forma resumida como sigue:
~l × ~l = i~~l .
Sin embago, es una caracteristica elemental del álgebra vectoral que el producto vectorial de un vector consigo
mismo es cero. Luego, dado que el producto vectorial de l consigo mismo no es cero, debemos concluir que l
no es un vector. El modelo vectorial es útil siempre y cuando nos demos cuanta que no es del todo “cierto” y
notemos que un operador vectorial, no un vector clásico.
54
Las relaciones inversas son
1 1
lx = (l+ + l− ) , ly = (l+ − l− ). (139)
2 2i
Necesitaremos los conmutadores de los operadores de corrimiento. Son fácilmente derivables de las relaciones
de conmutación fundamentales. Por ejemplo,
Aún más, dado que l2 conmuta con cada una de sus componentes, también conmuta con l± . Ası́, podemos
incluir en estas relaciones la regla
[l2 , l± ] = 0 . (141)
Supondremos que los autoestados simultáneos de l2 y lz están identificados por dos número cuánticos, que por
el momento denotaremos por λ y ml , sin ninguna razón aparente. Luego, los autoestados se denotarán como
|λ, ml i. Definimos ml a través de la relación
Ya que ~ tiene dimensiones de momentum angular (M L2 T −1 ), el autovalor de lz debe ser un múltiplo numérico
de ~; no estamos suponiendo que ml está restringuido a valores discretos, esto emergerá solo más adelante. Todo
lo que sabemos es que ml es un número real, por la hermiticidad de lz .
Dado que l2 conmuta con lz , el estado |λ, ml i es también un autoestado de l2 . En este punto debemos permitir
la posibilidad de que el autovalor de l2 dependa de ambos número cuánticos, por lo que escribimos
donde f es una función que necesitamos determinar. De lo visto en la sección anterior sabemos que este valor
será l(l + 1), donde l es el valor máximo de |ml |, pero esto es algo que derivaremos. Todo lo sabemos hasta este
punto es que dado que l2 es hermı́tico, f es real. Aún más, dado que l2 es la suma de cuadrados de operadores
hermı́ticos, también sabemos que sus autovalores son no-negativos.
Ya que l2 − lz2 = lx2 + ly2 , se sigue que los autovalores del operador l2 − lz2 son no-negativos:
55
Sin embargo, también sabemos
El siguiente paso es usar las relaciones de conmutación para determinar el efecto de los operadores de corrimiento
(y entender finalmente su nombre). Consideremos el efecto del operador l+ sobre |λ, ml i. Dado que |λ, ml i no
es un autoestado de lx ni de ly , cuando l+ actúa sobre este, se genera un nuevo estado. Primero, mostramos
que l+ |λ, ml i = |λ0 , m0l i es un autoestado de l2 con el mismo valor de f ; esto es |λ, ml i y l+ |λ, ml i comparten
el mismo autovalor de l2 . Para hacer esto, consideremos el efecto de l2 sobre el estado obtenido de la acción de
l+ :
l2 |λ0 , m0l i = l2 l+ |λ, ml i = l+ l2 |λ, ml i = l+ f (λ, ml )~2 |λ, ml i = f (λ, ml )~2 l+ |λ, ml i (147)
= f (λ, ml )~2 |λ0 , m0l i , (148)
donde la primera igual proviene del hecho de que l2 y l+ conmutan. Se sigue, dado que el autovalor de l2 para
el estado l+ |λ, ml i es el mismo que del estado original |λ, ml i, que l+ deja la magnitud del momentum angular
sin cambios cuando este actúa.
Ahora, consideremos el mismo argumento aplicado sobre |λ, ml i como un autoestado de lz . La conclusión será
diferente, ya que l+ y lz no conmutan. En vez de esto, debemos usar las siguientes igualdades para encontrar el
efecto de lz sobre |λ, ml i:
Luego, el estado l+ |λ, ml i debe ser proporcional al estado |λ, ml + 1i y podemos escribir
donde c+ (λ, ml ) es un coeficiente númerico que debemos encontrar. Ahora vemos por qué l+ es llamado el
operador de subida: cuando este opera sobre un estado con componente z ml ~, genera un estado con la misma
magnitud de momentum angular pero con una componente z una unidad más grande, (ml + 1)~ (Fig. 23). De
esta misma forma, el efecto del operador l− es el de bajar la componente z desde ml ~ a (ml − 1)~:
56
Figura 23: El efecto de los operadores de corrimiento l+ y l− .
Los operadores de corrimiento cambian ml por ±1 cada vez que operan. Sin embargo, ya hemos establecido de
su hermiticidad que m2l no puede exceder f (λ, ml ) (Ec. (146)); se sigue que ml debe tener un valor máximo,
que denotaremos por l. Cuando operamos con l+ sobre un estado en el que ml = l, generamos nada, dado que
no existe un estado con un valor más grande de ml :
l+ |λ, li = 0 . (153)
Esta relación nos entregará el valor de la función f hasta ahora desconocida. Cuando aplicamos l− , tenemos
l− l+ |λ, li = 0 . (154)
l− l+ = (lx − ily )(lx + ily ) = lx2 + ly2 + ilx ly − ily lx = lx2 + ly2 + i[lx , ly ] = l2 − lz2 + i(i~lz ) . (155)
y se sigue que
f (λ, l) = l(l + 1) . (157)
57
Ya hemos establecido que cuando l− actúa sobre un estado este no cambia el autovalor de l2 (de la comparación
de Ec. (143) y la Ec.(147) análoga para el operador l− ). Por lo tanto, todos los estados |λ, li, |λ, l − 1i, etc.
tienen los mismos autovalores de l2 . Ası́
f (λ, ml ) = l(l + 1) , (158)
para ml = l, l − 1, ... . Sabemos que existe una cota baja sobre ml debido a que el autovalor de lz2 no puede
exceder al autovalor de l2 , y por el momento denotaremos a esta cota baja por k. Es bastante fácil mostrar
que k = −l. Para ver que este es el caso, empezamos de l− |λ, ki = 0, y por un argumento similar pero usando
l+ l− |λ, ki = 0, concluı́mos que f (λ, k) = k(k − 1). Sin embargo, dado que f (λ, ml ) es independiente de ml ,
debemos tener l(l + 1) = k(k − 1). De las dos soluciones k = −l y k = l + 1, solo la primera es aceptable (la
cota baja debe ser menor que la cota por arriba!). Por lo tanto
para ml = l, l − 1, ..., −l .
En este punto, podemos poner al número cuántico que queda λ en uso, e identificarlo como l, el valor máximos
de |ml |. Luego,
f (l, ml ) = l(l + 1) , (160)
para ml = 1, l − 1, ..., −l .
Esto es, sabemos que
l2 |l, ml i = l(l + 1)~2 |l, ml i , (161)
y vemos que el valor de l (el valor máximo de ml ) determina la magnitud del momentum angular. Junto a lo
que ya sabemos
lz |l, ml i = ml ~ |l, ml i , (162)
Podemos resumir las conclusiones hasta ahora. Sobre la base de la hermiticidad de los operadores del momentum
angular y sus relaciones de conmutación, hemos mostrado que
p
1. La magnitud del momentum angular está confinada a los valores l(l + 1)~, con l = 0, 12 , 1, ... .
2. La componente sobre el eje z arbitrario está limitado a los 2l + 1 valores ml ~ con ml = l, l − 1, ... − 1.
Estas conclusiones difieren en un detalle con las obtenidas al resolver la ecuación de Schrödinger en la sección
anterior. Ahı́ vimos que l está confinada a valores enteros l = 0, 1, 2, .... En tal análisis, obtuvimos los valores
permitidos de l imponiendo condiciones de borde cı́clicas. Lo que el presente análisis hace es mostrar que el
momentum angular puede ser descrito por número cuánticos semi-enteros, pero tales número cuánticos no nece-
sariamente aplican a una situación fı́sica particular. Para el momentum angular orbital, donde la interpretación
de Born requiere que condiciones de borde cı́clicas sean satisfechas, solo valores enteros son admisibles. Cuando
58
condiciones de borde cı́clicas no son relevantes, como para el momentum angular intrı́nseco conocido como espı́n,
los valores semi-enteros pueden ser apropiados.
Usaremos la siguiente notación para enfatizar que existe una distinción entre el momentum angular según las
condiciones de borde que deben ser satisfechas. Para el momentum angular orbital, cuando las condiciones de
borde de la función de onda permiten solo números cuánticos enteros, usaremos la notación l y ml y escribiremos
estados como |l, ml i. Cuando consideramos el momentum angular interno (espı́n) usamos s y ms para los número
cuánticos (posiblemente semi-enteros) y escribiremos los estados como |s, ms i. Cuando la discusión es general
y aplicable a cualquier tipo de momentum angular, usaremos j y mj , y escribimos los estados como |j, mj i. La
expresión que hemos deducido hasta ahora puede luego ser escrita en esta notación general como
En este punto, un problema relevante es el de los valores de los coeficientes c± introducidos al estudiar el efecto
de los operadores de corrimiento:
Dado que los estados |j, mj i forman un conjunto ortonormal, multiplicando por la izquierda por hj, mj ± 1|,
tenemos
hj, mj ± 1| j± |j, mj i = c± (j, mj )~ . (165)
Luego, necesitamos saber los coeficientes si queremos conocer los valores de estos elementos matriciales. Ele-
mentos matriciales de este tipo aparecen en el cálculo de propiedades magnéticas e intensidades de transición
en resonancia magnética.
El primer paso involucra el encontrar dos expresiones para los elementos matriciales del operador j− j+ . Primero,
podemos usar Eq. (155) y escribir
El siguiente paso es encontrar una relación entre los dos coeficientes que aparecen en la última expresión.
Baseremos el cálculo en el siguiente elemento matricial
59
y en la hermiticidad de jx y jy . Consideremos el siguiente conjunto de manipulaciones:
Esto es
∗
hj, mj | j− |j, mj + 1i = hj, mj + 1| j+ |j, mj i , (170)
lo que demuestra que j− y j+ son el conjugado hermı́tico el uno del otro. Ninguno de los operadores es
hermı́tico, y luego ninguno de los dos operadores corresponde a un observable fı́sico. En general, dos operadores
A y B son conjugados hermı́ticos el uno del otra si
∗
ha| A |bi = hb| B |ai . (171)
La relación que hemos derivado implica una relación entre los coeficientes c± . Debido a que el elemento matricial
en la izquierda de Ec. (170) es igual a c− (j, mj + 1)~ y aquel a la derecha es igual a c∗+ (j, mj )~, se sigue que
2
|c+ (j, mj )| = j(j + 1) − mj (mj + 1) . (173)
Aún más, dado que c− (j, mj ) = c∗+ (j, mj − 1), también podemos escribir
q
c− (j, mj ) = j(j + 1) − mj (mj − 1) . (175)
Establecidos estos elementos matriciales podemos calcular un amplio conjunto de otras cantidades. Ejemplo
4.1?? Tarea??
Ahora consideraremos el momentum angular orbital de forma explı́cita. Esta versión de la teorı́a general se
refiere al momentum angular que surge de la distribución de una partı́cula en el espacio, por lo que está sujeta
a condiciones de borde periódicas para la función de onda. Como vimos al resolver el átomo hidrogenoide, estas
condiciones limitan los números cuánticos a valores enteros, que denotamos como l y ml . En la Tarea 1 vimos
como las funciones de onda angulares del electrón en un átomo hidrogenoide son soluciones de una ecuación
60
diferencial de segundo orden y que corresponden a armónicos esféricos. Con lo desarrollado en la presente sección
podemos mostrar que este resultado también puede ser obtenido al resolver una ecuación diferencial de primer
orden, lo que corresponde a una tarea mucho más fácil.
Comenzamos encontrando la función de onda para el estado |l, li (para el que ml = l). Una vez que esta función
de onda ha sido determinada, las funciones de onda para los estados |l, ml i pueden ser generadas actuando sobre
|l, li con l− el número apropiado de veces. La ecaución que tenemos que resolver es
l+ |l, li = 0 . (176)
Para expresar esta ecuación como una ecuación diferencial debemos adoptar una representación para los ope-
radores. En la representación de posición (y coordenadas esféricas), los operadores de momentum angular son
~ ∂ ∂
lx = − sin φ + cot θ cos φ , (177)
i ∂θ ∂φ
~ ∂ ∂
ly = cos φ − cot θ sin φ , (178)
i ∂θ ∂φ
~ ∂
lz = . (179)
i ∂φ
Estos operadores se obtienen de la forma cartesiana dada en Ec. (133) luego de realizar el cambio de coordenadas
a esféricas. Se sigue que los operadores de corrimiento en la representación de posición son
∂ iφ ∂
l+ = ~e + i cot θ , (180)
∂θ ∂φ
−iφ ∂ ∂
l− = −~e − i cot θ . (181)
∂θ ∂φ
Esta ecuación diferencial parcial puede ser separada con el ansatz ψ(θφ) = Θ(θ)Φ(φ), de la que obtendremos
luego de la manipulación usual
tan θ dΘ i dΦ
=− . (183)
Θ dθ Φ dφ
De acuerdo al argumento usual de la sepación de variables, ambos lados deben ser iguales a una constante, que
denotaremos por c. Luego, la ecuación se separa en las siguientes dos ecuaciones diferenciales de primer orden:
dΘ dΦ
tan θ = cΘ , = icΦ . (184)
dθ dφ
El valor de c se fija a l al requerir que lz φl,l = lψl,l . Por lo tanto, la solución completa es
61
donde N es una constante de normalización. Esta es la forma explı́cita de los armónicos esféricos Yll dados en la
Tabla III, sin considerar la constante de normalización, la cual se puede obtener al integrar sobre la superficie de
una esfera. Con esta función encontrada, es directo aplicar el operador l− para obtener el resto de las funciones
con un valor de l dado. Tarea??
9.4.5. Espı́n
En 1925, los trabajos de los fı́sicos daneses G. Uhlenbeck y S. Goudsmit mostraron que se puede lograr una
importante simplificación en la descripción del espectro atómico si se asume que el electrón posee un momentum
1
angular intrı́nseco con número cuántico s = 2 y que puede estar en dos estados con ms = + 12 , denotado como
α o ↑, y ms = − 12 , denotado por β o ↓. Este momentum angular intrı́nseco es llamado espı́n del electrón. Esta
realización nos entrega luces sobre un experimento realizado varios años antes por O. Stern y W. Gerlach. El
experimento de Stern-Gerlach consiste en preparar un haz de átomos de plata haciéndolos pasar a travéz de
un fuerte campo magnético inhomogéneo, como ilustra la Fig. 24. Stern y Gerlach encontraron que el haz es
deflectado en dos direcciones y atribuyeron este efecto a la cuantización espacial y momentum magnético del
electrón (en un átomo de plata, existe un único electrón fuera de un cascarón cerrado, por lo que los átomos
se comportan como un único electrón sobre una “plataforma” pesada, el resto del átomo). Sin embargo, Stern
y Gerlach no se dieron cuenta de que habı́an descubierto el espı́n del electrón, solo crearon su experimento
basados en sus consideraciones sobre el momentum angular orbital. Aún más, aunque el espı́n del electrón fue
descubierto en 1925, pareciera que recién en 1927 la separación de Stern-Gerlach fue atribuı́da al espı́n del
electrón estando en una de dos direcciones, lo que ahora interpretamos como los estados con ms = ± 21 .
62
bastante simple. Si denotamos el estado | 12 , + 12 i por α y el estado | 12 , − 21 i por β, luego las expresiones generales
dadas anteriormente en Ec. (163) se vuelven
1 1 3 2 3 2
sz α = + ~α , sz β = − ~β , s2 α = ~ α, s2 β = ~ β, (187)
2 2 4 4
y los efectos de los operadores de corrimiento, usando los resultados de Ecs. (174) y (175), son
s+ α = 0 , s+ β = ~α , s− α = ~β , s− β = 0 . (188)
Se sigue que los únicos elementos matriciales no nulos de los operadores de corrimiento son
Los operadores pueden ser escritos de forma sucinta en términos de matrices al considerar sus efectos en el
conjunto base ortonormal {α, β}: ! !
1 0
α= , β= . (190)
0 1
Con esta notación, el efecto del operador sz puede ser reproducido por el efecto de una matriz de 2 × 2:
! ! !
1 1 0 1 1 1 1
sz α = + ~ =+ ~ = + ~α , (191)
2 0 −1 0 2 0 2
con una expresión similar para el efecto de sz sobre β. De forma similar, el efecto de sx sobre α, que de acuerdo
a Ecs. (139) y (188) es sx α = 21 ~β, puede ser expresado como sigue
! ! !
1 0 1 1 1 0 1
sx α = + ~ =+ ~ = + ~β , (192)
2 1 0 0 2 1 2
con una expresión similar para los efectos de sx sobre β. De hecho, todas las propiedades de los operadores de
espı́n- 12 , sq , incluı́das sus relaciones de conmutación son reproducidas por las siguientes matrices;
! ! !
0 1 0 −i 1 0
σx = , σy = , σz = , (193)
1 0 i 0 0 −1
y donde ! !
0 2 0 0
σ+ = , σ− = , (194)
0 0 2 0
con la relación
1
sq = ~σq , (195)
2
con q = x, y, z, +, − . El conjunto de matrices σx , σy , σz son conocidas colectivamente como las matrices de
Pauli. Estas matrices juegan un rol importante en el desarrollo de las propiedades de sistemas de espı́n- 21 , y las
usaremos más adelante.
63
9.5. Momentum angular de sistemas compuestos
Ahora consideraremos un sistema en que el existen dos fuentes del momentum angular, que denotaremos como
j1 y j2 . El sistema puede ser compuesto por una única partı́cula que posee tanto espı́n como momentum angular
orbital, o puede consistir de dos partı́culas con espı́n o de dos partı́culas con momentum angular orbital. Acá
investigaremos las implicancias de las reglas de conmutación para el momentum angular total j del sistema.
El estado de la partı́cula 1 está completamente especificado al reportar los números cuánticos j1 y mj1 , y lo
mismo es cierto para la partı́cula 2, en términos de sus números cuánticos j2 y mj2 . Si nos es posible especificar
el estado completo como |j1 , mj1 ; j2 , mj2 i, necesitamos saber si todos los operadores correspondientes conmutan
entre ellos. De hecho, operadores para fuentes independientes de momentum angular sı́ conmutan entre ellos, y
podemos escribir
[j1q , j2q0 ] = 0 , (196)
para todas las componentes q = x, y, z y q 0 = x, y, z. Una forma de confirmar esta conclusión es notando que
en la representación de posición los operadores están expresados en términos de las coordenadas y derivadas
de cada partı́cula, separadamente, y las derivadas para una partı́cula trata a las coordenadas de la otra como
constantes. Operadores que hacen referencia a componentes independientes de un sistema siempre conmutan
entre ellos. Debido a que los operadores j12 y j22 están definidos en términos de sus componentes, las cuales
conmutan, entonces estos dos operadores también conmutan. Luego, los cuatro operadores j12 , j1z , j22 y j2z
conmutan entre ellos, y es permisible expresar el estado como |j1 , mj1 ; j2 , mj2 i.
Ahora exploramos si es que el momentum angular total del sistema, j = j1 + j2 , también puede ser especifi-
cado. Primero, investigamos cuando j es en efecto un momentum angular (¿qué significa que un observable sea
un momentum angular?). Para hacer esto, evaluamos los conmutadores de sus componentes, como
Estas relaciones de conmutación, junto a las otras dos que se pueden derivar de esta haciendo permutaciones
cı́clicas de las etiquetas para las coordenadas, son caracterı́sticas del momentum angular, ası́ j es un momentum
angular (j1 − j2 , por otro lado, no lo es). Ya que j es un momentum angular podemos concluir sin más que su
p
magnitud es j(j + 1)~ con j entero o semi-entero (¿por qué?), y su componente z tiene los valores mj ~ con
mj = j, j − 1, ..., −j.
Ahora necesitamos encontrar qué valores de j pueden existir en el sistema. La pregunta inicial es si es posible
especificar j si j1 y j2 han sido especificados. Debido a que j12 conmuta con todas sus componentes y j22 con
todas las suyas, y dado qe j 2 puede ser expresado en términos de las mismas componentes (como j 2 = j12 + j22 =
2 2 2 2 2 2
j1x + j1y + j1z + j2x + j2y + j2z ), se sigue que
64
Luego, podemos concluir que los autovalores de j12 , j22 y j 2 puede ser simultáneamente especificados. Por ejemplo,
un electrón p (para el que l = 1 y s = 12 ) puede ser pensado como teniendo un momentum angular total bien
definido con una magnitud dada por algún valor de j (los valores permitidos de aún necesitamos encontrar).
Ya que j 2 conmuta con sus propias componentes, en particular conmuta con jz = j1z + j2z . Ası́, sabemos
que podemos especificar los valores de mj y también j. Hasta este punto hemos establecido que un estado de
momentum angular acoplado puede ser denotado como |j1 j2 ; jmj i. Sin embargo, notemos que aún no hemos
establecido que se puede especificar de forma más completa como |j1 mj1 j2 mj2 ; jmj i ya que aún no hemos
establecido si j 2 conmuta con j1z y j2z . Para explorar este punto procedemos como sigue:
El conmutador no es cero, y entonces no podemos especificar mj1 (o mj2 ) si especificamos j. De este análisis se
sigue que tenemos que hacer una elección cuando especificamos el sistema. O bien usamos el marco desaco-
plado |j1 mj1 ; j2 mj2 i, que deja el momentum angular total sin especificar y por lo tanto, en efecto, no dice nada
acerca de la orientación relativa de los dos momentos, o bien usamos el marco acoplado |j1 j2 ; jmj i, que deja
las componentes individuales sin especificar. Hasta este punto, qué elección de marco hagamos es arbitraria. Más
adelante, cuando consideremos la energı́a de interacción entre diferentes momentos angulares veremos que un
marco es más natural que el otro. Por ahora, ambos marcos son simplemente formas alternativas de especificar
un sistema compuesto.
Esto es, la componente total del momentum angular alrededor de un eje es la suma de las componentes de las
dos contribuciones de momentos (Fig. 25). Para determinar los valores permitidos de j, primero notamos que el
número total de estados en el marco desacoplado es (2j1 + 1)(2j2 + 1) = 4j1 j2 + 2j1 + 2j2 + 1 (por ejemplo, para
el electrón p, donde j1 = l = 1 y j2 = s = 21 , tenemos 6 estados independientes ¿cuáles son estos?). Existe solo
un único estado en el que ambas componentes tiene sus valores máximos, mj1 = j1 y mj2 = j2 , y este estado
corresponde a mj = j1 + j2 . Sin embargo, el máximo valor de mj es por definición j, luego, el máximo valor de
j es j = j1 + j2 . Existen 2j + 1 = 2j1 + 2j2 + 1 estados correspondientes a este valor de j, por lo que aún hay
4j1 j2 más estados que encontar.
65
Figura 25: Representación de la condición mj = mj1 + mj2 .
Aunque el estado con mj = j1 + j2 puede surgir de una única manera, el estado con mj = j1 + j2 − 1 se puede
dar de dos formas; a partir de mj1 = j1 − 1 y mj2 = j2 y desde mj1 = j1 y mj2 = j1 − 1. El estado con
j = j1 + j2 cuenta para solo uno de estos estados (o para una de sus dos combinaciones lineales), entonces debe
existir otro estado acoplado para el que el valor máximo de mj es mj = j1 + j2 − 1. Este estado corresponde a
un estado con j = j1 + j2 − 1. Un sistema con este valor de j cuenta para 2j + 1 = 2j1 + 2j2 − 1 estados. El
proceso puede continuar al considerar el siguiente valor más bajo de mj , el que es mj = j1 + j2 − 2, que puede
ser producido de tres formas diferentes. Los dos estados con j = j1 + j2 y j = j1 + j2 − 1 cuentan dos de estos;
el tercero (o la tercera combinación lineal) debe surgir del estado con j = j1 + j2 − 2. Este argumento puede
continuar, y todos los estados son contandos una vez alcanzado j = |j1 − j2 | (j es un número positivo, es por
esto el valor absoluto). Por lo tanto, los estados permitidos del momentum angular son dados por la serie de
Clebsch-Gordan:
j = j1 + j2 , j1 + j2 − 1, ..., |j1 − j2 | . (201)
La serie de Clebsch-Gordan puede ser ilustrada de una forma simple. Supongamos que tenemos baras de lon-
gitudes j1 y j2 y se nos pregunta por la longitud j del tercer lado de un triángulo que puede ser “formado”
usando estas dos baras (con todas las tres longitudes enteras o semi-enteras). Luego, la respuesta serı́a preci-
samente aquellas dadas por la serie de Clebsch-Gordan (Fig. 26). Por ejemplo, j1 = 1 y j2 = 1 requiere baras
de longitudes j = 2, 1, 0 para formar un triángulo. Aunque la condición triangular no es más que una simple
regla mnemotécnica, sı́ nos sugiere que el momentum angular en mecánica cuántica sı́ se comporta como vector
y que el momentum angular total puede ser pensado como el resultado de los momentos contribuyentes. La
exploración de este punto nos lleva al “modelo vectorial” del momentum angular acoplado.
66
Figura 26: La condición triangular correspondiente a la serie de Clebsch-Gordan. Los valores permitidos de j
son aquellos para los que las lı́neas de longitud j, j1 , y j2 pueden ser usadas para formar un triángulo.
2. Este vector debe yacer sobre un ángulo indeterminado sobre un cono alrededor del eje z (debido a que jx
y jy no pueden ser especificados una vez que jz ha sido especificado).
p p
3. Las longitudes de los vectores momentos angulares que contribuyen son j1 (j1 + 1) y j2 (j2 + 1). Estas
longitudes tienen valores definidos incluso cuando j está especificado.
4. La proyección del momentum angular total sobre el eje z es mj ; en el marco acoplado (en el que j está
especificado), los valores de mj1 y mj2 son indefinidos, pero su suma es igual a mj .
5. En el marco desacoplado (en el que j no está especificado), las componentes individuales mj1 y mj2 pueden
ser especificadas, y su suma es igual a mj .
Los diagramas de las Figs. 27 capturan estos puntos. La Fig. 27 izquierda muestra uno de los estados en el marco
desacoplado: tanto mj1 como mj2 están especificados, pero no hay ninguna indicación acerca de la orientación
relativa de j1 y j2 más allá del hecho de que yacen sobre sus respectivos conos. El momentum angular total
es por lo tanto indeterminado, puede ser cualquiera de los resultados mostrados en (a) o en (b), o cualquiera
contenido entre ambos. En la derecha de la Fig. 27 se muestra uno de los estados del marco acoplado. Ahora
el resultante, el momentum angular total, tiene una magnitud y componente sobre el eje z bien definidas,
pero las componentes individuales mj1 y mj2 están indeterminadas. Es importante no imaginar a los vectores
67
activamente en movimiento de precesión alrededor de sus conos: en este punto de la descripción, el modelo
vectorial es una exhibición de posibles pero indeterminables orientaciones.
Figura 27: Izquierda: Dos posibles estados del momentum angular total que pueden surgir a partir de dos
contribuciones de momentos especificas con número cuánticos j1 y j2 . Las orientaciones relativas de los momentos
contribuyentes sobre sus conos determinan la magnitud total. Derecha: Si los dos momentos contribuyentes
son “unidos” o “sumados” de tal forma que generen un total especı́fico, las proyecciones de los momentos
contribuyentes expanden un rango (como ilustran las barras verticales) y aunque su suma puede ser especificada,
sus valores individuales no.
1
Un ejemplo importante es el caso de dos partı́culas con espı́n s = 2, como dos electrones o bien un par de
1
protones. Para cada partı́cula, s = 2 y ms = ± 12 . En el marco desacoplado los electrones podrı́an estar en
cualquiera de los cuatro estados
α1 α2 , α1 β2 , β1 α2 , β1 β2 . (202)
Estos cuatro estados están especificados en la Fig. 28. Los momentos angulares individuales yacen en posiciones
indeterminadas sobre sus conos, y el momentum angular total es indeterminado.
Ahora consideremos el marco acoplado. La condición triangular (o la serie de Clebsch-Gordan) nos dice que el
espı́n total S (mayúsculas son usadas para denotar el momentum angular de conjuntos de partı́culas) puede
tomar los valores 1 o 0. Cuando S = 0, existe solo un único valor posible de la componente z, a saber 0,
correspondiendo a MS = 0. Tal estado acoplado es llamado un singlete. Cuando S = 1, MS = +1, 0, −1, y ası́
este arreglo acoplado es llamado un triplete.
68
Figura 28: Los cuatros estados desacoplados de un sistema compuesto por dos partı́culas de espı́n- 12 (como los
electrones), ilustrados por los conos sobre los que los espines individuales yacen.
El modelo vectorial del triplete es mostrado en la Fig. 29. Los conos han sido dibujados a escala, y de esta
ilustración muchas observaciones se hacen evidentes. El primero, para obtener un resultado correspondiente a
√ p
S = 1 (de longitud 2) usando vectores componentes correspondientes a s = 12 (de longitud 3/4), los vectores
deben yacer sobre un ángulo relativo definido. De hecho, deben yacer en el mismo plano, como se muestra en
la ilustración, solo esa orientación resulta en un vector de la longitud correcta. Notemos que aunque los espines
se dicen “paralelos” en un estado triplete (lo que representa como ↑↑), en realidad están en un ángulo agudo
(cercano a 70◦ ). Los dos espines hacen el mismo ángulo entre ellos en los estados con MS = ±1; esto es necesario
si es que queremos obtener el mismo resultante.
Figura 29: Tres de los cuatro estados acoplados de un sistema compuesto por dos partı́culas de espı́n- 12 . Todos
estos estados corresponden a S = 1. Las orientaciones relativas de los momentos angulares individuales son los
mismos en todos los casos (el ángulo es arc cos(1/3) = 70,53◦ ).
69
Figura 30: El estado acoplado restante del sistema de dos partı́culas de espı́n- 12 . Este estado corresponde a
S = 0. Notemos que los dos momentos contribuyentes son perfectamente antiparalelos.
El modelo vectorial del singlete debe representar un estado en el que los vectores del momentum angular de
espı́n se sumen para entregar un resultante nulo (Fig. 30). De la ilustración es claro que los dos espines en
este estado son realmente antiparalelos (↑↓). Como en los estados de triplete, solo la orientación relativa de los
vectores está fija; la orientación absoluta está completamente indeterminada.
Los coeficientes C(mj1 , mj2 ) son llamados coeficientes de acoplamiento vectorial. Nombres alternativos
son “coeficientes de Clebsch-Gordan”, “coeficientes de Wigner” o “sı́mbolos 3j”.
Ilustraremos el uso de estos coeficientes considerando los estados de singlete y triplete de dos partı́culas de
espı́n- 21 . Los valores están dados en la Tabla IV (revisar Apéndice 2 del libro guı́a del curso para más valores
en otros casos). Los valores en la tabla implican que, usando la notación |S, MS i,
1
|1, +1i = α1 α2 , |1, 0i = √ α1 β2 + β1 α2 , (204)
2
1
|1, −1i = β1 β2 , |0, 0i = √ α1 β2 − β1 α2 . (205)
2
Hay dos puntos que notar. El primero, incluso un estado triplete “espı́n paralelo” (↑↑) puede estar compuesto de
espines “opuestos” (ver composición de |1, 0i). Segundo, el signo + en |1, 0i se interpreta como que los espines
contribuyentes, α y β, están en fase entre ellos (como es sugerido por el diagrama vectorial para este estado),
mientras que el signo − en |0, 0i significa que estos están desfasados. Esta caracterı́stica también es capturada
por el arreglo antiparalelo de vectores en el diagrama vectorial.
70
1
Tabla IV: Coeficientes de acoplamiento vectorial para s1 = s2 = 2
ms1 ms2 |1, +1i |1, 0i |0, 0i |1, −1i
+ 12 + 12 1 0q 0q 0
1 1 1 1
+2 −2 0 0
q2 2
q
− 12 + 12 0 1
2 − 12 0
1 1
−2 −2 0 0 0 1
Expresiones generales para los coeficientes de acoplamiento vectorial pueden ser derivadas, pero son bastante
complicadas y usualmente lo más simple es usar tablas de valores numéricos. Estos valores pueden ser derivados
de forma bastante simple en casos especiales. En la siguiente subsección se detallará el procedimiento para
encontrar los valores en la Tabla IV (o no?, Tarea? Todo depende del tiempo).
Tarea??
71
10. Teorı́a de grupos
El tema de esta sección -la teorı́a matemática de la simetrı́a- es uno de los más notables de la mecánica
cuántica. Su aplicación no solo simplifica los cálculos, sino que también revela conexiones inesperadas entre
fenómenos aparentemente dispares. Tópicos de estudios completos se logran unir en términos de estos conceptos.
El momentum angular es parte de la teorı́a de grupos; también las propiedades del oscilador armónico. La
conservación de la energı́a y del momentum pueden ser discutidas en términos de la teorı́a de grupos. La teorı́a
de grupos se usa para clasificar las partı́culas fundamentales, para discutir las reglas de selección que gobiernan
qué transiciones espectroscópicas son permitidas, y para formular los orbitales moleculares. Este tema es de
gran importancia en el desarrollo de la fı́sica y también en la quı́mica, como veremos más adelante.
Una operación aplicada sobre un objeto corresponde al acto de hacer algo a este, tal como rotarlo un de-
terminado ángulo, o trasladarlo, etc. Una operación de simetrı́a es una operación que deja a un objeto
aparentemente sin cambios. Por ejemplo, la rotación de una esfera alrededor de cualquier eje que incluya su
centro la deja aparentemente sin cambios, y es luego una operación de simetrı́a. La traslación de la función
sin(x) en un intervalo de 2π la deja aparentemente sin cambios, luego esta es una operación de simetrı́a de la
función. No todas las operaciones son operaciones de simetrı́a. La rotación en 90◦ de un rectángulo es solo una
operación de simetrı́a si es que el rectángulo resulta también ser un cuadrado. Cada objeto tiene al menos una
operación de simetrı́a: la identidad, la operación que no hace nada.
A cada operación de simetrı́a le corresponde un elemento de simetrı́a, el punto, la lı́nea o plano respecto al que
la operación se realiza. Por ejemplo, una rotación se realiza respecto a una lı́nea llamada “eje de simetrı́a”, una
reflexión se lleva a cabo respecto a un plano, llamado “plano de reflexión” o “plano especular”. Sin considerar
las operaciones de simetrı́a traslacionales, existen cinco tipos de operaciones de simetrı́a que podrı́an dejar a un
objeto aparentemente sin cambios, y cinco correspondientes tipos de elementos de simetrı́a: E, Cn , σ, i y Sn .
Cn : Una rotación de orden n, la operación es una rotación en 2π/n alrededor de su elemento, el eje de
simetrı́a.
Un hexágono, o una molécula hexágonal, como el benceno, tiene ejes de orden 2, 3 y 6 (C2 , C3 y C6 , respecti-
vamente), perpendiculares al plano y varios ejes de orden 2 (C2 ) en el plano que define al molécula (Fig. 31).
Para n > 2 la dirección de rotación es importante, y las n orientaciones de un objeto se encuentran en un orden
diferente dependiendo si la rotación es horaria, vista desde abajo (Cn+ ), o antihoraria (Cn− ). Luego, para n > 2,
existen dos rotaciones asociadas con cada eje de simetrı́a. Si un objeto (como por ejemplo, un hexágono) tiene
varios ejes de rotación, luego aquel con el mayor valor de n es llamado el eje principal, siempre que sea único.
Ası́, para el benceno, C6 es el eje principal.
72
Figura 31: Algunos de los ejes de rotación de un hexágono regular, como la molécula de benceno.
Cuando el plano especular incluye el eje principal de simetrı́a, se denomina plano vertical y se denota como
σv . Si el eje principal es perpendicular al plano especular, luego el elemento de la reflexión es llamado un plano
horizontal, y se denota por σh . Un plano diédrico, σd , es un plano vertical que biseca el ángulo entre dos
ejes C2 que yacen perpendiculares al eje principal (Fig. 32).
Figura 32: (a) Dos planos especulares verticales, (b) un plano especular horizontal, y (c) un plano especular
diédrico.
La operación de inversión es una operación hipotética que consiste en tomar cada punto de un objeto a través
de su centro y hacia afuera una distancia igual hacia el otro lado (Fig. 33).
Sn : Una rotación impropia de orden n, la operación (que es también llamada una “reflexión-rotatoria”)
ocurre alrededor de un eje de rotación impropio, el elemento de simetrı́a (o “eje de reflexión-rotatoria”).
73
Una rotación impropia es una operación compuesta que consiste de una rotación de orden n seguida por una
reflexión horizontal en un plano perpendicular al eje de orden n (el order de las operaciones Cn y σh realmente
no es importante, dado que estas operaciones conmutan, como veremos más adelante). En general, aún cuando
ambas operaciones por si solas pueden no ser operaciones de simetrı́a del objeto, pero el resultado final compuesto
sı́ lo serı́a. Una molécula de metano, por ejemplo, tiene tres ejes S4 (Fig. 34). Se debe tener cuidado al reconocer
rotaciones impropias “disfrazadas”. Ası́, S1 es equivalente a una reflexión, y S2 es equivalente a una inversión.
Figura 34: Un eje de una rotación impropia en una molécula tetraédrica (como el metano).
Figura 35: Notación en sistema Schoenflies e Internacional para grupos puntuales. Las entradas en la tabla
están en la forma Schoenflies: Internacional. El Sistema Internacional es también conocido como el sistema
Hermann-Mauguin. El grupo D2 :222 es a menudo denotado por V y llamado el grupo Vierer (grupo de cuatro).
El nombre del grupo puntual se expresa usando el Sistema Schoenflies o bien el Sistema Internacional.
74
Es común usar el primero para moléculas individuales y el último cuando consideramos especies en sólidos. Acá
usaremos el sistema Schoenflies, pero una tabla de traducción entre sistema es dada en la Fig. 35. En el sistema
Schoenflies, el nombre del grupo puntual se basa en alguna propiedad dominante de la simetrı́a de la molécula,
y la etiqueta dada al grupo es en algunos casos la misma etiqueta de la propiedad. Este doble uso de un sı́mbolo
es bastante útil, y raramente lleva a confusión.
1. Los grupos C1 , Cs y Ci : estos grupos consisten de solo la identidad (C1 ), la identidad y una reflexión (Cs ),
y la identidad y una inversión (Ci ) (Fig. 36).
2. Los grupos Cn : consisten de una identidad y una rotación de orden n (Fig. 37).
3. Los grupos Cnv : además de las operaciones de los grupos Cn , estos grupos también contienen n reflexiones
verticales (Fig. 38). Un ejemplo importante es el grupo C∞v , el grupo al que pertenen el cono y la molécula
diatómica heteronuclear.
4. Los grupos Cnh : además de las operaciones de los grupos Cn , estos grupos también contienen una reflexión
horizontal junto con cualquier operación que la presencia de estas últimas implique (Fig. 39).
75
Es importante notar, como observación en la última definición, que la presencia de un conjunto particular
de operaciones puede implicar la presencia de otras operaciones que no son mencionadas explı́citamente en la
definción. Por ejemplo, C2h automáticamente posee una inversión, debido a que rotaciones por 180◦ seguidas
por una reflexión horizontal es equivalente a una inversión. El conjunto completo de operaciones en cada grupo
se puede encontrar en las “tablas de carácter”, algunas de ellas listadas en el Apéndice 1 del libro guı́a del
curso. Estas tablas contienen mucha información adicional y tomarán cada vez más importancia a medida que
el capı́tulo progrese.
5. Los grupos Dn : además de las operaciones de los grupos Cn , estos grupos poseen n rotaciones de orden 2
perpendiculares a los n ejes (principales) de orden n, junto con cualquier operación que estas impliquen
(Fig. 40).
6. Los grupos Dnh : consisten de las operaciones presentes en Dn junto a una reflexión horizontal, además de
cualquiera de las operaciones que estas impliquen (Fig. 41). Un ejemplo importante es D∞h , el grupo al
que pertenece un cilindro uniforme y una molécular diatómica homonuclear.
7. Los grupos Dnd : contienen las operaciones de los grupos Dn y n reflexiones diédricas, junto a todas las
operaciones que se implican (Fig. 42).
8. Los grupos Sn , con n par: contienen la identidad y una rotación impropia de orden n, junto a todas las
operaciones que la presencia de estas operaciones implique (Fig. 43).
Solo los valores pares de n necesitan ser considerados, dado que grupos con n impar son idénticos a los grupos
Cnh , que ya han sido clasificados. Notemos también que el grupo S2 es equivalente al grupo Ci .
76
9. Los grupos cúbicos e icosaedros: contienen más de una rotación de orden n, con n ≥ 3. Los grupos cúbicos
están etiquetados por T (por tetraedro) y O por octaedro; el grupo icosaedro es etiquetado por I. El grupo
Td es el grupo del tetraedro regular; T es el mismo grupo pero sin las reflexiones del tetraedro; Th es un
grupo tetraédrico con una inversión. El grupo del octaedro regular es llamado Oh ; si no tiene reflexiones
es llamado O. El grupo del icosaedro es llamado Ih ; si no tiene inversión se llama I. Algunos objetos que
pertenecen a estos grupos puntuales están ilustrados en las Figs. 44, 45 y 46, respectivamente.
Figura 44: Objetos que pertenecen a los grupos (a) Td , (b) T y (c) Th .
10. El grupo de rotación completa R3 : consiste en todas las rotaciones en cualquier ángulo y en cualquier
orientación. Es el grupo de simetrı́a de la esfera.
Los átomos pertenecen a R3 , pero las moléculas no. Las propiedades de R3 resultan ser las propiedades del
momentum angular. Esta es la relación profunda entre este capı́tulo y el anterior, que exploraremos más adelante.
77
Existen dos formas simples de determinar a qué grupo puntual pertenece una molécula. Una manera es usar el
árbol de decisión ilustrado en Fig. 47. La otra es reconocer el grupo al comparar la molécula con los objetos en
Fig. 48.
Figura 47: Diagrama de flujo para decidir el nombre del grupo puntual al que un objeto pertenece.
78
Figura 48: Formas representativas para una variedad de grupos puntuales.
Cómo asignar un grupo puntual a una molécula: ¿cuál es el grupo puntual de la molécula de
benceno, C6 H6 ?
Método: Use el diagrama de flujo dado en Fig. 47, reconociendo que el benceno tiene un único eje principal C6
que es perpendicular al plano de la molécula.
Respuesta: El benceno, una molécula no-lineal, no contiene dos (o más) ejes principales: C6 es un eje prin-
cipal único y existen seis ejes C2 en el plano molecular y perpendiculares a C6 ; tres ejes intersectan átomos de
carbono en vértices opuestos y tres ejes bisecan enlaces carbono-carbono sobre aristas opuestas (Fig. 49). El
plano molecular es σh . De Fig. 47, el grupo puntual es D6h .
79
10.3. El cálculo de simetrı́a
El poder de la teorı́a de grupos viene de su estructura matemática. La siguiente sección estará dividida en dos
partes. La primera considera las operaciones de simetrı́a mismas y muestra como estas pueden ser combinadas.
La segunda etapa muestra como asociar matrices con cada operación de simetrı́a y a obtener las propiedades
de las matrices para establecer varios resultados importantes.
Las operaciones de simetrı́a pueden ser realizadas de forma consecutiva. Usaremos la convención de que la
operación R seguida de la operación S se denota como SR. El orden de las operaciones es importante dado que
en general el resultado de la operación SR no es el mismo que el resultado de la operación RS. Cuando los
resultados de RS y SR son equivalentes, se dice que las operaciones conmutan. Una propiedad general de las
operaciones de simetrı́a es que el resultado de una operación de simetrı́a compuesta es siempre equivalente a
una alguna operación de simetrı́a. Ya hemos visto esta propiedad cuando notamos que una rotación de orden 2
seguida por una reflexión en un plano perpendicular al eje de orden 2 es equivalente a una inversión:
σh C 2 = i . (206)
RS = T , (207)
Consideremos un objeto cuadrado y las operaciones de simetrı́a C2 (coincidente con el eje principal (C4 )), i y
σh . Luego, C2 (iσh ) = C2 C2 = E y (C2 i)σh = σh σh = E y la propiedad de asociatividad se cumple.
Estas observaciones, junto con otras dos que pueden ser comprobadas por inspección, son resumidas como sigue:
La tercera observación implica que R2 (que es una forma corta de escribir RR) es una operación de simetrı́a.
En observación 4, la inversa de una operación R, generalmente denotada por R−1 , se define tal que
80
Definición de un grupo.
El punto notable es que en matemáticas un conjunto de entidades (junto a una determinada operación interna)
llamadas elementos forman un grupo si (bajo la operación interna) estas satisfacen las siguientes condiciones:
Esto es, el conjunto de operaciones de simetrı́a (junto a la determinada operación interna) es un objeto que
satisface las condiciones que aseguran que este forma un grupo desde el punto de vista matemático. Como
consecuencia, la teorı́a matemática de los grupos, llamada teorı́a de grupos, puede ser aplicada al estudiar la
simetrı́a de las moléculas.
Una tabla que muestra el resultado de las operaciones compuestas RS para todas las operaciones de simetrı́a
en un grupo es llamada una tabla de multiplicación de grupo. El procedimiento usado para construir estas
tablas será ilustrado usando el grupo C3v . Las operaciones de simetrı́a para este grupo están ilustradas en la
Fig. 51. Vemos que hay seis elementos en este grupo, ası́ que decimos que el grupo tiene orden 6, lo que se
puede escribir como h = 6.
+
Figura 51: Los elementos de simetrı́a del grupo C3v . Figura 52: El efecto de la operación C3 seguida por σv
es equivalente a la operación σv 00 .
Para determinar el resultado de una secuencia de operaciones de simetrı́a, consideramos diagramas como los
de la Fig. 52. Debemos notar que la secuencia de cambios son respecto a posiciones fijas de los elementos de
simetrı́a, en el sentido que si se realiza una operación C3+ , la lı́nea representando el plano σv en la Fig. 51
permanece en la misma posición en la página y no es rotada en 120◦ por la operación σv . Luego, se sigue que
81
El conjunto completo de 36 (en general, h2 ) productos se muestra en la Tabla V. Como podemos ver, cada
producto es equivalente a un único elemento del grupo. Notemos que RS no es siempre el mismo que SR; esto
es, no todas las operaciones de simetrı́a conmutan. Tablas similares pueden ser construidas para todos los grupos
puntuales.
Construya la tabla de multiplicación para el grupo C2v , los elementos son mostrados en Fig. 53.
Método: Consideremos un único punto sobre el objeto de un determinado grupo puntual, y el efecto sobre tal
punto de cada par de operaciones de simetrı́a (RS). Identifique la única operación que reproduce el efecto de
las operaciones conjuntas (RS = T ), y regı́strela en la tabla. Note que ER = RE = R, para todo R, donde E
es la operación identidad. La orientación de los elementos de simetrı́a sobre la página permanece sin cambios
bajo todas las operaciones.
Resultado: La tabla de multiplicación del grupo es
Tabla VI : C2v
Primer: E C2 σ v σv0
Segundo:
E E C 2 σv σv0
C2 C2 E σv0 σv
0
σv σv σv E C2
σv0 σv0 σv C 2 E
Observación: Notemos que en este grupo RS = SR para todas las entradas en la tabla. Grupos de este tipo,
82
en los que los elementos conmutan, son llamados grupos Abelianos. El grupo C3v es un ejemplo de un grupo
no-Abeliano.
Tarea: Construya la tabla multiplicativa para el grupo D3 , con los elementos dados en Fig. 54.
Relaciones como RS = T son representaciones simbólicas del efecto de la acción generada sobre los objetos.
Podemos enriquecer esta representación simbólica de las operaciones de simetrı́a mediante el uso de entidades
que pueden ser manipuladas algebráicamente. Sin embargo, debido a que las operaciones de simetrı́a son en
general no-conmutativas (esto es, su resultado depende del orden en el que se aplican), debemos considerar la
necesidad de usar matrices en vez de simples números, ya que en general la multiplicación matricial es también
no-conmutativa. El representante matricial de una operación de simetrı́a es una matriz que reproduce el
efecto de la operación de simetrı́a (de una manera que describiremos más adelante). Una representación
matricial es un conjunto de representantes, uno por cada elemento del grupo, que se multiplican entre ellos
siguiendo las reglas establecidas por la tabla de multiplicación del grupo.
Figura 55: Una base para la discusión de la representación del grupo C3v ; cada esfera puede ser pensada como
un orbital s centrado en un átomo.
Para establecer un representante matricial para una operación particular de un grupo, necesitamos escoger
una base, un conjunto de funciones sobre las que las operaciones actúan. Para ilustrar este procedimiento,
consideremos un conjunto de orbitales s; sN , sA , sB y sC en una molécula de NH3 (Fig. 55), que pertenece al
grupo C3v . Escogemos esta base en parte debido a que es lo suficientemente simple para ilustrar un número
83
de propiedades de una manera directa pero también debido a que será usada en la discusión de la estructura
electrónica de una molécula de amonı́aco cuando construyamos orbitales moleculares. La dimensión de esta base
(el número de miembros) es 4. Podemos escribir la base como un vector de cuatro componentes (sN , sA , sB , sC ).
En general, una base de dimensión d puede ser escrita como un vector fila f , donde
f = (f1 , f2 , · · · , fd ) . (210)
Esta representación del efecto de la operación de simetrı́a puede ser verificado realizando la multiplicación
matricial. La matriz en esta expresión es la representante de la operación σv para la base elegida, y es denotada
por D(σv ). Notemos que una base cuadridimensional da pie a una representante 4 × 4-dimensional, y que en
general una base d-dimensional generará una representante d×d-dimensional. En términos de las reglas explı́citas
de la multiplicación matricial, el efecto de una operación R sobre la base general f es convertir la componente
fi en
X
Rfi = fj Dij (R) , (212)
j
donde Dij (R) es un elemento matricial de la representante D(R) de la operación R. Por ejemplo,
σv sB = sN × 0 + sA × 0 + sB × 0 + sC × 1 = sC , (213)
como es requerido.
Las representantes de las otras operaciones del grupo pueden ser encontradas de la misma forma. Notemos que
debido a que Ef = f , la representante de la operación identidad es siempre la matriz unitaria.
El set completo de representantes para esta base está dado en la tabla de la Fig. (56). Ahora nos toca discutir
sobre un tema de central importancia. Consideremos el efecto de las operaciones consecutivas C3+ seguida por
σv . De la tabla multiplicatica del grupo sabemos que el efecto de la operación conjunta σv C3+ es el mismo que
el efecto de la reflexión σv00 . Esto es,
σv C3+ = σv00 . (214)
Esto es, las representantes matriciales se multiplican en exactamente la misma forma que las operaciones del
grupo. Esto es cierto para cualquier operación que sea considerada, y ası́, el conjunto de seis matrices 4 × 4 en
84
la Tabla de la Fig. (56) forman una representación matricial del grupo para la base elegida en el sentido que,
Del hecho que las representantes se multiplican como los elementos del grupo se desprende que las representantes
de una operación R y su inversa R−1 están relacionadas por
donde (D(R))−1 denota la matriz inversa de D(R). Como caso particular, dado que RR−1 = E, se sigue que
Para desarrollar el tema de representaciones matriciales, necesitamos introducir algunas de sus propiedades. En
cada caso introduciremos el concepto usando la base del orbital s para C3v para fijar ideas, y luego generaliza-
remos el concepto usando una base arbitraria de un grupo arbitrario.
Comenzamos con el concepto de transformación de similitud. Supongamos que en vez de la base del orbital
s, elegimos una combinación lineal de estos orbitales como base. Un posible conjunto podrı́a ser (sN , s1 , s2 , s3 ),
donde s1 = sA +sB +sC , s2 = 2sA −sB −sC , y s3 = sB −sC (además del requerimiento de que las combinaciones
sean linealmente independientes, la elección es arbitraria, pero veremos más adelante que este conjunto tiene un
significado especial). Estas combinaciones son ilustradas en la Fig. 57. Debemos esperar que la representación
matricial en esta base sea similar a la de la base original. Esta similaridad es dada por una definición formal:
decimos que estas representaciones son similares si las representantes para las dos bases están relacionadas
85
mediante una transformación de similaridad,
donde c es la matriz formada por los coeficientes relacionando las dos bases. La relación inversa se obtienen al
multiplicar por la izquierda por c−1 y por la derecha por c:
Figura 57: Las combinaciones lineales adaptadas a la simetrı́a de los orbitales átomicos periféricos en una
molécula C3v .
La representante de la operación C3+ en C3v para la base s orbital es dada en la tabla en la Fig. 56. Derive una
expresión para la representante en la base transformada dada al comienzo de esta subsección.
Método: Para implementar la receta de la Ec. (219) necesitas construir las matrices c y c−1 . Luego, comenzamos
expresando la relación entre las dos bases en forma matricial (como f 0 = f c), y encontrando el recı́proco de c
según los métodos del álgebra matricial. Finalmente, evaluamos el producto matricial c−1 D(R) c.
sN = sN , s1 = sA + sB + sC , s2 = 2sA − sB − sC , s3 = sB − sC , (221)
86
puede ser escrita como la siguiente matriz:
1 0 0 0
0 1 2 0
(sN , s1 , s2 , s3 ) = (sN , sA , sB , sC ) , (222)
0
1 −1 1
0 1 −1 −1
La misma técnica que se ilustró en el ejemplo puede ser aplicado a otras representante, y los resultados se
muestran en la tabla de la Fig. 58.
87
10.3.5. El carácter de las representaciones
Existe una caracteristica clave en las dos represetanciones en las tablas de las Figs. 56 y 58. Aún cuando las
matrices difieren para ambas bases, para una determinada operación la suma de los elementos de la diagonal
de los representantes es la misma en ambas bases. La suma diagonal de los elementos matriciales es llamada el
carácter de una matriz, y es denotada por χ(R);
X
χ(R) = Dii (R) . (224)
i
En álgebra matricial, la suma de los elementos de la diagonal es llamada la traza de la matriz, y se denota por
tr. Luego, una definción sucinta del carácter de la operación R serı́a
Ahora, el carácter de una operación es invariante bajo una transformación de similaridad de la base. La prueba
de esta propiedad se base en el hecho de que la traza de un producto de matrices es invariante bajo la permutación
cı́clica de las matrices:
tr{ABC} = tr{CAB} = tr{BCA} . (226)
Tarea: Probar la propiedad de invariancia de la traza de una matriz y del carácter de un representante.
Una propiedad mostrada en las tablas de las Figs. 56 y 58 es que los caracteres de las dos rotaciones son los
mismos, tal como son los caracteres de las tres reflexiones. Estas igualdades sugiere que las operaciones caen en
diferentes clases que pueden ser distinguidas por sus caracteres.
La definición formal de la clase de una operación de simetrı́a es que dos operaciones R y R0 pertenecen a la
misma clase si existe alguna operación de simetrı́a S del grupo tal que
R0 = S −1 R S . (227)
Los elementos R y R−1 se dicen conjugados. Los miembros conjugados pertenecen a la misma clase. La
interpretación fı́sica de la conjugación y de la pertenencia a clases es que R y R0 son el mismo tipo de operación
(tal como una rotación) pero actúan con respecto a elementos de simetrı́a que están relacionados por una
operación de simetrı́a.
Muestre que las operaciones de simetrı́a C3+ y C3− son conjugadas en el grupo C3v .
Método: Necesitamos mostrar que existe una transformación de simetrı́a del grupo que transforma C3+ en C3− ,
según Ec. (227). Intuitivamente, sabemos que la reflexión de una rotación en un plano vertical invierte el sentido
de rotación, por lo que podemos sospechar que una reflexión es la operación que necesitamos. Para encontrar
el efecto de una sucesión de operaciones, usamos la información en la tabla de multiplicación de grupo (Tabla
V); para encontrar el recı́proco de una operación tenemos que buscar al elemento que produce una identidad E
88
en la tabla de multiplicación de grupo.
Resultado: Consideramos que S = σv y luego la operación conjunta σv−1 C3+ σv . De acuerdo a la Tabla V, la
inversa de σv es la misma σv . Por lo tanto, de la tabla de multiplicación de grupo, podemos escribir
Con el concepto de conjugación establecido, ahora es directo demostrar que las operaciones de simetrı́a perte-
necientes a la misma clase tienen el mismo carácter en una determinada representación.
Una observación para tener cuidado: aunque es cierto que en una determinada representación todos los miembros
de la misma clase tienen el mismo carácter, los caracteres de diferentes clases pueden ser los mismos entre ellos.
89