Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ciencia y Tecnologı́a
Editorial Universidad de Antioquia
Colección Ciencia y Tecnologı́a
c Jorge Mahecha Gómez
c Editorial Universidad de Antioquia
ISBN: 958-655-847-9
4. La formulación hamiltoniana 85
4.1. Las variables hamiltonianas de estado . . . . . . . . . . . . . . . . . . . . 85
4.2. Simetrı́as y el teorema de conservación . . . . . . . . . . . . . . . . . . . . 94
4.3. La segunda forma del principio de Hamilton . . . . . . . . . . . . . . . . 97
4.4. Las transformaciones puntuales. Las transformaciones en el espacio de fases101
4.5. Las transformaciones canónicas
o de contacto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
v
vi
1
2 / Mecánica clásica avanzada
etc.). Una visión histórica nos muestra que los virajes en el desarrollo de la fı́sica se
han producido a partir de las investigaciones en problemas especı́ficos que se salen del
rango de validez de las teorı́as existentes. O sea que las modernas teorı́as fı́sicas no han
invalidado la mecánica clásica sino que simplemente han restringido su rango de validez.
Por último, en la mecánica clásica está el germen de las teorı́as más completas como
la mecánica cuántica o la relatividad general. Tales teorı́as utilizan los conceptos de la
mecánica clásica y los introducen en sus formalismos cambiándoles el contenido. Las no-
ciones de energı́a, momentum, velocidad, posición, etc., tienen su origen en la mecánica
clásica, pero mantienen una importancia relevante dentro de las nuevas teorı́as. Podemos
concluir que un conocimiento riguroso de la mecánica clásica es indispensable para el
estudio cabal de la mecánica cuántica y demás teorı́as contemporáneas.
y el sistema de coordenadas que es necesario elegir (hay analogı́a con las nociones de
distancia, intervalo de tiempo, etc., que implican aspectos cuantitativos). Clásicamen-
te para la especificación o descripción completa del estado de un sistema mecánico se
requiere, por ejemplo, conocer la posición y velocidad de cada una de las partı́culas en
un tiempo dado. Es imposible obtener la descripción del estado sin tener un sistema
de referencia y un sistema de coordenadas. En cualquier rama de la fı́sica, y en general
cualquier ciencia cuantitativa, se requiere de la noción de estado. El tipo de descripción
depende del sistema que se trate: el estado de un sistema de partı́culas en mecánica
clásica se describe mediante posiciones y velocidades; en mecánica cuántica se descri-
be mediante la función de onda del sistema. El estado termodinámico de un sistema
macroscópico se describe mediante un conjunto de variables termodinámicas como P ,
V , T , etc. En economı́a, el estado finanaciero de una empresa, por ejemplo, se describe
mediante una serie de parámetros que evolucionan con el tiempo; qué parámetros son
relevantes, depende del modelo, ası́ como de la ecuación de evolución.
El sistema de referencia se denomina a veces espacio fı́sico de representación. El
sistema de coordenadas permite representar cada estado del sistema por un punto. La
representación de los estados ya forma parte de la teorı́a fı́sica, pero siempre existe el
supuesto de que hay una correspondencia que permite asociar a cada estado de movi-
miento del sistema un punto del espacio de representación, o, para ser más exactos, una
trayectoria en dicho espacio. A un sistema de N partı́culas se le asocian 3N coordenadas
y 3N velocidades. Los estados del sistema se pueden representar por puntos del espacio
de representación, llamado espacio de configuración, y sus vectores tangente y veloci-
dades. También los estados se pueden representar por puntos del espacio de fases 6N
dimensional. Una descripción puede ser por medio de las 6N cantidades:
{ x1 (t), y1 (t), z1 (t); x2 (t), y2 (t), z2 (t); ...xN (t), yN (t), zN (t);
(1.1)
ẋ1 (t), ẏ1 (t), ż1 (t); ẋ2 (t), ẏ2 (t), ż2 (t); ...ẋN (t), ẏN (t), żN (t) }
Ligaduras. Si con sólo cambiar las fuerzas y las condiciones iniciales las partı́cu-
las del sistema pueden ocupar cualquier posición en el espacio o cualquier velocidad,
Fundamentos de mecánica newtoniana / 5
Se supone que las partı́culas del sistema sólo interactúan entre pares; la prima
en la sumatoria indica que excluye j = i. En el caso más general F~ei y F~ij dependen
de las coordenadas y de las velocidades de todo el sistema. Usualmente se cumple lo
siguiente: (a) Las fuerzas entre las partı́culas i y j dependen sólo de las coordenadas y
de las velocidades de éstas; (b) La fuerza externa sobre la partı́cula i sólo depende de
sus coordenadas y velocidades:
F~i ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t =
N
X
F~ei (~ri , ~r˙ i ; t) + ′~
Fij (~ri , ~rj , ~r˙ i , ~r˙ j ) (1.3)
j=1
Variables dinámicas. Cualquier función del estado del sistema y del tiempo se
denomina una variable dinámica. Las coordenadas o las velocidades mismas son varia-
bles dinámicas. También lo son el momento angular, la energı́a, el momento lineal, las
coordenadas del centro de masa, etc. Un conjunto de 6N funciones (independientes entre
sı́) de las coordenadas y las velocidades constituye un conjunto completo de variables
dinámicas y sirve para especificar completamente el estado del sistema. Una clase espe-
cial de variables dinámicas es constituida por las constantes de movimiento. Un conjunto
máximo de constantes de movimiento, 6N , permite describir completamente el estado
del sistema. En mecánica cuántica pueden haber a lo sumo 3N constantes de movimiento
independientes, exactamente definidas; entonces las otras 3N constantes serán comple-
tamente indefinidas. La mecánica newtoniana en su forma original es adecuada para el
estudio de sistemas libres. Para sistemas con ligaduras es más conveniente el formalis-
mo lagrangiano. Desde el punto de vista teórico es deseable un formalismo en el cual
las ecuaciones del movimiento sean covariantes y en el cual la mecánica se deduzca de
principios más generales (variacionales); en este sentido también es más útil la mecánica
lagrangiana.
El sistema posee seis coordenadas, pero la ligadura permite expresar una de ellas
en términos de las otras, quedando sólo 6 − 1 = 5 coordenadas independientes. Por tales
coordenadas pueden tomarse las tres del centro de masa y dos ángulos que especifican
la orientación respecto al centro de masa.
Para N = 3 hay nueve coordenadas y tres condiciones de ligadura que pueden
expresarse en forma vectorial como:
|r~1 − r~2 | = a
|r~3 − r~1 | = c
Hay sólo 9 − 3 = 6 coordenadas independientes que pueden tomarse ası́: tres para
especificar la posición del centro de masa del sistema total y tres ángulos que especifican
la orientación del plano de las partı́culas con el centro de masa fijo.
Para un sólido rı́gido en general se requieren 3N coordenadas pero habrá cierto número
de condiciones de ligadura independientes. El número total de coordenadas indepen-
dientes requeridas para especificar la posición de un sólido rı́gido son seis, que pueden
7
8 / Mecánica clásica avanzada
tomarse ası́: las tres coordenadas del centro de masa y tres ángulos que especifican la
orientación del cuerpo con el centro de masa fijo.
Se dice que un sólido rı́gido de N partı́culas tiene seis grados de libertad y 3N − 6
condiciones de ligadura. Otros tipos de ligaduras son las siguientes:
(a) Hay alguna condición que obliga a las partı́culas a moverse sobre una superficie o
en una lı́nea. En una superficie cada partı́cula posee sólo dos coordenadas independientes,
o sea que el sistema tendrá N condiciones de ligadura y 2N grados de libertad. Para un
sistema de partı́culas sobre un plano las condiciones de ligadura son las siguientes, si se
toma en el plano x − y:
zi = 0 ; i = 1, 2, ... N (2.3)
Para una esfera de radio a y tomando el centro de la esfera como origen de coor-
denadas las ligaduras son:
(b) Si hay cuerpos rı́gidos en contacto que ruedan sin deslizarse sobre un plano.
Sea un cilindro de radio a que rueda sin deslizar sobre el plano z = 0. El cilindro requiere
de seis coordenadas para especificar su posición, pero hay dos condiciones de ligadura.
zCM = a
(2.5)
ẋ2CM + ẏCM
2
= a2 φ̇2
yCM = aφ (2.6)
La ecuación (2.5) puede también integrarse directamente para obtener una relación
entre el ángulo de giro del cilindro y el desplazamiento del centro de masa. En (2.6) se
ha escogido a φ de modo que yCM = 0 cuando φ = 0.
Las ligaduras de “rodar” relacionan las velocidades entre sı́ y con las coordenadas,
y en general son no holónomas, o sea no integrables. Son los casos de un disco o una
esfera rodando sobre un plano.
Para un disco rodando sobre un plano se requieren dos coordenadas para especificar
la posición del centro de masa, una para especificar el giro alrededor del eje y dos para
especificar la posición del plano del disco. Hay dos ligaduras de “rodar” que relacionan
las componentes de la velocidad del centro de masa con la velocidad angular de rotación
al rededor del eje (véase la figura 2.1).
Una de las coordenadas necesarias para especificar el plano del disco puede tomarse
como el ángulo que hace el eje del disco con la dirección x. La otra coordenada la
especificamos exigiendo que el plano del disco sea siempre perpendicular al plano x − y.
Una condición de ligadura es zCM = a. Las otras dos coordenadas del centro de masa
Ecuaciones generales de la estática y la dinámica / 9
a
ϕ
α x
son las mismas del punto de contacto del disco con el plano. Las condiciones de ligadura
de rodar son: que la magnitud de la velocidad del centro de masa sea proporcional a φ̇,
v = aφ̇ (2.7)
y que la dirección de la velocidad del centro de masa siempre esté en el plano de rotación
del disco,
ẋ = v senα ẏ = −v cos α (2.8)
De estas tres condiciones de ligadura sólo hay dos independientes:
dx − a senα dφ =0
(2.9)
dy + a cos α dφ =0
Las ecuaciones (2.9) no se pueden integrar para obtener relaciones que involucren
sólo cantidades finitas. Para poder hacer esto serı́a necesario hallar ciertas funciones
f (x, α; φ) y g(y, α; φ) tales que al multiplicar por ellas las ecuaciones (2.9) se obtengan
diferenciales exactos. Lo anterior no es posible, o sea que las relaciones (2.9) no pueden
usarse para expresar una coordenada en términos de las demás; esto implica que las
condiciones de ligadura deben considerarse simultáneamente con la solución del problema
mecánico, que contendrá sólo tres coordenadas independientes.
Los anteriores ejemplos nos muestran que un sistema de N partı́culas y k condicio-
nes de ligadura tendrá 3N − k grados de libertad. Un cuerpo rı́gido tendrá 6 − k grados
10 / Mecánica clásica avanzada
donde R ~ denota la posición del centro de masa, φ, θ, ψ son tres ángulos que especifican
la orientación del cuerpo con el centro de masa fijo y h es el número de condiciones de
ligadura holónomas. Un sistema se dice que es holónomo si no tiene ligaduras diferen-
ciales no integrables.
~˙ + mα θ̇ + nα φ̇ + σα ψ̇ + Pα = 0 ;
~lα · R α = 1, 2, ... n (2.14)
Ligaduras reonómicas. Del griego reo (flujo). Son las ligaduras, holonómicas o
no holonómicas, que dependen del tiempo. Serı́a el caso de dos partı́culas unidas entre
sı́ por una varilla cuya longitud varı́a con el tiempo de manera conocida:
|~r1 − ~r2 | = l(t) (2.16)
Ligaduras escleronómicas. Del griego esclero (duro). Son las ligaduras rı́gidas
o que no cambian con el tiempo. Es el caso de dos partı́culas unidas entre sı́ por una
Ecuaciones generales de la estática y la dinámica / 11
varilla rı́gida. La noción de ligadura involucra dos aspectos. Por una parte, indica que el
número de variables independientes necesarias para especificar el estado del sistema es
menor. En segundo lugar aparecen las llamadas fuerzas de ligadura, que no se pueden
conocer a priori porque dependen del problema especı́fico, es decir de las fuerzas aplica-
das y de las condiciones iniciales. Vemos que las ligaduras introducen nuevas incógnitas
en el problema.
F~1′ = −k ′ (r − l)û
(2.18)
F~2′ = k ′ (r − l)û
donde E es la energı́a del movimiento, que consideraremos tiene un valor finito dado.
Cuando k ′ → ∞, la frecuencia de las oscilaciones aumenta, en tanto que r − l tiende
a cero, obteniéndose la relación cinemática r = l. Por otra parte, como la energı́a E
depende de otras condiciones –fuerzas externas y condiciones de ligadura–, es realmente
indeterminada a priori. Sólo un modelo microscópico nos permitirı́a estimar el valor de
12 / Mecánica clásica avanzada
l = 3N − h − n (2.20)
el sistema tiene una coordenada superflua que se puede eliminar introduciendo unas
coordenadas en la superficie de la esfera. Si tomamos como coordenadas generalizadas
los ángulos θ y φ definidos por:
x(θ, φ, t) = a(t) senθ cos φ
z2 = 0
(2.25)
x22 + y22 − l22 = 0
θ2 l2
m2
θ1 l1
m1
Velocidades posibles. Son las velocidades que para una configuración dada (~r1 ,
~r2 , ... ~rN ) del sistema en el tiempo t son compatibles con las k condiciones de ligadura.
Sólo hay entre las velocidades posibles un conjunto de velocidades (~r˙ 1 , ~r˙ 2 , ... ~r˙ N ) que
efectivamente toma el sistema. Las velocidades reales se hallan solamente al resolver el
problema mecánico completo.
Desplazamientos posibles. Son los ~r˙ i = ~r˙ i dt, i = 1, 2, ... N , cuando las ~r˙ i son
las velocidades posibles. Cuando las ~r˙ i son las velocidades reales para una configuración
dada, d~ri = ~r˙ i dt son los desplazamientos reales.
Tanto los desplazamientos reales como los posibles deben ser compatibles con las
h condiciones de ligadura holónomas; es decir, estas deben satisfacerse tanto en la con-
figuración (~r1 , ~r2 , ... ~rN ) como en la configuración (~r1 + d~r1 , ~r2 + d~r2 , ... ~rN + d~rN ),
siendo los d~ri desplazamientos posibles.
Se sigue entonces que los desplazamientos posibles deben satisfacer simultánea-
mente las k = h + n condiciones,
N
X
~lα · d~ri + Dα dt = 0 α = 1, 2, ... n (2.28)
i
i=1
N
X ∂fα ∂fα
· d~ri + dt = 0 α = 1, 2, ... h (2.29)
i=1
∂~ri ∂t
que se siguen de (2.11) y (2.15). ∂/∂~ri denota el gradiente respecto a las coordenadas
de la partı́cula i.
N
X ∂fα ∂fα
· d′~ri + dt = 0 ; α = 1, 2, ... h (2.31)
i=1
∂~ri ∂t
En las ecuaciones (2.30) y (2.31), ~lαi y Dα están evaluadas en ~r1 , ~r2 , ... ~rN , t y
análogamente ∂fα /∂~ri y ∂fα /∂t.
Definimos los desplazamientos virtuales δ~ri como:
δ~ri = d′~ri − d~ri (2.32)
y las condiciones de su compatibilidad con las ligaduras son:
N
X
~lα · δ~ri = 0 ; α = 1, 2, ... n (2.33)
i
i=1
N
X ∂fα
· δ~ri = 0 ; α = 1, 2, ... h (2.34)
i=1
∂~ri
Ejemplo 2.3.1 Sea una partı́cula sometida a una fuerza externa F~ (x, y, t) y constreñida
a moverse solamente sobre una superficie descrita por la ecuación
Φ(x, y, z) = 0 (2.35)
d ∂Φ ¨ ∂Φ
~r˙ · + ~r · =0 (2.38)
dt ∂~r ∂~r
d ∂Φ F~ ∂Φ
~r˙ · + · =0 (2.39)
dt ∂~r m ∂~r
Como F~ puede darse arbitrariamente, vemos que sólo por accidente se cumplirı́a
(2.39).
Por tanto concluimos que la superficie debe reaccionar sobre la partı́cula con una
fuerza suplementaria R ~ que dependerá de las condiciones iniciales, de la fuerza aplicada
~ se llama fuerza de reacción de la ligadura y ha de
y de la ecuación de la superficie. R
ser tal que:
m~¨r = F~ + R
~ (2.40)
mẍ = Fx + Rx
mÿ = Fy + Ry
(2.41)
mz̈ = Fz + Rz
Φ(x, y, z) = 0
Faltan pues, dos ecuaciones adicionales. Para obtenerlas basta imponer la condición
de que la ligadura sea ideal. Esto quiere decir que R~ no realiza trabajo al efectuarse un
desplazamiento virtual. Es claro que si la superficie no tiene rozamiento (idealmente
~ será siempre normal a la superficie y como δ~r debe estar sobre la superficie se
suave), R
sigue que R~ y ~r son perpendiculares,
~ · δ~r = 0
R (2.42)
o también,
Rx δx + Ry δy + Rz δz = 0 (2.43)
~ ha de satisfacer
Como δx, δy son diferentes de cero y arbitrarios, se sigue que R
además las ecuaciones:
∂Φ/∂x
Rx = Rz
∂Φ/∂z
(2.45)
∂Φ/∂y
Ry = Rz
∂Φ/∂z
completándose ası́ las seis ecuaciones requeridas.
Las ligaduras ideales. Se dice que las condiciones de ligadura sobre un sistema
mecánico son ideales si se cumple que el trabajo realizado por las fuerzas de reacción de
las ligaduras al efectuar desplazamientos virtuales de todas las partı́culas es cero:
N
X
~ i · δ~ri = 0
R (2.46)
i=1
Las fuerzas de fricción dependen del tipo de ligadura, sin embargo para este tipo de
fuerzas deben emplearse métodos que no impliquen la noción de “ligadura ideal”.
Ejemplo 2.3.2 Sean dos partı́culas de masas m1 y m2 que interactúan entre sı́ a través
de una varilla rı́gida sin masa. Están sometidas a una fuerza externa y en un estado de
movimiento arbitrario. Se trata de mostrar que la ligadura es ideal.
~1 y G
G ~ 2 podrı́an producir aceleración del centro de masa de la varilla y aceleración
angular, pero como la masa de la varilla es cero, lo mismo que el momento de inercia,
se sigue que G~1 + G~ 2 = 0, lo mismo que el torque. Por lo tanto también se cumple que
~ ~
R1 = −R2 y como no hay torques, estos vectores estarán a lo largo de la varilla. El
trabajo virtual de las fuerzas de ligadura será:
~ 1 · δ~r1 + R
R ~ 2 · δ~r2 = R
~ 2 · (δ~r2 − δ~r1 ) (2.47)
Si llamamos ~r = ~r2 − ~r1 , δ~r = δ~r2 − δ~r1 , entonces un desplazamiento virtual δ~r
puede descomponerse en uno perpendicular a la varilla y en uno paralelo a la misma,
~ 1 · δ~r1 + R
R ~ 2 · δ~r2 = R
~ 2 · δ~r = R
~ 2 · δ~r⊥ (2.49)
pero R~ 2 está a lo largo de la varilla, luego R ~ 1 · δ~r2 = 0 concluyéndose por tanto que la
ligadura es ideal. R ~ 1 · δ~r1 y R
~ 2 · δ~r2 no son cero por separado, pero sı́ su suma.
Si suponemos que las ligaduras son ideales, ası́ las R ~ i no sean nulas, será nulo el
(a)
trabajo virtual realizado por ellas, ecuación (2.46). Aun en el equilibrio las F~i no serán
nulas, pero de (2.46) y (2.51) se sigue que el trabajo virtual de las fuerzas aplicadas debe
ser cero:
N
X (a)
F~i · δ~ri = 0 (2.52)
i=1
Como (2.55) debe cumplirse en las configuraciones ~r1 , ~r2 , ... ~rN y ~r1 + δ~r1 , ~r2 +
δ~r2 , ... ~rN + δ~rN , es cierto que:
N
X ∂fα
· δ~ri = 0 ; α = 1, 2, ... k (2.57)
i=1
∂~ri
3N
X ∂fα
fα (u1 , u2 , ... u3N ) = 0 ; δus = 0 ; α = 1, 2, ... k (2.59)
s=1
∂us
Ecuaciones generales de la estática y la dinámica / 21
Ahora, con (2.62), quedará (2.61) convertida en una combinación lineal igualada a
cero de las cantidades linealmente independientes δuk+1 , δuk+2 , ... δu3N . Lo anterior es
posible sólo si se anulan los coefientes, lo cual, junto con (2.62) conduce a:
k
X ∂fα
Fs(a) + λα = 0; s = 1, 2, ... 3N (2.63)
α=1
∂us
Ejemplo 2.4.1 Sean dos partı́culas de masas m1 y m2 , unidas por una varilla rı́gida sin
masa y colocadas dentro de un cascarón esférico, en presencia de la gravedad (véase
figura la 2.3). Hallar la posición de equilibrio y las fuerzas de reacción de las ligaduras.
a
m
1
0
l
m
2
Figura 2.3 Masas m1 y m2 unidas por una varilla rı́gida sin masa y colocadas dentro de un
cascarón esférico
Las ecuaciones (2.69) indican que sólo tres desplazamientos virtuales pueden dar-
se independientemente. Escogeremos independientes a δy1 , δy2 , δz2 y dependientes a
δx1 , δx2 , δz1 . Las seis ecuaciones correspondientes a las dadas por la expresión (2.63)
se obtienen usando la matriz de tres filas y seis columnas ∂fα /∂us donde α = 1, 2, 3 y
Ecuaciones generales de la estática y la dinámica / 23
0 + λ1 (x2 − x1 ) + 0 + λ3 x2 = 0 (2.72)
0 + λ1 (y1 − y2 ) + λ2 y1 + 0 = 0 (2.74)
0 + λ1 (y2 − y1 ) + 0 + λ3 y2 = 0 (2.75)
O sea que los vectores de posición de las partı́culas son paralelos, independiente-
mente de las masas y la longitud de la varilla. Esta solución podrı́a ser aceptable en los
casos lı́mites en que l = 0 o l = 2a. La solución (2.80) da:1
y1 m2 x1 m2
=− ; =− (2.82)
y2 m1 x2 m1
Las relaciones (2.82) implican que el centro de masa se encuentra siempre sobre el
eje z. Las ecuaciones de ligadura se pueden escribir como:
1 En (2.77) resulta entonces que las λ son infinitas, o sea que las fuerzas de ligadura son infinitas.
Ecuaciones generales de la estática y la dinámica / 25
m
1
ϕ2
ϕ1
m x
2
l2
l 2 a2 −
4
x22 + y22 = 2
m2 m2 2
a2 1 + − l (2.92)
m1 m1
2
m2
x21 + y12 = (x22 + y22 )
m1
De (2.86) y (2.68) obtenemos la siguiente expresión que nos permite analizar los
signos de z1 y z2 :
2
l2 m2 m1 l4
a2 a2 − 1+ +
2 m1 m2 4
z1 z2 = 2 (2.93)
m2 m1
a2 1 + − l2
m1 m2
26 / Mecánica clásica avanzada
Las ecuaciones (2.98), (2.99) y (2.100) serán la expresión correcta para zCM de-
pendiendo del signo de z1 z2 en la ecuación (2.93). Estas ecuaciones pueden también
escribirse como:
m1 − m2 a2
zCM = r (2.101)
m1 + m2 1 m1 m2 2
a2 − l
m1 + m2 m1 + m2
m2 − m1 a2
zCM = r (2.102)
m1 + m2 1 m1 m2 2
a2 − l
m1 + m2 m1 + m2
r
1 m1 m2 2
zCM = − a2 − l (2.103)
m1 + m2 m1 + m2
Utilizando las expresiones para los λα , las fuerzas ejercidas separadamente por la
varilla y el cascarón sobre las partı́culas de masas m1 y m2 respectivamente, son:
m1 m2 g ~r1 − ~r2 m1 m2 g ~r1 − ~r2 ~r1 ~r2
; ; m1 g ; m2 g (2.109)
m1 + m2 zCM m1 + m2 zCM zCM zCM
Por ejemplo, tomemos la solución de equilibrio estable cuando l = 2a y m1 > m2 :
x1 = x2 = y1 = y2 = 0, z1 = −a, z2 = a. En este caso r~1 = −ak̂, r~2 = ak̂, ~r1 − ~r2 = −2ak̂ y
zCM será:
m1 − m2
zCM = − a (2.110)
m1 + m2
Las fuerzas ejercidas sobre m1 por la varilla y el cascarón respectivamente son:
2m1 m2 g m1 (m1 + m2 )
−2aλ1 k̂ = − k̂ y − aλ2 k̂ = g k̂ (2.111)
m1 − m2 m1 − m2
Las fuerzas sobre la partı́cula de masa m2 son:
2m1 m2 g m2 (m1 + m2 )
2aλ1 k̂ = k̂ y aλ3 k̂ = g k̂ (2.112)
m1 − m2 m1 − m2
Las ecuaciones (2.111) y (2.112) nos dicen que la fuerza ejercida por el cascarón
sobre m2 no es cero y que la fuerza ejercida por el cascarón sobre m2 es diferente
de (m1 + m2 )g, lo cual contradice nuestra idea intuitiva de que las partı́culas están
“colocadas” dentro del cascarón (véase figura 2.3). El resultado que acabamos de obtener
nos dice que las partı́culas están “agarradas” del cascarón de alguna manera. Esto nos
ilustra una propiedad de las ecuaciones de ligadura del tipo (2.88), (2.89), (2.90), o sea
de las ligaduras holónomas bilaterales: las fuerzas de ligadura asociadas a las ligaduras
bilaterales se pueden ejercer en dos direcciones. Por esto en la parte más alta del cascarón,
ecuación (2.112), éste ejerce sobre la partı́cula de masa m2 una fuerza en la dirección
z negativa. La fuerza total sobre m1 y la fuerza total sobre m2 , usando las ecuaciones
(2.100) y (2.106), son respectivamente:
~ CM
R ~ CM
R
m1 g ; m2 g (2.113)
zCM zCM
Cuando l = 2a, la fuerza neta ejercida por las ligaduras sobre m1 es m1 g k̂ y sobre m2
es m2 g k̂. Es decir, las ligaduras ejercen sobre cada partı́cula una fuerza que contrarresta
su peso, como debe ser cuando las partı́culas están “agarradas” al cascarón.
El estudio del caso en que las partı́culas están simplemente “colocadas” en el
cascarón requiere reemplazar (2.66) por dos condiciones de ligadura unilaterales: r1 ≤ a,
r2 ≤ a. La solución se obtiene fácilmente a partir de la hallada cuando las ligaduras son
bilaterales.
(a)
Qν se denomina la fuerza generalizada asociada al grado de libertad qν . En coor-
(a)
denadas generalizadas las condiciones de equilibrio son Qν = 0 para ν = 1, 2, ... l, que
proporciona un sistema de l ecuaciones algebraicas simultáneas con las l incógnitas
q1 , q2 , ... ql que son las coordenadas generalizadas en la posición de equilibrio. En cuan-
to a las fuerzas de ligadura, de la ecuación (2.50) se sigue que la fuerza de reacción de
las ligaduras asociada al grado de libertad qν también es cero:
N
X XN
Eν = ~ i . ∂~ri = −
R F~i (a) ·
∂~ri
ν = 1, 2, ... l (2.117)
i=1
∂qν i=1
∂qν
Se sigue de (2.117) que sólo serán diferentes de cero las fuerzas asociadas a las
3N − l = k coordenadas “superfluas”. Como en coordenadas generalizadas desaparecen
las ecuaciones de ligadura, se sigue que las fuerzas de ligadura también se anulan, de
acuerdo con la idea de que en el espacio de configuración no euclidiano, definido por
las coordenadas generalizadas, el efecto de las ligaduras es asociado con la propiedad
geométrica de “curvatura del espacio”.
Las ecuaciones (2.119) dicen que la posición de equilibrio estática es aquella para
la cual la función de energı́a potencial tiene un mı́nimo o un máximo respecto a todas
las coordenadas generalizadas. Sin definir estrictamente la estabilidad de un sistema,
podemos decir que un mı́nimo en V corresponde a equilibrio estable, y un máximo a
equilibrio inestable; las condiciones rigurosas de estabilidad están dadas por el teorema
de Lagrange y los teoremas de Liapunov y Chetayev (véase el capı́tulo 5 del libro Lectures
in analytical mechanics de Gantmacher).
A manera de ilustración, consideraremos una partı́cula colocada sobre una esfera de
radio a que puede variar con el tiempo. Las coordenadas generalizadas pueden tomarse
como θ, φ, de acuerdo con la ecuación (2.24). A las fuerzas aplicadas se les pueden
asociar las fuerzas generalizadas Qθ , Qφ . La condición de equilibrio es Qθ = Qφ = 0, o sea
que no haya torques externos en las direcciones de θ y φ. En el equilibrio, la partı́cula se
moverá sobre la superficie de la esfera sin aceleración o permanecerá en reposo respecto
a la misma. Con coordenadas generalizadas no es posible obtener la fuerza de ligadura
en la dirección radial.
Ejemplo 2.5.1 Hallar la configuración de equilibrio para el problema del ejemplo 2.4.1
en coordenadas generalizadas.
La figura 2.5 muestra una configuración general del sistema. Se requiere hallar
tres parámetros independientes compatibles con las ligaduras y expresar en términos de
ellos las coordenadas de las partı́culas. Luego, hallar las fuerzas generalizadas asociadas
a esos parámetros. La configuración de equilibrio estará dada por los valores de los
parámetros que anulan las fuerzas generalizadas. Las coordenadas generalizadas serán
tres parámetros que ubican la posición del triángulo rı́gido: 012. Como el vector de
posición del centro de masa ~rCM es fijo respecto al triángulo 012, dos parámetros podrı́an
ser φCM , θCM y el tercer parámetro serı́a un ángulo de rotación del triángulo alrededor de
~rCM . Sin embargo, resultan más convenientes los tres ángulos de Euler que determinan
la ubicación de un sistema de coordenadas cartesianas x′ , y ′ , z ′ , fijo al triángulo, respecto
al sistema de coordenadas espacial x, y, z.
Los ángulos de Euler permiten mediante tres rotaciones sucesivas obtener los ejes
x′ , y ′ , z ′ a partir de los ejes x, y, z: primero se rota alrededor del eje z por un ángulo
φ, con lo cual el eje x pasa a ser cierto eje ξ; luego se rota alrededor del eje ξ por un
ángulo θ, con lo cual z pasará a ser cierto eje ξ ′ ; luego se rota alrededor del eje ξ ′ por
un ángulo ψ, con lo cual se obtendrá la posición final de los ejes x′ , y ′ , z ′ . La figura 2.6
muestra estas tres rotaciones.
La figura 2.7 muestra la ubicación del triángulo mediante los ángulos de Euler
φ, θ, ψ. Se escoge el eje z ′ a lo largo de la lı́nea que une a O con el centro de masa,
y ′ perpendicular a 0−CM en el plano del triángulo, y x′ perpendicular al plano del
triángulo.
Las coordenadas de las partı́culas respecto a los ejes x′ , y ′ , z ′ son:
x′1 = 0 x′2 = 0
β β
y1′ = −a sen −α y2′ = a sen +α
2 2
(2.120)
β β
z1′ = a cos −α z2′ = a cos +α
2 2
Ecuaciones generales de la estática y la dinámica / 31
2
l
1
r2
r1 θ1 θ2
ϕ2
ϕ1
Figura 2.5 Configuración de equilibrio del sistema de dos masas unidas por una varilla rı́gida
(del ejemplo 2.4.1)
z,ζ ζ′ z zi ′ z
θ
θ yi′
η′
η
y
y y
x x ϕ
ϕ x ϕ
ψ xi′
ζ ζ′
a2
~rCM · ~rm = (1 + cos β) = rCM rm cos α (2.121)
2
32 / Mecánica clásica avanzada
z
zi ′ 2 1 z i′
y i′ × CM
1 × CM 2
θ α
a a
y β
0
xi′ y i′
ϕ ψ
0
r
l2
rm = a 1− (2.123)
4a2
r
l2 β l β l2
cos β = 1 − 2 ; sen = ; cos = 1− (2.124)
2a 2 2a 2 4a2
l m1 − m2 1
sen α = s
2a m1 + m2 m1 m2 l2
1−
(m1 + m2 )2 a2
v (2.125)
u
u l2
u 1− 2
cos α = u
u
4a
t m1 m2 l2
1−
(m1 + m2 ) a2
2
De (2.120), (2.124) y (2.125) se deducen las siguientes expresiones para las coor-
denadas de las partı́culas respecto a los ejes x′ , y ′ y z ′ :
l2 m2
1− 2
′ 2a m1 + m2
z1 = a s (2.128)
m1 m2 l2
1−
(m1 + m2 )2 a2
v
u
u l2
m u 1− 2
1 u 4a
y2′ = l u (2.129)
m1 + m2 t m1 m2 l2
1−
(m1 + m2 ) a2
2
l2 m1
1− 2
′ 4a m1 + m2
z2 = a s (2.130)
m1 m2 l2
1−
(m1 + m2 )2 a2
Definamos las variables c = cos ψ, c′ = cosφ, c′′ = cos θ, s = senψ, s′ = senφ y
s = senθ. Las ecuaciones de transformación del sistema de coordenadas x′ , y ′ , z ′ al
′′
Qψ ≡0 (2.135)
z = ±z ′
en concordancia con lo dicho anteriormente. En la configuración de equilibrio estable,
θ = π, las coordenadas de las partı́culas, de acuerdo con (2.138) y (2.126) a (2.130), son:
l2 m2 l2 m1
1− 2 1− 2
2a m1 + m2 2a m1 + m2
z1 = −a s ; z2 = −a s (2.139)
m1 m2 l2 m1 m2 l2
1− 1−
(m1 + m2 )2 a2 (m1 + m2 )2 a2
de acuerdo con los resultados obtenidos anteriormente [ecuaciones (2.88) y (2.90)]. Los
resultados (2.80) también se obtienen directamente de (2.138).
Ecuaciones generales de la estática y la dinámica / 35
o sea que la ecuación general de la dinámica toma la misma forma de la ecuación general
de la estática. Esta ecuación puede interpretarse como una ecuación para caracterizar
en cada instante del tiempo la posición de equilibrio del sistema donde a las fuerzas
(a)
efectivas F~i se les adicionan las fuerzas ficticias o inerciales −mi~¨r i . Más precisamente,
el principio de D’alembert (1760) dice: “cualquier posición de un sistema dinámico puede
considerarse como una posición de equilibrio instantáneo si a las fuerzas aplicadas que
actúan sobre el sistema se agregan las fuerzas ficticias o de inercia”. La regla de oro de
J. Bernoulli queda aplicable también en la dinámica. A −mi~¨r i se llama fuerza inercial
de D’alembert. En el problema estático asociado, las fuerzas de reacción de las ligaduras
coinciden con las del problema original, dinámico.
Ejemplo 2.6.1 Sea un recipiente lleno de agua que se mueve con una aceleración ~a per-
pendicular a la fuerza de gravedad (véase figura 2.8). Hallar la forma y la posición de la
superficie del agua.
36 / Mecánica clásica avanzada
dm
–dma a
F ( a) = –dmgk
Ejemplo 2.6.2 Sean dos partı́culas en un doble plano inclinado, unidas por una cuerda
inextensible sin masa (véase figura 2.9). Hallar la condición de equilibrio. Resolver el
problema dinámico.
z1 = 0 z2 = 0
y1 = x1 tan α1
(2.144)
y2 = −x2 tan α2
p p
x21 + y12 + x22 + y22 = l
Ecuaciones generales de la estática y la dinámica / 37
y
α2 α1 z
m
m1 2
α1 α2
Figura 2.9 Dos partı́culas en un doble plano inclinado, unidas por una cuerda inextensible
sin masa.
es decir:
O sea que cuando los ángulos y las masas sean tales que se cumple la anterior
condición, el sistema estará en equilibrio en cualquier posición.
Para el caso dinámico, o sea cuando m1 senα1 6= m2 senα1 , aplicamos la ecuación
general de la dinámica:
Las aceleraciones deben ser compatibles con las ligaduras, con lo cual se obtienen
las siguientes relaciones:
cos α1
a1x = a2x ; a1y = a1x tan α1 ; a2y = −a2x tan α2 (2.151)
cos α2
38 / Mecánica clásica avanzada
Con lo cual se obtiene a a1x y por consiguiente a a1y . La magnitud de ~a1 será:
|m1 g senα1 − m2 g senα2 |
a1 = (2.154)
m1 + m2
La aceleración a2 tiene igual magnitud. Las componentes x de las aceleraciones
son iguales y de signos contrarios.
ωt
0 x
Figura 2.10 Alambre largo y rı́gido que gira uniformemente alrededor de un eje perpendicular
a él. La masa m se desliza sobre él sin fricción.
mÿ = −λ (2.162)
Rx = λ tan ωt ; R − y = −λ (2.163)
40 / Mecánica clásica avanzada
ü − ω 2 u = 0 (2.166)
Con lo cual la solución para x, y, λ es:
o, más explı́citamente,
XN ∂~r
(a) i
F~i − mi~¨r i · = 0; ν = 1, 2, ... l (2.173)
i=1
∂qν
Ecuaciones generales de la estática y la dinámica / 41
Igual que en el caso estático las fuerzas generalizadas de ligadura se anulan, según
una ecuación análoga a la (2.117).
Las ecuaciones (2.181) se denominan las ecuaciones de Lagrange de la segunda
clase. En esas ecuaciones T es la energı́a cinética del sistema. Una vez resueltas las ecua-
ciones (2.181) mediante las fórmulas de transformación (2.21) y (2.23) se hallan los ~ri (t)
(a)
con los cuales se pueden hallar F~i (t) y ~¨ri que permiten obtener de (2.140) las fuerzas
de reacción de las ligaduras.
d ∂L ∂L
− = 0; ν = 1, 2, ... l (2.185)
dt ∂ q̇ν ∂qν
Xl Xl
∂L ∂L ∂ q̇α ∂L ∂qα
= = (2.187)
∂ q̇ν α=1
∂ q̇α ∂ q̇ ν α=1
∂ q̇α ∂qν
Ecuaciones generales de la estática y la dinámica / 43
donde L es la función de (q), (q̇) y t, que se obtiene de L(q, q̇, t) al realizar la transfor-
mación: L(q, q,˙ t) ≡ L q(q, t), q̇(q, q̇, t), t . Por otra parte:
l
"
d ∂L X d ∂L ∂qα
=
dt ∂ q̇ν α=1
dt ∂ q̇α ∂qα
l
!#
∂L X ∂ 2 qα ∂ 2 qα
+ + (2.188)
∂ q̇α µ=1 ∂qµ ∂q ν ∂t∂q ν
Xl
∂L ∂L ∂qα ∂L ∂ q̇α
= + (2.189)
∂q µ α=1
∂qα ∂q ν ∂ q̇α ∂qν
Xl
d ∂L ∂L d ∂L ∂L ∂ q̇α
− = − =0 (2.190)
dt ∂ q̇ν ∂q ν α=1
dt ∂ q̇α ∂qα ∂q ν
Xl Xl
∂L ∂L
q̇ν = q̇ ν (2.191)
α=1
∂ q̇ν ν=1
∂ q̇ν
Sistema sin ligaduras. Si no hay ligaduras las fórmulas (2.185) siguen siendo
válidas, donde l = 3N . Se sigue de (2.190) que cuando el sistema no tiene ligaduras las
ecuaciones de Lagrange (2.185) constituyen la forma de las ecuaciones de movimiento
en cualquier sistema de coordenadas, propiedad que no cumplen las ecuaciones de la
segunda ley de Newton, que son de naturaleza vectorial: las ecuaciones de Lagrange
contienen la misma información que la segunda ley de Newton con la ventaja adicional
de ser ecuaciones completamente covariantes.
En coordenadas cartesianas las fuerzas generalizadas son de la forma Qxi , Qyi ,
Qzi .
N
X X (a) N
(a) ∂~
ri (a)
Qxj = F~i · = F~i · µ̂x δij = Fix (2.192)
i=1
∂xj i=1
N
X 1
T = mi ẋ2i + ẏi2 + żi2 (2.193)
i=1
2
Ejemplo 2.7.1 Sea un alambre largo y rı́gido que rota uniformemente alrededor de un
punto O como se muestra en la figura 2.11. Una partı́cula de masa m está sometida
a la ligadura de permanecer sobre el alambre. No hay fricción y actúa la fuerza de
gravedad en el plano de rotación del alambre. Resolver el problema usando coordenadas
generalizadas y las ecuaciones de Lagrange.
c
h ωt
m
ωt β
O B x
–mgj
Figura 2.11 Alambre largo y rı́gido que gira uniformemente alrededor de un punto O
Suponer que en t = 0 la partı́cula parte del punto C con velocidad cero a lo largo
del alambre. La ligadura es holónoma y reónoma, dada por la ecuación de la linea del
alambre:
y = x tan β + OA (2.195)
Ecuaciones generales de la estática y la dinámica / 45
De la geometrı́a se sigue que sen ωt = h/OA y tan β = − cot α, con lo cual la ecuación
de ligadura toma la forma:
q̈ − qω 2 = g cos ωt (2.201)
Rx = mẍ
(2.204)
Ry = mg + mÿ
46 / Mecánica clásica avanzada
ν = 1, 2, ... 3N (2.209)
N
X
dα = Dα ; aαν = ~lα · ∂~r1
i=1
∂qν
para α = h + 1, h + 2, ... h + n = k (2.211)
k
X
Qν = Q(a)
ν + λα aαν (2.212)
α=1
Xk
d ∂T ∂T
− = Qν(a) + λα aαν ; ν = 1, 2, ... 3N (2.213)
dt ∂ q̇ν ∂qν α=1
que junto con las 3N ecuaciones de Lagrange nos proporcionan 3N + k ecuaciones con
las 3N + k incógnitas siguientes: q1 , q2 , ... q3N , λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las fuerzas
de
Pkreacción de las ligaduras en estas coordenadas no independientes estarán dadas por
α=1 λα aαν , o más explı́citamente:
h
X n
∂fα X
Rν = λα + µα aαν (2.215)
α=1
∂qα α=1
Ejemplo 2.8.1 Resolver el problema del ejemplo 2.7.1 usando multiplicadores de Lagran-
ge y coordenadas no independientes.
f (q, h, t) = h − h0 (2.217)
con lo cual se obtienen las siquientes expresiones para los coeficientes aq , ah , d, según
(2.210):
∂f
aq = =0
∂q
∂f (2.219)
ah = =1
∂h
∂f
d= =0
∂t
Las fuerzas aplicadas generalizadas serán:
∂~r
Qν = −mg î · (2.220)
∂qν
con lo cual:
Qh = −mg senωt ; Qq = mg cos ωt (2.221)
La energı́a cinética será:
1
T (q, q̇, h, ḣ, t) = m(q̇ 2 + q 2 ω 2 + h2 ω 2 − 2q̇hω + 2q ḣω + ḣ2 ) (2.222)
2
Entonces las ecuaciones (2.213) serán:
m(q̈ − ḣω) − m(qω 2 + ḣω) = mg cos ωt
(2.223)
m(ḧ + q̇ω) − m(hω 2 − q̇ω) = −mg sen ωt + λ
La ecuación (2.214) será:
ḣ = 0 ⇒ h = h0 (2.224)
Reemplazando (2.224) en (2.223) obtenemos:
q̈ − qω 2 = g cos ωt
(2.225)
λ
= 2q̇ω − hω 2 + g senωt
m
La solución de las ecuaciones (2.225) de acuerdo con (2.224) será:
g
q = (cosh ωt − cos ωt)
2ω 2
(2.226)
2
λ = mg(senhωt + 2senωt) − mhω
Las fuerzas generalizadas de ligadura serán, de (2.226) y (2.215):
Rh = mg(senhωt + 2senωt) − mhω 2 ; Rq = 0 (2.227)
en completo acuerdo con los resultados de (2.208).
Ecuaciones generales de la estática y la dinámica / 49
Ejemplo 2.8.2 Sea un disco de radio R que rueda sobre un plano inclinado con el plano
del disco perpendicular al plano inclinado (podrı́a ser una de las ruedas de un carro).
Hallar y resolver las ecuaciones de movimiento.
mÿ = mg senβ + µ2
1 2 (2.233)
R mα̈ = 0
4
1 2
R mφ̈ = −µ1 R senα + µ2 R cos α
2
La tercera de las ecuaciones (2.233) nos da:
α = ωα t + α0 (2.234)
2 Para una justificación rigurosa de (2.231) ver sección 8.3.
50 / Mecánica clásica avanzada
Las dos primeras ecuaciones (2.233) junto con las (2.228) nos dan las siguientes
expresiones para µ1 y µ2 en términos de φ:
µ1 = mRωα cos(ωα t + α0 ) φ̇ + mR cos(ωα t + α0 ) φ̈
(2.235)
µ2 = mRωα sen(ωα t + α0 ) φ̇ − mR cos(ωα t + α0 )φ̈ − mg sen β
Ahora, reemplazando a µ1 y µ2 en la última de las (2.233) obtenemos:
2 g
φ̈ = − senβ cos(ωα t + α0 ) (2.236)
3 R
que al ser integrada nos da:
2g
φ= senβ cos(ωα t + α0 ) + At + B (2.237)
3Rωα2
Tomando la condición inicial φ(0) = 0 y φ̇(0) = 0, (2.237) será:
2g
φ= senβ[cos(ωα t + α0 ) − cosα0 + ωt senα0 ] (2.238)
3Rωα2
Tomando además a α0 = 0, lo que equivale a tomar en t=0 a α = 0, obtenemos:
α = ωα t
2gsenβ ωt
φ =− sen2
3Rωα2 2
2
µ1 = − mg senβsen2ωα t
3
(2.239)
2
µ2 = −mgβ 1 − cos 2ωα t
3
g senβ 1
x =− ωα t − sen2ωα t
3ωα2 2
gsenβ
y = sen2 ωα t
3ωα2
Donde hemos tomado que x = 0, y = 0, ẋ = 0, ẏ = 0 en t = 0.
Las fuerzas de reacción de las ligaduras serán, usando (2.215):
Rx = µ1
Ry = µ2
Rα = 0 (2.240)
Rφ = −µ1 R senωα t + µ2 R cos ωα t
1
= − mgR senβ cos ωα t
3
Ecuaciones generales de la estática y la dinámica / 51
α= 0 Rx = 0
g senβ 2 1
φ= − t Ry = − mg senβ
3R 3
(2.241)
x= 0 Rα = 0
1 1
y= gsenβ t2 R= − mgR senβ
3 3
Si en vez de un disco se tuviera una masa que baja sin rozamiento a lo largo del eje
y, la fuerza a lo largo del plano serı́a mg senβ. En este caso se tiene que el plano ejerce
sobre la rueda una fuerza en y dada por (−1/3)mg senβ y que la hace rodar hacia abajo
en la dirección de y positiva. Rφ es el torque que produce la rotación. La aceleración del
centro de masa será (2/3)g senβ con lo cual y = (1/3) senβ t2 y φ = (1/3)g senβ t2 /R.
Ejemplo 2.8.3 Sean dos partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida
de longitud l, sin masa. El sistema de alguna manera está constreñido a moverse en un
plano vertical, de modo que la velocidad del centro de masa siempre está en la dirección
de la varilla (véase figura 2.12). Hallar y resolver las ecuaciones de movimiento.
r1
1
r ·
r2 α
2
y
Figura 2.12 Partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida y constreñidas a
moverse en un plano vertical
52 / Mecánica clásica avanzada
2ÿ − 2g = µ (2.249)
1 2
l α̈ = 0
2
Para α se halla:
α = ωt + δ (2.250)
x, y y µ se hallan de las ecuaciones:
2ẍ = −µ tan(ωt + δ)
2ÿ = 2g + µ (2.251)
ẏ − ẋ tan(ωt + δ) = 0
Ecuaciones generales de la estática y la dinámica / 53
Rα = 0
Se sigue que si al sistema se aplica una fuerza dada por (2.257), se moverá con
la condición de ligadura (2.243). ω, δ, A, B, y C son constantes de integración que
dependen de las condiciones iniciales.
54 / Mecánica clásica avanzada
3
El principio de Hamilton y las ecuaciones de
Lagrange
también será cero el promedio de los trabajos virtuales realizados por las fuerzas de
55
56 / Mecánica clásica avanzada
z
2
Trayectoria variada
δri
mi
1
Trayectoria real
ri
y
x
ligadura entre t1 y t2 :
Z N
t2 X
1 ~ i (t) · δ~ri (t)dt = 0
R (3.2)
t2 − t1 t1 i=1
Notamos que en (3.9) aparecen el trabajo virtual de las fuerzas aplicadas, δA, y la
energı́a cinética:1
N
X N
(a) 1 X ˙2
δA = F~i · δ~ri ; T = mi~ri (3.10)
i=1
2 i=1
Podrı́a pensarse que la presencia de condiciones de ligadura harı́a que δ~ri (t1 ) =
δ~ri (t2 ) = 0 no es posible imponerla para todas las coordenadas sino sólo para las indepen-
dientes, quedando la posibilidad de que no se cumpla para las coordenadas dependientes.
1 Como para pasar de r a r +δ~ ri se requiere realizar un trabajo, la energı́a en cada trayectoria variada
i i
es diferente. Esto caracteriza al principio de Hamilton, a diferencia de otros principios variacionales como
el de “mı́nima acción” (véase sección 9.3).
58 / Mecánica clásica avanzada
Basta pues que se imponga la condición siguiente sobre los desplazamientos vir-
tuales de las coordenadas generalizadas:
δqν (t1 ) = δqν (t2 ) = 0 ; ν = 1, 2, ...l (3.14)
para que se satisfaga la condición requerida para los desplazamientos virtuales δ~ri .
En el caso particular en que las fuerzas aplicadas se pueden obtener como el gra-
diente de una función de las coordenadas y del tiempo, V (~r, t) vemos que:
N
X N
X
∂V (a)
δV (~r, t) = .δ~ri = − F~i .δ~ri = −δA (3.15)
i=1
∂~ri i=1
Se sigue que F (x1 , x2 , ...xn ) será extremal para aquellos valores de x1 , x2 , ...xn que
hacen que se anulen todas las derivadas parciales de primer orden de F :
∂F
=0 i = 1, 2, ...n (3.22)
∂xi
En el análisis de funciones F (x1 , x2 , ...xn ) es un número que se asocia al conjunto
de números x1 , x2 , ...xn . Al cambiar los números x1 , x2 , ...xn cambia el número F . Se
dice que F es extremal si no cambia al primer orden en δxi cuando los xi se cambian
por xi + δxi . 2
En el análisis funcional I [f1 (x), f2 (x), ...fn (x)] es un número que se asocia al conjunto
de funciones f1 (x), f2 (x), ...fn (x). Al cambiar las funciones f1 (x), f2 (x), ...fn (x) cambia
el número I. Se dice que I es extremal si no cambia al primer orden en δfi (x) cuando
las funciones fi (x) se cambian por las funciones fi (x) + δfi (x). A δfi (x) se le denomina
variación de la función fi (x). Toda función continua en un punto x0 puede expandirse
en serie de Taylor alrededor de x0 :
∞
X 1 (k)
fi (x) = f (x0 )(x − x0 )k (3.23)
k! i
k=0
(k)
donde fi (x0 ) denota el valor de la derivada k-ésima de la función fi (x) en x = x0 y
(0) (n)
fi (x0 ) ≡ fi (x0 ). Variando los parámetros fi (x0 ) para k = 0, 1, 2, ...∞ se obtiene una
función diferente.
S es una funcional de qν (t), pues a cada posible solución q1 (t), q2 (t), ...ql (t) le
corresponde un valor definido a la integral de acción S. El principio de Hamilton dice
que al variar las funciones qν (t) se obtiene el conjunto de funciones verdaderas que
describen la evolución del sistema por hallar qué conjunto es el que hace que S sea una
extremal. Para la mayorı́a de las situaciones fı́sicas se encuentra que S es mı́nima para
2 El máximo o mı́nimo de una función se halla resolviendo el sistema de ecuaciones algebraicas (3.22),
como en la estática. Los extremales de una funcional se hallan resolviendo un sistema de ecuaciones
diferenciales, como en la dinámica.
60 / Mecánica clásica avanzada
la solución correcta. En otras palabras, S tiene un valor mı́nimo cuando las funciones
qν (t) describen las trayectorias reales.3 El número S asignado a cualquier trayectoria
variada es mayor que el número S asociado a la trayectoria real.
Ejemplo 3.2.1 Ilustrar el principio de Hamilton con el problema del tiro parabólico en
presencia del campo gravitacional (véase figura 3.2).
Sabemos que la trayectoria real está descrita por:
1 2
x(t) = Vx t ; y(t) =
gt (3.24)
2
Eliminando el parámetro t se obtiene que la trayectoria es parabólica:
g 2
y= x (3.25)
2Vx2
Esta trayectoria pasa por el punto (x = 0, y = 0) en t = 0 y por el punto (x2 , y2 =
gx22 /(2Vx2 )) en t = t2 (véase figura 3.2).
La siguiente trayectoria variada pasa por los mismos puntos que la trayectoria real
en t = t1 = 0 y t = t2 :
x = Vx t
(3.26)
ex/x2 − 1
y = y2
e−1
Se trata de mostrar que la integral de acción tiene menor valor para la trayectoria
real que para esta trayectoria variada.
El lagrangiano del problema es:
1
L= m(ẋ2 + ẏ 2 ) + mgy (3.27)
2
Sobre la trayectoria real L es:
1 1 1
L= m(Vx2 + g 2 t2 ) + mg 2 t2 = mVx2 + mg 2 t2 (3.28)
2 2 2
La integral de acción es:
Z t2
1 1 1 x2y2
L dt = mVx2 t2 + mg 2 t32 = mVx x2 + 0, 666 mg (3.29)
0 2 3 2 Vx
Sobre la trayectoria variada:
y2 Vx
ẋ = Vx ; ẏ eVx t/x (3.30)
x2 (e − 1)
Con lo cual L es:
1 y22 Vx2 mgy2 Vx t/x2
L = m Vx2 + 2 2 e 2Vx t/x2
+ (e − 1) (3.31)
2 (e − 1) x2 e−1
3 De acuerdo con el principio de D’Alembert esto equivale a decir que las posiciones verdaderas son
de “equilibrio” estable.
El principio de Hamilton y las ecuaciones de Lagrange / 61
P1 x
P2 (x2,y2)
Ejemplo 3.2.2 Resolver el problema del oscilador armónico lineal usando directamente
el principio de Hamilton, con las siguientes condiciones en t = 0 y t = t1 :
(3.38)
∞ ∞
1XX nm n+m−1 1 n+m+1
an am µ t −k t
2 n=1 m=1 n+m−1 1 n+m+1 1
La condición δS = 0 nos da:
"∞
∞ X #
X nm 1
am µ tn+m−1 − k tn+m+1 δan = 0 (3.39)
n=1 m=1
n+m−1 1 n+m+1 1
En la ecuación (3.39) los δan son los cambios de los coeficientes an que darán lugar
a la variación δx(t). Los δan no son independientes, pues se debe además cumplir la
condición δx(t1 ) = 0:
Xn
δx(t1 ) = δan tn1 = 0 (3.40)
n=1
En virtud de (3.40) un δan puede expresarse en términos de los demás. Vamos a
introducir un multiplicador indeterminado λ multiplicando la ecuación (3.40) por λ y el
resultado lo sumamos a la ecuación (3.39) para obtener:
∞
" ∞
X X mn
µ t1n+m−1
n=1 m=1
n + m − 1
(3.41)
1
−k tn+m+1 am + λtn1 δan = 0
n+m+1 1
4 La ecuación (3.34) constituye una representación multiparamétrica de la trayectoria en el espacio
de configuración.
El principio de Hamilton y las ecuaciones de Lagrange / 63
En la ecuación (3.41) quedará una combinación lineal de los δa2 , δa3 , ...δa∞ , igua-
lada a cero. Como estas cantidades son ahora independientes, se debe cumplir que sus
coeficientes se anulen. Igualando a cero los coeficientes de δa2 , δa3 , ...δa∞ y reempla-
zando el valor de λ que se obtiene de (3.42), llegamos a:
X∞
m−1 m 1 m+2
µ t +k t am = 0 (3.43)
m=1
m+n−1 1 (m + 2)(m + n + 1) 1
k 1
am = − am−2 ; m = 2, 4, ... (3.44)
µ m(m − 1)
Como a0 = 0, se sigue que:
a0 = a2 = a4 = ... = 0 (3.45)
a1 = v0 (3.46)
Z l
t1 X
∂T d ∂T
Qν δqν + − δqν dt (3.54)
t1 ν=1 ∂qν dt ∂ q̇ν
t2
l
X ∂T
+ δqν = 0
∂ q̇ν
ν=1 t1
Como las δqν son arbitrarias, el integrando es una función arbitraria del tiempo;
si la integral es cero, es necesario entonces que el integrando sea cero. Ahora queda una
combinación lineal de las cantidades independientes δqν igualada a cero,
l
X
∂T d ∂T
Qν + − δqν = 0 (3.56)
ν=1
∂qν dt ∂ q̇ν
donde fν es la fuerza generalizada correspondiente a las fuerzas F~i′ . Es posible con este
tipo de fuerzas definir una función lagrangiana asociada a las fuerzas derivables del
potencial generalizado. fν contiene las fuerzas no incluidas en L.
Las ecuaciones de Lagrange toman la forma:
∂L d ∂L
− + fν = 0 ; ν = 1, 2, ...l (3.60)
∂qν dt ∂ q̇ν
donde L está definido como:
Para el caso en que las fuerzas no potenciales sean todas viscosas, las ecuaciones
de Lagrange toman la forma:
d ∂L ∂L ∂F
− + = 0; ν = 1, 2, ...l (3.75)
dt ∂ q̇ν ∂qν ∂ q̇ν
de modo que deben darse dos funciones escalares, L y F , para obtener las ecuaciones de
movimiento. Estas serán las ecuaciones a aplicarse en el caso de un sistema de osciladores
amortiguados por ejemplo; L contiene las fuerzas de “resorte” y F las fuerzas disipativas.
Ejemplo 3.3.1 Sea una partı́cula libre, descrita en un sistema de referencia inercial O
mediante el lagrangiano.
1 ˙2
L= m~r (3.78)
2
Si se realiza una transformación de Galileo, a un nuevo sistema de referencia inercial
O′ que se mueve respecto a O con velocidad constante V~ :
~
~υ = ~υ ′ + V (3.79)
Entonces el lagrangiano en el nuevo sistema de referencia inercial será:
1 1 2 1
L′ = m~r˙ ′2 = m~r˙ + m −2~r · V ~ +V ~2 (3.80)
2 2 2
Los dos lagrangianos están relacionados ası́:
d m
L′ = L + −2~r · V~ + V~ 2t (3.81)
dt 2
A la función:
m ~ +V ~ 2t
f (r, t) = −2~r · V (3.82)
2
por razones que se verán más adelante, se le denomina “función generadora de la trans-
formación de Galileo”. Vemos que:
m ~ − 2~r2 · V~ +V ~ 2 t2 − ~υ 2 t1
S′ = S + 2~r1 · V (3.83)
2
y por tanto δS ′ = δS dado que δ~r = δ~r ′ = 0 en t = t1 y t = t2 .
z → z
El principio de Hamilton y las ecuaciones de Lagrange / 69
y L no cambia, se dice que L es simétrico bajo rotaciones alrededor del eje z arbitrarias.
Veremos que esta simetrı́a está asociada con la conservación del momento angular. Si se
realiza una inversión de las coordenadas,
L → L + Fz az (3.88)
L se altera a no ser que az sea cero. Ya no habrá simetrı́a de translación a lo largo del eje
z. Veremos que esto implica que sólo son constantes las componentes x y y del momento
lineal.
L no cambia bajo rotaciones alrededor del eje z (a lo largo del cual actúa la fuer-
za), pero obviamente no tendrá simetrı́a de rotación alrededor de ningún otro eje. Antes
de aplicar la fuerza, L tenı́a simetrı́a de rotación alrededor de cualquier eje (simetrı́a
esférica), ahora sólo tiene simetrı́a de rotación en el eje z (simetrı́a cilı́ndrica). Esta si-
metrı́a implica que sólo se conserva la componente z del momento angular, en tanto que
en ausencia del campo se conservan las tres componentes. En general, hay una relación
entre las simetrı́as de L y las variables dinámicas que se conservan.
Variables dinámicas. A cualquier función del estado del sistema y del tiempo
se le llama una variable dinámica. Para un sistema con l grados de libertad las va-
riables dinámicas son de la forma Dα (q1 , q2 , ...ql , q̇1 , q̇2 , ...q̇l , t). Ejemplos de variables
dinámicas son:
N
X N
X N
X 1 2
P~ = mi~r˙ i ; ~ =
L mi~ri × ~r˙ i ; T = mi~r˙ i (3.90)
i=1 i=1 i=1
2
Por otra parte, con las 2l constantes de integración se puede obtener cualquier otro
conjunto de 2l constantes independientes. En conclusión, a cualquier sistema dinámico
integrable se le pueden asociar 2l funciones de (q), (q̇) y t cuya derivada total respecto a t
sea cero. Estas cantidades son variables dinámicas, o sea que para cada sistema mecánico
integrable siempre es posible hallar 2l constantes de movimiento independientes, o en
otras palabras 2l variables dinámicas que se conservan, si es integrable.
En mecánica cuántica se pueden encontrar a lo sumo l variables dinámicas que
pueden tomar simultáneamente valores constantes. Se dice que para un sistema cuántico
de l grados de libertad hay sólo l operadores hermı́ticos independientes que conmutan
entre sı́ y que tienen estados propios con valores definidos de las correspondientes varia-
bles dinámicas.
ligaduras no realizan trabajo sobre el sistema, entonces para tal sistema se cumple que
L es simétrica bajo el cambio de origen del tiempo:
∂L ∂L
=0 ⇒ =0 (3.93)
∂t0 ∂t
La derivada total de L respecto al tiempo es:
l
dL X ∂L ∂L ∂L
= q̇ν + q̈ν + (3.94)
dt i=1
∂qν ∂ q̇ν ∂t
La cantidad entre paréntesis se llama la función energı́a, denotada h(q, q̇, t) con lo
cual:
l
X ∂L
ḣ(q, q̇, t) = fν q̇ν − (3.98)
ν=1
∂t
De las condiciones (a) y (c) y del hecho de que V no depende de t se sigue que
fν = 0 y ∂L/∂t = 0, con lo cual:
h(q, q̇, t) = constante (3.99)
Esta constante se llama “energı́a” o “constante de Jacobi”. La función h es igual
al hamiltoniano H. La diferencia es que éste se define como una función de (q), (p), t y
aquella es función de (q), (q̇) y t. Veremos que si además se cumple que V no depen-
de de las (q̇), h coincide con la energı́a total T +V . (a) implica que el sistema es holónomo.
O sea que T se puede escribir como la suma de tres funciones homogéneas de las
velocidades generalizadas de grados 2, 1 y 0:
T = T2 + T1 + T0 (3.107)
Es decir, que la energı́a cinética es una función homogénea cuadrática en las velo-
cidades. La función Aνµ (q, t) es simétrica:
En virtud del teorema de Euler acerca de las funciones homogéneas se sigue que
para un sistema esclerónomo:
Xl
∂T
q̇ν = 2T (3.110)
ν=1
∂ q̇ν
∂L ∂T
= (3.111)
∂ q̇ν ∂ q̇ν
Xl
∂T
h(q, q̇, t) = q̇ν − T + V = T + V (3.112)
ν=1
∂ q̇ν
X l
dh dE ∂L
= = fν q̇ν − (3.113)
dt dt ν=1
∂t
donde la dependencia que tiene L de t puede provenir sólo de que V dependa del tiempo.
Si las fuerzas fν son viscosas y se pueden obtener de la función de disipación de Rayleigh,
que es una función homogénea cuadrática de las velocidades, en virtud de las ecuaciones
(3.72), (3.74) y (3.101), se sigue que:
l
X Xl
∂F
fν q̇ν = − q̇ν = −2F (3.114)
ν=1 ν=1
∂ q̇ν
dh ∂L ∂E ∂V
= −2F − o = −2F + (3.115)
dt ∂t ∂t ∂t
En (3.115) resulta claro que la rata de cambio de la energı́a total consta de la rata
de disipación de energı́a 2F y de la rata de suministro de energı́a debida a la variación
temporal de V .
Ejemplo 3.4.1 Hallar la constante de Jacobi y la rata de cambio de la energı́a total para
una partı́cula cargada en presencia de un campo electromagnético.
74 / Mecánica clásica avanzada
1
h = T2 − T0 + V = ma2 (q̇ 2 − ω 2 senq) − mga cos q (3.129)
2
la cual es una constante de movimiento. Podemos reinterpretar a h diciendo que es
la energı́a total respecto al sistema de ejes rotantes x′ , y ′ y z ′ . La energı́a cinética
76 / Mecánica clásica avanzada
Conservación del momento lineal. Sea un sistema que cumple las siguientes
condiciones: (a) se describe completamente a partir de un lagrangiano; (b) L no depende
de alguna de las coordenadas generalizadas. Entonces se cumple:
∂L
=0 (3.133)
∂qν0
donde la coordenada qν0 que no aparece en L se llama cı́clica o ignorable. La ecuación
de Lagrange para la coordenada qν0 implica que:
d ∂L
= f0 (3.134)
dt ∂ q̇ν0
O sea que si fν0 = 0 la siguiente cantidad se conserva:
∂L
Pν0 ≡ = constante (3.135)
∂ q̇ν0
Se define el momento canónico conjugado a la coordenada qν ası́:8
∂L
Pν = ; ν = 1, 2, ...l (3.136)
∂ q̇ν
luego, el momento canónico conjugado a una coordenada cı́clica es una constante de
movimiento. Si L no depende de qν0 y fν0 = 0 se dice que el sistema es simétrico bajo
cualquier cambio en la coordenada qν0 .
8 La palabra “canónico” viene desde de época de Hamilton; significa “de acuerdo con el canon”. Se
usa ampliamente en fı́sica para designar diversos aspectos del formulismo hamiltoniano, que describe
los sistemas mecánicos mediante las variables (q, p).
El principio de Hamilton y las ecuaciones de Lagrange / 77
donde P~ es el momento total del sistema. Se sigue que si hay homogeneidad espacial,
δL = 0, entonces se sigue que la variable dinámica ~ǫ· P~ se conserva. Como E es arbitrario,
se sigue que P~ es una constante. Si sólo hay simetrı́a de translación en determinada
dirección ~ǫ se sigue que sólo se conserva la componente de P~ en la dirección de ~ǫ. Como
L = T − V y T sólo depende de las velocidades de las partı́culas,
∂L ∂V
=− = F~i (3.140)
∂~ri ∂~ri
Entonces en (3.138) se tiene:
N
X
δL = ~ǫ · F~i (3.141)
i=1
δL será cero si el sistema no está sometido a una fuerza neta externa, es decir si el
sistema está aislado. O también: si el sistema es aislado, no debe haber fuerzas sobre el
centro de masa:
∂V
F~CM = − =0 (3.142)
∂R~ CM
luego V no depende de RCM y ésta será cı́clica. El momento canónico conjugado de
~ CM será el momento lineal total y será una constante de movimiento:
R
XN
∂L ∂L ∂~r˙ i
P~CM = = · (3.143)
~˙ CM
∂R r˙ i ∂ R
i=1 ∂ ~
~ CM
Se sigue que:
∂~r˙ i ~
= ~1 (3.145)
˙
~
∂ RCM
donde ~~1 es el diádico unidad, que se representa por una matriz unidad de dimensión
3 × 3 (véase sección 7.4). Por tanto:
X ∂LN X N
∂L
= = mi~r˙ i = P~CM (3.146)
˙~ ∂ ˙
~
r
∂ RCM i=1 i i=1
n
δϕ
δr
r + δr
θ
y que:
∂~r
= n̂ × ~r (3.149)
∂φ
El momento canónico conjugado de φ será:
∂L ∂~r˙ ∂~r
pφ = = m~r˙ · = m~r˙ · = m~r˙ · (n̂ × ~r) = n̂ · m~r × ~r˙ (3.150)
∂ φ̇ ∂ φ̇ ∂φ
Se sigue que pφ es la componente del momento angular a lo largo de n̂. Si L no
depende de φ, pφ es una constante de movimiento.
Isotropı́a espacial. Sea un sistema tal que no cambia L cuando se rota como un
todo alrededor de un eje n̂. Esto es, si para cada partı́cula:
~ri → ~ri + n̂ × ~ri δφ ; ~r˙ i → ~r˙ i + n̂ × ~r˙ i δφ (3.151)
el cambio en L será:
X N X N
∂L ∂L ˙
δL = · δ~ri + · δ~ri = p~˙ i · δ~ri + p~i · δ~r˙ i (3.152)
i=1
∂~ri ∂~r˙ i i=1
Usando (3.151) y usando la invariancia del triple producto escalar bajo permutación
cı́clica de los factores:
N
X XN
d
δL = n̂ · ~ri × p~˙ i + p~i × ~r˙ i δφ = n̂δφ · ~ri × p~i (3.153)
i=1 i=1
dt
Con lo cual
~˙
δL = δφn̂ · L (3.154)
~ es el momento angular total. Por otra parte, en virtud de las ecuaciones de
donde L
Lagrange:
N
X
δL = F~i · δ~ri + p~i · δ~ri =
i=1
(3.155)
N
X N
X
δφn̂ · ~ri × F~i + ~r˙ i × p
~i = δφn̂ · ~ki = δφn̂ · K
~
i=1 i=1
~ en esa dirección.
componente de L
N N
d X X
2T = pi · ~ri −
~ F~i · ~ri (3.159)
dt i=1 i=1
!τ Z N (3.160)
1
N
X 1 τ X~
lı́m p~i · ~ri − lı́m Fi · ~ri dt
τ →∞ τ τ →∞ τ 0
i=1 0 i=1
La condición (b) conduce a la anulación del primer miembro del lado derecho, con
lo cual llegamos a:
N
X
2T = − F~i · ~ri , (3.161)
i=1
El principio de Hamilton y las ecuaciones de Lagrange / 81
Las fuerzas R~ i actúan sólo cuando la partı́cula i choca con las paredes del recipiente.
Estas fuerzas representan la reacción del muro a la colisión ejercida por los átomos sobre
la pared. Esto es lo que se denomina la reacción a la presión P que ejerce el gas sobre el
recipiente. PN ~
En un tiempo t dado, en i=1 R i ·~
ri sólo contribuyen los términos correspondientes
a las partı́ulas que en ese instante chocan con las paredes del recipiente. Podemos dividir
el área de las paredes en elementos infinitesimales de área dA. Todas las dN partı́culas
que choquen sobre un dA dado tendrán aproximadamente el mismo radio vector ~ri que
llamaremos ~r. La contribución de las dN partı́culas a la sumatoria será aproximadamente
R~ dN · ~r, donde R~ es la fuerza que ejerce el elemento de área sobre cada una de las dN
partı́culas que inciden sobre ella. Si llamamos R ~ dN = dR,
~ entonces tenemos que:
N
X Z
~ i · ~ri =
R ~
~r · dR (3.170)
i=1
~ en términos de la
Si n̂ es un vector normal a la superficie, podemos escribir a dR
presión de la siguiente manera:
~ = −n̂P dA
dR (3.171)
Como la presión es constante escribimos:
N
X Z
~ i · ~ri = −P
R n̂ · ~r dA (3.172)
i=1
Entonces:
N
X
~ i · ~ri = −3P V
R (3.174)
i=1
En virtud del teorema del virial, que es válido en este caso porque el movimiento
es acotado, y usando (3.162) y (3.166) se sigue que:
3N KB θ = −I + 3P V (3.176)
Llegándose a la ecuación de estado para un gas real:
1
P V = N KB θ + I (3.177)
3
El principio de Hamilton y las ecuaciones de Lagrange / 83
85
86 / Mecánica clásica avanzada
que serı́a por ejemplo la forma que tomarı́a el potencial electromagnético (3.68) al ser
expresado en coordenadas generalizadas, entonces pν será:
l
X
pν = Aνµ q̇µ + Aν − Πν ; ν = 1, 2, ...l (4.7)
µ=1
Xl
∂L(q, q̇, t)
h(q, q̇, t) = q̇ν − L(q, q̇, t) (4.12)
ν=1
∂ q̇ν
Entonces:
X n n
X
∂Y ∂fk ∂X ∂fk
= yk + fk δik − =
∂yi ∂yi ∂fk ∂yi
k=1 k=1
(4.19)
n
X
∂fk ∂fk
yk − yk + fi = xi
∂yi ∂yi
k=1
∂X ∂Y
yi = ; xi = ; i = 1, 2, ...n (4.24)
∂xi ∂yi
X ∂Y ∂X
Y = xk yk − X ; =− ; i = 1, 2, ...m (4.25)
∂αi ∂αi
k
∂H ∂L
=− (4.29)
∂t ∂t
teniendo en cuenta que el conjunto (q), t, hace el papel de las (α). De las ecuaciones de
Lagrange se sigue que:
∂L d ∂L
= − fν = ṗ − fν ; ν = 1, 2, ...l (4.30)
∂qν dt ∂ q̇ν
Las ecuaciones (4.27) a (4.30) nos dan:
∂H ∂H
q̇ν = ; p˙ν = − + fν ; ν = 1, 2, ...l (4.31)
∂pν ∂qν
Las ecuaciones (4.31) se denominan las ecuaciones canónicas de Hamilton y cons-
tituyen las ecuaciones de movimiento en las variables hamiltonianas. Son 2l ecuaciones
diferenciales que involucran sólo primeras derivadas de (q) y (p), en tanto que las de
Lagrange son l ecuaciones deferenciales de segundo orden en las (q). En esencia sólo el
segundo conjunto de ecuaciones (4.31) constituye las ecuacionnes de movimiento, pues
el primer conjunto sólo proporciona la transformación inversa a pν = ∂L/∂ q̇ν .
La formulación hamiltoniana / 89
l
X ∂H
= [(fν − ṗν ) q̇ν + q̇ν ṗν ] + (4.32)
ν=1
∂t
l
X ∂H
= fν q̇ν +
ν=1
∂t
Si las ligaduras reónomas no dan lugar a que t aparezca en H y el potencial no
depende del tiempo, ∂H/∂t = 0, y si además no hay fuerzas no derivables del potencial,
se sigue que Ḣ = 0, o sea que H es una constante de movimiento. Si además las fuerzas
son derivables de un potencial que no depende de las velocidades, sabemos de (3.112)
que H = T + V . O sea que bajo estas condiciones la energı́a total E = T + V se conserva,
de lo contrario se cumple que H es constante pero no es cierto que H = E. Si V no
depende de (q̇) ni de t y las ligaduras reónomas no dan lugar a que t aparezca en H se
cumple que ∂H/∂t = 0 y que H = T + V . En este caso:
l
dE d(T + V ) X
= = fν q̇ν (4.33)
dt dt ν=1
Luego, dE/dt es igual a la rata a la cual las fuerzas no conservativas realizan tra-
bajo sobre el sistema. Si estas son nulas, la energı́a total se conserva.
Por otra parte, si las fν son cero, o bien V depende de t, o las ligaduras reónomas
dan lugar a que t aparezcan en H,
dH ∂H
= (4.34)
dt ∂t
Ejemplo 4.1.2 Usando la transformación de Legendre inversa, derivar las ecuaciones de
movimiento lagrangianas a partir de las ecuaciones de movimiento hamiltonianas.
Supongamos que fν = 0. Las ecuaciones de movimiento serán:
∂H ∂H
q̇ν = ; ṗ = − ; ν = 1, 2, ...l (4.35)
∂pν ∂qν
La transformación de Legendre inversa es (p) → (q̇) y está generada por H:
∂H(q, p, t)
q̇ν = ; ν = 1, 2, ...l (4.36)
∂pν
El generador de la transformación (q̇) → (p) es L:
l
X
L(q, q̇, t) = q̇ν pν − H(q, p, t) (4.37)
ν=1
90 / Mecánica clásica avanzada
Ejemplo 4.1.3 Hallar las ecuaciones de movimiento correspondientes a las variables (p),
(ṗ) y t obtenidas mediante una transformación de Legendre.
Entonces las ecuaciones de movimiento lagrangianas para las variables (p) y (ṗ)
son:
∂L′ (p, ṗ, t) d ∂L′ (p, ṗ, t)
− = 0; ν = 1, 2, ...l (4.48)
∂pν dt ∂ ṗν
Esta es la representación de momentos, que nos dice que mediante las variables
(p), (ṗ) es posible describir completamente el sistema.
1 2 k
L=T −V = mṙ + (4.49)
2 r
El sistema, para ~l dado, tiene en esencia dos grados de libertad, luego hay dos
ecuaciones de Lagrange:
k
mr̈ − mrφ̇ + =0 y mr2 φ̇ = constante (4.51)
r2
Como ~l vale:
~l = m~r × ~r˙ = mr2 φ̇k̂ (4.52)
donde k̂ es un vector unitario normal al plano del movimiento, se sigue de (4.51) y (4.52)
que:
l2 k
mr̈ − + 2 =0 (4.53)
mr3 r
La anterior es una ecuación que permite hallar a r(t) para l dado. Una vez conocido
r(t), tenemos que φ(t) se determina al integrar:
l
φ̇ = (4.54)
mr2
Para pasar al formalismo hamiltoniano partimos de las fórmulas de transformación:
∂L ∂L
pr = = mṙ ; pφ = = mr2 φ̇ = l = constante (4.55)
∂ ṙ ∂ φ̇
92 / Mecánica clásica avanzada
El hamiltoniano será:
H(r, φ, pr , pφ ) = pr ṙ + pφ φ̇ − L =
! (4.56)
p2r p2φ 1 p2r 2
p2φ k
+ 2 − m + r −
m r 2 m2 m2 r 4 r
Con lo cual:
p2r p2φ k
H= + − =T +V (4.57)
2m 2mr2 r
Las ecuaciones de Hamilton serán:
∂H pr ∂H p2φ k
ṙ = − = ; ṗr = − =− 3 + 2
∂pr m ∂r mr r
(4.58)
∂H pφ ∂H
φ̇ = = ; ṗφ = − =0
∂pφ mr2 ∂φ
Las ecuaciones (4.58) de la izquierda no son más que las ecuaciones de la trans-
formación inversa a (4.55). Al reemplazar éstas en las ecuaciones (4.58) de la derecha,
se obtienen las ecuaciones (4.51), como es de esperarse. Es decir, el formalismo hamil-
toniano no aporta nada nuevo en cuanto a las ecuaciones de movimiento se refiere.
Notamos que φ es cı́clica tanto en L como en H. En consecuencia pφ se conserva.
H presenta las mismas simetrı́as que L y por tanto tiene los mismos teoremas de con-
servación.
Ejemplo 4.1.5 Hallar el hamiltoniano y las ecuaciones de movimiento para una partı́cula
en un sistema de coordenadas que rota uniformemente con velocidad angular ~ω .
En el sistema de ejes espaciales:
1
L ~r, ~r˙ = m~r˙2 − V (~r) (4.59)
2
Si instantáneamente coinciden los ejes espaciales y los ejes rotantes, se cumple que:
~r = ~r
(4.60)
~r˙ = ~r˙ + ~
ω × ~r
donde ~r es el vector de posición de la partı́cula respecto a los ejes rotantes y ~r˙ su velocidad
en esos ejes. Entonces usando la transformación (4.60), (4.59) tomará la forma:
1 2 2
~ ˙
~ ˙
~ ~˙ ~
L r, r = m r + 2r · ~ω × r + ~ω × r ~ − V ~r (4.61)
2
Las componentes del momento canónico son:
∂L
px = ... (4.62)
∂ ẋ
La formulación hamiltoniana / 93
O vectorialmente:
~p = ∂L = m ~r˙ + ~
ω × ~r (4.63)
∂~r˙
La velocidad expresada en términos del momento es:
~
~r˙ = p − ~
ω × ~r (4.64)
m
El lagrangiano (4.61) en términos de las variables hamiltonianas es:
1 p2
L ~r, ~p = − V ~r (4.65)
2m
El hamiltoniano será:
!
X ~p 1 p2
H ~r, ~p = pν q̇ ν − L = ~p · − ~ω × ~r − + V ~r (4.66)
ν
m 2m
Con lo cual:
1 p2 ~
H= ω × ~r + V ~r
−p· ~ (4.67)
2m
˙ H es:
En términos de ~r y ~r,
1 ~˙ 2 1 2
h= ω × ~r + V ~r
mr − m ~ (4.68)
2 2
Nótese que el hamiltoniano correspondiente a L(~r, ~r˙ ) difiere de h por el término
m(~ω × ~r)2 /2. Comparando las ecuaciones (4.61) y (4.68) vemos que h no es T + V . De
acuerdo con (3.124), h es T + V sólo si T es función cuadrática de las velocidades, en
tanto que en este caso hay en T términos de las formas T1 y T0 .
1 2
T2 = mṙ
2
T1 = m~r˙ · (~
ω × ~r ) (4.69)
1
T0 = ω × ~r)2
m(~
2
h es una constante de movimiento porque L no depende del tiempo y no hay fuerzas
disipativas, pero E = T + V no es constante de movimiento. De acuerdo con (3.126):
Vemos que T1 + 2T0 actúan como un trabajo sobre el sistema que hace que E no
sea constante. Esto es debido a la rotación del sistema de coordenadas. Sucede que en
este caso la transformación ~r → ~r depende del tiempo debido a la rotación, con lo cual
la transformación es de tipo reónomo. T1 + 2T0 es un potencial “ficticio” inercial. T1
94 / Mecánica clásica avanzada
está asociada con la fuerza de Coriolis y T0 con la fuerza centrı́fuga. H puede escribirse
como:
p2
H= ω · ~r × ~p + V ~r
−~ (4.71)
2m
X l
dH dA
= fν q̇ν = (4.79)
dt ν=1
dt
Si además H = T + V = E, se sigue:
dE dA
= (4.80)
dt dt
Si la transformación de coordenadas depende del tiempo explı́citamente, V no
depende de (q̇) y fν = 0,
T = T0 + T1 + T2 (4.81)
con lo cual
H = T2 − T0 + V = E − T1 − 2T0 (4.83)
α2
∂H α β 2 ∂H
m~¨ri = − → m 2 ~¨r i = (4.91)
∂~ri β α ∂~ri
Esta transformación pertenece a la clase de las transformaciones canónicas, o sea
a las transformaciones que no cambian la forma de las ecuaciones canónicas.
La ecuación (4.86) dice que si las longitudes l se cambian por l′ = αl y los tiempos
t por t′ = βt, el sistema tendrá simetrı́a de cambio de escala si α y β son tales que se
cumple (4.89), β = α1−k/2 , o sea si la transformación en longitudes y tiempos cumple:
′ 1−k/2
t′ l
= (4.92)
t l
La ecuación (4.92) permite obtener algunas simples relaciones entre los perı́odos
de oscilación de sistemas periódicos que sólo difieren entre sı́ por sus dimensiones carac-
terı́sticas y para los cuales V sea función homogénea.
Para el péndulo simple, donde el potencial mgz es función homogénea de grado 1:
r
t′ l′
= , (4.93)
t l
como se ve, es general; vale no sólo para pequeñas oscilaciones.
La formulación hamiltoniana / 97
Sea la función:
l
X
L̃(q, p, q̇, ṗ, t) = pν q̇ν − H(p, q, t) (4.97)
ν=1
donde hemos suprimido una constante aditiva. Planteando las ecuaciones de Hamilton
e integrándolas se llega a la solución:
θ = θ0 + at (4.106)
r !
k
z = z0 sen t+δ (4.107)
m
–R
m
–z0 z
z0
–R
y
w=a
diagrama de fases θ̇, θ, es una lı́nea recta, como también la proyección de la trayectoria
de fases sobre el plano θ, pθ .
La proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz , es
una hélice elı́ptica. Esto es representado en la figura 4.2.
pz Ez = cte pθ
pθ = cte
z θ
pθ = mR2a
pz2 1
Ez = + kz 2
zm i2 pθ
pz
pθ = cte
z
Superficie Ez = cte
Figura 4.2 Arriba: diagramas de fases sobre los planos z-pz y θ-pθ respectivamente. Abajo:
Proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz .
(4.111)
δqν (t1 ) = δqν (t2 ) = 0
px / mω
ϕ
x
∂H ∂H ∂r ∂H ∂φ
ṗx = − =− +
∂x ∂r ∂x ∂φ ∂x
(4.120)
∂H x ∂H −px
=− +
∂r r ∂φ mωx2 sec2 φ
Se obtiene entonces para ∂H/∂px y ∂H/∂x:
∂H ∂H senφ ∂H cos φ
= +
∂px ∂r mω ∂φ mωr
(4.121)
∂H ∂H ∂H sen φ
= cos φ −
∂x ∂r ∂φ r
Por otra parte se tiene para ẋ y ṗx :
∂x ∂x
ẋ = ṙ + φ̇ = cos φ ṙ − r senφ φ̇
∂r ∂φ
(4.122)
∂px ∂px
ṗx = ṙ + φ̇ = mω senφ ṙ + mωr cos φ φ̇
∂r ∂φ
o sea que las ecuaciones de Hamilton se transforman en:
∂H senφ ∂H cos φ
cos φ ṙ − r senφ φ̇ = + (4.123)
∂r mω ∂φ mωr
La formulación hamiltoniana / 103
∂H ∂H senφ
mω senφ ṙ + mωr cos φ φ̇ = − cos φ + (4.124)
∂r ∂φ r
Ejemplo 4.4.2 Efectuar una rotación con velocidad angular constante a en el espacio
de fases bidimensional. Mostrar que tal transformación es canónica sólo si al nuevo
hamiltoniano se le adiciona un término. Mostrar que las fórmulas de transformación y
el nuevo hamiltoniano se pueden obtener a partir de las primeras derivadas de cierta
función F (q, q, t). Mostrar que F satisface una ecuación diferencial parcial si se anula el
nuevo hamiltoniano, lo cual es posible para un oscilador armónico.
La formulación hamiltoniana / 105
Si F es la función de q, q y t siguiente:
2qq − (q 2 + q 2 ) cos at
F (q, q, t) = c (4.143)
2 sen at
Comparando a (4.142) y (4.143) vemos que:
∂F (q, q, t) ∂F (q, q, t)
p= ; p=− (4.144)
∂q ∂q
Como las ecuaciones (4.144) son completamente equivalentes a las ecuaciones de
transformación (4.136), se dice que F es la función generatriz de la transformación, que
será canónica solamente si el nuevo hamiltoniano es:
∂F
H =H+ (4.145)
∂t
puesto que,
∂F (q, q, t) −2qq cos at + q 2 + q 2 ca 2 p2
= ca 2
= q + 2 (4.146)
∂t 2 sen at 2 c
Los anteriores resultados valen para cualquier sistema de un grado de libertad.
Para un oscilador armónico encontramos que:
p2 k 2 1 c2
H[q(q, p), p(q, p)] = + q + − k q 2 sen2 at
2m 2 2 m
(4.147)
c k p2 k 1
+ − q p sen at cos at + − sen2 at
m c 2 c2 m
Si escogemos el valor de c tal que:
c2 = km (4.148)
Obtenemos que:
q2 k a p2
H(q, p) = + q 2 + ( + cq 2 ) (4.149)
2m 2 2 c
H será cero solamente si a y c cumplen:
1 a
+ = 0; k + ac = 0 (4.150)
m c
Es decir, si a =√
−c/m = −k/c, valor que es compatible con el valor de c dado por
(4.148). Como c = ± km, a debe valer:
r
k
a=± (4.151)
m
Tomamos negativo
p el valor de c para que a sea positiva y coincida con la frecuencia
del oscilador ω = k/m. Notamos que H = 0 implica que q y p son constantes, o sea
que las fórmulas (4.136) nos dan directamente la solución en términos de q y p que se
La formulación hamiltoniana / 107
determinan por las condiciones iniciales de q y p.2 Es simple verificar que F satisface la
ecuación diferencial llamada de Hamilton-Jacobi para el oscilador armónico:
2
1 ∂F 1 ∂F
+ kq 2 + =0 (4.152)
2m ∂q 2 ∂t
en el espacio fásico (véase figura 4.3), rota en el sentido de las agujas del reloj con velocidad angular ω,
con las coordenadas q y q se verá el punto estacionario. H describe pues, un problema de equilibrio.
108 / Mecánica clásica avanzada
Este ejemplo, al igual que los dos anteriores, ilustra el hecho de que el carácter
canónico de una transformación es algo inherente a la transformación misma, indepen-
dientemente de la forma del hamiltoniano, en particular, independientemente de sus
propiedades de simetrı́a. Por esto cualquier sistema de l grados de libertad posee ecua-
ciones de movimiento covariantes bajo la transformación (4.153), aunque solamente si el
potencial es función homogénea de las coordenadas el sistema posee simetrı́a de seme-
janza mecánica, ecuación (4.92). Ası́ mismo las transformaciones (4.115) y (4.116), no
canónicas, y (4.134), canónica, pueden hacerse sin referencia alguna a la forma del hamil-
toniano. Sin embargo, para un hamiltoniano dado, sólo cierta transformación canónica
permite obtener un nuevo hamiltoniano de forma simple. Ası́, para un oscilador armónico
lineal la transformación canónica (4.134) conduce a que H = ωp, o sea a que φ sea cı́clica
en H. Sin embargo (4.134) es aplicable a cualquier sistema de un grado de libertad. De
forma similar (4.136) conduce a H = 0 para el oscilador.
Ejemplo 4.5.2 Mostrar que es canónica la transformación:
q ν = αpν ; pν = βqν ; α 6= 0 , β 6= 0 ; ν = 1, 2, ...l (4.157)
En este caso:
H = −αβH (4.158)
En particular, la transformación con α = 1, β = −1:
q ν = pν ; pν = −qν ; ν = 1, 2, ...l, (4.159)
es canónica con H = H.
Este ejemplo muestra que las nociones de “coordenada” y “momento” pierden su
sentido inicial, pues mediante una transformación canónica (T.C.) es posible hacer que
los momentos pasen a hacer el papel de coordenadas y viceversa.
Como en general q ν = q ν (q, p, t) y pν = pν (q, p, t), con las fórmulas inversas
qν = qν (q, p, t); pν = pν (q, p, t), se ve que se requieren tanto (q) como (p) para po-
der especificar la posición del sistema en el espacio de configuración. (q) y (p) no son
pues “coordenadas” y “momentos” generalizados, sino simplemente pares de cantidades
canónicamente conjugadas. En conclusión, en el espacio de fases el estado del sistema
se especifica mediante un conjunto completo (de 2l) de cantidades canónicamente con-
jugadas.
En (4.169) está implı́cito que (q) y (q) son independientes. Por lo tanto las fórmulas
de la transformación canónica serán:
∂F1
pν = = −q ν ⇒ q ν = −pν ; ν = 1, 2, ...l (4.170)
∂qν
∂F1
pν = − = qν ⇒ pν = qν ; ν = 1, 2, ...l (4.171)
∂qν
Es esencialmente la misma transformación (4.159), que intercambia coordenadas y
momentos. Este ejemplo muestra que cada función de (q, q, t) define una transformación
canónica
Ejemplo 4.6.2 Probar que la transformación canónica (4.134) es libre de la primera clase.
Hallar la correspondiente función F1 .
Sea q = x y p = px . Las fórmulas de transformación serán entonces:
r
2p p
q= cos q ; p = − 2mωp sen q (4.172)
mω
1 p2 p
p = mω x2 + 2 2 ; q = −tan−1 (4.173)
2 m ω mωq
El jacobiano (4.164) es trivial y diferente de cero:
q ∂q
J = 6= 0 (4.174)
p ∂p
O sea que la transformación es libre de la primera clase y puede ser generada por
cierta función de las variables independientes q y q. La transformación no depende del
tiempo, pues suponemos a m y a ω constantes. Notamos de (4.174) que toda transforma-
ción canónica no puntual es libre de primera clase para sistemas de un grado de libertad.
F1 (q, q, t) ha de ser tal que, de acuerdo con (4.163):
1 p2
dF1 = p dq − pdq = p dq − mω q 2 + 2 2 dq (4.175)
2 m ω
3 La función del ejemplo 4.4.2, (4.143), es la función generatriz de la transformación canónica (4.136).
La formulación hamiltoniana / 111
∂F1 ∂F1 1
= −mωq tan q ; = − mωq 2 sec2 q (4.179)
∂q ∂q 2
O sea que:
1
p = −mωq tan q ; p= mωq 2 sec2 q (4.180)
2
Al despejar en (4.180) a p y q obtenemos a (4.170), y al despejar a p y q obtenemos
a (4.173). Notemos que −Et − mωq 2 tan q/2 es una solución a la ecuación de Hamilton-
Jacobi (4.152).
p2
H= − aq (4.181)
2m
donde m y a son constantes. Hallar la T.C. que lleva al hamiltoniano:
H=0 (4.182)
Si no hay fuerzas disipativas y las ecuaciones que definen las coordenadas genera-
lizadas no dependen del tiempo, H se conserva, H = H 0 , luego:
t
X l Xl Xl
0 0
dF = pν dqν − pν dqν = − pν dqν (4.199)
ν=1 ν=1 ν=1 t0
Z tX l
∂L d ∂L d ∂L
= δqν + δqν − δqν dt (4.201)
t0 ν=1 ∂qν dt ∂ q̇ν dt ∂ q̇ν
Xl
t Z t "X
l #
∂L ∂L d ∂L
= δqν + − δqν dt
ν=1 ∂ q̇ν t0 t0 ν=1 ∂qν dt ∂ q˙ν
Si asumimos que la trayectoria es real, se cumplen sobre ella las ecuaciones de
Lagrange, luego:
t t
X l
∂L l
X
δS = δqν = pν δqν (4.202)
∂ q̇ν t0
ν=1 ν=1 t0
Ejemplo 4.8.1 Analizar un oscilador armónico lineal cuando sólo se conoce exactamente
su energı́a.
Mediante la transformación canónica (4.172), la dinámica del oscilador está descrita
por:
r
2p p
q= cos q ; p=− 2mωp senq ; H = ωp = E (4.204)
mω
Las ecuaciones canónicas en las variables (q, p) tienen la solución:
E
q = ωt + δ ; p= = constante (4.205)
ω
donde δ es una constante arbitraria. La otra constante arbitraria es E. O sea que dados
E y δ queda determinado completamente el estado de movimiento:
r
2E
q(E, δ, t) = cos (ωt + δ)
mω 2 (4.206)
√
p(E, δ, T ) = − 2mE sen(ωt + δ)
p / mω
t>0
r
δ q
(2E / mω 2 ) 1/2
t=0
Figura 4.4 Espacio de fases del oscilador armónico lineal para E conocida
Conjunto estadı́stico. Es una noción útil en los casos donde hay 2l−7 constantes
de movimiento no determinadas. Consiste en un conjunto de sistemas iguales (el mismo
número de grados de libertad, la misma clase de partı́culas y de interacciones, las mismas
ligaduras y los mismos valores de las constantes de movimiento aditivas).
Es decir, dos sistemas de un conjunto estadı́stico sólo pueden diferir por los valores
de las 2l − 7 constantes no aditivas. Se considera que el número de sistemas es muy
grande, de modo que es una muestra estadı́sticamente representativa de la distribución
de los valores de las 2l − 7 constantes indeterminadas. En cada instante del tiempo, el
estado de cada sistema del conjunto será representado por un punto del espacio fásico,
y su estado de movimiento por una trayectoria de fases. El conjunto estadı́stico de siste-
mas de l grados de libertad estará representado en cada instante por un “enjambre” de
puntos del espacio fásico. Como los sistemas del conjunto estadı́stico no interactúan, ca-
da punto se mueve independientemente de los demás en el espacio fásico 2l-dimensional.5
cuenta que asociadas a la posición del centro de masa de un sistema libre hay tres constantes; quedarı́an
en ese caso 6N − 10 constantes no determinadas.
5 Un conjunto estadı́stico tiene analogı́a con los “ensambles” que mencionamos en la sección 2.3.
La formulación hamiltoniana / 117
donde la integral abarca todo el espacio de fases. Matemáticamente el teorema dice que:
l
dρ X ∂ρ ∂ρ ∂ρ
ρ̇ = 0 o = q̇ν + ṗν + =0 (4.211)
dt ν=1
∂qν ∂ ṗν ∂t
E + dE
t
t + dt
dp
E pdt
(q,p)
dq
q
qdt
Figura 4.5 Espacio fásico. Región accesible definida por las lı́neas E = constante y E +∆E =
constante.
será igual a:
O sea que el número de puntos que entran a dΓ por unidad de tiempo es:
Para hallar los puntos que salen, debemos considerar los que se mueven dentro de
dΓ hacia las caras derecha y superior y que las alcanzarán en el tiempo dt. Esto se puede
obtener de (4.215) mediante una expansión de Taylor alrededor de (q, p), para hallar
(4.215) en (q + dq, p + dp):
Ejemplo 4.8.3 Sea un conjunto de cuatro partı́culas iguales que se lanzan hacia arriba
en un campo gravitacional uniforme, con las siguientes condiciones iniciales:
p20 p20
E1 = + mgz0 ; E2 = + mg(z0 + ∆z0 )
2m 2m
(p0 + ∆p0 )2
E3 = + mgz0 (4.230)
2m
(p0 + ∆p0 )2
E4 = + mg(z0 + ∆z0 )
2m
Asumiendo positivos a ∆p0 y ∆z0 , vemos que:
Además, para precisar, asumamos que ∆p0 y ∆z0 son tales que E3 > E2 , de modo
que:
De modo que:
p0 1 p0 1
z1 = z0 + t − gt2 ; z2 = z0 + ∆z0 + t − gt2
m 2 m 2
∆p0
Pz1 = pz2 = p < p0 ; z3 = z1 + t
m
z1 = z
Dicha región se mueve distorsionándose pero sin cambiar el valor del área. El
resultado es el mismo en el caso en que dentro del área en mención haya un número
arbitrario de puntos: el área de la región limitada por las lı́neas 1 − 2, 2 − 4, 3 − 4 y 1 − 3
permanecerı́a constante y todos los puntos quedarı́an dentro. La densidad de puntos en
el espacio de fases también es una constante; en este caso.
4
= constante (4.237)
∆z0 ∆p0
De haber inicialmente en el centro del rectángulo una quinta partı́cula, esta per-
manecerı́a en el centro del cuadrilátero en t > 0.
La figura 4.7 muestra las trayectorias de fase.
Ejemplo 4.8.4 Sea una partı́cula que se lanza hacia arriba en presencia de un campo
gravitacional uniforme. Sus condiciones iniciales se conocen con cierta indeterminación:
122 / Mecánica clásica avanzada
pz
p0 + ∆p0 3 4
∆p0t / m
p0
1 2
p + ∆p0 3 4
p
1 2
z0 z0 + ∆z0 z z + ∆z0 z
pz
3 4
p0 + ∆p0
1 2
p0
z0 z0 + ∆z0
2
1
4
1 3
2
3
4
Figura 4.7 Trayectorias de fase. Caso en que dentro del área hay un número arbitrario de
puntos
∆z0 ∆p0
z(0) = z0 ± ; pz (0) = p0 ± (4.238)
2 2
Es decir, se sabe que en t = 0 la partı́cula está en un rectángulo de área ∆z0 ∆p0
en el espacio de fases. Analizar la evolución de la partı́cula.
Basta considerar el movimiento de la partı́cula en los valores extremos de las con-
diciones iniciales (z0 − ∆z0 /2 , p0 − ∆p0 /2 ; z0 − ∆z0 /2 , p0 + ∆p0 /2 ; z0 + ∆z0 /2 , p0 −
La formulación hamiltoniana / 123
∆p0 /2 ; z0 + ∆z0 /2 , p0 + ∆p0 /2), que coinciden con las condiciones iniciales (4.227)
del ejemplo anterior, cambiando z0 por z0 + ∆z0 /2 y p0 por p0 + ∆p0 /2. Se concluye
inmediatamente que para una partı́cula se cumple:
∆z(t) ∆pz (t) = ∆z(0) ∆pz (0) = constante = ∆z0 ∆p0 (4.239)
Para un valor dado de esta constante, si se reduce la indeterminación en z, se
aumenta la indeterminación en ∆pz y viceversa. Clásicamente no hay lı́mite al valor más
pequeño que puede tomar la constante ∆p0 ∆z0 . Cuánticamente no puede ser menor que
h̄/2, donde h̄ es la constante de Planck, luego:
h̄
∆z ∆pz ≥ (4.240)
2
La ecuación (4.240) se denomina la desigualdad de Heisenberg.
El resultado (4.239) es válido en general, de acuerdo con el teorema de Liouville.
La proyección del volumen del espacio fásico dentro del cual inicialmente se en-
cuentra la partı́cula, ∆Γ0 = ∆p10 ∆q10 ∆p20 ∆q20 ...∆pl0 ∆ql0 , sobre el plano qν − pν ,
tiene un área ∆pν0 ∆qν0 . Se tiene entonces que:
125
126 / Mecánica clásica avanzada
∂L ∂L ~˙
p=
~ = µ~r˙ ; P~ = = MR (5.7)
∂~r˙ ˙
~
∂R
Entonces el hamiltoniano del sistema será:
P~2 p~2
H= + + V (r) (5.8)
2M 2µ
H es una constante de movimiento, ası́ como por separado lo son la energı́a del
centro de masa y la de la partı́cula de masa reducida.
La energı́a total de las dos partı́culas en el sistema de referencia del centro de masa
es:
1 2 1 2 1 2
Ec = m1~r˙ 1c + m2~r˙ 2c + V (r) = µ~r˙ + V (r) (5.11)
2 2 2
y el momento angular respecto al centro de masa:
~ c = ~r1c × m1~r˙ 1c + ~r2c × m2~r˙ 2c = µ~r × ~r˙
L (5.12)
1
r1c
r2c
r1
2
R
r2
Se ve que la energı́a total en el sistema del centro de masa coincide con la energı́a total
de la partı́cula de masa reducida, y el movimiento angular total coincide con el momento
angular de la partı́cula de masa reducida.
El momento angular total en el sistema de referencia del laboratorio es:
~ = ~r1 × m1~r˙ 1 + ~r2 × (m2~r˙ 2 ) = M R
L ~˙ + µ~r × ~r˙
~ ×R (5.13)
vemos que es igual al momento angular del centro de masa más el momento angular
respecto al sistema de referencia del centro de masa. Finalmente podemos afirmar que
los aspectos no triviales del problema están en el movimiento de la partı́cula de masa
reducida.
êϕ êΦ
êr
Θ
y
ϕ
êΦ
5.2). No hay ninguna razón fı́sica para suponer dónde está el origen de ese sistema de
coordenadas. Si queremos podemos colocarlo en el centro de masa o, como se propuso
antes, en la posición de la partı́cula 1. Las componentes de ~r y ~r˙ es conveniente expre-
sarlas en coordenadas esféricas; esto es simple mediante las fórmulas de transformación
entre vectores unitarios:
éstos son dos conjuntos ortonormales de vectores de base (véase figura 5.2). Entonces ~r
y ~r˙ tienen las siguientes expresiones:
lz = µr2 sen2 θ φ̇
Los otros momentos canónicos conjugados son:
∂L ∂L
pr = = µṙ ; pθ = = µr2 θ̇ (5.21)
∂ ṙ ∂ θ̇
pr y pθ no son constantes de movimiento. Podemos expresar las componentes de ~l,
(5.19) y (5.20), en función de los momentos canónicos:
pφ p2φ
lθ = pθ ; lφ = ; l2 = p2θ + (5.22)
senθ sen2 θ
lx = −pθ senφ − pφ cot θ cos φ
lz = pφ
Las fórmulas (5.34) y (5.35), recordemos, valen si se eligen las coordenadas de modo
que el eje z coincide con la dirección de ~l. Para una elección general de las coordenadas,
las expresiones para hallar la ecuación de la órbita y la dependencia temporal de θ
y φ resultan más complicadas: estas fórmulas las consideramos más adelante usando
el formalismo de Hamilton-Jacobi. La fórmula (5.33) no depende de la elección de las
coordenadas.
Hallemos ahora la llamada ecuación diferencial de la órbita. Es una ecuación dife-
rencial para r en función de φ. Se halla a partir de (5.34) y de:
l dυ l2 2 d2 υ 1
ṙ = − ; r̈ = − υ ; donde υ = (5.37)
µ dφ µ2 dφ2 r
Con la ayuda de (5.37), la ecuación (5.32) se transforma en la ecuación diferencial
de la órbita:
d2 υ µ F (υ)
=− 2 2 , (5.38)
dφ2 l υ
donde F (υ) = f (1/υ). Esta ecuación permite, dada f (r) hallar a r(φ), y dada r(φ) hallar
a f (r).
132 / Mecánica clásica avanzada
∆α
rmáx
rmín
x2 y2 xy
2
+ 2 +2 ∆ω t = 1 (5.43)
Ax Ay Ax Ay
que es la ecuación de una elipse con el eje mayor rotado. La ecuación (5.43) puede
escribirse como una forma cuadrática no diagonal:
A2y Ax Ay ∆ω t x
(x, y) = A2x A2y (5.44)
2 y
Ax Ay ∆ω t Ax
Ejemplo 5.1.2 Hallar para qué valores del momento angular es posible que sea acotado
el movimiento en presencia del potencial:
A l2
V (r) = − e−αr (5.48)
r 2µr2
Aα −αr Ae−αr l2
e + − =0 (5.50)
r r2 µr3
Si llamamos x = αr, entonces (5.50) se puede llevar a la forma:
αl2
(x2 + x)e−x = (5.51)
µA
Hay solución solamente si la curva f (x) = (x2 + x)e−x corta a la recta αl2 /(µA)
(véase figura 5.5), esto es, si:
αl2
f (x0 ) > (5.52)
µA
donde x0 es la posición en la cual f (x) tiene un máximo. f ′ (x) = 0 si:
x2 − x − 1 = 0 (5.53)
Vef
l2
2µr2
E
1/α
r
–Ae–αr/r
Figura 5.4 Energı́a potencial efectiva Vef componente de los potenciales centrı́fugo y de
Yukawa
Entonces:
√ 1+√5
f (x0 ) = 2 + 5 e− 2 ≈ 0,84 (5.55)
′
Hay solución a Vef (r) = 0 sólo si:
αl2
0, 84 > (5.56)
µA
Si (5.48) se usa para describir la interacción nuclear, por ejemplo entre un neutrón
y un protón, habrá resonancias, o sea estados ligados de energı́a positiva, si se cumple la
condición (5.56). El momento angular l = 0 presenta estados ligados pero no resonancias.
Puede haber resonancias sólo si:
µA
0, 84 > h̄2 (5.57)
α
La barrera que se forma en Vef se llama “barrera centrı́fuga”. Se entiende por
resonancia (“de forma”) el efecto túnel que se produce cuando la partı́cula viene desde
r → ∞ y atraviesa la barrera quedando atrapada por el pozo de potencial durante cierto
tiempo. Este proceso no es clásicamente posible.
136 / Mecánica clásica avanzada
αl 2
µA
f(x)
x0
E
l=− senδ ; E = µA2 ω 2 (5.65)
ω
Entonces la excentricidad y el semieje mayor tienen la siguiente expresión en térmi-
nos de E y l:
s
kl2 s
2 1− 2
µE 1E 2
kl
E2 = s ; a2 = 1+ 1− 2
(5.66)
kl 2 2 k µE
1+
µE
Entonces llegamos a:
B2
r2 = (5.70)
1 − e sen2(φ − φ0 + β0 )
donde B, e y β0 son:
s s l2
r02 −
l2 kl2 µk
B= ; e= 1− ; 2β0 = arcsen (5.71)
µE µE 2 r02 e
La ecuación de la elipse centrada y no rotada en coordenadas polares es:
b2
r2 = (5.72)
1 − cos2 φ
ǫ2
Si se rota 45◦ toma la forma:
b2 b2 /(1 − ǫ2 /2)
r2 = = (5.73)
φ ǫ2
1 − ǫ2 cos2 (φ − ) 1− sen2φ
4 2 − ǫ2
Las ecuaciones (5.70) y (5.73) coinciden si:
b2 ǫ2
β0 = φ0 ; B2 = 2 ; e= (5.74)
ǫ 2 − ǫ2
1−
2
Las ecuaciones (5.71) y (5.74) conducen a los valores hallados en (5.66) para los paráme-
tros de la elipse en función de las constantes de movimiento. La órbita es una elipse y
el centro de la misma coincide con el centro de fuerza.
Cálculo de la variación temporal del radio. Para hacer este cálculo usamos
la ecuación (5.33):
Z r
dr
t − t0 = s (5.75)
r0 2 1 2 l2
E − kr − 2 2
µ 2 µ r
Vemos que:
l l
rmax = a = p ; rmin = b = p (5.77)
µE(1 − e) µE(1 + e)
Esto nos permite escribir la expresión bajo el signo de raı́z cuadrada en (5.75)
como:
r Z r
µ rdr
t − t0 = p (5.78)
k r0 (a − r2 )(r2 − b2 )
2
r r−2
1 µ (a2 + b2 )ρ − 2 0
t = t0 = arcsen (5.80)
2 k ρ(a2 − b2 ) r−2
a2 + b 2 a2 − b 2 E
r2 = + sen2ω(t − t0 ) = [1 + e sen2ω(t − t0 )] (5.81)
2 2 k
l no puede ser arbitrario, está restringido al rango:
E
0≤l≤ (5.82)
ω
La ecuación (5.82) corresponde al comportamiento cuántico, haciendo la corres-
pondencia con los números cuánticos l → lh̄ y E = nh̄ω, donde los valores permitidos
del número cuántico orbital l son: 0 ≤ l ≤ n; o sea l = 0, 1, 2, ...n.
Cuando l = E/ω, e =p 0 y ǫ = 0, la órbita es circular pues según (5.81) el radio de
la órbita es constante: r = E/k.
Cuando l = 0, e = 1 y ǫ = 1, la órbita es rectilı́nea. Según (5.81) la variación
temporal del radio será de forma pendular, con frecuencia ω y no 2ω como cuando
e 6= 1:
r
2E π
r= cos ω(t − t0 − ) (5.83)
k 4ω
Para hallar a r(t) a partir de (5.81) se requiere realizar una expansión en serie infi-
nita. Para l 6= 0 y diferente de un máximo valor, r(t) contiene la frecuencia fundamental
2ω y todos sus armónicos.
140 / Mecánica clásica avanzada
Cuál de los signos corresponde a rmin o rmax depende del signo de k y del signo
de E.3 Si rmax es finito, el movimiento será ligado.
Por otra parte, de (5.85) vemos que:
l2 /µk
rmin, max = (5.88)
1±ǫ
Comparando a (5.88) con (5.87) hallamos que:
s
2El2
ǫ= 1+ (5.89)
µk 2
Las secciones cónicas. Son las curvas que definen la intersección de un cono con
un plano. Sobre el plano una curva cónica es el lugar geométrico de los puntos cuya
3 En estos puntos cambia el signo de la velocidad radial. Además, para E ≥ 0, según veremos, sólo
existe un punto de retorno.
Movimiento de dos partı́culas que interactúan ... / 141
distancia a un punto dado llamado foco es proporcional a la distancia a una lı́nea dada,
la directriz. Si tomamos el origen del sistema de coordenadas polares en el foco y S es
la distancia del foco a la directriz (véase figura 5.6), se sigue de la definición, llamando
ǫ a la constante de proporcionalidad:
r = ǫ [S − r cos (φ − φ0 )] (5.90)
• Directriz
φ
φ0
x
Foco
ǫ debe ser positivo por ser la relación entre dos distancias. Se sigue de (5.90):
ǫS
= 1 + ǫ cos (φ − φ0 ) , ǫ>0 (5.91)
r
La curva es simétrica respecto a la lı́nea φ = φ0 . La longitud ǫS se llama parámetro
de la sección cónica y ǫ se llama excentricidad. Hay distintos tipos de secciones cónicas
dependiendo del valor de ǫ.
Si ǫ = 1, se obtiene la parábola, es decir, el lugar geométrico de los puntos equi-
distantes del foco y de la directriz. El punto de máximo acercamiento al foco se llama
vértice y está situado a una distancia S/2, en tanto que la máxima distancia es infinita:
1
rmin = S; rmax = ∞; ǫ = 1 (5.92)
2
Si ǫ < 1, se obtiene una elipse: curva con dos directrices y dos focos. Hay en este
caso dos distancias absidales finitas:
ǫS ǫS
rmin = ; rmax = ; ǫ<1 (5.93)
1+ǫ 1−ǫ
El promedio entre rmax y rmin lo llamaremos a, de modo que:
1 − ǫ2
S=a ; ǫS = a(1 − ǫ2 ) (5.94)
ǫ
142 / Mecánica clásica avanzada
a(1 − ǫ2 )
r= (5.95)
1 + ǫ cos (φ − φ0 )
ε=1
S/2
S )φ0
F
D2
S
ε<1
D1 εS ) φ0
•
εa F2
S
F1
a /ε
Si ǫ > 1, la cónica es una hipérbola: curva de dos ramas con sus correspondientes
focos, directrices y ası́ntotas. De la definición (5.90) se sigue la siguiente ecuación para
la rama 2, respecto al origen de coordenadas mostrado, la cual es consistente con (5.85)
Movimiento de dos partı́culas que interactúan ... / 143
2 ε<1
D2
εS
D1 )φ0
F2
a S
a/ε
aε
1 F1
1 l2
rmin = S= ⇒ l 6= 0 (5.103)
2 2µk
Este caso se presenta cuando la partı́cula parte del reposo desde el infinito.
Si E < 0, entonces ǫ < 1. En este caso:
s
2|E|l2
ǫ= 1− <1 (5.104)
µk 2
Para ǫ < 1 la trayectoria es una elipse rotada en un ángulo φ0 y con semiejes mayor
y menor dados por:
k p l
a= ; b=a 1 − ǫ2 = p (5.109)
2|E| 2µ|E|
respectivamente. Vemos que b está comprendido, dependiendo de l, entre:
0≤b≤a (5.110)
Vef
r mín k<0 r
Vef
r mín r
k > 0, E > 0
Vef
E
rmín r
k > 0, E = 0
Como para los planetas del sistema solar m ≪ M , se sigue que τ ∝ a3/2 , que es el
contenido de la tercera ley de Kepler, la cual como se ve, es un resultado aproximado.
Movimiento de dos partı́culas que interactúan ... / 147
y
R
P
M r
ψ φ x
ψ es el ángulo del vector de posición del punto Q, tomando como origen el centro
de la elipse. R es un punto que gira uniformemente sobre una circunferencia de radio a,
con velocidad angular 2π/τ . φ y M sirven para describir la posición del punto p (véase el
texto de Marion, Classical dynamics of particles and systems, segunda edición, sección
8,8). Expresando a (5.117) en función de (5.118) obtenemos:
donde Jn son las funciones de Bessel de orden entero. Entonces la expresión para r(t)
es:
( "
r(t) = a 1 − ǫ cos 2πν(t + δ)+
∞
#)
X sen{2πnν(t + δ)}
2 Jn (nǫ) (5.121)
n=1
n
Precesión de las órbitas elı́pticas. Vimos que, bajo fuerzas centrales, las órbitas
son simétricas respecto a cualquier ábside, por lo tanto el ángulo entre cualquier par de
lı́neas absidales consecutivas es el mismo. En el problema de Kepler (k > 0, E < 0),
150 / Mecánica clásica avanzada
las órbitas son cerradas, o sea que el ángulo de precesión de los ábsides es cero. En
el movimiento planetario, por ejemplo, hay efectos “perturbadores”, que hacen que el
potencial no sea exactamente de la forma −k/r, aunque lo sea aproximadamente.
Para el movimiento de la luna alrededor de la tierra, además de la interacción
gravitacional entre estos dos cuerpos tomados como masas puntuales, hay efectos adi-
cionales como una fuerza externa no central debida al campo gravitacional homogéneo
producido por el sol sobre la órbita de la luna; esto se traduce en pequeñas oscilaciones
del plano de la órbita. La tierra y la luna no son masas puntuales y por ello la interacción
del tipo −k/r es sólo el primer término en una expansión multipolar, que dependerá de
la distribución de masa de los cuerpos; la parte central de esta interacción dará lugar
a la precesión de la órbita, o sea al giro del semieje mayor de la elipse, y la parte no
central da lugar a movimientos giroscópicos de la tierra y la luna.
En el caso de Mercurio hay efectos de precesión de su órbita debidos al efecto
combinado de todos los demás cuerpos del sistema solar y efectos residuales que sólo son
explicados por la teorı́a general de la relatividad.
Ejemplo 5.3.2 Analizar la precesión de la órbita de una partı́cula que se mueve en pre-
sencia del potencial:
k C C
V =− + 2; ≪1 (5.130)
r 2r ka
γ =2
γ =3
γ=5
γ = 1,33
que es función de las variables de estado, H(q, p); para cada estado de movimiento (q, p),
H tendrá un valor definido. Si se toman q(t) y p(t) no de la solución exacta sino de una
aproximada, el valor de H siempre será en promedio mayor que el que tendrı́a tomando
para q(t), p(t), sus valores exactos. Este método está relacionado con el método varia-
cional usado en mecánica cuántica para hallar la energı́a del estado base de un sistema
usando funciones de onda de ensayo.
Veamos cómo trabaja por medio de un ejemplo.
Consideremos un átomo de litio y tratemos de hallar las energı́as del electrón ex-
terno usando la vieja mecánica cuántica. De acuerdo con el modelo de capas del átomo,
el Li consta de dos electrones internos y uno externo. E. Schrödinger en 1921 propuso el
siguiente modelo.4 El resto del átomo –los electrones internos– es reemplazado por una
capa esférica de distribución uniforme de carga negativa, externa a la cual hay entonces
un campo de fuerza coulombiano, correspondiente a una carga positiva +e del núcleo
“apantallado” por dos electrones, y en el interior hay un campo coulombiano, corres-
pondiente a una carga positiva +3e, la del núcleo. Llamemos ρ al radio del cascarón.
Entonces la energı́a potencial en este modelo será:
3e2 2e2
− + r<ρ
V = r ρ (5.137)
2
−e r>ρ
r
4 Véase el texto The mechanics of the atom de Max Born, sección 28.
154 / Mecánica clásica avanzada
ze2
V =− (5.138)
r
donde z será un parámetro variacional que se determina por la condición de que hHi
sea un mı́nimo.
Por simplicidad supondremos que el electrón externo está en un estado s, o sea
que tiene l = 0. Para este caso, según (5.104) la excentricidad será ǫ = 1. Como V es
central, el hamiltoniano es de la forma (5.28), o sea que interviene sólo la coordenada
radial. Usando (5.119) y (5.118) obtenemos, tomando δ = 0:
ψ ψ
r = 2a sen2 ; ṙ = 2πνa cot (5.140)
2 2
La ecuación (5.140) permite ahora expresar a H en términos de la solución de
ensayo ası́:
2 2 2 2 ψ 3e2 2 ψ 2e2
2π mν a cot − csc + r<ρ
2 2a 2 ρ
H= (5.141)
2
2π 2 mν 2 a2 cot2 ψ − e csc2 ψ r>ρ
2 2a 2
El valor medio de H en un perı́odo será, usando la ecuación de Kepler:
Z 1/(2ν) Z π
2 ψ
hHi = 2ν Hdt = Hsen2 dψ (5.142)
0 π 0 2
de (5.151) se sigue que z debe ser positiva. Una vez hallada z de (5.151) se reemplaza
en (5.149) para obtener la energı́a:
"
R n
E= 2
2z(z − 1) 1 −
2n 2
r #
4n z2
+zn(1 − 6n) + 6n + 6z − 2 (5.152)
π n
Los resultados no son muy buenos pero ilustran el método variacional que es usa-
do extensivamente en muchas ramas de la fı́sica; las discrepancias se deben en parte al
modelo –suponer que el potencial es central y dado por (5.137)–, en parte al método
variacional en sı́, y en parte al uso de la aproximación clásica.
incidentes tiene una sección transversal A que es mucho mayor que el área efectiva de
interacción σ = πα2 , las partı́culas se distribuyen al azar sobre el área de la sección
transversal del haz. El haz tiene un número muy grande de partı́culas para permitir
un tratamiento estadı́stico, pero no tan grande como para que una partı́cula del haz
interfiera con otra. Toda partı́cula que se acerque al centro dispersor a una distancia
menor que α es dispersada; la probabilidad a priori de una partı́cula ser dispersada es:
σ
p= ; σ = πα2 (5.153)
A
donde σ se llama sección eficaz total de dispersión y es una medida de la dispersión en
cualquier ángulo. Llamaremos θ al ángulo entre la dirección del haz incidente y la del
movimiento final de una partı́cula dispersada.
Las partı́culas que incidan sobre el blanco con un parámetro de impacto s serán
dispersadas en un ángulo θ; las que incidan con un parámetro de impacto s + ds serán
dispersadas en un ángulo θ + dθ donde dθ es negativo. Todas las partı́culas que incidan
sobre una corona circular de radios s y s + ds serán dispersadas dentro del rango angular
θ y θ + dθ. Todas las partı́culas que incidan sobre el área dσ (área rayada en la figura
5.19) se dispersarán con ángulos entre θ y θ + dθ y φ + dφ. Como suponemos que r ≫ α,
rd θ
A
dσ r
dϕ dϕ
θ θ + dθ
ds
entonces hemos notado que no hay diferencia esencial en suponer que las partı́culas
emergen del centro dispersor en vez del centro del área rayada dσ. Estas partı́culas
serán dispersadas dentro de un ángulo sólido dΩ dado por:
dΩ = senθ dθ dφ (5.154)
La probabilidad de dispersión dentro del ángulo dΩ se expresa en función de la
llamada sección eficaz dσ.
dσ s ds dφ
dp = = (5.155)
A A
Supongamos que la intensidad del haz incidente es I:
∆N
I= (5.156)
A ∆t
158 / Mecánica clásica avanzada
dN (θ)
= Idσ (5.158)
∆t
Ejemplo 5.4.1 Sea una esfera dura de radio a y masa infinita. Sobre ella incide un haz de
partı́culas de masa m y radio b también duras, que se dispersan elásticamente al chocar.
Hallar la sección eficaz diferencial (véase figura 5.20).
a
z
b α
α
θ
Figura 5.20 El haz partı́culas de masa m y radio b incide sobre una esfera de masa infinita
y radio a
Entonces:
1
σ(θ) = (a + b)2 ; σ = π(a + b)2 (5.164)
2
σ(θ) no depende de θ ni de la energı́a. Cuánticamente se halla que σ es cuatro veces
mayor debido a efectos de difracción.
z′e
•
Q
r
Θ
θ / 2 ϕ
O •ze x
v∞
•u S
Entonces:
θ 1 θ
cos φmin = −sen = − ⇒ ǫ = csc (5.169)
2 ǫ 2
Por otra parte ǫ está relacionado con E y l, o sea con υ∞ y con s:
1
l = mυ∞ s ; E = mυ∞ 2 (5.170)
2
Como, según (5.89), ǫ2 = 1 + 2El2 /(mk 2 ), vemos que:
k2 2
s2 = (ǫ − 1) (5.171)
4E 2
De (5.169) y (5.171) se sigue que:
k θ
s= cot (5.172)
2E 2
Reemplazando a (5.172) en (5.161) obtenemos para σ(θ):
2
k θ
σ(θ) = csc4 (5.173)
4E 2
que es la fórmula de Rutherford.5 Como el resultado no depende del signo de k, la
fórmula también es válida cuando el potencial es atractivo.
5 Hallada en 1911. En el tomo I del Berkeley physics course, al final del capı́tulo 15, puede verse el
trabajo original de Rutherford.
Movimiento de dos partı́culas que interactúan ... / 161
v -v m vc M1
m m
x x
c.m. vc
c.m. v=0
Laboratorio: inicial Laboratorio: final
Las energı́as cinéticas totales de acuerdo con lo hallado en (5.11) a (5.13) son:
1 1 2
TL = mυ 2 ; TC = µυ (5.177)
2 2
La energı́a cinética del centro de masa, que es constante, es:
1
TC.M = (M + m)υ 2 (5.178)
2
De modo que si p
~ es el momento lineal relativo, las energı́as cinéticas están conec-
tadas por:
P~ 2 p~2
TL = + = TC.M + Tc (5.179)
2(M + m) 2µ
o sea que en la región asintótica (r → ∞):
µ m
TL = EL ; EC.M = TC.M = EL ; EL = EC (5.180)
M µ
El momento lineal total anterior a la colisión (r → ∞), es igual al momento lineal
total después de la colisión (r → ∞). Usaremos primas para denotar las cantidades en
la región asintótica después de la colisión. En el centro de masa el momento lineal total
es cero, de modo que:
~C = 0 ;
m~υC + M V ′
m~υC ~′ =0
+ MV (5.181)
C
es decir, las magnitudes de los cuatro momentos lineales, incidentes y emergentes, son
iguales, de modo que en el centro de masa cada partı́cula queda después de la colisión
con la misma energı́a inicial.6 En el proceso de colisión no interviene el ángulo φ, porque
con fuerzas centrales el movimiento ocurre en un plano (véase figura 5.23). Analicemos
ahora la relación entre los ángulos de dispersión θL y θC . La relación de las velocidades
de centro de masa y laboratorio es:
′
~υL ′
= ~υC + ~υ ; V~L′ = V~C′ + ~υ (5.185)
6 Seve que la partı́cula µ no coincide con m cuando se toma el origen de ~
r en el centro de masa.
Como sólo interesa θC , es irrelevante saber dónde está el origen de ~
r.
Movimiento de dos partı́culas que interactúan ... / 163
m v2′
Vc′
r m
Θc
v Θ2 v
vc
C.M.
r
C.M.
v=0 vc
Laboratorio v2′ Centro de mesa M
vc′
Sabemos que:
~BC
p M~ ~C ′ = p~BC = −~υ
υC =
~ = υ; V (5.186)
m m M
′
Como υC = υC y VC′ = VC , la ecuación (5.186) nos dice que:
′ M
υC = υ; VC′ = −υ (5.187)
m
′
O sea que si M > m entonces υC > υ = VC′ y si M < m, entonces υC′
< υ = VC′ .
Podemos distinguir dos casos, M > m y M < m. Si m > M , de acuerdo con las figuras
5.24 y 5.25, θL es máximo cuando ~υC ′ es perpendicular a ~υL ′ , luego:
′
υC M
senθLmax = = (5.188)
υ m
o sea que hay una región angular en el laboratorio que está prohibida cuando m > M .
Si m < M , todos los valores de θL son posibles. La relación entre θC y θL es común para
los casos m > M y m < M . Dicha relación se obtiene a partir de:
v ′L
vi′C
ΘL ΘC
γ>1
v ′L vi′C
ΘL ΘC
v
γ<1
senθL
tan θC = γ (5.193)
cos θL −
1+γ
Entonces usamos:
d(cos θC ) d(cos θC ) d(tan θC )
= = (5.194)
d(cos θL ) d(tan θC ) d(cos θL )
La fórmula σL (θL ) = fγ (θL )σC (θC ) da la conexión entre los cálculos teóricos,
centro de masa, y las medidas experimentales, laboratorio. Si γ = 1, vemos que f1 (θL ) =
4 cos θL , y si γ = 0, f0 (θL ) = 1.
1
σC (θC ) = (a + b)2 (5.196)
4
El resultado se obtiene usando la siguiente consideración: el problema es como si
reemplazáramos la esfera de masa m por una de masa µ, y la esfera de masa M por una
de masa infinita. Como la interacción es la misma, entonces el radio de la esfera de masa
µ debe ser b y el de la esfera de masa infinita debe ser a.
Como la ecuación (5.164) no depende del valor de la masa, se sigue el resultado
(5.196). En el sistema de referencia de laboratorio la sección eficaz diferencial es:
1
σL (θL ) = (a + b)2 fγ (θL ) (5.197)
4
La sección eficaz diferencial en el centro de masa es isotrópica, en tanto que en
el laboratorio sı́ habrá una dependencia angular. En virtud del resultado (5.188), la
función fγ (θL ) debe definirse idénticamente igual a cero para ángulos θL mayores que
θL máximo, cuando γ > 1.
m M m
x1 x2 x3
167
168 / Mecánica clásica avanzada
Para estos movimientos se cumple: (a) La energı́a potencial es del tipo de un “re-
sorte” con pequeñas elongaciones; (b) La energı́a cinética no depende de la posición, o
sea, es función cuadrática homogénea de las velocidades, con coeficientes que no depen-
den de la posición. Ver la discusión detallada de lo anterior, por ejemplo en Gantmacher,
numeral 40.
El número de grados de libertad necesarios para especificar las oscilaciones longitudina-
les es 3 − 1 = 2 descontando la traslación del centro de masa. La longitud del “resorte”
que une los átomos 1 y 2 es x2 − x1 . Supondremos que en la posición de equilibrio la
longitud de este “resorte” es b, o sea que x20 − x10 = b, siendo xi0 la coordenada de la
partı́cula i en la configuración de equilibrio. La elongación del resorte 1−2 será entonces:
(x2 − x1 ) − b = (x2 − x20 ) − (x1 − x10 ) (6.1)
Si llamamos a η1 , η2 y η3 la cantidad en que se separa cada átomo de su posición
de equilibrio:
ηi = xi − xi0 (6.2)
podemos escribir las elongaciones de los resortes 1 − 2 y 2 − 3 como:
η2 − η1 y η3 − η2 (6.3)
de modo que la energı́a potencial para pequeñas oscilaciones será:
1 1
V = k(η2 − η1 )2 + (η3 − η2 )2
2 2
(6.4)
1 2 2 2
k(η1 + 2η2 + η3 − 2η1 η2 − 2η2 η3 )
2
donde k es la “constante de resorte”, cuyo valor depende de factores que no entraremos a
considerar aquı́, pero que supondremos conocido. En (6.4) no se incluye interacción entre
los átomos 1 y 3. Las coordenadas η1 , η2 , η3 , no son todas vibracionales pues sabemos
que las vibraciones longitudinales requieren sólo dos coordenadas. V puede escribirse en
la forma:
3
1 X
V = kij ηi ηj (6.5)
2 i,j=1
donde mij son los elementos de la matriz 3 × 3, m̃, que es diagonal y por lo tanto
simétrica:
m 0 0
m̃ = 0 M 0 (6.8)
0 0 m
Para hallar las ecuaciones de Lagrange se requiere conocer las derivadas parciales
de L respecto a ηi y η̇i . Para ello evaluemos a dL:
3
1 X
dL = (mij dη̇i η̇j + mij η̇i dη̇j − kij dηi ηj + kij ηi dηj ) (6.10)
2 i,j=1
Teniendo en cuenta que las mij son constantes, las ecuaciones de Lagrange son:
3
X
(mij η̈j + kij nj ) = 0; i = 1, 2, 3 (6.13)
j=1
η¨ + k̃~η = ~0
m̃~ (6.15)
170 / Mecánica clásica avanzada
mωα2 − k k 0
ωα2 m̃ − k̃ =
k M ωα2 − 2k k
(6.22)
0 k mωα2 − k
det ωα2 m̃ − k̃ = mωα2 − k (M ωα2 − 2k)(mωα2 − k) − k 2
(6.23)
−k k(mωα2 − k)
Por tanto la ecuación (6.21) es una ecuación algebraica de tercer grado en ωα2 , que
tendrá tres raı́ces que serán ω12 , ω22 y ω32 :
k M + 2m
det ωα2 m̃ − k̃ = m2 M ω 2 − (ω 2 − 0) ω 2 − k
m Mm
(6.24)
= m2 M (ω 2 − ω22 )(ω 2 − ω12 )(ω 2 − ω32 )
En conclusión, las frecuencias con las cuales puede ocurrir la oscilación simultánea
de las tres coordenadas son:
k k m
ω12 = 0; ω22 = ; ω32 = 1+2 (6.25)
m m M
0 k 0 0
µ21
0
M − 2m
k k k µ22 =
m
(6.27)
0
0 k 0 µ23
m
2 k k 0 0
M µ31
0
M =
k k k µ32
m
0
m µ33
0 k 2 k
M
Pequeñas oscilaciones de sistemas de varios grados de libertad / 173
Notamos que ~ µ1 , ~
µ2 y ~
µ3 no son ortogonales, puesto que: ~µ1 · ~µ2 = 0; ~µ1 · ~µ3 =
2µ11 µ31 (1 − m/M ); ~µ2 · ~
µ3 = 0. Es deseable, sin embargo, trabajar con vectores ortogo-
nales. Los vectores siguientes son ortogonales:
√ √
m m
√
1/2
m̃ ~
µ1 = µ11 M ; m̃ ~µ2 = µ21 0
1/2
√ √
m − m
√ (6.31)
m
−2m
m̃1/2 µ
~ 3 = µ31 √
M
√
m
1 Las trayectorias descritas en el espacio de configuración son rectilı́neas. ~
η1 corresponde a una lı́nea
infinita, describe una translación no acotada a lo largo del vector ~ µ1 . ~η2 y ~η3 describen oscilaciones
sobre segmentos rectos finitos a lo largo de los vectores ~µ2 y ~ µ3 respectivamente.
174 / Mecánica clásica avanzada
En vez de trabajar con estos vectores, es cómodo quedarse con los vectores (6.30),
pero cambiando la definición del producto escalar. Definiremos el producto escalar de
dos vectores ~
µ y ~ν ası́:
3
X
µ, ~ν ) = (m̃1/2 ~µ).(m̃1/2 ~ν ) = ~µ.(m̃~ν ) =
(~ mij µi νj (6.32)
i,j=1
Podemos ahora escoger las constantes arbitrarias µ11 , µ21 y µ31 de modo que los
vectores ~
µα formen una trı́ada ortonormal bajo el producto escalar (6.32), es decir,
normalizar los vectores a la unidad: (~µα , ~να ) = 1; α = 1, 2, 3. Este procedimiento nos
conduce inmediatamente a:
1 1
1 1
µ1 = √
~
1 ; ~µ2 = √ 0
2m + M
2m
1 −1
(6.33)
1
1
−2m
µ3 = r
~
m M
2m(1 + 2 )
M
1
La definición (6.32) se hace por comodidad matemática, pero nos aleja un poco
del sentido fı́sico original. La exigencia de ortonormalidad nos conduce a vectores que
no tienen dimensiones de desplazamiento y a soluciones que no dependen de las con-
diciones iniciales: contienen información sobre la relación de amplitudes pero no de su
valor absoluto. Por esto se les llama “modos normales de oscilación”. Se dice que los
movimientos longitudinales de la molécula triatómica lineal son no degenerados porque
las frecuencias de los tres modos normales son diferentes; en otras palabras, no hay dos
modos normales diferentes con la misma frecuencia.
La frecuencia w1 , que es nula, no corresponde a una oscilación. Esto es consistente
con la forma del vector propio correspondiente: las tres partı́culas se desplazan la misma
cantidad en todo momento, o sea que la molécula se traslada. En sentido estricto sólo
µ2,3 son modos normales de oscilación, de acuerdo con lo dicho anteriormente acerca de
~
que sólo hay dos coordenadas vibracionales longitudinales. En el modo ~µ2 la partı́cula 2
se queda quieta y las partı́culas 1 y 3 oscilan en contrafase. En el modo ~µ3 las partı́culas
1 y 3 oscilan en fase, pero la partı́cula 2 se desplaza respecto a 1 − 3 una cantidad que
depende de las masas y es en sentido opuesto. En el modo ~µ2 cada “resorte” actúa p inde-
pendientemente sobre una masa m; por esto la frecuencia correspondiente vale k/m.
Si se quiere indicar la magnitud de las oscilaciones es conveniente definir otras solu-
ciones, llamadas “coordenadas normales”, que, veremos, representan otro conjunto de
coordenadas generalizadas independientes para describir el estado del sistema y contie-
nen información sobre las condiciones iniciales.
Pequeñas oscilaciones de sistemas de varios grados de libertad / 175
η = ÃT ~
~ θ (6.35)
donde ÃT es la matriz transpuesta de Ã. En las nuevas variables L toma la forma:
1 ~˙ T ˙ 1 ~T
L= θ Ãm̃ÃT θ~ − θ Ãk̃ ÃT ~θ (6.36)
2 2
Ahora exigimos que à sea tal que m̃′ = Ãk̃ÃT y k̃ ′ = Ãm̃ÃT sean ambas diagona-
les, es decir, tales que m′ij = m′i δij y kij
′
= ki′ δij para i, j = 1, 2, 3 de modo que (6.36)
queda ası́:
3
1X ′ 2
L= (m θ̇ − kα′ θα2 ) (6.37)
2 α=1 α α
Las soluciones para las nuevas coordenadas, en función de las constantes de inte-
gración Cα y φα , serán:
s !
kα′
θα = Cα sen t + φα kα′ θα2 = 0; α = 1, 2, 3 (6.39)
m′α
matriz Ã, que se obtienen resolviendo para las Aαi las ecuaciones que resultan de las
condiciones:
(Ãm̃ÃT )ij = m′i δij ; (Ãk̃ ÃT )ij = ki′ δij (6.41)
A partir de (6.16) y (6.17) vemos que ~ηi toma la forma:
3
X
ηi = Cα µαi sen(ωα + φα ) (6.42)
α=1
Las expresiones (6.40) y (6.42) coinciden si se cumple que:
kα′
Aαi = µαi y ωα2 = ; i, α = 1, 2, 3 (6.43)
m′α
Llegamos a la conclusión de que los vectores propios, o modos normales de oscila-
µα , son las filas de la matriz Ã, o sea las columnas de la matriz ÃT que realiza la
cion ~
transformación de ~η a θ~ según (6.35). Como los vectores ~µα son ortogonales y ortonor-
males según el producto escalar (6.32):
(µα , µβ ) = δαβ ; α, β = 1, 2, 3 (6.44)
Podemos escribir (6.44) también en la forma:
~ Tα m̃~µβ = δαβ ;
µ α, β = 1, 2, 3 (6.45)
Explı́citamente (6.45) es:
3
X
mij µαi µβj = δαβ ; α, β = 1, 2, 3 (6.46)
i,j=1
Notamos la identidad entre las filas de à y los vectores ~µTα , y por lo tanto podemos
escribir a (6.46) como:
Ãm̃ÃT = I˜ (6.47)
donde I˜ es la matriz unidad 3 × 3, o sea que m′i = 1 para i = 1, 2, 3. Entonces las
condiciones que nos definen las frecuencias ωα2 y la matriz à son de (6.41), (6.43) y
(6.47):
(Ãm̃ÃT )ij = δij ; (Ãk̃ ÃT )ij = ωi2 δij ; i, j = 1, 2, 3 (6.48)
T
Las columnas de à son los vectores ~µα y las ωα2
son los elementos diagonales de la
matriz k̃ ′ = Ãk̃ÃT . La ecuación (6.47) es la condición de que la matriz à sea ortogonal,
o sea que preserve el producto escalar (6.32) en una transformación de coordenadas
generalizadas. Explı́citamente la matriz ÃT es:
−1/2 −1/2
M 2m
1 + 2m 1 1+
M
−1/2 −1/2
1
M 2m 2m
ÃT = √ 1+ 0 − 1+ (6.49)
2m 2m M 2M
−1/2 −1/2
M 2m
1+ −1 1+
2m M
Pequeñas oscilaciones de sistemas de varios grados de libertad / 177
y la matriz k̃ ′ es:
0 0 0
k
′ 0 0
k̃ = m (6.50)
k 2m
0 0 1+
m M
θ̈1 = 0 (6.51)
θ1 = At + B (6.52)
θα = Cα sen(ωα t + φα ) ; α = 2, 3 (6.53)
1 2 3
ω1 = 0 x
Traslación: η1 = η2 = η3
ns
√k
ω2 = x
m
Vibración simétrica: η1= –η3 , η2 = 0
√m ( 1 + M (
k 2m
ω3 = x
Vibración asimétrica: η1 = η3 , η2 = –2m/M η1
Figura 6.2 Modos normales para la molécula triatómica lineal en oscilaciones longitudinales
Con la primera forma podemos definir el producto escalar en términos del “tensor
métrico” de cierto espacio Riemanniano, mij :
l
X
~ ~η ) =
(ζ, mij ζi ηj (6.59)
i,j=1
µα = ωα2 ~
(m̃−1 k̃)~ µα ; (m̃−1 k̃)~µβ = ωβ2 ~µβ (6.60)
µβ , m−1 k̃~
(~ µα ) = ωα2 (~
µβ , ~µα )
(6.61)
(m−1 k̃~ µα ) = ωβ2 (~
µβ , ~ µβ , ~µα )
180 / Mecánica clásica avanzada
Como m̃−1 k̃ es simétrica, los lados izquierdos en (6.61) son iguales. En efecto:
l
X l
X
µβ , m̃−1 k̃~
(~ µα ) = µβi mij krs µαs (m̃)−1
jr
i,j=1 r,s=1
l
X l
X
= µβr krs µαs = krs µβr µαs
r,s=1 r,s=1
(6.62)
l
X l
X
(m̃−1 k̃~
µβ , ~
µα ) = (m̃)−1
ir krs µβs mij µαj
i,j=r r,s=1
l
X l
X
= krs µβs µαr = ksr µβr µαs
r,s=1 r,s=1
Si ωα2 6= ωβ2 entonces ~µα y ~µβ son ortogonales. Si α = β, (~µα , ~µα ) tiene algún valor
que tomamos igual a 1, entonces,
(~
µα , ~
µβ ) = δα,β α , β = 1, 2, l (6.64)
Ãm̃ÃT = I˜ (6.66)
vemos que la matriz à realiza sobre k̃ una transformación que la diagonaliza, siendo las
frecuencias propias los elementos diagonales. Las expresiones (6.66) y (6.68) nos dicen
que à diagonaliza simultáneamente a m̃ y a k̃. m̃ es el tensor métrico en el espacio de
configuración. Podemos entonces interpretar a à como la matriz de una transformación
lineal en el espacio de configuración que nos hace pasar de unos ejes oblicuos, ηi , (con m̃
Pequeñas oscilaciones de sistemas de varios grados de libertad / 181
y y
x x
z Modo y z Modo z
3 En efecto, las filas de à determinan los vectores unitarios de los “ejes principales”, o sea los ~
µα .
182 / Mecánica clásica avanzada
x x
z z
Figura 6.4 Modos normales de oscilación: dos frecuencias simples y una frecuancia doble.
para pequeñas oscilaciones se cumple que di ≪ b, lo cual nos permite escribir en vez de
(6.73):
˙ ˙
î × (d~3 − d~1 ) = 0 (6.74)
o más explı́citamente:
Integrando (6.75) obtenemos: d3y = d1y + Constante; d3z = d1z + Constante; las
constantes deben anularse porque estas ecuaciones se deben cumplir aun en la posición
de equilibrio:
2m 2m
d2y = − d1y ; d2z = − d1z (6.78)
M M
m
d2x = − (d1x + d3x )
M
Existen además cinco relaciones similares a (6.78) para las velocidades de los des-
plazamientos. Tomaremos como coordenadas generalizadas independientes vibracionales
a d1x , d3x , d1y , d1z , y las llamaremos η1 , η2 , η3 y η4 :
Si usamos a (6.78) y (6.79) para expresar todos los d~i en función de los ην , ν =
1, 2, 3, 4 obtenemos para V (~
η ):
1 2m2 2m
V = k 1+ + + k (η12 + η22 )
′
2 M2 M
1h m m i
+ 4k 1+ − 2k ′ η1 η2 (6.87)
2 M M
" 2 #
1 2m
+ 2K 1 + (η32 + η42 )
2 M
η¨ + k̃~η¨ = 0
m̃~ (6.92)
ηα = ~
~ µα sen(ωα t + φα ); α = 1, 2, 3, 4 (6.93)
µα = ~0
(m̃ωα2 − k̃)~ (6.94)
186 / Mecánica clásica avanzada
La ecuación (6.94) admite soluciones no triviales para los ~µα sólo si las ωα son
tales que satisfacen la ecuación secular:
det(m̃ωα2 − k̃) = 0 ; α = 1, 2, 3, 4 (6.95)
Si usamos la siguiente notación (Classical mechanics, Corben-Stehle, capı́tulo 8):
2
2m m
α = 2K 1 + ; α′ = 2m 1 +
M M
(6.96)
2m m2 m
β= + 2 2; β′ =
M M M
Podemos escribir:
m̃ω 2 − k̃ =
m(1+β ′ )ω 2 −k(1+β)−k ′ mβ ′ ω 2 −kβ +k ′ 0 0
′ 2
mβ ω −kβ +k ′ ′ 2
m(1 +β )ω −k(1+β)−k ′
0 0 (6.97)
0 0 α′ ω 2 − α 0
0 0 0 α′ ω 2 −α
0 0
(6.110)
0 0
0 0
µ3 = µ33
~ 1 ; µ
~ 4 = µ43 1
µ34 µ44
µ33 µ43
Como en las ecuaciones (6.30), µ11 , µ21 , µ33 y µ43 pueden definirse por la condición
de normalización, sin embargo µ43 y µ44 quedan aún indeterminadas. Hay un número
infinito de vectores propios normalizados correspondientes a la frecuencia propia dege-
nerada ω3 = ω4 . La condición de normalización es:
~ Tα m̃~µα = 1 ; α = 1, 2, 3, 4
µ (6.111)
donde m̃ es la matriz (6.85). Esto nos conduce a los siguientes valores para µ11 , µ21 , µ33
y µ43 :
1 1
µ11 = √ ; µ21 = s
2m 2m
2m 1 +
M
v (6.112)
u 1
µα3 =u
u − µ2α4 ; α = 3, 4
t 2m
2m 1 +
M
Debido a que µ34 y µ44 son arbitrarios, µ ~ 3 y ~µ4 son linealmente independientes.
~3 y µ
µ ~ 4 generan entonces un espacio de dimensión dos, siendo cualquier vector de este
espacio un vector propio correspondiente al valor propio ω3 = ω4 . Podemos decir que a la
frecuencia propia doblemente degenerada, ω3 = ω4 , le corresponde un conjunto infinito
de vectores propios normalizados en un espacio bidimensional. Cualquier par de vectores
linealmente independientes genera el espacio; por esto podemos sin perder generalidad
escoger los vectores ~
µ3 y ~µ4 de modo que sean ortogonales entre sı́, bajo el producto
escalar (6.59):
µ33 µ43 + µ34 µ44 = 0 (6.113)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 189
Como definimos a µ33 y µ43 positivos en (6.113), entonces µ34 y µ44 deben tener
signos opuestos; (6.112) y (6.113) conducen a:
1
µ234 + µ244 = (6.114)
2m
2m 1 +
M
Todavı́a los vectores no están bien definidos pues aún hay infinitos pares de vectores
ortonormales en el mencionado espacio bidimensional. ~µT3 y ~µT4 pueden escribirse en la
forma:
1
~ T3
µ = r (0, 0, cos δ, senδ)
2m
2m(1 + )
M
1
~ T4
µ = r (0, 0, senδ, − cos δ) (6.115)
2m
2m(1 + )
M
donde δ está comprendido entre 0 y π/2 de acuerdo con la elección del signo de µ33 y
µ43 .
Los vectores ~
µ3 y µ
~ 4 generan todas las posibles oscilaciones transversales con la
frecuencia degenerada ω3 = ω4 . Los modos normales de oscilación transversales son:
η~3T = µ
~ T3 sen(ω3 t + φ3 ) → (0, 0, d1y , d1z )
(6.116)
η~4T = η~4T sen(ω3 t + φ4 )
d1
(Modo µ3)
δ
y
d1 (Modo µ4)
Podemos tomar δ = 0, con lo cual ~µ3 corresponde a las oscilaciones en “y” y ~µ4 a
las oscilaciones en “z”. Una oscilación transversal general será de la forma:
~η = C3 ~
η3 + C4 ~η4 (6.117)
Sin perder generalidad η~T puede escribirse en la forma:
~η T = C [0, 0, senγ sen(ω3 t + φ3 ), cos γ sen(ω3 t + φ4 )] (6.118)
φ3 y φ4 son arbitrarias. Si tomamos φ3 = φ4 obtenemos oscilaciones longitudinales en
una dirección que hace un ángulo γ con el eje z. Si tomamos φ3 = 0 y φ4 = π/2, el
movimiento será una circunferencia y en general será una elipse, donde γ será la dirección
del eje mayor de la elipse.
Recordando las fórmulas (6.78),
2m 2m
d2y = − d1y ; d2z = − d1z
M M (6.119)
d3y = d1y ; d3z = d1z
Vemos que el desplazamiento del átomo central es siempre contrario al de los
laterales. En general, el átomo central gira en sentido contrario a los laterales, en una
trayectoria elı́ptica, con una amplitud tal que el momento angular es cero. El movimiento
transversal general es pues una rotación de cada átomo. Véase figuras 6.3 y 6.4. Si
quisiéramos describir las nueve coordenadas del sistema, deberı́amos usar vectores 9-
dimensionales y matrices 9 × 9. Ası́ por ejemplo, en vez de ~µ3 y µ
~ 4 tendrı́amos, usando
las fórmulas (6.78):
1 2m
~eT3 = s (0, 1, 0; 0, − M , 0; 0, 1, 0)
2m
2m 1 +
M
(6.120)
1 2m
~eT4 = s (0, 0, 1; 0, 0, − M ; 0, 0, 1)
2m
2m 1 +
M
de la degeneración.
DF + EG = 0 ; DG + EF = 0 ; HL + JK = 0 (6.123)
G = F , D = −E o G = −F , D = E (6.124)
192 / Mecánica clásica avanzada
˜ Por
Cuando A, B y C son los elementos de m̃, entonces (6.122) debe ser igual a I.
tanto se cumple, usando las relaciones de la izquierda en (6.124), que:
2D2 A − 2BD2 = 1 ; 2F 2 A + 2F 2 B = 1
(6.125)
C(H 2 + K 2 ) = C(J 2 + L2 ) = 1
Recordando la expresión para A y B en m̃, ecuación (6.85), obtenemos para D y
F:
1 1
D=√ = −E ; F = s =G (6.126)
2m 2m
2m 1 +
M
En (6.126) por convención tomamos las raı́ces cuadradas positivas. Por otra parte,
para H, K, L, J, obtenemos las relaciones:
K = L , H = −J o K = −L , H = J (6.127)
Como hay sólo tres ecuaciones para determinar las cuatro incógnitas H, K, J, L,
podemos asignar el valor a una de ellas arbitrariamente. Sea que:
cos δ π
H=s ; ≤δ≤ 2 (6.128)
2m
2m 1 +
M
Vemos que las filas de à coinciden con los vectores propios ~µα hallados anterior-
mente. Cuando tomamos como A, B y C los elementos de k̃ de la ecuación (6.96),
encontramos:
A(E 2 + D) + 2BDE = ω12 ; A(F 2 + G2 ) + 2BF G = ω22
(6.131)
C(H 2 + K 2 ) = C(J 2 + L2 ) = ω32
Pequeñas oscilaciones de sistemas de varios grados de libertad / 193
donde ω12 , ω22 y ω32 están dados en las ecuaciones (6.101) y (6.102). En este problema
el procedimiento de diagonalización se simplificó debido a la forma de m̃ y k̃ que nos
permitió partir de la forma (6.121) para la matriz Ã. Para sistemas más complicados no es
tan simple la elección de la forma de Ã. A pesar de esto, muchas veces la ecuación secular
resulta mucho más complicada, por requerir primero la evaluación de un determinante y
luego el cálculo de las raı́ces de una ecuación algebraica de grado l. En estos casos, donde
l es grande y m̃ y k̃ complicadas, es más conveniente el método de la diagonalización,
que se realiza usualmente en forma numérica, por ejemplo mediante el método numérico
de diagonalización de Jacobi.
A
V (r) = − (6.132)
rn−1
suponiendo que la órbita es circular, hallar los valores de n para los cuales hay pequeñas
oscilaciones estables.
Este es un ejemplo de pequeñas oscilaciones alrededor de un movimiento estable.
Se entiende por estabilidad el hecho de tender al estado de equilibrio al ser sometido el
sistema a una distorsión. En fuerzas centrales la órbita es plana, con lo cual podemos
describir la partı́cula con las coordenadas polares r, θ. El lagrangiano es:
1 A
L= m(ṙ2 + r2 θ̇) + n−1 (6.133)
2 r
Las ecuaciones de movimiento de Lagrange son:
r = r0 y θ̇ = ω0 (6.135)
r = r0 + ρ y θ̇ = ω0 + φ̇ (6.136)
estas son ecuaciones lineales acopladas para ρ y φ̇. Buscamos ahora los “modos normales
de oscilación” de ρ y φ̇:
donde ω es la frecuencia propia del modo normal (esperamos que haya dos frecuencias),
y α la fase, como en la ecuación (6.93). ρ0 y φ̇0 son las componentes de los vectores
propios ~
µ, que satisfacen las ecuaciones algebraicas:
−m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 −2mω0 ωr0
2mω0 ωr0 mr02 ω
ρ0 0
× = (6.140)
φ̇0 0
ω2 = 0 y ω 2 = (3 − n)ω02 (6.142)
ω02 = ω 2 (6.143)
ω = 2ω0 (6.144)
A 1 A l2
Vef (r) = − + mr2 θ̇2 = − n−1 + (6.145)
rn−1 2 r 2mr2
En el movimiento estable el potencial tiene un mı́nimo. Para pequeños desplaza-
mientos del movimiento estable, el “pozo” de potencial puede aproximarse a un pozo
Pequeñas oscilaciones de sistemas de varios grados de libertad / 195
η1 ηi + 1 ηn
η2 ηi – 1 ηi ηi + 1 ηn – 1 x
x1 x2 xi – 1 xi xi + 1 xi + 2 xn – 1 xn xn – 1
x0 = 0 d = L
Figura 6.6 Cuerda estirada sin masa con un conjunto discreto de masas
donde λ depende de ωα :
d
λ = 2 − mωα2 (6.158)
τ
D1 = λ
D2 = λ2 − 1
D3 = λ3 − 2λ = λD2 − D1
D5 = λ5 − 4λ3 + 3λ = λD4 − D3
λ = 2 cos β (6.163)
D1 = 2 cos β
D2 = 2 cos 2β + 1
D3 = 2(cos 3β + cos β)
(6.164)
D4 = 2(cos 4β + cos 2β) + 1
(ei2β )k + (e−i2β )k
cos 2kβ = (6.166)
2
y similarmente para (2n + 1)β. Notamos luego que se obtienen series geométricas de
potencias. La expresión para la suma cerrada de una serie geométrica es conocida. En
este caso la razón de la serie es e±2β :
1 − (ei2β )r+1
1 + ei2β + (ei2β )2 + ...(ei2β )r = (6.167)
1 − ei2β
que vale si ei2β 6= 1. Ası́, si n es par:
1 − (ei2β )(n/2+1)
Dn = 2Re −1 (6.168)
1 − ei2β
El resto es un cálculo trigonométrico. Para n impar el procedimiento es similar.
El resultado final es que, para todo n:
sen(n + 1)β
Dn = ; n par o impar (6.169)
senβ
Se sigue entonces que la ecuación secular correspondiente a (6.156) es:
µα2 = λα µα1
µα3 = (λ2α − 1)µα1
µα4 = (λ3α − 2λα )µα1
µα5 = (λ4α − 3λ2α + 1)µα1
..
. (6.175)
senkβα
µαk = Dk−1 (λα )µα1 = µα1
senβα
..
.
α, k = 1, 2, ...n
n
n + 1 1 X i2βα k (6.179)
= − Re (e )
2 2
k=1
2 sen2 βα
µ2α1 = (6.180)
(n + 1)m
En los modos normales de oscilación todas las partı́culas están sobre una curva si-
nusoidal cuya longitud de onda depende del orden del modo, o sea de la frecuencia ωα . Es
una solución del tipo “onda estacionaria”, determinada por las condiciones de frontera
µα0 = µαn+1 . Corben y Stehle obtienen a partir de esta solución la solución para una on-
da viajera, imponiendo las condiciones de frontera periódicas, µα0 = µαn y µα1 = µαn+1 .
202 / Mecánica clásica avanzada
m(x, x′ ) = ρδ(x − x′ )
τ
k(x, x′ ) = [2δ(x − x′ ) − δ(x − x′ − d) − δ(x − x′ + d)] (6.194)
d2
d2
= −τ 2 δ(x − x′ )
dx
π2 τ
ωβ2 = β 2 (6.196)
L2 ρ
como debe ser. En vez de las ecuaciones algebraicas (6.156) tendremos ahora una ecua-
ción diferencial. En efecto, (6.156) se convierte en:
τ 2τ τ
− µα (x − d) + − ρdωα2 µα (x) − µα (x + d) = 0 (6.197)
d d d
De donde:
∂2η ρ ∂2η
2
− =0 (6.202)
∂x τ ∂t2
Esta ecuación se obtiene también directamente de (6.15) y (6.195). Es la ecua-
ción de onda en una dimensión. Hemos llegado a la teorı́a de las ondas mecánicas. No
seguiremos con el tema, que nos aleja del propósito del presente capı́tulo.
7
Cinemática del cuerpo rı́gido
205
206 / Mecánica clásica avanzada
l12 2
1
l23
l13
3
Figura 7.1 Posición de un punto respecto de tres puntos no colineales del cuerpo rı́gido
z′
r′
r y′
a
η
ξ
x′
x
x2 = y x′2 = y ′ x2 = ξ a2 = ay (7.5)
x3 = z x′3 = z ′ x3 = ζ a3 = az
Con lo cual podemos describir:
3
X
xi = x′i + ai ; xi = aij x′j ; i = 1, 2, 3 (7.6)
j=1
donde aij son los elementos de la matriz Ã. La transformación de las coordenadas espa-
ciales (x) a las coordenadas del cuerpo rı́gido (x) son:
3
X
xi = a−1
ij xj + ai i = 1, 2, 3 (7.7)
j=1
En términos de los elementos (Ã−1 T )lm de la matriz traspuesta de la matriz Ã−1 , que
se obtiene por intercambio de filas y columnas, podemos escribir (7.10) como:
3
X
˜ jk
(Ã−1 T )ij (Ã−1 )ik = (I) (7.11)
i=1
O sea que sólo hay tres relaciones independientes para j 6= k. En total hay seis
relaciones entre los elementos de la matriz Ã. Como era de esperarse, Ã contiene sólo
tres parámetros independientes.
Cinemática del cuerpo rı́gido / 209
x2
x2
r,r
x1
θ
θ
φ
x1
Ejemplo 7.2.1 Supongamos que los ejes (x) y (x) difieren simplemente por una rotación
por un ángulo φ alrededor del eje x3 = x3 (véase figura 7.3). Encontrar las fórmulas de
transformación.
x= r cos θ
(7.17)
x= r senθ
x1 = x1 cos φ + x2 senφ
x3 = x3
210 / Mecánica clásica avanzada
O en forma de matriz:
x1 cos θ senφ 0 x1
x2 = −senφ cos φ 0 x2
(7.21)
x3 0 0 1 x3
Esta matriz satisface idénticamente las relaciones de ortogonalidad (7.13). Para
j = k:
j= primera fila , cos2 φ + sen2 φ + 02 = 1
j= tercera fila , 02 + 02 + 12 = 1
satisface también las relaciones para j 6= k (ortogonalidad de las filas entre sı́ o de las
columnas entre sı́):
j = 1, k = 2 ( 1a y 2a filas) : − cos φ senφ + senφ cosφ + 0 = 0
j = 1, k = 3 ( 1a y 3a filas) : 0 +0 +0 =0 (7.23)
j = 1, k = 2 ( 2a y 3a filas) : 0 +0 +0 =0
y similarmente para la ortogonalidad entre columnas.
En general, las relaciones (7.13) pueden expresarse en la siguiente manera. Para
una matriz ortogonal à se cumple que el producto escalar de una fila por sı́ misma, o
de una columna por sı́ misma, es igual a la unidad. Dos filas diferentes o dos columnas
diferentes son ortogonales entre sı́. No es cierto sin embargo que una fila sea ortogonal
a una columna. Es claro en el ejemplo anterior que Ã−1 = ÃT .
en efecto:
3
X 3
X
~e′i · ~ek = (~e′i · ~ej )(~ej · ~ek ) = (~e′i · ~ej )δjk = ~e′i · ~ek (7.26)
j=1 j=1
En tanto que:
3
X
~e′k = αkj ~ej (7.30)
j=1
3
X 3
X
1= (~e′i · ~ej ) → α2kj = 1 ; i = 1, 2, 3 (7.33)
j=1 j=1
3
X 3
X
0= (~ei · ~ej )(~ej · ~e′k ) → αij αkj = 0 ; i, k = 1, 2, 3 (7.34)
j=1 j=1
212 / Mecánica clásica avanzada
Vemos que la fórmula de transformación de los vectores ~e′i a los vectores ~ei es:
3
X 3
X
~ei = αij ~e′j = (~e′j · ~ei )~e′j (7.35)
j=1 j=1
puesto que:
3
X
~ei · ~e′k = (~e′j · ~ei )δjk = (~e′k · ~ei ) (7.36)
j=1
Esto nos dice que la matriz traspuesta de (αij ) produce la rotación de los ejes (x)
a los ejes (x). Las componentes de un vector se transforman según:
3
X 3
X
Vk = αjk Vj′ = αTkj Vj′ (7.37)
j=1 j=1
Las relaciones (7.33) y (7.34) entre los cosenos directores pueden escribirse como:
3
X 3
X
αij αkj = αij αTjk = δik (7.38)
j=1 j=1
En sı́ntesis, vemos que la matriz de los (αij ) es ortogonal y cumple todas las propie-
dades de la matriz de rotación Ã. Los cosenos directores son los elementos de la matriz Ã.
~~
Es claro que la representación de D es:
D11 D12 D13
~~
D → D21 D22 D23
(7.46)
D31 D32 D33
214 / Mecánica clásica avanzada
Ası́ como el producto de un vector fila por una matriz da un vector fila y el
producto de una matriz por un vector columna da un vector columna, definimos por
analogı́a el producto de un vector por un diádico y de un diádico por un vector para
obtener vectores. Definimos los productos entre dı́adas unitarias y vectores ası́:
~ = ~ei (~ej · V
~ei~ej · V ~ ) = ~ei Vj
(7.47)
V~ · ~ei~ej = ~ · ~ei )~ej = ~ej Vi
(V
y el producto entre diádicos y vectores ası́:
3 X
X 3 X
3 3
X
~~ ~ ~ = Dij Vj ~ei
D ·V = Dij ~ei ~ej · V
i=1 j=1 i=1 j=1
(7.48)
!
X 3
3 X 3
X 3
X
~~
V~ · D = Dij V~ · ~ei ~ej = Dij Vi ~ej
i=1 j=1 j=1 i=1
~
~1 claramente tiene las propiedades:
3
X 3
X
~ ~=
~1 · A ~=
~ei~ei · A ~
~ei Ai = A
i=1 i=1
(7.50)
3
X 3
X
~ ·~
A ~1 = ~ · ~ei~ei =
A ~
Ai~ei = A
i=1 i=1
Por tanto:
~B
A ~ :C
~D~ =C
~ ·A
~B~ ·D
~ (7.56)
Veremos que existe completa correspondencia entre los diádicos y los tensores.
Un tensor es una entidad algebraica, con componentes Tij tales que bajo rotaciones se
transforma ası́:
3 X
X 3
Tij′ = αik αjl Tkl (7.57)
k=1 l=1
donde (αij ) son los elementos de la matriz de rotación. En efecto, Tij son los elementos
~
de la matriz que representa a cierto diádico T~ :
~ ~
Tij′ = T~ · ~e′i~e′j = ~e′i · T~ · ~e′j (7.58)
~
T~ se puede expresar bien en términos de ~ei~ej o de ~e′i~e′j :
XX 3 3 XX 3 3
~
T~ = Tij ~ei~ej = Tij′ ~e′i~e′j (7.59)
i=1 j=1 i=1 j=1
~ ·A
C ~∧B
~ ·D
~ = (C
~ · A)(
~ B ~ · D)
~ − (C
~ · B)(
~ A ~ · D)
~
(7.66)
~∧B
A ~ :C
~ ∧D
~ = 2(D
~ · B)(
~ A ~ · C)
~ − 2(C
~ · B)(
~ A ~ · D)
~
ÃT Ã = I˜ (7.67)
otro teorema matemático dice que los determinantes de una matriz y de su traspuesta
son iguales, entonces:
Es fácil ver que det à = −1 ocurre cuando la matriz à contiene una inversión del
sistema de coordenadas. Entonces los desplazamientos de un sólido rı́gido con un punto
fijo sólo pueden ser descritos mediante una matriz de determinante +1.
Cinemática del cuerpo rı́gido / 217
V~ ′ = ÃV
~ =V
~ (7.70)
V~ ′ = ÃV
~ = λV
~ (7.71)
Como à es unitaria (ortogonal) pero no hermı́tica (no simétrica), sus valores pro-
pios no tienen por qué ser reales. Esto nos permite enunciar el teorema de Euler de otra
manera: “la matriz real y ortogonal que determina el movimiento fı́sico de un cuerpo
rı́gido con un punto fijo siempre tiene el valor propio +1”. La ecuación de valores propios
(7.71) puede escribirse:
˜V
(Ã − λI) ~ = ~0 (7.72)
Es un sistema homogéneo de tres ecuaciones lineales, donde las incógnitas son las
componentes de V~ :
λ3 + bλ2 + cλ + d = 0 (7.75)
218 / Mecánica clásica avanzada
donde:
b = −a11 − a22 − a23
c = a22 a11 + a33 a11 + a21 a33 − a23 a32 − a12 a21 − a13 a31
(7.76)
d = a23 a32 a11 + a12 a21 a33 + a13 a31 a22
~ ′ |2 = V
|V ~ ′† · V
~ ′ = (ÃV
~ )† · (ÃV~ ) = V
~ † ÃT ÃV~ (7.77)
~ ′ |2 = | V
Como à es ortogonal, se sigue que |V ~ |2 . Por otra parte, V
~ ′ = λV
~ , por
tanto:
~ ′ |2 = V
|V ~ ′† · V
~ ′ = (λV
~ )† · (λV
~ ) = λ⋆ λV
~†·V
~ = |λ|2 |V
~ |2 (7.78)
En conclusión:
|λ|2 = 1 (7.79)
(b) La ecuación secular (7.75) tiene al menos una raı́z real. Grafiquemos
la ecuación real:
f (x) = x3 + bx2 + cx + d (7.80)
asumiremos x real. De la ecuación (7.76) sabemos que b, c y d son reales.
Claramente:
f (x) → ∞ para x → ∞
(7.81)
f (x) → −∞ para x → −∞
Como f (x) es continua debe en alguna parte cruzar el eje x. Llamemos x = λ el
punto donde corta el eje, o sea el cero de f (x):
λ3 + bλ2 + cλ + d = 0 (7.82)
Como por (a) sabemos que |λ| = 1, se sigue que el valor propio real debe ser λ = −1
o λ = +1 (véase figura 7.4).
λ x
Definimos las siguientes matrices formadas con las componentes de los vectores
propios y con los valores propios:
O también:
Es decir, los vectores propios forman una matriz que diagonaliza a à siendo los
elementos de la diagonal los valores propios.
det λ̃ = ±1 (7.89)
220 / Mecánica clásica avanzada
Hemos dicho que para rotaciones se debe cumplir que det à = +1 y para inversio-
nes det à = −1. Entonces, cuando à representa rotaciones:
det λ̃ = λ1 λ2 λ3 = |λ|2 λ3 = +1 (7.90)
Como |λ|2 = +1 se sigue que siempre el valor propio real debe ser igual a +1. Esto
es lo que afirma el teorema de Euler: existe un vector que no cambia al realizar una
transformación cualquiera à (corresponde al valor propio +1).
~:
Los vectores propios. El vector invariante bajo rotaciones es V
~ =V
ÃV ~ (7.91)
~α formamos la matriz Ṽ que diagonaliza a Ã:
Con las componentes de V
Ṽ ÃṼ T = λ̃ (7.92)
La traza de λ̃ es:
tr λ = λ1 + λ2 + λ3 = λ + λ⋆ + 1 (7.93)
Como |λ| = 1, podemos escribir:
λ = eiΦ (7.94)
De donde:
tr λ̃ = 2 cos Φ + 1 (7.95)
Como, según un teorema matemático, la traza es invariante bajo transformaciones
de semejanza (Ṽ ÃṼ T es una transformación de semejanza sobre Ã):
tr à = tr λ̃ = 1 + 2 cos Φ (7.96)
Es decir,
a11 + a22 + a33 = 1 + cos Φ (7.97)
Podemos mediante una transformación de semejanza rotar los ejes de modo que
~ , de modo que la matriz de rotación tendrá la forma dada por
x3 esté a lo largo de V
(7.21):
cos φ senφ 0
à = −senφ cos φ 0
(7.98)
0 0 1
Vemos entonces de (7.97) y (7.98) que cos φ = cos Φ, luego Φ puede identificarse
~ . La ecuación de valores
como el ángulo de rotación alrededor del eje determinado por V
propios para la matriz à es:
cos Φ senΦ 0 V1 V1
−senΦ cos Φ 0 V2 = V2 (7.99)
0 0 1 V3 V3
Cinemática del cuerpo rı́gido / 221
V3 = V3
Esto nos da, multiplicando la primera por V2 y la segunda por V1 y restando:
Estas propiedades se siguen del hecho de que las matrices de rotación son ortogo-
nales. Es sencillo demostrar a partir de lo anterior que:
(a) El producto de dos matrices ortogonales es ortogonal.
(b) Como para toda matriz de rotación det à = 1, se sigue que toda matriz de
rotación tiene inverso.
(c) I˜ es ortogonal.
(d) El producto de matrices obedece la ley asociativa.
Las rotaciones consideradas en abstracto como simples transformaciones geométri-
cas forman un grupo. El conjunto de matrices ortogonales 3 × 3 constituye una repre-
sentación del grupo de rotaciones.
x3, µ 3 x3 x3 x2
µ3′ µ2′ χ3, µ3′
µ2 θ θ
ϕ
x2 x2
x2
ϕ ϕ x1 ϕ ψ
x1 x1
x1
µ1 µ1, µi
Línea de nodos
1 (θ,φ − π/2) son los ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 , y (θ, π/2 − ψ) son los
ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 .
Cinemática del cuerpo rı́gido / 223
Para hallar α11 = ~e′1 · ~e1 tomemos los planos que se cortan en la lı́nea de nodos y
que contienen los ejes x1 − x2 y x1 − x2 como en la figura 7.6. Vemos que:
x3
x3 π- θ
x2
x2
α
a b
φ ψ
l x1
x1 θ
Por la forma como fue obtenida, a partir de los cosenos directores, se tiene que Ã
es una matriz ortogonal. Es decir, que Ã−1 se obtiene simplemente trasponiendo a Ã.
Cinemática del cuerpo rı́gido / 225
Del teorema de Euler se sigue que de alguna manera à representa una rotación
única alrededor de cierto eje n̂ = c1~e1 + c2~e2 + c3~e3 bajo un ángulo Φ. El eje de rotación
se halla resolviendo la ecuación de valores propios (7.91), con λ = 1:
3
X
(aij − δij )Cj = 0 ; i = 1, 2, 3 (7.123)
j=1
Ası́ que:
parámetros independientes que pueden ser por ejemplo tres cosenos directores indepen-
dientes, tres ángulos de Euler, o un eje de rotación y un ángulo. Vimos que las rotaciones
constituyen un grupo matemático que tiene una representación obvia en términos de ma-
trices 3 × 3 ortogonales (hay un homomorfismo entre las rotaciones fı́sicas y las matrices
ortogonales 3 × 3).
Queremos buscar una representación de la transformación de coordenadas en términos
de los parámetros de una rotación: dos cosenos directores del eje de rotación y el ángulo
de rotación.
x2 x2 Pasiva: x2 Activa
r = Ar r ′ = Ar
i
x1
r r r r′
i
φ x1 x1
relacionadas con las del viejo vector ~r, por medio de la ecuación ~r′ = Ã~r. En general Ã
corresponde a una rotación en sentido contrario a las agujas del reloj por un ángulo φ
cuando sea aplicada al sistema de coordenadas, y como una rotación en sentido de las
agujas del reloj por un ángulo φ cuando sea aplicada a los vectores.
N V P
Φ
r′
i
N V P
Φ
r ×n
Figura 7.9 Rotación de un vector alrededor de un eje n̂. Vista en dirección ~n.
Cinemática del cuerpo rı́gido / 229
N~Q = ~ ) cos Φ
(~r − ON (7.135)
V~Q = ~r × n̂ senΦ
Con lo cual obtenemos:
~r′ = ~r cos Φ + n̂(n̂ · ~r)(1 − cos Φ) + ~r × n̂ senΦ (7.136)
Esta fórmula es válida para cualquier rotación finita de un vector. Para Φ infinite-
simal, dicha expresión toma la forma:
~r′ = ~r + ~r × n̂Φ (7.137)
en concordancia con la fórmula (3.148). Escrita en forma de matriz, la ecuación (7.136)
es:
′
x1
′
x2 =
x′3
(7.138)
cos Φ+C12 c C1 C2 c + C3 senΦ C1 C3 c−C2 senΦ x1
C1 C2 c−C3 senΦ cos Φ+C 2
c C C c+C senΦ x2
2 2 3 1
C1 C3 c+C2 senΦ C2 C3 c−C1 senΦ cos Φ+C32 c x3
donde hemos llamado c = (1 − cos Φ).
En (7.138) la matriz à depende de los cuatro parámetros no independientes C1 ,
C2 , C3 y Φ. Suele expresarse esta matriz en términos de los llamados parámetros de
Euler, no independientes, e0 , e1 , e2 , e3 , definidos ası́:
Φ
e0 = cos
2
(7.139)
Φ
ei = Ci sen ; i = 1, 2, 3
2
En términos de estos parámetros (7.136) toma la forma:
~r′ = ~r(e20 − e21 − e22 − e23 ) + 2~e(~e · ~r) + 2(~r × ~e)e0 (7.140)
y la matriz à entonces será:
2
e0 + e21 − e22 − e23 2(e1 e2 + e0 e3 ) 2(e1 e3 − e0 e2 )
à =
2(e1 e2 − e0 e3 ) e20 − e21 + e22 − e23 2(e2 e3 + e0 e1 )
(7.141)
2(e1 e3 + e0 e3 ) 2(e2 e3 − e0 e1 ) e20 − e21 − e22 + e23
230 / Mecánica clásica avanzada
Usando las ecuaciones (7.124), (7.126) y (7.139) se obtienen las siguientes relaciones
entre los parámetros de Euler y los ángulos de Euler:
θ φ+ψ
e0 = cos cos
2 2
θ φ−ψ
e1 = sen cos
2 2
(7.142)
θ φ−ψ
e2 = sen sen
2 2
θ φ+ψ
e3 = cos sen
2 2
Los parámetros y los ángulos de Euler fueron hallados por Euler en 1776, quien
llamó ei a los parámetros simétricos.
Podemos definir las dı́adas unitarias ~e1~e1 , ~e1~e2 , ~e2~e1 y ~e2~e2 , que pueden represen-
tarse por matrices 2 × 2:
1 0 0 1
~e1~e1 → ~e1~e2 →
0 0 0 0
(7.144)
0 0 0 0
~e2~e1 → ~e2~e2 →
1 0 0 1
En una dı́ada unitaria el primer vector se representa por una matriz columna y el
segundo por una matriz fila. Por ejemplo:
1 0 1
~e1~e2 → (0 1) = (7.145)
0 0 0
Nótese que:
0 1
~e1 ∧ ~e2 = ~e1~e2 − ~e2~e1 = (7.146)
−1 0
~~
Un diádico D puede expresarse en términos de las dı́adas unitarias:
~~
D = D11~e1~e1 + D12~e1~e2 + D21~e2~e1 + D22~e2~e2 (7.147)
y puede representarse por medio de una matriz 2 × 2:
D11 D12
~~
D → (7.148)
D21 D22
El diádico unidad, ~
~1, es:
1 0
~
~1 = ~e1~e1 + ~e2~e2 → (7.149)
0 1
Se definen los diádicos ~ ~σ x , ~
~σ y y ~~σ z de la siguiente manera:
0 1
~
~σ x = ~e1~e2 + ~e2~e1 → = σ̃x
1 0
0 −i
~
~σ y = −i~e1~e2 + i~e2~e1 → = σ̃y (7.150)
i 0
1 0
~
~σ z = ~e1~e1 − ~e2~e2 → = σ̃z
0 −1
232 / Mecánica clásica avanzada
~ ~
~σ x ~~σ y ~~σ z
~ = Vx √
V + Vy √ + Vz √ (7.153)
2 2 2
Existe un isomorfismo entre los diádicos bidimensionales de traza cero y los vectores
ordinarios V~ . En efecto, el conjunto de todos los diádicos bidimensionales de traza cero
satisface las mismas propiedades que el conjunto de todos los vectores ordinarios: (i) La
suma de dos diádicos de traza cero es un diádico de traza cero, la suma es conmutativa;
(ii) El producto de un número por un diádico de traza cero es un diádico de traza cero;
(iii) La suma de diádicos es asociativa; (iv) Existe el diádico cero. Además, si se define
el producto escalar de dos diádicos como:
~ ~
~ : W
~ = V ⋆ W11 + V ⋆ W12 + V ⋆ W21 + V ⋆ W22
V 11 12 21 22 (7.154)
Vemos que este producto escalar satisface las mismas propiedades del producto
escalar de vectores. Para ello es suficiente mostrar que:
~
~σ i : ~
~σ j = 2δij ; i, j = x, y, z (7.155)
~ ′ = ÃV
V ~ (7.157)
donde à es la matriz de rotación 3 × 3, el diádico correspondiente en el espacio bidimen-
sional deberá presentar una transformación correspondiente en virtud del mencionado
homomorfismo. Como:
3
X
Vi′ = aij Vj (7.158)
j=1
Cinemática del cuerpo rı́gido / 233
~′
entonces V~ será:
3 3
~ ′ XX 1
V~ = aij Vj √ ~~σ i (7.159)
i=1 j=1
2
~ ′ ~~ ~ ~~ †
V~ = Q ~ ·Q
·V (7.160)
~~ † ~~
donde Q es el adjunto de Q:
†
~~
Q = Q⋆11 ê1 ê1 + Q⋆21 ê1 ê2 + Q⋆12 ê2 ê1 + Q⋆22 ê2 ê2 (7.161)
′
~
~ es:
Explı́citamente V
!
X2 2
X 2
X
~′ =
V Qij êi êj · Vkl êk êl · Q⋆mn ên êm
i,j=1 k,l=1 m,n=1
(7.162)
2
X
(Q̃Ṽ Q̃† )im êi êm
i,m=1
~′
Por otra parte V~ está dado por (7.159). Por tanto, según (7.152) y (7.153):
1 h i
3
1 X
√ a1j Vj = Q̃Ṽ Q̃† + Q̃Ṽ Q̃†
2 j=1 2 12 21
i h i
3
1 X
√ a2j Vj = Q̃Ṽ Q̃† − Q̃Ṽ Q̃† (7.163)
2 j=1 2 12 21
1 h i
3
1 X
√ a3j Vj = Q̃Ṽ Q̃† − Q̃Ṽ Q̃†
2 j=1 2 11 22
~~
Estas ecuaciones nos permiten relacionar à con Q̃. El diádico Q en (7.160) debe
ser unitario:
~~ † ~~ ~~ ~~ †
Q ·Q=1=Q ·Q (7.164)
~~
Si llamamos α, β, γ y δ las componentes de Q:
~~
Q = αê1 ê1 + βê1 ê2 + γê2 ê1 + δê2 ê2 (7.165)
234 / Mecánica clásica avanzada
~~ † ~~
Q .Q = (α⋆ ê1 ê1 + γ ⋆ ê1 ê2 + β ⋆ ê2 ê1 + δ ⋆ ê2 ê2 )·
|α|2 + |γ|2 = 1
α⋆ β + γ ⋆ δ = 0 (7.167)
|β|2 + |δ|2 = 1
αδ − βγ = 1 ⇒ β = −γ ⋆ ; δ = α⋆ ; αα⋆ + ββ ⋆ = 1 (7.168)
Con lo cual quedan sólo tres parámetros independientes de los ocho que contiene
Q̃. Entenderemos pues, que en (7.165) α, β, γ y δ satisfacen las condiciones de unitaridad
(7.167) y de unimodularidad (7.168).
En (7.163) se requiere conocer la matriz Q̃Ṽ Q̃† . Esto es:
α β V11 V12 α⋆ γ⋆
Q̃Ṽ Q̃† =
γ δ V21 V22 β⋆ δ⋆
(7.169)
!
|α|2 V11 +|β|2 V22 +α⋆ βV21 +αβ ⋆ V12 γ ⋆ αV11 +γ ⋆ βV21 +δ⋆ αV12 +βδ⋆ V22
=
α⋆ γV11 +α⋆ δV21 +β ⋆ γV12 +β ⋆ δV22 |γ|2 V11 +|δ|2 V22 +γ ⋆ δV21 +δ⋆ γV12
Cinemática del cuerpo rı́gido / 235
3
√ X
2 a1j Vj = (γ ⋆ α + α⋆ γ)V11 + (γ ⋆ β + α⋆ δ)V21
j=1
3
√ X
2 a2j Vj = i(γ ⋆ α − α⋆ γ)V11 + i(γ ⋆ β − α⋆ δ)V21
j=1 (7.170)
3
√ X
2 a3j Vj = (|α|2 − |γ|2 )V11 + (|β|2 − |δ|2 )V22
j=1
1
V1 = √ (V12 + V21 )
2
i
V1 = √ (V12 − V21 ) (7.171)
2
1
V1 = √ (V11 + V22 )
2
Obtenemos usando (7.170) y (7.171) las siguentes relaciones entre las componentes
de à y las de Q̃, igualando coeficientes de los Vij :
a13 = γ ⋆ α + α⋆ γ
a23 = i(γ ⋆ α − α⋆ γ)
(7.172)
(a21 + ia22 ) = i(δ ⋆ α − β ⋆ γ)
(a31 + ia32 ) = αβ ⋆ − δ ⋆ γ
236 / Mecánica clásica avanzada
Para una rotación alrededor del eje x1 , de acuerdo con (7.142) se tiene que e1 =
senθ/2, e2 = e3 = 0. Por tanto:
~~ θ~~1 + i sen θ ~
Q θ = cos ~σ x (7.178)
2 2
donde θ es el ángulo de rotación. Para una rotación por φ alrededor del eje x3 :
~~ φ~~1 + i sen φ ~
Q φ = cos ~σ z (7.179)
2 2
Cada diádico de Pauli ~
~σ i está asociado con una rotación alrededor de un eje par-
ticular y puede considerarse como el “rotador unitario” para dicho eje.
Ejemplo 7.8.1 Mostrar que los diádicos de Pauli anticonmutan mutuamente, esto es,
que:
~
~σ i · ~
~σ j = −~
~σ j · ~
~σ i (7.180)
Hagamos los nueve productos ~~σ i · ~~σ j , usando las definiciones (7.150):
~ ~
~σ x · ~
~σ x = ê1 ê1 + ê2 ê2 = ~1 ; ~~σ x · ~~σ y = iê1 ê1 − iê2 ê2 = i~~σ z
~
~σ x · ~
~σ z = −ê1 ê2 + ê2 ê1 = −i~~σy ; ~~σ y · ~~σ x = −iê1 ê1 + iê2 ê2 = −i~~σ z
~
~σ z · ~
~σ x = ê1 ê2 − ê2 ê1 = i~
~σ y ; ~~σ z · ~~σ y = −iê1 ê2 − iê2 ê1 = −i~~σx
y de anticonmutación:
~σ i · ~
~ ~σ i = 2~
~σ j · ~
~σ j + ~ ~1δij (7.184)
~~
Ejemplo 7.8.2 Mostrar que Q θ puede escribirse simbólicamente como:
238 / Mecánica clásica avanzada
~~ i~
~
σx (θ/2)
Q θ = e (7.185)
2
donde el exponencial denota una serie infinita de términos. Como según (7.181) ~~σ x ≡
~ 2n ~ 2n+1
~
~σ x · ~
~σ x = ~1, se sigue que ~~σ = ~1 y que ~~σ = ~~σ x para n = 0, 1, 2, ... Por lo tanto:
x x
∞
X 2n
θ 1 ~~σ x θ θ
cos ~
~σ x ≡ (−1)n = ~~1 cos
2 n=0
(2n)! 2 2
(7.186)
∞
X 2n+1
~ θ 1 ~ θ θ
sen ~σ x ≡ (−1)n
~σ x = ~~σ x sen
2 n=0
(2n + 1)! 2 2
~~
Con lo cual Q θ puede expresarse en la forma:
~~ ~ θ θ θ θ ~
Q ~
θ = 1 cos + +i~~σ x sen = cos(~~σ x ) + i sen(~~σ x ) = ei~σ x (θ/2) (7.187)
2 2 2 2
†
Como ~
~σ i son hermı́ticos, ~~σ i = ~~σ i , se sigue que:
~~ † −i~
~
σx (θ/2)
Q θ = e (7.188)
Ejemplo 7.8.3 Hallar la forma de la matriz de rotación para una rotación arbitraria,
definida por los ángulos de Euler.
~~
Q puede escribirse como el producto de tres rotaciones sucesivas, en virtud del
homomorfismo con el grupo de rotaciones:
~~ † ~ ~ ~
Q = ei~σz (ψ/2) ei~σ µ1 (θ/2) ei~σ z (φ/2) (7.189)
~~
Las tres rotaciones que aparecen en Q son alrededor de los ejes z, µ1 y z. Es
deseable expresarlas en términos de rotaciones alrededor de ejes del mismo sistema de
coordenadas. Para ello hay que notar que cada uno de los diádicos que aparece en el
operador de rotación está asociado con el respectivo eje de rotación.
Como el eje x conduce al eje µ1 por medio de la rotación Aφ , correspondientemente
~
~σ µ1 será, de acuerdo con la ecuación (7.160):
~ ~ ~
~σ µ1 = ei~σ z (θ/2)~~σ x · e−i~σz (θ/2) (7.190)
~ ~ ~ ~
ei~σµ1 (θ/2) = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (φ/2) (7.192)
Cinemática del cuerpo rı́gido / 239
~~
Por tanto Q toma la foma:
~~ ~ ~ ~
Q = ei~σz (ψ/2) ei~σ z (φ/2) ei~σ x (θ/2) (7.193)
Por otra parte, el eje z se obtiene del eje µ′3 por medio de la rotación Aψ , y µ′1 se
obtiene de µ3 = z por medio de Ãθ . Por lo tanto ~~σ z puede escribirse en términos de ~~σ z
como:
~ ~ ~ ~ ~
~σ z = ei~σ z (ψ/2) ei~σ µ1 (θ/2)~
~σ z e−i~σµ1 (θ/2) e−i~σz (ψ/2) (7.194)
Usando (7.192):
~ ~ ~ ~ ~ ~
~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · e−i~σz (φ/2) · σz .ei~σ z (φ/2) ·
(7.195)
−i~
~
σ x (θ/2) −i~
~
σ z (φ/2) −i~
~
σ z (ψ/2)
e ·e ·e
~~ ~~
Notando que ~
~σ z y Q φ conmutan y que Qφ es unitario:
~ ~ ~ ~ ~ ~ ~
~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σx (θ/2) · σz · e−i~σ x (θ/2) · e−i~σz (φ/2) · e−i~σ z (ψ/2) (7.196)
Se sigue entonces que:
~ ~ ~ ~ ~ ~
ei~σ z (ψ/2) = ei~σz (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σ z (ψ/2) · e−i~σ x (θ/2) ·
(7.197)
~ ~
e−i~σz (φ/2) · e−i~σz (ψ/2)
O sea:
~ ~ ~ ~ ~ ~
ei~σ z (ψ/2) = ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σz (ψ/2) · e−i~σx (θ/2) · e−i~σz (φ/2) (7.198)
~~
Reemplazando (7.198) en (7.193) obtenemos para Q:
~~ ~ ~ ~ ~ ~ ~ ~
Q = ei~σz (φ/2) ·ei~σ x (θ/2) ·ei~σ z (ψ/2) ·e−i~σ x (θ/2) ·e−i~σ z (φ/2) ·ei~σ z (φ/2) ·ei~σ x (θ/2) (7.199)
~~
Con lo cual, usando la unitaridad de los operadores, se obtiene finalmente para Q:
~~ ~ ~ ~
Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2) (7.200)
~~
Hemos conseguido expresar a Q en términos de rotaciones alrededor de los ejes
~~
del sistema de coordenadas espacial. Es posible, de manera análoga, expresar a Q en
~~
términos de rotaciones respecto a los ejes fijos al cuerpo rı́gido Q de donde toma la
forma:
~~ ~ ~ ~
Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2) (7.201)
Ejercicio 7.8.1 Demostrar que si (e0 , ei ) y (e′0 , e′i ) son los parámetros de Euler que des-
criben dos rotaciones A y A′ , entonces los parámetros de la rotación A” = A′ A están
expresados en términos de los parámetros de las rotaciones A, A′ , por:
240 / Mecánica clásica avanzada
Ejercicio 7.8.2 Demostrar que si (α, β, γ, δ) y (α′ , β ′ , γ ′ , δ ′ ) son los parámetros de Cayley-
Klein que describen dos rotaciones A y A′ , entonces los parámetros (α′′ , β ′′ , γ ′′ , δ ′′ ) de
la rotación A′′ = A′ A están expresados en términos de los parámetros de A, A′ , por:
α′′ = αα′ + γ ′ β β” = αβ ′ + βδ ′
(7.203)
γ ′′ = γα′ + δ ′ γ δ” = γβ ′ + δδ ′
Ejercicio 7.8.3 Interpretación geométrica del homomorfismo entre SO(3) y SU (2). Sea
una esfera y una figura geométrica F en ella (véase figura 7.10). Se coloca la esfera sobre
un plano. La normal al plano en el punto de contacto corta a la esfera en el punto T .
La proyección estereográfica de F en el plano es P . Al punto T se le llama vértice de la
proyección.
α′ z + β ′ α′′ z ′ + β ′′
z′ = y z ′′ = (7.205)
γ ′z + δ′ γ ′′ z ′ + δ ′′
Es una homografı́a:
α′′′ Z + β ′′′
z ′′′ = (7.206)
γ ′′′ Z + δ ′′′
donde la relación entre (α′′′ , β ′′′ , γ ′′′ , δ ′′′ ) con (α′ , β ′ , γ ′ , δ ′ ) y (α′′ , β ′′ , γ ′′ , δ ′′ )
está dada por expresiones análogas a (7.203). Argumentar que lo anterior muestra cone-
~~
xión entre las rotaciones y las transformaciones homográficas, y que por tanto las Q del
grupo SU (2) corresponden a transformaciones homográficas, donde los parámetros de
Cayley-Klein son los parámetros que caracterizan la transformación homográfica corres-
pondiente a una rotación de un sólido rı́gido (véase el texto de L.V. Ahlfors, Análisis de
variable compleja, Aguilar, 1966).
~r˙ = 0 (7.207)
Es posible escoger los sistemas de coordenadas de modo que ~r(0) = ~r, lo cual
implica que:
Podemos decir que el cuerpo rı́gido en el tiempo t estará descrito por la transforma-
ción ÃT (t) que evoluciona de manera continua a partir de la transformación identidad.
Además es posible suponer que para un tiempo infinitesimal, ÃT (∆t) difiere de la iden-
tidad I˜ por términos del orden de ∆t.
242 / Mecánica clásica avanzada
O sea que:
o también:
3
X
ǫ̃ = Ci G̃i δΦ = (C1 ê2 ∧ ê3 + C2 ê3 ∧ ê1 + C3 ê1 ∧ ê2 )δΦ (7.222)
i=1
Las matrices G̃i se llaman los generadores infinitesimales del grupo de rotaciones.
Satisfacen:
~~ 1
G i = ǫijk êj ∧ êk (7.223)
2
El conmutador de dos generadores obedece la siguiente propiedad:
3
X
G̃i G̃j − G̃j G̃i = ǫijk G̃k (7.224)
k=1
244 / Mecánica clásica avanzada
Las ecuaciones (7.224) definen el álgebra de Lie del grupo de rotaciones. Con esta
notación podemos escribir a (7.214) como:
X 3
d~r
= Ci G̃i ~r (7.225)
dΦ i=1
Estas fórmulas, como hemos dicho, están dentro de la interpretación activa de las
rotaciones.
0 = Ã ˙ T ~r = −ÃÃ
˙ T ~r + ÃT ~r˙ ⇒ ~r˙ = −(ÃT )−1 Ã ˙ T ~r (7.229)
Definimos la matriz Ω̃ ası́:
˙ T = Ã
Ω̃ = −ÃÃ ˙ ÃT (7.230)
De (7.228) y (7.229) vemos que ~r = Ω̃~r0 . Además:
˙ T = −(Ã
Ω̃ = −ÃÃ ˙ ÃT )T = −Ω̃ (7.231)
Por tanto Ω̃ es una matriz antisimétrica. Sus elementos son entonces de la forma:
3
X
Ωij = ǫijk ωk (7.232)
k=1
Por tanto:
~r˙ = −~
ω × ~r (7.234)
Podemos expresar a ωi en términos de las Ωij . Para ello multiplicamos (7.232) por
ǫijl y sumamos sobre i, j:
X 3
3 X 3 X
X 3
ǫijl Ωij = ǫijl ǫijk ωk (7.235)
i=1 j=1 i=1 k=1
3 X
X 3
ǫijl ǫijk = 2δlk (7.236)
i=1 j=1
3 3
1 XX
ωl = ǫijl Ωij (7.237)
2 i=1 j=1
3 3 3
1 XXX
ωl = Ȧik Ajk ǫijl (7.238)
2 i=1 j=1
k=1
3
X
Aij = δij cos Φ + Cj Ck (1 − cos Φ) + ǫjkl Cl senΦ (7.239)
l=1
X3
d d
Ȧik = −δik senΦ Φ̇ + [Ci Ck (1 − cos Φ)] + ǫjkm (Cm senΦ) (7.240)
dt m=1
dt
246 / Mecánica clásica avanzada
3
X d
ǫijm cos Φ (Cm senΦ) − Ci Cj (1 − cos Φ)senΦ Φ̇+
m=1
dt
d
Cj [Ci n̂(1 − cos Φ)] · n̂(1 − cos Φ)+
dt
3 (7.241)
X d
ǫikm (Cm senΦ)Cj Ck (1 − cos Φ)−
m=1
dt
3
X 3
X d
ǫjil Cl sen2 Φ Φ̇ + ǫjkl [Ci Ck (1 − cos Φ)]Cl senΦ+
dt
l=1 l=1
3
X d
(δji δlm − δjm δli )Cl senΦ (Cm senΦ)
dt
l,m=1
P3
donde hemos usado la conocida propiedad del tensor de Levi-Civita, l=1 ǫkij ǫklm =
δil δjm − δim δjl . Las ecuaciones (7.241) se simplifican notando que n̂.n̂˙ = 0 y n̂ × n̂ = 0 y
P3 ~ ~
k=1 ǫijk Ai Bj = (A × B)k . Luego, al multiplicar por ǫikl y sumar sobre i y sobre j, no-
tando además que ǫijk se anula cuando tiene subı́ndices repetidos, obtenemos finalmente
para ~ ω:
Con la interpretación activa de las rotaciones, la velocidad angular que hemos ob-
tenido nos permite hallar, por medio de (7.234), la forma en que cambia con el tiempo
el vector de posición de un punto arbitrario del cuerpo rı́gido.
~r˙ = Ω̃~r = −~
ω × ~r (7.245)
Cinemática del cuerpo rı́gido / 247
ahora ~
ω es la velocidad angular de los ejes unidos al cuerpo rı́gido en el sistema de
coordenadas espacial. El tratamiento es igual al anterior, con sólo reemplazar a à por
ÃT :
Ω̃ = −ÃT Ã ˙ T Ã
˙ = Ã (7.246)
donde ÃT se obtiene de (7.138) con sólo reemplazar a Φ por −Φ. ~ω estará dada en
términos de à por:
3 3 3
1 XXX T
ωl = Ȧik Akj ǫijl (7.247)
2 i=1 j=1
k=1
ahora n̂ es el eje alrededor del cual giran los ejes coordenados unidos al cuerpo rı́gido,
y Φ es el ángulo de rotación en el sentido de la regla de la mano derecha (contrario a
las agujas del reloj). ~
ω puede también ser evaluada en términos de los ángulos de Euler.
Para ello hay varias posibilidades de cálculo.
(a) Considerar que ~ ω tiene componentes a lo largo de los ejes de las rotaciones
sucesivas que definen los ángulos de Euler:
donde en (7.251) hemos usado la ecuación (7.122). Las ecuaciones (7.251) permiten
escribir a (7.250) en la forma:
De manera similar se obtiene para ~ω respecto a los ejes fijos al cuerpo rı́gido:
~ω = (ψ̇ + φ̇ cos θ)êz + (φ̇ senθ cos ψ − θ̇ senψ)êy
(7.253)
+(φ̇ senθ senψ + θ̇ cos ψ)êx
(b) La otra posibilidad de cálculo consiste en usar la ecuación que define a Ω̃,
(7.246). Ã se puede expresar como producto de tres rotaciones según (7.131). Por tanto:
˙ , ...
Si llamamos Ω̃φ = ÃTφ Ãφ
Ω̃ = Ω̃φ + ÃTφ Ω̃θ Ãφ + ÃTφ ÃTθ Ω̃φ Ãθ Ãφ (7.256)
Claramente Ã~r˙ no es ~r˙ , puesto que esta última es cero. Usando (7.246) y la or-
togonalidad de à obtenemos que à Ω̃ à = Ãà ˙ T , matriz que llamaremos Ω̃ que es Ω̃
transformada a las coordenadas fijas al sólido rı́gido. La matriz Ω̃ es antisimétrica:
T
Ω̃ = Ã ˙ ÃT = −ÃΩ̃ÃT = −Ω̃
˙ ÃT = Ã(ÃT Ã) (7.260)
por tanto puede expresarse como:
3
X
Ωij = ǫijk ω k (7.261)
k=1
Esto conduce a:
Ã~r˙ = Ω̃~r = −ω
~ × ~r (7.262)
Entonces se sigue que:
3 3 3
1 XXX
ωl = ǫijk Aik ȦTkj (7.263)
2 i=1 j=1
k=1
∂ 2 λ1 ∂ 2 λ1
= 0 ; en tanto que = cos θ senφ (7.268)
∂ψ ∂θ ∂θ∂ψ
∂ 2 λ1 ∂ 2 λ1
= 0 ; en tanto que = sen θ cos φ
∂ψ ∂φ ∂φ∂ψ
250 / Mecánica clásica avanzada
En (7.269) ~
ω está dada por (7.248), que es el negativo de la velocidad angular que
usan algunos
autores para describir
las
rotaciones desde el punto de vista pasivo y para
los cuales dG~ = −~ω × G ~ dt.
rotacional espacio
~ visto en los ejes espaciales es:
Entonces el cambio en G
~
dG ~
= dG ~
− ~ω × Gdt (7.270)
espacio cuerpo
o también:
! !
~
dG ~
dG
= ~
− ~ω × G (7.271)
dt dt
espacio cuerpo
~ es:
La segunda derivada temporal de G
! ! !
~
d2 G ~
d2 G ~
dG
2
= 2
− 2~ω ×
dt dt dt
espacio cuerpo espacio (7.272)
+~ω × (~ω × G) ~˙ × G
~ −ω ~
Cinemática del cuerpo rı́gido / 251
La ecuación (7.270), y por tanto también (7.271) y (7.272), es válida sólo cuando
los ejes espaciales y del cuerpo rı́gido coinciden instantáneamente. Para una posición
arbitraria del cuerpo rı́gido se cumple:
~ =
G ~
ÃG
~˙ =
G ˙G
à ~˙
~ + ÃG (7.273)
~¨ =
G ¨G
à ˙G
~ + 2Ã ~˙ + ÃG
¨
~
~˙ y G
Las (7.273) pueden expresarse en función de ~ω . Los vectores G ~¨ se pueden
escribir respecto a los ejes espaciales ası́:
~˙ = G
ÃT G ~˙ + ÃT Ã
˙G~ y ~¨ = G
ÃT G
¨~ ˙G
+ 2ÃT Ã ~˙ + ÃT Ã
¨G ~ (7.274)
˙ obtenemos:
Usando la definición Ω̃ = −ÃT Ã,
Ω̃˙ = ˙ T Ã
−Ã ˙ − ÃT Ã
¨
(7.275)
2
Ω̃ = ˙ T Ã −ÃT Ã
à ˙ T Ã
˙ = −Ã ˙ ⇒ Ω̃˙ = Ω̃2 − ÃT Ã
¨
~˙ = G
ÃT G ~˙ − Ω̃G
~
(7.276)
~¨ = G
ÃT G
¨~ ~˙ + (Ω̃2 − Ω̃)
− 2Ω̃G ˙ G~
Ω̃˙ G ω˙ × G
~ = −~ ~ (7.278)
~˙ = G
ÃT G ~˙ + ~ ~
ω×G
(7.280)
T~¨ = G
à G
¨~
+ 2~ ~˙ + ω
ω×G ~ + ~ω˙ × G
~ × (~ω × G) ~
252 / Mecánica clásica avanzada
Vemos que (7.271) y (7.272) coinciden con (7.281) cuando à = I, ˜ esto es, cuando
escogemos los ejes de modo que coincidan instantáneamente.
En particular, para el vector de posición de una partı́cula moviéndose en el sistema
de coordenadas fijo a la Tierra, siendo ~ω la velocidad angular de la Tierra respecto al
sistema de ejes espacial, (7.281) nos da para à = I:˜
El fin de la dinámica del cuerpo rı́gido es describir la evolución del cuerpo rı́gido, o
sea, hallar las coordenadas generalizadas de rotación en función del tiempo cuando son
conocidas: (i) La distribución de masa del cuerpo rı́gido en reposo y (ii) Las fuerzas y
ligaduras que actúan sobre él. Cuando no hay ligaduras, los ángulos de Euler constituyen
un conjunto adecuado de coordenadas generalizadas independientes.
Hay distintas formas de llegar a las ecuaciones de movimiento para los ángulos de
Euler: a partir del lagrangiano, por medio de tres constantes de movimiento o por medio
de las ecuaciones de movimiento de Euler. Cuál forma se utiliza es algo que depende del
problema particular.
N
X Z
~ =
L mi~ri × ~r˙ i ; ~ =
L ρ(~r)~r × ~r˙ d3~r (8.3)
i=1
253
254 / Mecánica clásica
donde F~ (~r) es la fuerza por unidad de volumen en el punto ~r. Las ecuaciones (8.2),
(8.3) y (8.4) son cantidades evaluadas en el sistema de coordenadas espacial; es deseable
expresarlas en función de las coordenadas del cuerpo rı́gido.
Supondremos que el cuerpo rı́gido se translada a la vez que rota, siendo V ~ la
velocidad de translación del origen de coordenadas fijo al cuerpo y ω~ la velocidad angular
de rotación. Las fórmulas de transformación para la posición y la velocidad de un punto
arbitrario son, según las fórmulas (7.5), (7.244) y (7.245):
~r = V~ t + AT ~r ; ~ + AT ~r˙ − ~ω × ~r ′
~r˙ = V (8.5)
Por simplicidad hemos tomado a V ~ constante. El vector ~ω está dado por (7.248).
Si el punto en consideración es del cuerpo rı́gido entonces se cumple que ~r˙ = 0.
Por tanto:
(~ ~ =0
ω2 − ω~1 ) × R (8.10)
Dinámica del cuerpo rı́gido / 255
Energı́a cinética. La energı́a cinética respecto a los ejes espaciales, ecuación (8.2),
puede descomponerse usando (8.5):
1X
N h i
T = mi V~ 2 − 2V
~ · (~
ω × ~ri ) + (~ω × ~ri ′ )2 (8.11)
2 i=1
Cuando los ejes del cuerpo rı́gido coinciden instantáneamente con los espaciales,
~r = ~ri ′ , en vez de (8.13) podemos escribir:
N
1 ~2 1X 2
T = MV + ω × ~r i
mi ~ (8.14)
2 2 i=r
~
donde ~1 es el diádico unidad; vemos entonces que:
1 ~~ 1
Trotacional = ~ω · I · ~ω = ωs Ist ωt (8.22)
2 2
~ ~
En la definición de I~ tomamos los ejes del cuerpo rı́gido; I~ es el tensor de inercia
respecto a los ejes del cuerpo rı́gido con origen en el centro de masa. Sin embargo, cuando
~ = 0, T = Trotacional y la fórmula (8.22) resulta aplicable también en el caso en que el
V
origen de coordenadas no esté en el centro de masa.
~
Los elementos no diagonales de I~ reciben el nombre de productos de inercia (y a
veces el de momentos centrı́fugos respecto a los planos coordenados):
N
X
Ist = − mi r is rit ; s 6= t = 1, 2, 3 (8.27)
i=1
~~
I es un tensor simétrico, por lo tanto puede ser diagonalizado mediante una trans-
formación de semejanza realizada por una matriz ortogonal, sus valores propios son
reales y sus vectores propios son ortogonales, de acuerdo con conocidos teoremas del
álgebra de matrices.1
~ · n̂ = n̂ · ~I~ · n̂
Ln̂ = L ω = Iω (8.30)
~ rotacional al cuadrado es:
La magnitud de L
~ ~
ω · I~ · I~ · ω
L2 = ~ ~ 6= I 2 ω 2 (8.31)
~
Si n̂ es el eje de rotación vemos que In coincide con I = n̂ · I~ · n̂.
I ′ = I + M a2 (8.37)
donde a2 es:
~ × n̂)2
a2 = (R (8.38)
~ ~
donde I~ es el tensor de inercia respecto al centro de masa y I~ ′ es el tensor de inercia
~
respecto a unos ejes del cuerpo rı́gido con origen en R respecto al centro de masa.
~ ~~
Ejemplo 8.1.1 Expresar a I~ en términos de R i definida ası́:
0 z i −y i
~~
R̃i =
−z i 0 x i
o sea : R i = ǫmnl xil êm ên (8.40)
y i −xi 0
~~ ~~ ~
R r i~r i − r 2i ~1
i · Ri = ~ (8.41)
Dinámica del cuerpo rı́gido / 259
~~
Se sigue entonces la siguiente expresión para I:
N
X ~ ~
~~
I =− mi R i · R i (8.42)
i=1
Ejemplo 8.1.2 Hallar el lagrangiano para una placa uniforme rectangular rı́gida horizon-
tal que está colocada sobre cuatro resortes iguales, para el caso en el cual el centro de
la placa sólo puede tener movimientos perpendiculares a la placa. La placa sólo puede
desplazarse verticalmente y girar de modo que el centro permanezca fijo.
En las fórmulas dinámicas hemos supuesto que los ejes espacial y de cuerpo rı́gido
coinciden instantáneamente. Por esto debemos tomar nulos los valores de los ángulos de
Euler, con lo cual ω
~ yω ~ coinciden instantáneamente:
Vamos a admitir que los valores propios Iα puedan ser complejos. Entonces Iβ⋆
satisface:
X 3
⋆ ⋆
Itr Xβr = Iβ⋆ Xβt
⋆
; t, β = 1, 2, 3 (8.56)
r=1
⋆
Multiplicando a (8.55) por Xβr y a (8.56) por Xαt , sumando sobre r y t y restando
los resultados obtenemos:
X3 X 3 3 X
X 3 3
X
⋆ ⋆ ⋆ ⋆ ⋆
Irt Xαt Xβr − Itr Xβr Xαt = Iα Xαr Xβr Iβ
r=1 t=1 t=1 t=1 r=1
(8.57)
3
X
⋆
− Xβt Xαt
t=1
como Irt es real y simétrica, el lado izquierdo de (8.57) es nulo. El lado derecho puede
escribirse como un producto escalar ordinario, quedando:
~α · X
(Iα − Iβ⋆ )X ~ ⋆ = 0 ; α, β = 1, 2, 3 (8.58)
β
Para α = β se sigue de (8.58), debido a que X~α ·X~ ⋆ es real y positivo, que I ⋆ = Iα ,
α α
o sea que los valores propios son reales. Cuando X~α y X~ β corresponden a valores propios
diferentes, se sigue que son ortogonales. Escogiendo los vectores propios X ~ α normalizados
a la unidad y notando que cuando ocurra que Iα = Iβ entonces Xα · X ~ ~ β puede no ser
cero, pero que puede escogerse cero, obtenemos de esta manera que X ~ 1, X
~2 y X~ 3 , forman
una trı́ada ortonormal de vectores unitarios:
X~α · X
~ β = δαβ ; α, β = 1, 2, 3 (8.59)
Analicemos más en detalle el caso en que ocurran valores propios degenerados,
Iα = Iβ con α 6= β. De (8.58) se sigue que se debe cumplir, en el caso en que I1 6= I2 = I3 ,
que X~1 · X~2 = X~1 · X~ 3 = 0, pero no necesariamente se debe cumplir que X ~2 · X
~ 3 = 0.
~
Todos los vectores perpendiculares a X1 son vectores propios correspondientes al mismo
valor propio I2 , formando un espacio bidimensional, o sea que sólo hay dos vectores
propios de I2 linealmente independientes, con lo cual podemos escoger cualquier par
de vectores ortogonales, lo cual nos está a su vez indicando que el sólido rı́gido posee
~ 1.
simetrı́a de rotación alrededor del eje X
donde αrs son los cosenos directores de la transformación. Vemos que las componentes
de los nuevos vectores unitarios coinciden con los cosenos directores:
Xrs = αrs ; r, s = 1, 2, 3 (8.61)
Es decir, con los elementos de los vectores propios formamos una matriz que coin-
cide con la matriz de la transformación principal siendo las filas de tal matriz formadas
con las componentes de los vectores propios. Esta matriz es ortogonal.
Los cosenos directores también pueden escribirse en la forma αrs = X ~ r · ês y las
~~ ~ ~
componentes del tensor de inercia en las formas Irs = Xr · I · Xs y Itu = êt · I~ · êu , con
′ ~
lo cual las ecuaciones (8.60) de la derecha quedan en la forma de la identidad siguiente:
3
X
X~ r · ~I~ · X
~s = ~ r · êt ) êt · ~I~ · êu (êu · X
(X ~ s) (8.62)
t,u=1
′
Como Irs es diagonal, podemos escribir:
′
Irs ~ r · ~I~ · X
=X ~ s = Is δrs ; r, s = 1, 2, 3 (8.63)
~1 y R~~ ~
Las ecuaciones (8.68) y (8.69) nos dicen que los vectores X X1 son vectores
~~
propios de I con el mismo valor propio I1 ; estos dos vectores no necesariamente son
ortogonales pero sı́ son linealmente independientes y permiten escribir cualquier vector
en el plano perpendicular al eje de simetrı́a X ~ 3 . Si I1 = I2 = I3 se dice que el cuerpo
~~
rı́gido es esférico; en este caso I será diagonal respecto a cualquier sistema de ejes del
cuerpo rı́gido con origen en el centro de masa.
Ejemplo 8.2.1 Sea un cuerpo rı́gido formado por once masas discretas iguales distri-
buidas como se muestra en la figura 8.1. Las ocho masas del plano están sobre una
circunferencia de radio a, con un ángulo entre sı́ de 45o . Las masas del eje están a una
distancia a del centro de la circunferencia. Al rotar el cuerpo alrededor del eje un ángulo
2π/8, coincide consigo mismo; se dice que posee un eje de simetrı́a de orden 8. Sobre
el plano hay también cuatro ejes de simetrı́a de orden 2. Calcular las componentes del
tensor de inercia para este cuerpo y mostrar que dos momentos principales de inercia
son iguales.
Figura 8.1 Cuerpo rı́gido formado por once masas discretas iguales.
Podemos elegir los ejes del cuerpo rı́gido de modo que coincidan con la posición de
algunas de las masas, digamos, tomando el plano x − y en el plano de la figura y el eje z
264 / Mecánica clásica
a lo largo del eje de simetrı́a. Con esta elección se anulan los productos de inercia o sea
que dichos ejes forman un conjunto de ejes principales y los momentos de inercia serán
también momentos principales de inercia. Los valores de los Iα son:
Vemos que ninguno de los tres momentos principales de inercia es mayor que la
suma de los otros dos y que los momentos principales respecto a los ejes del plano de
simetrı́a son iguales.
Se puede demostrar que si en vez de x − y se toma cualquier par de ejes en ese
plano, perpendiculares o no entre sı́, el tensor de inercia resulta diagonal, siempre que
un eje pueda obtenerse a partir del otro eje mediante una de las operaciones de simetrı́a
del cuerpo. Es decir, cualquier par de ejes no colineales que hagan entre sı́ un ángulo
que sea un múltiplo de 2π/8, forma parte del conjunto de ejes principales del cuerpo.
Usando el lenguaje de la teorı́a de grupos, decimos que el cuerpo rı́gido posee un grupo
de simetrı́as de orden 8, el grupo puntual D4 , que consta de cuatro rotaciones alrededor
del eje de simetrı́a de orden 8, y cuatro rotaciones de π alrededor de ejes horizontales.
Además posee un conjunto de simetrı́as de reflexión en planos horizontales y verticales.
El conjunto de los vectores propios correspondientes al valor propio degenerado I1 cons-
tituye una representación irreductible del grupo de simetrı́as D4 .3
El elipsoide de inercia. Sea n̂ el vector unitario que define una dirección cual-
quiera. El momento de inercia respecto al eje n̂ es:
3
X
~
I = n̂ · I~ · n̂ = nr Irs ns (8.71)
r,s=1
donde nx , ny , nz , son los cosenos directores del eje (véase figura 8.2). Si tomamos un
punto cualquiera sobre el eje, estará descrito respecto al centro de masa por el vector de
posición ~r = (x, y, z) = r(nx , ny , nz ); por lo tanto si multiplicamos por r2 ambos lados
en (8.71) obtenemos:
Ahora consideremos un conjunto de ejes que pasen por el centro de masa. Entonces
podemos hallar el lugar geométrico de los puntos ~r para los cuales In r2 toma el mismo
valor. Este lugar geométrico es una superficie elipsoidal llamada el elipsoide de inercia
o elipsoide de momentos de inercia. Es claro que eligiendo adecuadamente el sistema de
coordenadas fijo al cuerpo rı́gido4 se obtiene la ecuación estándar para un elipsoide:
x2 y2 z2
2
+ 2 + 2 =1 (8.73)
a b c
3 Véase el capı́tulo de teorı́a de la simetrı́a en el libro de Mecánica cuántica no relativı́stica de Landau-
Lifshitz.
4 Que coincide instantáneamente con el sistema de coordenadas espacial.
Dinámica del cuerpo rı́gido / 265
Cuerpo r
rígido n
Elipsoide
de inercia:
In r 2 = constante
∂F
= 2xIxz + 2yIyz + 2zIzz = Knz
∂z
Si estas ecuaciones las dividimos por 2r, luego multiplicamos la primera por nx y la
tercera por nz , el resultado que se obtiene al sumarlas coincide con (8.72) si la constante
266 / Mecánica clásica
l2 = 3R2 (8.85)
Ejemplo 8.2.3 Tres masas iguales están en los puntos (a, 0, 0), (0, a, 2a) y (0, 2a, a),
hallar los momentos principales de inercia y un conjunto de ejes principales respecto al
origen de coordenadas.
Para i1 obtenemos las siguientes relaciones entre los componentes del vector propio
~ 1:
X
Vemos que los Xα1 pueden asignarse arbitrariamente, ya que la condición de nor-
malización sólo nos permite expresar a Xα2 en función de Xα1 . Este comportamiento es
caracterı́stico de los problemas de valores propios cuando hay degeneración. Una pareja
268 / Mecánica clásica
z
m
x2
x1
y
x3
x m
donde hemos tomado los ejes coincidiendo instantáneamente. Las ecuaciones (8.104) y
(8.105) nos dan:
dLr
+ ǫr st ωs ωt Lt = Kr ; r = 1, 2, 3 (8.106)
dt
Como escogemos los ejes rotantes coincidiendo con los ejes principales se cumple
que Lr = Ir ωr , de modo que obtenemos de (8.106) directamente las ecuaciones de Euler:
Ir ω˙r + ǫr st ωs ωt Is = Kr ; r = 1, 2, 3 (8.107)
Ejemplo 8.3.1 Sea un sistema de ejes primados que coinciden en el origen con un sistema
de ejes inercial pero que rota con respecto a los ejes inerciales con una velocidad angular
fija ω
~ 0 . Hallar las ecuaciones de movimiento de Euler para un cuerpo rı́gido que se mueve
respecto a este sistema de ejes rotantes en el caso en que no haya torques externos, V = 0.
ÃÃT = I˜ ; Ã ˙ T = 0;
˙ ÃT + ÃÃ ˙ ÃT ;
Ω̃′0 = Ã Ω̃′2 ˙ ˙T
0 = −ÃÃ (8.111)
llegamos a:
2
~r˙ = ~r˙ ′2 + 2~r ′T Ω̃′0 ~r˙ ′ − ~r ′T Ω̃′2
0 ~r′ (8.112)
Expresando ahora la matriz antisimétrica Ω̃′0 en términos del vector velocidad
angular respecto a los ejes rotantes:
Ω̃′0~r ′ = −~
ω0′ × ~r ′ ; Ω̃20~r ′ = ω
~ 0′ × (ω0′ × ~r ′ ) (8.113)
Entonces podemos escribir a (8.112) como:
2 2
~r˙ = ~r˙ ′ − 2~
ω0′ · (~r˙ ′ × ~r ′ ) − ω
~ 0 · [(~ω0′ × ~r ′ ) × ~r ′ ] (8.114)
La ecuación (8.114) puede llevarse a la forma:
~ 0′ · ~~1 × ~r ′2 − ~r ′~r ′ · ~ω0′
2 2
~r˙ = ~r˙ ′ + 2~
ω0′ · (~r ′ × ~r˙ ′ ) + ω (8.115)
L = T′ + ω ~′ + 1ω
~ 0′ · L
~
~ ′ · I~ · ~ω0 (8.116)
2 0
272 / Mecánica clásica
donde L~ ′ es el momento angular total respecto a los ejes rotantes e ~I~ es el momento de
inercia respecto a dichos ejes.
Si ahora el cuerpo rı́gido se mueve respecto a los ejes primados con velocidad
angular ~ω , es claro que:
1~ ~
T′ = ω · ~I · ~ω (8.117)
2
~
donde ~I es el momento de inercia respecto a los ejes del cuerpo rı́gido, que podemos
tomarlos como ejes principales.
Ahora se cumple que:
Ω ˜ ′ Ã′T
˜ = Ã′ Ω (8.119)
0 0
Con lo cual construimos el tensor de inercia respecto a los ejes del cuerpo rı́gido.
Finalmente, L toma la forma:
XN
1~ ~~ ~
L= ~+
ω·I ·ω ~ × ~r i + 1 ω
mi ~ω 0 × ~ri · ω ~ 0 · ~I · ω
~0 (8.122)
2 i=1
2
1
+ (sen2 θ sen2 ψ I1 + sen2 θ cos2 ψ I2 + cos2 θI3 )ω02
2
Dinámica del cuerpo rı́gido / 273
ω 3 = ψ̇ + cos θ φ̇
y las inversas:
senψ ω 1 + cos ψ ω2
φ̇ = ; θ̇ = cos ψ ω1 − senψ ω2
senθ (8.132)
ψ̇ = − cot θ(senψ ω 1 + cos ψ ω 2 ) + ω3
5 Ver el texto de Corben y Stehle, Classical mechanics, sección 77, capı́tulo 13, 1960.
274 / Mecánica clásica
Si llamamos q̇1 = φ̇, q̇2 = θ̇, q̇3 = ψ̇, estas fórmulas pueden escribirse en forma de
matrices:
~ω = α̃~q˙ ; q~˙ = β̃ ω
~ (8.133)
donde α̃ y β̃ son:
senθ senψ cos ψ 0
α̃ =
senθ cos ψ −senψ 0
cos θ 0 1
(8.134)
senψ cos ψ
0
senθ senθ
β̃ = cos ψ −senψ 0
−senψ cot θ − cos ψ cot θ 1
∂L ∂ L̃ ∂ L̃ ∂αsu
= + q̇u (8.135)
∂qr ∂qr ∂ωs ∂qr
y que:
d ∂L d ∂ L̃
= αsr (8.136)
dt ∂ q̇r dt ∂ωs
Multiplicando a (8.135) y (8.136) por βrt y sumando sobre r llegamos a la siguiente
expresión para las ecuaciones de Lagrange en L̃:
∂ L̃ ∂ L̃ ∂αsu
βrt + βrt βuυ ω υ =
∂qr ∂ωs ∂qr
d ∂ L̃ ∂ L̃ ∂αsr
βrt αsr + βuυ ωυ βrt (8.137)
dt ∂ω s ∂ωs ∂qu
Usando la propiedad α̃β̃ = I˜ obtenemos finalmente:
∂ L̃ d ∂ L̃ ∂ L̃
βrt − = γtυs ωυ ; t = 1, 2, 3 (8.138)
∂qr dt ∂ωt ∂ω s
donde:
∂αsr ∂αsu
γtυs = − βrt βuυ (8.139)
∂qu ∂qr
Para nuestro caso, el lagrangiano está dado por la ecuación (8.97):
1 ~ ~~ ~
L̃(q, ω) = ω · I · ω − V (q) (8.140)
2
Dinámica del cuerpo rı́gido / 275
y ası́:
∂ L̃ ∂V ∂ L̃
=− = Kr ; = ωr Ir (8.141)
∂qr ∂qr ∂ωr
Por tanto obtenemos de (8.138):
3
X
Kr βrt − ω̇ t It = γtυs ωυ ω s Is ; t = 1, 2, 3 (8.142)
υ,s=1
Kr son los torques alrededor de los ejes z, µ1 y z, en tanto que los lados derechos
de (8.148) son los torques alrededor de los ejes x, y, z.
Ejemplo 8.3.3 Otra variante de solución del ejemplo 8.3.1 puede obtenerse partiendo de
las ecuaciones de Lagrange (8.138).
Para este problema tenemos que:
∂ L̃ ~ ∂ω0 ∂ L̃ ~ + ~ω 0 ) · ~I~
ω + ~ω 0 ) · I~ ·
= (~ ; = (ω (8.149)
∂~q ∂~q ∂ω~
En términos de componentes, las ecuaciones (8.138) son:
3
X ∂ω0m
βrt (ω 0m + ωm )Im − ω̇ 0t + ω̇t It =
r,m=1
∂qr
3
X
ǫtυs (ω s + ω0s )Is ω υ (8.150)
υ,s=1
O en otra forma:
X 3
∂ω0m
(ω̇ 0t + ω̇t )It = βrt − ǫt,m,r ω r (ω 0m + ω m )Im (8.151)
r,m=1
∂qr
Cuerpo
rígido
Elipsoide
de inercia b
a
c
r
P
∆
F L
ω
~ = 2r T
d~ · L (8.162)
ω
si escogemos a d~ paralelo a L,
~ entonces adquiere la forma:
2r ~
L
d~ = T 2 (8.163)
ω L
~ y es la normal al plano
La expresión (8.161) es la ecuación de un plano, donde L
y ~r es un punto del mismo.
Como ~r es un punto particular (el punto donde se cortan el eje de rotación y el
elipsoide de inercia) que puede estar cambiando con el tiempo, vemos entonces que el
elipsoide se mueve de tal manera que el punto donde se corta con el eje de rotación
siempre permanece sobre un plano (véase figura 8.4). d~ es un vector constante, pues
usando las relaciones:
1 2
Ir2 = constante y T = Iω = constante (8.164)
2
podemos escribir el vector d~ como una expresión que solo depende de T y L:
~
√
2Ir2 T ~
d~ = L (8.165)
L2
Dinámica del cuerpo rı́gido / 279
Línea invariable
Polodia
Plano invariable
0
r d
P
Herpolodia
r –d
ω L
Figura 8.5 El elipsoide de inercia rueda sin deslizar sobre el plano invariable
r
ω
~ ·L~
~ = 2T L
L ~ = 2T ~
d (8.166)
L 2 L2 Ir2
ω ~
~ ·L Ir2 ω
= (8.167)
ωL L r2
el elipsoide de inercia. Es fácil demostrar que respecto a los ejes del cuerpo rı́gido la
magnitud de L ~ es una constante:
d 2
L = 2L~ ·L~˙ = −2L~· ω ~ =0
~ ×L (8.168)
dt
Esto implica que respecto a los ejes del sólido rı́gido ~r está además sobre el elipsoide:
Ir2 L2
I12 x2 + I22 y 2 + I32 z 2 = (8.169)
2T
La polodia es, en consecuencia, el lugar geométrico de los puntos del elipsoide de
inercia que satisfacen simultáneamente las ecuaciones (8.73) y (8.169); es decir, es el
lugar geométrico de la intersección de dos elipsoides cuyos semiejes están dados respec-
tivamente por:
Ir2 Ir2 L2 Ir2 Ir2 L2 Ir2 Ir2 L2
a2 : , ; b2 : , ; c2 : , (8.170)
I1 I1 2T I1 I2 I2 2T I2 I3 I3 2T I3
La existencia de una intersección está asegurada por las desigualdades evidentes:
~
I = ~n · I~ · ~n ≥ I1 ; I ≤ I3 ⇒ 2T I1 < L2 < 2T I3 (8.171)
siendo I1 el más pequeño de los tres momentos principales de inercia e I3 el mayor.
Cono fijo
ω
z
L
Figura 8.6 El cono del cuerpo rı́gido rueda sin deslizar sobre el cono fijo
alrededor del vector constante L ~ y en el sistema del cuerpo rı́gido precesa alrededor del
eje de simetrı́a. En conclusión, el movimiento del cuerpo rı́gido puede obtenerse a partir
del movimiento del cono del cuerpo rı́gido que rueda sin deslizar sobre el cono fijo.
Es claro que para un cuerpo no simétrico la polodia no será una circunferencia, ~ω
no será constante, como tampoco el ángulo entre los vectores ~ω y L.~ En el cuerpo rı́gido
asimétrico se presentarán estos tres movimientos: rotación alrededor del eje instantáneo
de rotación; precesión del eje instantáneo de rotación alrededor del vector constante L ~
~
y nutación del eje instantáneo de rotación al cambiar el ángulo entre los vectores ~ω y L.
Es claro que la frecuencia de nutación es el doble de la frecuencia de rotación.
I3 ω̇z = 0 (8.176)
El resultado nos dice que el vector ~ω precesa alrededor de z a una rata constante
|Ω|. Como no hay nutación se dice que la precesión es regular. El resultado está de
acuerdo con las conclusiones obtenidas mediante la construcción de Poinsot.
Ejemplo 8.4.1 Analizar el movimiento rotacional de la Tierra con un modelo de cuerpo
rı́gido simétrico libre.
La Tierra puede suponerse aproximadamente como un elipsoide achatado y con una
distribución uniforme de materia. Entonces la masa total puede asumirse que está en el
centro de masa, de modo que con esta aproximación los demás cuerpos celestes no reali-
zarán torques. Los momentos principales de inercia respecto al centro para un elipsoide
son:
1 1 1
I1 = M (b2 + c2 ) ; I2 = M (a2 + c2 ) ; I3 = M (a2 + b2 ) (8.180)
5 5 5
Con este modelo tenemos que para la Tierra se cumple:
I3 ≈ I1 = I2 ; c≈a=b (8.181)
La relación entre los diámetros polar y ecuatorial nos da:
c
= 0, 9672 (8.182)
a
Tomando el eje z a lo largo del eje polar y sabiendo que la rotación completa
alrededor de un eje es un dı́a, obtenemos:
2π
ωz ≈ = 7, 272 × 10−5 rad/s (8.183)
dı́a
La magnitud de la precesión, A, dependerá de la medida en que difieran ω y ωz ,
que es pequeña. La frecuencia de precesión está dada por:
I1 − I3
|Ω| = ωz ≈ 1 − c ωz = 0, 00328ωz (8.184)
I1 a
El perı́odo de precesión será pues de unos 305 dı́as. Se ha observado que tal pre-
cesión se presenta siendo su amplitud pequeña. El “radio” de la polodia es aproximada-
mente de 5 a 8 metros. La polodia es una curva complicada que exhibe algo ası́ como una
nutación. El perı́odo observado es de unos 427 dı́as; es una precesión no atribuible a tor-
ques; las discrepancias se deben a la idealización del modelo. Esta precesión es diferente
a la precesión de los equinoccios, debida a los torques ejercidos por el Sol y la Luna,
pues en realidad el centro de masa de la Tierra no coincide con el centro geométrico, el
perı́odo de esta precesión es de 25.800 años. Esta precesión tampoco es la responsable
de las estaciones. Éstas se deben a que el plano de la elı́ptica hace un ángulo de 23◦ con
el plano ecuatorial de la Tierra.
Si z es una variable compleja, en general una función elı́ptica Fpq (z) es una función
que posee un cero en el punto z = p y un polo en el punto z = q, donde p y q son los
puntos de una red rectangular infinita en el plano complejo. En la construcción de esta
red se parte de una celdilla elemental constituida por un rectángulo cuyos vértices están
en los puntos O, K, K + iK ′ , iK ′ , llamados respectivamente s, c, d, n. Los números
reales K y K ′ están definidos de la siguiente manera en función de un parámetro real
m, 0 ≤ m ≤ 1:
Z π/2 Z π/2
dθ dθ
K= √ ; K′ = p (8.185)
0 1 − msen2 θ 0 1 − (1 − m)sen2 θ
φ = am z (8.187)
Todas las otras nueve funciones pueden expresarse en función del trio copolar sn,
cn, dn. Estas funciones aparecen al evaluar ciertas integrales, llamadas integrales elı́pti-
cas, que son de la forma:
Z
R(x, y) dx (8.189)
Z φ (8.190)
dθ
p
0 (1 − n sen2 θ)(1 − m sen2 θ)
Cuando φ = π/2, las integrales (8.190) se llaman integrales elı́pticas completas de
primera, segunda y tercera clase. Cuando el parámetro toma el valor cero las funciones
elı́pticas coinciden con funciones circulares. Cuando el parámetro es tan pequeño que
podemos despreciar términos de orden superior a m2 tenemos las aproximaciones:
1
sn z = sen z − m(z − sen z cos z) cos z + ...
4
1
cn z = cos z + m(z − sen z cos z) sen z + ...
4
(8.191)
1
dn z = 1 − m sen2 z + ...
2
1
an z = z − m(z − sen z cos z) + ...
4
Cuando m tiende a la unidad, las funciones elı́pticas coinciden con funciones hi-
perbólicas; por ejemplo sn z → tanh z; cn z → 1/ cosh z; dn z → 1/ cosh z. A partir
de la ecuación diferencial que sirve para definir la función sn podemos obtener buena
información del comportamiento de las funciones elı́pticas, para z real.
La ecuación (8.186) equivale a la ecuación diferencial:
2
dφ
= 1 − msen2 φ (8.192)
dx
Mediante la sustitución y = sen φ, (8.192) se transforma en:
2
dy
= (1 − y 2 )(1 − my 2 ) (8.193)
dx
2
Claramente y = sen x es la solución cuando m = 0 (véase figura 8.7). (dy/dx)√
es igual a una función continua de y que se anula en y = ±1 y √ en y = ±1/ m; en
y = ±1 la derivada
√ de esa función vale ±2(m − 1) y en y = ±1/ m la derivada vale
∓2(m − 1)/ m.
De (8.193) podemos deducir las siguientes propiedades de la solución, y = s nx:
(i) Si y(x) es una solución, y(x + c) es una solución ya que ni y ni dy/dx cambian
en una translación en el eje x.
(ii) y(x) está siempre contenida √ entre los valores y = −1 y y = +1 puesto que para
valores absolutos de y entre√1 y 1/ m, dy/dx es imaginaria, como también lo es para
valores de y mayores que 1/ m.
Dinámica del cuerpo rı́gido / 285
(iii) Como para todos los valores de y entre −1 y +1 la derivada dy/dx es no nula,
se sigue que en el intervalo (−1, +1) no hay otros puntos diferentes a y = ±1 donde la
pendiente se anule dentro del intervalo.
(iv) Sólo hay una curva y(x) que toca una de las lı́neas y = −1 o y = +1 en un
punto x0 dado. Para x < x0 y para x > x0 la pendiente de y en la vecindad de x0 tiene
valores opuestos. Por ejemplo, si (x = x0 , y = −1) es el punto en cuestión, se sigue
integrando (8.193):
Z y
dy
x − x0 = − p
−1 (1 − y )(1 − my 2 )
2
Z y (8.194)
dy
x − x0 = p
−1 (1 − y 2 )(1 − my 2 )
según que dy/dx sea negativa o positiva respectivamente.
y=1
dn x
sn x
x0
x
2K
cn x
y = –1
Cuando (x, y) tiende a (x0 , −1), las ecuaciones (8.194) dan la única curva y(x) que
satisface la condición de tangencia.
(v) La curva y(x) es inalterada mediante una reflexión en el origen. Basta con
conocer la curva entre y = 0 y y = 1, o equivalentemente entre x = 0 y x = K para
construir la curva total.
(vi) La distancia en x entre dos sucesivos contactos de y(x) con las lı́neas y = −1
y y = +1 está dada por:
Z +1
dy
2K = p (8.195)
−1 (1 − y )(1 − my 2 )
2
286 / Mecánica clásica
con la condición de que las funciones y sus derivadas sean continuas. Como 0 ≤ m ≤ 1,
dnx siempre puede tomarse positiva. El perı́odo de cn x es 4K y el de dn x es 2K. Se
sigue de (8.196) que:
dsn x
= cn x dn x (8.198)
dx
de (8.196) y (8.197) se sigue entonces que:
dcn x ddn x
= −sn x dn x ; = −m sn x cn x (8.199)
dx dx
La figura 8.7 muestra las funciones elı́pticas de Jacobi sn, cn y dn, para m = 1/2.
Con las funciones elı́pticas es posible hallar fórmulas análogas a las de la trigono-
metrı́a ordinaria. Por ejemplo, la fórmula de adición para la función sn es:
sn u cn υ dn υ ± sn υ cn u dn u
sn(u ± υ) = (8.200)
1 − m sn2 u sn2 υ
Algunos valores notables de sn son:
sn 0 = 0 ; sn K = 1 ; sn iK ′ = ∞
1 K 1 (8.201)
sn(K + iK ′ ) = √ ; sn =p √
m 2 1 + m1
Landau (ver bibliografı́a). Nos interesará la función θ4 que tiene la siguiente expresión
como un producto infinito (fórmula 16.37.4 del del libro de Abramowitz):
1/2 Y∞
m
θ4 (v) = θ4 (0) (1 − 2q 2n−1 cos 2v + q 4n−2 ) (8.203)
16qm21 n=1
Esta expresión tiene polos simples donde θ4 tiene ceros simples, o sea cuando v es
tal que:
′
e±2iv = ei(2n−1)πiK /K
(8.207)
es decir, cuando u = 2Kv/π, vale:
urm = (2r + 1)iK ′ + 2mK ; r, n = 0, ±1, ±2. . . ± ∞ (8.208)
Con esta expresión para los polos de θ4′ /θ4 podemos formar la serie de Laurent
para esta función:
+∞
X +∞
X
θ4′ (v) brm
= (8.209)
θ4 (v) r=−∞ m=−∞ v − vrm
las ecuaciones de la polodia están dadas por la intersección del elipsoide de inercia con
el elipsoide del momento angular:
I1 ω21 + I2 ω 22 + I3 ω 23 = 2E
(8.212)
I12 ω21 + I22 ω 22 + I32 ω23 = L2
De estas ecuaciones podemos obtener las siguientes expresiones para ω21 y ω23 en
función de ω 22 :
1
ω21 = [(2EI3 − L2 ) − I2 (I3 − I2 ) ω 22 ] (8.213)
I1 (I3 − I1 )
1
ω23 = [(L2 − 2EI3 ) − I2 (I2 − I1 ) ω 22 ] (8.214)
I3 (I3 − I1 )
Si para precisar suponemos que 2EI3 > L2 > 2EI2 , encontramos entonces que a2
2
y b son positivas. Notamos que al expresar a L y a E en función del momento de inercia
alrededor del eje de rotación I, esta condición nos dice que I3 > I > I2 > I1 , con lo cual
obtenemos que a es mayor que b. Con estas sustituciones, y escogiendo t = 0 de modo
que ω 2 sea igual a cero, la integral de (8.215) es de la forma:
1/2 Z ω2
I1 I2 I3 a dω 2
t= p (8.217)
(I3 − I2 )(L2 − 2EI1 ) 0 (a − ω 22 )(b2 − ω 22 )
2
ω2 = b sn v (8.219)
Dinámica del cuerpo rı́gido / 289
Estos ceros del denominador son simples, o sea que la función puede expandirse en
series de Laurent de la forma (8.209):
X+∞ +∞
"
1 1 X arm
L −
I2 I1 r=−∞ m=−∞ (−1)r ct + iβ − urm
# (8.238)
brm
− + constante
(−1)r ct − iβ − urm
cn(±iβ + iK ′ ) dn(±iβ + iK ′ )
donde hemos usado la periodicidad de las funciones elı́pticas. Usando (8.236) y luego las
expresiones (8.231), llegamos a que arm y brm valen respectivamente:
1/2
dn iβ 1 I1 I2 (I3 − I2 )(I − I1 )
± =± (8.240)
2m sn iβ cn iβ 2i II3 (I2 − I1 )
Los residuos del segundo término de (8.235) son entonces:
c
±i (8.241)
2
Por tanto el segundo término del lado derecho de (8.235) es:
+∞ +∞
"
c X X 1
i r
2 r=−∞ m=−∞ (−1) ct + iβ − urm
# (8.242)
1
− + constante
(−1)r ct − iβ − urm
292 / Mecánica clásica
Es fácil ver que u−r,−m = ur−1,m , con lo cual es posible hacer que los términos
con r impares tengan la misma forma de los términos con r pares. Entonces (8.242) es
igual a una expresión que no contiene el (−1)r . Usando la expresión (8.226) para c y
luego multiplicando numeradores y denominadores por π/(2K), obtenemos:
+∞ +∞
"
π X X 1
i
T r=−∞ m=−∞ π (ct + iβ) − vrm
2K
# (8.243)
1
− π + constante
(ct − iβ) − vrm
2K
Comparando ahora a (8.243) con (8.236), obtenemos finalmente la siguiente expre-
sión para φ̇ en términos de las funciones θ:
"
L iπ θ4′ [(ct + iβ)π/(2K)]
φ̇ = +
I1 T θ4 [(ct + iβ)π/(2K)]
#
θ4′ [(ct − iβ)π/(2K)] θ4′ (iβπ/2K)
− −2 (8.244)
θ4 [(ct − iβ)π/(2K)] θ4 (iβπ/(2K)
Asumamos que el cuerpo inicialmente gira alrededor del eje x1 y que además
I3 > I2 > I1 . Por efecto de alguna pequeña perturbación el cuerpo adquiere rotaciones
alrededor de los otros ejes; asumiremos que ω2 y ω3 son entonces cantidades pequeñas
en comparación con ω1 . La ecuación de Euler para ω1 contendrá el producto ω2 ω3 , o sea
que al primer orden en estas cantidades ω 1 es constante. Esto permite resolver fácilmente
las otras dos ecuaciones de Euler:
I3 − I1 I1 − I2
ω˙2 = ω 1 ω 3 ; ω˙3 = ω1 ω 2 (8.249)
I2 I3
De aquı́ obtenemos la siguiente ecuación diferencial para ω2 :
(I1 − I3 )(I1 − I2 ) 2 2
ω¨2 + ω1 ω2 = 0 (8.250)
I2 I3
Esta ecuación tiene como solución:
ω 2 = A sen(Ω1 t + δ) (8.251)
donde A es una cantidad pequeña y Ω1 satisface:
1/2
(I3 − I1 )(I2 − I1 )
Ω1 = ω1 (8.252)
I2 I3
Como Ω1 es real, entonces ω 2 y ω 3 tendrán movimientos oscilatorios con frecuencia
Ω1 . La rotación alrededor de x1 es estable. De manera similar, cuando el cuerpo rota
inicialmente alrededor de x3 , el movimiento es estable con frecuencia:
1/2
(I3 − I2 )(I3 − I1 )
Ω3 = ω3 (8.253)
I1 I2
Sin embargo, cuando el cuerpo rota inicialmente alrededor de x2 el movimiento
es inestable porque Ω2 resulta imaginario. O sea que para rotaciones alrededor del eje
de menor momento de inercia o del eje de mayor momento de inercia hay estabilidad,
siendo inestable la rotación alrededor del eje correspondiente al momento de inercia in-
termedio. Para un cuerpo rı́gido simétrico, digamos para el cual I1 = I2 , es fácil mostrar
que solamente es estable la rotación alrededor del eje x3 .
Ejemplo 8.4.3 Calcular los diferentes perı́odos asociados con el movimiento libre de un
elipsoide homogéneo asimétrico cuyos semiejes tienen las longitudes a = 0, 1m, b = 0, 2m,
c = 0, 3m y cuya masa es de 1 kg. Los valores iniciales de las componentes de la velocidad
angular alrededor de los ejes principales son ω1 = πs−1 , ω 2 = 10πs−1 , ω 3 = πs−1 ,
asumiendo que I1 < I2 < I3 .
De acuerdo con las fórmulas (8.180), los valores de los momentos principales de
inercia son:
I1 = 0, 010 kg m2 ; I2 = 0, 020 kg m2 ; I3 = 0, 026 kg m2 (8.254)
Los valores de las constantes de movimiento 2E y L son:
2E = 2, 036π 2J ; L2 = 0, 040776π 2J2 s2 (8.255)
294 / Mecánica clásica
I = 0, 0200275 kg m2 (8.256)
La tabla 17.2 del texto de Abramowitz y Stegun nos da los siguientes valores para
q, K y K ′ , usando interpolación lineal:
El perı́odo de los ángulos θ y ψ es T = 4K/c, que tiene el valor 1,010 s. Para hallar
el perı́odo de φ debemos calcular el valor de β. La fórmula (8.231) nos da que:
dn iβ = 2, 3094003 (8.260)
β = 1, 1258087 (8.262)
z
y
c.g.
l
mg θ
y
0
ψ
x φ
Figura 8.8 Trompo con el punto inferior fijo en un campo gravitacional. Sistema de ejes.
Vef (u)
f (u)
E′
E′0
–1 u1 0 u2
u0 +1 u3
Vemos que para un valor dado de E ′ habrá dos valores de u, u1 y u2 para los cuales
′
E = Vef (u), o sea para los cuales u̇ = 0 (θ̇ = 0). Éstos son los puntos de retorno de
la coordenada θ. Vemos que en general θ oscilará entre θ1 y θ2 esto es, habrá nutación.
Cuando E ′ = E0′ entonces u1 = u2 = u0 y no habrá nutación; este caso corresponde a
la precesión estable o regular. u1 y u2 corresponden a los ceros de la función f (u) en el
intervalo entre u = −1 y u = 1.
La función f (u) es un polimonio cúbico en u que tiene el siguiente comportamiento.
En u = ±1 la función f es negativa, puesto que f (±1) = −(b ∓ a)2 . Para algunos valores
de u entre −1 y +1, f (u) debe de ser positiva porque el lado izquierdo en (8.274) es
positivo. Cuando u → ∞, f (u) es positiva y cuando u → −∞, f (u) es negativa. La
figura 8.9 muestra el comportamiento de f (u), la cual tiene por lo tanto dos raı́ces reales
u1 y u2 que se sitúan entre −1 y +1, y la tercera raı́z u3 es también real y mayor que +1
(que corresponde a un valor de θ imaginario puro). Llamemos a esas raı́ces cos θ1 , cos θ2 ,
cosh θ3 , donde hemos convenido en designar con θ3 al módulo del ángulo correspondiente
a u3 y donde cos θ2 > cos θ1 , con lo cual θ1 > θ2 .
E0′ es el valor de E ′ para el cual θ1 y θ2 son iguales, o sea, el valor de E ′ en el cual
Vef tiene un mı́nimo. Este caso es análogo al de las órbitas circulares en el problema de
298 / Mecánica clásica
Vef (θ)
E′
E′0
0 θ2 θ0 θ1 π θ
4 α + a2
u= z+ (8.278)
β 3β
ż 2 = 4z 3 − g2 z − g3 = 4s(z) (8.279)
Si u1 , u2 y u3 son las raı́ces del polinomio cúbico f (u) entonces las raı́ces del
polinomio cúbico s(z) son:
β α + a2
zi = ui − = ei ; i = 1, 2, 3 (8.280)
4 12
Los coeficientes g2 y g3 pueden expresarse en función de los ei mediante las fórmulas
18.1 del texto de Abramowitz y Stegun:
La conexión entre z y t está dada en consecuencia por medio de una función elı́ptica
Dinámica del cuerpo rı́gido / 299
XX, Cambridge University Press, 1965; A treatise on analytical dynamics de E. T. Whittaker, capı́tulo
VI, Cambridge University Press, 1960.
300 / Mecánica clásica
Ṗ(iδ) Ṗ(iγ)
2iφ̇ = −
P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ)
(8.292)
Ṗ(iδ) Ṗ(iγ)
2iψ̇ = +
P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ)
De acuerdo con (8.284), la función P tiene un polo doble en el origen, o sea que la
función:
Ṗ(iδ)
(8.293)
P(x) − P(iδ)
tiene ceros en x = 0, tiene polos en x = iδ y x = −iδ, y en todos los puntos congruentes a
estos, es decir, que se obtengan por translaciones en múltiplos enteros de los perı́odos de
la función elı́ptica P(x), que son ciertos ω1 y ω2 , análogos a 2K y 2iK ′ en las funciones
elı́pticas de Jacobi. Los residuos de la función (8.293) en ésos polos son +1 y −1. En la
teorı́a de las funciones elı́pticas de Weierstrass existe una función, de la familia de las
funciones θ, que tiene una estructura analı́tica idéntica a la de la función (8.293). En
efecto, la función σ(x + iδ) tiene ceros en x = −iδ y en los puntos congruentes a éste, y
la función σ ′ (x + iδ)/σ(x − iδ) tiene polos en los puntos congruentes a x = −iδ y residuo
igual a −1, en tanto que σ ′ (x − iδ)/σ(x − iδ) tiene polos en x = iδ y residuo igual a +1.
En consecuencia la función (8.293) puede escribirse en la forma:
Esta expresión limita drásticamente los posibles valores de la velocidad angular del
trompo ωz alrededor de su eje de simetrı́a z:
4mglI1 u0
≤ ωz2 (8.303)
I32
El trompo rápido. Si ωz es tan grande que 2βu0 /a2 es mucho menor que la
unidad tenemos el caso del trompo rápido. De (8.303) vemos que la condición de trompo
rápido puede escribirse en la forma:
I3 1
mgl ≪ I3 ωz2 (8.304)
I1 2
Expandiendo al primer orden la raı́z cuadrada en (8.301) obtenemos para las fre-
cuencias de precesión de un trompo rápido:
(+) I3 ωz (−) mgl
φ̇0 = ; φ̇0 = (8.305)
I1 u0 I3 ωz
Dinámica del cuerpo rı́gido / 303
Para el caso en que θ0 > π/2 (u0 negativo), la condición de precesión estable
(8.302) se cumple para todos los valores de ωz . Este es el caso en que el trompo “cuelga”
(+) (−)
del punto fijo O. Según (8.305), cuando u0 < 1, φ̇0 y φ̇0 tienen signos opuestos.
Precesión con nutación. Ocurre cuando E > E ′ ; en este caso θ oscila entre θ1
y θ2 . La frecuencia angular de precesión está dada por (8.270):
b − a cos θ b/a − cos θ
φ̇ = =a (8.306)
sen2 θ sen2 θ
Se pueden presentar varios casos en cuanto al signo de φ̇:
(a) φ̇ tiene el mismo signo para todos los valores de θ. Ocurre que es positivo para
todos los valores de θ si:
b
> cos θ (8.307)
a
El trompo precesa siempre en la misma dirección alrededor del eje z en tanto que
el eje z oscila entre θ1 y θ2 . La precesión es monotónica con φ̇ siempre positivo. Si se
toma una esfera fija en el espacio, con centro en O, la “marca” que dejarı́a el eje z sobre
la esfera se representa en la figura 8.11.
z
Z
θ2 θ2 θ2
θ1 θ1 θ1
φ
a b c
Figura 8.11 “Marcas” que dejarı́a el eje z sobre la esfera: a. para b/a > cos θ, b. para
cos θ1 < b/a < cos θ2 y c. para cos θ2 = b/a
Esto implica que φ̇ es positivo para todo θ mayor que θ2 y se anula para θ =
θ2 . Entonces, como θ = θ2 es un punto de retorno, allı́ θ̇ es igual a cero. En θ =
θ2 el eje z se encontrará simultáneamente sin precesión y sin nutación, o sea que se
encuentra instantáneamente en reposo. El movimiento se representa en la figura 8.11c.
Esta situación corresponde al método más simple de dejar girando un trompo. Primero
se hace girar alrededor del eje z y luego se suelta haciendo un ángulo θ2 con la vertical.
Las condiciones para t = 0 son entonces θ = θ2 y θ̇ = φ̇ = 0. Las ecuaciones (8.272) y
(8.309) nos dicen entonces que la constante E ′ vale:
E ′ = mgl cos θ2 (8.310)
Como en (8.272) los términos que contienen a I1 son positivos, para tiempos ma-
yores que cero la energı́a potencial debe disminuir o sea θ debe aumentar hasta alcanzar
el valor θ1 y según (8.306) entonces φ̇ aumenta a partir de cero hasta alcanzar el valor
máximo positivo dado por:
cos θ2 − cos θ1
φ̇1 = a (8.311)
sen2 θ1
O sea que el trompo al dejarse caer desde θ = θ2 con θ̇ = φ̇ = 0 en t = 0, en un
tiempo mayor adquiere precesión y nutación. Ocurre cuando el trompo es rápido y hay
rozamiento en el punto O que la nutación se amortigua rápidamente, dando la impresión
de que las condiciones iniciales señaladas no dan lugar a precesión con nutación sino a
una precesión regular.
Los comportamientos descritos en (a), (b) y (c) están contenidos en la expresión
analı́tica (8.295). El producto que contiene las funciones σ es puramente periódico, de
modo que el exponencial del lado derecho da el movimiento medio de φ, esto es el mo-
vimiento precesional neto. La ecuación (8.295) nos dice que ψ tiene un comportamiento
análogo al de φ o sea una rotación neta acompañada de fluctuaciones periódicas.
I3 ψ̇(0) = I1 a (8.312)
E′ = mgl cos θ2
que pueden expresarse en términos de la energı́a de rotación, inicialmente dada por:
1 1
R= I3 ωz2 = I3 ψ̇ 2 (0) (8.313)
2 2
Dinámica del cuerpo rı́gido / 305
Entonces:
√
2RI3 I3
a= = ωz ; b = a cos θ2
I1 I1
(8.314)
′ I1 β
E = mgl cos θ2 = cos θ2
2
Entonces podemos escribir a f (u) en la forma:
f (u) = β(1 − u2 )(u2 − u) − a2 (u2 − u)2 (8.315)
Las raı́ces de f (u) son:
" s #
a2 4β β
u3,1 = 1± 1+ 2 − u2 (8.316)
2β a a2
ẍ + a2 x = 0 (8.325)
β sen2 θ2 β at
x= cos at ; cos θ = cos θ2 − sen2 θ2 sen2 (8.326)
2a2 a2 2
La frecuencia angular de la nutación es:
1 I3
a= ωz (8.327)
2 2I1
O sea que la frecuencia de las nutaciones es mayor a medida que ωz es mayor.
(8.306) nos da la frecuencia angular de precesión. Como según (8.326) x es del orden de
β/(2a2 ), podemos escribir aproximadamente a φ̇ como:
u2 − u u2 − u β at
φ̇ = 2
a≈ 2 a = sen2 (8.328)
1−u 1 − u2 a 2
Vemos que mientras mayor sea ωz , menor será la velocidad angular de precesión.
Para un trompo rápido el movimiento es una nutación pequeña y una precesión pe-
queña que coincide con la velocidad angular de precesión lenta de un trompo rápido.
Esta precesión se llama precesión seudoregular, pues aunque las condiciones iniciales no
son las de la precesión regular, en la práctica se comporta como ésta porque la fricción
amortigua rápidamente la nutación y aparentemente el eje z del trompo empieza ins-
tantáneamente a precesar, con movimiento normal a la gravedad. Ésta es la paradoja de
Klein-Sommerfeld quienes explicaron que esta precesión no implica aceleraciones infini-
tas sino que se trata de una precesión con una imperceptible nutación.
f (u)
u1 = u2 = 1 u3
–1 0 +1 u
f (u)
0 +1
–1 u1 u2 = u 3 = 1 u
Esta situación es un caso lı́mite de la precesión estable cuando el mı́nimo de Vef (u)
está en u0 = 1. Como cuando E ′ = E0′ , los dos puntos de retorno coinciden, la función
f (u) tiene el comportamiento mostrado en las figuras 8.12 y 8.13.
Para este caso los valores de las constantes de movimiento son:
I1 a = I3 (ψ̇ + φ̇) ; b = a; E ′ = mgl (8.332)
Se sigue de (8.275) y (8.332) que:
α=β (8.333)
308 / Mecánica clásica
√
Entonces los valores de m y de e3 − e1 son:
√ a
m = 0, 25 ; e3 − e1 = (8.342)
2
De la tabla 17.1 del manual de Abramowitz y Stegun obtenemos:
K(0, 25) = 1, 685 (8.343)
con lo cual el valor exacto del perı́odo T es:
4K 6, 74
T = = (8.344)
a a
y el valor exacto de la frecuencia de nutación es:
Ωnut = 0, 932 a (8.345)
Promediando sobre un perı́odo de las funciones P obtenemos que el término de φ̇
que en (8.292) da lugar a precesión neta es:
σ̇(iδ) σ̇(iγ)
2iφ̇ = 2 −2 (8.346)
σ(iδ) σ(iγ)
Según (8.288) y (8.314) se cumple para este caso que:
β βu2 + a2 5λ − 4 2 1 2
P(iγ) = − = a = a
4 12 48 48
(8.347)
β βu2 + a2 7λ + 4 2 11
P(iδ) = − − =− a = − a2
4 12 48 48
Según la expansión en serie para P(x) el término dominante es x−2 de modo que:
1 1
P(iγ) ≈ − ; P(iδ) ≈ − (8.348)
γ2 δ2
Entonces hallamos que:
√ r
48 48 1
iγ ≈ ; iγ ≈ −i (8.349)
a 11 a
Por otra parte, el término dominante en la expansión en serie para ς(x) es x−1 lo
cual nos dice que:
r
1 11 1 1
ς(iδ) ≈ ≈i a ; ς(iγ) ≈ ≈√ a (8.350)
iδ 48 iγ 48
(8.346) supone que existe movimiento en φ durante más de un perı́odo. En efecto, para
λ mayor que 0,8 domina el efecto de la gravedad y el trompo cae. La fórmula (8.340)
resulta aplicable para λ < 0,8. El movimiento descrito por la figura 8.11c existe si:
I1 2mgl
< 0, 8 (8.352)
I3 R
Si tomamos λ = 0, 1 y u2 = 0, 5, mediante idénticos procedimientos llegamos a los
siguientes resultados:
En consecuencia:
φ̇ = 0, 04 a (8.357)
que esta vez no tiene la contribución imaginaria. Según (8.330) que es aplicable en este
caso pues λ ≪ 1, φ̇ debe valer:
β
φ̇ ≈ = 0, 0025 a (8.358)
2a
eje de rotación y alejándose de él; el módulo de esta fuerza es mρω 2 siendo ρ la distancia
de la partı́cula al eje de rotación.
Al final de la sección 7.9 encontramos expresiones más exactas para las ecuaciones
de movimiento, en función de la matriz de rotación. Encontramos en la ecuación (7.282)
un término adicional, la fuerza m~r × ~ω˙ debida a la no uniformidad de la rotación. Con-
sideremos ahora el sistema de referencia no inercial más general. Consiste en un sistema
de referencia que rota no uniformemente y cuyo origen se translada con aceleración no
uniforme. Se supone que la aceleración A(t) ~ del origen de coordenadas y la velocidad an-
gular de rotación ω~ (t) son funciones del tiempo conocidas a priori. Entonces la ecuación
de movimiento más general para una partı́cula que se mueve en un sistema de referencia
no inercial es:
∂V
m~¨r = − − mA ~ + m~r × ~ω˙ + 2m~r˙ × ~ω + m~ω × (~r × ~ω) (8.359)
∂~r
Ya hemos considerado el movimiento de un cuerpo rı́gido en un sistema de refe-
rencia que rota uniformemente. En el ejemplo 8.3.1 hallamos la forma que toman las
ecuaciones de Euler en tal sistema de referencia, ecuaciones (8.128) y (8.129).
Ejemplo 8.6.1 Resolver el problema del péndulo de Foucault considerándolo como un
cuerpo rı́gido y usando las ecuaciones de Euler en un sistema de referencia rotante.
En este problema intervienen tres sistemas de ejes. Los ejes inerciales, los ejes
rotantes fijos a la Tierra y los ejes fijos al cuerpo rı́gido. Llamaremos x′ , y ′ , z ′ , a los ejes
fijos a la Tierra y x, y, z, a los ejes fijos al cuerpo rı́gido. El vector de velocidad angular
de la Tierra, que asumiremos constante respecto a los ejes inerciales, vale:
~ 0 = ω0~k
ω (8.360)
donde ~k está en la dirección de la lı́nea sur-norte que asumiremos fija en el espacio (ver
la figura 8.14).
El péndulo está suspendido de un punto O fijo respecto a la Tierra. En ese punto
tomaremos el origen común de los ejes fijos a la Tierra y al cuerpo rı́gido. Este es un
cuerpo rı́gido trivial que consiste en una partı́cula mantenida a distancia fija de O por
medio de un hilo sin masa y longitud l. El eje z lo tomamos a lo largo del hilo, de modo
que la posición de la partı́cula respecto a los ejes fijos al cuerpo rı́gido está en (0, 0, l).
Los momentos principales de inercia de este cuerpo rı́gido son:
I1 = ml2 ; I2 = ml2 ; I3 = 0 (8.361)
Los ejes x y y son perpendiculares a z pero pueden tomarse arbitrariamente, pues
este cuerpo rı́gido no permite especificarlos. Podemos, sin perder generalidad, tomar el
eje y perpendicular al plano de oscilación del péndulo y el eje x en el plano de oscilación
del péndulo y cuando aparezca la velocidad de rotación alrededor del eje z, ψ̇, asumir
que es cero, lo mismo que ψ.
Las componentes del vector de velocidad angular de la Tierra respecto a los ejes
primados son:
ω0 ′ =
~ ω0 [(~k · ~i ′ )~i ′ + (~k · ~j ′ )~j ′ + (~k · ~k ′ )~k ′ ]
(8.362)
= ω0 (cos λ, 0, −senλ)
312 / Mecánica clásica
N
0 i
φ i′ j′
j′ i′
j k′ k
0
k
k′
θ ω0
l
φ
λ
m
S
a b
Figura 8.14 Péndulo de Foucault considerado como un cuerpo rı́gido: a. Sistema de ejes y
b. Componentes del vector de velocidad angular de la tierra respecto a los ejes primados.
La energı́a potencial vale V = −mgz ′ = −mgl cos θ. Entonces los torques alrededor
de los ejes z ′ y z, y de la lı́nea de nodos, son respectivamente:
3
X
Kr βrt ; t = 1, 2, 3 (8.364)
r=1
donde las Kr están dadas por (8.363) y βrt es la matriz (8.134). Los torques (8.364),
que llamaremos K1 , K2 , K3 , son en consecuencia:
para escribir las ecuaciones (8.155) se requiere además conocer las componentes del
ω0′ respecto a los ejes fijos al cuerpo rı́gido. Para ello debemos evaluar:
vector ~
~ 0 = Ã~
ω ω0′ (8.366)
donde à es la matriz de rotación entre los ejes con primas y los ejes con barras, dada
por la ecuación (7.122) sección 7.6. Las ecuaciones (8.128) y (8.129) con torques, con los
Dinámica del cuerpo rı́gido / 313
Ciertamente las ecuaciones (8.367) son consistentes cuando ωz + ω0z valga cero.
En efecto, las dos últimas igualdades de (8.367) se convierten en:
g
θ̈ − ω0 φ̇ senφ cos λ + senθ = 0
l
(8.370)
senθ φ̇ − ω0 cos θ senφ cos λ − ω0 senθ senλ = constante
Esto quiere decir que tomar simultáneamente ceros los valores de ωy + ω0y y ωz + ω0z da
lugar a la solución cuando los ejes x′ −y ′ y x−y coinciden instantáneamente. La ecuación
314 / Mecánica clásica
(8.372) muestra una rotación uniforme del plano de oscilación del péndulo alrededor del
eje z, en sentido positivo. En efecto, si el péndulo oscilara en el polo norte, donde
senλ = 1, un observador en la Tierra verı́a rotar el plano del péndulo uniformemente
en sentido contrario al de la rotación de la Tierra y con una velocidad angular igual a
ω0 ; esto se ve claramente al notar que el plano de oscilación del péndulo en un sistema
de referencia inercial no cambia, o sea que los ejes x − y no cambian en un sistema de
referencia inercial y respecto a ellos los ejes x′ − y ′ rotan uniformemente.
Para un péndulo de 100 m, g/l vale aproximadamente 10−1 s−2 en tanto que ω0 ≈
−8 −1
10 s , de modo que las ecuaciones (8.367) pueden resolverse fácilmente, sin hacer las
suposiciones: ωz + ω0z = ωy + ω0y = 0, despreciando los términos que contengan a ω02
y ω0 φ̇. El resultado es que el plano de oscilación del péndulo rota uniformemente con
una velocidad angular ω0 senλ, aun en donde los ejes x′ − y ′ y x − y no coinciden, y en
que la rotación de la Tierra no tiene efecto sobre la coordenada θ sino con un término
centrı́fugo, que es del orden de ω02 .
Los ejes principales del giróscopo x, y, z, los definimos de modo que el eje de simetrı́a
es el eje z, que permanecerá en el plano horizontal. La figura 8.15a muestra los ejes fijos
a la Tierra x′ , y ′ , z ′ , y la figura 8.15b los ejes x, y, z.
N Línea de nodos x′ x
(φ = 0)
Vertical
z
j′ ψ z′
k′ Norte
0 i′ θ
k′ y′
0 Este
ω0
λ Línea
del meridiano
S y
a b
φ=0 (8.373)
Ésta implica que φ̇ = 0, o sea que la ligadura impuesta a las velocidades angulares
ωx , ωy , ωz , de acuerdo con las ecuaciones (8.132) es:
Rx = λ tan ψ ; Ry = λ ; Rz = 0 (8.375)
~ 0′ = ω0 (senλ, 0, cos λ)
ω (8.377)
~ 0 debemos usar la matriz de rotación Ã, ecuación (7.122) de la
Para hallar a ω
sección 7.6, tomando φ = 0:
senλ cos ψ + cos λ senψ senθ
~
ω 0 = ω0 −senλ senψ + cos λ cos ψ senθ (8.378)
cos λ cos θ
Ejercicio 8.6.1 Integrar las ecuaciones (8.374), (8.376) y (8.386) para hallar explı́cita-
mente a θ, ψ y λ en función del tiempo. Analizar los resultados.
318 / Mecánica clásica avanzada
9
Las transformaciones canónicas
319
320 / Mecánica clásica avanzada
0 b
x
θ′ θ
P1 (x1, y1, t1)
a
inicial y final dados, P1 , P2 , o sea para un valor dado de θ, se puede encontrar una
familia de trayectorias circuitosas que pasan por esos dos puntos en t = t1 y t = t2 .
Haciendo variar la tripleta de parámetros (a, b, θ) sobre todo el rango de sus valores
posibles podrı́amos obtener todas las posibles trayectorias “rectas” en el plano x − y;
para definir las trayectorias circuitosas requerirı́amos de parámetros adicionales.
En general, sea (α) un conjunto completo de parámetros que define una familia
de trayectorias rectas en el espacio de configuración. A esa familia de trayectorias le
corresponde una familia de puntos iniciales y finales P1 , P2 y de tiempos t1 y t2 , dada
por:
t1 = t1 (α) ; qν1 = qν1 (α)
ν = 1, 2, ...l
Debemos definir desplazamientos virtuales entre una trayectoria real y las corres-
pondientes trayectorias circuitosas y entre trayectorias reales. Esto se logra consideran-
do: (a) Cambios virtuales en las qν , como antes y (b) Cambios virtuales en el tiempo,
con lo cual los tiempos de los puntos inicial y final son distintos para cada trayectoria.
Queremos evaluar el cambio en la integral de acción:
Z t2
S= L dt (9.3)
t1
cuando se pasa de una trayectoria real a otra de la familia. La diferencia de las coorde-
nadas de las dos trayectorias la denotaremos ∆qν = qν (α + ∆α) − qν (α).
Tal cambio consta de dos partes, uno virtual producido con t fijo y otro debido al
cambio virtual en el tiempo:
∆qν = δqν + q̇ν δt ; ν = 1, 2, ...l
(9.4)
∆t = t(α + ∆α) − t(α)
Las transformaciones canónicas / 321
C2
P2
t2
(α)
t t2 + ∆t2
C1 (∆q) (∆q) t2 P2′
P1
t1 + ∆t1 q∆t t + ∆t
t1 t (α + ∆α)
t1 + ∆t1 (q + δq) (q + ∆q)
P1′
∆S = S′ − S
Z t2 +∆t2 Z t2 (9.5)
= dt L(q + δq, q̇ + δ q̇, t) − dt L(q, q̇, t)
t1 +∆t1 t1
t
t1 t1 + ∆t1 t2 t2 + ∆t2
l
X (9.8)
∂L d
δqν + (pν δqν ) − ṗν δqν
ν=1
∂qν dt
donde despreciamos todos los términos de orden superior al primero en (δq) y (q̇ ∆t).
Como los (p) corresponden a la trayectoria real P1 P2 , de acuerdo con las ecuaciones de
Lagrange la integral en (9.9) es cero, luego:
!t2
l
X
∆S = pν δqν + L ∆t (9.10)
ν=1 t1
Obtenemos:
l
X
∆S = pν ∆qν − H ∆t (9.14)
ν=1
donde ahora los parámetros (α) son tales que varı́an entre (αi ) y (αf ) de modo que
las funciones de (α) definidas por (9.17) son periódicas, es decir toman el mismo valor
cuando (α) = (αi ) que cuando (α) = (αf ). Por ejemplo, para el oscilador tridimensional
ligado a moverse sobre un cilindro, la familia de trayectorias correspondiente a (9.17) es
mostrada en la figura 9.4. (Véase el ejemplo 4.3.1 en la sección 4.3). Es claro que C1 y
C2 deben estar sobre la hipersuperficie Ez constante.
En general, la familia de trayectorias tiene la apariencia de un “tubo”1 donde C1
y C2 son las curvas que describen la forma de las “puntas”. Por la causalidad, es claro
que las trayectorias no se intersectan. A cada valor de las (α) le corresponde uno y sólo
un punto sobre C1 , un punto sobre C2 y una trayectoria y sólo una. Cada trayectoria
tiene un valor dado de la acción:
Z t2 (α)
S̃ = L̃ [q(α, t), q̇(α, t), p(α, t), ṗ(α, t), t] (9.18)
t1 (α)
Pz
C1
θ
z
C2
Figura 9.4 Familia de trayectorias para el oscilador tridimensional ligado a moverse sobre un
cilindro
( l Z
" !
X ∂H
∆S̃ = dt q̇ν − δpν
ν=1
∂pν
# )t2
∂H d
− ṗν + δqν + (pν ∆qν ) + L ∆t (9.20)
∂qν dt
t1
Teniendo en cuenta que las trayectorias en el espacio de fases son “rectas”, definidas
por las ecuaciones de Hamilton, se sigue:
" #t2
l
X
∆S̃ = pν δqν + L ∆t (9.21)
ν=1 t1
Ahora, usando (9.4) en (9.21) obtenemos que ∆S̃ = ∆S, ecuación (9.11):
" #t2
l
X
∆S̃ = pν ∆qν − H ∆t (9.22)
ν=1 t1
Z l
!
(αf ) X
= p2ν ∆qν2 2
− H ∆t2
(αi ) ν=1
Z l
!
(αf ) X
− p1ν ∆qν1 1
− H ∆t1 (9.23)
(αi ) ν=1
I l
!
X
= pν ∆qν − H ∆t
C2 ν=1
I l
!
X
− pν ∆qν − H ∆t
C1 ν=1
no cambia su valor tomada sobre un contorno arbitrario del espacio fásico, a través del
cual pasan trayectorias reales que lo deforman al desplazarse sobre la “manguera” de
trayectorias reales. I es una integral invariante, llamada la integral invariante de Poin-
caré-Cartán (véase el texto de Gantmacher, Lectures in analytical mechanics, sección 18).
s = −H(q, p, t) (9.26)
En estas variables, K hace las veces de H y q1 las veces de t. Hemos probado, pues,
que el movimiento del sistema con las nuevas variables obedece las ecuaciones:
dt ∂K ∂s ∂K
= ; =−
dq1 ∂s dq1 ∂t
(9.29)
dqν ∂K dpν ∂K
= ; =− ; ν = 1, 2, ...l
dq1 ∂pν dq1 ∂qν
donde ahora q1 es la variable independiente o “tiempo”.
Sea ahora un sistema generalizado conservativo (o sea un sistema arbitrario para
el cual H no depende del tiempo). En este caso:
cualquier curva cerrada que se mueve con un fluido no cambia con el tiempo.
Las transformaciones canónicas / 327
Z q22
Σ= M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) dq1 (9.41)
q11
t2 + ∆t2
(q + ∆q) P2
2
q1
t t + ∆t
A t2
(q) (∆q)
t1 + ∆t1 B
t
t1
P1 1
q1
l
X l
1X 1 1
M= pν qν′ + p1 = pν q̇ν = (L + H) = (2T2 + T1 ) (9.42)
ν=2
q̇ ν=1 q̇ 1 q̇ 1
Esto nos dice: “dada la configuración inicial y final de un sistema descrito por un
hamiltoniano constante, e igual a la energı́a total, con un valor dado de la energı́a, la
trayectoria del sistema en el espacio de configuración es aquella para la cual la integral
de la energı́a cinética es estacionaria, cuando se compara con las trayectorias vecinas que
satisfacen dichas condiciones”. Este principio es aplicable sólo a sistemas conservativos.
Los tiempos requeridos para moverse sobre las diferentes trayectorias pueden cambiar
pero la energı́a es la misma sobre cada curva. En el principio de Hamilton aplicado a sis-
temas conservativos, se consideran sólo aquellas trayectorias para las cuales el tiempo de
movimiento a lo largo de ellas es el mismo, aunque las energı́as asociadas a ellas pueden
diferir. Las trayectorias variadas en el principio de Hamilton no corresponden necesa-
riamente con trayectorias posibles del movimiento del sistema, H puede no conservarse
sobre ellas.
En el principio de mı́nima acción se consideran trayectorias variadas donde el
tiempo puede variar pero H sı́ se conserva. En estos dos principios se halla la trayectoria
verdadera “escogiendo” entre las trayectorias de dos conjuntos de trayectorias definidas
de manera diferente.
Otra forma de obtener que ∆Σ = 0 es la siguiente:
Z t2 X l Z t2
Σ= pν q̇ν dt = (L + H) dt = S + h(t1 − t2 ) (9.46)
t1 ν=1 t1
Lagrange mostró además que (9.50) se cumple si y sólo si vale la segunda ley de
Newton, mi~¨r i = −∂V /∂~ri , i = 1, 2, ...N . Además, Lagrange fue el primero que introdujo
las coordenadas generalizadas, con las cuales (9.50) es:
Z N
BX
∆E=C pν dqν = 0 (9.51)
A i=1
Lagrange llamó a (9.52) el principio de la más pequeña o más grande fuerza viva.
Las transformaciones canónicas / 331
Hamilton, escocés que vivió entre 1805 y 1865, aportó en 1835 la formulación gene-
ral del principio de mı́nima acción y las ecuaciones de Hamilton. Extiende la formulación
al considerar trayectorias circuitosas en que la energı́a no se conserva:
Z B Z B
∆ L dt = ∆ (2T − H)dt = 0 (9.53)
A A
El conjunto de trayectorias es tal que pasa simultáneamente por los mismos puntos
inicial y final. Es claro ya por qué a Σ se llama la acción de Lagrange y a S la acción
de Hamilton. Los principios de Hamilton y de mı́nima acción son aplicables equivalente-
mente para sistemas conservativos, sin embargo, el primero es más general pues se aplica
además a sistemas holónomos generales, con una generalización a sistemas holónomos
con fuerzas no derivables de un potencial, ecuación (3.12).
donde:
l
X
G= aµν qµ′ qν′ (q1′ = 1) (9.55)
µ,ν=1
sobre C1 y C2 tienen los mismos tiempos. Es decir, sea C1 un conjunto de puntos del
espacio de fases que forma una lı́nea cerrada y que corresponde a estados simultáneos
de un sistema de acuerdo con (9.17), las ecuaciones paramétricas de C1 son:
t1 (α) = constante ; qν1 = qν1 (α) ; p1ν = p1ν (α) ; ν = 1, 2, ...l (9.64)
C2 está definida similarmente. A lo largo de estos contornos se cumple que ∆t = 0,
reduciéndose la ecuación (9.24) a:
I l
X I l
X
pν ∆qν = pν ∆qν = I1 (9.65)
C2 ν=1 C1 ν=1
La integral I1 fue introducida por Poincaré pero fue Cartán quien la extendió a
contornos formados por estados no simultáneos con la introducción del término adicional
−Ht.5
Sea C un contorno arbitrario en el espacio de fases (véase figura 9.6). Es claro
que las proyecciones de C sobre cada uno de los planos de fase (qν , pν ), ν = 1, 2, ...l,
constituye una curva cerrada bidimensional, que llamaremos Cν , ν = 1, 2, ...l.
Pν
Cν
Aν
qν
I X
l
= (ṗν ∆qν + pν ∆q̇ν )
ν=1
I X
l
= (ṗν ∆qν + ∆(pν q̇ν ) − ∆pν q̇ν ) (9.69)
ν=1
I X
l
= (ṗν ∆qν − q̇ν ∆pν )
ν=1
I X
l
= (Pν ∆qν − Qν ∆pν )
ν=1
Como I1 = 0, se sigue que (9.69) debe ser igual a la integral de una diferencial ∆
exacta de alguna función de (q, p, t) que llamaremos −H:
I X l
(Pν ∆qν − Qν ∆pν ) =
ν=1
I l
Z X
∂H ∂H
−∆H = − ∆qν + ∆pν (9.70)
ν=1
∂qν ∂pν
X l #
∂Bν ∂Aµ
− ∆pµ ∆pν (9.77)
µ<ν=1
∂pµ ∂pν
336 / Mecánica clásica avanzada
Para Aν = pν y Bν = 0, se cumple:
I X l Z Z X l
pν ∆qν = ∆pν ∆qν (9.78)
C ν=1
S ν=1
Z Z Z l
X
I3 = pν ∆qν ∆pµ ∆qµ = J4
µ,ν=1
Z Z Z Z X
l
= ∆qν ∆pν ∆qµ ∆pµ (9.80)
µ,ν=1
Z Z Z l
X
I2l−1 = ··· pν1 ∆qν1 ∆pν2 ∆qν2 ... ∆pνl ∆qνl = J2l
ν1 , ν2 , ...νl =1
(9.81)
Z Z Z Z l
X
= ... ∆q1 ∆p1 ... ∆ql ∆pl
ν1 , ν2 , ...νl =1
ν = 1, 3, ..,2l − 1.
~ , es un vector.
y el producto de una matriz por un vector, M̃ V
donde se usó la propiedad d(∆~q)/dt = ∆~q˙ . La ecuación (9.92) también se puede escribir
como:
I h i
I˙′ = ~˙ · ∆~q + ∆(A
A ~ · ~q˙ ) − ∆A ~˙ · ∆~
~ · ~q˙ + B ~ · p~˙ ) − ∆B
p + ∆(B ~ · p~˙ (9.93)
Se cumple que:
I (αi )
~ ˙
∆(A · ~ ~ ˙
q ) = A · ~q =0 (9.94)
C (αf )
debido a que ~
q (αi , t) = ~q(αf , t); ~p(αi , t) = p~(αf , t), por ser C un contorno cerrado. Por
otra parte:
~ ~ ~
~˙ = ∂ A · ~q˙ + ∂ A · ṗ + ∂ A
A (9.95)
∂~q ∂~p ∂t
∂A~ ∂A~
~=
∆A · ∆~q + · ∆~
p (9.96)
∂~q ∂~p
∂F ∂H ~
∂A ∂F ∂H ~
∂B
= −Z̃ + ; = −Z̃ + (9.101)
∂~q ∂~q ∂t ∂~p ∂~p ∂t
En términos de componentes (9.101) toma la forma:
X l X l
∂F ∂H ∂Aν ∂F ∂H ∂Bν
=− Zνλ + ; =− Zνλ + (9.102)
∂qν ∂qλ ∂t ∂pν ∂pλ ∂t
λ=1 λ=1
X ∂Zµλ ∂H X ∂2H ∂ 2 Aµ
− − Zµλ +
∂qν ∂qλ ∂qν ∂qλ ∂qν ∂t
λ λ
X ∂Zνλ ∂H X ∂2H ∂ 2 Bν
− − Zνλ + =
∂pµ ∂pλ ∂pµ ∂pλ ∂pµ ∂t
λ λ
(9.104)
X ∂Zµλ ∂H X ∂2H ∂ 2 Bµ
− − Zµλ +
∂pν ∂pλ ∂pν ∂pλ ∂pν ∂t
λ λ
X ∂Zνλ ∂H X ∂2H ∂ 2 Aν
− − Zνλ + =
∂pµ ∂qλ ∂pµ ∂qλ ∂pµ ∂t
λ λ
X ∂Zµλ ∂H X ∂2H ∂ 2 Bµ
− − Zµλ +
∂qν ∂pλ ∂qν ∂pλ ∂qν ∂t
λ λ
∂Zνν ∂H ∂2H ∂ 2 Aν
− − Zνν + =
∂qµ ∂qν ∂qµ ∂qν ∂qµ ∂t
∂Zµµ ∂H ∂2H ∂ 2 Aµ
− − Zµµ +
∂qν ∂qµ ∂qν ∂qµ ∂qν ∂t
∂Zνν ∂H ∂2H ∂ 2 Bν
− − Zνν + =
∂pµ ∂pν ∂pµ ∂pν ∂pµ ∂t
(9.107)
∂Zµµ ∂H ∂2H ∂ 2 Bµ
− − Zµµ +
∂pν ∂pµ ∂pν ∂pν ∂pν ∂t
∂Zνν ∂H ∂2H ∂ 2 Aν
− − Zνν + =
∂pµ ∂qν ∂pµ ∂qν ∂pµ ∂t
∂Zµµ ∂H ∂2H ∂ 2 Bµ
− − Zµµ +
∂qν ∂pµ ∂qν ∂pµ ∂qν ∂t
∂Zνν ∂H ∂Zµµ ∂H ∂ 2H
− + + (Zµµ − Zνν )
∂pµ ∂qν ∂qν ∂pµ ∂pµ ∂qν
∂ ∂Aν ∂Bµ
+ − =0
∂t ∂pµ ∂qν
Las transformaciones canónicas / 341
∂Z
= 0 ⇒ Z = constante
∂t
(9.110)
∂ ∂Aν ∂Aµ ∂ ∂Bν ∂Bµ
− = 0; − =0
∂t ∂qµ ∂qν ∂t ∂pµ ∂pν
∂ ∂Aν ∂Bµ
− =0
∂t ∂pµ ∂qν
donde Z = Zνν .
Para µ = ν cumple Zµν = 0, o sea:
∂Aµ ∂Bµ
= ; µ=ν (9.111)
∂pν ∂qν
reemplazando (9.111) en la última igualdad (9.110) se obtiene:
∂ ∂Aν ∂Aµ
− =0 (9.112)
∂t ∂pµ ∂pν
La ecuación (9.112) y la primera igualdad (9.110) nos dan:
∂ ∂Aν ∂ ∂Aµ ∂ ∂Aν ∂ ∂Aµ
= ; = (9.113)
∂pµ ∂t ∂pν ∂t ∂qµ ∂t ∂qν ∂t
Las expresiones (9.113) se cumplen si Aν (q, p, t) son de la forma:
∂f (q, t) ∂g(p, t)
Aν = + (9.114)
∂qν ∂pν
donde f y q son funciones continuas. Bν satisfacen, por los mismos argumentos, relacio-
nes similares a (9.113), por tanto:
∂f ′ (q, t) ∂g ′ (p, t)
Bν = + (9.115)
∂qν ∂pν
342 / Mecánica clásica avanzada
~ y B
Las ecuaciones (9.114) y (9.115) son las condiciones que deben satisfacer A ~ para
que (9.87) sea una integral universal invariante.
Se cumple entonces que, para µ 6= ν:
∂Aν ∂Aµ ∂2f ∂2f
− = − =0
∂qµ ∂qν ∂qµ ∂qν ∂qν ∂qµ
lo cual constituye la prueba del teorema de Li Hua Chung para I ′ . De paso hemos hallado
que A~ yB ~ deben tener la forma (9.114) y (9.115) respectivamente a fin de que I ′ sea
una integral universal invariante. Esta prueba es una generalización para l grados de
libertad de la presentada en Gantmacher para l = 1.
Las transformaciones canónicas / 343
I l
! I l
X X
pν ∆q ν − H ∆t = pν ∆q ν (9.130)
C ν=1 C 0 ν=1
Como t es invariante bajo una transformación canónica, se sigue que el lado derecho
de (9.129) está evaluado en el mismo tiempo que el lado derecho de (9.130). Si en la
H Pl
integral universal invariante ν=1 pν ∆q ν pasamos a las variables (q, p) por medio de
la transformación canónica (9.124), obtenemos:
I l
X
pν ∆q ν =
C 0 ν=1
I l
" l
! l
! #
X X ∂qµ X ∂q µ
pµ ∆qν + pµ ∆pν (9.131)
C0 ν=1 µ=1
∂qν µ=1
∂pν
Es fácil ver que (9.139) se puede derivar directamente de (9.25) mediante la trans-
formación canónica ~ q → −~p, p~ → q~. Se sigue entonces que además de (9.129) son posibles
las siguientes relaciones:
I l
! I l
X X
− qν ∆pν − H∆t = − qν ∆pν
C ν=1 C0 ν=1
! (9.140)
I l
X I l
X
− q ν ∆pν − H∆t = − q ν ∆pν
C ν=1 C0 ν=1
P
Por el teorema de Li Hua Chung se sigue que lν=1 qν ∆pν , que es una integral
universal invariante, es proporcional a I1 . Usando (9.129) y (9.140) conjuntamente con
el teorema de Li Hua Chung, podemos obtener además de (9.132) las siguientes tres
346 / Mecánica clásica avanzada
relaciones, que nos darán otras tres expresiones para la función generatriz completamente
equivalentes (9.135):
I l
X I l
X
pν ∆q ν = C − qν ∆pν
C 0 ν=1 C0 ν=1
I l
X I l
X
− q ν ∆pν = C pν ∆qν (9.141)
C0 ν=1 C0 ν=1
I l
X I l
X
− q ν ∆pν = C − qν ∆pν
C0 ν=1 C0 ν=1
Es claro que las “C” que aparecen en (9.132) y en (9.141) no tienen por qué ser
la misma. De cada una de las expresiones (9.141) se obtiene una forma diferente para la
función generatriz de la transformación canónica por un procedimiento igual al que con-
duce a la forma (9.135). En primer lugar, y en virtud de (9.129) y (9.140), las ecuaciones
(9.141) son equivalentes a:
I l
! I l
!
X X
pν ∆q ν − H∆t = C − qν ∆pν − H∆t (9.142)
C ν=1 C ν=1
I l
! I l
!
X X
− q ν ∆pν − H∆t =C pν ∆qν − H∆t (9.143)
C ν=1 C ν=1
I l
! I l
!
X X
− q ν ∆pν − H∆t =C − qν ∆pν − H∆t (9.144)
C ν=1 C ν=1
l
! l
!
X X
∆F = C pν ∆qν − H∆t − − q ν ∆pν − H∆t (9.146)
ν=1 ν=1
l
! l
!
X X
∆F = C − qν ∆pν − H∆t − − q ν ∆pν − H∆t (9.147)
ν=1 ν=1
clase respectivamente. Es posible que una transformación canónica dada sea a la vez
canónica libre de más de una clase.
En (3.20) encontramos transformaciones canónicas libres de la primera clase.
Ejemplo 9.5.1 Demostrar que la transformación canónica (4.134), para l = 1, es libre
de primera clase:
1 2 p2 p
p = mω q + ; q = −tan−1 (9.148)
2 mω 2 mωq
Las fórmulas de transformación pueden escribirse en la forma:
1
p = mωq tan q ; p= mωq 2 sec2 q (9.149)
2
o sea que es libre de la primera clase. También se puede escribir como:
s r
−1 mωq 2 2p
q = cos ; p = −mω − q2 (9.150)
2p mω
o sea que también es libre de la segunda clase. Es fácil ver que también es libre de tercera
y cuarta clase.
Ejemplo 9.5.2 Demostrar que la transformación identidad es canónica de segunda y
tercera clase pero no es de primera ni de cuarta clase.
La transformación identidad es:
q ν = qν ; pν = pν ; ν = 1, 2, ...l (9.151)
Esta transformación puede escribirse en cualquiera de las formas siguientes:
qν = qν ; pν = pν
(9.152)
qν = q ν ; pν = pν ; ν = 1, 2, ...l
o sea que sólo es posible tomar independientes a (q, p) o a (q, p). Esta transformación es
canónica de segunda y tercera clase pero no es de primera ni de cuarta clase.
Ejemplo 9.5.3 Mostrar que la transformación que intercambia coordenadas y momentos
y cambia de escala, es libre de primera y cuarta clase pero no de segunda ni de tercera
clase:
1
qν = αpν ; qν = p
β ν
(9.153)
1
pν = βqν ; pν = q ν ; ν = 1, 2, ...l
α
Ejemplo 9.5.4 Mostrar que la transformación canónica q = −αp/q, p = q 2 /2α, con
l = 1, es una transformación canónica libre de primera y de cuarta clase pero no de
segunda ni de tercera clase:
348 / Mecánica clásica avanzada
αp p
q= −√ ; q= 2αp
2αp
(9.154)
q2 qq
p= ; p=−
2α α
Las transformaciones canónicas libres de primera clase se caracterizan porque (p, p)
se pueden expresar en función de (q, q). Esto dice que las (p) dependen de (q), o sea que:
q 1 , q 2 , ...q l
J 6= 0 (9.155)
p1 , p2 , ...pl
En este caso la función generatriz F (q, p, t) puede representarse mediante una fun-
ción de (q, q) que llamaremos F1 :
F (q, p, t) = F1 (q, q, t) (9.156)
De (9.135) y (9.156) se sigue que:
l
! l
!
X X
∆F1 (q, q, t) = C pν ∆qν − H∆t − pν ∆q ν − H∆t (9.157)
ν=1 ν=1
q 1 , q 2 , ...q l . Que las l cantidades independientes ∂F1 /∂qν sean funciones de las l can-
tidades independientes q ν se expresa diciendo que el jacobiano de esas funciones no es
idénticamente cero:
2
∂F1 /∂~q ∂ F1
J = det 6= 0 (9.162)
q
~ ∂~q ∂~q
De la desigualdad (9.162) se sigue que las primeras l ecuaciones (9.158) pueden
resolverse para las q ν , con lo cual todas las nuevas variables de fases q ν , pν (ν = 1, 2, ...l)
pueden expresarse en función de las viejas variables qν , pν (ν = 1, 2, ...l). La ecuación
(9.162) también permite que en (9.158) las l últimas ecuaciones sean resueltas para qν en
función de las q ν , pν . En conclusión, las ecuaciones (9.158) definen una transformación
canónica libre de primera clase con función generatriz y valencia dadas, F1 y C 6= 0,
en tanto que la fórmula (9.159) permite relacionar las funciones hamiltonianas H y H,
que serán proporcionales sólo en el caso en que la transformación canónica no dependa
explı́citamente del tiempo.
Podemos decir que la clase de las transformaciones canónicas libres de primera
clase se puede obtener hallando todas las funciones generatrices F1 que satisfacen la
condición (9.162) y las diferentes valencias C 6= 0, y usando las fórmulas (9.158).
Para las transformaciones canónicas libres de primera clase univalentes (C = 1),
(9.158) y (9.159) toman la forma más simple:
∂F1 ∂F1 ∂F1
= pν ; = −pν ; ν = 1, 2, ...l ; H = H + (9.163)
∂qν ∂qν ∂t
∂F2
= H − CH (9.166)
∂t
donde F2 es función de (q, p, t) y satisface la condición:
2
∂ F2
det 6= 0 (9.167)
∂~q ∂~p
350 / Mecánica clásica avanzada
∂F3
= H − CH (9.170)
∂t
donde F3 es función de (p, q, t) y satisface la condición:
2
∂ F3
det 6= 0 (9.171)
p ∂~q
∂~
En las T.C. libres de cuarta clase (p, p) son independientes, luego:
!
~p
J 6= 0 (9.172)
q
~
∂F4
= H − CH (9.174)
∂t
donde F4 es función de (p, p, t) y satisface la condición:
2
∂ F4
det 6= 0 (9.175)
p ∂~p
∂~
Se tienen, pues, 4l cantidades no independientes (q, p, q, p) de las cuales, además de
(q, p) y (q, p), se pueden extraer conjuntos de variables independientes (q, q), (q, p), (p, q),
(p, p). En cada uno de estos cuatro casos decimos que la transformación canónica es libre.
Una transformación canónica arbitraria es no libre y obedece fórmulas de transformación
en términos de una función generatriz que veremos más adelante y de las cuales (9.158)
y (9.164) a (9.175) no son más que casos particulares.
Ejemplo 9.5.5 Hallar la función generatriz del tipo F2 para la transformación canónica
(9.148).
Como ∆F2 es exacto se sigue que ∂ 2 F2 /∂p ∂q = ∂ 2 F2 /∂q ∂p lo cual implica que la
transformación es univalente, o sea C = 1. La función generatriz es:
s r
−1 mωq 2 1 2p
F2 (q, p) = p cos − mωq − q2 (9.178)
2p 2 mω
Ejemplo 9.5.6 Hallar las funciones generatrices del tipo F2 y F3 para la transformación
canónica identidad.
de la condición ∂ 2 F2 /∂qν ∂pµ = ∂ 2 F2 /∂pµ ∂qν se sigue que la transformación debe ser
univalente, en consecuencia:
l
X l
X
∆F2 = (pν ∆qν + qν ∆pν ) = ∆ q ν qν (9.186)
ν=1 ν=1
Por tanto:
l
X
F2 = pν qν (9.187)
ν=1
Similarmente:
l
X
F3 = − q ν pν (9.188)
ν=1
Ejemplo 9.5.7 Hallar las funciones generatrices del tipo F1 y F4 para la transformación
canónica de cambio de escala e intercambio de coordenadas y momentos (9.153).
l
X
C = −α β ; F4 = α pν pν (9.190)
ν=1
l
X
C = α β ; F2 = α pν qν (9.191)
ν=1
l
X
C = α β ; F3 = −β q ν pν (9.192)
ν=1
Las transformaciones canónicas / 353
Ejemplo 9.5.9 Sea una transformación canónica libre de primera clase (q, p) → (q, p)
con generatriz F1 (q, q, t). Mostrar que la transformación inversa (q, p) → (q, p) también
es canónica, y hallar la correspondiente función generatriz.
La desigualdad (9.162) garantiza que las dos últimas ecuaciones (9.194) se pueden
resolver para (q) en función de (p), tomando (q) como parámetros, con lo cual se pueden
expresar (p, q) en función de (q, p), o sea que las ecuaciones (9.124) se pueden invertir.
Esto prueba que la transformación inversa existe, la cual además es canónica. Para la
transformación inversa:
l
! l
!
X X
i i
∆F1 = C pν ∆q ν − H ∆t − pν ∆qν − H ∆t (9.195)
ν=1 ν=1
∂F1i ∂F1
C + = (−CC i + 1)H
∂t ∂t
De (9.197) se sigue que:
1
F1 = −CF1i ; F1i = −C i F1 ; Ci = (9.198)
C
o más explı́citamente:
1 1
F1i (q, q, t) = − F1 (q, q, t) ; Ci = (9.199)
C C
Para una transformación canónica libre univalente de primera clase se cumple
simplemente:
l
! l
!
X X
i i
∆F (q, p, t) = C pν ∆q ν − H ∆t − pν ∆qν − H ∆t (9.202)
ν=1 ν=1
l
! l
!
X X
∆Fµ.v. = pν ∆q ν − H ∆t − pν ∆q ν − H ∆t (9.209)
ν=1 ν=1
l
X l
X
F4 = F1 + q ν pν − qν pν (9.219)
ν=1 ν=1
Ejercicio 9.5.1 Usar las relaciones (9.217), (9.218) y (9.219) para obtener a F2 , F3 y F4
a partir de F1 para un oscilador armónico lineal. Comparar con las fórmulas (9.184).
Las transformaciones canónicas / 357
F2 = ψ ′ (q, p, t)
(9.222)
F3 = ψ(q, p, t)
F4 = φ′ (q, p, t)
Landau usa F1 = F y F2 = Φ.
l
X
F3 = − fν−1 (q, t)pν (9.227)
ν=1
donde fν−1 son las funciones inversas a fν , o sea, qν = fν−1 (q, t). Entonces se tiene para
pν y pν :
Xl
∂fµ (q, t)
pν = pν (9.228)
µ=1
∂qν
Xl
∂fµ−1 (q, t)
pν = pµ (9.229)
µ=1
∂q ν
Según lo anterior es claro que (p) y (p) estarán conectados por una transformación
lineal que depende de las coordenadas que llamaremos T̃ de modo que en forma de
matrices y vectores l-dimensionales (9.228) y (9.229) toman la forma:
−1
∂fν −1
∂fµν
Tµν = ; Tµν = (9.231)
∂qµ ∂qµ
La transformación es:
p
r = x2 + y 2 + z 2 = fr (q)
z
θ = cos−1 p = fθ (q) (9.232)
x + y2 + z 2
2
y
φ = tan−1 = fθ (q)
x
z = r cos θ = fz (q)
Las transformaciones canónicas / 359
donde tomamos a (q) = (x, y, z) y (q) = (r, θ, φ). Además usamos la notación (fν−1 ) =
(fx , fy , fz ). La función generatriz F2 , de acuerdo con (9.226) y (9.232) es:
F2 (q, p) = pr f r + pθ f θ + pφ f φ
p z
= pr x2 + y 2 + z 2 + p2θ cos−1 p (9.234)
x + y2 + z 2
2
−1 y
+pφ tan
x
Similarmente para F3 (q, p) tenemos:
F3 (q, p) = −px fx − py fy − pz fz
(9.235)
= −px r senθ cos φ − py rsenθ senφ − pz r cos θ
Usando (9.228) junto con (9.234) y (9.235) obtenemos las siguientes fórmulas para
la transformación de los momentos:
x y xz
px = p pr − 2 p +p
2 φ
pθ
2
x +y +z2 2 x + y x + y (x2 + y 2 + z 2 )
2 2
y x yz
py = p pr + 2 pφ + p pθ
x2 + y 2 + z 2 x +y 2
x2 + y 2 (x2 + y 2 + z 2 ) (9.236)
p
z x2 + y 2
px = p pr − 2 pθ
2 2
x +y +z 2 x + y2 + z 2
y similarmente:
pr = px senθ cos φ + py senθ senφ + pz cos θ
donde asumimos que Sνµ y bν pueden depender explı́citamente del tiempo, aunque
obviamente no dependen de (q) ni de (p).
La transformación inversa es:
l
X
−1
qν = Sνµ q µ − bµ = fν−1 (q, t) (9.242)
ν=1
−1
donde Sνµ es la matriz inversa de Sνµ . Las funciones generatrices F2 (q, p, t) de la trans-
formación, y −F2 (q, p, t) = F3 (q, p, t) de la transformación inversa son:
l
X l
X
F2 (q, p, t) = Sµν pµ qν + b ν pν (9.243)
µ,ν=1 ν=1
l
X
−1
F2 (q, p, t) = − Sµν q µ − b µ pν (9.244)
µ,ν=1
Ejercicio 9.5.2 Hallar los hamiltonianos y las ecuaciones de movimiento que correspon-
den a los conjuntos de variables canónicas (q, ṗ) y (−p, q̇).
Ejercicio 9.5.3 Analizar la transformación (q, p) ↔ (q, q̇) como una transformación en
el espacio de fases, e investigar si es canónica. De serlo hallar la correspondiente función
generatriz.
de acuerdo con (9.136). Es claro que igualmente podrı́amos haber usado cualquiera de
las expresiones (9.145), (9.146) o (9.147), obteniéndose cuatro expresiones para F que
sólo difieren por una transformación de Legendre. La expresión (9.256) usando (9.255)
se puede separar ası́:
r
X l
X s
X s
X
∆F = C pν ∆qν +C pν ∆qν − pν ∆q ν − pν ∆q ν + H − H ∆t (9.257)
ν=1 ν=r+1 ν=1 ν=s+1
Las transformaciones canónicas / 363
! (9.258)
l
X l
X l
X
pν ∆q ν = ∆ pν q ν − q ν ∆pν
ν=s+1 ν=s+1 ν=s+1
Las fórmulas (9.260) son equivalentes a las fórmulas (9.254) y determinan la trans-
formación canónica por medio de la valencia C y la función generatriz U de las variables
independientes (9.255).
Las fórmulas (9.260) relacionan el conjunto de variables independientes (9.255) con
el siguiente conjunto de variables independientes complementarias:
p1 , p2 , ...pr , qr+1 , qr+2 , ...ql , p1 , p2 , ...ps , q s+1 ; q s+2 , ...q l
(9.262)
0 ≤ r ≤ l, 0 ≤ s ≤ l
364 / Mecánica clásica avanzada
El jacobiano de las variables p1 , p2 , ...ps , q s+1 , q s+2 , ...q l respecto a las variables
q1 , q2 , ...qr , pr+1 , pr+2 , ...pl es diferente de cero. Ese jacobiano puede escribirse como:
∂~ps ∂~ps
! ∂~qr
~ps , ~q l−s ∂~pl−r
J = det
qr , p~l−r
~
∂~q l−s ∂~q l−s
∂~qr ∂~pl−r
2
∂ U ∂2U
−
∂~qr ∂~q −
s ∂~pl−r ∂~q s
= det
(9.263)
∂2U ∂2U
∂~qr ∂~pl−s ∂~pl−r ∂~pl−s
donde ~ps es el vector p1 , p2 , ...ps . p~l−r es el vector pr+1 , pr+2 , ...pl , con significado análo-
go para los otros vectores que aparecen en (9.263). En vista de (9.263), las ecuaciones
(9.260) de la primera lı́nea pueden resolverse para expresar a q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl
en función de p1 , p2 , ...pr , qr+1 , qr+2 , ...ql . Después se reemplazan las expresiones obte-
nidas en las l ecuaciones de la segunda lı́nea de (9.260) para obtener las ecuaciones de
la transformación canónica (9.254). Las fórmulas de la transformación canónica inversa
pueden obtenerse de manera análoga mediante una función generatriz que depende de
las variables (9.262) en vez de las variables complementarias igual a (9.255), −C −1 U y
una valencia igual a C −1 .
Queda claro que las transformaciones canónicas libres resultan como casos parti-
culares de la transformación canónica arbitraria, al definir apropiadamente los valores
de r y s.
q = ~q(~
~ q0 , p~0 , t) ; p~ = ~p(~q0 , p~0 , t) (9.264)
La ecuación (9.264) puede interpretarse como una transformación canónica de las varia-
bles ~
q0 , p~0 a las variables ~q, p~. En la sección 4.7 vimos que para un sistema conservativo
la acción coincide con el negativo de la función generatriz de la transformación canónica
de evolución temporal (9.264). Veamos que este resultado vale en general. En la sección
9.1 vimos que la diferencia de acción entre dos trayectorias rectas infinitesimalmente
Las transformaciones canónicas / 365
próximas, ∆S, cuyos puntos iniciales y finales están sobre ciertas curvas C1 y C2 res-
pectivamente, del espacio de configuración, está dada por la ecuación (9.11),
l
! l
!
X X
∆S = pν ∆qν − H ∆t − pν ∆qν − H ∆t (9.265)
ν=1 C2 ν=1 C1
buscada (9.264).
~ t)
La ecuación (9.277) se llama la ecuación de Hamilton-Jacobi.7 La solución S(~q, β,
de la ecuación de Hamilton-Jacobi con l constantes arbitrarias β1 , β2 , ...βl se llama la
integral completa de la ecuación de Hamilton-Jacobi si se cumple la condición:
∂2S
det 6= 0 (9.278)
~
∂~q ∂ β
La expresión (9.278) es equivalente a la (9.162) que es la condición necesaria
para que las ecuaciones (9.275) puedan resolverse para expresar a ~q, p~, en la forma
q = ~q(~
~ ~ t); ~
α, β, p = p~(~ ~ t). Lo anterior constituye el teorema de Jacobi cuyo enunciado
α, β,
7 Ya en 1824 el mismo Hamilton halló una ecuación diferencial de esta forma en conexión con la
óptica.
Las transformaciones canónicas / 367
Z t
1 1 1
S= mż 2 − mgz dt = m ż02 t − ż0 gt2 + g 2 t3
0 2 2 3
1 2 1 3
−mg z0 t + ż0 t − gt (9.280)
2 6
teniendo en cuenta que E = 1/2 mż02 + mgz0 :
1
S = −Et + mż02 t − mż0 gt2 + mgt3 (9.281)
2
y como:
s !
ż0 2g
t= 1− 1 + 2 (z0 − z) (9.282)
g ż0
podemos escribir a S en la forma:
3/2
mż03 2g
S = −Et − 1 + 2 (z0 − z) (9.283)
3g ż
8 Este enunciado constituye la contribución de Jacobi a este problema y fue publicado en el año 1837.
368 / Mecánica clásica avanzada
donde omitimos una constante. La expresión (9.283) también se puede escribir en térmi-
nos de E como:
3/2
m 2
S(z, E, t) = −Et − (E − mgz)3/2 (9.284)
3g m
que coincide con la ecuación (4.190), que fue obtenida integrando la ecuación de Hamilton-
Jacobi.
El hamiltoniano es:
p2 kq 2
H= + (9.287)
2m 2
La ecuación de Hamilton-Jacobi (9.277) es:
2
∂S(q, β, t) ∂S(q, β, t) kq 2
+ + =0 (9.288)
∂t ∂q 2
donde h es la constante de Jacobi que en este caso coincide con la energı́a total E. Como
el sistema tiene sólo un grado de libertad hay sólo una constante de integración, por
tanto, podemos hacer h = E = β. Σ(q, E) será solución a la ecuación:
2
1 d Σ(q, E) kq 2
+ =E (9.290)
2m dq 2
La ecuación (9.290) puede resolverse directamente:
r
√ Z q 2E
Σ(q, E) = mk − q 2 dq (9.291)
q0 k
√ Z qr
2E
S(q, E, t) = Σ(q, E, t) = −Et + mk − q 2 dq (9.292)
q0 k
Z t Z t
p2 kq 2
L dt = − dt =
t0 t0 2m 2
Z t
E [cos2 ω(t − α) − sen2 ω(t − α)] dt = (9.298)
t0
E E
sen 2ω(t − α) − sen 2ω(t0 − α) (9.299)
2ω 2ω
Omitiendo la constante aditiva podemos escribir:
Z t
E 1
L dt → sen ω(t − α) cos ω(t − α) = mω 2 q 2 cot ω(t − α) (9.300)
t0 ω 2
Evaluando a S en (9.292):
√
S = −Et + mk×
" r #
1 2E 2
2E −1 q
q −q + sen p + constante (9.301)
2 k k 2E/k
reemplazando a (9.296) en (9.301) y omitiendo una constante aditiva:
1√
S = −Et + 2mEq cos ω(t − α) + E(t − α)
2
(9.302)
1
⇒ S → mωq 2 cot ω(t − α)
2
Comparamos (9.300) y la parte final de (9.302) para encontrar el resultado que se
espera: la solución a la ecuación de Hamilton-Jacobi coincide con la integral de acción.
S(~
q , β1 , β2 , ...βl−1 , h, t) = −ht + Σ(~q, β1 , β2 , ...βl−1 , h) (9.304)
q , β~l−1 , h)
∂Σ(~
= t − αl (9.308)
∂h
donde αν , βν , h, son constantes arbitrarias.
Usando las segundas l − 1 ecuaciones (9.307) podemos expresar a l − 1 coordenadas
en términos de la restante l-ésima coordenada y de las 2l − 1 constantes arbitrarias
~l−1 , h, α1 , α2 , ...αl−1 , como en la ecuación (9.38). Éstas son las ecuaciones de las
β
trayectorias en el espacio de configuración. La ecuación (9.308) conecta las coordenadas
con la variable temporal t, y equivale a la ecuación (9.40).
Ası́ como la acción principal de Hamilton coincide con una de las integrales com-
pletas de la ecuación de Hamilton-Jacobi dependiente del tiempo, la acción de Lagrange
10 El ejemplo 4.4.2, sección 4.4, ilustra la propiedad general de la ecuación de Hamilton-Jacobi de
poseer soluciones en las cuales las variables t y ~
q no están separadas.
372 / Mecánica clásica avanzada
∂F1
=0⇒H =H; H = H(q) = constante = h (9.309)
∂t
∂F1 ∂F1
= pν ; = pν ; ν = 1, 2, ...l (9.310)
∂qν ∂qν
∂F1 (~ ~l−1 , h)
q, β
= p~
∂~q
∂F1 (~ ~l−1 , h)
q, β
= −~pl−1 (9.313)
~l−1
∂β
∂F1 (~ ~l−1 , h)
q, β
= −~
pl
∂h
Las transformaciones canónicas / 373
~
~p˙ = − ∂H(q ) = − ∂βl (9.314)
~
∂p ~
∂β
⇒ ~pl−1 = constante = α
~ l−1 ; pl = −t + αl
Las ecuaciones (9.312) y (9.313) junto con las (9.314) quedan ası́:
∂F1 (~ ~l−1 , h)
q, β
= pν ; ν = 1, 2, ...l
∂~qν
∂F1 (~ ~l−1 , h)
q, β
= −αν ; α = 1, 2, ...l − 1 (9.315)
∂βν
∂F1 (~ ~l−1 , h)
q, β
= t − αl
∂h
Comparando (9.312) con (9.305) y a (9.315) con (9.307), vemos que la función
generatriz de la transformación buscada, F1 (q, q), coincide con la función Σ.
Σ puede considerarse como la función generatriz de una transformación canónica
libre univalente de primera clase que al ser aplicada a un sistema conservativo genera-
lizado nos conduce a unas variables canónicas (q, p) donde todas las q ν son constantes,
lo mismo que l − 1 pν . Una de las constantes q ν coincide con h y el l-ésimo pν es una
función lineal del tiempo, pl = −t + αl . Si esta transformación se aplica a un sistema
para el cual ∂H/∂t 6= 0, es claro que las nuevas variables canónicas ya no tendrán las
caracterı́sticas señaladas.
No es drástica la exigencia βl = h. Podrı́amos haber dejado a h = H(β), ~ lo cual
nos conducirı́a a que todos los q ν son constantes y todos los pν son funciones lineales
del tiempo.
Es decir, las T.C.I. son las que se obtienen a partir de la identidad variando de
manera continua uno o varios parámetros.
Los Gj se llaman los generadores infinitesimales de la T.C.I., en términos de los
cuales se pueden expresar las fórmulas (9.135). Una transformación canónica del tipo F2
satisface:
∂F2 ∂F2 ∂F2
pν = ; qν = ; ν = 1, 2, ...l ; H − H = (9.321)
∂qν ∂pν ∂t
Entonces para la T.C.I. con función generatriz (9.319) tenemos:
∂G ∂G
δpν = −ε ; δqν = ε ; ν = 1, 2, ...l
∂qν ∂pν
(9.322)
∂G
H =H +ε
∂t
donde en (9.322) hemos notado que ε f (q, p, t) = εf (q, p, t) al primer orden en ε.
Si comparamos a (9.329) con (9.319) vemos que en este caso τ hace el papel del
parámetro infinitesimal ε y H es el generador infinitesimal de la T.C.I. de evolución
temporal. Al mismo resultado llegamos de la siguiente manera, notemos que:
q ν = qν + τ q̇ν ⇒ δqν = τ q̇ν = dqν (9.330)
∂H
pν = pν + τ ṗν ⇒ δpν = τ ṗν = dpν ; H = H + τ (9.331)
∂t
Comparando a (9.322) con (9.330) obtenemos:
∂G ∂G ∂G ∂H
ε = τ q̇ν ; −ε = τ ṗν ; ε =τ (9.332)
∂pν ∂qν ∂t ∂t
376 / Mecánica clásica avanzada
ri
ε
r
θi
x
yi = ri sen(θi + ε) (9.338)
zi = zi ; i = 1, 2, ...N
y similarmente para las componentes de P~i . Al primer orden en ε, las ecuaciones (9.338)
y sus similares para p~i nos dan:
xi = xi − εyi ; yi = yi + εxi ; z i = zi
(9.339)
pxi = pxi − εpyi ; pyi = pyi + εpxi ; pzi = pzi ; i = 1, 2, ...N
Comparando (9.339) con (9.322) hallamos:
∂G ∂G ∂G
−εyi = δxi = ε ; εxi = δyi = ε ; 0 = δzi = ε
∂pxi ∂pyi ∂pzi
∂G
−εpyi = δpxi = −ε (9.340)
∂pxi
∂G ∂G
εpxi = δpyi = −ε ; 0 = δpzi = −ε
∂yi ∂zi
vemos que G no depende de zi ni de pzi . (9.340) se satisfacen si:
N
X
G= (xi pyi − yi pxi ) = Lz (9.341)
i=1
378 / Mecánica clásica avanzada
O sea que, como debe ser, Lz = Lz . Veremos que Lz será constante en el tiempo
sólo si H no depende de la coordenada φ del vector de posición del centro de masa.
Las variables dinámicas. Definimos una variable dinámica como una función del
estado del sistema y del tiempo que no cambia su valor en una transformación canónica.
Ası́ que bajo una transformación canónica (q, p) → (q, p), f será una variable dinámica
si se cumple:
dado se describe por el punto A(q, p) en un espacio de fases y por el punto A(q, p) en
otro espacio de fases, una variable dinámica tiene el mismo valor en A que en A.
Por otra parte, hay transformaciones canónicas que admiten una interpretación
activa. Son aquellas transformaciones canónicas del espacio de fases en sı́ mismo; o sea
aquellas en que se tiene una aplicación del espacio de fases sobre sı́ mismo. Ası́, la trans-
formación canónica de evolución temporal asocia al estado del sistema en el tiempo t0 ,
(q0 , p0 ) el estado en el tiempo t, (q, p); la transformación canónica de translación espacial
asocia a la posición del sistema (~r1 , ~r2 , ...~rN ) una posición en la cual todas las partı́culas
se han desplazado una distancia ~ ε: (~r1 + ~ε, ~r2 + ~ε, ...~rN + ~ε); la transformación canónica
de rotación espacial es la misma estudiada en el capı́tulo 7. Son susceptibles de una in-
terpretación “activa” todas aquellas transformaciones canónicas que se pueden obtener
a partir de la transformación identidad por medio de la variación continua de uno o
varios parámetros. Ası́ por ejemplo, la inversión de las coordenadas, o la transformación
canónica que intercambia coordenadas y momentos, no son susceptibles de una interpre-
tación activa. Tampoco mediante una variación continua de parámetros podemos llegar
de las coordenadas cartesianas a las coordenadas esféricas, por ejemplo.
Toda T.C.I. es pues susceptible de ser tratada en las formas pasiva (el sistema
descrito desde diferentes espacios de fases) o activa (el sistema es cambiado de un estado
a otro). En (9.318) es entonces válido tomar desplazamientos del tipo ∆.
de acuerdo con la notación (9.343). Usando (9.343) podemos escribir a (9.346) como:
∂f = −∂f (9.348)
Los dos cambios (9.345) y (9.346) son iguales, o sea que ∂f puede significar el
cambio del valor de f al pasar el sistema del estado (q, p, t) al estado (q, p, t) o el cambio
funcional de la función f en el mismo estado, en la interpretación “pasiva”. La T.C.I. es
380 / Mecánica clásica avanzada
Xl
∂g ∂h ∂g ∂h
[g, h] = − (9.350)
ν=1
∂qν ∂pν ∂pν ∂qν
Vemos que el corchete de Poisson de dos variables dinámicas a su vez es una variable
dinámica. En sı́ntesis:
l
∂f X ∂f ∂H ∂f ∂H (9.352)
= + −
∂t ν=1 ∂qν ∂pν ∂pν ∂qν
∂f
⇒ f˙ = + [f, H]
∂t
Si la variable dinámica f no depende explı́citamente del tiempo, su rata de cambio
es igual a su corchete de Poisson con H. Si f es una constante de movimiento, el corchete
de Poisson de f con H es igual al negativo de su derivada parcial respecto al tiempo; si f
no depende explı́citamente del tiempo será una constante de movimiento si su corchete
de Poisson con H es cero.
H(q, p, t) y H(q, p, t), de acuerdo con (9.344) y (9.319) están relacionadas por:
∂G
H(q, p, t) − H(q, p, t) = ε (9.354)
∂t
reemplazando a (9.354) en (9.353) tenemos:
∂G
∂H = H(q, p, t) − H(q, p, t) + ε (9.355)
∂t
Ahora sı́ podemos usar la ecuación (9.351) para H:
∂H = ε Ġ (9.359)
Por otra parte si se conocen 2l constantes de movimiento del sistema se tendrá re-
suelto el problema mecánico, si esas 2l constantes son independientes. En efecto, el
método de Hamilton-Jacobi permite mediante una transformación canónica expresar las
coordenadas y momentos del sistema en términos de las constantes de movimiento y del
tiempo. En el capı́tulo 11 se muestra que el resultado falla si el sistema es no integrable.
La conservación del momento que vimos en el capı́tulo 3 se sigue de este teorema. Si
qν0 es cı́clica, H no depende de ella y por tanto es invariante en una T.C.I. que implique
el cambio de qν0 , y el generador infinitesimal de esta transformación habrá de ser una
constante de movimiento. Las ecuaciones de tal transformación canónica serán:
∂G ∂G
δqν = ε ; δpν = −ε ; ν = 1, 2, ...l (9.361)
∂pν ∂qν
G = pν0 (9.362)
∂H ∂H
= [qν , H] ; = −[pν , H] ; ν = 1, 2, ...l (9.364)
∂pν ∂pν
Las expresiones (9.363) son las ecuaciones de movimiento de Poisson, totalmente equi-
valentes a las ecuaciones de movimiento de Hamilton. Las ecuaciones (9.364) no son más
que el resultado de aplicar el párrafo que sigue a la ecuación (9.362), conjuntamente con
(9.351).
Ejemplo 9.8.1 Hallar las ecuaciones de movimiento de Poisson para una partı́cula car-
gada en presencia de un campo electromagnético externo.
Usamos la ecuación (3.117) para h conjuntamente con la ecuación (4.1) para ~r˙ en
función del momento canónico p~:
1 e ~ 2
H= p~ − A + eφ (9.365)
2m c
Las transformaciones canónicas / 383
donde A ~ y φ son los potenciales vectorial y escalar del campo externo. Evaluemos los
corchetes de Poisson de ~r con H y de p~ con H para mostrar la consistencia con las
fórmulas (9.363):
∂rn ∂H ∂rn ∂H
[rn , H] = · − ·
∂~r ∂~ p ∂~p ∂~r
e~
∂H p~ − A
= ~n · = ~n · c ; ~n = ~i, ~j, ~k (9.366)
∂~p m
Por otra parte:
∂pn ∂H ∂pn ∂H ∂H ∂H
[pn , H] = · − · = −~n · =−
∂~r ∂~ p ∂~p ∂~r ∂~r ∂rn
e e ~ ∂A ~ ∂φ
= p~ − A · −e (9.367)
mc c ∂rn ∂rn
La ecuación (9.367) también puede escribirse ası́:
[pn , H] =
~
e ˙ ∂A ∂φ e ∂ ˙ ~ ∂An
~r · −e = (~r · A) − Ȧn + + (9.368)
c ∂rn ∂rn c ∂rn ∂t
e e ∂An ∂φ
Ȧn − −e
c c ∂t ∂rn
~ y E se pueden expresar en términos de A
Notamos que B ~ y φ ası́:
~
~ = − ∂φ − 1 ∂ A ;
E ~ = ∂ ×A
B ~ (9.369)
∂~r c ∂t ∂~r
Notemos que:
∂ ∂Aµ
~r˙ × ~
×A = ǫnms ǫstµ ṙm
∂~r n ∂rt
∂Aµ
= (δnt δmµ − δnµ δmt ) ṙm (9.370)
∂rt
∂A~ ∂Aµ
= ~r˙ · − ~r˙ ·
∂rn ∂~r
y,
∂An ˙ ∂An
Ȧn = + ~r · (9.371)
∂t ∂~r
con lo cual:
∂ ~
~r˙ × ~ = ~r˙ · ∂ A + ∂An − Ȧn = ∂ (~r˙ · A)
×A ~ + ∂An − Ȧn (9.372)
∂~r ∂rn ∂t ∂rn ∂t
384 / Mecánica clásica avanzada
"
X2l Xl
∂hν ∂gν ∂f
D̂g D̂h − D̂h D̂g f= gi − hi
i=1 ν=1
∂xi ∂xi ∂qν
# (9.388)
∂hl+ν ∂gl+ν ∂f
+ gi − hi
∂xi ∂xi ∂pν
X2l Xl
∂hν ∂gν ∂ ∂g ∂f
gi − hi − hi
i=1 ν=1
∂xi ∂xi ∂p ν ∂xi ∂qν (9.389)
X2l Xl
∂hl+ν ∂gl+ν ∂ ∂g ∂f
+ gi − hi + hi
i=1 ν=1
∂xi ∂xi ∂qν ∂xi ∂pν
∂g ∂g
gν = − ; gl+ν = ; ν = 1, 2, ...l (9.390)
∂pν ∂qν
Por tanto:
∂hν ∂gν ∂ ∂g
gµ − hµ − hµ
∂qµ ∂qµ ∂pν ∂qµ
∂g ∂ 2 h ∂h ∂ 2 g
= −
∂pµ ∂qµ ∂pν ∂pµ ∂qµ ∂pν
(9.391)
∂ 2 h ∂g ∂h ∂ 2 g
+ +
∂pν ∂pµ ∂qµ ∂pµ ∂pν ∂qµ
∂g ∂ 2 h ∂g ∂ 2 h
= +
∂pµ ∂qµ ∂pν ∂qµ ∂pµ ∂qν
Las transformaciones canónicas / 387
∂g ∂ 2 h ∂g ∂ 2 h
− −
∂qµ ∂pµ ∂pν ∂pµ ∂pν ∂qµ
∂hl+ν ∂gl+ν ∂ ∂g
gµ − hµ + hµ =
∂qµ ∂qµ ∂qν ∂qµ
(9.392)
∂g ∂ 2 h ∂g ∂ 2 h
− −
∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ
∂hl+ν ∂gl+ν ∂ ∂g
gl+µ − hl+µ + hl+µ =
∂pµ ∂pµ ∂qν ∂pµ
∂g ∂ 2 h ∂g ∂ 2 h
+
∂qµ ∂pµ ∂qν ∂pµ ∂qν ∂qµ
Reemplazando (9.391)y (9.392) en (9.389) obtenemos:
l
X ∂g ∂ 2 h ∂g ∂ 2 h
+
µ,ν=1
∂pν ∂qµ ∂pν ∂qµ ∂pµ ∂pν
!
∂g ∂ 2 h ∂g ∂ 2 h ∂f
− − (9.393)
∂qµ ∂pµ ∂pν ∂pµ ∂pµ ∂qν ∂qν
l
X ∂g ∂ 2 h ∂g ∂ 2 h
+ − −
µ,ν=1
∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ
!
∂g ∂ 2 h ∂g ∂ 2 h ∂f
+ +
∂qµ ∂pµ ∂qν ∂pν ∂qν ∂qµ ∂pν
Xl
∂f ∂f ∂f ∂qµ ∂f ∂pµ
= = + (9.395)
∂q ∂q ν µ=1
∂qµ ∂qν ∂pµ ∂q ν
388 / Mecánica clásica avanzada
∂f ∂f ∂G ∂f ∂ ∂f
= +ǫ ,f = +ǫ [G, f ] − ǫ G, (9.397)
∂qν ∂qν ∂qν ∂qν ∂qν ∂qν
y análogamente se llega a:
∂f ∂f ∂ ∂f
= +ǫ [G, f ] − ǫ G, (9.399)
∂pν ∂pν ∂pν ∂pν
l
"
X ∂f ∂[G, f ] ∂f
f, g (q,p)
= +ǫ − ǫ G, ·
ν=1
∂qν ∂pν ∂qν
∂g ∂[G, g] ∂g
+ǫ − ǫ G, +
∂pν ∂pν ∂pν
(9.400)
∂f ∂[G, f ] ∂f
+ǫ − ǫ G, ·
∂pν ∂pν ∂pν
#
∂g ∂[G, g] ∂g
+ǫ − ǫ G,
∂qν ∂qν ∂qν
Las transformaciones canónicas / 389
Xl
∂[G, f ] ∂g
f, g (q,p)
= [f, g](q,p) + ε
ν=1
∂qν ∂pν
∂f ∂g ∂f ∂[G, g]
− G, +
∂qν ∂pν ∂qν ∂pν
∂f ∂g ∂[G, g] ∂f ∂g ∂f
− G, − + G,
∂qν ∂pν ∂qν ∂pν ∂qν ∂pν
(9.401)
∂g ∂[G, f ] ∂g ∂f
− + G, =
∂qν ∂pν ∂qν ∂pν
Xl
∂g ∂f ∂g ∂f
+ǫ ,G − ,G
ν=1
∂pν ∂qν ∂qν ∂pν
∂f ∂g
+ [f, H] = 0 y + [g, H] = 0 (9.403)
∂t ∂t
Debemos probar que esto implica que:
∂[f, g]
+ [[f, g], H] = 0 (9.404)
∂t
11 Este teorema fue enunciado por Poisson en 1809.
390 / Mecánica clásica avanzada
En efecto:
∂ ∂f ∂g
[f, g] = , g + f, = − [[f, H] , g] − [f, [g, h]]
∂t ∂t ∂t
(9.405)
[[H, f ] , g] + [g, [H, f ]] = − [[f, g] , H]
La última igualdad en (9.405) se sigue de la identidad de Jacobi, lo cual demuestra
el teorema. El corchete de Poisson de dos variables dinámicas que se conservan es una
variable dinámica que se conserva. Esto permite, por ejemplo, construir a partir de
un conjunto de s constantes de movimiento independientes C1 , C2 , ...Cs (s < 2l) las
2l − s constantes independientes restantes Cs+1 , Cs+2 , ...C2l por formar los corchetes
de Poisson entre todos los posibles pares de estas S variables dinámicas. En total hay
s(s − 1)/2 corchetes de Poisson, de los cuales algunos pueden ser cero o funciones de
constantes de movimiento conocidas antes, pero es de esperarse que haya 2l − s que
sean independientes. Es claro que puede haber un número mı́nimo s de constantes de
movimiento independiente tal que a partir de ellas se pueda obtener el conjunto completo
de 2l constantes de movimiento independientes.
Ejemplo 9.8.2 Sea una partı́cula en una dimensión, sometida a una fuerza constante.
Hallar dos constantes de movimiento independientes y mostrar que el corchete de Poisson
de ellas no da lugar a una tercera constante de movimiento.
La solución al problema es:
1
x = v(t + t0 ) + g(t + t0 )2 ; p = mv + mg(t + t0 ) (9.406)
2
donde t0 y v son constantes. Dos constantes de movimiento son t0 y la energı́a total E.
x puede escribirse en la forma:
p 1
x= (t + t0 ) − g(t + t0 )2 (9.407)
m 2
Entonces las expresiones para t0 y E en función de p y x son:
s
p p2 2x p2
t0 = −t + − − ; E = − mgx (9.408)
mg m2 g 2 g 2m
El corchete de Poisson de t0 y E es:
∂t0 ∂E ∂t0 ∂E
[t0 (p, x, t), E(p, x, t)] = − (9.409)
∂x ∂p ∂p ∂x
Haciendo el cálculo indicado en (9.408), usando (9.409), obtenemos:
[t0 , E] = 1 (9.410)
La ecuación (9.408) puede interpretarse como una transformación canónica que
permite expresar las nuevas variables canónicas t0 y E en función de las viejas x y p.
Tal transformación depende del tiempo. Esto ilustra un resultado más general: [qν , pν ] =
[q ν , q ν ] = 1, para todo ν, que veremos más adelante.
Las transformaciones canónicas / 391
Ejemplo 9.8.3 Sea una partı́cula para la cual lz y py son constantes de movimiento.
Hallar una tercera constante de movimiento.
obtenemos:
[li , lj ] = (δij δkn − δin δkj )xk pn − (δij δkn − δin δkj )pk xn (9.420)
Ası́, vemos que [lx , ly ] = xpy − ypx = lz , o sea que si lx y ly son constantes de
movimiento, lz también lo es.
O sea que H, ~l2 y lz pueden tomarse como tres “momentos” constantes, que jun-
to con sus tres “coordenadas” canónicamente conjugadas, que son funciones lineales
del tiempo según se vio al final del capı́tulo 2, constituyen un conjunto de seis varia-
bles canónicas que describen exhaustivamente el sistema. Por ser independientes, li y lj
podrı́an servir de variables de estado pero en un formalismo no canónico (no hamilto-
niano).
donde los G̃i están dados en la ecuación (7.221), los Ci son los cosenos directores del eje
de rotación y δφ es el ángulo de rotación. De acuerdo con (9.318) y (9.432):
~r = ~r + Ci G̃i ~r δφ ; ~p = p~ + Ci G̃i p~ δφ (9.433)
De acuerdo con (9.318), (9.322) y (9.433) tenemos que:
∂
δ~r = Ci G̃i~r δφ = ǫ G(~r, ~p)
∂~p
(9.434)
∂
δ~
p= Ci G̃i p
~ δφ = ǫ G(~r, ~p)
∂~r
donde G es el generador infinitesimal de la rotación, que de acuerdo con (9.340) es la
componente de ~l a lo largo del eje de rotación:
G(~r, p~) = ~n · ~r × ~p = Ci li (9.435)
Vemos entonces que δφ = ǫ y que:
∂ ∂
Ci G̃i ~r = Ci li = (~n · ~r × ~p) = ~n × ~r
∂~
p ∂~p
(9.436)
∂ ∂
Ci G̃i p~ = − Ci li = − (~n · ~r × p~) = ~n × p~
∂~p ∂~r
Tomando componentes en (9.432) a (9.436):
Ci G̃i xl = ǫkil Ci xl ⇒ G̃i = ǫkil (9.437)
kl kl
El lector puede verificar fácilmente que este resultado es consistente con las ecua-
ciones (7.222), teniendo en cuenta que allı́ se tenı́an rotaciones “activas”. De (9.436)
vemos que se puede escribir:
= G̃i~r · G̃j p
~ − G̃j ~r · G̃i ~p (9.439)
= ~rT G̃Ti G̃j ~p − ~rT G̃Tj G̃i p~ = ~rT (G̃Ti G̃j − G̃Tj G̃i )~
p
De acuerdo con la ecuación (7.224) que define el álgebra de Lie de las rotaciones:
= ǫijk lk
lo cual concuerda con el resultado obtenido en (9.422).
Decimos que li y G̃i tienen la misma álgebra de Lie, definida por corchetes de
Poisson de variables dinámicas y de conmutadores de matrices respectivamente.
Volvamos al problema de las funciones escalares y vectoriales. Para rotaciones
infinitesimales una función escalar cumple:
∂φ ∂φ
φ(~r, p~) = φ(~r + δ~r, p~ + δ~
p) = φ(~r, ~p) + δ~r · + δ~
p· (9.442)
∂~r ∂~p
o sea que se cumple:
∂φ ∂φ ∂G ∂φ ∂G ∂φ
δ~r · + δ~
p· =ǫ · − · = −ǫ [G, φ] = 0 (9.443)
∂~r ∂~
p ∂~
p ∂~r ∂~r ∂~p
lo cual es consistente con (9.351). La ecuación (9.443) también implica que:
∂φ ∂φ ∂φ ∂φ
~n × ~r · + ~n × p~ · = 0 ⇒ ~n · ~r × + p~ × =0 (9.444)
∂~r ∂~
p ∂~r ∂~p
Como ~n es arbitrario, a fin de que φ sea escalar debe cumplirse:
∂φ ∂φ
~r × + p~ × =0 (9.445)
∂~r ∂~
p
se cumple si ∂φ/∂~r = a~r + b~
p y ∂φ/∂~p = c~r + d~
p puesto que:
∂φ ∂φ
~r × + p~ × = b~r × p~ + c~
p × ~r = 0 si b = c (9.446)
∂~r ∂~
p
es decir, φ es de la forma:
1 2 1 2
φ= p = A~r2 + B~
a~r + c~r · p~ + d ~ p2 + c~r · ~p (9.447)
2 2
donde A, B y C no dependen de ~r ni de ~p. Ası́ pues:
[~r2 , li ] = 0 ; [~
p2 , li ] = 0 ; [~r · p~, li ] = 0 implican : [φ, li ] = 0 (9.448)
p + f3 ~l
F~ = f1 ~r + f2 ~ (9.449)
donde f1 , f2 y f3 son funciones escalares, o sea de la forma (9.447).
396 / Mecánica clásica avanzada
De (9.428) se sigue que F~ se transforma bajo rotación como (9.431). Los vectores de
la forma (9.449) dependen del estado del sistema, en tanto que los vectores unitarios de
base ~ei son independientes de él como también los vectores ~n, que definen las rotaciones.
Si ~n mismo estuviera determinado por los vectores ~r y p~, entonces una rotación cambiarı́a
no sólo los componentes de la función F~ sino la naturaleza misma de la función (algo
análogo a lo que sucede con el hamiltoniano cuando las transformaciones canónicas
dependen del tiempo). En una rotación el cambio en F~ es:
donde los vectores unitarios no son rotados por ~l · ~n. Éste no serı́a el caso si F~ fuera un
vector externo como un campo magnético, que no depende del estado de la partı́cula.
La expresión (9.451) vale pues sólo para funciones vectoriales de la forma (9.449). La
ecuación (9.450) también puede escribirse usando la notación diádica en términos del
diádico unidad ~
~1 = ~e1~e1 + ~e2~e2 + ~e3~e3 :
~
[F~ , ~l] = −~1 × F~ (9.452)
[F~ · G,
~ ~l · ~n] = 0 (9.453)
En efecto, F~ · G
~ es una función escalar, que no cambia por rotaciones.
Por contraste, F~ · ~n′ donde ~n′ es un vector independiente del estado, no es una
función escalar y satisface que:
1 1
[Ai , li ] = B[(~r × ~e3 )i , lj ] = Bǫik3 [xk , li ] (9.455)
2 2
usando (9.427) obtenemos:
1 1
[Ai , lj ] = Bǫik3 ǫkjl xl = − B(δij δ3l − δil δ3j ) xl
2 2
(9.456)
1
= − B(δij x3 − δ3j xi )
2
Las transformaciones canónicas / 397
similarmente,
l̂i ˆ lj ˆ
lj − ˆ li = ih̄ǫijk l̂k (9.461)
donde G̃i (q, p, t) son llamadas las constantes estructurales, las correspondientes relacio-
nes de álgebra de Lie cuánticas son:
Ejemplo 9.8.6 Sea una variable dinámica B independiente del tiempo, la cual satisface
la última igualdad de la ecuación (9.352). Mostrar que la solución de dicha ecuación coin-
cide formalmente con la fórmula de Hausdorff-Baker-Campbell (H.B.C.) de la mecánica
cuántica.
l l
!
X X
pν ∆q ν − H ∆t = C pν ∆qν − H ∆t − ∆F (q, p, t) (9.477)
ν=1 ν=1
l
X l
X
pν δq ν = C pν δqν − δF (q, p, t) (9.478)
ν=1 ν=1
Ahora (9.478) es la identidad que define una transformación canónica que no de-
pende del tiempo,
Entonces, las ecuaciones (9.479) definen una transformación canónica con valencia C
y función generatriz F (q, p, t′ ) que no depende del valor escogido para t = t′ . Veamos
ahora cómo la identidad que define el carácter canónico de la transformación dependiente
del tiempo, ecuación (9.477), puede obtenerse de la identidad correspondiente para la
transformación independiente del tiempo, ecuación (9.478). La ecuación (9.4) relaciona
las variaciones δ con las variaciones ∆:
∆q ν = δq ν + q̇ ν ∆t ; ν = 1, 2, ...l (9.480)
Con expresiones análogas para ∆pν , ∆qν , ∆pν . Entonces la relación entre ∆F y
δF será:
" l #
X ∂F ∂F ∂F
∆F = δF + q̇ν + ṗν + ∆t (9.481)
ν=1
∂qν ∂pν ∂t
Las transformaciones canónicas / 401
l
! l
!
∂ X ∂q µ ∂ X ∂qµ
− pµ = − pµ (9.489)
∂pν µ=1
∂pλ ∂pλ µ=1
∂pν
l
! l
!
∂ X ∂q µ ∂ X ∂q µ
Cpλ − pµ = − pµ
∂pν µ=1
∂qλ ∂qλ µ=1
∂pν
Xl
∂pµ ∂q µ ∂pµ ∂q µ
− = 0
µ=1
∂qν ∂qλ ∂qλ ∂qν
Xl
∂pµ ∂qµ ∂pµ ∂q µ
− = 0 (9.490)
µ=1
∂pν ∂pλ ∂pλ ∂pν
Xl
∂pµ ∂q µ ∂pµ ∂q µ
− − = Cδνλ
µ=1
∂pν ∂qλ ∂qλ ∂pν
Xl
∂qν ∂pν ∂qν ∂pν
{f (q, p, t), g(q, p, t)} ≡ − (9.491)
ν=1
∂f ∂g ∂g ∂f
{qν (q, p, t), qλ (q, p, t)} = 0 ; {pν (q, p, t), pλ (q, p, t)} = 0
(9.492)
{qν (q, p, t), pλ (q, p, t)} = Cδνλ ; ν, λ = 1, 2, ...l
{~
q, ~ p, p~)} = 0̃l ; {~q, ~p)} = C I˜l
q )} = 0̃l ; {~ (9.493)
Las transformaciones canónicas / 403
donde el elemento ν, λ, de la matriz {~q, ~q}, es {qν , qλ }, ..., y 0̃l y I˜ son las matrices
cero e identidad de orden l × l respectivamente. A su vez las fórmulas (9.493) se pueden
condensar en la siguiente expresión con matrices 2l × 2l:
{~
q, ~
q )} −{~
q, ~
p)} 0̃l −I˜l
= ≡ Ẽ (9.494)
{~
q, p~)} {~
p, p~)} I˜l 0̃l
Ẽ T = −Ẽ
Ẽ T = Ẽ −1
(9.495)
Ẽ 2 = −I˜
det Ẽ = +1
M̃ T Ẽ M̃ = Ẽ (9.496)
Si ahora se someten los vectores [~u, ~v ] y [~u ′ , ~v ′ ] a una transformación mediante una
matriz simplicial M̃ :
′ ′
~u ~u ~u ~u
= M̃ ; = M̃ (9.499)
~v ~v ′ ′
~v ~v
Entonces se cumple que:
′ ′
~u ~u
f = ~u, ~v Ẽ = (~u, ~v ) M̃ T Ẽ M̃
~v ′ ′
~v
′
~u
= (~u, ~v ) Ẽ =f (9.500)
′
~v
Es decir, la forma bilineal f es invariante bajo transformaciones de los vectores
[~u, ~v ] realizados por matrices simpliciales; en otras palabras, f es invariante bajo las
transformaciones del grupo simplicial.
! ! ! !
l
X ~T ∂~q ∂~q
T
∂~p
∂p − =0 (9.505)
µ=1
∂~
p ∂~p ∂~p ∂~p
νµ µλ νµ µλ
! ! ! !
l
X ~T ∂~p ∂~q
T
∂~q
∂q − = Cδνλ
µ=1
∂~
p ∂~q ∂~p ∂~q
νµ µλ νµ µλ
˜ Si la transformación es canónica,
donde J es el determinante de la matriz jacobiana J.
˜ l
J = det J = ±C , o se a que:
Γ = Γ|C|l (9.511)
En particular, Γ es invariante bajo la transformación canónica de evolución tem-
poral, o sea que:
dΓ
=0 (9.512)
dt
La ecuación (9.512) puede considerarse como una prueba del teorema de Liouville,
véase ecuación (3.137). Γ es una de las integrales invariantes de Poincaré, ecuación (9.81).
y similarmente:
T T
! T T
!
∂~q ∂~q ∂~q ∂~q ∂~p ∂~p ∂~p ∂~p
[q ν , q λ ] = − ; [pν , pλ ] = − (9.519)
∂~q ∂~p ∂~p ∂~q ∂~q ∂~p ∂~p ∂~q
µλ µλ
notemos que:
Xl
∂f ∂g ∂f ∂g
[f, g](q,p) = −
ν=1
∂qν ∂pν ∂pν ∂qν
∂f ∂g ∂f ∂g
= −
∂~q ∂~p ∂~p ∂~q
(9.523)
Xl
∂f ∂g ∂f ∂g
[f, g](q,p) = −
ν=1
∂q ν ∂pν ∂pν ∂q ν
∂f ∂g ∂f ∂g
= −
∂~q ∂~p ∂~p ∂~q
l T T
!
∂f X ∂f ∂qµ ∂f ∂pµ ∂~q ∂f ∂~p ∂f
= + = − (9.525)
∂qν µ=1
∂q ν ∂qν ∂pµ ∂qν ∂~q ∂~q ∂~q ∂~p
ν
Las transformaciones canónicas / 409
conjunto se puede escribir como (~u, ~v ). Podemos formar con estas variables los siguientes
corchetes de Lagrange y Poisson:
[~u, ~u]; [~u, ~v ]; [~v , ~v ]; {~u, ~u}; {~u, ~v }; {~v , ~v }
A su vez con estos corchetes podemos formar las siguientes matrices de orden 2l:
[~u, ~u] [~u, ~v ] {~u, ~u} {~u, ~v }
P̃ = ; L̃ = (9.530)
[~v , ~u] [~v , ~v ] {~v , ~u} {~v , ~v }
donde xi es una componente del vector [~u, ~v ] y zi representa una componente del vector
q , p~].13 Notando que:
[~
X2l
∂zr ∂xi ∂zr
= = δrs ; Ẽ 2 = −I˜ (9.533)
i=1
∂xi ∂z s ∂zs
y que:
∂zt ∂xm
Eµr Ert = −δnm (9.534)
∂xn ∂zµ
O sea que el corchete de Lagrange es, excepto por el signo, el recı́proco del corchete
de Poisson. La invariancia del uno implica la invariancia del otro. Vimos que los corchetes
de Poisson son invariantes bajo transformaciones canónicas univalentes, por tanto se
13 Véase las fómulas (9.385).
Las transformaciones canónicas / 411
∂~p ∂~q
{~
q, f } = ; {~
p, f } = − (9.536)
∂f ∂f
{g, f } = −{f, g}
1
{cf, g} = {f, cg} = {f, g}
c
No se cumplen las propiedades de linealidad ni la identidad de Jacobi, o sea que
los corchetes de Lagrange no permiten definir un álgebra.
Ejemplo 9.9.1 Analizar la siguiente transformación compleja, y si es canónica, hallar la
función generatriz y la valencia.
1 1
q = √ (q + ip) ; p = √ (q − ip) (9.537)
2 2
La transformación puede escribirse en la forma:
√ √
p = i(q − 2q) ; p = 2q − q (9.538)
La transformación será canónica libre de primera clase con valencia C, si, de acuer-
do con (9.158), puede generarse por una función tal que:
∂F ∂F
Cp = ; p=− (9.539)
∂q ∂q
Es simple mostrar que la transformación (9.537) será canónica si F y C están dadas
por:
1 2 1 2 √
F = q + q − 2qq ; C = −i (9.540)
2 2
De acuerdo con (9.159), el nuevo hamiltoniano será:
H = iH (9.541)
Es simple mostrar de (9.492) que {q, p} = −i.
Ejemplo 9.9.2 En la transformación canónica del ejemplo 9.9.1 hallar el corchete de
Poisson de q, y de p. Resolver el problema del oscilador armónico lineal usando dicha
transformación canónica.
14 El corchete de Lagrange de dos constantes de movimiento es una constante de movimiento. Sin
embargo, a diferencia de los de Poisson, los corchetes de Lagrange no sirven para hallar nuevas constantes
de movimiento porque para evaluarlos hay que conocer todas esas constantes.
412 / Mecánica clásica avanzada
[q, p] = −i (9.542)
q = aq + bp ; p = eq + f p ⇒ c = af − be (9.543)
H = Iωqp (9.548)
donde llamamos N a:
N = qp (9.550)
H = −iωq p (9.553)
Las fórmulas (9.551) nos permiten escribir directamente las ecuaciones de movi-
miento de Poisson, ecuaciones (9.363):
q̇ = q, H ; ṗ = p, H (9.554)
donde hemos notado que q y p son complejo conjugadas entre sı́. Utilizando las fórmulas
(9.547) obtenemos a q y p en función del tiempo:
√ √
q = 2Re (q 0 e−iωt ) ; p = 2Im(q 0 e−iωt ) (9.557)
q = q0 cos ωt + p0 sen ωt
(9.559)
p = p0 cos ωt + q0 sen ωt
Los distintos sistemas del ensamble difieren sólo por la fase. La dispersión en x se
caracteriza por su varianza (∆x)2 , definida por:
(∆x)2 = h(x − hxi)2 i = hx2 i − hxi2 (9.561)
donde h...i denota el promedio sobre el ensamble. Como x(t) puede escribirse en la forma:
x = Ax sen(ωt + δ) (9.562)
Si promediamos sobre todos los posibles valores de δ, 0 ≤ δ ≤ 2π, obtenemos los
promedios de ensamble microcanónicos:
A2x
hx2 i = ; hxi = 0 (9.563)
2
px se comporta análogamente. Obtenemos entonces que:
1 1
(∆x)2 = A2x ; (∆p)2 = A2p (9.564)
2 2
El producto ∆x ∆px será entonces:
1
(∆x) (∆px ) = Ax Ap (9.565)
2
Notamos según el ejemplo 9.9.2 que los máximos valores de x y px , que se obtienen
de las fórmulas (9.560), son:
px
A2x = x20 + 2 0 2 ; A2p = p2x0 + m2 ω 2 x20 (9.566)
m ω
que pueden expresarse en función de q0 y p0 mediante (9.546):
I
A2x = (q 2 + p20 ) ; A2p = Iωm(q02 + p20 ) (9.567)
mω 0
Reemplazando (9.548) en (9.546) obtenemos:
(∆x) (∆px ) = I(q02 + p20 ) (9.568)
Notando que según (9.550):
N = (Re q 0 )2 + (Im q 0 )2 (9.569)
Entonces obtenemos al usar (9.549):
E
∆x ∆px = IN = (9.570)
ω
Este valor no depende del tiempo, en concordancia con el teorema de Liouville,
ejemplo 4.8.4, sección 4.8. El resultado (9.569) es una propiedad del ensamble o sea que
para un valor dado de E, queda determinado de manera única el valor del producto
∆x ∆px . Solamente disminuyendo el valor de E es posible disminuir el valor de este
producto; o sea que una disminución de ∆x implica un aumento en ∆px y viceversa.
Según la desigualdad de Heisenberg para osciladores mecánico-cuánticos:
h̄
∆x ∆px ≥ (9.571)
2
se sigue entonces de (9.551) que E ≥ h̄ω/2. Si tomamos I igual a la constante de
Planck, se sigue también de (9.551) que E = nh̄ω. Estos resultados recuerdan a análogos
resultados mecánico-cuánticos.
10
La ecuación de Hamilton-Jacobi con
variables de acción-ángulo
415
416 / Mecánica clásica avanzada
la cuantización de los sistemas atómicos (lo cual se tomó como un dato experimental)
sino determinar cuales son las cantidades susceptibles de ser cuantizadas. Se halló que
las cantidades a ser cuantizadas deben satisfacer los siguientes dos requisitos: pueden
cambiar sólo por múltiplos enteros de la constante de Planck h̄ y deben permanecer
absolutamente inalteradas cuando se someta el sistema a una influencia externa que no
sea capaz de causar una alteración de magnitud h̄ en esa cantidad. Tales cantidades se
llaman invariantes adiabáticos y fueron extensivamente estudiados por P. Ehrenfest en
los años 1914-1923.1 Los invariantes adiabáticos de la vieja teorı́a cúantica coinciden con
las llamadas variables de acción.
Como λ varı́a muy poco en un perı́odo del movimiento, podemos considerar que
λ̇ también es constante. Entonces al promediar la ecuación (10.6) sobre un perı́odo
obtenemos:
Z
1 T ∂H
Ė = λ̇ dt (10.7)
T 0 ∂λ
De acuerdo con una de las ecuaciones de Hamilton se cumple:
dq
dt = (10.8)
∂H/∂p
La ecuación (10.7) se puede entonces escribir como:
I
∂H/∂λ
dq
∂H/∂p
Ė = λ̇ I (10.9)
1
dq
∂H/∂p
H
donde denota la integral de lı́nea sobre la trayectoria de fases del sistema en un
perı́odo de movimiento. En un perı́odo, por hipótesis, λ cambia muy poco, por tanto E
es constante, según (10.6). Como una trayectoria de fases se caracteriza por la relación:
p = p(q; E, λ) (10.10)
donde E y λ son fijos, entonces p (o q) solo, es suficiente para especificar el estado. Sobre
una trayectoria de fases dada C se cumple entonces que H(q, p, λ) = HC (p, λ), luego:
dHc ∂Hc ∂Hc ∂p
= + (10.11)
dλ ∂λ ∂p ∂λ
Como durante un perı́odo E no cambia apreciablemente y HC = E se cumple
aproximadamente que:
∂Hc ∂Hc /∂λ
=− (10.12)
∂p ∂p/∂λ
como por otra parte ∂HC /∂E = (∂HC /∂p)(∂p/∂E) = 1, cumple:
∂Hc 1
= (10.13)
∂p ∂p/∂E
Reemplazando a (10.12) y (10.13) en (10.9) obtenemos:
I
∂p
− dq
∂λ
Ė = λ̇ I (10.14)
∂p
dq
∂E
La ecuación (10.14) se puede escribir en la forma:
I
∂p ∂p
Ė + λ̇ dq = 0 (10.15)
∂E ∂λ
418 / Mecánica clásica avanzada
y podemos sin mayor error reemplazar a Ė por Ė, con lo cual en vez de (10.15) podemos
escribir:
I I
∂p d
dq = 0 (λ̇2 ) ⇒ p dq = 0 + 0(λ̇2 ) (10.17)
∂t dt
Se define la variable de acción J como:
I
J = p dq (10.18)
Entonces (10.17) nos dice que J˙ = 0, o sea que J es un invariante adiabático (una
cantidad que no cambia cuando λ varı́a adiabáticamente). Concluimos que J depende
de la energı́a del sistema pero varı́a muy poco con λ. Esto permite calcular a partir de
J la frecuencia del movimiento:
I I I
∂J ∂p 1
= dq = dq = dt = T (10.19)
∂E ∂E ∂HC /∂p
o sea que:
1
ν= (10.20)
∂J/∂E
La ecuación (10.18) tiene la siguiente interpretación geométrica: J es el valor del
área encerrada por la curva de fases que describe el sistema en un perı́odo. La invariancia
adiabática de J permite concluir que una perturbación al sistema que varı́a lentamente
con el tiempo puede producir una deformación de la trayectoria de fases pero de tal
manera que no se cambia el valor del área encerrada por esa curva. J también se puede
escribir como una integral de superficie:
Z
J = dq dp (10.21)
Sabemos que para un valor dado de l los valores medios de las energı́as cinética y
potencial son iguales, e iguales a la mitad de la energı́a total E (teorema del virial):
1 2 2 1 1
ml ϕ̇ = mgl ϕ2 = E (10.32)
2 2 2
Comparando (10.32) y (10.31), al tomar el promedio temporal de dE, obtenemos
que:
E
dE = − dl (10.33)
2l
p
Como la frecuencia angular es ω = g/l, vemos que el cambio fraccional de ω es
proporcional al cambio fraccional de l cuando la longitud del péndulo se altera en dl:
dω 1 dl
=− (10.34)
ω 2 l
Comparando a (10.33) y (10.34) obtenemos que:
dE dω
= (10.35)
E ω
Se sigue por integración de (10.35) que:
J E
= = Constante (10.36)
2π ω
Argumentos similares se pueden usar cuando ω se varı́a lentamente a causa de
alguna otra influencia externa. Se usó el carácter adiabático de la variación en l, dl, al
tomar en (10.31) el promedio temporal: se asumió que dl es prácticamente constante
durante un perı́odo de la oscilación.
Como el oscilador armónico del ejemplo de (10.22) equivale matemáticamente a un
péndulo con una amplitud de oscilación pequeña, se sigue que E/ω es constante en tal
caso. Sin embargo, se puede mostrar que para otros sistemas de un grado de libertad,
E/ω no es un invariante adiabático, aunque para tales sistemas habrá otros invariantes
adiabáticos.
2 Es posible que un sistema sea integrable mas no separable, es decir, que no se puede desacoplar las
ecuaciones de movimiento.
422 / Mecánica clásica avanzada
p2x 1 p2y 1
+ mωx2 x = E1 ; + mωy2 y 2 = E2 (10.51)
2m 2 2m 2
La hipersuperficie bidimensional ME1 E2 tiene intersecciones con los planos de fase
(x, px ) y (y, py ) dadas por las elipses (10.51).
Si se quiere, pueden tomarse como integrales primeras a H y una de las dos (10.51);
dado que H = E1 + E2 .
La hipersuperficie H = h es una esfera (o mejor elipsoide) en el espacio fásico; tal
hipersuperficie es de dimensión 3, en tanto que H1 = E1 es unidimensional siendo la
hipersuperficie MEE1 bidimensional.
El producto directo de las elipses definidas por (10.51) es un toroide de dimensión 2,
en tanto que los puntos del producto directo de las regiones H = h y H1 = E1 constituyen
una superficie bidimensional, que se puede hacer corresponder topológicamente con un
toroide bidimensional (véase figura 10.1).
El movimiento cuasiperiódico generado por H sobre ME1 E2 se define en términos
de las coordenadas angulares ϕ ~ = (ϕ1 , ϕ2 ) de los puntos de la superficie de un toro que
se mueven uniformemente sobre las circunferencias ϕ1 = Constante y ϕ2 = Constante,
con frecuencias angulares constantes que dependen de los valores de E1 y E2 :
d~
ϕ
=~
ω(E1 , E2 ) (10.52)
dt
Si ω1 y ω2 son inconmensurables, entonces la trayectoria de fases llena totalmente
el toro cuando t → ∞, en tanto que cuando ω1 y ω2 son conmensurables la trayectoria
de fases es cerrada y por lo tanto ocupa una región de dimensión menor a la del toro, es
424 / Mecánica clásica avanzada
ϕ2
ϕ1
decir, unidimensional. Para que esto ocurra es necesario que exista una nueva constante
de movimiento además de E1 y E2 .
Por ejemplo, cuando ωx = ωy , existe otra constante de movimiento relacionada
con la degeneración, que es el momento angular:
A = xpy − ypx (10.53)
Cuando ωy = 2ωx la constante es:
A = (m2 ωx2 x2 − p2x ) y + xpx py (10.54)
y cuando ωx = 2ωy , es constante:
A = (m2 ωy2 y 2 − p2y ) x + ypx py (10.55)
Para el caso ωx = ωy es fácil ver que hay otra constante dada por:
B = px py + m2 ω 2 xy (10.56)
y que se cumple:
B
[E2 , B] = −mω 2 A ; [E2 , A] = (10.57)
m
o sea que E2 con B1 y E2 con A no están en involución. Tampoco A y B están en
involución puesto que su corchete de Poisson vale E2 − E1 . Pero aún es posible formar
una combinación lineal de A y B que esté en involución con E1 y con E2 :
C = B + mω tan(ϕ10 − ϕ20 ) A (10.58)
donde ϕ10 − ϕ20 es la diferencia de fase de los dos movimientos oscilatorios.
Resultados análogos se esperan cuando las frecuencias satisfacen la relación nωx =
mωy donde n y m son números enteros.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 425
O sea que los desplazamientos producidos por cada una de las transformaciones
canónicas infinitesimales generadas por Φ1 , Φ2 , ...Φl están contenidos totalmente den-
tro del subespacio Mc . Con esto queda demostrada la proposición (i) del teorema de
Liouville.
En particular, para cuando Φ1 = H se tiene que:
q
~ −∂H/∂~p
∂ = −ǫ ⇒ ~q˙ = ∂H ; ~p˙ = −
∂H
(10.63)
∂~p ∂~q
p~ ∂H/∂~q
426 / Mecánica clásica avanzada
g(~r)x0 = x0 (10.65)
Es decir, asociar el intervalo (0, 1) a cada una de las lı́neas cerradas que se obtienen
por desplazar el punto x0 mediante las transformaciones gν (rν ). Es claro entonces que
gν (mν )x0 = x0 donde mν es un número entero.
Por tanto podemos caracterizar el conjunto de todas las transformaciones de la
forma (10.65) mediante los vectores enteros:
A su vez el intervalo (0, 1) corresponde con el intervalo (0, 2π), de modo que pode-
mos hacer corresponder a la región Mc un toroide de dimensión l, T l , definido como el
producto cartesiano de l cı́rculos, siendo definidos los puntos de los l cı́rculos mediante
coordenadas angulares ϕν mod 2π:
T l = {(ϕ1 , ϕ2 , ...ϕl )} ; ϕ
~ mod 2π (10.68)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 427
ϕ̇ν = ων ; ων = ων (~c) ; ϕ
~ (t) = ϕ
~ (0) + ~ω t (10.69)
H(x, y, px , py ) = E (10.70)
I(x, y, px , py ) = C (10.71)
px = px (x, y) (10.72)
428 / Mecánica clásica avanzada
px
0 x
py
0 y
En este caso el “toro” es una lı́nea cerrada. Es claro que la función generatriz del
tipo F2 para esta transformación es Σ(I, q), que satisface:
∂Σ ∂Σ
p= ; ϕ= (10.80)
∂q ∂I
∂Σ
H ,q = h(I) (10.81)
∂q
siendo H(p, q) = h(I) el hamiltoniano del sistema. Como la relación h(I) es biunı́voca
se sigue que cada curva Mh está definida por un valor de I. Sobre una curva definida h
por un valor de I, se sigue de (10.80) que:
dΣ|I=Constante = p dq (10.82)
En la vecindad de un punto q0 la acción vale:4
Z q
Σ(I, q) = p dq = Area (10.83)
q0
Ejemplo 10.3.1 Resolver las ecuaciones de movimiento para el oscilador armónico uni-
dimensional del ejemplo 10.1.1 usando las variables acción-ángulo.
De acuerdo con el ejemplo 10.1.1, para un oscilador armónico de constante k, con
p
ω0 ≡ k/m el área encerrada por la elipse definida por H = E es:
2πE E
A= ⇒ I= (10.88)
ω0 ω0
La frecuencia del movimiento es entonces:
∂E
ω= = ω0 (10.89)
∂I
que en este caso particular resulta independiente del valor de I.
Las fórmulas (10.80) permiten resolver las ecuaciones de movimiento usando el
formalismo de las variables acción-ángulo. En efecto:
Z q Z qq
Σ(I, q) = p dq = 2mE − m2 ω02 q 2 dq (10.90)
q0 q0
entonces:
Z q r
∂Σ dq mω0
ϕ= = r = sen−1 q (10.91)
∂I q0 2I 2I
− q2
mω0
lo cual nos dice que:
r r
2I 2I
q= sen ϕ = sen (ϕ0 + ω0 t) (10.92)
mω0 mω0
donde hemos absorbido en ϕ la constante de integración de (10.91). Resulta que la
variable angular ϕ es la fase de las oscilaciones.
Ejemplo 10.3.2 Aplicar el formalismo de las variables acción-ángulo para hallar la solu-
ción a las ecuaciones de movimiento del péndulo plano y realizar un estudio del espacio
fásico correspondiente.
p
Punto elíptico Rot.
Sep.
Lib.
E>F
E=F
E<F
–2π –π 0 π 2π θ
Punto hiperbólico
donde θmax = π/2 para rotación (E > F ) y cos θmáx = −H/F para libración (E < F ).
El nuevo hamiltoniano se obtiene notando que H = H = E, con lo cual (10.96) permite
en principio expresar a E en función de I.
En (10.79) se supone que Mc representa una lı́nea cerrada. Sin embargo la definición
es posible ampliarla para incluir no sólo libración sino rotación.
Si en (10.96) y (10.97) efectuamos el cambio de variable siguiente:
s
1 E θ
1+ sen η = sen (10.98)
2 F 2
obtenemos:
r
E(k) − (1 − k 2 )K(k) , k < 1
8 F
I= (10.99)
π G 1 kE(k −1 ) , k>1
2
y,
F (η, k) /K(k) , k<1
π
ϕ= (10.100)
2
2F (η/2, k −1) /K(k −1 ) , k > 1
siendo F (η, k) y E(η, k) las integrales elı́pticas incompletas de primera y segunda especie
respectivamente, en tanto que K(k) = F (π/2, k) y E(k) = E(π/2, k) son las integrales
elı́pticas completas de primera y segunda especie (véase sección 8.4).
Z η
dξ
F (η, k) = p = sen−1 (sen η)
2 2
1 − k sen ξ
0
(10.101)
Z ηp
E(η, k) = 1 − k 2 sen2 ξ dξ
0
k está dada por:
E
2k 2 = 1 + (10.102)
F
y es una medida de la energı́a normalizada del oscilador.
k = 1 cuando E = 1 (la energı́a de la separatriz) y k < 1 para libración y k > 1
para rotación. De (10.95) obtenemos para la frecuencia normalizada:
1/K(k) , k<1
ω(k) π
= (10.103)
ω0 2
2k/K(k −1 ) , k > 1
√
donde ω0 = F G es la frecuencia angular para el movimiento linealizado alrededor del
punto singular elı́ptico. El valor asintótico de K cerca a k = 1 nos da una frecuencia
normalizada cerca a la separatriz:
(π/2)/ln 4(1 − k 2 )−1/2 , k < 1
ω
lı́m = (10.104)
k→1 ω0
π/2 ln 4(k 2 − 1)−1/2 , k>1
que tiende a cero cuando k tiende a 1.
434 / Mecánica clásica avanzada
2ω0 θ
p=± cos ; θ = 4tan−1 (eω0 t ) − π (10.105)
G 2
Variables acción ángulo para l grados de libertad. En el caso unidimen-
sional, donde el toroide invariante se reduce a una lı́nea, la integral de lı́nea en (10.86)
coincide con la trayectoria. En el caso l-dimensional esta coincidencia no es necesaria.
Sean γ1 , γ2 , ...γl , l lı́neas cerradas sobre el toroide Mc , topológicamente equivalen-
tes a circunferencias. Sobre cada lı́nea especificamos un punto mediante una coordenada
ϕν que en un circuito cerrado se aumenta por el valor 2π. Los γν no coinciden necesa-
riamente con trayectorias, que según veremos en general no son cerradas; es decir, en
el caso general ninguna de las lı́neas γν coincide con la proyección de la trayectoria de
fases del sistema sobre el plano qν − pν . Entonces definimos la Iν por:
Z l Z
1 1 X
Iν = p~ · d~q = pν dqµ (10.106)
2π γν 2π µ=1 γµ
γν
γ′ν
Sin embargo en la vecindad de un punto ~q0 siempre es posible definir una función
unı́voca que especifica la transformación canónica. Como en el caso unidimensional, la no
uniformidad de Σ se traduce en la no uniformidad de las variables angulares. En efecto
el cambio en la variable angular ϕν al realizarse un circuito sobre la lı́nea γµ está dado
por:
∂Σ ∂
∆µ ϕν = ∆µ = ∆µ Σ = 2πδµν (10.113)
∂Iν ∂Iν
Por otra parte, las variables de acción están indeterminadas por una constante que
no depende de las Iν , como se puede ver en (10.85), pero es una constante que no trae
problemas como los provenientes de la no uniformidad de Σ.
5 La integral (10.109) es una integral de lı́nea que no depende de la trayectoria seguida para llegar
de ~
q0 a q~.
436 / Mecánica clásica avanzada
Sistemas separables. Hay casos en los cuales mediante una adecuada elección
de las coordenadas resulta que la función Σ puede escribirse en la forma:
l
X
~ ~
Σ(I, q) = ~ qν )
Σν (I, (10.114)
ν=1
se dice entonces que el sistema es completamente separable. Para un sistema de este tipo
las ecuaciones (10.110) toman la forma:
Xl
∂ ~ qν ) ; ∂ ~ qµ )
pν = Σν (I, ϕν = Σµ (I,
∂qν ∂I ν
µ=1 (10.115)
ν = 1, 2, ...l
En este sistema es posible escoger los ciclos de base γ1 , γ2 , ...γl en los planos de
fase (q1 , p1 ), (q2 , p2 ), ...(ql , pl ) de modo que las variables de acción pueden definirse por
las integrales:
I
1 1
Iν = ∆ν Σν = pν dqν (10.116)
2π 2π
donde cada integral es tomada sobre un ciclo de la coordenada qν . Ver la sección 9.4.
m1 T1 = m2 T2 = ... ml Tl = T (10.117)
estado del sistema es periódica respecto a las variables angulares y su perı́odo respecto
a cada una de ellas es 2π. Su expansión de Fourier es de la forma:
∞
X ∞
X
F (~
q , p~) = ...
n1 =−∞ n2 =−∞
(10.118)
∞
X
∂E ∂E ∂E
An1 , n2 , ...nl exp i n1 + n2 + ... nl t
n =−∞
∂I1 ∂I2 ∂Il
l
Cada término de esta suma es periódico respecto al tiempo con frecuencia angular:
∂E ∂E ∂E
n1 + n2 + ... nl (10.119)
∂I1 ∂I2 ∂Il
pero como estas frecuencias no son conmensurables en general, la suma no es periódica.
En particular, no serán periódicas las coordenadas y momentos (~q, p~) en las cuales el
sistema no sea separable.
En algunos casos particulares, dos o más de las frecuencias ων = ∂E/∂Iν son
conmensurables para todos los valores de las Iµ . La existencia de degeneración conlleva
una reducción del nuḿero de variables de acción independientes de las cuales depende
de la energı́a. En efecto si ω1 y ω2 son tales que:
∂E ∂E
n1 = n2 (10.120)
∂I1 ∂I2
donde n1 y n2 son enteros, se deduce entonces que E depende de I1 y I2 sólo en la
combinación n2 I1 + n1 I2 :
E(I~ ) = E(n2 I1 + n1 I2 , I3 , ...Il ) (10.121)
Cuando hay degeneración, el número de integrales de movimiento uniformes es
mayor que l.
En efecto, la siguiente cantidad es constante de movimiento:
A = n1 ϕ1 − n2 ϕ2 (10.122)
la constancia de la cual es evidente de (10.120). Además está constante de movimiento
no depende de las Iν , que son las variables canónicamente conjugadas de las ϕν .
Al realizarse un circuito sobre la lı́nea γν , el cambio en A está dado, en virtud de
(10.113), por:
∆ν A = (n1 δ1ν − n2 δ2ν ) 2π (10.123)
o sea que A no es uniforme, pero su no uniformidad consiste en la adición de un múltiplo
entero de 2π. Por tanto, tomando una función trigonométrica arbitraria de A se obtiene
una nueva integral de movimiento uniforme.
Ejemplo 10.3.3 Mostrar que las constantes (10.53) y (10.54) en el caso del oscilador
armónico bidimensiohal son funciones respectivamente de ϕ1 − ϕ2 y de 2ϕ1 − ϕ2 .
438 / Mecánica clásica avanzada
donde rmı́n y rmax están dados por la fórmula (5.76). Mediante la sustitución x = r2 ,
(10.133) toma la forma:
I q
1 1
Ir = −m2 ω02 x2 + 2mEx − l2 dx (10.134)
2π x
La integral se hace fácilmente usando la técnica de los residuos teniendo en cuenta
que en el plano complejo el integrando es una función biforme (positivo en el intervalo
(xmı́n , xmax ) y negativo entre (xmax , xmı́n )), presentándose entonces una lı́nea de rami-
ficación entre xmı́n y xmax . Por otra parte el integrando tiene singularidades en x = 0
y x = ∞, presentándose polos en dichos puntos. El residuo en x = 0 vale −l/(2π) y
el residuo en x = ∞ (que se obtiene con la sustitución y = 1/x) vale E/(2πω0 ). En
consecuencia, usando (10.132):
E = ω0 (Ir + Iϕ ) (10.135)
La técnica para evaluar este tipo de integrales puede verse en el apéndice II del
libro de Born, The mechanics of the atom o en la sección 9-7 del libro de Goldstein. Esto
nos permite escribir entonces (10.130) y (10.131) como:
Z
dr
ϕr = mω0 r (10.136)
l2 2 2 2
2mE − 2 − m ω0 r
r
Z
mω0 − l/r2
ϕϕ = ϕ + r dr (10.137)
l2 2 2 2
2mE − 2 − m ω0 r
r
Estas integrales coinciden con las evaluadas en el capı́tulo 5, que aparecieron en
las fórmulas (5.67) y (5.75):
El resultado para r en función de ϕr se obtiene directamente de (5.81):
r !
2 E ω02 l2
r = 1 + 1 − 2 sen 2ϕr = r02 (1 + e sen 2ϕr ) (10.138)
mω02 E
l≠0
La figura 10.8 muestra las curvas de fases representadas por (10.142) para diferentes
valores de e. Cuando e → 1, las trayectorias cerca a rmı́n son muy “planas”, de modo
que cuando e = 1, los puntos con pmax y pmı́n están unidos por una lı́nea recta vertical
levantada en rmı́n = 0.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 441
l=0
pr (mω0r0)
1 e=1
e = 0,8
e = 0,6
0,5
e = 0,4
e = 0,2
r/r 0
e=0
0 0,5 1 1,5
–0,5
–1
en un segmento de lı́nea, pues en cualquier movimiento real los puntos de la lı́nea recta
vertical son recorridos a velocidad infinita.
En coordenadas polares son constantes de movimiento E y l. Como consecuencia
de la degeneración hay otra constante que es una función trigonométrica de A. Tal
constante coincide con E1 o con E2 . En efecto, podemos tomarla como E1 .
px puede expresarse en función de pr y pϕ mediante la fórmula:
1
px = pr cos ϕ − pϕ sen ϕ (10.143)
r
pϕ es una constante igual a l, cuyo valor tiene la siguiente expresión en función de e:
p
l = mω0 r02 1 − e2 (10.144)
remplazando pr de (10.142) en (10.143) obtenemos:
mω0 r0 p
px = √ e cos ϕ cos 2ϕr − 1 − e2 sen ϕ (10.145)
1 + e sen 2ϕr
con lo cual E1 puede llevarse a la forma:
1 mω02 r02
E1 = [e (1 + cos 2ϕ)(e + sen 2ϕr )
2 1 + e sen 2ϕr (10.146)
√
+1 − e2 − e 1 − e2 sen 2ϕ sen 2ϕr ]
De (10.139) obtenemos las siguientes expresiones para cos 2ϕ y sen 2ϕ:
√
(e + sen 2ϕr ) sen 2A + 1 − e2 cos 2ϕr cos 2A
cos 2ϕ =
1 + e sen 2ϕr
√ (10.147)
(e + sen 2ϕr ) cos 2A − 1 − e2 cos 2ϕr sen 2A
sen 2ϕ =
1 + e sen 2ϕr
La sustitución de (10.147) en (10.146) nos conduce finalmente a:
1
E1 = mω02 r02 (1 + e sen 2A) (10.148)
2
y en consecuencia:
1
E2 = mω02 r02 (1 − e sen 2A) (10.149)
2
Sistemas no separables. Como una consecuencia del teorema de Liouville sobre
los sistemas integrables, todo sistema de l grados de libertad que posea l constantes de
movimiento uniformes admite un sistema de variables acción ángulo, siendo las variables
de acción l constantes de movimiento uniformes y las variables agulares l funciones
lineales del tiempo de la forma ϕν = ων t+ϕν0 siendo las ϕν0 l constantes de movimiento
no uniformes. En un sistema no integrable, el número de constantes de movimiento
uniformes es menor que l y por tanto la trayectoria de fases cubrirá regiones de más de
l dimensiones.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 443
Haciendo
Σ = Σξ (ξ) + Ση (η) (10.156)
obtenemos las ecuaciones:
2
dΣξ
2ξ + 8mωy2 ξ 3 − 4mEξ = β (10.157)
dξ
2
dΣη
2η + 2mωy2 η 3 − 4mEη = −β (10.158)
dη
donde β es la constante de separación. Integrando estas ecuaciones hallamos:
Z s Z s
β 2 2 2
β
Σ= 2mE + − 4m ωy ξ dξ + 2mE − − 4m2 ωy2 η 2 dη (10.159)
2ξ 2η
y y ξ2 y
η2
ξ1
η1
ξ2 η2
x x x
ξ2 η2
β>0 β=0 β<0
se sigue que:
s p
−x + x2 + y 2
pξ = px + p py
x + x2 + y 2
s (10.164)
p
x + x2 + y 2
pη = −px + p py
−x + x2 + y 2
Reemplazando a (10.164) y (10.162) en (10.160) se sigue que:
β = 2[ypx py + x(m2 ωy2 y 2 − p2y )] (10.165)
Similarmente, la constante ligada a la degeneración en coordenadas parabólicas
puede tomarse como E1 :
!
1 ξp2ξ − ηp2η
E1 = + 2mωy2 (ξ − η)2 (10.166)
2m ξ+η
Iϕ = lz (10.179)
l = Iθ + Iϕ ; lz = lϕ (10.180)
Llamando a y b a:
k l
a=− ; b= √ (10.182)
2E −2mE
Podemos escribir a p2r como:
" 2 2 #
2 a b a
pr = −2mE −1 + 2 − (10.183)
r a r
B −2Ar − B
+ √ sen−1 √ (10.184)
2 −A B 2 − 4AC
√ Br + 2C
− −Csen−1 √
r B 2 − 4AC
Por tanto:
Z
√ √ r−a
pr dr = −2mE −r2 + 2ar − b2 + a sen−1 √
a2 − b 2
(10.185)
−1 √ar − b2
−b sen
r a2 − b 2
y teniendo en cuenta que:
p
rmin, max = a ± a2 − b2 (10.186)
llegamos a:
Z rmax
√
pr dr = −2mE (a − b)π (10.187)
rmı́n
448 / Mecánica clásica avanzada
Por tanto:
Z p
1 1
ϕr = − −r2 + 2ar − (1 − ǫ2 )a2 dr
a r
Z
dr
+2 p (10.196)
−r + 2ar − (1 − ǫ2 )a2
2
Z
2 dr
−(1 − ǫ )a p
r −r2 + 2ar − (1 − ǫ2 ) a2
Cada una de estas integrales es elemental y puede hallarse en el manual citado.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 449
y = cos ψ (10.200)
ϕr = ψ − ǫ sen ψ (10.202)
ϕr = ωr (t − t0 ) (10.204)
Vemos que x y r son funciones pares de ψ en tanto que y es una función impar.
Entonces podemos escribir:
X∞
r 1
= B0 + Bn cos(nϕr ) (10.208)
a 2 n=1
X∞
x 1
= C0 + Cn cos(nϕr ) (10.209)
a 2 n=1
∞
y p X
= 1 − ǫ2 Dn sen (nϕr ) (10.210)
a n=1
B0 = 2 + ǫ 2 ; C0 = −3ǫ (10.220)
Entonces, finalmente:
X∞
r ǫ2 1
=1+ +ǫ [Jn+1 (ǫn) − Jn−1 (ǫn)] cos(nϕr ) (10.221)
a 2 n=1
n
X∞
x 3 1
=− ǫ+ [Jn−1 (ǫn) − Jn+1 (ǫn)] cos(nϕr ) (10.222)
a 2 n=1
n
∞
y 2p X 1
= 1 − ǫ2 Jn (ǫn) sen (nϕr ) (10.223)
a ǫ n=1
n
Es interesante notar que el sistema formado por dos partı́culas cargadas, ligado,
emite radiación electromagnética. El momento de dipolo del sistema, d~ = Z1 e~r1 + Z2 e~r2 ,
donde Z1 y Z2 tienen signos opuestos, se puede escribir, usando las fórmulas (5.1), como:
~ Z1 Z2
d = µe − ~r (10.224)
m1 m2
donde µ es la masa reducida. Las ecuaciones (10.221) a (10.223) muestran que el momen-
to de dipolo se puede expandir en serie de Fourier y la intensidad radiada de frecuencia
nω0 , donde ω0 = ϕ̇r está dada por la fórmula:
ω04 n4 ~ 2
In = dn (10.225)
3c3
Como d~n es un vector en el plano de la órbita, se han de considerar las contribu-
ciones de x y y a la radiacion de frecuencia nω0 . El resultado es:
2
64n2 E 4 Z1 Z2 1 − ǫ2 2
In = 3 2 2 − Jn′2 (ǫn) + J n (ǫn) (10.226)
3c Z1 Z2 m1 m2 ǫ2
452 / Mecánica clásica avanzada
si llamamos γ a:
s
Iϕ2
γ= 1− (10.233)
(Iθ + Iϕ )2
z x-
y-
θ0
x′
θ
nos lleva a:
Z Z
dθ dv
p =−
sen4 θ − (1 − γ 2 ) sen2 θ 1 + v 2 (1 − γ 2 )
(10.255)
1 p
−1
=− tan [v 1 − γ2]
1 − γ2
Entonces (10.252), (10.253), (10.255) junto con (10.230) nos conducen a:
p
ϕϕ = ϕθ + tan−1 [v 1 − γ 2 ] + ϕ (10.256)
Resolviendo para v hallamos:
1
v=p tan(ϕϕ − ϕθ − ϕ) (10.257)
1 − γ2
que equivale a la siguiente ecuación cuadrática en cos θ:
(1 − γ 2 ) cos2 θ + tan2 (ϕϕ − ϕθ − ϕ) cos2 θ
(10.258)
−γ 2 tan2 (ϕϕ − ϕθ − ϕ) = 0
456 / Mecánica clásica avanzada
por tanto:
cos θmı́n tan(ϕϕ − ϕθ − ϕ)
cos θ = p (10.259)
sen2 θmı́n + tan2 (ϕϕ − ϕθ − ϕ)
o si se quiere:
sen θmı́n cos θ
tan(ϕϕ − ϕθ − ϕ) = √ 2 (10.260)
cos θmı́n − cos2 θ
Usando (10.238) obtenemos esta expresión para la dependencia temporal de ϕ:
tan(ϕϕ − ϕθ − ϕ) =
√ (10.261)
− cos θ0 (ǫ − cos ψ) + sen θ0 1 − ǫ2 sen ψ
sen θmı́n √
sen θ0 (ǫ − cos ψ) + cos θ0 1 − ǫ2 sen ψ
Cuando la órbita está en el plano x − y, Iθ = 0, o sea γ = 0. Entonces θmı́n =
θmax = π/2 = θ. En consecuencia, si tomamos θ0 = 0,
−ǫ + cos ψ
tan(ϕϕ − ϕθ − ϕ) = √ (10.262)
1 − ǫ2 sen ψ
de donde:
√ r
1 − ǫ2 sen ψ 1 − ǫ2 p 2 2
cos(ϕϕ − ϕθ − ϕ) = = a ǫ − (a − r)2 (10.263)
1 − ǫ cos ψ ǫr
que nos conduce a una ecuación similar a la (10.245), pero esta vez para la órbita en el
plano x − y. Entonces el ángulo que hace el vector absidal del perihelio respecto al eje
x, cuando θ0 = 0, es:
π
ϕ0 + donde ϕ0 = ϕϕ − ϕθ (10.264)
2
Cuando la órbita está en el plano z − x′ , Iϕ = 0 y sen θmı́n = 0 entonces tan(ϕϕ −
ϕθ − ϕ) = 0. Por tanto en este caso el ángulo ϕ es constante y vale ϕ0 , que es el ángulo
que hace la lı́nea de intersección entre el plano vertical de la órbita y el plano x − y.
En general, para Iϕ y Iθ arbitrarios, el plano de la órbita y el plano x − y se cortan
en la lı́nea Ox′ , llamada lı́nea de nodos. La curva cruza el plano xy cuando θ = π/2 y
cuando θ = 3π/2. En esos puntos, según (10.260), ϕ vale ϕ0 . En conclusión, ϕ0 es el
ángulo de la lı́nea de nodos respecto al eje x. ϕ0 es el acimut de la partı́cula cuando
θ = π/2 y π + ϕ0 es el acimut cuando θ = 3π/2.
Como ϕ es una variable cı́clica, pϕ es constante de movimiento, cuyo valor es igual al
de Iϕ cuya variable canónica conjugada es ϕϕ . Por medio de una transformación canónica
es posible hacer que las variables acción-ángulo sean (Ir + Iθ + Iϕ , ϕr ), (Iθ + Iϕ , ϕθ − ϕr )
y (Iϕ , ϕϕ − ϕθ ), con lo cual vemos que l y θ0 son variables canónicas conjugadas, lo
mismo que lz y ϕ0 .
Como sabemos, θ0 y ϕ0 en tanto que variables angulares son no uniformes pues al
completar un ciclo sobre las lı́neas γθ0 y γϕ0 del toroide no regresan a su valor original
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 457
sino que aumentan en 2π, pero esto no tiene efecto sobre las fórmulas ya que aparecen
en funciones trigonométricas.
Los ejes x, y, z fijos a la órbita, se pueden ubicar respecto a los ejes x, y, z mediante
los ángulos de Euler que denotaremos ϕ′ , θ′ , ψ ′ definidos en la sección 7.6. ϕ′ es el ángulo
entre x′ y x, θ′ el ángulo entre z y z y el ψ ′ ángulo entre x y x′ , donde el eje x′ coincide
con la lı́nea de nodos.
(Véase figura 10.11). ϕ′ , θ′ , ψ ′ están relacionados con θ0 , ϕ0 mediante:
π π
ϕ′ = ϕ0 ; θ′ = − θmı́n ; ψ′ = − θ0 (10.265)
2 2
z z
θ′ θmin
y′
y
α
θ0
x
ψ′
y
ϕ′
x′
Figura 10.11 Los ejes x, y y z están fijos a la órbita y ubicados respecto a x, y y z mediante
los ángulos de Euler. x, y están sobre el plano de la órbita.
El ángulo entre el vector absidal del perihelio, eje x, y el eje z, es α, cuyo coseno
es el elemento 1 − 3 de la matriz que conecta los ejes x, y, z con los ejes x, y, z:
Puede mostrarse que el vector de Runge-Lenz tiene la expresión A ~ = ǫ~ex , por tanto
Az = ǫ cos α.
I determina la longitud del semieje mayor de la órbita a, en tanto que I y Iθ + Iϕ
determinan la excentricidad.
Concluimos que las variables acción-ángulo determinan la forma y tamaño de la
órbita, lo mismo que su orientación en el espacio. I además determina la frecuencia y
ϕr determina la posición de la partı́cula sobre la órbita. ϕ0 , θ0 , ϕr , Iϕ , Iθ + Iϕ , I son
conocidas como los elementos de Delaunay de la órbita en astronomı́a.
√ )
1 − ǫ2
−i Jn (nǫ) sen nϕr eiϕθ
ǫ
( (10.269)
∞ iϕr
X
3 e
+aγ − ǫeiϕr + Jn′ (nǫ) cos nϕr
4 n=1
n
√ )
1 − ǫ2
+i Jn (nǫ) sen nϕr e−iϕθ
ǫ
√ ! ∞ #
p 1 − ǫ2 X e−iϕr
− 1 + i 1 − γ2 Jn (nǫ) sen nϕr ei(ϕϕ −2ϕθ )
ǫ n=1
n
(10.272)
Vemos que se anulan todos los coeficientes de Fourier para los cuales nϕ y nθ son
diferentes de:
nϕ = 0, 1, −1 ; nθ = 0, ±2 (10.273)
En cuanto a n no hay ninguna restricción.
Según la fórmula (10.225), para este caso se tiene:
ω4 4 h i
In, nθ , nϕ = 03 τn, nθ , nϕ
An, n , nϕ 2 + Bn, n , nϕ 2 (10.274)
θ θ
3c
donde τn, nθ , nϕ es un número que describe el orden del armónico de ω0 radiado, y A y
B son los coeficientes de Fourier de z y de x + iy respectivamente. Vemos que solamente
es posible la radiación asociada a los nθ y nϕ dados por (10.273).
Las fórmulas (10.269) y (10.272) pudieron también obtenerse directamente de
(10.240) y de (10.256).
~ = p~ × ~l − mk ~r
A (10.275)
r
Como A~ · ~l = 0, se sigue que A~ es un vector fijo en el plano de la órbita. Tomando
el producto escalar de A ~ con ~r obtenemos:
similarmente,
Estos resultados son válidos para fuerzas centrales en general y no sólo en el caso
kepleriano, ya que independientemente de la forma del potencial la energı́a depende de
Iθ y Iϕ en la combinación Iθ + Iϕ , lo cual da lugar a que:
ωθ = ωϕ (10.285)
Notemos que (10.286) es una propiedad de los li que sabemos son los generadores
infinitesimales del grupo de rotaciones.
Se dice que ~l tiene un álgebra de Lie cuyas constantes de estructura son ǫijk .
Por tanto J~ y K ~ tienen cada uno un álgebra de Lie como la del grupo de rota-
ciones. Concluimos que el hamiltoniano de una partı́cula ligada en un potencial −k/r
es invariante bajo dos grupos de rotaciones independientes. Estos grupos son subgrupos
de un grupo más general, el de las rotaciones ortogonales O(6). La representación O(6)
es reducible siendo una de sus representaciones irreducibles O(4). Como, según vimos
en la sección 7.8, existe un homomorfismo entre O(3) y SU (2), entonces podemos ver
que hay un homomorfismo entre las representaciones O(4) y SU (2) ⊗ SU (2). Vemos
que la degeneración del sistema que consideramos resulta del hecho de ser invariante el
hamiltoniano bajo un grupo de simetrı́a más amplio que el grupo de rotaciones.
Entre las siete constantes de movimiento J, ~ K
~ y H sólo existen 5 constantes in-
2 2
dependientes, que podemos tomar como J , K , Jz , Kz , H pues existen dos relaciones
entre ellas, provenientes de:
2
J~ − K
~ · ~l = 0 ; J~ − K
~ = mkaǫ2 (10.289)
De (10.288) puede verse que estas cinco constantes no están en involución. Por tanto
si se halla un sistema de coordenadas en que J 2 y K 2 sean constantes de separación,
necesariamente Jz y Kz dependerán de variables angulares.
6 Puede verse que los “buenos números cuánticos” están asociados precisamente con las variables
dinámicas que no dependen de variables angulares.
462 / Mecánica clásica avanzada
que junto con (10.297) nos conduce a la siguiente expresión para la energı́a en términos
de las variables de acción parabólicas:
mk 2
E=− (10.300)
2(Iξ + Iη + Iϕ )2
Si definimos a I como:
I = Iξ + Iη + Iϕ (10.301)
∂E m ∂K1
Z m +
∂Iξ ξ ∂Iξ
ϕξ = s dξ
2mK1 p2ϕ
2mE + − 2
ξ 4ξ
(10.305)
∂E m ∂K2
Z m +
∂Iξ η ∂Iξ
+ s dη
2mK2 p2ϕ
2mE + − 2
η 4η
∂E mk 2 2E
ωξ = ωη = ωϕ = = 3 =− (10.306)
∂I I I
464 / Mecánica clásica avanzada
y,
∂K1,2 K2 ∂K1,2 K1 ∂K1,2 K1 − K2
=± ; =∓ ; =∓ (10.307)
∂Iξ I ∂Iη I ∂Iϕ I
Por tanto:
2mE mK1
Z − +
I ξI
ϕξ = s dξ
2mK1 p2ϕ
2mE + − 2
ξ 4ξ
(10.308)
2mE mK 2
Z − −
I ηI
+ s dη
2mK2 p2ϕ
2mE + − 2
η 4η
7
Si definimos a θ1 , Lξ y Lη ası́:
2ξ
1−
(1 + β) a
θ1 = ϕξ − ϕn ; Lξ = s ;
γ2
1−
(1 + β)2
2η (10.312)
1−
(1 − β) a
Lη = s
γ2
1−
(1 + β)2
obtenemos:
s !
2ξ 2η γ2
, = 1− 1− Lξ , η (1 ± β) (10.313)
a a (1 ± β)2
y,
Además,
1p q
ϕξ,η = − (1 + β)2 − γ 2 1 − L2ξ
2
(10.315)
1p q
− (1 − β)2 − γ 2 1 − L2η − sen2 Lξ,η
2
Ahora definamos dos nuevas variables (anomalı́as excéntricas):
θ1 = −αξ + αη (10.317)
1p
ϕξ = − (1 + β)2 − γ 2 cos αξ
2
(10.318)
1p
− (1 + β)2 − γ 2 cos(θ1 + αξ ) − αξ
2
1p
ϕη = − (1 + β)2 − γ 2 cos(αη − θ1 )
2
(10.319)
1p
− (1 + β)2 − γ 2 cos αη − αη
2
7 Como se cumple (10.306), se sigue que θ1 es una constante de movimiento asociada a la degeneración.
466 / Mecánica clásica avanzada
Donde:
p p
(1) (1 + β)2 + γ 2 + (1 − β)2 + γ 2 cos θ1
tan αξ = p (10.324)
(1 − β)2 − γ 2 sen θ1
8
Comparando (10.323) con (10.203) cuando r = rmax , obtenemos:
r
1 + β2 − γ2 1p
ǫ= + (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1 (10.325)
2 2
Por otra parte, z, en coordenadas parabólicas y en esféricas es:
z 1p 1p
=β− (1 + β 2 ) − γ 2 sen αξ + (1 − β)2 − γ 2 sen αη (10.326)
a 2 2
r
z 1 − ǫ2 − γ 2 h p 2 sen ψ sen θ − (ǫ − cos ψ) cos θ
i
= − 1 − ǫ 0 0 (10.327)
a 1 − ǫ2
8 Estafórmula nos muestra que los valores de β y γ no son arbitrarios: si β > 0, 0 ≤ |γ| ≤ 1 − β y si
β < 0, 0 ≤ |γ| ≤ 1 + β.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 467
z η = ηmín
η = ηmáx
ξ = ξmáx
ξ = ξmín
En el caso β = 0, γ = 1, resulta que ηmı́n = ηmax = ξmı́n = ξmax = a/2 y por tanto
el anillo queda reducido a una circunferencia de radio a colocada en el plano x − y. En
este caso según (10.325) ǫ = 0, como debe ser.
Cuando β = γ − 1 o β = −γ + 1, el movimiento sólo es posible a lo largo de curvas
colocadas sobre la superficie de un casquete lateral.
Las órbitas compatibles con valores dados de E, β, γ se caracterizan por tener un
vector de Runge-Lenz con componente z definida, por tener un momento angular con
componente z definida y por tener un semieje mayor de longitud definida. El ensamble
de órbitas con valores de E, β, γ definidos no tienen una excentricidad definida, aunque
la ecuación (10.325) fija el rango de excentricidades posibles.
Puede mostrarse que Iβ /2 y θ1 son variables canónicamente conjugadas, en tanto
que [Iϕ , θ1 ] = 0.
Como de (10.287) se puede hallar que:
1 1
Jz = (Iϕ − Iβ ) = I(γ − β) (10.337)
2 2
se sigue que esencialmente Jz y θ1 son variables canónicamente conjugadas y que Jz es el
generador infinitesimal de z, las rotaciones que dejan invariante la proyección del vector
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 469
calculando las integrales con la fórmula 14.283 del manual de Spiegel y expresando todas
las constantes de movimiento en función de a, β y γ, hallamos:
2ξ γ2
−
1 1 a 1+β
ϕϕ = ϕ + (ϕξ + ϕη ) − sen−1 s
2 2 2ξ γ2
1−
a (1 + β)2
(10.348)
2η γ2
−
1 a 1−β
− sen−1 s
2 2η γ2
1−
a (1 − β)2
1p i
+ (1 − β)2 − γ 2 sen αη
2
(10.354)
1h p
× 2 − (1 + β)2 − γ 2 sen αξ
2
p i 3
− (1 − β)2 − γ 2 sen αη dαξ dαη = βa
2
En los coeficientes donde nξ y nη no son ambos cero, el término constante β
en z se puede omitir, pues desaparece al efectuar la integral, según se ve en (10.352)
directamente. Entonces, usando una notación obvia y una propiedad de los lı́mites de
integración en (10.352):
Z 3π/2 Z 3π/2
a
Anξ nη = (−S sen αξ + R sen αη )
4π 2 −π/2 −π/2
obtenemos:
ah i
Anξ nη = ei nπ/2 RJnξ (nR)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS) (10.360)
n
Por tanto, la expansión de Fouurier para z es:
3
z= βa
2
∞
X ∞
X i nπ/2 h i
′ e
+a RJnξ (nS)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS)
nξ =−∞ n =−∞
n
η
(nξ ϕξ +nη ϕη )
×e (10.361)
h αξ αξ i
× (1 + β) sen − (2S + iγ) cos
2 2 (10.368)
h αη αη i
(1 − β) sen − (2R + iγ) cos
2 2
ai
B0,−1 = p (2iyx′ − Ryy ′ + Sxx′ ) (10.373)
8 1 − β2
donde:
En definitiva:
x + iy = B−1,0 e−iϕξ +iϕϕ + B0,−1 e−iϕη +iϕϕ
∞
X ∞
X (10.375)
′
+ Bnξ nη einξ ϕξ +inη ϕη +iϕϕ
nξ =−∞nη =−∞
Los números enteros que aparecen en las expansiones de Fourier (10.361) y (10.375)
del problema anterior corresponden a las transiciones entre estados (véase Mecánica
cuántica de Laudau, sección 48). Ası́, en (10.361), nϕ = ∆m = 0 y en (10.375), nϕ =
∆m = 1 y en la compleja conjugada de (10.375), nϕ = ∆m = −1. En esta forma el
desarrollo de Fourier del momento de dipolo eléctrico da las reglas de selección clásicas:
respecto a n1 y n2 la regla de selección es ∆n1 + ∆n2 + 1 = nξ + nη + 1 6= 0, (∆n1 =
0, ∆n2 = −1), o (∆n1 = −1, ∆n2 = 0).
Respecto a l y m, de (10.269) y (10.271) se sigue que nθ + nϕ = ±1. Por otra parte,
de (10.351) se sigue:
∆l − ∆m = nθ (10.378)
Entonces vemos que cuando nϕ = ∆m = ±1, nθ = ∆l ∓ 1 y cuando nϕ = ∆m = 0,
nθ = ∆l. Cuando, de acuerdo con (10.273), nθ = ∓2 y nϕ = ±1, nθ + nϕ = ∓1. Se sigue
entonces que ∆l = ±1 cuando nθ = ±2, nϕ = ∓1, y ∆l = 0 cuando nθ = 0, nϕ = 0, o
cuando nθ = ∓1, nϕ = ±1.
En conclusión, del desarrollo de Fourier de ~r en coordenadas esféricas se sigue que:
∆l = 0, ±1 y ∆m = 0, ±1 (10.379)
lo cual es consistente con la mecánica cuántica.
En todas las expansiones de Fourier que hemos hallado, ejemplos 10.4.1, 10.4.2 y
10.5.1, se cumple que los coeficientes de Fourier se corresponden con elementos de matriz
cuánticos en el lı́mite clásico (véase, Landau, Mecánica cuántica, sección 48).
Para detalles acerca de las reglas de cuantización semiclásicas véase el artı́culo de
I.C. Percival y las referencias allı́ contenidas.12 , y la sección 13.4 del capı́tulo 13 del
presente texto.
z
θ1 = π
η = (1 – β) a
θ1 = 0
ξ = (1 – β) a
Teorı́a de perturbaciones
Son muy pocos los problemas mecánicos que poseen soluciones analı́ticas exactas.
Por eso son necesarios diferentes métodos de aproximación para afrontar la mayor parte
de los problemas realistas.
En astronomı́a, donde se consideran sistemas de muchos cuerpos interactuando
gravitacionalmente, son indispensables los métodos numéricos y los aproximados, para
obtener los cambios en los parámetros de una órbita kepleriana o en los perı́odos, cau-
sados por pequeños efectos debidos a la presencia de los otros planetas. En el siglo XIX
hubo gran interés en el problema de la estabilidad del sistema solar, que llevó al estudio
del movimiento de muchos cuerpos interactuando entre sı́ mediante fuerzas gravitacio-
nales, siendo el más simple el famoso problema de los tres cuerpos, tema que aún es
objeto de investigaciones. Los avances han sido notables, en parte como consecuencia
de los trabajos matemáticos de Kolmogorov, Arnold y Moser, quienes han obtenido las
condiciones de estabilidad de un sistema múltiplemente periódico.
Antes del surgimiento de la moderna teorı́a cuántica, la teorı́a clásica de pertur-
baciones fue muy aplicada a sistemas atómicos, especialmente para el cálculo de efectos
debidos a la interacción con campos electromagnéticos. Es notable el trabajo de Max
Born (noviembre de 1924).1 Esos esfuerzos no fueron estériles ni inútiles, pues dieron
lugar a la teorı́a de perturbaciones de la mecánica cuántica. Hoy esos estudios se aplican
con pocas variaciones a cálculos sobre la estructura vibracional en sistemas moleculares,
y al análisis de los átomos en estados altamente excitados.
La teorı́a clásica de perturbaciones con sus modernos desarrollos se aplica en cam-
pos tan disı́miles como la fı́sica de las altas energı́as (estabilidad de haces en un ciclotrón,
estabilidad del plasma en una máquina Tokamak, etc.), y la óptica (estabilidad de una
cavidad láser, propagación de la radiación láser en una fibra óptica, comportamientos
multiestables y caóticos en óptica cuántica, etc.), por ejemplo.
479
480 / Mecánica clásica avanzada
Las funciones F (n) no pueden considerarse como funciones generatrices de una serie
de transformaciones canónicas, como F0 y F ′ , por la disposición de los argumentos.
Se cumple que H(q, p, t) = H(q, p, t) + ∂F/∂t. Entonces:
La expansión de H0 es:
∂F ∂F (0) ∂H0 ∂F (1)
H0 q, , t = H0 q, ,t + λ ·
∂q ∂q ∂~p ∂~q
(2) (1)
2 ∂H0 ∂F 1 ∂F ∂ H0 ∂F (1)
2
+λ · + · · + ... (11.8)
∂~
p ∂~q 2 ∂~q ∂~p∂~q ∂~q
La expansión de H1 es:
∂F ∂F (0) ∂H1 ∂F (1)
λH1 q, , t = λH1 q, , t + λ2 · + ... (11.9)
∂q ∂q ∂~p ∂~q
Esto nos conduce a:
h i
∂F (0) ∂F (1)
H = H0 + + λ F (1) , H0 + H1 +
∂t ∂t
(11.10)
+λ2 F (2) , H0 + F (1) , H1
!
1h h ii ∂F (2)
+ F (1) , F (1) , H0 + H2 + + ...
2 ∂t
∂F (1) 2 ∂F
(2)
Iν0 = Iν + λ + λ + ... (11.19)
∂ϕ0ν ∂ϕ0ν
∂F (1) ∂F (2)
ϕν = ϕ0ν + λ + λ2 + ... (11.20)
∂Iν ∂Iν
F (1) , F (2) , ... deben ser funciones periódicas de las ϕ0ν con perı́odo 2π.
La ecuación de Hamilton-Jacobi del problema perturbado es:
∂F 0 ∂F 2 0 ∂F
H0 + λH1 ϕ , + λ H2 ϕ , + ... = H(I) (11.21)
∂ϕ0 ∂ϕ0 ∂ϕ0
X ∂H0 ∂F (1)
· + H1 (ϕ0 , I) = H (1) (I) (11.23)
ν
∂Iν ∂ϕ0ν
....................................
n−1
X n−s
X l
X X 1 ∂ k Hs ∂F (i1 )
·
s=0 k=1 ν1 ,ν2 ,...νk =1 i1 +i2 +...ik =s
k! ∂Iν1 ∂Iν2 ...∂Iνk ∂ϕ0ν1
(11.25)
(i2 ) (ik )
∂F ∂F
· ... + Hn (ϕ0 , I) = H (n) (I) ; n = 0, 1, 2, ...
∂ϕ0ν2 ∂ϕ0νk
484 / Mecánica clásica avanzada
donde Φn es una función que depende sólo de F (1) , F (2) , ...F (n−1) .
La ecuación (11.23) permite determinar a la vez a H (1) (I) y a F (1) . Como F (1) es
función periódica de las ϕ0ν , el valor medio de (11.23) sobre una celdilla fundamental en
el espacio de las ϕ0ν , o sea sobre el toroide invariante del movimiento no perturbado, es
cero. Por tanto:
donde el signo {H1 } denota la parte oscilante de H1 , o sea la diferencia H1 − hH1 i, que
puede representarse por una serie de Fourier de la forma:
XX X 0 0 0
′
{H} = ... An1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl ) (11.30)
n1 n2 nl
∂F (1) (ϕ0 , I)
ϕν = ϕ0ν + λ (11.33)
∂Iν
Teorı́a de perturbaciones / 485
lo cual nos dice que las variables angulares perturbadas presentan pequeñas oscilaciones
con amplitud del orden de λ.
El cambio en las frecuencias se obtiene de:
∂H(I) ∂H (1) (I)
ων0 (I) = = ων0 (I) + λ (11.34)
∂Iν ∂Iν
y resulta ser pequeño.
De (11.19) se obtiene para las Iν0 :
∂F (1) (ϕ0 , I)
Iν = Iν + λ (11.35)
∂ϕ0ν
lo cual muestra que las Iν0 que en el movimiento no perturbado son constantes, ahora
están sometidas a oscilaciones de amplitud del orden de λ.
Que no haya degeneración es una exigencia necesaria para que (11.32) tenga senti-
do. Ası́ no haya degeneración pueden presentarse los llamados pequeños divisores, o sea
valores de n1 , n2 , ...nl tales que ~n · ~ω 0 toma valores pequeños.
De (11.24) se sigue que la parte oscilante en el lado izquierdo debe anularse, lo cual
nos da una ecuación diferencial para F (2) :
1 X X ∂ 2 H0 ∂F (1) ∂F (1)
· ·
2 µ ν ∂Iν ∂Iµ ∂ϕ0ν ∂ϕµ
(11.36)
X ∂H0 ∂F (2) X ∂H1 ∂F (1)
+ · 0
+ 0
+ H2 (ϕ0 , I) = 0
ν
∂I ν ∂ϕ ν ν
∂I ν ∂ϕ ν
Xl X
′ ∂A~n nν A−~ n
H (2) = hH2 i − 0
ν=1
∂Iν ~n · ω
~
~
n
l l
1 X X ∂ωµ0 X ′ A~n A−~n
+ nν nµ (11.38)
2 µ=1 ν=1 ∂Iν (~n · ~ω 0 )2
~
n
hei(~n+m)
~
· ϕi = δ~n,−m
~ (11.39)
486 / Mecánica clásica avanzada
Ejemplo 11.2.1 Encontrar las correcciones de primero y segundo orden para un oscilador
armónico con perturbación anarmónica.
H1 = aq 3 ; H2 = bq 4 (11.47)
Teorı́a de perturbaciones / 487
De acuerdo con el ejemplo 9.5.5, las variables acción-ángulo del problema no per-
turbado se hallan mediante la transformación canónica con función generatriz F1 , dada
por:
1
F (q, ϕ0 ) = mω02 cot ϕ0 (11.48)
2
que da lugar a la transformación:
0 1/2
2I
q= sen ϕ0 ; p = (2mI 0 ω 0 )1/2 cos ϕ0 (11.49)
mω 0
Expresando a H0 , H1 y H2 en términos de I 0 y ϕ0 , obtenemos:
H0 = I 0 ω 0 (11.50)
3/2
2I 0
H1 = a sen3 ϕ0 (11.51)
mω 0
2
2I 0
H2 = b sen4 ϕ0 (11.52)
mω 0
0por tanto:
3/2
∂F λa 2I
ϕ= = ϕ0 + sen2 ϕ0 cos ϕ0 + 2 cos ϕ0 (11.58)
∂I 2Iω 0 mω 0
Ahora resolvemos esta ecuación para ϕ0 en términos de ϕ, al primer orden en λ:
3/2
0 λa 2I
ϕ =ϕ− sen2 ϕ cos ϕ + 2 cos ϕ (11.59)
2Iω 0 mω 0
A este mismo orden, I 0 en función de (I, ϕ) es:
3/2
0 λa 2I
I =I− 0 sen3 ϕ (11.60)
ω mω 0
Al reemplazar (11.59) y (11.60) en la expresión (11.49) para q, que sigue siendo
válida en el sistema perturbado, obtenemos:
1/2
2I λaI
q= sen ϕ − 2 0 3 (3 + cos 4ϕ) (11.61)
mω 0 m (ω )
Ejercicio 11.2.1 Aplicar la teorı́a de perturbaciones al péndulo simple, tomando como
parámetro pequeño la relación entre la energı́a de libración y la energı́a de la separatriz
(pequeñas oscilaciones). Mostrar que:
2
λGI
H(I) = ω 0 I −
16
(11.62)
GI 2
F (1) =− (8 sen ϕ − sen 4ϕ)
192ω 0
ver el ejemplo 10.3.2.
Teorema 11.3.1 Todos los sistemas de variables angulares en que una función f (I, ϕ)
tiene perı́odo fundamental 2π, están conectados entre sı́ por las fórmulas:
l
X
ϕν = nνµ ϕ′µ + ψν (ϕ′1 , ϕ′2 , ...ϕ′l , I1′ , I2′ , ...Il′ )
µ=1 (11.66)
ν = 1, 2, ...l
donde las nνµ forman una matriz de elementos enteros y determinante ±1 y las ψν
son funciones periódicas de las ϕ′ν con perı́odo 2π. Según el teorema, buscamos una
transformación:
ϕν = fν (ϕ′ , I ′ ) (11.67)
Ahora llamemos ϕν a:
Entonces:
F (I; ϕ1 , ϕ2 , ...ϕl ) = F ′ (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) =
(11.70)
F ′ (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) = F (I; ϕ1 , ϕ2 , ...ϕl )
490 / Mecánica clásica avanzada
lo cual implica que las ψν deben ser derivadas parciales de ψ y por tanto se debe cumplir:
∂ψν ∂ψµ
= (11.77)
∂Iµ ∂Iν
Las fórmulas de transformación para las Iν′ son:
l
X ∂ψ
Iν′ = nνµ Iν − (11.78)
µ=1
∂ϕ′ν
l
X X ′
Iν′ = nνµ Iν − i C~n (I)nν ei~n·ϕ~ (11.81)
µ=1 ~
n
Como tanto las (I, ϕ) como las (I ′ , ϕ′ ) son variables acción-ángulo, las (I, I ′ ) deben
ser constantes y las (ϕ, ϕ′ ) deben ser funciones lineales del tiempo. Esto implica una de
las dos condiciones siguientes:
o que en el exponente de la serie de Fourier sólo aparecen combinaciones de las ϕ′ν tales
que:
n1 ϕ′1 + n2 ϕ′2 + ...nl ϕ′l = (n1 ω1′ + n2 ω2′ + ...nl ωl′ ) t
(11.83)
+n1 δ1′ + n2 δ2′ + ... + nl δl′ = constante
~ ′ = 0.
Claramente la condición (11.83) requiere que el sistema sea degenerado, ~n · ω
En conclusión, para un sistema no degenerado, hay varios conjuntos de variables
acción-ángulo, conectados entre sı́ mediante las fórmulas:
l
X l
X
∂ψ
ϕν = nνµ ϕ′µ − ; Iν′ = nνµ Iν (11.84)
µ=1
∂Iν µ=1
De donde:
l
X l
X
ϕ′′ν = Cνµ ϕ′µ ; Iν′ = Cνµ Iµ′′ (11.89)
µ=1 µ=1
θ1 = −ϕ2 ; φ1 = ϕ1 (11.99)
La clasificación dada en (11.87) nos permite llamar a las ϕ′α y Iα′ variables acción-
ángulo propias, y a las ϕ′ρ , Iρ′ , variables impropias o degeneradas; las ϕ′ρ permanecen
constantes en el curso del movimiento. El número s de frecuencias ωα′ no nulas e inde-
pendientes se llama el grado de periodicidad del sistema y el número l − s se llama el
grado de degeneración.
Consideraremos ahora las fórmulas de transformación (11.80) y (11.81) en el caso
degenerado. Con el fin de que la división entre variables degeneradas y no degeneradas
persista, requerimos que las ϕρ no dependan de las ϕ′α y que las ϕ′ρ no dependan de
las ϕα . Esto implica que los elementos nρα se anulen. Las fórmulas de transformación
que toman en cuenta lo anterior y además que las ϕα y las ϕ′α son funciones lineales del
tiempo, y que las ϕρ , ϕ′ρ , Iν , Iν′ , son constantes, son:
l
X
ϕα = nαµ ϕ′µ + ψα (ϕ′σ , I) (11.100)
µ=1
l
X
ϕρ = nρσ ϕ′σ + ψρ (ϕ′σ , I) (11.101)
σ=s+1
s
X
Iα′ = nβα Iβ (11.102)
β=1
l
X X
Iρ′ = nνρ Iρ − i C~nσ (I)nρ ei~nσ ·ϕ~ σ (11.103)
ν=1 ~
nσ
donde el subı́ndice σ se coloca a los vectores para indicar que solamente tienen compo-
nentes degeneradas. Como los nνµ son enteros y los nρα son nulos, entonces se cumple
que:
Esto tiene una razón fı́sica más profunda: las variables (ϕ0 , I 0 ) que se obtienen de
las variables del problema perturbado (ϕ, I) al hacer λ = 0 no están determinadas por
el movimiento no perturbado sino por la perturbación. Es decir, no podemos partir de
cualquier conjunto de variables acción-ángulo del sistema no perturbado sino que antes
debemos encontrar un conjunto de variables acción-ángulo “exactas en la aproximación
cero”.
Este comportamiento se refleja en la teorı́a cuántica de perturbaciones de sistemas
degenerados, donde se deben formar combinaciones lineales de las funciones de onda
degeneradas para obtener las funciones de onda exactas en la aproximación cero, que
son las funciones que se obtienen de las perturbadas al hacer λ = 0. Esto en mecánica
cuántica equivale a buscar una combinación lineal de las funciones degeneradas que
diagonalice la perturbación, en teorı́a de perturbaciones degeneradas de primer orden.3
3 Véase la sección 12.5, capı́tulo 12.
Teorı́a de perturbaciones / 495
∂G ∂V ∂G ∂V
ϕ′α = = ϕ0α + 0 ′ ; ϕ0ρ ′ = = ϕ0ρ + 0 ′ (11.109)
∂Iα0 ′ ∂Iα ∂Iρ0 ′ ∂Iρ
G en (11.107) tiene una parte que depende solamente de las variables ϕ0ρ e Iρ0 ′ , la
cual se halla resolviendo la ecuación de Hamilton-Jacobi siguiente:
0 0 ∂G
H1 Iα , ϕρ , = H (1) (I 0 ′ ) (11.110)
∂ϕ0ρ
En este punto está garantizando que la perturbación no dependerá de variables
angulares al promediar sobre las variables angulares no degeneradas y que se cumple
siempre la condición m ω 0 6= 0. Ahora expresamos a H en términos de (I ′ , ϕ′ ):
~ ·~
H = H0 (Iα′ ) + λH1 (ϕ0 ′ , I 0 ′ ) + λ2 H2 (ϕ0 ′ , I 0 ′ ) + ... (11.111)
y, como en la sección 11.2, buscamos una transformación canónica (I ′ , ϕ′ ) → (I, ϕ), lo
cual dará lugar nuevamente a las fórmulas (11.22), ... (11.25), escribiendo (ϕ0 , I 0 ) en
lugar de (ϕ0 ′ , I 0 ′ ).
Como H no depende de Iρ′ , ahora en lugar de (11.26) se tiene:
Xs
∂H0 ∂F (n)
· 0
= H (n) (I) − Φn (ϕ0 , I) (11.112)
α=1
∂Iα ∂ϕα
donde {H1 } = H1 − hH1 i y h...i denota un promedio sobre las variables angulares ϕ0α .4
Es claro que la ecuación (11.113) no permite determinar completamente a F (1) , pues
4 La solución de la forma (11.32) aún existe, siendo bien definida salvo posibles divergencias debidas
a la presencia de pequeños denominadores en los armónicos altos, ~ nα · ~
ωα0 ≈ 0.
496 / Mecánica clásica avanzada
De esta ecuación podemos determinar a H (2) (I), a R(1) y a una parte G(2) de F (2) .
Indicaremos con h...i los promedios sobre las ϕ0α y los promedios sobre las ϕ0ν
completas por hh...ii. Entonces:
H (2) (I) = hhΦ2 ii (11.116)
donde Φ2 es completamente conocida:
s s
1 X X ∂ 2 H0 ∂G(1) ∂G(1)
Φ2 = · ·
2 α=1 ∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β
β=1
(11.117)
s
X ∂H1 ∂G(1)
+ · + H2 (ϕ0 , I)
α=1
∂Iα ∂ϕ0α
donde:
{hΦ2 i} = hΦ2 i − hhΦ2 ii (11.119)
F (2) es solución a:
Xs
∂H0 ∂F (2)
· = −{Φ2 } (11.120)
α=1
∂Iα ∂ϕ0α
pero (11.120) determina sólo una parte G(2) , quedando por determinar una función R(2)
que depende de ϕ0ρ y Iν , en la aproximación siguiente.
de modo que (I, ϕ) pueden tomarse independientes, y con funciones de (I, ϕ). Sean las
expansiones de Fourier de f (I, ϕ) = f (I, ϕ):
X X
f (I, ϕ) = f~n (I)ei~n·ϕ~ = f (I, ϕ) = fm
~ (I)e
im·
~ ϕ~
(11.121)
~
n m
~
Entonces, claramente f m
~ (I) pueden expresarse en función de f~
n (I), ası́:
I I I X
1 ~
fm~ (I) = ... f~n (I)ei~n·ϕ~ e−i~n·ϕ~ dl ϕ (11.122)
(2π)l
~
n
XX (11.124)
= g+
~ (I) fα α′ (I) gα
~ −~ ~ ′ (I)
~ ′β
β~
α
α
~ α
~′
donde g +
~ α = gα
⋆
~β~ . Si formamos matrices con los coeficientes de Fourier, entonces (11.124)
β~
nos dice que f~n y fm ~ están conectados por medio de una transformación unitaria.
Ahora examinemos las expansiones de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las varia-
bles canónicas (Iρ0 , ϕ0ρ ) y (Iρ0 ′ , ϕ0ρ ′ ) conectadas por las fórmulas (11.108) y (11.109). La
transformación canónica buscada, por definición, conduce a una expresión que no depen-
de de las ϕ′ρ . Si llamamos f (Iρ0 , ϕ0ρ ) a hH1 (Iρ0 , ϕ0ρ , Iα )i y f ′ a la correspondiente expresión
en términos de (Iρ0 ′ , ϕ0ρ ′ ), podemos hacer corresponder la ecuación de Hamilton-Jacobi
(11.110) con la (11.124). La transformación canónica buscada debe dar lugar a coefi-
cientes de Fourier de la forma:
′ 0′ (1) 0 ′
fβ−
~ β~ ′ (I ) = H (I )δβ,
~β ~′ (11.125)
a0 es igual a:
(I30 )2
a0 = (11.134)
mZe2
En esta expresión no aparecen ni ϕ01 ni ϕ03 . Por tanto I10 y I30 son constantes
durante el movimiento perturbado y aparecen como parámetros. Las únicas variables
son entonces ϕ02 y I20 , indicando que en el movimiento perturbado la órbita no permanece
Teorı́a de perturbaciones / 499
√
2 x dI20 = dx (11.138)
lo cual nos permite escribir:
I I
1 ∂ϕ0 1 √ dϕ02
I20 ′ = I20 02 dI20 = x dx (11.139)
2π dI2 2π dx
De (11.135) se sigue que:
C
cos2 ϕ02 = (11.140)
x B B
1− − +
A x A
Por tanto:
2 1 1 B
d(sec ϕ02 ) = − + 2 dx (11.141)
C A x
En consecuencia:
√
dϕ02 (x2 − AB) AC
= √ (11.142)
dx 2 x(A − x)(x − B)[(A − x)(x − B) − ACx]1/2
Entonces (11.139) nos da:
√ I
AC (x2 − AB) dx
I20 ′ = (11.143)
4π (A − x)(x − B)[(A − x)(x − B) − ACx]1/2
500 / Mecánica clásica avanzada
siendo W igual a:
3
W = H1 − hH1 i = eEz − eEaβ (11.151)
2
Podrı́amos partir de la expresión para W en coordenadas parabólicas para calcular
a F (1) y luego a H (2) . Sin embargo usaremos el siguiente procedimiento equivalente: como
en coordenadas parabólicas el promedio de eEz sobre las variables angulares es igual
al promedio temporal, debido a que heEzit no contendrá variables angulares, podemos
realizar inicialmeste los promedios temporales en coordenadas esféricas. Luego, antes de
promediar sobre la otra variable angular pasamos de coordenadas esféricas a coordenadas
parabólicas usando las ecuaciones (10.326) y (10.327). El resultado será el mismo que si se
calculan los promedios temporales en coordenadas parabólicas. Finalmente, promediando
sobre θ1 obtenemos a H (2) en coordenadas parabólicas.
heEzit y eEz están dados por:
3
heEzit = eEaǫ cos θmı́n cos θ0
2
−(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ
Por tanto W en coordenadas esféricas es:
W = eF a cos θmı́n
1
× −(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ (11.153)
2
La ecuación (11.150) toma la forma:
∂F (1) eF a
0 = cos θmı́n
∂ϕ3 2ω 0
h i
× 2(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 + 2 cos θ0 cos ψ (11.154)
eF a h
F (1) = cos θ mı́n − 2(1 − ǫ2 )1/2 sen θ0 cos ψ
4πω 0
∂F (1) ∂F (1)
= − (11.158)
∂ϕ02 ∂θ0
∂F (1) eF a h
= cos θmı́n 2(1 − ǫ2 )1/2 cos θ0 cos ψ
∂ϕ02 2ω 0
∂ cos θmı́n γ2
=
∂I2 I3 (1 − ǫ2 )3/2 cos θmı́n
∂ǫ −(1 − ǫ2 − γ 2 )
= (11.160)
∂I2 I3 (1 − ǫ2 )1/2 ǫ cos2 θmı́n
∂ψ I2 sen ψ
= −
∂I2 I32 ǫ (1 − ǫ cos ψ)
Teorı́a de perturbaciones / 503
obtenemos usando (11.159), (11.161) y (11.162) después de un cálculo largo pero directo:
h
∂W ∂F (1) (eEa)2
. = − (9 − 13ǫ2 − γ 2 + 4ǫ4 + ǫ2 γ 2 )
∂I2 ∂ϕ02 t 16ω 0 I3 (1 − ǫ2 )
(11.163)
i
+(−4 + 3ǫ2 + 4γ 2 + ǫ4 + ǫ2 γ 2 ) cos2 θ0
Por otra parte podemos escribir los otros dos términos de la ecuación (11.149) ası́:
* 2 +
1 ∂ 2 H0 ∂F (1) ∂W ∂F (1)
·
2 ∂I32 ∂ϕ03 ∂I3 ∂ϕ03 t
t
* 2 +
3ω 0 W ∂W −W (11.164)
=− + ·
2I3 ω0 ∂I3 ω0 t
t
1 3 ∂
=− + hW 2 it
2ω 0 I3 ∂I3
De (10.268) se sigue que:
1
hW 2 it = (eE)2 a cos2 θmı́n (1 − ǫ2 + 5ǫ2 cos2 θ0 ) (11.165)
2
Con este resultado (11.164) puede escribirse como:
Resumiendo los resultados dados por las ecuaciones (11.163) y (11.166) llegamos
a:
* 2 +
∂W ∂F (1) ∂W ∂F (1) 1 ∂ 2 H0 ∂F (1)
· + · +
∂I2 ∂ϕ02 t ∂I3 ∂ϕ03 t 2 ∂I32 ∂ϕ03
t
(11.167)
2
(eEa)
=− [(29 − 24ǫ2 − 21γ 2 ) + 9ǫ2 cos2 θmı́n cos2 θ0 ]
16I3 ω 0
Si ahora pasamos a coordenadas parabólicas mediante las ecuaciones (10.325),
(10.341) a (10.345), llegamos a la siguiente expresión para el lado derecho de (11.167):
(eEa)2 h
− · 17 − 3β 2 − 9γ 2
16I3 ω 0
p i
− 12 [(1 + β 2 ) − γ 2 ][(1 − β 2 ) − γ 2 ] cos θ1 (11.168)
rápidas del sistema. Cuando el parámetro toma el valor cero, el sistema posee solamen-
te oscilaciones rápidas, y a medida que aumenta el valor del parámetro, aparecen las
contribuciones de las frecuencias lentas.
Asumamos que el sistema posee sólo una frecuencia rápida y que el hamiltoniano
se puede separar en la forma:
H = H0 (I, λ~y , λt) + λH1 (I, ϕ, λ~y , λt) (11.171)
donde I y ϕ son las variables acción-ángulo del movimiento no perturbado (λ = 0) del
grado de libertad rápido, y ~
y = (q, p) son las variables canónicas de los restantes gra-
dos de libertad, no necesariamente expresadas en variables acción-ángulo. Debido a que
cuando λ = 0 el sistema es de un grado de libertad, entonces es integrable.
Vemos que ∆I/I será del orden de λ2 , a no ser que haya una conmensurabilidad
entre las oscilaciones en t y en ϕ:
ω0 s
= (11.193)
λω1 2
508 / Mecánica clásica avanzada
donde s es un entero del orden de 1/λ. En este caso los términos con n = ±s en (11.192)
serán constantes en t, y ∆I/I será del orden de λ:
∆I 2π
≈ λ|as | (11.194)
I ω1
O sea que si la resonancia es mantenida por tiempos del orden de un perı́odo de la
oscilación lenta, 2π/(λω1 ), el invariante de primer orden es destruido.
X XX
H2 = bν qν4 + ′
(bµν qµ2 qν2 + b′µν qµ3 qν )
ν µ ν
Caso no degenerado. Cuando las ων0 son inconmensurables se dice que son no
degeneradas. En las variables acción-ángulo (ϕ0 , I 0 ), H0 es:
l
X
H0 = ων0 Iν0 (11.198)
ν=1
Para hallar a H (2) aplicamos la fórmula (11.40), lo cual requiere hallar los coefi-
cientes de Fourier A~n de H1 . Para escribir a H1 como una serie de Fourier usamos la
identidad trigonométrica:
4 sen α sen β sen γ = −sen (α + β + γ) + sen (−α + β + γ)
(11.201)
+sen (α − β + γ) + sen (α + β − γ)
la cual nos da:
1X
H1 = aν Q3ν [−sen (3ϕν ) + 3sen ϕν ]
4 ν
1X
+ aµν Q2µ Qν [−sen (2ϕµ + ϕν )
4 µν
(11.202)
+2 sen ϕν + sen (2ϕµ − ϕν )]
1X
+ aµνλ Qµ Qν Qλ [−sen (ϕµ + ϕν + ϕλ )
4
µνλ
+3 sen (ϕµ + ϕν − ϕλ )]
La ecuación (11.202) tiene la forma de una serie de Fourier seno:
X
H1 = B~n sen (~n · ϕ
~) (11.203)
~
n
donde todos los coeficientes de Fourier B (ν) (nν ) son cero excepto:
3 1X
B1ν = aν Q3ν + aµν Q2µ Qν (11.204)
4 2 µ
1
B3ν = − aν Q3ν (11.205)
4
νµ 1
B21 = − aνµ Q2ν Qµ (11.206)
4
µν 1
B2−1 = aνµ Q2ν Qµ (11.207)
4
νµλ 3
B111 = − aνµλ Qν Qµ Qλ (11.208)
2
νµλ 3
B11−1 = aνµλ Qν Qµ Qλ (11.209)
2
En (11.40) aparecen |A~n |2 = A~n A−~n , donde A~n están relacionadas con los B~n por:
B~n − B−~n
A~n = (11.210)
2i
510 / Mecánica clásica avanzada
entonces:
1
|A~n |2 = (B~n − B−~n )2 (11.211)
4
con lo cual los |A~n |2 diferentes de cero son:
!
1 X
|Aν1 |2 = Cν = 3aν Q3ν + 2 aµν Q2µ Qν (11.212)
64 µ
1 2 6
|Aν3 |2 = Cν′ = a Q (11.213)
64 ν ν
1 2 4 2
|Aνµ 2
21 | = Cνµ = a Q Q (11.214)
64 νµ ν µ
9 2
|Aνµλ 2
111 | = Cνµλ = a Q2 Q2 Q2 (11.215)
16 νµλ ν µ λ
luego (11.40) toma la forma:
3X 1XX
H (2) = bν Q4ν + bνµ Q2ν Q2µ
8 ν 4 ν µ
X 1 ∂
− 0 ∂I
(Cν + Cν′ )
ν
ω ν ν
XX
2 0 ∂Cνµ 0 ∂Cνµ
− 4ω ν − ω µ (11.216)
ν µ
4(ων0 )2 − (ωµ0 )2 ∂Iν ∂Iµ
XXX 1 ∂Cνµλ
−
ν µ
ων0 + ωµ0 + ωλ0 ∂Iν
λ
1 ∂Cνµλ ∂Cνµλ ∂Cνµλ
+ 0 + −
ων + ωµ0 − ωλ0 ∂Iµ ∂Iµ ∂Iλ
Según (11.199) y (11.212) a (11.215) las cantidades C son de tercer grado en las
Iν , de modo que todos los términos de H (2) son cuadráticos en las Iν . La energı́a total
tiene entonces la siguiente dependencia de las variables de acción:
X 1 XX 0
H(I) = ων0 Iν + ω Iν Iµ (11.217)
ν
2 ν µ νµ
I 20/ 3
2 I 10 / 3
I 10/ 3
1/CT 1/C
I1 = rI 1 ; I2 = I 2 − sI 1 (11.238)
Cuando se aplica la perturbación, como vimos en el efecto Stark lineal, ϕ̇1 pasa a
ser una frecuencia lenta y ϕ̇2 es una frecuencia rápida. Si en la expansión de Fourier de
H1 en las variables acción-ángulo iniciales, (I, ϕ), efectuamos la transformación (11.238)
y (11.239), obtenemos:
XX
H1 = Hl,m (I)ei[lϕ1 +(ls+mr)ϕ2 ]/r (11.240)
l m
514 / Mecánica clásica avanzada
notando que los coeficientes con p = 1 y p = −1 sólo difieren en la fase, de modo que
puede hacerse H−r,s = Hr,−s con la simple adición a ϕ1 de una constante.
Las fórmulas (11.243) y (11.244) nos dan las siguientes ecuaciones para la locali-
zación de los puntos fijos:
Entonces los puntos fijos están localizados en ϕ10 = 0, nπ. Como ∂I1 /∂I 1 = r y
∂I2 /∂I 1 = −s, vemos que ∂H 0 /∂I 1 = sω1 − rω2 = 0. Por tanto I 10 está determinado
por:
∂H00 Hr,−s
±2 =0 (11.246)
∂I 10 ∂I 10
Para puntos de la superficie de sección diferentes a los puntos fijos, se cumple que:
∂H 0 ∂H00 ∂Hr,−s
ϕ̇1 = +λ + 2λ cos ϕ1 (11.248)
∂I 1 ∂I 1 ∂I 1
O sea que los desplazamientos de I 1 respecto a un punto fijo son del orden de
λ. En cuanto a ϕ1 , el comportamiento es diferente según la degeneración sea acciden-
tal o intrı́nseca. Si la degeneración es accidental, entonces H 0 = H 0 (I 1 , I 2 ) y por esto
la amplitud de las oscilaciones de ϕ1 es del orden de la unidad. Si la degeneración es
intrı́nseca, entonces H 0 (I 1 , I 2 ) = H0 (sI1 + rI2 ) = H 0 (I 2 ) y, entonces, ∂H 0 /∂I 1 = 0 y
las oscilaciones de ϕ1 son del orden de λ.
I 1 = I 10 + ∆I 1 (11.249)
Esto nos permite expandir a H(I) en las cercanı́as de I 10 . Para ello usamos en
(11.244) las expresiones:
∂H 0 1 ∂2H 0
H 0 (I) = H 0 (I 0 ) + ∆I 1 + (∆I 1 )2 + ... (11.250)
∂I 10 2 ∂I 2
10
∂H00 1 ∂ 2 H00
H00 (I) = H00 (I 0 ) + ∆I 1 + (∆I 1 )2 + ... (11.251)
∂I 10 2 ∂I 2
10
∂Hrs 1 ∂ 2 Hrs
Hrs (I) = Hrs (I 0 ) + ∆I 1 + (∆I 1 )2 + ... (11.252)
∂I 10 2 ∂I 2
10
1 ∂2H 0
∆H = H − H 0 (I 0 ) − λH00 (I 0 ) = (∆I 1 )2 + 2λHr,−s cos ϕ1 (11.253)
2 ∂I 2
10
donde:
∂ 2H 0
G(I 0 ) = 2 ; F (I 0 ) = −2λHr,−s (I 0 ) (11.255)
∂I 10
Este resultado nos muestra que el movimiento cerca a cualquier resonancia, para
cualquier sistema, es aproximadamente similar al de un péndulo (el diagrama de fases
presenta rotación, separatriz y vibración, ver ejemplo 10.3.2).
Si GF > 0, el punto fijo estable está en ϕ1 = 0 y el punto fijo inestable en ϕ1 = ±π.
La frecuencia del movimiento en I 1 − ϕ1 para la libración cerca al punto estable es baja:
!1/2
√ ∂ 2
H 0
ω1 = F G = λ1/2 −2Hr,−s · 2 (11.256)
∂I 10
y, según la fórmula (10.104), se hace cero en la separatriz. El máximo desplazamiento
en ∆I 1 está dado en la mitad de la separatriz y vale:
1/2
r −2H
F r,−s
máx ∆I 1 = 2 = λ1/2 2 (11.257)
G ∂ H0
2
∂I 10
Degeneración intrı́nseca. En este caso, de (11.247) y (11.248), se sigue que tanto
I 1 como ϕ1 permanecen cerca del punto fijo porque ∂H 0 /∂I 1 = 0.
En las proximidades del punto elı́ptico ϕ10 escribimos ϕ1 = ∆ϕ1 , y por tanto:
1
cos ϕ1 = 1 − (∆ϕ1 )2 + ... ; ϕ1 ≈ 0 (11.258)
2
En las proximidades del punto hiperbólico ϕ10 = π (o ϕ10 = −π) escribimos
ϕ1 = ±π + ∆ϕ1 y por lo tanto:
1
cos ϕ1 = −1 + (∆ϕ1 )2 + ... ; ϕ1 ≈ ±π (11.259)
2
En este caso ∆H en vez de (11.254) toma la forma:
1 1
∆H = G(∆I 1 )2 + F (∆ϕ1 )2 (11.260)
2 2
donde:
∂2H 0 ∂ 2 H00 ∂ 2 Hr,−s
G= 2 +λ 2 +λ 2 (11.261)
∂I 10 ∂I 10 ∂I 10
F = ∓2λHr,−s (11.262)
2
Como para degeneración intrı́nseca ∂ 2 H 0 /∂I 10 = 0, se sigue que F y G son del
orden de λ. Cerca del punto fijo elı́ptico la frecuencia de oscilación es:
" !#1/2
√ ∂ 2 H00 ∂ 2 Hr,−s
ω1 = F G = λ −2Hr,−s 2 + 2 (11.263)
∂I 10 ∂I 10
Teorı́a de perturbaciones / 517
Ejemplo 11.7.1 Analizar el movimiento cerca a la resonancia del sistema de dos oscila-
dores con acoplamiento no lineal del ejemplo 11.6.1.
∂ 2 H2,−1 1 h i
−3/2 −1/2
2 2 = I 10 (I 20 ) + 6(I 20 ) (11.268)
∂I 20 2(mω10 )3/2
λ h i
−3/2 −1/2
G= I 10 (I 20 ) + 6(I 20 ) (11.270)
4(mω10 )3/2
ω1 será:
1/2
λ (I 10 − 2I 20 )(I 10 + 6I 20 )
ω1 = (11.271)
2(mω10 )3/2 I 20
518 / Mecánica clásica avanzada
Rotación Libración
Resonancia:
I20 = I20 Separatriz
ϕ02 = ϕ20
I20
ϕ20
λ=0
Punto
hiperbólico Punto
elíptico
a b
Figura 11.2 Movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento
no lineal. Superficie de sección I20 − ϕ02 .
La relación entre las oscilaciones máximas en I20 y ϕ02 está dada por:
∆I20 1/2
0 = 2I 20 (I 10 − 2I 20 )(I 10 + 6I 20 ) (11.272)
∆ϕ2
La figura 11.2 muestra la superficie de sección I20 − ϕ02 , en coordenadas polares,
con y sin perturbación.
∆I1 cos ϕ1
a b
Figura 11.3 Cadena de islas asociada a la resonancia: a. Aparecen las separatrices y las curvas
de libración; b. Cadena de islas formadas en la resonancia secundaria.
En la figura 11.3a, aparecen las separatrices y las curvas de libración. Las lı́neas
punteadas corresponden a la resonancia primaria y las lı́neas continuas corresponden a
las “islas” formadas en la resonancia secundaria. En la figura 11.3b, se han llevado las
“islas” de la resonancia secundaria a variables acción-ángulo. En un paso siguiente, uno
podrı́a transformar las variables (J, χ) a unas nuevas variables (J, χ) donde sea removida
la resonancia 5ω1 = ω2 , dando lugar nuevamente a curvas de tipo pendular como las de
la figura 11.2b.
Para tener en cuenta la forma como una resonancia secundaria modifica la solución,
′
reintroducimos los términos de H 1 ignorados al promediar sobre ϕ2 , al ir de (11.240) a
(11.242):
′
H 1 (I, ϕ) = H 1 (I, ϕ) − hH 1 (I, ϕ1 )i (11.274)
Usando la fórmula:
∞
X
eix sen θ = Jn (x) einθ (11.279)
n=−∞
donde Jn son las funciones Bessel enteras de orden n, podemos escribir a K1 como:
XXX
′
K1 = Γlmn (I 10 , J2 )einχ1 +i(ls/r+m)χ2 (11.280)
l m n
donde:
" 1/2 #
l 2J1
Γlmn (I 10 , J2 ) = H lm (I 10 , J2 )Jn (11.281)
r R
donde:
X
K−jp,jq = Γkr,jq−ks,−jp (11.291)
k
o explı́citamente:
Trayectoria de fases
Puntos fijos
con r entero y s = 6
I1
x0
x1
ϕ1 I2
x2
ϕ2
α irracional
ϕ2 = constante
a b
dados por ϕ1 = 0, π para todo I1 , y (11.309) tiene puntos fijos dados por 2ϕ2 = 2πα(I2 )−
2πm con m entero.
A partir de las ecuaciones de Hamilton podemos hallar la correspondiente apli-
cación sobre una superficie de sección. Las ecuaciones de Hamilton del hamiltoniano
(11.301) son:
dIi ∂H1 dϕi ∂H0 ∂H1
= −λ ; = +λ (11.310)
dt ∂ϕi dt ∂Ii ∂Ii
La ecuación para I1 sobre la superficie de sección ϕ2 = constante = ϕ20 , entre la
n y la n + 1-ésima iteración, es:
dI1 ∂H1
= −λ (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) (11.311)
dt ∂ϕ1
donde I2 , ω1 y ω2 son funciones de In+1 . En la n-ésima iteración en (11.311) t = 0 y en
la n + 1-ésima iteración t = T2 . Luego el salto en la acción I1 en una iteración es:
Z T
∂H1
∆I1 = −λ dt (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) (11.312)
0 ∂ϕ1
Entonces de (11.302) se sigue que:
In+1 = In + K sen ϕn
(11.318)
ϕn+1 = ϕn + In+1
dI dϕ
= K sen ϕ δ1 (n) ; =I (11.319)
dn dn
y el hamiltoniano según (11.317) es:
1 2
H= I + Kδ1 (n) cos ϕ (11.320)
2
Es conveniente usar la expansión de Fourier de la función delta periódica, (11.315):
∞
X
δ1 (n) = 1 + 2 cos 2πqn (11.321)
q=1
entonces:
∞
X
1 2
H= I + K cos ϕ ei2πnm (11.322)
2 m=−∞
H = H 0 + H1 (11.323)
donde:
1 2
H0 = I + K cos ϕ (11.324)
2
y,
∞
X
H1 = 2K cos ϕ cos 2πqm (11.325)
q=1
q
ωq
–π +π
Superficie
de sección ϕ = constante
a
Iy
ϕ
Ix
ωϕ
Superficie
de sección q = constante
Figura 11.5 Movimiento en las superficies de sección para un sistema de dos grados de
libertad: a. Sección p − q; b. Sección I − ϕ.
q(−ω0 t) = −q(ω0 t), expandiendo la función seno y notando que sólo la parte simétrica
contribuye a la integral, obtenemos:
A −ϕn
f (In+1 , ϕn ) = α2 (Q0 ) sen (11.332)
ω0 r r
donde:
Z ∞
mq(s)
αm (Q0 ) = cos − Q0 s ds (11.333)
−∞ 2r
es la integral de Arnold-Melnikov, y:
ωϕ
Q0 = (11.334)
rω0
Teorı́a de perturbaciones / 529
La integral (11.333) es impropia pero consta de una parte oscilante que promedia
a cero durante el movimiento sobre la separatriz y una parte constante que viene de la
región con s ≤ 1/Q0 . Melnikov la evaluó, siendo para Q0 ≫ m:6
4π
αm (Q0 ) = (2Q0 )m−1 e−πQ0 /2 (11.335)
(m − 1)!
32 (11.340)
ϕn+1 = ϕn + Q0 r ln
|Wn+1 |
donde:
ωϕ I0 8πA 2 −πQ0 /2
W0 = = Q0 e (11.341)
F F
No degeneración y no degeneración isoenergética. Tratemos de explorar las
consecuencias debidas a la dependencia lineal de las frecuencias sobre los movimientos
en una superficie de sección.7
6 Véase el apéndice A, en Chirikov, Op. cit.
7 Véase el texto de V. Arnold, Les méthodes mathématiques de la mécanique classique, Mir, Moscú,
1976.
530 / Mecánica clásica avanzada
Asumamos que hay una relación entre las frecuencias, para dos grados de libertad,
de la forma:
f (ω1 , ω2 ) = 0 (11.342)
Diferenciando hallamos de df = 0:
∂ω1 ∂ω2 ∂f
∂I1 ∂I1 ∂ω1
ω̃I f~ω = =0 (11.343)
∂ω ∂ω2 ∂f
1
∂I2 ∂I2 ∂ω2
Si f es de la forma:
f = m1 ω 1 + m2 ω 2 = 0 (11.344)
valores racionales como irracionales, de modo que en ciertos cı́rculos habrá puntos fijos
discretos y en otros no. Una y otra clase de cı́rculos forman un conjunto denso, pero
en casi todos los cı́rculos el ángulo de rotación no será un múltiplo racional de 2π. Si
ahora la aplicación es perturbada, como en (11.306), la propiedad de un cı́rculo con α
racional de tener puntos fijos debe desaparecer. La trayectoria sobre un toro resonante
no perturbado es cerrada y no llega sino a muy pocos puntos del mismo, pero al aplicar
una pequeña perturbación llenará todos los puntos del toro. En tanto que si el toro es no
resonante, una perturbación pequeña no ocasiona un cambio grande en las trayectorias
de fase y en la topologı́a misma del toro.
En una resonancia particular, ω1 /ω2 = r/s, la condición de no degeneración iso-
energética (11.346) se convierte en:
∂ 2 H0 ∂ 2 H0 ∂ 2 H0
r2 2 + s2 2 − 2rs 6= 0 (11.347)
∂I1 ∂I2 ∂I1 ∂I2
Esta condición a la vez es una condición de no linealidad del movimiento alrededor
de un punto fijo. Al analizar el movimiento cerca a una resonancia aislada encontramos
que es descrito por un hamiltoniano de la forma (11.253):
∂2H 0
∆H = 2 (∆I 1 )2 + 2λHr,s cos ϕ1 (11.348)
∂I 1
2
tomando a Hrs real. Si ∂ 2 H 0 /∂I = 0, entonces la no linealidad aparece solamente al
orden λ2 y el ancho de la separatriz no estará restringido a ser del orden de λ1/2 , según
(11.256). Entonces la condición de no linealidad es, de (11.255):
∂2H 0
G= 2 6= 0 (11.349)
∂I 1
2
Esta condición separa los sistemas con degeneración accidental (∂ 2 H 0 /∂I 6= 0) o
2
fuertemente no lineales, de los sistemas con degeneración intrı́nseca (∂ 2 H 0 /∂I = 0) o
débilmente no lineales. Para ver la equivalencia de (11.349) y (11.347), pasamos de las
variables (I 1 , I 2 ) a las (I1 , I2 ) mediante la transformación canónica (11.238) y (11.239):
∂2H 0 ∂ ∂H0 ∂I1 ∂H0 ∂I2
= . + . 6= 0 (11.350)
∂I12 ∂I 1 ∂I1 ∂I 1 ∂I2 ∂I 1
y como según (11.238), ∂I1 /∂I 1 = r y ∂I2 /∂I 1 = s, obtenemos inmediatamente a
(11.347). O sea que la condición de no degeneración isoenergética es a la vez una condi-
ción de no linealidad del movimiento en proximidades de una resonancia aislada.
toroides invariantes, o sea adherencias de las curvas de fase que son hélices cuasiperiódi-
cas con un número de frecuencias igual al número de grados de libertad. Tales toroides
son la mayorı́a en el sentido que la medida del complemento de su unión es del orden de
λ”. Las condiciones a ser satisfechas son:
(i) No linealidad suficiente. O sea que en cierto rango de valores de I~ las frecuencias
son independientes:
m.~ ~ 6= 0
~ ω(I) (11.351)
donde ω ~ = ∂H0 /∂ I~ y m
~ es un vector de componentes enteras.
(ii) La perturbación es función de clase C M , o sea que posee derivadas continuas
hasta de orden M .
(iii) El estado del sistema es lo suficientemente alejado de una resonancia para
satisfacer que:
|m
~ ·~ ~ −τ
ω| ≥ C|m| (11.352)
Entonces:
X
I1 (ϕ1 + 2πα) − I1 (ϕ1 ) = ak eik2πα − 1 eikϕ1 (11.355)
ω 1 /ω 2 = s
ω 1 /ω 2 = s + 1
m(p, q) = p + sq (11.362)
1/2
2λHqm
∆I 1 = 4 (11.363)
G
8 Condiciones de validez del teorema de K. A. M.: (i) Las curvas perturbadas son cercanas a las
curvas no perturbadas no resonantes. (ii) Las resonancias son lo suficientemente separadas, de acuerdo
con la condición de suavidad de la perturbación. (iii) En la figura 11.6b los intervalos rayados muestran
resonancias secundarias. La suavidad de la perturbación exige que las resonancias secundarias sean
aisladas.
Teorı́a de perturbaciones / 535
Las cuales serán continuas a condición de que Hqm sean lo suficientemente pequeñas
para q y m grandes.
Para que la serie converja, es necesario que para q y m grandes los términos se
comporten como 1/q 2 por lo menos, ya que m es lineal en q de acuerdo con (11.362).
Entonces las amplitudes de Fourier para q grandes han de comportarse como:
A
Hqm ≈ (11.368)
q M+2
con el fin de que λH1 sea de clase C M . Según (11.362) y la desigualdad p < q, hay q
coeficientes de Hqm con el mismo valor de q y diferentes valores de p. Estos coeficientes
corresponden a resonancias y son todos grandes y de magnitud comparable. Por tanto:
X 1/2
1/2
Hqm ≈ qHqm′ (11.369)
donde:
M
σ=ζ , ω1 = (λAG′ )1/2 (11.371)
2
536 / Mecánica clásica avanzada
Iy Circunferencia
K.A.M.
Curva estacionaria α > r/s
Circunferencia
α = r/s
Ix
Circunferencia
K.A.M.
α < r/s
s = 3, k = 1
Figura 11.7 La figura muestra una curva de K. A. M. (por fuera de la curva racional) que
se mueve en sentido contrario al del reloj, una curva racional que se mueve en sentido del
reloj y una curva sólida que no es de K. A. M.
Ahora mediante una aplicación que preserve el área llevamos los puntos de la curva
sólida radialmente a alguna curva rayada como lo muestra la figura 11.7. Las curvas con-
tinua y rayada deben encerrar la misma área. Esto es posible sólo si las curvas se cruzan
entre sı́ un número par de veces. Cada intersección cuando es iterada s veces retorna a
538 / Mecánica clásica avanzada
su posición inicial, es un punto fijo. De modo que para un número par de intersecciones,
debe haber 2ks de tales puntos, que son los puntos fijos de Poincaré-Birkhoff. El teorema
no da el valor de k, que en la figura se ha tomado k = 1. Los puntos son alternativamente
de naturaleza elı́ptica e hiperbólica. Los puntos con α 6= r/s cercanos a un punto elı́ptico
tienden a girar alrededor de él, en tanto que los puntos cercanos a un punto hiperbólico
mediante repetidas aplicaciones tienden a alejarse indefinidamente del punto fijo.
En la sección 11.7 mediante transformación a un sistema de coordenadas fijo en un
punto elı́ptico estudiamos el comportamiento de los puntos cercanos a él y encontramos
que tienen un movimiento pendular. Luego encontramos que las resonancias de orden
superior dan lugar a la aparición de nuevos puntos fijos en las cercanı́as del punto elı́pti-
co, alrededor de los cuales nuevamente se presentan oscilaciones pendulares de amplitud
mucho más pequeña, según (11.295) proporcional a (1/s)s+1/2 . Hasta aquı́ vemos un
cuadro lleno de curvas de K. A. M. de gran complejidad. Sin embargo, veremos que el
comportamiento estocástico no resulta de las resonancias de orden superior, sino que
puede ocurrir en resonancias de orden bajo como resultado de la bifurcación de las sepa-
ratrices. Hablando a grosso modo podemos decir que los punto elı́pticos están asociados
a la estructura de islas del espacio fásico y los puntos hiperbólicos al comportamiento
estocástico de la región entre toroides de K. A. M. En el apéndice 9 del libro de Arnold
hay una serie de proposiciones referentes a los puntos fijos de las aplicaciones canónicas.9
Curva
K.A.M.
x′′′
x′′
x′
Curva K.A.M.
Punto x Γ+
elíptico Γ–
Γ+
Γ–
Curva
K.A.M.
Curva
K.A.M.
Figura 11.8 Bifurcación de las separatrices Γ. Las lı́neas punteadas indican la separatriz del
sistema truncado integrable. Las lı́neas continuas indican la separatriz del sistema completo
no integrable.
teroclı́nicos. Todas esas trayectorias llenan densamente el espacio accesible a ellas, para
dos grados de libertad limitado por dos superficies de K. A. M. La intersección de las
trayectorias en puntos homoclı́nicos demuestra que un toroide de K. A. M. no puede
existir en tales puntos puesto que hay un drástico cambio de topologı́a. Cuando la per-
turbación aumenta, según el teorema de K. A. M., la medida de la región de toroides
disminuye y aumenta la de la región estocástica.
La magnitud de la bifurcación de las separatrices para λ pequeño es exponencial-
mente pequeña, razón por la cual pasa desapercibida en las diferentes formas de la teorı́a
de perturbaciones. Su sola existencia genera las divergencias que ocurren en las series
de perturbaciones. Si esas series fueran convergentes, el sistema no tendrı́a bifurcación
de las separatrices ni estados de movimiento irregular.
Wn+1 = Wn − W0 sen ϕn
32 (11.383)
ϕn+1 = ϕn + Q0 r ln
|Wn+1 |
Los puntos fijos de perı́odo 1, o sea de una sola iteración, están en:
32
Q0 r ln = 2πm (11.384)
|W1 |
o sea:
W1 = ±32e−2πm/(Q0r) , m : entero
(11.385)
ϕ1 = 0, π
Si llamamos x1 = (W1 , ϕ1 ) y T la aplicación, estos puntos satisfacen x1 = T x1 .
Linealizando alrededor de x1 obtenemos xn = x1 + ∆xn :
∆xn+1 = Ã ∆xn (11.386)
siendo à la matriz jacobiana de la aplicación:
∂W ∂W
n+1 n+1
∂Wn ∂ϕn
à = (11.387)
∂ϕn+1 ∂ϕn+1
∂Wn ∂ϕn
Para evaluar la estabilidad se requiere la traza de Ã:
W0
tr à = 2 + Q0 r cos ϕ (11.388)
W1
Para estabilidad se requiere que tr à < 2, de modo que para W1 > 0 los puntos
fijos con ϕ1 = 0 son todos inestables. Para ϕ1 = π hay estabilidad cuando:
Q0 r
W1 > Ws = W0 (11.389)
4
o sea:
2πrA 3 −πQ0 /2
W1 > Q0 e (11.390)
F
Teorı́a de perturbaciones / 543
Es de esperarse que el valor de Ws que marca el lı́mite entre los puntos con ϕ1 = π
estables e inestables represente un importante parámetro indicativo de estocasticidad
cuando W < Ws . La aplicación separatriz es de importancia para comprender el com-
portamiento caótico de los sistemas cuasi-integrables, pues las separatrices siempre ro-
dean las resonancias de esos sistemas. La aplicación separatriz, que describe el compor-
tamiento en las cercanı́as de la separatriz, claramente exhibe comportamiento caótico
para W → 0.
Ejercicio 11.8.1 Hallar los puntos fijos de perı́odo 1 y analizar la estabilidad de la apli-
cación de Fermi:
Un+1 = |Un + sen ϕn |
demasiado fuerte. Greene (1979)10 halló que aunque la pérdida de estabilidad lineal de
las islas de perı́odo 1 es una condición muy fuerte, tal criterio aplicado a islas de perı́odo
alto cercanas a una superficie de K. A. M. puede dar una mejor descripción. Este es un
criterio alterno al de Chirikov y más exacto en muchos casos.
Ejemplo 11.8.4 Analizar diferentes criterios de irregularidad global para la aplicación
estándar (11.318).
(a) Pérdida de estabilidad de los puntos fijos elı́pticos de perı́odo 1. Tales puntos
están en:
I1 = 2πm , m : entero ; ϕ1 = 0, 1 (11.393)
La matriz à es:
1 ±K
à = (11.394)
1 1±K
donde el signo más corresponde a ϕ1 = 0 y el menos a ϕ1 = π. La condición de estabi-
lidad:
|2 ± K| < 2 (11.395)
nos dice que el punto ϕ = 0 es siempre inestable. No hay puntos fijos elı́pticos de perı́odo
1 si:
K>4 (11.396)
(b) Sobreposición de separatrices de resonancias primarias. Es conveniente consi-
derar el hamiltoniano de la aplicación, obtenido en el ejemplo 11.8.1. Si asumimos que ϕ
varı́a lentamente con el tiempo, dϕ/dn ≪ 2π, entonces esperamos que en H1 , ecuación
(11.325), contribuirá sólo el término de variación más lenta, de modo que:
1 2
H= I + K cos ϕ + 2K cos ϕ cos 2πn (11.397)
2
La parte correspondiente a H0 , ecuación (11.324), describe un movimiento pendu-
lar, siendo la frecuencia de libración alrededor del punto elı́ptico ϕ = π:
√
ω0 = K (11.398)
El máximo desplazamiento de I es hallado de H0 tomando cos ϕ = 1 en I = 0, o
sea H0 = K. Entonces el valor máximo de I está en cos ϕ = −1:
√
∆Imáx = 2 K (11.399)
De acuerdo con (11.393), la distancia entre las resonancias primarias δI es igual a
2π, y por tanto la relación entre el ancho total de la separatriz y la distancia entre dos
resonancias consecutivas es:
2∆Imáx 4ω0
= (11.400)
δI 2π
10 Véaseel texto de Lichtenberg A. J. y M. A. Lieberman, Regular and stochastic motion, Springer-
Verlag, Nueva York, 1983.
Teorı́a de perturbaciones / 545
Realicemos una transformación canónica para obtener una variable angular rápida
y una lenta:
Iχ = rI χ ; Iϕ = I ϕ − sI χ
(11.408)
ϕ = rχ − sϕ ; χ=χ
Entonces:
1 2
H
+ = rI χ + I ϕ − sI χ
2
rχ − ϕ rχ − ϕ
+ K cos + 2K cos cos χ (11.409)
s s
Ahora ϕ es una variable angular lenta y podemos aplicar la teorı́a de perturbaciones
adiabáticas, sección 11.5, válida aquı́ por no haber divisores nulos.
Para buscar una expansión en potencias de K, al orden cero aplicamos (11.178):
1 2
H 0 = rI χ + I ϕ − sI χ (11.410)
2
Al primer orden promediamos la perturbación sobre la variable angular rápida χ:
H1 = 0 (11.411)
∂F (1)
2π = − cos(rχ − ϕ) − 2 cos(rχ − ϕ) cos χ (11.412)
∂χ
y por tanto:
1 1
−2πF (1) = sen (rχ − ϕ) + sen [(r − 1)χ − ϕ]
r r−1
(11.413)
1
+ sen [(r + 1)χ − ϕ]
r+1
y,
∂F (1) 1 1
2π = cos(rχ − ϕ) + cos[(r − 1)χ − ϕ]
∂χ r r−1
(11.414)
1
+ cos[(r + 1)χ − ϕ]
r+1
Para hallar a H 2 , aplicamos la fórmula (11.37) con los promedios tomados sobre
χ:
2 2 (1)
1 X X ∂ 2 H0 ∂F ∂F (1)
H2 = (11.415)
2 µ=1 ν=1 ∂I ν ∂I µ ∂ϕν ∂ϕµ
Teorı́a de perturbaciones / 547
Como en (11.341) A es H11 que para nuestro caso podemos tomar igual a F . De (11.421)
y (11.341) podemos obtener el parámetro de estocasticidad K en función de Q0 y W1 :
8πQ30 −πQ0 /2
K= e (11.423)
W1
donde K está asociado al ancho de las separatrices de las “islas” de segundo orden. Tal
ancho, según (11.420), está descrito por W , o sea por W1 en (11.423), que según (11.422)
puede expresarse en función de K:
2
√
W1 = 4(2π)4 K −5/2 e−π / K
(11.424)
√
De (11.399) se sigue que el valor de I en la separatriz es I0 = 2 K. La energı́a del
lı́mite exterior de la capa estocástica cercana a la separatriz es igual a la energı́a de la
separatriz, K, más el ancho de la capa, dado según (11.420) por ∆E = W F , o sea que:
K + ∆E = K(1 + W1 ) (11.425)
es la energı́a del lı́mite exterior de la capa estocástica. Como E = I 2 /2 + K cos ϕ para
el péndulo, en ϕ = π es igual a I 2 /2 − K, encontramos que:
1 2
I − K = K(1 + W1 ) , I 2 = 2K(2 + W1 ) (11.426)
2
y como W ≪ 1:
√ W1
I =2 K 1+ (11.427)
4
De modo que el ancho de la separatriz respecto a la acción es:
1 √
∆Is = I − I0 = W1 K (11.428)
2
Si sumamos este ancho en (11.418) obtenemos un criterio de sobreposición mejo-
rado:
h 2
√ i √ K
1 + (2π)4 K −5/2 e−π / K 2 K + =π (11.429)
2
del cual se obtiene el valor:
K ≈ 1, 2 (11.430)
que coincide un poco más con el valor experimental K ≈ 0, 99.
12
1 Traducido al inglés por B. L. van der Waerden en Sources of quantum mechanics, Dover, Nueva
York, 1968.
2 Reproducido por van der Waerden, Op. cit.
549
550 / Mecánica clásica avanzada
Por ser f real, se cumple que fα~⋆−~α′ (I) = fα~ ′ −~α (I). La suma sobre α
~ en (12.2)
puede ser divergente, lo cual ha de tenerse en cuenta en los desarrollos que siguen. Esto
corresponde con las dificultades de normalización de las ondas planas en la mecánica
cuántica.
Si formamos el producto de dos variables dinámicas, sus coeficientes de Fourier
dependen de los coeficientes de Fourier de cada variable, ası́:
X
(f g)β−
~ β~ ′ (I) = fβ−~
~ α (I)gα ~ ′ (I)
~ −β (12.3)
α
~
La convergencia de la expansión (12.1) exige que los coeficientes para ~n altos sean
pequeños, por tanto sólo son de interés los ~n bajos. Por otra parte, si ∆I es pequeño,
~ en I~ = α
siempre los α ~ ∆I serán grandes, es decir que |~n| es del orden de la unidad y:
|~n| ≪ |~
α| (12.4)
∂fα~ −~α′
fα~⋆′ ,~α = fα~⋆′ −~α (~
α′ ∆I) = fα~ ,~α′ + (~
α′ − α
~) · ∆I (12.7)
∂ I~
es aproximadamente autoadjunta. Como α ~ ′ pueden recorrer todos los vectores de
~ y α
componentes enteras resulta que las fα~ ,~α son matrices infinitas.
′
1 ∂ −i~α·ϕ~
− e ~ e−i~α·ϕ~
=α (12.10)
i ∂ϕ
~
Ciertamente hay algunas dificultades en la definición de las variables acción-ángulo
en mecánica cuántica, analizadas en el artı́culo de Augustı́n y Rabitz (1979).4
En la sección §48 del libro de mecánica cuántica de Landau-Lifshitz (ver biblio-
grafı́a) está demostrada la correspondencia entre los elementos de matriz de un operador
cuántico y los coeficientes de Fourier de la correspondiente variable dinámica clásica.
No tenemos hasta ahora ninguna justificación para relacionar la matriz clásica
fα~ ,~α′ con transiciones entre estados cuantizados descritos por α ~ yα~ ′ . El ejemplo 10.5.2
sobre radiación dipolar da una evidencia de la asociación entre emisión de radiación y
transiciones en mecánica clásica.
función generatriz G3 (I, ~ϕ), las variables angulares y de acción se deben transformar
como ϕ ~ = −∂G3 (I, ϕ)/∂ I, ~ I~ = −∂G3 (I, ϕ)/∂ ϕ,
~ las funciones e−i~α·ϕ~ como:
X ′ ~
e−i~α·ϕ~ = gα~ ,~α′ (I)e−i~α ·ϕ (12.11)
α
~′
donde g + ⋆
~ α (I) = gα ~ (I).
~ ,β
β,~
Podemos tomar los resultados de la sección 11.3, referentes a los cambios de sis-
temas de variables acción-ángulo. Para sistemas no degenerados, las fórmulas (11.84) y
(11.85) de tal sección establecen que:
l
X l
X
∂
ϕν = nνµ ϕµ − ψ(I) ; Iν = nµν Iµ (12.13)
µ=1
∂I ν µ=1
l
X
ϕτ = nτ σ ϕσ + ψτ (ϕσ , I) (12.16)
ν=s+1
l
X X σ σ
Iτ = nντ Iτ − i C~nσ (I) nτ ei~n ·ϕ~
ν=1 nσ
~
α ~ = αβ nβν ϕν + ατ nτ σ ϕσ + αν ψν (ϕσ , I)
~ ·ϕ (12.17)
Corespondencia con la mecánica cuántica de Heisenberg / 553
y por tanto:
X
h+
~σ hα~ σ ,β~ ′ σ = δβ~σ ,β~ ′ σ (12.21)
ασ
β ,~
~σ
α
~ ~ (12.22)
kα~ ,~α′ gα~ ′ ,β~ = e−i~α·(δk +ñk δg ) δβ,~
~ αñk ñg
Como puede verse, las matrices unitarias que describen las transformaciones canóni-
cas satisfacen una álgebra no conmutativa.
Aquı́ estamos considerando solamente transformaciones canónicas entre diferentes
conjuntos de variables acción-ángulo, que cambian expansiones de Fourier en expansio-
nes de Fourier. Es claro que al pasar a variables canónicas que no sean de acción-ángulo
una expansión de Fourier se cambia por una expansión en otro conjunto de funciones
ortogonales igualmente válida; en la formulación de la mecánica cuántica este trabajo
fue hecho por Born, Jordan y Heisenberg entre septiembre y noviembre de 1925.
f β,
~β
~
~ ′ = f 0 (β ∆I) δβ,
~β ~′ (12.25)
554 / Mecánica clásica avanzada
Esta expansión se satisface sólo si f 0 (I) son las raı́ces de la ecuación secular:
det fα~ ,~α′ − f 0 (~
α ∆I) δα~ ,~α′ = 0 (12.27)
En conclusión, encontrar las variables acción-ángulo en las cuales una variable
dinámica no dependa de las variables angulares equivale a diagonalizar la matriz clásica
formada con los coeficientes de Fourier. Los vectores propios de la matriz son a su
vez los elementos de la matriz de la transformación unitaria g que conecta las dos
representaciones:
X
fα~ ,~α′ gα~ ′ ,β~ (I) = f 0 (I) gα~ ,β~ (I) (12.28)
α
~′
Esta matriz es autoadjunta sin aproximaciones. Los valores propios son los dife-
rentes valores de la energı́a del oscilador armónico. Por ser H positivo, resulta que:
Además por ser ∆I pequeño, los valores propios de H son muy próximos entre sı́,
formando un continuo en el lı́mite ∆I → 0.
Cambiando a ~l por β
~−β ~ ′ y a ~n por β~ − α ~ , se sigue:
X
∂gα~ −β~ ′ ∂fα~ −β~ ′
[f, g]β−
~ β~′ = i(β~ − α
~ ) · f ~ α − g ~ α (12.40)
β−~ β−~
α
~
∂ I~ ∂ I~
−i ˜
[f, g]β,
~β ~′ = (f g̃ − g̃f˜)β−
~ β~′ (12.43)
∆I
Vemos que la matriz del corchete de Poisson de dos variables dinámicas puede
expresarse como el conmutador de las correspondientes matrices clásicas, multiplicado
por −i/∆I:
gg] = −i ˜
[f, (f g̃ − g̃ f˜) (12.44)
∆I
En conclusión, en la mecánica clásica es posible asociar a las variables dinámicas
un álgebra no conmutativa que coincide con el álgebra de los corchetes de Poisson.
Ejemplo 12.2.1 Evaluar directamente el conmutador de q y p, y el corchete de Poisson,
para un oscilador armónico.
Corespondencia con la mecánica cuántica de Heisenberg / 557
De (12.30) se sigue:
X i ∆I p
qβ,α pα,β ′ = β (12.45)
α
2
h p p p p i
× − β ′ + 1 δβ,β ′ +2 + β ′ + 1 − β ′ − 1 δβ,β ′ + β ′ − 1 δβ,β ′ −2
con una expresión análoga al permutar a p con q. El valor del conmutador es:
X
(qβ,α pα,β ′ − pβ,α qα,β ′ ) =
α
p p p
i ∆I β β + 1 − β − 1 δβ,β ′ ≈ i ∆I δβ,β ′ (12.46)
donde los elementos de la matriz x̃ y las frecuencias ωα,β son cantidades a determinar.
La condición adicional (12.58) nos da:
X
2m ωα,α′ |xα,α′ |2 = h̄ (12.62)
α′
h̄ωα,β = Eα − Eβ (12.64)
5 Véase, van der Waerden, Op. cit.
560 / Mecánica clásica avanzada
siendo Eα y Eβ las energı́as de los estados α y β. Esta ecuación nos dice que para cada
α debe existir al menos un β ′ para el cual xα,β ′ 6=0 . Para este β ′ , (12.63) nos dice que
necesariamente:
(Eα − Eβ ′ )2 = h̄2 ω02 (12.65)
Esta es una ecuación cuadrática en Eβ ′ , con las soluciones:
Eβ ′ = Eα ± h̄ω0 (12.66)
lo cual nos indica que hay dos β ′ para los cuales xα,β ′ 6= 0, que llamaremos β ′ y β ′′ .
Para éstos dos β ′ las frecuencias satisfacen la relación:
ωα,β ′ = −ωα,β ′′ (12.67)
Entonces (12.62) nos dice que:
2mωα,β ′ |xα,β ′ |2 − |xα,β ′′ |2 = h̄ (12.68)
1X |Aα~ ,β~ |2
H (2) (~
α ∆I) = − (~ ~ · ∂
α − β) (12.103)
2
~
∂ I~ (~
α − β)~ · ~ω
β6=α
~
donde Aα~ ,β~ está dada por el coeficiente de Fourier de la expansión de H1 en las variables
acción-ángulo no perturbadas. Tanto ω ~ como A ~ tienen como argumento a I~ = α
α
~ ,β ~ ∆I.
Como en (12.41), podemos escribir:
∆I |Aα~ ,β~ |2
(~ ~ · ∂
α − β) =
2 ∂ I~ (~
α − β)~ ·ω ~
|Aα~ ,β~ |2 |Aα~ ,β~ |2
− (12.104)
(~α − β) ~ · ~ω (~
α − ~ · ~ω
β)
α
~ ∆I (~ ~ ∆I/2
α+β)
cometemos un error del orden de |(~ ~ ∆I|2 en la expresión para H (2) , con lo cual
α − β)
llegamos a la fórmula:
X |Aα~ ,β~ |2
H (2) (~
α ∆I) = (12.106)
~ =α ∆I α
~ ·ω α ∆I) − ∆I β~ · ~ω(β
~ (~ ~ ∆I)
β6 ~
Si llamamos:
α
~ ∆I · ~
ω (~
α ∆I) = Eα~ ′ (12.107)
La ecuación (12.103) puede escribirse con un error del orden de |(~ ~ ∆I|2 como:
α − β)
X |Aα~ ,β~ |2
H (2) (~
α ∆I) = ′
(12.108)
Eα~ − Eβ~
~
β
siendo n el ı́ndice de refracción del medio en el punto ~r. El principio de mı́nima acción
aplicado a una partı́cula sometida a un potencial V , ecuación (9.49), expresa que:
Z
[E − V (~r)]1/2 dl (13.2)
567
568 / Mecánica clásica avanzada
tiene un valor estacionario para la trayectoria real. En los dos casos se deben tomar va-
riaciones “∆”. La trayectoria de una partı́cula y la de un rayo de luz coinciden haciendo:
n(~r) = A [E − V (~r)]1/2 (13.3)
En un medio inhomogéneo y anisotrópico n depende no sólo de la posición sino de
la dirección de los rayos, esto es, de ~r y ~r˙ .
Lo anterior permitirı́a asociar propiedades corpusculares a la luz. Hamilton se pro-
puso elaborar esta conexión dentro de un modelo ondulatorio de la luz teniendo en cuenta
que la relación (13.3) es válida independientemente del modelo usado. Es natural partir
del concepto de “frente de ondas”, introducido por Huygens en 1690. Cada punto ~r de
un frente de ondas en el tiempo t genera una onda secundaria que alcanzará otro punto
~r ′ del frente de ondas en un tiempo posterior t′ . El tiempo empleado por la luz en ir de
~r a ~r ′ dependerá solamente de ~r y ~r ′ . El lugar geométrico de los puntos alcanzados por
la luz en el tiempo t′ es una superficie de ondas secundarias, definida por una función
Σ(~r, ~r ′ ), donde ~r hace de parámetro, mediante la fórmula:
Σ(~r, ~r ′ ) = t − t′ (13.4)
Σ describe el camino óptico entre ~r y ~r ′ y fue llamada por Hamilton función carac-
terı́stica del medio. Según el principio de Huygens, la envolvente de las ondas secundarias
en el tiempo t′ es el frente S ′ que se ha propagado en el espacio, como se ilustra en la
figura 13.1.
N
α′′
α′ r″ T
α r′
Σ′
r
Σ
S″
S′
S
Las ecuaciones (13.4) y (13.7) a (13.9) permiten expresar las seis cantidades (x′ ,
y , z , α′1 , α′2 , α′3 ) en términos de (x, y, z, α1 , α2 , α3 ).
′ ′
Entonces, dada una función caracterı́stica del medio Σ, las seis ecuaciones (13.4)
y (13.7) a (13.9) describen unı́vocamente la lı́nea de las normales N en el medio óptico
anisotrópico. Es necesario aclarar que la lı́nea N no necesariamente coincide con la lı́nea
T de un rayo luminoso que pasa por ~r; esta coincidencia ocurre solamente en un medio
óptico isotrópico, en el cual los vectores ~r˙ , ~r˙ ′ , ~r˙ ′′ , ... son respectivamente paralelos a los
vectores α ~, α~ ′, α~ ′′ , ...
La función Σ determina una transformación en el espacio que cambia cualquier
superficie S en una nueva S ′ . Si dos superficies Σ y S ′ se tocan en un punto ~r ′ , entonces
las correspondientes superficies transformadas Σ′ y S ′′ se tocan en un punto ~r ′′ corres-
pondiente a ~r ′ . Sophus Lie por esta razón llama a las transformaciones (~r, α ~ ) → (~r ′ , α
~ ′)
1
transformaciones de contacto. Entonces cada función Σ define una transformación de
contacto, que transforma un frente de ondas S en el frente de ondas S ′ envolvente de
todas las ondas secundarias emergentes de S, en el intervalo de tiempo t′ − t. De (13.7)
y (13.8) se sigue que:
∂Σ(~r, ~r ′ ) ∂Σ(~r, ~r ′ )
= λ~
α; = λ′ α
~′ (13.10)
∂~r ∂~r ′
1 En
dinámica hamiltoniana se usa el nombre de transformaciones canónicas para designar a estas
transformaciones.
570 / Mecánica clásica avanzada
La longitud del camino óptico entre ~r y ~r ′ también puede escribirse, usando (13.15)
y (13.16), como:
Z ~r ′ Z ′
′ n 1 ~r
Σ(~r, ~r ) = α
~ · d~r = n dl (13.23)
~
r c c ~r
Entonces, el principio de Fermat, (13.1), equivale a la condición de que Σ sea una
extremal. La condición ∆Σ = 0 determina la forma de la lı́nea de los rayos T de la figura
13.1.
Comparando a (13.23) con (13.2) vemos que M es proporcional a la energı́a cinética
del problema mecánico equivalente.
La transformación de contacto (13.10), cuya función generatriz es Σ, puede expre-
sarse como una transformación canónica libre de primera clase:
∂Σ(~r, ~r ′ ) ∂Σ(~r, ~r ′ )
p~ = − ; ~′ =
p (13.24)
∂~r ∂~r ′
donde (~r ′ , p~ ′ ) son las “viejas” variables canónicas y (~r, p~) las “nuevas”.
Comparando con los resultados de la sección 9.3, fórmula (9.44), encontramos que
Σ coincide formalmente con la acción de Lagrange y M con ~p · ~q. Sin embargo hay una
discrepancia dimensional a través de un factor constante B con dimensiones de energı́a.
O sea que BΣ es la acción de Lagrange y B~ p es el momento mecánico.
La acción de Lagrange BΣ obedece la ecuación de Hamilton-Jacobi independiente
del tiempo, que para una partı́cula de masa m en un potencial V es:
2
1 ∂Σ V E
+ 2 = 2 (13.25)
2m ∂~r B B
Usando la conexión dada por (13.3), podemos escribir a (13.25) como:
2
∂Σ 2m 1
= 2 2 n2 = 2 n2 (13.26)
∂~r A B c
donde c es una constante con dimensiones de velocidad:
AB
c= (13.27)
(2m)1/2
572 / Mecánica clásica avanzada
C = aeiϕ (13.29)
donde ϕ es la eiconal que obedece la ecuación (13.26) sólo en el lı́mite de ondas cortas.
Desarrollando a ϕ en potencias de ~r y t, para ~r y t pequeños se obtiene:
∂ϕ ∂ϕ
ϕ=α+t + ~r · (13.30)
∂t ∂~r
Como es de esperarse, el frente de ondas emergente de un punto es en las cercanı́as
del mismo casi plano, con:
~k = ∂ϕ ; ω=−
∂ϕ
(13.31)
∂~r ∂t
Por otra parte, expandiendo a S cerca a ~r = 0 obtenemos:
∂Σ
S = −Et + BΣ ≈ −Et + B~r · = −Et + B~r · p~ (13.32)
∂~r
Si admitimos que S = Dϕ, donde D es otra constante, encontramos que p~ es
proporcional a ~k y E proporcional a ω:
D~
E = Dω ; p
~= k (13.33)
B
La función M , según (13.19) puede escribirse como:
n(~r, α
~)
M (~r, ~r˙ ) = ~ · ~r˙
α (13.34)
c
2 Eiconal viene del griego, icono = imagen. La función eiconal permite localizar imágenes.
Corespondencia con la mecánica cuántica de Schrödinger / 573
y se denomina la indicatriz del medio óptico en el punto ~r. La velocidad del frente de
ondas en el punto ~r en la dirección α
~ tiene magnitud v(~r, α
~ ) = c/n(~r, α
~ ). Por tanto:
~ · ~r˙
α α
~ ~v (~r, α
~)
M (~r, ~r˙ ) = ; p~ = = (13.35)
v(~r, α
~) v(~r, α
~) v(~r, α~ )2
Por esto el vector p~, que es proporcional a ~k cuando la onda es plana monocromáti-
ca, se llama el vector de lentitud normal del frente de ondas en el punto ~r en la dirección
α
~.
Los vectores ~r˙ y ~p. Exploremos la relación entre los vectores ~r y α ~ en un punto
dado ~r. Para ello usamos la noción matemática de homotecia, o sea la transformación de
cambio de escala. Si realizamos a la superficie M (~r, ~r˙ ) una transformación de homotecia
con parámetro ǫ respecto a ~r˙ , en un punto ~r, obtenemos:
M (~r, ǫ~r˙ ) = ǫ~
p · ~r˙ (13.36)
Punto
de tangencia
p
r
Σ(r, r ′) Plano tangente
a la indicatriz en r
M(r, r ′)
S(t) S(t + ε)
Una posible solución de (13.41) es una función arbitraria de las variables de acción.
Sin embargo no es la más interesante.
obtenemos:
∂ϕθ l ∂ϕϕ
= ; =1 (13.58)
∂θ pθ ∂ϕ
De donde obtenemos finalmente:
mk 1
Q(~r) = (1 − ǫ2 )1/2 2 (13.59)
(2π)3 a r sen θ pr pθ
Esta es la densidad de probabilidad para un ensamble de sistemas con los mismos
valores de E, l, lz , donde cada sistema posee un valor distinto de las ϕν . La región
descrita por Q(~r) se obtiene también a partir de una órbita individual mediante estas tres
operaciones: primero, dejando la órbita fija se toma el conjunto de todas las posiciones
de la partı́cula sobre la misma; segundo, dejando fijo el plano de la órbita, se toma el
conjunto de puntos del plano obtenido al rotar el anterior conjunto alrededor del foco,
obteniéndose ası́ una corona sobre el plano de la órbita; finalmente, se toma el conjunto de
puntos del espacio obtenido al rotar la corona alrededor del eje z. La región ası́ obtenida
resulta ser un elipsoide de revolución con ejes de longitudes rmáx y rmáx cos θmı́n , colocado
con el eje menor sobre el eje z, y que además posee en el centro un agujero elipsoidal con
ejes de longitudes rmı́n y rmı́n cos θmı́n . Q(~r) vale cero fuera del elipsoide y dentro del
agujero, es infinita sobre las superficies de los elipsoides, y en los demás puntos está dada
por (13.59). Nótese que los elipsoides interior y exterior son las superficies cáusticas. La
región que hemos descrito es, para el caso del átomo de hidrógeno, el lı́mite clásico de la
densidad de probabilidad cuántica |ψnlm |2 . Vemos que no presenta los nodos angulares
caracterı́sticos de |Ylm |2 , ni los nodos de la densidad de probabilidad radial Rnl 2
(r).
Además, la densidad de probabilidad cuántica no es cero para r mayor que rmáx ni para
r menor que rmı́n , aunque decae exponencialmente en estas regiones, y tampoco presenta
superficies cáusticas.
En este caso rmı́n = 0, las órbitas son rectilı́neas y la intersección del toroide
invariante con el espacio de configuración es una esfera. Q(r) es cero para r > 2a,
infinito en r = 0 y r = 2a, y en los demás puntos está dada por:
1
Q(r) = (13.60)
(2π)2 ar(2ar − r2 )1/2
Esta expresión no se obtiene directamente de (13.59) porque para l = 0, pθ no
está definido. En (13.53), ∂ϕθ /∂θ es indeterminada pero hemos asumido que es una
constante que se halla por normalización.
Q(r) es isotrópica y corresponde a los estados s de la mecánica cuántica. Q(r)
diverge en r = 0 y r = 2a, que son los puntos de retorno, y tiene un mı́nimo en
r = 3a/2. El valor medio de r calculado con esta Q es 3a/2 y coincide exactamente con
el valor medio cuántico. Si bien en este caso no se cumplen las condiciones de validez de la
aproximación clásica,3 el problema ilustra la correspondencia entre las dos descripciones.
3 Véase la sección 49 del libro de Mecánica cuántica de Landau-Lifshitz, Op. cit.
578 / Mecánica clásica avanzada
1 2πϕ21s
2πQr
1 2
2
Figura 13.3 Función de distribución 2πQ(r) en el caso lz = l = 0 y densidad cuántica 2πψ1s
para el átomo de hidrógeno
1 1
Qp (p) = (13.61)
2π 2 p2 (1 + p2 )2
Ejemplo 13.2.3 Demostrar que la función de distribución Q(r) definida por (13.51) sa-
tisface la ecuación de continuidad (13.46).
En este caso Q no depende explı́citamente del tiempo. El jacobiano está dado por:
ϕ~ ∂ϕλ ∂ϕσ ∂ϕρ
J = ǫλσρ (13.63)
~r ∂x ∂y ∂z
4 Véase la sección 36 del libro de Landau-Lifshitz, Op. cit.
Corespondencia con la mecánica cuántica de Schrödinger / 579
donde ǫλσρ es el tensor de Levi-Civita. Por otra parte la velocidad tiene la expresión:
X ∂~r
~r˙ = ωµ (13.64)
µ
∂ϕµ
Recordando que:
~ ~r)
∂Σ(I,
ϕν = (13.68)
∂Iν
se sigue de (13.63) que:
∂2Σ ∂2Σ ∂2Σ
(2π)3 Q(~r) = ǫλσρ (13.69)
∂x∂Iλ ∂y∂Iσ ∂z∂Iρ
~ ~r),
Se sigue entonces que a cada solución de la ecuación de Hamilton-Jacobi, Σ(I,
le corresponde una función de distribución. No es necesario resolver por separado la
ecuación de continuidad en el espacio de configuración. En otras palabras, los campos
~ ~r) y Q(I,
Σ(I, ~ ~r) no son independientes. En mecánica cuántica esto implicarı́a que la
función de onda compleja queda determinada simplemente por una función real.
teorema K.A.M. dice que en este caso, aun si la perturbación es muy pequeña, los toroi-
des invariantes pueden cambiar drásticamente en su topologı́a; para la mayor parte de las
condiciones iniciales las trayectorias son estocásticas o sea que no están colocadas sobre
regiones de geometrı́a definida en el espacio fásico. Para el problema de fuerzas centrales
en coordenadas esféricas, además de Ir , Iθ e Iϕ hay una constante de movimiento adicio-
nal ϕθ − ϕϕ (y en el problema de Kepler además ϕr − ϕθ es constante). Cuando se aplica
una perturbación las constantes que dependen sólo de variables angulares pasan a ser
veriables angulares de frecuencia lenta dando lugar a que la trayectoria no sea cerrada
sino que ocupe toda la región definida por las variables de acción constantes. Entonces
es de esperarse que a causa de los efectos cuánticos, en un sistema degenerado se cumpla
también la igualdad (13.70).
~ t) = Σ(~r, C)
S(~r, C, ~ − Et (13.71)
dl
u= (13.72)
dt
5 Esta correspondencia tiene implicaciones en las teorı́as gauge de la fı́sica de partı́cu-
las elementales. Véase L.A. Sánchez, J. Mahecha, Rev. Mex. Fis. 49(2003)364. También
http://xxx.lanl.gov/abs/hep-th/0308160
Corespondencia con la mecánica cuántica de Schrödinger / 581
Por tanto la velocidad de los puntos del frente S para una partı́cula es:
E E
u= 1/2
= (13.76)
(2mT ) p
La relación E = pu, donde p es el momento lineal de la partı́cula y u la velocidad
del frente S, es análoga a E = pc en el caso de los fotones. u = E/mv es pequeña
cuando v es grande y viceversa, y resulta ser proporcional a la magnitud del vector de
lentitud normal análogo al de la óptica geométrica. u es llamada la velocidad de fase y
v = p/m es la velocidad de la partı́cula (llamada en mecánica ondulatoria la velocidad
de grupo). Cuando la velocidad de las partı́culas es pequeña, las superficies S se mueven
rápidamente y cuando las partı́culas se mueven rápidamente, la velocidad de los frentes
~ t) puede considerarse como un campo o fluido, definido en toda
es pequeña. S(~r, C,
la región del espacio de configuración accesible a la partı́cula. Cuando el potencial no
depende de la velocidad, las curvas caracterı́sticas en el espacio de configuración son
ortogonales a las superficies S. Al moverse las partı́culas el campo S se propaga con
velocidad u(~r) en cada punto. A su vez las partı́culas mismas caracterizan otro campo,
~ con un flujo de velocidad en cada punto dado por ~r˙ .
el de las densidades Q(~r, C),
Ejemplo 13.3.1 Hallar las velocidades u y v para un oscilador armónico lineal y analizar
los campos Q y S.
Las velocidades de los frentes S y de las partı́culas son respectivamente:
1 ωA 1 ωA
u=± = (13.77)
2 x2
1/2 2 cos(ωt)
1− 2
A
1/2
x2
v = ±Aω 1 − 2 = ωA cos(ωt) (13.78)
A
Vemos que v varı́a entre −Aω y +Aω, en tanto que u varı́a entre −∞ y −ωA/2 y
entre ωA/2 e ∞.
582 / Mecánica clásica avanzada
y µ
ωA
1 ωA
2
t
0
T/4 T/2 3T/4 T
Vemos que en los puntos de retorno x = ±A los frentes S “rebotan” con velocidad
muy grande; además la densidad de los frentes S es mayor donde u es baja y es cero
donde u es infinita. O sea, los frentes son densos donde la densidad de las partı́culas es
pequeña y viceversa (véase figura 13.4).
Para este problema, de (13.51) se sigue que Q vale:
1 1 ω
Q= = (13.79)
2πA x
2 1/2 2π|v|
1− 2
A
donde los γν son los diferentes contornos. Brillouin en 1926 esbozó una teorı́a de las fun-
ciones de onda semiclásicas que conduce a reglas de cuantización como la del oscilador
armónico, I = (k + 1/2)h̄, basada en consideraciones sobre los puntos de retorno del
movimiento clásico. Keller en 1958 y Maslov en 1972 elaboraron una teorı́a completa
acerca de las funciones de onda semiclásicas y las reglas de cuantización que genera-
liza los trabajos de Bohr, Sommerfeld, Einstein y Brillouin. En la actualidad muchos
problemas especı́ficos en fı́sica atómica y molecular son adecuadamente estudiados me-
diante estas teorı́as semiclásicas, denominadas genéricamente “la aproximación W.K.B”.
p2
x
x1 x2
p1
En la trayectoria hay dos puntos en los cuales p se anula y cambia de signo que
son x1 y x2 .
Tanto p como Σ son funciones bivaluadas de x. Los dos valores de p o Σ para cada
valor de x están sobre diferentes “hojas”, análogas a las hojas de Riemann de la teorı́a
de las funciones de variable compleja, definidas por la lı́nea de ramificación x1 x2 . Para
p las dos hojas son x1 p2 x2 y x1 p1 x2 . En x1 y x2 , p es singular por ser dp/dx infinita.
Similarmente, en la representación de momentos p1 p2 definen una lı́nea de ramificación
que separa el plano xp en las hojas p1 x1 p2 y p1 x2 p2 . La correspondiente acción reducida
es Σ(p), conectada con Σ(x) mediante la fórmula (9.217):
Σ(p) = Σ(x) − xp (13.102)
Corespondencia con la mecánica cuántica de Schrödinger / 587
Para un valor dado de E, Σ(x) define parte de la trayectoria de fases, formada por
los puntos (x, dΣ/dx). Pero Σ puede usarse sólo para la trayectoria sobre una hoja, ya
que la ecuación de Hamilton-Jacobi no determina a Σ en x1 y x2 . Para pasar a la otra
hoja es necesario continuar la función. En efecto, Σ(p) está bien definida en los puntos x1
y x2 sobre dos hojas, p1 x1 p2 y p1 x2 p2 . Esto permite la extensión analı́tica de Σ(x) de una
hoja a la otra usando la ecuación (13.102). La continuación a lo largo de la trayectoria
puede lograrse, pues, por transformaciones sucesivas entre las representaciones x y p.
Podemos definir las funciones multivaluadas Σ y Σ en términos de funciones univaluadas
ası́:
Σ1 (x) en x1 p2 x2
Σ(x) =
Σ2 (x) en x1 p1 x2
(13.103)
Σ1 (p) en p1 x1 p2
Σ(p) =
Σ2 (p) en p1 x2 p2
Para el caso descrito por (13.101), sobre las dos ramas Q difiere sólo en el signo
[véase por ejemplo la expresión (13.81)].
588 / Mecánica clásica avanzada
1/2 Z x0
mω [2m(E − V )]1/2 dx π
ψ2 (x) = exp −i −i (13.124)
2π|p| x2 h̄ 2
1/2 Z x1
mω [2m(V − E)]1/2 dx
ψ3 (x) = exp − (13.125)
2π|p| x h̄
1/2 Z x
mω [2m(V − E)]1/2 dx
ψ4 (x) = exp − (13.126)
2π|p| x2 h̄
√
Se han introducido los factores 1/ 2 pues al ampliar el rango de x desde −∞ hasta
+∞ se cambia la normalización.
Cuando la función de onda en un intervalo dado es multiforme, debe tomarse
la suma aritmética de las funciones de onda asociadas a las diferentes hojas. En el
presente caso, la región x1 < x < x2 tiene dos hojas y la función correcta es ψ1 + ψ2 . Si
Corespondencia con la mecánica cuántica de Schrödinger / 591
multiplicamos las cuatro funciones (13.123) a (13.126) por eiπ/4 , las fases relativas no
cambian. Entonces:
1/2 Z x
mω [2m(E −V )]1/2 dx π
cos + ; x1 < x < x2
π|p| x2 h̄ 4
1/2 Z x1
mω [2m(V −E)]1/2 dx iπ
ψ(x) = exp − + ; −∞ < x < x1 (13.127)
2π|p| h̄ 4
x
1/2 Z x
mω [2m(V −E)]1/2 dx iπ
exp − + ; x2 < x < ∞
2π|p| x2 h̄ 4
este es el resultado usual de la aproximación W.K.B.
592 / Mecánica clásica avanzada
Bibliografı́a
Textos generales de mecánica clásica
2. Corben H. C. y Stehle P. Classical mechanics. 2nd ed. J. Wiley, New York, 1960.
8. Marion J. Classical dynamics of particles and systems. Academic Press, New York,
1970.
9. Pars, L.A. A treatise on analytical dynamics. John Wiley, New York, 1968.
10. Scheck F. Mechanics: from Newton’s laws to deterministics chaos. Springer, Ber-
lin, 1995.
12. Whittaker E. T. A treatise on the analytical dynamics of particles and rigid bo-
dies. 4th ed. Cambridge University. Press, Cambridge, 1960.
593
594 / Mecánica clásica avanzada
Colecciones de problemas
16. Born M. The mechanics of the atom. 2nd printing. Ungar, New York, 1967.
Textos de matemáticas
1969.
30. Gutzwiller M.C. Chaos in classical and quantum mechanics. Springer, New York,
1990.
33. Van der Waerden B. L. (ed). Sources of quantum mechanics. Dover, New York,
1968.
Monografı́as especializadas
598
Índice alfabético / 599