Jorge Mahecha-Mecanica Clasica Avanzada-Editorial Universidad de Antioquia (2006) PDF

Jorge Mahecha Gómez Mecánica clásica avanzada
Mahecha Gómez, Jorge

Mecánica clásica avanzada / Jorge Mahecha Gómez. –
Medellı́n : Editorial Universidad de Antioquia, 2006.
xiv, 608 p. : il., diagrs. ; 24 cm.
Incluye bibliografı́a e ı́ndice.
ISBN: 958-655-847-9
1. Mecánica 2. Estática 3. Cinemática 4. Dinámica
I. Tı́t.
531 cd 19 ed.
A1072576
CEP-Banco de la República-Biblioteca Luis-Ángel Arango

Mecánica clásica avanzada
Jorge Mahecha Gómez
Ciencia y Tecnologı́a
Editorial Universidad de Antioquia
Colección Ciencia y Tecnologı́a
c Jorge Mahecha Gómez
c Editorial Universidad de Antioquia
ISBN: 958-655-847-9
Primera edición: enero de 2006

Diseño de cubierta: Erledy Arana Grajales, Imprenta Universidad de Antioquia
Diagramación: Patricia Arredondo
Corrección de textos: Arley Cárdenas
Coordinación editorial: Gonzalo Montoya Velásquez
Impresión y terminación: Imprenta Universidad de Antioquia
Impreso y hecho en Colombia / Printed and made in Colombia

Prohibida la reproducción total o parcial, por cualquier medio o con cualquier
propósito, sin autorización escrita de la Editorial Universidad de Antioquia
Editorial Universidad de Antioquia

Teléfono: (574) 210 50 10. Telefax: (574) 263 82 82
E-mail: mercadeo@editorialudea.com
Página web: www.editorialudea.com
Apartado 1226. Medellı́n. Colombia
Imprenta Universidad de Antioquia

Teléfono: (574) 210 53 30. Telefax: (574) 210 53 32
E-mail: imprenta@quimbaya.udea.edu.co
Índice general
1. Fundamentos de la mecánica newtoniana 1

1.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Sistema de referencia. Estado de un sistema mecánico. Ligaduras. Ecua-
ciones de movimiento para un sistema de partı́culas. Variables dinámicas.
Problemas separables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2. Ecuaciones generales de la estática y la dinámica 7

2.1. Las ligaduras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Las coordenadas generalizadas . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3. Los desplazamientos virtuales . . . . . . . . . . . . . . . . . . . . . . . . 15
2.4. La ecuación general de la estática . . . . . . . . . . . . . . . . . . . . . . . 19
2.5. Las ecuaciones de la estática en coordenadas generalizadas . . . . . . . . . 28
2.6. La ecuación general de la dinámica . . . . . . . . . . . . . . . . . . . . . . 35
2.7. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas
holónomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.8. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas
no holónomos. Uso de coordenadas no independientes . . . . . . . . . . . 46
3. El principio de Hamilton y las ecuaciones de Lagrange 55

3.1. Forma integral de la ecuación general de la dinámica para un sistema
holónomo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2. El principio de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3. Algunas propiedades de la función lagrangiana . . . . . . . . . . . . . . . 67
3.4. Simetrı́as de la lagrangiana y teoremas de conservación . . . . . . . . . . 68
3.5. El teorema del virial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4. La formulación hamiltoniana 85
4.1. Las variables hamiltonianas de estado . . . . . . . . . . . . . . . . . . . . 85
4.2. Simetrı́as y el teorema de conservación . . . . . . . . . . . . . . . . . . . . 94
4.3. La segunda forma del principio de Hamilton . . . . . . . . . . . . . . . . 97
4.4. Las transformaciones puntuales. Las transformaciones en el espacio de fases101
4.5. Las transformaciones canónicas
o de contacto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
v
vi
4.6. La función generatriz

de una transformación canónica . . . . . . . . . . . . . . . . . . . . . . . . 108
4.7. La evolución temporal de un sistema
considerada como una transformación
canónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.8. El teorema de Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
5. Movimiento de dos partı́culas

que interactúan por medio de una fuerza central 125
5.1. Coordenadas de centro de masa
y coordenadas relativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5.2. El oscilador armónico tridimensional . . . . . . . . . . . . . . . . . . . . . 136
5.3. El potencial 1/r . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
5.4. El problema de la dispersión bajo fuerzas centrales . . . . . . . . . . . . . 156
6. Pequeñas oscilaciones de sistemas

de varios grados de libertad 167
6.1. Modos normales de oscilación. Caso
no degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
6.3. Un campo mecánico unidimensional:
la cuerda uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
7. Cinemática del cuerpo rı́gido 205

7.1. Definición de cuerpo rı́gido . . . . . . . . . . . . . . . . . . . . . . . . . . 205
7.2. Sistemas de coordenadas espacial
y del cuerpo rı́gido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
7.3. Los cosenos directores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
7.4. El teorema de Euler acerca del movimiento de un cuerpo rı́gido . . . . . . 217
7.5. El rotador rı́gido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
7.6. Los ángulos de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
7.7. Descripción de las rotaciones en términos de n̂ y Φ. Parámetros de Euler . 226
7.8. Representación del grupo de rotaciones
por medio de matrices 2 × 2. Los parámetros
de Cayley-Klein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
7.9. Las rotaciones infinitesimales. Cinemática de las rotaciones . . . . . . . . 241
8. Dinámica del cuerpo rı́gido 253

8.1. El tensor de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
8.2. Diagonalización del tensor de inercia . . . . . . . . . . . . . . . . . . . . . 260
8.3. Las ecuaciones de movimiento de Euler . . . . . . . . . . . . . . . . . . . 268
8.4. El movimiento de un cuerpo rı́gido libre . . . . . . . . . . . . . . . . . . . 277
8.5. El trompo con el punto inferior fijo en un campo gravitacional homogéneo 295
8.6. Movimiento en un sistema de referencia no inercial . . . . . . . . . . . . . 310
vii
9. Las transformaciones canónicas 319

9.1. La acción en función de las variables de estado . . . . . . . . . . . . . . . 319
9.2. La integral invariante de Poincaré-Cartán . . . . . . . . . . . . . . . . . . 323
9.3. El principio de mı́nima acción y expresiones equivalentes . . . . . . . . . . 328
9.4. El teorema de Li Hua Chung . . . . . . . . . . . . . . . . . . . . . . . . . 332
9.5. Las transformaciones canónicas . . . . . . . . . . . . . . . . . . . . . . . . 343
9.6. La ecuación de Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . . . . . . 364
9.7. Las transformaciones canónicas infinitesimales . . . . . . . . . . . . . . . . 374
9.8. Los corchetes de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378
9.9. Pruebas del carácter canónico de una transformación . . . . . . . . . . . . 400
10.La ecuación de Hamilton-Jacobi con variables de acción-ángulo 415

10.1. Los invariantes adiabáticos . . . . . . . . . . . . . . . . . . . . . . . . . . 415
10.2. Los toroides invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
10.3. Las variables acción-ángulo . . . . . . . . . . . . . . . . . . . . . . . . . . 429
10.4. Problema de Kepler (coordenadas esféricas) . . . . . . . . . . . . . . . . . 445
10.5. Problema de Kepler (coordenadas parabólicas) . . . . . . . . . . . . . . . 462
11.Teorı́a de perturbaciones 479

11.1. Teorı́a de perturbaciones dependiente del tiempo . . . . . . . . . . . . . . 480
11.2. Teorı́a de perturbaciones independiente del tiempo . . . . . . . . . . . . . 482
11.3. Multiplicidad de conjuntos de variables acción-ángulo en los sistemas de-
generados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488
11.4. Teorı́a de perturbaciones de sistemas degenerados . . . . . . . . . . . . . 494
11.5. Perturbaciones adiabáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . 504
11.6. Sistema de osciladores lineales con acoplamiento no lineal . . . . . . . . . 508
11.7. Movimiento cerca de una resonancia aislada . . . . . . . . . . . . . . . . 513
11.8. Movimientos regulares e irregulares . . . . . . . . . . . . . . . . . . . . . . 522
12.Correspondencia con la mecánica cuántica de Heisenberg 549

12.1. Representación matricial de variables dinámicas . . . . . . . . . . . . . . . 550
12.2. Corchetes de Poisson y conmutadores de matrices clásicas . . . . . . . . . 555
12.3. Problemas mecánicos a la manera de Heisenberg . . . . . . . . . . . . . . 558
12.4. Ecuación de Hamilton-Jacobi y diagonalización de la matriz hamiltoniana 561
12.5. Teorı́a de perturbaciones con matrices clásicas . . . . . . . . . . . . . . . 564
13.Correspondencia con la mecánica cuántica de Schrödinger 567

13.1. Ideas de Hamilton acerca de las transformaciones canónicas . . . . . . . . 567
13.2. Función de distribución de probabilidades . . . . . . . . . . . . . . . . . . 573
13.3. La mecánica ondulatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 580
13.4. La función de onda semiclásica según Keller y Maslov . . . . . . . . . . . 585
A Isabel.
A Clara.
A Eduardo y Andrés.
Prefacio
No trataré de exponer razones para la aparición de un nuevo texto de mecánica
clásica. La acogida que reciba mi trabajo en la comunidad universitaria indicará si en
su concepción y realización satisface una necesidad existente en este campo.
Hay bellas canciones tradicionales, pero ello no impide que aparezcan nuevas compo-
siciones. Tampoco se pide a un compositor que diga las necesidades del público que
pretende complacer. Tal vez en toda obra que se realice sin interés de lucro, la principal
motivación esté en el placer experimentado por el autor al superar paulatinamente el
reto que voluntariamente se ha impuesto. Considero que estas reflexiones son válidas
respecto al presente trabajo.
Aunque la redacción del manuscrito y el trabajo mecanográfico se realizaron fuera de
la Universidad, es justo reconocer que el origen y la finalidad del texto, ası́ como su
reprodución, están dentro de ella. He dictado el curso de Mecánica Clásica Avanzada
en varias ocasiones y el presente trabajo tiene como núcleo los manuscritos de las clases
distribuidos a los alumnos. Con sus discusiones muchos estudiantes colaboraron positi-
vamente. Algunos colegas me contribuyeron con sugerencias y discusiones útiles, como
los señores Fernando Medina, Alberto Sánchez, Augusto Montes, Román Castañeda y
Roberto Martı́nez. Debo reconocer que la idea de escribir un libro de mecánica clásica
la recibı́ del profesor Fabio Machado.
He tratado de hacer una presentación de los temas en forma muy clara, lo cual des-
afortunadamente ha resultado en contra de la concisión. Especialmente en los ejemplos,
no aconsejo una lectura sino un desarrollo de los problemas por parte del lector. Por
tratarse de un texto de estudio y no de una obra divulgativa, no he considerado nece-
sario esforzarme por suprimir algunas fórmulas y frases redundantes. He tratado más
bien de evitar los errores en el contenido. De antemano pido excusas a los lectores por
las deficiencias estilı́sticas de mi trabajo, y especialmente por los errores que puedan
encontrar.
El plan de la obra consiste en desarrolar los temas tradicionales (formulaciones dalamber-
tiana, lagrangiana y hamiltoniana, fuerzas centrales, cuerpo rı́gido, pequeãs oscilaciones,
transformaciones canónicas, el método de Hamilton-Jacobi y la teorı́a clásica de pertur-
baciones), con la elaboración de ciertos puntos en los que no se profundiza en los textos
usuales, y especialmente en buscar ilustraciones concretas. He tratado también algunos
problemas de la mecánica clásica que son objeto de investigación en la actualidad. El
lector encontrará una presentación más completa que en los textos tradicionales de mu-
chas cuestiones como: el tratamiento de sistemas holónomos, el uso de las coordenadas
generalizadas, las transformaciones canónicas, el oscilador isotrópico, el método varia-
cional, la cuerda uniforme, los parámetros de Euler y los parámetros de Cayley-Klein,
las funciones elı́pticas de Jacobi, las ecuaciones de Euler en sistemas de referencia ro-
tantes, la brújula de Foucault, la formulación de la mecánica según Poincaré, el teorema
de Liouville sobre los sistemas integrables, un tratamiento exhaustivo del problema de
Kepler con variables acción-ángulo, la teorı́a canónica de perturbaciones, el teorema
de K.A.M, los movimientos caóticos en sistemas hamiltonianos, una formulación de la
mecánica clásica con matrices, dos presentaciones de los fundamentos de la mecánica
x
cuántica, y muchos otros temas que yo no soy el llamado a valorar.

El tratamiento de la mecánica basado en la teorı́a matemática de las variedades dife-
renciales y en el cálculo diferencial e integral de Cartan ha sido excluido por obvias
razones. Esto no implica que le reste valor al uso de las matemáticas contemporáneas.
El matemático A. N. Kolmogorov decı́a que es mucho más importante obtener resulta-
dos correctos que rigurosos. Para un fı́sico lo anterior es profundamente válido: no hay
nada menos riguroso desde el punto de vista teórico que un resultado experimental, pero
tampoco nada que sea más cierto ni bello.
La aplicación de la teorı́a de grupos a las vibraciones moleculares, los campos mecáni-
cos, los sistemas con vı́nculos, los fractales y el caos en sistemas disipativos, son algunos
temas importantes de la mecánica clásica contemporánea que no han sido incluidos. Tal
vez si es posible una segunda edición?
Mis obras de consulta son excelentes textos (ver bibliografı́a) como los de Whittaker,
Landau-Lifshitz, Arnold, Gantmacher, Goldstein, Born, Corben-Stehle, Marion, Lan-
czos, etc., ası́ como numerosas monografı́as y artı́culos especializados. Mi trabajo se
alimenta en gran parte de estas obras aunque me he esforzado por evitar el plagio. Dejo
a los lectores la determinación del grado de originalidad del libro que tienen en sus ma-
nos.
Esta es una obra de referencia para profesores y estudiantes de cursos de pregrado y
posgrado en fı́sica, y puede servir como texto guı́a mediante una adecuada selección de
los temas, complementado con ejercicios. Con los capı́tulos I, II, III, IV, V y VI, y un
resumen del VII, puede cubrirse el curso de pregrado. Con un resumen de unas quince
horas del curso de pregrado, los capı́tulos VIII y IX, y una selección de temas de los
capı́tulos X, XI, XII y XIII puede cubrirse el curso de postgrado. La comprensión de
este material facilita la solución de problemas de investigación y escuchar sin grandes
dificultades conferencias en el campo de la dinámica clásica.
JORGE MAHECHA GÓMEZ

Medellı́n, Junio de 1987.
1
Fundamentos de la mecánica newtoniana
1.1. Conceptos preliminares

Mecánica. Es la ciencia que estudia el comportamiento de la materia a partir
del movimiento de las partı́culas constituyentes. En la mecánica la máxima información
acerca de un sistema de partı́culas consiste en obtener las posiciones y velocidades de
cada una de ellas en cada instante de tiempo, respecto a un sistema de referencia dado.
Para la solución de cualquier problema mecánico es necesario: definir un sistema de re-
ferencia, hallar las coordenadas más adecuadas para describir el sistema y plantear las
ecuaciones de movimiento de cuya solución se obtendrán las coordenadas y velocidades
en función del tiempo.
Importancia. El mundo percibido por el hombre directamente a través de sus sen-

tidos se denomina macroscópico. La mecánica clásica brinda la formulación más completa
del comportamiento de la mayorı́a de fenómenos macroscópicos, por ello es el instrumen-
to teórico por excelencia en ramas como: arquitectura e ingenierı́a de construcciones,
ingenierı́a mecánica que está en la base de la moderna industria de la maquinaria, la ae-
ronáutica y la astronáutica, la geofı́sica, etc. Podemos decir que la ciencia de la mecánica
ha sido estimulada por el desarrollo de la gran industria y a la vez le ha contribuido a
ésta de manera importante.
La mecánica clásica no es una ciencia acabada. En primer lugar, hay muchos pro-
blemas fundamentales que son estudiados en la actualidad (Arnold, Abraham, Maslov,
etc. son nombres asociados a desarrollos contemporáneos de la mecánica). En segundo
lugar, hay problemas fundamentales de la fı́sica (entendida como la ciencia o conjunto de
ciencias que estudian las propiedades elementales de la materia) que utilizan la mecánica
clásica como teorı́a básica en el grado de validez de la misma (metrologı́a, fı́sica de los
plasmas, estado sólido, astrofı́sica, sistemas atómicos, sistemas nucleares y de partı́cu-
las elementales en estados altamente excitados, etc.). Una revisión de los temas en que
trabaja una inmensa mayorı́a de los fı́sicos contemporáneos nos muestra que sus objetos
de investigación no son las teorı́as fundamentales sino problemas especı́ficos referentes a
las propiedades de sistemas fı́sicos reales (núcleos, sólidos, átomos, gases, lı́quidos, luz,
1
2 / Mecánica clásica avanzada
etc.). Una visión histórica nos muestra que los virajes en el desarrollo de la fı́sica se
han producido a partir de las investigaciones en problemas especı́ficos que se salen del
rango de validez de las teorı́as existentes. O sea que las modernas teorı́as fı́sicas no han
invalidado la mecánica clásica sino que simplemente han restringido su rango de validez.
Por último, en la mecánica clásica está el germen de las teorı́as más completas como
la mecánica cuántica o la relatividad general. Tales teorı́as utilizan los conceptos de la
mecánica clásica y los introducen en sus formalismos cambiándoles el contenido. Las no-
ciones de energı́a, momentum, velocidad, posición, etc., tienen su origen en la mecánica
clásica, pero mantienen una importancia relevante dentro de las nuevas teorı́as. Podemos
concluir que un conocimiento riguroso de la mecánica clásica es indispensable para el
estudio cabal de la mecánica cuántica y demás teorı́as contemporáneas.
Rango de validez. La mecánica clásica no relativı́stica es aplicable cuando las

velocidades involucradas son mucho menores que la velocidad de la luz.1 La aplicabilidad
de la mecánica cuántica a sistemas microscópicos como átomos y moléculas está restrin-
gida a los estados en los cuales el producto del momento lineal de las partı́culas por la
dimensión caracterı́stica de la región que ocupan sea del orden Hde la constante de Planck
(o más exactamente, la mecánica clásica es aplicable cuando pdq ≫ h). No es exacto
afirmar que la mecánica clásica es aplicable sólo en el mundo macroscópico. Hay proble-
mas de microfı́sica como: átomos en estados excitados, la dispersión de electrones por
una radiación LASER, el movimiento de electrones en algunas moléculas, el movimiento
de electrones en campos eléctricos y magnéticos, etc., en los cuales se puede utilizar la
mecánica clásica. En fin, sólo un análisis del problema especı́fico que se tenga permite
decidir si la mecánica clásica es aplicable, si se puede usar como una aproximación o si
es completamente inadecuada.
Modelos fundamentales en la mecánica. En las teorı́as mecánicas los cuerpos

reales son representados por medio de nociones abstractas como las de ”punto mate-
rial”(partı́cula), ”sólido rı́gido”, etc. Un punto material es un cuerpo cuyas dimensiones,
forma y estructura interna carecen de importancia para la resolución de un determinado
problema; esto ocurre cuando las dimensiones que aparecen en el problema son mucho
más grandes que las de los cuerpos involucrados y cuando la estructura interna dé lugar
a efectos secundarios en el contexto en que se trabaja. Un sólido rı́gido es un cuerpo
que se considera formado por gran cantidad de partı́culas, de tal modo que la distancia
entre dos cualesquiera es constante y que la forma y dimensiones del cuerpo no cambian
cuando éste se mueve. Usualmente un sólido rı́gido se considera formado de un núme-
ro muy grande de partı́culas, que con muy buena aproximación se pueden considerar
formando una distribución continua de masa. En la interacción de dos cuerpos rı́gidos
por contacto se asumen dos modelos: el contacto perfectamente liso y el perfectamente
rugoso. Lo anterior es importante en el análisis de las fuerzas internas llamadas de liga-
dura. Otro modelo es el de cuerpo deformable, básico en las teorı́as de campos mecánicos.
Partes de la mecánica. Tradicionalmente se divide en estática, cinemática y

1 Estamos adoptando el punto de vista que consiste en considerar como clásica a toda teorı́a fı́sica
que no dé cuenta de los efectos indeterministas de tipo cuántico y permite una descripción causal en
sentido clásico. En particular, consideramos clásicas las teorı́as especial y general de la relatividad.
Fundamentos de mecánica newtoniana / 3
dinámica. En el curso se tratan dos clases de temas:

1) Generales. Leyes generales de la estática y la dinámica (formalismos lagrangiano,
hamiltoniano, poissoniano y de Hamilton-Jacobi), cinemática y dinámica del movimiento
de rotación.
2) Espaciales. Problema de los dos cuerpos, movimiento del sólido rı́gido y vibra-
ciones mecánicas.
Las teorı́as, incluyendo la mecánica clásica, adquieren su verdadera relevancia cuan-
do se las aplica a situaciones reales. Las teorı́as tratan de las leyes generales pero el desa-
rrollo de la fı́sica se halla impulsado por el estudio de problemas especı́ficos. Por esto,
hacemos especial énfasis en los ejemplos y en la presentación de cálculos detallados.
1.2. Sistema de referencia. Estado de un sistema me-

cánico. Ligaduras. Ecuaciones de movimiento pa-
ra un sistema de partı́culas. Variables dinámicas.
Problemas separables.
Sistema de referencia. Se entiende por tal a un cuerpo rı́gido real o ficticio que
sirve de referencia para estudiar el movimiento del sistema mecánico considerado. Se
supone que tal sistema de referencia está rı́gidamente unido con un sistema de coorde-
nadas; esto permite ubicar la posición de cada partı́cula del sistema mecánico respecto
del sistema de referencia.
Además en el sistema de referencia hay un “cronómetro” que permite determinar
los instantes en que cada partı́cula del sistema ocupa una posición dada del espacio. El
sistema de referencia no tiene ninguna propiedad que pueda afectar al sistema mecánico,
aunque sı́ es de esperarse que la descripción obtenida dependa del estado del movimiento
del sistema de referencia.
Ası́ como para especificar la longitud de un objeto se requiere un patrón de longi-
tud con una unidad de medida asociada, la descripción del movimiento de un sistema
mecánico requiere de un “patrón”mecánico que no es más que el sistema de referencia.
La unidad de medida es análoga al sistema de coordenadas. La elección del sistema de
coordenadas en un sistema de referencia es cuestión de comodidad. Hay un número in-
finito de sistemas de coordenadas posible. Con una elección de sistema de coordenadas
se busca que las ecuaciones de movimiento sean fácilmente solubles y que la solución
sea lo más simple posible. En cualquier sistema de coordenadas es posible escribir las
ecuaciones de movimiento, pero puede ocurrir que no sean solubles. Encontrar el ade-
cuado sistema de coordenadas que permita resolver las ecuaciones de movimiento es un
importante problema matemático que llega a involucrar la teorı́a de grupos, la geometrı́a
diferencial y otras ramas de las matemáticas.
Estado de un sistema mecánico. Es necesario distinguir los conceptos de estado

y de descripción de estado. La noción de estado es intuitiva (análoga a las nociones de
longitud, duración, etc.), involucra sólo aspectos cualitativos, de carácter objetivo. La
descripción del estado implica nociones geométricas a través del sistema de referencia
y el sistema de coordenadas que es necesario elegir (hay analogı́a con las nociones de
distancia, intervalo de tiempo, etc., que implican aspectos cuantitativos). Clásicamen-
te para la especificación o descripción completa del estado de un sistema mecánico se
requiere, por ejemplo, conocer la posición y velocidad de cada una de las partı́culas en
un tiempo dado. Es imposible obtener la descripción del estado sin tener un sistema
de referencia y un sistema de coordenadas. En cualquier rama de la fı́sica, y en general
cualquier ciencia cuantitativa, se requiere de la noción de estado. El tipo de descripción
depende del sistema que se trate: el estado de un sistema de partı́culas en mecánica
clásica se describe mediante posiciones y velocidades; en mecánica cuántica se descri-
be mediante la función de onda del sistema. El estado termodinámico de un sistema
macroscópico se describe mediante un conjunto de variables termodinámicas como P ,
V , T , etc. En economı́a, el estado finanaciero de una empresa, por ejemplo, se describe
mediante una serie de parámetros que evolucionan con el tiempo; qué parámetros son
relevantes, depende del modelo, ası́ como de la ecuación de evolución.
El sistema de referencia se denomina a veces espacio fı́sico de representación. El
sistema de coordenadas permite representar cada estado del sistema por un punto. La
representación de los estados ya forma parte de la teorı́a fı́sica, pero siempre existe el
supuesto de que hay una correspondencia que permite asociar a cada estado de movi-
miento del sistema un punto del espacio de representación, o, para ser más exactos, una
trayectoria en dicho espacio. A un sistema de N partı́culas se le asocian 3N coordenadas
y 3N velocidades. Los estados del sistema se pueden representar por puntos del espacio
de representación, llamado espacio de configuración, y sus vectores tangente y veloci-
dades. También los estados se pueden representar por puntos del espacio de fases 6N
dimensional. Una descripción puede ser por medio de las 6N cantidades:
{ x1 (t), y1 (t), z1 (t); x2 (t), y2 (t), z2 (t); ...xN (t), yN (t), zN (t);
(1.1)
ẋ1 (t), ẏ1 (t), ż1 (t); ẋ2 (t), ẏ2 (t), ż2 (t); ...ẋN (t), ẏN (t), żN (t) }
También es posible una descripción en términos de las coordenadas en dos tiempos

diferentes, t y t′ . No basta, pues, conocer los valores iniciales de las coordenadas ya
que además se requiere información acerca de cómo cambian con el tiempo para poder
predecir cuál será la configuración del sistema en otro tiempo. Para lo anterior desde el
punto de vista meramente matemático, se requerirı́a conocer todas las derivadas tempo-
rales de las coordenadas y velocidades que en un tiempo determinan los valores de las
mismas en cualquier otro instante. En conclusión, el espacio de representación para un
sistema de N partı́culas tiene 6N dimensiones. Los distintos formalismos de la mecánica
se caracterizan, entre otras cosas, por el tipo de espacio de representación que emplean.
La formulación newtoniana utiliza las posiciones y velocidades de las partı́culas. La for-
mulación lagrangiana, las coordenadas y velocidades generalizadas. Las formulaciones
de Hamilton y Poisson, las coordenadas y momentos generalizados. La formulación de
Hamilton-Jacobi utiliza constantes de movimiento. La mecánica cuántica utiliza otro
tipo de descrición del estado: los vectores de estado del espacio de Hilbert del sistema.
Ligaduras. Si con sólo cambiar las fuerzas y las condiciones iniciales las partı́cu-
las del sistema pueden ocupar cualquier posición en el espacio o cualquier velocidad,
Fundamentos de mecánica newtoniana / 5
se dice que el sistema es libre. Si lo anterior no es posible, es porque hay restriccio-

nes, llamadas ligaduras mecánicas. Las ligaduras disminuyen el número de cantidades
independientes necesarias para especificar completamente el estado del sistema. Si hay
k condiciones de ligadura independientes, el número de cantidades independientes ne-
cesarias para especificar la configuración del sistema (llamado el número de grados de
libertad) será 3N − k = 1. En lo que sigue supondremos conocidos los conceptos refe-
rentes a: trayectoria, primera ley de Newton, sistemas de referencia inerciales, segunda
y tercera ley de Newton, trabajo y energı́a, y teoremas de conservación del momento
lineal, la energı́a y el momento angular.
Ecuaciones de movimiento para un sistema de partı́culas. Supondremos

que las fuerzas que actúan sobre una partı́cula son función de las coordenadas y velo-
cidades de todas las partı́culas del sistema, y que se pueden descomponer a una parte
debida a efectos exteriores al sistema y a otra debida a las demás partı́culas del sistema.
La fuerza neta sobre la partı́cula i (i = 1, 2, ...N ) será:
F~i (~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t) =

F~ei ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t (1.2)
N
X
+ ′~
Fij ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t
j=1
Se supone que las partı́culas del sistema sólo interactúan entre pares; la prima
en la sumatoria indica que excluye j = i. En el caso más general F~ei y F~ij dependen
de las coordenadas y de las velocidades de todo el sistema. Usualmente se cumple lo
siguiente: (a) Las fuerzas entre las partı́culas i y j dependen sólo de las coordenadas y
de las velocidades de éstas; (b) La fuerza externa sobre la partı́cula i sólo depende de
sus coordenadas y velocidades:

F~i ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t =
N
X
F~ei (~ri , ~r˙ i ; t) + ′~
Fij (~ri , ~rj , ~r˙ i , ~r˙ j ) (1.3)
j=1
Las ecuaciones de movimiento serán:

N
X
′~
Fij ~ri , ~rj , ~r˙ i , ~r˙ j + F~ei ~ri , ~r˙ i ; t = mi~¨r i i = 1, 2, ...N (1.4)
j=1
Este último es un sistema de N ecuaciones diferenciales, en general no lineales, de

segundo orden, acopladas, con N incógnitas (~r1 , ~r2 , ...~rN ), o si se quiere, de 3N ecuacio-
nes diferenciales escalares con 3N incógnitas. La solución de estas ecuaciones contiene
6N constantes de integración, que pueden tomarse como las 3N coordenadas y las 3N
velocidades en el tiempo t = t0 , y proporciona directamente la especificación completa
del estado del sistema.
Variables dinámicas. Cualquier función del estado del sistema y del tiempo se
denomina una variable dinámica. Las coordenadas o las velocidades mismas son varia-
bles dinámicas. También lo son el momento angular, la energı́a, el momento lineal, las
coordenadas del centro de masa, etc. Un conjunto de 6N funciones (independientes entre
sı́) de las coordenadas y las velocidades constituye un conjunto completo de variables
dinámicas y sirve para especificar completamente el estado del sistema. Una clase espe-
cial de variables dinámicas es constituida por las constantes de movimiento. Un conjunto
máximo de constantes de movimiento, 6N , permite describir completamente el estado
del sistema. En mecánica cuántica pueden haber a lo sumo 3N constantes de movimiento
independientes, exactamente definidas; entonces las otras 3N constantes serán comple-
tamente indefinidas. La mecánica newtoniana en su forma original es adecuada para el
estudio de sistemas libres. Para sistemas con ligaduras es más conveniente el formalis-
mo lagrangiano. Desde el punto de vista teórico es deseable un formalismo en el cual
las ecuaciones del movimiento sean covariantes y en el cual la mecánica se deduzca de
principios más generales (variacionales); en este sentido también es más útil la mecánica
lagrangiana.
Problemas separables. Son aquellos en los cuales el sistema de ecuaciones de

movimiento acopladas, es posible mediante algún cambio de variables reducirlo a un
sistema de 3N ecuaciones diferenciales desacopladas, o sea, 3N ecuaciones donde en
cada ecuación hay sólo una incógnita. En principio algunos problemas mecánicos son
separables, pero en la mayorı́a de los casos esto es un problema muy difı́cil (o imposible)
de resolver matemáticamente.
Algunos problemas que han sido resueltos matemáticamente son: el de N partı́culas
en un campo externo pero no interactuantes entre sı́; N partı́culas en un campo externo
interactuando entre sı́ con fuerzas restauradoras lineales (cadena de osciladores acopla-
dos, molécula lineal poliatómica, etc.); dos partı́culas interactuando entre sı́ a través de
un potencial central (problema de dos cuerpos, por ejemplo); sólido rı́gido con un punto
fijo en un campo gravitacional homogéneo. Pero la mayor parte de los problemas mecáni-
cos no se han podido resolver analı́ticamente, por ejemplo, el problema de tres partı́culas
interactuando entre sı́ a traves de un potencial central de tipo gravitacional (problema
de los tres cuerpos), o el problema de una partı́cula cargada en presencia del campo
electrostático de una carga fija y un campo magnético homogéneo. Los problemas solu-
bles clásicamente lo son también cuánticamente; en cuanto a la búsqueda de soluciones
analı́ticas exactas, la mecánica cuántica no aporta mucho en relación con la mecánica
clásica, sin embargo, la mecánica cuántica ha alcanzado una mayor flexibilidad en la
búsqueda de soluciones aproximadas al problema de muchas partı́culas interactuantes
entre sı́.
2
Ecuaciones generales de la estática y la
dinámica
2.1. Las ligaduras

Esta noción aparece en fı́sica macroscópica con frecuencia y raras veces en fı́sica
microscópica. Es de interés en las aplicaciones técnicas, como el diseño de maquinaria.
Por ejemplo, en la definición de sólido rı́gido aparece el concepto de ligadura. Este sistema
se define por la condición que la distancia entre cualquier par de partı́culas permanece
fija. Para N = 2, el cuerpo rı́gido consiste de dos partı́culas a una distancia fija entre sı́;
la condición de ligadura es:
(x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 = constante (2.1)
El sistema posee seis coordenadas, pero la ligadura permite expresar una de ellas
en términos de las otras, quedando sólo 6 − 1 = 5 coordenadas independientes. Por tales
coordenadas pueden tomarse las tres del centro de masa y dos ángulos que especifican
la orientación respecto al centro de masa.
Para N = 3 hay nueve coordenadas y tres condiciones de ligadura que pueden
expresarse en forma vectorial como:
|r~1 − r~2 | = a
|r~2 − r~3 | = b (2.2)
|r~3 − r~1 | = c
Hay sólo 9 − 3 = 6 coordenadas independientes que pueden tomarse ası́: tres para
especificar la posición del centro de masa del sistema total y tres ángulos que especifican
la orientación del plano de las partı́culas con el centro de masa fijo.
Para un sólido rı́gido en general se requieren 3N coordenadas pero habrá cierto número
de condiciones de ligadura independientes. El número total de coordenadas indepen-
dientes requeridas para especificar la posición de un sólido rı́gido son seis, que pueden
7
tomarse ası́: las tres coordenadas del centro de masa y tres ángulos que especifican la
orientación del cuerpo con el centro de masa fijo.
Se dice que un sólido rı́gido de N partı́culas tiene seis grados de libertad y 3N − 6
condiciones de ligadura. Otros tipos de ligaduras son las siguientes:
(a) Hay alguna condición que obliga a las partı́culas a moverse sobre una superficie o
en una lı́nea. En una superficie cada partı́cula posee sólo dos coordenadas independientes,
o sea que el sistema tendrá N condiciones de ligadura y 2N grados de libertad. Para un
sistema de partı́culas sobre un plano las condiciones de ligadura son las siguientes, si se
toma en el plano x − y:
zi = 0 ; i = 1, 2, ... N (2.3)
Para una esfera de radio a y tomando el centro de la esfera como origen de coor-
denadas las ligaduras son:
x2i + yi2 + zi2 − a2 = 0 ; i = 1, 2, ... N (2.4)
(b) Si hay cuerpos rı́gidos en contacto que ruedan sin deslizarse sobre un plano.
Sea un cilindro de radio a que rueda sin deslizar sobre el plano z = 0. El cilindro requiere
de seis coordenadas para especificar su posición, pero hay dos condiciones de ligadura.
zCM = a
(2.5)
ẋ2CM + ẏCM
2
= a2 φ̇2
donde R~ CM y R~˙ CM son la posición y velocidad del centro de masa y φ̇ es la velocidad

angular de rotación alrededor del eje del cilindro. Si se escoge el sistema de coordenadas
de modo que el eje del cilindro sea paralelo al eje x, la ecuación (2.5) puede integrarse
para dar:
yCM = aφ (2.6)
La ecuación (2.5) puede también integrarse directamente para obtener una relación
entre el ángulo de giro del cilindro y el desplazamiento del centro de masa. En (2.6) se
ha escogido a φ de modo que yCM = 0 cuando φ = 0.
Las ligaduras de “rodar” relacionan las velocidades entre sı́ y con las coordenadas,
y en general son no holónomas, o sea no integrables. Son los casos de un disco o una
esfera rodando sobre un plano.
Para un disco rodando sobre un plano se requieren dos coordenadas para especificar
la posición del centro de masa, una para especificar el giro alrededor del eje y dos para
especificar la posición del plano del disco. Hay dos ligaduras de “rodar” que relacionan
las componentes de la velocidad del centro de masa con la velocidad angular de rotación
al rededor del eje (véase la figura 2.1).
Una de las coordenadas necesarias para especificar el plano del disco puede tomarse
como el ángulo que hace el eje del disco con la dirección x. La otra coordenada la
especificamos exigiendo que el plano del disco sea siempre perpendicular al plano x − y.
Una condición de ligadura es zCM = a. Las otras dos coordenadas del centro de masa
Ecuaciones generales de la estática y la dinámica / 9
a
ϕ
α x
Figura 2.1 Disco rodando sobre un plano
son las mismas del punto de contacto del disco con el plano. Las condiciones de ligadura
de rodar son: que la magnitud de la velocidad del centro de masa sea proporcional a φ̇,
v = aφ̇ (2.7)
y que la dirección de la velocidad del centro de masa siempre esté en el plano de rotación
del disco,
ẋ = v senα ẏ = −v cos α (2.8)
De estas tres condiciones de ligadura sólo hay dos independientes:
dx − a senα dφ =0
(2.9)
dy + a cos α dφ =0
Las ecuaciones (2.9) no se pueden integrar para obtener relaciones que involucren
sólo cantidades finitas. Para poder hacer esto serı́a necesario hallar ciertas funciones
f (x, α; φ) y g(y, α; φ) tales que al multiplicar por ellas las ecuaciones (2.9) se obtengan
diferenciales exactos. Lo anterior no es posible, o sea que las relaciones (2.9) no pueden
usarse para expresar una coordenada en términos de las demás; esto implica que las
condiciones de ligadura deben considerarse simultáneamente con la solución del problema
mecánico, que contendrá sólo tres coordenadas independientes.
Los anteriores ejemplos nos muestran que un sistema de N partı́culas y k condicio-
nes de ligadura tendrá 3N − k grados de libertad. Un cuerpo rı́gido tendrá 6 − k grados
de libertad. Las condiciones de ligadura para un sistema de partı́culas pueden siempre

expresarse en la forma:
fα (~r1 , ~r2 , ... ~rN ; ~r˙ 1 , ~r˙ 2 , ... ~r˙ N ; t) = 0; α = 1, 2, ... k (2.10)
Ligaduras holonómicas. También se llaman integrables, finitas o geométricas. Su
nombre se deriva de las raı́ces griegas nomos (ley) y holo (entero, todo). Estas ligaduras
sólo restringen las posiciones posibles del sistema, o sea que se pueden expresar por
medio de igualdades que no involucran las velocidades. Para un sistema de N partı́culas
son de la forma:
fα (~r1 , ~r2 , ... ~rN ; t) = 0 α = 1, 2, ... h (2.11)
Para un cuerpo rı́gido son:
~ θ, φ, ψ; t) = 0
fα (R, α = 1, 2, ... h (2.12)
donde R ~ denota la posición del centro de masa, φ, θ, ψ son tres ángulos que especifican
la orientación del cuerpo con el centro de masa fijo y h es el número de condiciones de
ligadura holónomas. Un sistema se dice que es holónomo si no tiene ligaduras diferen-
ciales no integrables.
Ligaduras no holonómicas. También se llaman no integrables, diferenciales o

cinemáticas. Son aquellas que no pueden integrarse. Para un cuerpo rı́gido son de la
forma:
fα (R, ~˙ θ, φ, ψ, θ̇, φ̇, ψ̇; t) = 0 ;

~ R, α = 1, 2, ... n (2.13)
donde n es el número de ligaduras no holónomas. En la mayorı́a de los casos (por ejemplo
el de la figura 2.1), se pueden expresar en la forma:
~˙ + mα θ̇ + nα φ̇ + σα ψ̇ + Pα = 0 ;
~lα · R α = 1, 2, ... n (2.14)
donde ~lα , mα , nα , σα , Pα , son funciones de R,

~ θ, φ, ψ, t. La generalización de (2.12),
(2.13) y (2.14) para sistemas de cuerpos rı́gidos es inmediata. Para un sistema de N
partı́culas usualmente son de la forma:
N
X
~lα · r~˙i + Dα = 0 ; α = 1, 2, ... n (2.15)
i
i=1
donde ~lαi y Dα son funciones de ~r1 , ~r2 , ... ~rN , t.
Ligaduras reonómicas. Del griego reo (flujo). Son las ligaduras, holonómicas o
no holonómicas, que dependen del tiempo. Serı́a el caso de dos partı́culas unidas entre
sı́ por una varilla cuya longitud varı́a con el tiempo de manera conocida:
|~r1 − ~r2 | = l(t) (2.16)
Ligaduras escleronómicas. Del griego esclero (duro). Son las ligaduras rı́gidas
o que no cambian con el tiempo. Es el caso de dos partı́culas unidas entre sı́ por una
varilla rı́gida. La noción de ligadura involucra dos aspectos. Por una parte, indica que el
número de variables independientes necesarias para especificar el estado del sistema es
menor. En segundo lugar aparecen las llamadas fuerzas de ligadura, que no se pueden
conocer a priori porque dependen del problema especı́fico, es decir de las fuerzas aplica-
das y de las condiciones iniciales. Vemos que las ligaduras introducen nuevas incógnitas
en el problema.
Las ligaduras consideradas como fuerzas. La noción de ligadura es puramente

macroscópica. Viendo las cosas en detalle en los ejemplos, notamos que las ligaduras son
el resultado de interacciones. Ası́, en el caso de la partı́cula que se mueve sobre la esfera,
deben existir fuerzas que impiden que la partı́cula salga de la superficie, bien sea hacia
afuera o hacia adentro (por esto se dice que esta ligadura es bilateral. En el caso en que
la partı́cula pudiera ocupar sólo cualquier posición dentro de la esfera se dice que la
ligadura es unilateral). En el caso del disco que rueda sin deslizar, debe haber algún tipo
de interacción entre la superficie del disco y la del plano en la zona de contacto. En todos
estos casos sucede que es imposible conocer las fuerzas a priori, independientemente de
las fuerzas aplicadas y de las condiciones iniciales.
Por ejemplo, en el caso de las dos partı́culas unidas por una varilla, no sabemos
cuál es la fuerza que ejerce la varilla sobre ellas. Obviamos esta dificultad diciendo
simplemente que hay una “ligadura”:
|~r1 − ~r2 | = l (2.17)
Pero podemos, si queremos, modelar dicha fuerza, digamos que considerándola

como un caso lı́mite de una interacción del tipo restauradora lineal. Ası́, las fuerzas de
la varilla sobre las partı́culas serı́an de la forma:
F~1′ = −k ′ (r − l)û
(2.18)
F~2′ = k ′ (r − l)û
donde k ′ serı́a la constante de resorte, l la separación de las partı́culas en la posición

de equilibrio y û un vector unitario en la dirección del vector ~r2 − ~r1 = ~r. En el caso
de dos partı́culas interactuando a través de una fuerza central es posible separar el
movimiento en dos partes: el movimiento del centro de masa, y el movimiento de una
partı́cula de masa reducida µ respecto al centro de masa bajo una interacción idéntica
a la interacción entre las dos partı́culas originales. Entonces, el movimiento relativo
descrito como el movimiento de la partı́cula ficticia de masa µ obedece la ecuación:
r s
2E k′
r−l = sen (t − t0 ) (2.19)
k′ µ
donde E es la energı́a del movimiento, que consideraremos tiene un valor finito dado.
Cuando k ′ → ∞, la frecuencia de las oscilaciones aumenta, en tanto que r − l tiende
a cero, obteniéndose la relación cinemática r = l. Por otra parte, como la energı́a E
depende de otras condiciones –fuerzas externas y condiciones de ligadura–, es realmente
indeterminada a priori. Sólo un modelo microscópico nos permitirı́a estimar el valor de
k ′ . Por lo tanto las fuerzas de ligadura F~ ′ 1 y F~ ′ 2 son indeterminadas; su valor depende

de la solución al problema mecánico completo. Es claro que la indeterminación en las
fuerzas de ligadura no proviene de la omisión de los detalles microscópicos, pues aun a
escala microscópica las interacciones dependerı́an del movimiento completo del sistema.
2.2. Las coordenadas generalizadas

Grados de libertad. El número de grados de libertad de un sistema mecánico
es igual al número de coordenadas independientes necesarias para especificar comple-
tamente cada configuración del sistema. Entendemos por configuración la posición que
ocupa cada una de las partı́culas del sistema. Si hay h condiciones de ligadura holónomas
y n condiciones de ligadura no holónomas (o sea si hay k = n + h condiciones de ligadura
independientes), el número l de grados de libertad será:
l = 3N − h − n (2.20)
Clasificación de los grados de libertad. Sea un sistema de partı́culas sin liga-

duras, k = 0. Sus 3N coordenadas se pueden clasificar en traslacionales y rotacionales
(cuando describen el movimiento del centro de masa y las rotaciones del sistema respecto
al centro de masa), y en vibracionales (cuando describen los movimientos relativos de
las partı́culas que no trasladan el centro de masa y no rotan el sistema). Por ejemplo,
sea un sistema de dos partı́culas –molécula diatómica–, las seis coordenadas se pueden
clasificar en tres grados de libertad traslacionales, dos grados de libertad rotacionales y
un grado de libertad vibracional; en el caso de tratarse de una molécula de H2 , además
hay grados de libertad internos a las dos partı́culas: seis grados de libertad correspon-
dientes a los dos electrones, un grado de libertad interno, el espı́n para cada núcleo y
para cada electrón. Las modernas teorı́as de las partı́culas elementales consideran que a
su vez el protón y el electrón poseen otros grados de libertad internos.
Gran parte de los modelos que se construyen en la fı́sica consisten en hallar cuáles
son los grados de libertad que tienen más relevancia para una situación dada. Ası́ por
ejemplo, en la mecánica se omiten los grados de libertad microscópicos.
Las coordenadas generalizadas. Sea un sistema de N partı́culas con h condicio-

nes de ligadura holónomas, dadas por las ecuaciones (2.11). Estas ecuaciones permiten
expresar a h coordenadas en términos de 3N − h coordenadas, que sólo serán indepen-
dientes en el caso en que no haya ligaduras no holónomas. Es conveniente realizar una
transformación de coordenadas de modo que se eliminen del problema las h coordenadas
superfluas; para ello basta exigir que la transformación anule idénticamente las funciones
fα en las ecuaciones (2.11) y (2.12). Es decir, si:
xi = xi (q1 , q2 , ... q3N −h , t)
yi = yi (q1 , q2 , ... q3N −h , t) (2.21)
zi = zi (q1 , q2 , ... q3N −h , t) ; i = 1, 2, ... N

donde q1 , q2 , ... q3N −h son las coordenadas generalizadas y la transformación depen-

derá del tiempo si las ligaduras holónomas son además reónomas. La transformación
además debe cumplir que se anulen idénticamente las funciones:
f~α (q1 , q2 , ... q3N −h , t) ≡

fα [~r1 (q1 , q2 , ... q3N −h , t), ~r2 (q1 , q2 , ... q3N −h , t), ... t] (2.22)
para α = 1, 2, ... h
Usaremos la siguiente notación: los subı́ndices latinos se refieren a cantidades que

se pueden asociar a las partı́culas. Para nombrar las coordenadas generalizadas reserva-
mos los subı́ndices griegos: qν (ν = 1, 2, ... 3N − h). Para nombrar el conjunto de todas
las coordenadas generalizadas usamos la notación (q). Más adelante usaremos también
la notación ~q.
Si k = h, o sea si n = 0, entonces q será un conjunto de coordenadas generalizadas

independientes. Por ejemplo, para una partı́cula que se puede mover sólo sobre una
esfera de radio a la condición de ligadura está dada por la ecuación (2.4); o sea que, por
ejemplo, si el radio de la esfera cambia con el tiempo de manera conocida,
f (x, y, z, t) ≡ x2 + y 2 + z 2 − a2 (t) (2.23)
el sistema tiene una coordenada superflua que se puede eliminar introduciendo unas
coordenadas en la superficie de la esfera. Si tomamos como coordenadas generalizadas
los ángulos θ y φ definidos por:
x(θ, φ, t) = a(t) senθ cos φ
y(θ, φ, t) = a(t) senθ senφ (2.24)
z(θ, φ, t) = a(t) cos θ
Vemos que f (θ, φ, t) se anula idénticamente, o sea que la condición de ligadura

(2.4), se reduce a 0 = 0. Veamos otro ejemplo, sea el sistema formado por dos bolas
pegadas entre sı́ por varillas rı́gidas sin masa y una de ellas unida por una varilla rı́gida
sin masa a un punto fijo. Este sistema se denomina péndulo doble (véase figura 2.2).
El sistema posee seis coordenadas que no son independientes. Supongamos que sólo hay
movimientos permitidos en un plano. Entonces las condiciones de ligadura serán,
z1 = 0
z2 = 0
(2.25)
x22 + y22 − l22 = 0
(x1 − x2 )2 + (y1 − y2 )2 + l12 = 0

donde tomamos el plano x − y como el plano de movimiento, y el origen de coordenadas
en el extremo fijo de la varilla l2 . El sistema tendrá dos grados de libertad que son las
θ2 l2
m2
θ1 l1
m1
Figura 2.2 Péndulo doble
coordenadas θ1 , θ2 definidas por:

x1 − x2 = l1 cos θ1 , x2 = l2 cos θ2 , z1 ≡ 0
(2.26)
y1 − y2 = l1 sen θ1 , y2 = l2 sen θ2 , z2 ≡ 0
son unas coordenadas generalizadas, ya que reducen las ecuaciones (2.25) a la identidad
0 = 0.
Las coordenadas generalizadas se refieren al sistema como un todo y no a las
partı́culas individuales. Además, no necesitan tener dimensiones de longitud. En gene-
ral, cualquier conjunto de 3N − h variables dinámicas independientes del sistema puede
servir de sistema de coordenadas generalizadas.
Velocidades generalizadas. Son las derivadas totales de las coordenadas gene-

ralizadas respecto al tiempo:
(q̇) = (q˙1 , q˙2 , ... q̇3N −h ) (2.27)
En coordenadas cartesianas se cumple que el momento está relacionado con la velo-
cidad mediante la relación ~p = m~v. En coordenadas generalizadas no existe una relación
de este tipo en general.
Espacio de configuración. Es un espacio definido por las l coordenadas indepen-

dientes del sistema, donde l = 3N −k. Al describir un sistema con ligaduras por medio del
espacio 3N dimensional, estamos usando un espacio euclidiano (en ausencia de fuerzas,
una partı́cula se mueve en lı́nea recta); entonces las trayectorias no rectilı́neas inmedia-
tamente se atribuyen a la presencia de fuerzas de ligadura. Al describir un sistema con
ligaduras por medio del espacio de configuración l-dimensional, usamos un espacio no

euclidiano; entonces las trayectorias no rectilı́neas se atribuyen no a fuerzas, sino a la
curvatura del espacio, como en relatividad general.
2.3. Los desplazamientos virtuales

Sea un sistema sujeto a k condiciones de ligadura, h holónomas, dadas por las
ecuaciones (2.11) y n no holónomas dadas por las ecuaciones (2.15), o por (2.12) y
(2.14) respectivamente si se trata de un cuerpo rı́gido, o sus generalizaciones para un
sistema de cuerpos rı́gidos.
Para una configuración dada del sistema en un tiempo t, sólo hay ciertas veloci-
dades compatibles con las n condiciones de ligadura no holónomas. O sea que hay n
componentes de las velocidades que se pueden expresar en función de las 3N − n com-
ponentes restantes.
Velocidades posibles. Son las velocidades que para una configuración dada (~r1 ,
~r2 , ... ~rN ) del sistema en el tiempo t son compatibles con las k condiciones de ligadura.
Sólo hay entre las velocidades posibles un conjunto de velocidades (~r˙ 1 , ~r˙ 2 , ... ~r˙ N ) que
efectivamente toma el sistema. Las velocidades reales se hallan solamente al resolver el
problema mecánico completo.
Desplazamientos posibles. Son los ~r˙ i = ~r˙ i dt, i = 1, 2, ... N , cuando las ~r˙ i son
las velocidades posibles. Cuando las ~r˙ i son las velocidades reales para una configuración
dada, d~ri = ~r˙ i dt son los desplazamientos reales.
Tanto los desplazamientos reales como los posibles deben ser compatibles con las
h condiciones de ligadura holónomas; es decir, estas deben satisfacerse tanto en la con-
figuración (~r1 , ~r2 , ... ~rN ) como en la configuración (~r1 + d~r1 , ~r2 + d~r2 , ... ~rN + d~rN ),
siendo los d~ri desplazamientos posibles.
Se sigue entonces que los desplazamientos posibles deben satisfacer simultánea-
mente las k = h + n condiciones,
N
X
~lα · d~ri + Dα dt = 0 α = 1, 2, ... n (2.28)
i
i=1
N
X ∂fα ∂fα
· d~ri + dt = 0 α = 1, 2, ... h (2.29)
i=1
∂~ri ∂t
que se siguen de (2.11) y (2.15). ∂/∂~ri denota el gradiente respecto a las coordenadas
de la partı́cula i.
Desplazamientos virtuales. Son los desplazamientos posibles cuando se dejan

fijas las ligaduras durante el desplazamiento. Por ejemplo, si en la situación representada
por la figura 2.1 se permite que el plano x−y se mueva de manera conocida, las ligaduras
serán reónomas; supongamos que se trate sólo de un movimiento del plano en la dirección
z. En un desplazamiento virtual del disco se deja el plano x − y fijo mientras se efectúa
el desplazamiento. En un desplazamiento posible, el centro de masa del disco tiene

movimiento en la dirección z y en el plano x − y; en un desplazamiento virtual el centro
de masa sólo se mueve en el plano x − y.
Para hallar la condición para que los desplazamientos virtuales sean compatibles
con las ligaduras, consideremos dos conjuntos de desplazamientos posibles durante un
tiempo dt, d~ri = ~vi dt y d′~ri = ~vi′ dt, donde ~vi y ~vi′ son dos conjuntos de velocidades
posibles. Los d~ri satisfacen las ecuaciones (2.28) y (2.29) y d′~ri satisface,
N
X
~lα · d′~ri + Dα dt = 0 ; α = 1, 2, ... n (2.30)
i
i=1
N
X ∂fα ∂fα
· d′~ri + dt = 0 ; α = 1, 2, ... h (2.31)
i=1
∂~ri ∂t
En las ecuaciones (2.30) y (2.31), ~lαi y Dα están evaluadas en ~r1 , ~r2 , ... ~rN , t y
análogamente ∂fα /∂~ri y ∂fα /∂t.
Definimos los desplazamientos virtuales δ~ri como:
δ~ri = d′~ri − d~ri (2.32)
y las condiciones de su compatibilidad con las ligaduras son:
N
X
~lα · δ~ri = 0 ; α = 1, 2, ... n (2.33)
i
i=1
N
X ∂fα
· δ~ri = 0 ; α = 1, 2, ... h (2.34)
i=1
∂~ri
Ejemplo 2.3.1 Sea una partı́cula sometida a una fuerza externa F~ (x, y, t) y constreñida
a moverse solamente sobre una superficie descrita por la ecuación
Φ(x, y, z) = 0 (2.35)
Como la ligadura es holónoma, vemos que cualquier velocidad es posible si es

tangente a la superficie. La única condición sobre los desplazamientos virtuales es que
sean compatibles con la ligadura. En este caso es que satisfagan la ecuación (2.34), donde
Φ hace las veces de fα , es decir,
∂Φ ∂Φ ∂Φ
δx + δy + δz = 0 (2.36)
∂x ∂y ∂z
O sea que δx, δy, δz no pueden ser arbitrarios; sólo dos de ellos pueden serlo. En
otras palabras, hay dos grados de libertad. La ecuación de movimiento, F~ = m ~¨r, y la
ecuación de ligadura (2.35), deben ser compatibles. En efecto, (2.35) impone condiciones
a las velocidades posibles y a las aceleraciones posibles:
∂Φ ˙
· ~r = 0 (2.37)
∂~r
d ∂Φ ¨ ∂Φ
~r˙ · + ~r · =0 (2.38)
dt ∂~r ∂~r
la ecuación de movimiento será compatible con (2.38) sólo si:
d ∂Φ F~ ∂Φ
~r˙ · + · =0 (2.39)
dt ∂~r m ∂~r
Como F~ puede darse arbitrariamente, vemos que sólo por accidente se cumplirı́a
(2.39).
Por tanto concluimos que la superficie debe reaccionar sobre la partı́cula con una
fuerza suplementaria R ~ que dependerá de las condiciones iniciales, de la fuerza aplicada
~ se llama fuerza de reacción de la ligadura y ha de
y de la ecuación de la superficie. R
ser tal que:
m~¨r = F~ + R
~ (2.40)
Ahora tenemos seis incógnitas para el problema: x, y, z, Rx , Ry , Rz , en tanto hay

sólo las cuatro ecuaciones siguientes:
mẍ = Fx + Rx
mÿ = Fy + Ry
(2.41)
mz̈ = Fz + Rz
Φ(x, y, z) = 0
Faltan pues, dos ecuaciones adicionales. Para obtenerlas basta imponer la condición
de que la ligadura sea ideal. Esto quiere decir que R~ no realiza trabajo al efectuarse un
desplazamiento virtual. Es claro que si la superficie no tiene rozamiento (idealmente
~ será siempre normal a la superficie y como δ~r debe estar sobre la superficie se
suave), R
sigue que R~ y ~r son perpendiculares,
~ · δ~r = 0
R (2.42)
o también,
Rx δx + Ry δy + Rz δz = 0 (2.43)
~ no realiza trabajo en desplazamientos virtuales. Según la ecuación

Es decir, R
(2.36), δx, δy y δz no son independientes. Podemos expresar a δz en términos de δx y
δy.
Entonces la ecuación (2.33) puede escribirse en la forma:

∂Φ/∂x ∂Φ/∂y
Rx − Rz δx + Ry − Rz δy = 0 (2.44)
∂Φ/∂z ∂Φ/∂z
~ ha de satisfacer
Como δx, δy son diferentes de cero y arbitrarios, se sigue que R
además las ecuaciones:
∂Φ/∂x
Rx = Rz
∂Φ/∂z
(2.45)
∂Φ/∂y
Ry = Rz
∂Φ/∂z
completándose ası́ las seis ecuaciones requeridas.
Las ligaduras ideales. Se dice que las condiciones de ligadura sobre un sistema
mecánico son ideales si se cumple que el trabajo realizado por las fuerzas de reacción de
las ligaduras al efectuar desplazamientos virtuales de todas las partı́culas es cero:
N
X
~ i · δ~ri = 0
R (2.46)
i=1
Las fuerzas de fricción dependen del tipo de ligadura, sin embargo para este tipo de
fuerzas deben emplearse métodos que no impliquen la noción de “ligadura ideal”.
“Ensambles” y desplazamientos virtuales. Entenderemos por “ensamble” a

un conjunto de réplicas iguales de un sistema dinámico, donde la única diferencia entre
las réplicas es la configuración, que debe ser compatible con las condiciones de ligadura,
además, en estas réplicas las ligaduras están en idéntica condición; es decir, entre un
sistema y otro, para un tiempo dado, las ligaduras son idénticas. Podemos imaginar las
configuraciones de estos sistemas formando una red o matriz bidimensional: los elementos
de las “filas” constituyen un “ensamble” y las “columnas” dan los distintos estados de
un sistema cuando evoluciona el tiempo; cada fila está caracterizada por un valor del
tiempo y cada columna por una configuración. Al cambiar t a un valor vecino t + dt
los sistemas del ensamble experimentan desplazamientos reales (de una fila a otra). Al
realizarse un desplazamiento virtual, un sistema se convierte en otro vecino (de una
columna pasa a otra).
Ejemplo 2.3.2 Sean dos partı́culas de masas m1 y m2 que interactúan entre sı́ a través
de una varilla rı́gida sin masa. Están sometidas a una fuerza externa y en un estado de
movimiento arbitrario. Se trata de mostrar que la ligadura es ideal.
Todos los desplazamientos infinitesimales que no cambian la longitud de la varilla

son virtuales.
Las fuerzas ejercidas por la varilla sobre las partı́culas son de ligadura y dependerán
del estado de movimiento y de las fuerzas aplicadas sobre las partı́culas. Por ejemplo, si
rotan al rededor del centro de masa, las fuerzas de ligadura dependerán de la velocidad
angular de rotación.
Sean R~1 y R ~ 2 las fuerzas ejercidas por la varilla sobre las partı́culas, y G~1 y G
~2
las fuerzas ejercidas por las partı́culas sobre la varilla, por la tercera ley de Newton se
cumple que G ~ 1 = −R ~1 y G~ 2 = −R
~ 2.
~1 y G
G ~ 2 podrı́an producir aceleración del centro de masa de la varilla y aceleración
angular, pero como la masa de la varilla es cero, lo mismo que el momento de inercia,
se sigue que G~1 + G~ 2 = 0, lo mismo que el torque. Por lo tanto también se cumple que
~ ~
R1 = −R2 y como no hay torques, estos vectores estarán a lo largo de la varilla. El
trabajo virtual de las fuerzas de ligadura será:
~ 1 · δ~r1 + R
R ~ 2 · δ~r2 = R
~ 2 · (δ~r2 − δ~r1 ) (2.47)
Si llamamos ~r = ~r2 − ~r1 , δ~r = δ~r2 − δ~r1 , entonces un desplazamiento virtual δ~r
puede descomponerse en uno perpendicular a la varilla y en uno paralelo a la misma,
δ~r = δ~r⊥ + δ~rk (2.48)
Como la varilla es rı́gida, δ~rk → 0, luego:
~ 1 · δ~r1 + R
R ~ 2 · δ~r2 = R
~ 2 · δ~r = R
~ 2 · δ~r⊥ (2.49)
pero R~ 2 está a lo largo de la varilla, luego R ~ 1 · δ~r2 = 0 concluyéndose por tanto que la
ligadura es ideal. R ~ 1 · δ~r1 y R
~ 2 · δ~r2 no son cero por separado, pero sı́ su suma.
2.4. La ecuación general de la estática

Sea un sistema de N partı́culas. La fuerza sobre la partı́cula i se puede descomponer
(a)
en una fuerza aplicada (F~i ) y en una fuerza de reacción de las ligaduras (R ~ i ). Si el
sistema está en equilibrio se debe cumplir que:
(a)
F~i = F~i + R~ i = ~0 ; i = 1, 2, ...N (2.50)
El trabajo virtual de las F~i también será cero,

N
X N
X N
X
(a)
F~i · δ~ri = F~i · δ~ri + ~ i · δ~ri = 0
R (2.51)
i=1 i=1 i=1
Si suponemos que las ligaduras son ideales, ası́ las R ~ i no sean nulas, será nulo el
(a)
trabajo virtual realizado por ellas, ecuación (2.46). Aun en el equilibrio las F~i no serán
nulas, pero de (2.46) y (2.51) se sigue que el trabajo virtual de las fuerzas aplicadas debe
ser cero:
N
X (a)
F~i · δ~ri = 0 (2.52)
i=1
La ecuación (2.52) se llama la ecuación general de la estática o también el principio

de los trabajos virtuales. El contenido de la ecuación (2.52) es el siguiente: “para que
alguna configuración del sistema, compatible con las ligaduras, sea una posición de
equilibrio, es necesario y suficiente que en esa posición la suma de los trabajos virtuales
de las fuerzas efectivas sea cero”. Este enunciado se llama la “regla de oro de la mecánica”
y fue formulado por J. Bernoulli en 1717.
La compatibilidad de los desplazamientos virtuales con las ligaduras se expresa

a través de las ecuaciones (2.34). Por lo tanto los desplazamientos virtuales δ~ri en la
ecuación (2.52) no serán independientes, por lo que se pueden expresar k de ellos en
términos de los 3N − k restantes.
Las coordenadas generalizadas independientes permiten hallar una expresión a
partir de (2.52) que contenga los desplazamientos independientes e igualar a cero los
coeficientes. Este procedimiento hace posible hallar la configuración de equilibrio pero
no las fuerzas de ligadura.
Sistema de ecuaciones de la estática. La solución de un problema de estática

consiste en hallar la configuración de equilibrio (xi , zi , yi para i = 1, 2, ... N ), y las
fuerzas de reacción de las ligaduras (Rxi , Ryi , Rzi para i = 1, 2, ... N ). Son seis incógnitas
que se obtienen resolviendo simultáneamente las siguientes ecuaciones algebraicas:
(a)
F~i + R~i = 0 ; i = 1, 2, ... N (2.53)
N
X
~ i · δ~ri = 0
R (2.54)
i=1
fα (~r1 , ~r2 , ... ~rN ) = 0 ; α = 1, 2, ... k (2.55)

(a)
Como las F~i son funciones conocidas de las coordenadas, las R ~ i en la posición
de equilibrio se hallan con sólo conocer dicha posición, o sea que en (2.53) son 3N
~ i . Para hallar la configuración de equilibrio basta resolver
ecuaciones que determinan las R
las ecuaciones:
N
X (a)
F~i · δ~ri = 0 y fα (~r1 , ~r2 , ... ~rN ) = 0 ; α = 1, 2, ... k (2.56)
i=1
Como (2.55) debe cumplirse en las configuraciones ~r1 , ~r2 , ... ~rN y ~r1 + δ~r1 , ~r2 +
δ~r2 , ... ~rN + δ~rN , es cierto que:
N
X ∂fα
· δ~ri = 0 ; α = 1, 2, ... k (2.57)
i=1
∂~ri
Con lo cual es posible expresar k desplazamientos en términos de 3N − k. Escri-

bamos el conjunto de 3N coordenadas x1 , y1 , z1 , x2 , y2 , z2 , ...xN , yN , zN , en la forma
u1 , u2 , ... u3N de modo que tomamos a u1 , u2 , ... uk como k coordenadas que se pue-
den expresar en términos de las coordenadas uk+1 , uk+2 , ... u3N que tomaremos como
(a)
3N − k coordenadas independientes. Llamaremos análogamente Fs a las componentes
(a)
Fus . Con estas modificaciones las ecuaciones de la estática pueden escribirse como:
3N
X
Fs(a) δus = 0 (2.58)
s=1
3N
X ∂fα
fα (u1 , u2 , ... u3N ) = 0 ; δus = 0 ; α = 1, 2, ... k (2.59)
s=1
∂us
Introducimos las k cantidades λ1 , λ2 , ... λk , llamadas multiplicadores indetermi-

nados de Lagrange, de la siguiente manera: multiplicamos las ecuaciones (2.59) que
relacionan los δus por λα y sumamos sobre α para obtener:
3N X
X k
∂fα
λα δus = 0 (2.60)
s=1 α=1
∂us
Ahora sumamos (2.58) y (2.60):

3N k
!
X X ∂f α
Fs(a) + λα δus = 0 (2.61)
s=1 α=1
∂us
Tenemos k cantidades indeterminadas, λα , que podemos escoger de tal manera que

en (2.61) se anulen los coeficientes de los k desplazamientos dependientes δu1 , δu2 , ... δuk ,
es decir,
k
X ∂fα
Fs(a) + λα = 0; s = 1, 2, ... k (2.62)
α=1
∂us
Ahora, con (2.62), quedará (2.61) convertida en una combinación lineal igualada a
cero de las cantidades linealmente independientes δuk+1 , δuk+2 , ... δu3N . Lo anterior es
posible sólo si se anulan los coefientes, lo cual, junto con (2.62) conduce a:
k
X ∂fα
Fs(a) + λα = 0; s = 1, 2, ... 3N (2.63)
α=1
∂us
La ecuación general de la estática (2.58) queda convertida en las 3N ecuaciones

(2.63). Ahora hay k incógnitas adicionales, o sea 3N + k en total. Pero hay 3N + k
ecuaciones que son las (2.55) y las (2.63). La solución nos dará la posición de equilibrio
del sistema. Las fuerzas de ligadura se hallan de cualquiera de las expresiones:
Rs = −Fs(a) (u1 , u2 , ... u3N ) ; s = 1, 2, ... 3N (2.64)
k
X ∂
Rs = λα fα (u1 , u2 , ... u3N ) ; s = 1, 2, ...k (2.65)
α=1
∂us
Ejemplo 2.4.1 Sean dos partı́culas de masas m1 y m2 , unidas por una varilla rı́gida sin
masa y colocadas dentro de un cascarón esférico, en presencia de la gravedad (véase
figura la 2.3). Hallar la posición de equilibrio y las fuerzas de reacción de las ligaduras.
Las ecuaciones de ligadura, cuando se toma el origen de coordenadas en el centro

de la esfera, son:
(x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − l2 = 0
x21 + y12 + z12 − a2 = 0 (2.66)
x22 + y22 + z22 − a2 = 0

Donde a es el radio de la esfera y l ≤ 2a la longitud de la varilla. Tomando el eje

z en la dirección vertical, las fuerzas aplicadas son:
(a) (a)
F~1 = −m1 g k̂ ; F~2 = −m2 g k̂ (2.67)
Ecuación de equilibrio (2.58):
−m1 g δz1 − m2 g δz2 = 0 (2.68)
a
m
1
0
l
m
2
Figura 2.3 Masas m1 y m2 unidas por una varilla rı́gida sin masa y colocadas dentro de un
cascarón esférico
Compatibilidad de los desplazamientos virtuales con las ligaduras:
(x1 − x2 )δx1 + (x2 − x1 )δx2 + (y1 − y2 )δy1 +
(y2 − y1 )δy2 + (z1 − z2 )δz1 + (z2 − z1 )δz2 = 0

(2.69)
x1 δx1 + y1 δy1 + z1 δz1 = 0
x2 δx2 + y2 δy2 + z2 δz2 = 0
Las ecuaciones (2.69) indican que sólo tres desplazamientos virtuales pueden dar-
se independientemente. Escogeremos independientes a δy1 , δy2 , δz2 y dependientes a
δx1 , δx2 , δz1 . Las seis ecuaciones correspondientes a las dadas por la expresión (2.63)
se obtienen usando la matriz de tres filas y seis columnas ∂fα /∂us donde α = 1, 2, 3 y
s = 1, 2, ... 6. α = 1, 2, 3 corresponden a las ecuaciones (2.66) respectivamente y las us co-

rresponden a x1 , x2 , z1 , y1 , y2 , z2 respectivamente. Los elementos de la matriz ∂fα /∂us
son:
 
a −a b c −c −b
 
∂fα  
=  x 1 0 z 1 y 1 0 0 
 (2.70)
∂us  
0 x2 0 0 y2 z2
donde a = x1 − x2 , b = z1 − z2 y c = y1 − y2 .
Las ecuaciones (2.63) serán:
0 + λ1 (x1 − x2 ) + λ2 x1 + 0 = 0 (2.71)
0 + λ1 (x2 − x1 ) + 0 + λ3 x2 = 0 (2.72)
−m1 g + λ1 (z1 − z2 ) + λ2 z1 + 0 = 0 (2.73)
0 + λ1 (y1 − y2 ) + λ2 y1 + 0 = 0 (2.74)
0 + λ1 (y2 − y1 ) + 0 + λ3 y2 = 0 (2.75)
−m2 g + λ1 (z2 − z1 ) + 0 + λ3 z2 = 0 (2.76)
De (2.71), (2.72) y (2.73) obtenemos para λ1 , λ2 , λ3 :

x1 x2 − x1
λ1 = m1 g ; λ2 = m1 g
x2 z1 − x1 z2 x2 z1 − x1 z2
(2.77)
x1 x1 − x2
λ3 = m1 g
x2 x2 z1 − x1 z2
Reemplazando a (2.77) en (2.74), (2.75) y (2.76), obtenemos:
x2 y1 − x1 y2 x1 x2 y1 − x1 y2
= 0; =0
x2 z1 − x1 z2 x2 x2 z1 − x1 z2
(2.78)
m2 x1 x2 z1 − x1 z2
+ =0
m1 x2 x2 z1 − x1 z2
Si se cumple que x2 z1 − x1 z2 = 0, las ecuaciones (2.78) se convierten en:
x2 y1 − x1 y2 = 0; x2 z1 − x1 z2 = 0 (2.79)
La otra posibilidad es que x2 z1 − x1 z2 no sea cero. En este caso, de (2.78) salen
las dos relaciones diferentes:
x1 m2
x1 y2 = x2 y1 ; =− (2.80)
x2 m1
La solución (2.79) no tiene sentido pues implica:
~r1 × r~2 = (y1 z2 − z1 y2 )î − (x1 z2 − z1 x2 )ĵ + (x1 y2 − x2 y1 )k̂ = 0 (2.81)

O sea que los vectores de posición de las partı́culas son paralelos, independiente-
mente de las masas y la longitud de la varilla. Esta solución podrı́a ser aceptable en los
casos lı́mites en que l = 0 o l = 2a. La solución (2.80) da:1
y1 m2 x1 m2
=− ; =− (2.82)
y2 m1 x2 m1
Las relaciones (2.82) implican que el centro de masa se encuentra siempre sobre el
eje z. Las ecuaciones de ligadura se pueden escribir como:
2a2 − 2x1 x2 − 2y1 y2 − 2z1 z2 − l2 = 0 (2.83)
x21 + y12 + z12 − a2 = 0 (2.84)
x22 + y22 + z22 − a2 = 0 (2.85)
De reemplazar (2.82) en (2.83) obtenemos:

m2 2 m2 2
2a2 + 2 x +2 y − 2z1 z2 − l2 = 0 (2.86)
m1 2 m1 2
Usando (2.84) y (2.85) podemos escribir a (2.86) como:
s 2
2 m 2 2 2
m2
2a + 2 a − z2 − 2z2 a − 2 (a2 − z22 ) − l2 = 0 (2.87)
m1 m1
Despejando en (2.87) a (a2 − z2 2 ) obtenemos luego para z22 :

2
m2 2 l2
1+ a −
m1 2
z22 = 2 (2.88)
m2 m2 2
1+ a2 − l
m1 m1
z1 se obtiene de (2.74), (2.84) y (2.85):
2
2 2 m2
a − z1 = a2 − z22 (2.89)
m1
Lo cual conduce a:
2
m2 2 m2 l 2
1+ a −
m1 m1 2
z22 = 2 (2.90)
m1 m1 2
1+ a2 − l
m1 m1
Se ve fácilmente que al intercambiar las partı́culas, o sea en (2.88) al reemplazar
m2 por m1 y viceversa se obtiene (2.90).
1 En (2.77) resulta entonces que las λ son infinitas, o sea que las fuerzas de ligadura son infinitas.
Las ecuaciones (2.82) nos indican que:

y1 y2
= (2.91)
x1 x2
Observando la proyección de las partı́culas sobre el plano xy, vemos que la varilla
debe cortar el eje z, lo cual está de acuerdo con el hecho de que el centro de masa
está sobre el eje z en la posición de equilibrio. Lo anterior nos dice que la proyección de
la varilla sobre el plano xy es una lı́nea recta que pasa por el origen.
Debido a que de las tres ecuaciones (2.78) sólo se obtienen dos relaciones indepen-
dientes, vemos que habrá una indeterminación en los valores de x1 y y1 (y correspon-
dientemente de x2 , y2 ), lo cual es debido a la simetrı́a del problema bajo rotaciones en
el eje z. Podemos determinar solamente a ax21 + y12 y ax22 + y22 :
m
1
ϕ2
ϕ1
m x
2
Figura 2.4 Proyección de las partı́culas m1 y m2 sobre el plano xy

l2
l 2 a2 −
4
x22 + y22 = 2
m2 m2 2
a2 1 + − l (2.92)
m1 m1
2
m2
x21 + y12 = (x22 + y22 )
m1
De (2.86) y (2.68) obtenemos la siguiente expresión que nos permite analizar los
signos de z1 y z2 :
2
l2 m2 m1 l4
a2 a2 − 1+ +
2 m1 m2 4
z1 z2 = 2 (2.93)
m2 m1
a2 1 + − l2
m1 m2
Supongamos que l = 2a, con m1 6= m2 . Entonces,

z1 z2 = −a2 (2.94)
De tal forma que (2.88), (2.90) y (2.83) a (2.85) dan z12 = z22 = a2 . Hay para este
caso, pues, dos soluciones posibles: z1 = a, z2 = −a o z1 = −a, z2 = a, que corresponden
a la varilla vertical. Si además m1 = m2 , (2.88), (2.89) y (2.90) conducen a valores
indeterminados de z1 y z2 : cualquier posición es de equilibrio, lo cual está de acuerdo
con que el centro de masa está en O para todas las posiciones de la varilla. Para m1 = m2 ,
con l arbitrario, se obtiene de (2.88), (2.89) y (2.90):
l2
z12 = z22 = a2 − (2.95)
4
y de (2.93) se obtiene:
l2
z 1 z 2 = a2 − (2.96)
4
que indica que z1 y z2 deben tener el mismo signo. Las condiciones de ligadura no
contienen información acerca de si las partı́culas están dentro del cascarón o pegadas a él
(pudiendo moverse sin fricción); por esto (2.96) admite dos soluciones: z1 = z2 = a2 − l2 /4
o z1 = z2 = −(a2 − l2 /4). Es claro que la segunda solución es la única aceptable cuando
las partı́culas están colocadas simplemente dentro del cascarón. La posición del centro
de masa en un caso general es:
m1 z 1 + m2 z 2
zCM = =
m1 + m2

m2 2 m2 l 2 m2 2 l2
±m1 1 + a − ± m2 1 + a − (2.97)
m1 m 2 m1 2
s1 2
m2 m2 2
(m1 + m2 ) 1+ a2 − l
m1 m1
Es claro que cuando las partı́culas están dentro del cascarón debe excluirse la
solución en que z1 y z2 tienen ambas signos positivos. Las otras soluciones son:
Para z1 > 0 , z2 < 0:

m2
1− a2
m1
zCM = s 2 (2.98)
m2 m 2 2
1+ a2 − l
m1 m1
Para z1 < 0 , z2 > 0:

m2
− 1 a2
m1
zCM = s 2 (2.99)
m2 m2 2
1+ a2 − l
m1 m1
Para z1 < 0 , z2 > 0:

s 2
m1 m2 m2 2
zCM =− 1+ a2 − l (2.100)
m1 + m2 m1 m1
Las ecuaciones (2.98), (2.99) y (2.100) serán la expresión correcta para zCM de-
pendiendo del signo de z1 z2 en la ecuación (2.93). Estas ecuaciones pueden también
escribirse como:
m1 − m2 a2
zCM = r (2.101)
m1 + m2 1 m1 m2 2
a2 − l
m1 + m2 m1 + m2
m2 − m1 a2
zCM = r (2.102)
m1 + m2 1 m1 m2 2
a2 − l
m1 + m2 m1 + m2
r
1 m1 m2 2
zCM = − a2 − l (2.103)
m1 + m2 m1 + m2
Cuandop m1 = m2 sólo es válida (2.103). En ese caso, como es de esperarse zCM =

z1 = z2 = − a2 − l2 /4. En general (2.101) y (2.102) sólo serán válidas cuando se cumple
una de las desigualdades siguientes:

m2 m1
l2 > 2 1 + a2 o l 2 > 2 1 + a2 (2.104)
m1 m2
Para el cálculo de las fuerzas de reacción de las ligaduras se requiere evaluar los
λα . Los denominadores en las ecuaciones (2.77) se calculan usando las ecuaciones (2.80):

x2 m1
−z2 + z1 = −zCM 1 + (2.105)
x1 m2
Con lo cual las ecuaciones (2.77) nos dan:
m1 m2 g g g
λ1 = − ; λ2 = m2 ; λ3 = m2 (2.106)
m1 + m2 zCM zCM zCM
De acuerdo con (2.65), (2.71) a (2.76), se puede hallar la contribución de cada
ligadura a las fuerzas de reacción de las ligaduras. λ1 está asociada a la fuerza ejercida
por la varilla sobre las partı́culas, λ2 a la fuerza ejercida por el cascarón sobre la partı́cula
de masa m1 y λ3 a la fuerza ejercida por el cascarón sobre la partı́cula de masa m2 .
Estas fuerzas, en forma vectorial, son respectivamente:
λ1 (~r1 − ~r2 ); λ1 (~r2 − ~r1 ); λ2~r1 ; λ3~r2 (2.107)
La fuerza total, de la varilla y el cascarón, sobre la partı́cula de masa m1 y sobre

la de masa m2 respectivamente es:
(λ1 + λ2 )~r1 − λ1~r; (λ1 + λ3 )~r2 − λ1~r1 (2.108)

Utilizando las expresiones para los λα , las fuerzas ejercidas separadamente por la
varilla y el cascarón sobre las partı́culas de masas m1 y m2 respectivamente, son:
m1 m2 g ~r1 − ~r2 m1 m2 g ~r1 − ~r2 ~r1 ~r2
; ; m1 g ; m2 g (2.109)
m1 + m2 zCM m1 + m2 zCM zCM zCM
Por ejemplo, tomemos la solución de equilibrio estable cuando l = 2a y m1 > m2 :
x1 = x2 = y1 = y2 = 0, z1 = −a, z2 = a. En este caso r~1 = −ak̂, r~2 = ak̂, ~r1 − ~r2 = −2ak̂ y
zCM será:
m1 − m2
zCM = − a (2.110)
m1 + m2
Las fuerzas ejercidas sobre m1 por la varilla y el cascarón respectivamente son:
2m1 m2 g m1 (m1 + m2 )
−2aλ1 k̂ = − k̂ y − aλ2 k̂ = g k̂ (2.111)
m1 − m2 m1 − m2
Las fuerzas sobre la partı́cula de masa m2 son:
2m1 m2 g m2 (m1 + m2 )
2aλ1 k̂ = k̂ y aλ3 k̂ = g k̂ (2.112)
m1 − m2 m1 − m2
Las ecuaciones (2.111) y (2.112) nos dicen que la fuerza ejercida por el cascarón
sobre m2 no es cero y que la fuerza ejercida por el cascarón sobre m2 es diferente
de (m1 + m2 )g, lo cual contradice nuestra idea intuitiva de que las partı́culas están
“colocadas” dentro del cascarón (véase figura 2.3). El resultado que acabamos de obtener
nos dice que las partı́culas están “agarradas” del cascarón de alguna manera. Esto nos
ilustra una propiedad de las ecuaciones de ligadura del tipo (2.88), (2.89), (2.90), o sea
de las ligaduras holónomas bilaterales: las fuerzas de ligadura asociadas a las ligaduras
bilaterales se pueden ejercer en dos direcciones. Por esto en la parte más alta del cascarón,
ecuación (2.112), éste ejerce sobre la partı́cula de masa m2 una fuerza en la dirección
z negativa. La fuerza total sobre m1 y la fuerza total sobre m2 , usando las ecuaciones
(2.100) y (2.106), son respectivamente:
~ CM
R ~ CM
R
m1 g ; m2 g (2.113)
zCM zCM
Cuando l = 2a, la fuerza neta ejercida por las ligaduras sobre m1 es m1 g k̂ y sobre m2
es m2 g k̂. Es decir, las ligaduras ejercen sobre cada partı́cula una fuerza que contrarresta
su peso, como debe ser cuando las partı́culas están “agarradas” al cascarón.
El estudio del caso en que las partı́culas están simplemente “colocadas” en el
cascarón requiere reemplazar (2.66) por dos condiciones de ligadura unilaterales: r1 ≤ a,
r2 ≤ a. La solución se obtiene fácilmente a partir de la hallada cuando las ligaduras son
bilaterales.
2.5. Las ecuaciones de la estática en coordenadas ge-

neralizadas
Las ligaduras hacen que los desplazamientos virtuales de las partı́culas (δx1 , δy1 ,
δz1 ; ... δxn , δyn , δzn ) no sean todos independientes. Por esto en la ecuación general de
la estática, ecuaciones (2.52) y (2.58), no se tienen combinaciones lineales de cantidades

linealmente independientes y los coeficientes de los desplazamientos no se anulan. Si
introducimos las coordenadas generalizadas independientes (q), para lo cual es necesario
que el sistema sea holónomo, mediante las ecuaciones de transformación (2.21), podemos
expresar los δ~ri en términos de los δqν :
Xl
∂~ri
δ~ri = δqν (2.114)
ν=1
∂q ν
donde l es el número de grados de libertad; l = 3N − k, con k = h, puesto que en estática

no hay ligaduras no holónomas.
Entonces la ecuación (2.52) toma la forma:
N l l N
!
X (a)
X ∂~
ri
X X (a) ∂~
ri
F~i · δqν = F~i · δqν = 0 (2.115)
i=1 ν=1
∂qν ν=1 i=1
∂qν
En la ecuación (2.115) se tiene una combinación lineal de los desplazamientos

virtuales independientes δqν igualada a cero. Por esto se debe cumplir que:
N
X (a) ∂~
ri
Q(a)
ν ≡ F~i · = 0; ν = 1, 2, ... l (2.116)
i=1
∂qν
(a)
Qν se denomina la fuerza generalizada asociada al grado de libertad qν . En coor-
(a)
denadas generalizadas las condiciones de equilibrio son Qν = 0 para ν = 1, 2, ... l, que
proporciona un sistema de l ecuaciones algebraicas simultáneas con las l incógnitas
q1 , q2 , ... ql que son las coordenadas generalizadas en la posición de equilibrio. En cuan-
to a las fuerzas de ligadura, de la ecuación (2.50) se sigue que la fuerza de reacción de
las ligaduras asociada al grado de libertad qν también es cero:
N
X XN
Eν = ~ i . ∂~ri = −
R F~i (a) ·
∂~ri
ν = 1, 2, ... l (2.117)
i=1
∂qν i=1
∂qν
Se sigue de (2.117) que sólo serán diferentes de cero las fuerzas asociadas a las
3N − l = k coordenadas “superfluas”. Como en coordenadas generalizadas desaparecen
las ecuaciones de ligadura, se sigue que las fuerzas de ligadura también se anulan, de
acuerdo con la idea de que en el espacio de configuración no euclidiano, definido por
las coordenadas generalizadas, el efecto de las ligaduras es asociado con la propiedad
geométrica de “curvatura del espacio”.
Fuerzas derivables de un potencial. Si las fuerzas aplicadas se pueden obtener

a partir de una función V (~
rl , r~2 , ... ~rN , t) en la forma:
(a) ∂V
F~i = − ; i = 1, 2, ... N (2.118)
∂~ri
Las condiciones de equilibrio en coordenadas generalizadas son, para este caso:
N
X ∂V ∂~ri ∂V
Q(a)
ν =− · =− ; i = 1, 2, ... l (2.119)
i=1
∂~ri ∂qν ∂qν
Las ecuaciones (2.119) dicen que la posición de equilibrio estática es aquella para
la cual la función de energı́a potencial tiene un mı́nimo o un máximo respecto a todas
las coordenadas generalizadas. Sin definir estrictamente la estabilidad de un sistema,
podemos decir que un mı́nimo en V corresponde a equilibrio estable, y un máximo a
equilibrio inestable; las condiciones rigurosas de estabilidad están dadas por el teorema
de Lagrange y los teoremas de Liapunov y Chetayev (véase el capı́tulo 5 del libro Lectures
in analytical mechanics de Gantmacher).
A manera de ilustración, consideraremos una partı́cula colocada sobre una esfera de
radio a que puede variar con el tiempo. Las coordenadas generalizadas pueden tomarse
como θ, φ, de acuerdo con la ecuación (2.24). A las fuerzas aplicadas se les pueden
asociar las fuerzas generalizadas Qθ , Qφ . La condición de equilibrio es Qθ = Qφ = 0, o sea
que no haya torques externos en las direcciones de θ y φ. En el equilibrio, la partı́cula se
moverá sobre la superficie de la esfera sin aceleración o permanecerá en reposo respecto
a la misma. Con coordenadas generalizadas no es posible obtener la fuerza de ligadura
en la dirección radial.
Ejemplo 2.5.1 Hallar la configuración de equilibrio para el problema del ejemplo 2.4.1
en coordenadas generalizadas.
La figura 2.5 muestra una configuración general del sistema. Se requiere hallar
tres parámetros independientes compatibles con las ligaduras y expresar en términos de
ellos las coordenadas de las partı́culas. Luego, hallar las fuerzas generalizadas asociadas
a esos parámetros. La configuración de equilibrio estará dada por los valores de los
parámetros que anulan las fuerzas generalizadas. Las coordenadas generalizadas serán
tres parámetros que ubican la posición del triángulo rı́gido: 012. Como el vector de
posición del centro de masa ~rCM es fijo respecto al triángulo 012, dos parámetros podrı́an
ser φCM , θCM y el tercer parámetro serı́a un ángulo de rotación del triángulo alrededor de
~rCM . Sin embargo, resultan más convenientes los tres ángulos de Euler que determinan
la ubicación de un sistema de coordenadas cartesianas x′ , y ′ , z ′ , fijo al triángulo, respecto
al sistema de coordenadas espacial x, y, z.
Los ángulos de Euler permiten mediante tres rotaciones sucesivas obtener los ejes
x′ , y ′ , z ′ a partir de los ejes x, y, z: primero se rota alrededor del eje z por un ángulo
φ, con lo cual el eje x pasa a ser cierto eje ξ; luego se rota alrededor del eje ξ por un
ángulo θ, con lo cual z pasará a ser cierto eje ξ ′ ; luego se rota alrededor del eje ξ ′ por
un ángulo ψ, con lo cual se obtendrá la posición final de los ejes x′ , y ′ , z ′ . La figura 2.6
muestra estas tres rotaciones.
La figura 2.7 muestra la ubicación del triángulo mediante los ángulos de Euler
φ, θ, ψ. Se escoge el eje z ′ a lo largo de la lı́nea que une a O con el centro de masa,
y ′ perpendicular a 0−CM en el plano del triángulo, y x′ perpendicular al plano del
triángulo.
Las coordenadas de las partı́culas respecto a los ejes x′ , y ′ , z ′ son:
x′1 = 0 x′2 = 0
β β
y1′ = −a sen −α y2′ = a sen +α
2 2
(2.120)

β β
z1′ = a cos −α z2′ = a cos +α
2 2
2
l
1
r2
r1 θ1 θ2
ϕ2
ϕ1
Figura 2.5 Configuración de equilibrio del sistema de dos masas unidas por una varilla rı́gida
(del ejemplo 2.4.1)
z,ζ ζ′ z zi ′ z
θ
θ yi′
η′
η
y
y y
x x ϕ
ϕ x ϕ
ψ xi′
ζ ζ′
Figura 2.6 Los ángulos de Euler φ, θ y ψ
Llamando ~rm la posición del punto medio de la varilla, obtenemos la siguiente

expresión que relaciona a cos α con cos β:
a2
~rCM · ~rm = (1 + cos β) = rCM rm cos α (2.121)
2
z
zi ′ 2 1 z i′
y i′ × CM
1 × CM 2
θ α
a a
y β
0
xi′ y i′
ϕ ψ
0
Figura 2.7 Ubicación del triángulo mediante los ángulos de Euler
De la definición de ~rCM y de la geometrı́a se sigue que:

s
m1 m2 l2
rCM = a 1 − (2.122)
(m1 + m2 ) a2
2
r
l2
rm = a 1− (2.123)
4a2
r
l2 β l β l2
cos β = 1 − 2 ; sen = ; cos = 1− (2.124)
2a 2 2a 2 4a2
Usando (2.122), (2.123) y (2.124) se obtienen de (2.121) las siguientes expresiones

para senα y cos α:
l m1 − m2 1
sen α = s
2a m1 + m2 m1 m2 l2
1−
(m1 + m2 )2 a2
v (2.125)
u
u l2
u 1− 2
cos α = u
u
4a
t m1 m2 l2
1−
(m1 + m2 ) a2
2
De (2.120), (2.124) y (2.125) se deducen las siguientes expresiones para las coor-
denadas de las partı́culas respecto a los ejes x′ , y ′ y z ′ :
x′1 = x′2 = 0 (2.126)

v
u
u l2
′ m2 u u
1−
4a2
y1 = −l u (2.127)
m1 + m2 t m1 m2 l2
1−
(m1 + m2 ) a2
2
l2 m2
1− 2
′ 2a m1 + m2
z1 = a s (2.128)
m1 m2 l2
1−
(m1 + m2 )2 a2
v
u
u l2
m u 1− 2
1 u 4a
y2′ = l u (2.129)
m1 + m2 t m1 m2 l2
1−
(m1 + m2 ) a2
2
l2 m1
1− 2
′ 4a m1 + m2
z2 = a s (2.130)
m1 m2 l2
1−
(m1 + m2 )2 a2
Definamos las variables c = cos ψ, c′ = cosφ, c′′ = cos θ, s = senψ, s′ = senφ y
s = senθ. Las ecuaciones de transformación del sistema de coordenadas x′ , y ′ , z ′ al
′′
sistema de coordenadas x, y, z son las siguientes [ver (2.118)]:

 
x
 
 
 y =
 
 
z
  ′  (2.131)
c c′ − s s′ c′′ −s c′ − c′′ s′ c s′′ s′ x
  
  
 c s′ + c′′ c′ s −s s′ + c′′ c′ c −s′′ c′   y ′ 
  
  
s′′ s s′′ c c′′ z′
Como las componentes del vector de posición del centro de masa en los ejes x′ , y ′ ,
′
z son:
′
x′CM = yCM = 0; ′
zCM = rCM , (2.132)
se deduce de (2.131) que respecto a los ejes x, y, z las coordenadas del centro de masa
son:
xCM = rCM senθ senφ
yCM = −rCM senθ cos φ (2.133)
zCN = rCM cos θ

Las fuerzas generalizadas se obtienen usando las ecuaciones (2.67) y (2.116):

∂z1 ∂z2 ∂zCM
Qν = −m1 g − m2 g = −g(m1 + m2 ) (2.134)
∂qν ∂qν ∂qν
donde en este caso tomanos q1 = φ, q2 = θ, q3 = ψ. De (2.133) y (2.134) se sigue
inmediatamente que:
Qφ ≡0
Qψ ≡0 (2.135)
Qθ = (m1 + m2 )grCM senθ

Las condiciones de equilibrio son Qν = 0, lo cual da las siguientes ecuaciones:
0 = 0, 0 = 0, senθ = 0 (2.136)
Se sigue de (2.136) que las configuraciones de equilibrio son aquellas para las cuales
θ = 0 o θ = π, donde φ y ψ pueden tomar cualquier valor. Como para θ = 0 y θ = π,
φ y ψ están en el mismo plano, realmente sólo hay un ángulo arbitrario: todas las
configuraciones que se obtienen por rotar alrededor del vector de posición del centro de
masa son de equilibrio, donde el centro de masa está sobre el eje z.
Las configuraciones de equilibrio respecto a los ejes x, y, z se obtienen de (2.131)
con ψ y φ arbitrarios:
    ′ 
x cos(ψ ± φ) −sen(ψ ± φ) 0 x
    
    ′ 
 y  =  sen(φ ± ψ) cos(φ ± ψ) 0  y 
  (2.137)
   
    
z 0 0 ±1 z′
Donde el signo superior se refiere al caso en que θ = 0 y el inferior a φ = π.
Explı́citamente (2.137) da:
x = x′ cos(ψ ± φ) − y ′ sen(ψ ± φ)
y = x′ sen(φ ± ψ) + y ′ cos(φ ± ψ) (2.138)
z = ±z ′
en concordancia con lo dicho anteriormente. En la configuración de equilibrio estable,
θ = π, las coordenadas de las partı́culas, de acuerdo con (2.138) y (2.126) a (2.130), son:
l2 m2 l2 m1
1− 2 1− 2
2a m1 + m2 2a m1 + m2
z1 = −a s ; z2 = −a s (2.139)
m1 m2 l2 m1 m2 l2
1− 1−
(m1 + m2 )2 a2 (m1 + m2 )2 a2
de acuerdo con los resultados obtenidos anteriormente [ecuaciones (2.88) y (2.90)]. Los
resultados (2.80) también se obtienen directamente de (2.138).
2.6. La ecuación general de la dinámica

Si un sistema no está en equilibrio, la fuerza neta sobre cada una de las partı́culas
no es cero sino, de acuerdo con la segunda ley de Newton, es igual al producto de su
masa por su aceleración:
(a) ~ i = mi~¨ri ;
F~i = F~i + R i = 1, 2, ...N (2.140)
Debido a que consideramos ligaduras ideales, que no realizan trabajo sobre el

sistema como un todo al desplazar virtualmente todas las partı́culas, se sigue que:
n
X
(a)
F~i − mi~¨r i · δ~ri = 0 (2.141)
i=1

(a)
La cantidad F~i − mi~¨r i ·δ~ri no es cero, pero su suma sı́ lo es. La fórmula (2.141)
se llama la ecuación general de la dinámica o también el principio de D’alembert. Esta
ecuación establece lo siguiente: “en todo instante en un sistema dinámico la suma de
(a)
las fuerzas efectivas F~i y de las fuerzas de inercia −mi~rï no realiza trabajo al efectuar
desplazamientos virtuales del sistema”, o más en general establece que: “la ecuación
general de la dinámica expresa una condición necesaria y suficiente para que un movi-
miento compatible con las ligaduras sea a la vez compatible con las fuerzas aplicadas”.
Esta ecuación es aplicable a cualquier sistema ideal, holónomo o no holónomo.
Como hay 3N − k desplazamientos virtuales independientes, la ecuación general
de la dinámica proporciona 3N − k ecuaciones, al igualar a cero los coeficientes de los
desplazamientos virtuales independientes, que junto con las k ecuaciones de ligadura
constituye un sistema de 3N ecuaciones con 3N incógnitas. Esta vez, a diferencia del
caso estático, las ecuaciones no serán algebraicas sino diferenciales.
(a+f ) (a)
Si llamamos F~i = F~i − mi~rï la ecuación (2.141) queda ası́:
N
X (a+f )
F~i · δ~ri = 0 (2.142)
i=1
o sea que la ecuación general de la dinámica toma la misma forma de la ecuación general
de la estática. Esta ecuación puede interpretarse como una ecuación para caracterizar
en cada instante del tiempo la posición de equilibrio del sistema donde a las fuerzas
(a)
efectivas F~i se les adicionan las fuerzas ficticias o inerciales −mi~¨r i . Más precisamente,
el principio de D’alembert (1760) dice: “cualquier posición de un sistema dinámico puede
considerarse como una posición de equilibrio instantáneo si a las fuerzas aplicadas que
actúan sobre el sistema se agregan las fuerzas ficticias o de inercia”. La regla de oro de
J. Bernoulli queda aplicable también en la dinámica. A −mi~¨r i se llama fuerza inercial
de D’alembert. En el problema estático asociado, las fuerzas de reacción de las ligaduras
coinciden con las del problema original, dinámico.
Ejemplo 2.6.1 Sea un recipiente lleno de agua que se mueve con una aceleración ~a per-
pendicular a la fuerza de gravedad (véase figura 2.8). Hallar la forma y la posición de la
superficie del agua.
Cuando ~a = 0, la única fuerza aplicada sobre cada elemento de volumen es la de

gravedad; las fuerzas ejercidas por el resto del lı́quido pueden asumirse como de reacción.
La forma de la superficie en el caso estático es plana y horizontal, perpendicular a la
fuerza aplicada.
dm
–dma a
F ( a) = –dmgk
Figura 2.8 Diagrama de fuerzas ejercidas sobre el elemento de masa dm
En el caso dinámico, a cada elemento de masa dm se le aplica adicionalmente una

fuerza ficticia −dm ~a. La superficie del agua será ahora un plano perpendicular a la
fuerza F~ (a+f ) . La inclinación de la superficie estará dada por:
a
tan φ = (2.143)
g
Ejemplo 2.6.2 Sean dos partı́culas en un doble plano inclinado, unidas por una cuerda
inextensible sin masa (véase figura 2.9). Hallar la condición de equilibrio. Resolver el
problema dinámico.
Las ligaduras son:
z1 = 0 z2 = 0
y1 = x1 tan α1
(2.144)
y2 = −x2 tan α2
p p
x21 + y12 + x22 + y22 = l
y
α2 α1 z
m
m1 2
α1 α2
Figura 2.9 Dos partı́culas en un doble plano inclinado, unidas por una cuerda inextensible
sin masa.
Hay sólo un grado de libertad. Los desplazamientos virtuales son a lo largo de

los planos, como los desplazamientos reales. El principio de los trabajos virtuales nos
conduce a:
−m1 g ĵ · δ~r1 − m2 g ĵ · δ~r2 = 0 (2.145)
es decir:
−m1 tan α δx1 + m2 tan α2 δx2 = 0 (2.146)
De la condición de ligadura impuesta por la cuerda se obtiene:

cos α1
δx1 = δx2 (2.147)
cos α2
Con lo cual la ecuación de equilibrio queda ası́:

cos α1
−m1 tan α1 + tan α2 δx2 = 0 (2.148)
cos α2
Como δx2 es arbitrario, se obtiene que:
m1 senα1 = m2 senα2 (2.149)
O sea que cuando los ángulos y las masas sean tales que se cumple la anterior
condición, el sistema estará en equilibrio en cualquier posición.
Para el caso dinámico, o sea cuando m1 senα1 6= m2 senα1 , aplicamos la ecuación
general de la dinámica:
(m1~g − m1~a1 ) · δ~r1 + (m2~g − m2~a2 ) · δ~r2 = 0 (2.150)
Las aceleraciones deben ser compatibles con las ligaduras, con lo cual se obtienen
las siguientes relaciones:
cos α1
a1x = a2x ; a1y = a1x tan α1 ; a2y = −a2x tan α2 (2.151)
cos α2
Además, entre los desplazamientos virtuales hay estas tres relaciones:

cos α2 senα2
δy1 = δx1 tan α1 ; δx2 = δx1 ; δy2 = −δx1 (2.152)
cos α1 cos α1
Al expresar en la ecuación general de la dinámica todas las componentes de las
aceleraciones en términos de a1x y todos los desplazamientos virtuales en términos de
δx1 , obtenemos:
"
senα2
− m1 g tan α1 + m2 g
senα1
# (2.153)
−(m1 sec2 α1 + m2 sec2 α1 ) a1 x δx1 = 0
Con lo cual se obtiene a a1x y por consiguiente a a1y . La magnitud de ~a1 será:
|m1 g senα1 − m2 g senα2 |
a1 = (2.154)
m1 + m2
La aceleración a2 tiene igual magnitud. Las componentes x de las aceleraciones
son iguales y de signos contrarios.
Sistema de ecuaciones de la dinámica. Para sistemas holónomos, el principio

de D’alembert permite usar los resultados obtenidos en el caso estático. Las ecuaciones
(a)
(2.63) nos permiten obtener las ecuaciones de movimiento con sólo reemplazar a F~i
(a)
por F~i − mi~¨r i :
N
X
(a) ∂fα
F~i − mi~¨r i + λα =0 (2.155)
α=1
∂~ri
Para un sistema no holónomo, además de lo anterior, los desplazamientos virtuales

deben satisfacer las relaciones (2.33):
N
X
~lα · δ~ri = 0 ; α = 1, 2, ... n (2.156)
i
i=1
Debemos entonces introducir los multiplicadores de Lagrange adicionales µ1 , µ2 ,

...µn , que escogeremos de modo que se anulen los coeficientes de los n desplazamientos
dependientes adicionales. Para ello, multiplicamos (2.33) por µα y sumamos sobre α:
N X
X n
µα ~lαi · δ~ri = 0 (2.157)
i=1 α=1
Claramente se ve que en este caso las ecuaciones de movimiento tomarán la si-

guiente expresión:
h
X n
(a) ∂fα X ~
mi~rï = F~i + λα + µα lαi ; i = 1, 2, ... N (2.158)
α=1
∂~ri α=1
Estas 3N ecuaciones contienen las 3N + n + h incógnitas ~r1 , ~r2 , ... ~rN , λ1 , λ2 ,

...λh , µ1 , µ2 , ...µn que junto con las n + h condiciones de ligadura (2.11) y (2.15) nos
dan 3N + n + h ecuaciones con 3N + n + h incógnitas. Esta vez las ecuaciones serán
diferenciales acopladas. Las fuerzas de ligadura estarán dadas por:
h
X n
~i = ∂fα X ~
R λα + µα lαi ; i = 1, 2, ... N (2.159)
α=1
∂~ri α=1
Las ecuaciones (2.158) se llaman ecuaciones de Lagrange de la primera clase y

fueron dadas por Lagrange en el año de 1788. La ecuación (2.159) nos permite obtener la
contribución de cada ligadura a las fuerzas de reacción de las ligaduras. Este formalismo
es aplicable a cualquier sistema mecánico con ligaduras ideales, holónomo o no holónomo,
sometido a fuerzas conservativas o no conservativas.
Ejemplo 2.6.3 Sea un alambre largo, rı́gido, que gira uniformemente alrededor de un
eje perpendicular a él. Una bolita se desliza en el alambre sin fricción. No hay fuerzas
aplicadas (véase figura 2.10). Hallar la trayectoria de la partı́cula y las fuerzas de reacción
de la ligadura.
Elegimos las coordenadas de modo que el alambre permanece en el plano x − y. La
ecuación de ligadura es:
tan ωt x − y = 0 (2.160)
ωt
0 x
Figura 2.10 Alambre largo y rı́gido que gira uniformemente alrededor de un eje perpendicular
a él. La masa m se desliza sobre él sin fricción.
Las ecuaciones (2.158) y (2.159) para este caso son:

mẍ = λ tan ωt (2.161)
mÿ = −λ (2.162)
Rx = λ tan ωt ; R − y = −λ (2.163)
La ecuación de ligadura nos proporciona la siguiente ecuación diferencial, que junto

con (2.161) y (2.162) nos permite obtener a x, y, λ:
ÿ = ẍ tan ωt + 2ẋω sec2 ωt + 2ω 2 x sec2 ωt tan ωt (2.164)

La ecuación diferencial para x es:
ẍ + 2ω ẋ tan ωt + 2ω 2 x tan2 ωt = 0 (2.165)
Haciendo la sustitución x = u cos ωt obtenemos la siguiente ecuación diferencial

para u:
ü − ω 2 u = 0 (2.166)
Con lo cual la solución para x, y, λ es:
x = A cosh ωt cos ωt (2.167)
y = A cosh ωt senωt (2.168)
λ = −2Amω 2 senhωt cos ωt (2.169)
Las componentes de la fuerza de reacción de la ligadura son:
Rx = −2Amω 2 senhωt senωt ; Ry = 2Amω 2 senhωt cos ωt (2.170)

~ con el eje x está dado por:
El ángulo de R
Ry
= cot ωt (2.171)
Rx
~ es siempre perpendicular al alambre y su magnitud es R = 2Amω 2 senhωt.
o sea que R
2.7. Las ecuaciones de la dinámica en coordenadas

generalizadas para sistemas holónomos
Al introducir las coordenadas generalizadas independientes las ecuaciones de liga-
dura se satisfacen idénticamente. El paso a coordenadas generalizadas de la ecuación
general de la dinámica se puede realizar en forma análoga al caso de la estática en vir-
tud del principio de D’alembert. De acuerdo con las ecuaciones (2.142) y (2.116) las
ecuaciones de movimiento en coordenadas generalizadas son:
N
X (a+f ) ∂~ri
Q(a+f
ν
)
= F~i · = 0; ν = 1, 2, ... l (2.172)
i=1
∂qν
o, más explı́citamente,
XN ∂~r
(a) i
F~i − mi~¨r i · = 0; ν = 1, 2, ... l (2.173)
i=1
∂qν
Definimos la fuerza generalizada aplicada asociada al grado de libertad ν por:

N
X (a) ∂~
ri
Q(a)
ν = F~i · (2.174)
i=1
∂qν
La fuerza generalizada asociada correspondiente a la fuerza de inercia se puede

relacionar con la energı́a cinética de la siguiente manera:
N
X d~r˙i ∂~ri
Q(f
ν
)
= − mi ·
i=1
dt ∂qν
XN
d ˙ ∂~ri ˙ d ∂~ri
= − mi ~ri · − mi~ri · (2.175)
dt ∂qν dt ∂qν
i=1
Podemos expresar en (2.175) a ∂~ri /∂qν y su derivada temporal en términos de

derivadas respecto a ~r˙ i . Para ello partimos de la siguiente expresión para ~r˙ i :
Xl
∂~ri ∂~ri
~r˙ i = q̇µ + (2.176)
µ=1
∂q µ ∂t
mediante la cual obtenemos:

l
∂~r˙i ∂~ri d ∂~ri X ∂ 2~ri ∂ 2~ri
= ; = q̇µ + (2.177)
∂ q̇ν ∂qν dt ∂qν µ=1
∂qµ ∂qν ∂t∂qν
Por otra parte tenemos que:

l
∂~r˙ i ∂ d~ri X ∂ 2~ri ∂ 2~ri
= = q̇µ + (2.178)
∂qν ∂qν dt µ=1
∂qν ∂qµ ∂qν ∂t
De (2.177) y (2.178) se sigue entonces que:
∂~r˙i ∂~ri d ∂~ri ∂~r˙i

= ; = (2.179)
∂ q̇ν ∂qν dt ∂qν ∂qν
Mediante (2.179) el lado derecho de (2.175) se transforma en:
N
" ! #
X d ˙ ∂~r˙ i ∂ ˙i
~
r
− mi ~ri · − mi~r˙ i · =
i=1
dt ∂qν ∂qν
(2.180)
N N
d X1 ∂ ˙2 X 1 ∂ ˙2
− mi ~ri + mi ~r
dt i=1 2 ∂ q̇ν i=1
2 ∂qν i
Las ecuaciones (2.174) y (2.180) nos permiten escribir a (2.173) en la forma:

d ∂T ∂T
Q(a)
ν − + = 0; ν = 1, 2, ... l (2.181)
dt ∂ q̇ν ∂qν
Igual que en el caso estático las fuerzas generalizadas de ligadura se anulan, según
una ecuación análoga a la (2.117).
Las ecuaciones (2.181) se denominan las ecuaciones de Lagrange de la segunda
clase. En esas ecuaciones T es la energı́a cinética del sistema. Una vez resueltas las ecua-
ciones (2.181) mediante las fórmulas de transformación (2.21) y (2.23) se hallan los ~ri (t)
(a)
con los cuales se pueden hallar F~i (t) y ~¨ri que permiten obtener de (2.140) las fuerzas
de reacción de las ligaduras.
Fuerzas derivables de un potencial. Si todas las fuerzas aplicadas se pue-

den obtener de una función V mediante las fórmulas (2.118), las fuerzas generalizadas
tomarán la forma:
∂
Q(a)
ν =− V (q, t) ; ν = 1, 2, ... l (2.182)
∂qν
Como ∂V /∂ q̇ν = 0, (2.181) se pueden escribir:

d ∂(T − V ) ∂
− (T − V ) = 0 ν = 1, 2, ... l (2.183)
dt ∂ q̇ν ∂qν
T en coordenadas generalizadas depende de (q), (q̇) y de t en el caso en que las li-

gaduras sean reónomas. Se define la función lagrangiana, o simplemente “el lagrangiano”
L ası́:
L(q, q̇, t) ≡ T (q, q̇, t) − V (q, t) (2.184)
Entonces las ecuaciones de movimiento para un sistema holónomo con fuerzas

derivables de un potencial que no depende de las velocidades son:
d ∂L ∂L
− = 0; ν = 1, 2, ... l (2.185)
dt ∂ q̇ν ∂qν
Las ecuaciones (2.185) se denominan usualmente “ecuaciones de Lagrange” y hay

una por cada grado de libertad del sistema.
Covariancia de las ecuaciones de Lagrange. Sean dos conjuntos diferentes de

coordenadas generalizadas (q) y (q) relacionadas mediante la transformación:
qν = qν (q, t) ; q ν = q ν (q, t) ; ν = 1, 2, ... l (2.186)
Esta transformación que no mezcla coordenadas con velocidades se denomina pun-

tual. Queremos hallar si en las coordenadas (q) las ecuaciones de Lagrange toman la
forma de (2.185) en las coordenadas (q). Mediante la transformación (2.186) tenemos
que:
Xl Xl
∂L ∂L ∂ q̇α ∂L ∂qα
= = (2.187)
∂ q̇ν α=1
∂ q̇α ∂ q̇ ν α=1
∂ q̇α ∂qν
donde L es la función de (q), (q̇) y t, que se obtiene de L(q, q̇, t) al realizar la transfor-
mación: L(q, q,˙ t) ≡ L q(q, t), q̇(q, q̇, t), t . Por otra parte:
l
"
d ∂L X d ∂L ∂qα
=
dt ∂ q̇ν α=1
dt ∂ q̇α ∂qα
l
!#
∂L X ∂ 2 qα ∂ 2 qα
+ + (2.188)
∂ q̇α µ=1 ∂qµ ∂q ν ∂t∂q ν
Xl
∂L ∂L ∂qα ∂L ∂ q̇α
= + (2.189)
∂q µ α=1
∂qα ∂q ν ∂ q̇α ∂qν
Entonces se sigue de (2.188), (2.189) y (2.185) que:
Xl
d ∂L ∂L d ∂L ∂L ∂ q̇α
− = − =0 (2.190)
dt ∂ q̇ν ∂q ν α=1
dt ∂ q̇α ∂qα ∂q ν
Es decir, la forma de las ecuaciones de Lagrange es la misma en cualquier sis-

tema de coordenadas generalizadas. Es interesante la siguiente relación que se obtiene
directamente usando la transformación puntual (2.186):
Xl Xl
∂L ∂L
q̇ν = q̇ ν (2.191)
α=1
∂ q̇ν ν=1
∂ q̇ν
Sistema sin ligaduras. Si no hay ligaduras las fórmulas (2.185) siguen siendo
válidas, donde l = 3N . Se sigue de (2.190) que cuando el sistema no tiene ligaduras las
ecuaciones de Lagrange (2.185) constituyen la forma de las ecuaciones de movimiento
en cualquier sistema de coordenadas, propiedad que no cumplen las ecuaciones de la
segunda ley de Newton, que son de naturaleza vectorial: las ecuaciones de Lagrange
contienen la misma información que la segunda ley de Newton con la ventaja adicional
de ser ecuaciones completamente covariantes.
En coordenadas cartesianas las fuerzas generalizadas son de la forma Qxi , Qyi ,
Qzi .
N
X X (a) N
(a) ∂~
ri (a)
Qxj = F~i · = F~i · µ̂x δij = Fix (2.192)
i=1
∂xj i=1
N
X 1
T = mi ẋ2i + ẏi2 + żi2 (2.193)
i=1
2
Con lo cual las ecuaciones (2.181) nos dan:

(a)
mi ẍi = Fix (2.194)
es decir, las ecuaciones de Lagrange conducen a la segunda ley de Newton.
Comparación de los formalismos newtoniano y lagrangiano. Llamaremos

newtoniano al formalismo basado en la ecuación general de la dinámica directamente.
Este formalismo tiene la ventaja de su generalidad. Sin embargo, para sistemas holóno-
mos con fuerzas derivables de un potencial, el formalismo basado en las ecuaciones de
Lagrange presenta algunas ventajas: las ecuaciones de movimiento se obtienen a partir
de una sola función escalar, la lagrangiana L, en tanto que en el formalismo newtoniano
se trabaja con las fuerzas que actúan sobre las partı́culas. El uso de coordenadas ge-
neralizadas permite en el formalismo lagrangiano eliminar del problema las fuerzas de
ligadura y las coordenadas superfluas. En el formalismo lagrangiano se trabaja con l pa-
rametros independientes que no se refieren a las partı́culas sino al sistema como un todo,
en cambio en el formalismo newtoniano se trabaja necesariamente con coordenadas de
las partı́culas. Finalmente, la covariancia de las ecuaciones de Lagrange es claramente
una ventaja del formalismo lagrangiano.
Ejemplo 2.7.1 Sea un alambre largo y rı́gido que rota uniformemente alrededor de un
punto O como se muestra en la figura 2.11. Una partı́cula de masa m está sometida
a la ligadura de permanecer sobre el alambre. No hay fricción y actúa la fuerza de
gravedad en el plano de rotación del alambre. Resolver el problema usando coordenadas
generalizadas y las ecuaciones de Lagrange.
c
h ωt
m
ωt β
O B x
–mgj
Figura 2.11 Alambre largo y rı́gido que gira uniformemente alrededor de un punto O
Suponer que en t = 0 la partı́cula parte del punto C con velocidad cero a lo largo
del alambre. La ligadura es holónoma y reónoma, dada por la ecuación de la linea del
alambre:
y = x tan β + OA (2.195)
De la geometrı́a se sigue que sen ωt = h/OA y tan β = − cot α, con lo cual la ecuación
de ligadura toma la forma:
x cos ωt + y senωt − h = 0 (2.196)
Es una ligadura dependiente explı́citamente del tiempo. El sistema tiene sólo un

grado de libertad. Podemos tomar como coordenada generalizada el desplazamiento de
partı́cula sobre el alambre respecto el punto C. Las ecuaciones de transformación son:
x(q, t) = q senωt + h cos ωt

(2.197)
y(q, t) = −q cos ωt + h senωt
Al reemplazar (2.197) en (2.196) se obtiene la identidad 0 = 0. El lagrangiano del

problema es:
1
L= m(ẋ2 + ẏ 2 ) − mgy (2.198)
2
L expresado en términos de la coordenada generalizada q y la velocidad generali-
zada q̇ es:
L(q, q̇, t) = 21 m(q̇ 2 + q 2 ω 2 + h2 ω 2 − 2q̇hω)

(2.199)
−mg(h senωt − q cos ωt)
Para escribir la ecuación de Lagrange se requiere conocer:

∂L ∂L
= mqω 2 + mg cos α ; = m(q̇ − hω) (2.200)
∂q ∂ q̇
Con lo cual la ecuación de movimiento para la coordenada generalizada q (ecuación
de Lagrange) es:
q̈ − qω 2 = g cos ωt (2.201)
Claramente la solución de (2.201) es de la forma:
q = Aeωt + Be−ωt + C cos ωt (2.202)
que satisface las condiciones iniciales q(0) = 0, q̇(0) = 0 sólo si A = B = −(1/2)C. C se

determina reemplazando (2.202) en (2.201), obteniéndose finalmente para q(t):
g
q(t) = (cosh ωt − cos ωt) (2.203)
2ω 2
Las fuerzas de reacción de las ligaduras se determinan a partir de la ecuación
(2.140):
Rx = mẍ
(2.204)
Ry = mg + mÿ
Las ecuaciones (2.197) y (2.203) permiten calcular a ẍ y ÿ:
ẍ = q̈ senωt + 2q̇ω cos ωt − qω 2 senωt − hω 2 cos ωt

(2.205)
ÿ = −q cos ωt + 2q̇ω senωt + qω 2 cos ωt − hω 2 senωt
Con lo cual se obtiene para Rx y Ry:
Rx = mg(senhωt + 2senωt) cos ωt − mhω 2 cos ωt

(2.206)
Ry = mg(senhωt + 2senωt)senωt − mhω 2 senωt
El vector ~l está dirigido a lo largo del alambre:

~l = îsenωt − ĵ cos ωt (2.207)
El producto escalar de ~l con R

~ es cero: ~l· R
~ = 0 o sea que R
~ es siempre perpendicular
al alambre. Su magnitud es:

R = mg(senhωt + 2senωt) − mhω 2 (2.208)
2.8. Las ecuaciones de la dinámica en coordenadas

generalizadas para sistemas no holónomos. Uso
de coordenadas no independientes
Con sistemas no holónomos no es posible, mediante la introducción de coordena-
das generalizadas independientes, eliminar las condiciones de ligadura. Por alguna razón
serı́a deseable trabajar con un conjunto de 3N coordenadas no cartesianas q1 , q2 , ... q3N ,
que no serán independientes. Incluso serı́a posible trabajar con un conjunto de 3N − h
coordenadas generalizadas no independientes definido de tal manera que se eliminen
del problema las ligaduras holónomas. En cualquiera de estos dos casos debemos traba-
jar con coordenadas generalizadas no independientes. Se trata de hallar las ecuaciones
de movimiento usando estas coordenadas. Para ello basta partir de las ecuaciones de
Lagrange de la segunda clase, ecuaciones (2.181), considerando esta vez las Qν como
formadas de las fuerzas aplicadas y de las fuerzas de ligadura (2.159):
N h n
!
X (a)
X ∂f α
X ∂~ri
Qν = F~i + λα + µα~lαi ·
i=1 α=1
∂~
r i α=1
∂q ν
ν = 1, 2, ... 3N (2.209)
definimos las cantidades dα y aαν de la siguiente manera:

N
X
∂fα ∂fα ∂~ri ∂fα
dα = ; aαν = · = para α = 1, 2, ... h (2.210)
∂t i=1
∂~ri ∂qν ∂qν
N
X
dα = Dα ; aαν = ~lα · ∂~r1
i=1
∂qν
para α = h + 1, h + 2, ... h + n = k (2.211)
Con lo cual podemos escribir a (2.209) como:
k
X
Qν = Q(a)
ν + λα aαν (2.212)
α=1
donde esta vez λα representan los k multiplicadores de Lagrange λ1 , λ2 , ... λh , µ1 , µ2 ,

... µn . Las ecuaciones de Lagrange de la segunda clase se pueden escribir entonces en la
forma:
Xk
d ∂T ∂T
− = Qν(a) + λα aαν ; ν = 1, 2, ... 3N (2.213)
dt ∂ q̇ν ∂qν α=1
En resumen, con las coordenadas generalizadas q1 , q2 , ... q3N las ecuaciones de

ligadura se pueden escribir en la forma:
3N
X
aαν q̇α + dα = 0 ; α = 1, 2, ... h, h + 1, h + 2, ... h + n = k (2.214)
α=1
que junto con las 3N ecuaciones de Lagrange nos proporcionan 3N + k ecuaciones con
las 3N + k incógnitas siguientes: q1 , q2 , ... q3N , λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las fuerzas
de
Pkreacción de las ligaduras en estas coordenadas no independientes estarán dadas por
α=1 λα aαν , o más explı́citamente:
h
X n
∂fα X
Rν = λα + µα aαν (2.215)
α=1
∂qα α=1
Ejemplo 2.8.1 Resolver el problema del ejemplo 2.7.1 usando multiplicadores de Lagran-
ge y coordenadas no independientes.
Tomaremos a q y h como coordenadas generalizadas no independientes. En la

ecuación de ligadura escribiremos a la distancia OC como h0 :
f (x, y, t) = x cos ωt + y senωt − h0 (2.216)
Haciendo la transformación de las coordenadas x, y a las coordenadas q, h, ecuación

(2.197), obtenemos para ~r y f :
f (q, h, t) = h − h0 (2.217)
~r(q, h, t) = q(î senωt − ĵ cos ωt) + h(î cos ωt + ĵ senωt) (2.218)

con lo cual se obtienen las siquientes expresiones para los coeficientes aq , ah , d, según
(2.210):
∂f
aq = =0
∂q
∂f (2.219)
ah = =1
∂h
∂f
d= =0
∂t
Las fuerzas aplicadas generalizadas serán:
∂~r
Qν = −mg î · (2.220)
∂qν
con lo cual:
Qh = −mg senωt ; Qq = mg cos ωt (2.221)
La energı́a cinética será:
1
T (q, q̇, h, ḣ, t) = m(q̇ 2 + q 2 ω 2 + h2 ω 2 − 2q̇hω + 2q ḣω + ḣ2 ) (2.222)
2
Entonces las ecuaciones (2.213) serán:
m(q̈ − ḣω) − m(qω 2 + ḣω) = mg cos ωt
(2.223)
m(ḧ + q̇ω) − m(hω 2 − q̇ω) = −mg sen ωt + λ
La ecuación (2.214) será:
ḣ = 0 ⇒ h = h0 (2.224)
Reemplazando (2.224) en (2.223) obtenemos:
q̈ − qω 2 = g cos ωt
(2.225)
λ
= 2q̇ω − hω 2 + g senωt
m
La solución de las ecuaciones (2.225) de acuerdo con (2.224) será:
g
q = (cosh ωt − cos ωt)
2ω 2
(2.226)
2
λ = mg(senhωt + 2senωt) − mhω
Las fuerzas generalizadas de ligadura serán, de (2.226) y (2.215):
Rh = mg(senhωt + 2senωt) − mhω 2 ; Rq = 0 (2.227)
en completo acuerdo con los resultados de (2.208).
Ejemplo 2.8.2 Sea un disco de radio R que rueda sobre un plano inclinado con el plano
del disco perpendicular al plano inclinado (podrı́a ser una de las ruedas de un carro).
Hallar y resolver las ecuaciones de movimiento.
Tomaremos el plano xy en el plano inclinado, con lo cual se tendrá una confi-

guración como en la figura 2.1. Las coordenadas del sistema serán: xCM , yCM , α, φ,
que tomamos como coordenadas genaralizadas no independientes. De las ecuaciones de
ligadura, no holónomas dadas por las ecuaciones (2.9):
ẋ − R senα φ̇ = 0
(2.228)
ẏ + R cos α φ̇ = 0
obtenemos las siquientes expresiones para los coeficientes aαν que aparecen en (2.214):
a1x = 1 a1y = 0 a1α = 0 a1φ = −R senα
(2.229)
a2x = 0 a2y = 1 a2α = 0 a2φ = R cos α
Los momentos de inercia de un disco alrededor de su eje y alrededor de un diámetro
son respectivamente:
1 1
Iφ = mR2 ; Iα = mR2 (2.230)
2 4
La energı́a cinética contendrá una parte debida al movimiento del centro de masa
y otra debida al movimiento respecto al centro de masa:2
1 1 1
T = m(ẋ2 + ẏ 2 ) + mR2 φ̇2 + mR2 α̇2 (2.231)
2 4 8
Tomaremos los ejes xy de modo que el eje x esté horizontal y el eje y haciendo un
ángulo β con la horizontal. Las fuerzas generalizadas serán entonces:
(a)
Q(a)
α = Qφ = 0 ; Q(a)
x = 0; Q(a)
y = mg senβ (2.232)
Usando las ecuaciones (2.229), (2.231) y (2.232), las ecuaciones (2.213) se trans-
forman en:
mẍ = µ1
mÿ = mg senβ + µ2
1 2 (2.233)
R mα̈ = 0
4
1 2
R mφ̈ = −µ1 R senα + µ2 R cos α
2
La tercera de las ecuaciones (2.233) nos da:
α = ωα t + α0 (2.234)
2 Para una justificación rigurosa de (2.231) ver sección 8.3.
Las dos primeras ecuaciones (2.233) junto con las (2.228) nos dan las siguientes
expresiones para µ1 y µ2 en términos de φ:
µ1 = mRωα cos(ωα t + α0 ) φ̇ + mR cos(ωα t + α0 ) φ̈
(2.235)
µ2 = mRωα sen(ωα t + α0 ) φ̇ − mR cos(ωα t + α0 )φ̈ − mg sen β
Ahora, reemplazando a µ1 y µ2 en la última de las (2.233) obtenemos:
2 g
φ̈ = − senβ cos(ωα t + α0 ) (2.236)
3 R
que al ser integrada nos da:
2g
φ= senβ cos(ωα t + α0 ) + At + B (2.237)
3Rωα2
Tomando la condición inicial φ(0) = 0 y φ̇(0) = 0, (2.237) será:
2g
φ= senβ[cos(ωα t + α0 ) − cosα0 + ωt senα0 ] (2.238)
3Rωα2
Tomando además a α0 = 0, lo que equivale a tomar en t=0 a α = 0, obtenemos:
α = ωα t
2gsenβ ωt
φ =− sen2
3Rωα2 2
2
µ1 = − mg senβsen2ωα t
3
(2.239)
2
µ2 = −mgβ 1 − cos 2ωα t
3

g senβ 1
x =− ωα t − sen2ωα t
3ωα2 2
gsenβ
y = sen2 ωα t
3ωα2
Donde hemos tomado que x = 0, y = 0, ẋ = 0, ẏ = 0 en t = 0.
Las fuerzas de reacción de las ligaduras serán, usando (2.215):
Rx = µ1
Ry = µ2
Rα = 0 (2.240)
Rφ = −µ1 R senωα t + µ2 R cos ωα t
1
= − mgR senβ cos ωα t
3
Si se deja la rueda inicialmente alineada en el eje y, se tiene que ωα = 0, con lo

cual:
α= 0 Rx = 0
g senβ 2 1
φ= − t Ry = − mg senβ
3R 3
(2.241)
x= 0 Rα = 0
1 1
y= gsenβ t2 R= − mgR senβ
3 3
Si en vez de un disco se tuviera una masa que baja sin rozamiento a lo largo del eje
y, la fuerza a lo largo del plano serı́a mg senβ. En este caso se tiene que el plano ejerce
sobre la rueda una fuerza en y dada por (−1/3)mg senβ y que la hace rodar hacia abajo
en la dirección de y positiva. Rφ es el torque que produce la rotación. La aceleración del
centro de masa será (2/3)g senβ con lo cual y = (1/3) senβ t2 y φ = (1/3)g senβ t2 /R.
Ejemplo 2.8.3 Sean dos partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida
de longitud l, sin masa. El sistema de alguna manera está constreñido a moverse en un
plano vertical, de modo que la velocidad del centro de masa siempre está en la dirección
de la varilla (véase figura 2.12). Hallar y resolver las ecuaciones de movimiento.
r1
1
r ·
r2 α
2
y
Figura 2.12 Partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida y constreñidas a
moverse en un plano vertical
La ligadura holónoma es:

|~r1 − ~r2 | = l (2.242)
La ligadura no holónoma es:
ẋ
= tan α (2.243)
ẏ
Escogemos como coordenadas generalizadas no independientes a x, y y α. Defini-
mos el vector ~l como:
~l = ~r1 − ~r2 (2.244)
con magnitud l y dirección α. Las ecuaciones de transformación de coordenadas son:
~l
~r1 = ~r +
2
(2.245)
~l
~r2 = ~r −
2
La energı́a cinética se puede escribir como:
1
T = ẋ2 + ẏ 2 + l2 α̇2 (2.246)
4
Los coeficientes en la ecuación de ligadura no holónoma son:
ax = − tan α ; ay = 1 ; aα = 0 (2.247)
La fuerza aplicada generalizada es:
Qx = 0 ; Qy = 2g ; Qα = 0 (2.248)
Las ecuaciones de Lagrange, (2.213), serán:
2ẍ = −µ tan α
2ÿ − 2g = µ (2.249)
1 2
l α̈ = 0
2
Para α se halla:
α = ωt + δ (2.250)
x, y y µ se hallan de las ecuaciones:
2ẍ = −µ tan(ωt + δ)
2ÿ = 2g + µ (2.251)
ẏ − ẋ tan(ωt + δ) = 0
ẋ obedece la ecuación diferencial:

2ẍ + 2ẋω tan α = g sen2α (2.252)
Esta es una ecuación diferencial lineal de primer orden en ẋ cuya solución general
está dada por una fórmula estándar. La solución para ẋ es:
g
ẋ = − (1 + cos 2α) + A cos α (2.253)
2ω
Su integral nos da directamente:
g A
x=− (2ωt + sen2α) + senα + B (2.254)
Aω 2 ω
donde A y B son constantes de integración. Para y y µ se halla:
g A
y= 2
cos 2α − cos α + C (2.255)
4ω ω
µ = −2g(1 + cos 2α) + 2Aω cos α (2.256)
Las fuerzas de reacción de las ligaduras serán:

Rx = 2g sen2α − 2Aω senα
Ry = −4g cos 2α + 2Aω cos α (2.257)
Rα = 0
Se sigue que si al sistema se aplica una fuerza dada por (2.257), se moverá con
la condición de ligadura (2.243). ω, δ, A, B, y C son constantes de integración que
dependen de las condiciones iniciales.
3
El principio de Hamilton y las ecuaciones de
Lagrange
3.1. Forma integral de la ecuación general de la dinámi-

ca para un sistema holónomo
Trayectorias variadas. La ecuación general de la dinámica, ecuación (2.141), es
válida en cada instante t, ya que por definición los δ~ri se realizan instantáneamente
alrededor de la posición real del sistema. La ecuación general de la dinámica es un
“principio diferencial” que expresa la anulación del trabajo virtual de las fuerzas de
ligadura en cada instante t, o equivalentemente en cada configuración del sistema.
Tomemos fijos t1 y t2 . Si en cada instante t, entre t1 y t2 , se realiza un despla-
zamiento virtual en las coordenadas de cada partı́cula, δ~ri (t), y se impone la condición
δ~ri (t1 ) = δ~ri (t2 ) = 0 se obtendrá que la secuencia de desplazamientos virtuales define
una trayectoria diferente entre t1 y t2 . A esta trayectoria se le denomina “trayectoria va-
riada” y la trayectoria seguida por el sistema se denomina “trayectoria real” (véase figura
3.1 ). La función del tiempo ~ri (t) determina la trayectoria real y la función ~ri (t) + δ~ri (t)
determina la trayectoria variada. A la función δ~ri (t) se le denomina la “variación” de
la función ~ri (t). También se suele llamar “trayectoria recta” a la real y “trayectoria
circuitosa” a la variada (véase figura 3.1). ~ri (t) es una representación paramétrica de la
trayectoria con parámetro t. De acuerdo con los comentarios de la sección 2.3, el conjun-
to de desplazamientos virtuales en un tiempo t puede asociarse a un “ensamble” muy
grande de sistemas.
Las trayectorias se forman uniendo un elemento de una “fila”, t, a un elemento
de la “fila” t + dt, en forma de “zig-zag” en la matriz bidimensional mencionada en la
sección 2.3; una trayectoria será “recta”; todas las demás serán “circuitosas”.
Si el trabajo virtual de las fuerzas de ligadura es cero en cada instante t:
N
X
~ i (t) · δ~ri (t) = 0,
R (3.1)
i=1
también será cero el promedio de los trabajos virtuales realizados por las fuerzas de
55
z
2
Trayectoria variada
δri
mi
1
Trayectoria real
ri
y
x
Figura 3.1 Representación de trayectorias en desplazamientos virtuales
ligadura entre t1 y t2 :
Z N
t2 X
1 ~ i (t) · δ~ri (t)dt = 0
R (3.2)
t2 − t1 t1 i=1
Como consecuencia de lo anterior, la ecuación general de la dinámica toma la

forma:
Z N h
t2 X i
(a)
F~i (t) − mi~¨r i (t) · δ~ri (t)dt = 0 (3.3)
t1 i=1
Esta es una expresión integral, en términos ya no de desplazamientos virtuales sino

de variaciones globales de las trayectorias de las partı́culas. Transformando la ecuación
(3.3) llegaremos a una expresión completamente equivalente a la ecuación general de la
dinámica y por lo tanto a las ecuaciones de Lagrange de la primera y de la segunda
clase, para sistema holónomos.
Cada punto de la trayectoria variada se puede obtener de un punto de la trayectoria
real, para cada una de las partı́culas, por medio de un desplazamiento virtual. Como
consecuencia de esto, tanto la trayectoria real como la variada han de ser compatibles
con las condiciones de ligadura.
En cada instante t podemos escribir los δ~ri como:
δ~ri (t) = ~ri v (t) − ~ri r (t) (3.4)
donde v denota “variada” y r “real”. Se impone la condición de que las variaciones se

anulen en t1 y en t2 para cada partı́cula. Es decir que ~riv (t) = ~rir (t) en t = t1 y t = t2
para i = 1, 2, ...N .
El principio de Hamilton y las ecuaciones de Lagrange / 57
La integral de acción. Es la integral (3.3) haciendo algunas transformaciones.

En la ecuación (3.3) hacemos la siguiente transformación:
d ˙ d
mi~¨r i · δ~ri = mi~ri · δ~ri − mi~r˙ i · (δ~ri ) (3.5)
dt dt
Notando que las operaciones δ y d/dt conmutan:
d d
(δ~ri ) = [~ri v (t) − ~ri r (t)] = ~r˙ i v − ~r˙ i r = δ~r˙ i (3.6)
dt dt
podemos escribir a (3.5) en la forma:
d ˙ 1 2
mi~¨r i · δ~ri = mi~ri · δ~ri − mi δ~r˙ i (3.7)
dt 2
Con lo cual se tiene que:
N N
! N
X d X X 1 2
mi~¨r i · δ~ri = mi~r˙ i · δ~ri −δ mi~r˙ i (3.8)
i=1
dt i=1 i=1
2
Por tanto la ecuación (3.3) tomará la forma:

Z t2 "XN N
! N
#
~ (a) d X ˙ X
˙ 2
Fi · δ~ri − mi~ri · δ~ri + δ mi~ri dt = 0 (3.9)
t1 i=1
dt i=1 i=1
Notamos que en (3.9) aparecen el trabajo virtual de las fuerzas aplicadas, δA, y la
energı́a cinética:1
N
X N
(a) 1 X ˙2
δA = F~i · δ~ri ; T = mi~ri (3.10)
i=1
2 i=1
O sea que (3.9) se puede escribir como:

Z t2 t2
N
X
˙
(δA + δT )dt − mi~ri · δ r~i = 0 (3.11)
t1
i=1 t1
En virtud de la condición impuesta a los desplazamientos virtuales en t = t1 y

t = t2 , el término integrado se anula con lo cual (3.11) queda finalmente:
Z t2
(δA + δT )dt = 0 (3.12)
t1
Podrı́a pensarse que la presencia de condiciones de ligadura harı́a que δ~ri (t1 ) =
δ~ri (t2 ) = 0 no es posible imponerla para todas las coordenadas sino sólo para las indepen-
dientes, quedando la posibilidad de que no se cumpla para las coordenadas dependientes.
1 Como para pasar de r a r +δ~ ri se requiere realizar un trabajo, la energı́a en cada trayectoria variada
i i
es diferente. Esto caracteriza al principio de Hamilton, a diferencia de otros principios variacionales como
el de “mı́nima acción” (véase sección 9.3).
Sin embargo este no es el caso, pues de una transformación a coordenadas generalizadas

independientes q1 , q2 , ...ql se sigue que:
Xl
∂~ri
δ~ri = δqν (3.13)
ν=1
∂qν
Basta pues que se imponga la condición siguiente sobre los desplazamientos vir-
tuales de las coordenadas generalizadas:
δqν (t1 ) = δqν (t2 ) = 0 ; ν = 1, 2, ...l (3.14)
para que se satisfaga la condición requerida para los desplazamientos virtuales δ~ri .
En el caso particular en que las fuerzas aplicadas se pueden obtener como el gra-
diente de una función de las coordenadas y del tiempo, V (~r, t) vemos que:
N
X N
X
∂V (a)
δV (~r, t) = .δ~ri = − F~i .δ~ri = −δA (3.15)
i=1
∂~ri i=1
Para este caso la ecuación (3.12) toma la forma:

Z t2 Z t2 Z t2
δ(T − V )dt = δL dt = δ L dt = 0 (3.16)
t1 t1 t1
donde el segundo signo igual en (3.16) está justificado por lo siguiente:

Z t2 Z t2 Z t2 Z t2 Z t2
v r v r
δL dt = (L − L )dt = L dt − L dt = δ L dt (3.17)
t1 t1 t1 t1 t1
Por medio de las transformaciones a coordenadas independientes se ve que T es

función de (q), (q̇), t, y V es función de (q) y t, con lo cual (3.16) se puede escribir como:
Z t2
δS = δ L(q, q̇, t)dt = 0 (3.18)
t1
Esta ecuación es equivalente a la ecuación general de la dinámica y de ella se

pueden obtener también las ecuaciones de Lagrange usando el cálculo variacional. A la
integral S se la denomina integral de acción
3.2. El principio de Hamilton

Es posible el desarrollo formal de la mecánica tomando la ecuación (3.12) como pos-
tulado fundamental en vez de partir del principio de D’Alembert, ecuación (2.141). En
este formalismo se denomina al contenido de la ecuación (3.18), el principio de Hamilton.
El principio de Hamilton para sistemas con fuerzas aplicadas derivables

de un potencial. El movimiento del sistema, descrito por las coordenadas generalizadas
qν (t), es tal que entre dos instantes t1 y t2 se satisface:
Z t2
δ L(q1 , q2 , ...ql ; q̇1 , q̇2 , ...q̇l ; t)dt = 0 (3.19)
t1
Este es un principio variacional, formulado por W. Hamilton en 1835. Matemáticamente

(3.19) es la condición para que la acción S sea una extremal. S es una funcional de la
trayectoria q(t).
En análisis de funciones, se tiene que si F (x1 , x2 , ...xn ) es una función de muchas
variables, F tendrá un valor extremal, máximo o mı́nimo, si al realizar un cambio infini-
tesimal en las variables F no cambia al primer orden en dichos cambios infinitesimales.
Es decir si:
F (x1 + δx1 , x2 + δx2 , ...xn + δxn ) − F (x1 , x2 , ...xn )
(3.20)
= δF (x1 , x2 , ...xn )
entonces:
XN
∂F
δF (x1 , x2 , ...xn ) = δxi + 0(δx2i ) = 0 (3.21)
i=1
∂xi
Se sigue que F (x1 , x2 , ...xn ) será extremal para aquellos valores de x1 , x2 , ...xn que
hacen que se anulen todas las derivadas parciales de primer orden de F :
∂F
=0 i = 1, 2, ...n (3.22)
∂xi
En el análisis de funciones F (x1 , x2 , ...xn ) es un número que se asocia al conjunto
de números x1 , x2 , ...xn . Al cambiar los números x1 , x2 , ...xn cambia el número F . Se
dice que F es extremal si no cambia al primer orden en δxi cuando los xi se cambian
por xi + δxi . 2
En el análisis funcional I [f1 (x), f2 (x), ...fn (x)] es un número que se asocia al conjunto
de funciones f1 (x), f2 (x), ...fn (x). Al cambiar las funciones f1 (x), f2 (x), ...fn (x) cambia
el número I. Se dice que I es extremal si no cambia al primer orden en δfi (x) cuando
las funciones fi (x) se cambian por las funciones fi (x) + δfi (x). A δfi (x) se le denomina
variación de la función fi (x). Toda función continua en un punto x0 puede expandirse
en serie de Taylor alrededor de x0 :
∞
X 1 (k)
fi (x) = f (x0 )(x − x0 )k (3.23)
k! i
k=0
(k)
donde fi (x0 ) denota el valor de la derivada k-ésima de la función fi (x) en x = x0 y
(0) (n)
fi (x0 ) ≡ fi (x0 ). Variando los parámetros fi (x0 ) para k = 0, 1, 2, ...∞ se obtiene una
función diferente.
S es una funcional de qν (t), pues a cada posible solución q1 (t), q2 (t), ...ql (t) le
corresponde un valor definido a la integral de acción S. El principio de Hamilton dice
que al variar las funciones qν (t) se obtiene el conjunto de funciones verdaderas que
describen la evolución del sistema por hallar qué conjunto es el que hace que S sea una
extremal. Para la mayorı́a de las situaciones fı́sicas se encuentra que S es mı́nima para
2 El máximo o mı́nimo de una función se halla resolviendo el sistema de ecuaciones algebraicas (3.22),
como en la estática. Los extremales de una funcional se hallan resolviendo un sistema de ecuaciones
diferenciales, como en la dinámica.
la solución correcta. En otras palabras, S tiene un valor mı́nimo cuando las funciones
qν (t) describen las trayectorias reales.3 El número S asignado a cualquier trayectoria
variada es mayor que el número S asociado a la trayectoria real.
Ejemplo 3.2.1 Ilustrar el principio de Hamilton con el problema del tiro parabólico en
presencia del campo gravitacional (véase figura 3.2).
Sabemos que la trayectoria real está descrita por:
1 2
x(t) = Vx t ; y(t) =
gt (3.24)
2
Eliminando el parámetro t se obtiene que la trayectoria es parabólica:
g 2
y= x (3.25)
2Vx2
Esta trayectoria pasa por el punto (x = 0, y = 0) en t = 0 y por el punto (x2 , y2 =
gx22 /(2Vx2 )) en t = t2 (véase figura 3.2).
La siguiente trayectoria variada pasa por los mismos puntos que la trayectoria real
en t = t1 = 0 y t = t2 :
x = Vx t
(3.26)
ex/x2 − 1
y = y2
e−1
Se trata de mostrar que la integral de acción tiene menor valor para la trayectoria
real que para esta trayectoria variada.
El lagrangiano del problema es:
1
L= m(ẋ2 + ẏ 2 ) + mgy (3.27)
2
Sobre la trayectoria real L es:
1 1 1
L= m(Vx2 + g 2 t2 ) + mg 2 t2 = mVx2 + mg 2 t2 (3.28)
2 2 2
La integral de acción es:
Z t2
1 1 1 x2y2
L dt = mVx2 t2 + mg 2 t32 = mVx x2 + 0, 666 mg (3.29)
0 2 3 2 Vx
Sobre la trayectoria variada:
y2 Vx
ẋ = Vx ; ẏ eVx t/x (3.30)
x2 (e − 1)
Con lo cual L es:

1 y22 Vx2 mgy2 Vx t/x2
L = m Vx2 + 2 2 e 2Vx t/x2
+ (e − 1) (3.31)
2 (e − 1) x2 e−1
3 De acuerdo con el principio de D’Alembert esto equivale a decir que las posiciones verdaderas son
de “equilibrio” estable.
P1 x
P2 (x2,y2)
Figura 3.2 Trayectoria parabólica en presencia de un campo gravitacional. Trayectoria variada.
La integral de acción es:

Z t2
1 81e − 60 mgx2 y2
L dt = mVx x2 +
0 2 72(e − 1) Vx
(3.32)
1 mgx2 y2
= mVx x2 + 0,689
2 Vx
Vemos que la acción en la trayectoria real es menor que la acción en la trayectoria

variada.
Cuando no se conoce la trayectoria, es decir cuando no se ha resuelto el problema,
el principio de Hamilton directamente no proporciona un método práctico: se requiere
un método de ensayo y error; suponer una solución y evaluar S; obtener una “tabla”
de soluciones posibles en función de la acción. La solución correcta serı́a aquella para la
cual S es mı́nima.
Ejemplo 3.2.2 Resolver el problema del oscilador armónico lineal usando directamente
el principio de Hamilton, con las siguientes condiciones en t = 0 y t = t1 :
x(0) = 0 , x(t1 ) = x1 , ẋ(0) = v0 (3.33)

Las posibles funciones de t las asumiremos de la forma:

X∞
x(t) = a n tn (3.34)
n=0
O sea que a cada conjunto de parámetros a0 , a1 , a2 , ...a∞ le corresponderá una
solución.4 El conjunto de parámetros que determina la solución real es aquel para el cual
δS = 0. De la condición x(0) = 0 se sigue que a0 = 0, con lo cual:
X∞
x(t) = a n tn (3.35)
n=1
El lagrangiano para el oscilador armónico unidimensional es:
1 1
L = µẋ2 − kx2 (3.36)
2 2
∞ ∞ ∞ ∞
1 XX 1 XX
L= µ nman am tn+m−2 − k an am tn+m (3.37)
2 n=1 m=1 2 n=1 m=1
Con lo cual la integral de acción será:
Z t1
S= L dt =
0
(3.38)
∞ ∞
1XX nm n+m−1 1 n+m+1
an am µ t −k t
2 n=1 m=1 n+m−1 1 n+m+1 1
La condición δS = 0 nos da:
"∞
∞ X #
X nm 1
am µ tn+m−1 − k tn+m+1 δan = 0 (3.39)
n=1 m=1
n+m−1 1 n+m+1 1
En la ecuación (3.39) los δan son los cambios de los coeficientes an que darán lugar
a la variación δx(t). Los δan no son independientes, pues se debe además cumplir la
condición δx(t1 ) = 0:
Xn
δx(t1 ) = δan tn1 = 0 (3.40)
n=1
En virtud de (3.40) un δan puede expresarse en términos de los demás. Vamos a
introducir un multiplicador indeterminado λ multiplicando la ecuación (3.40) por λ y el
resultado lo sumamos a la ecuación (3.39) para obtener:
∞
" ∞
X X mn
µ t1n+m−1
n=1 m=1
n + m − 1
(3.41)

1
−k tn+m+1 am + λtn1 δan = 0
n+m+1 1
4 La ecuación (3.34) constituye una representación multiparamétrica de la trayectoria en el espacio
de configuración.
Ahora escogemos a λ de modo que se anule el coeficiente de δa1 :

X∞
1 m+2
µtm
1 − k t am + λt1 = 0 (3.42)
m=1
m+2 1
En la ecuación (3.41) quedará una combinación lineal de los δa2 , δa3 , ...δa∞ , igua-
lada a cero. Como estas cantidades son ahora independientes, se debe cumplir que sus
coeficientes se anulen. Igualando a cero los coeficientes de δa2 , δa3 , ...δa∞ y reempla-
zando el valor de λ que se obtiene de (3.42), llegamos a:
X∞
m−1 m 1 m+2
µ t +k t am = 0 (3.43)
m=1
m+n−1 1 (m + 2)(m + n + 1) 1
De (3.43) se obtiene la siguiente relación de recurrencia para coeficientes, por igua-

lar a cero los coeficientes de las tm
1 :
k 1
am = − am−2 ; m = 2, 4, ... (3.44)
µ m(m − 1)
Como a0 = 0, se sigue que:
a0 = a2 = a4 = ... = 0 (3.45)
Los coeficientes impares se pueden expresar en términos de a1 , que se determina

de la condición ẋ(0) = v0 :
a1 = v0 (3.46)
Con lo cual se obtiene que:

(m−1)/2
(m−1)/2 1 k
am = (−1) v0 ; m = 1, 3, ... (3.47)
m! µ
o también en la forma:
n
k 1
a2n+1 = (−1)n v0 ; n = 0, 1, 2, ... (3.48)
µ (2n + 1)!
Con lo cual x(t) será:
r s !2n+1
∞
µX 1 k
x(t) = v0 (−1)n (3.49)
k n=0 (2n + 1)! µ
p
Llamando ω = k/m llegamos a:
v0
x(t) = sen(ωt) (3.50)
ω
Claramente el método es engorroso en problemas más complicados.
Deducción de las ecuaciones de Lagrange a partir del principio de Ha-

milton generalizado. La ecuación (3.12) se denomina el principio de Hamilton genera-
lizado. Es aplicable a cualquier sistema holónomo independientemente de la naturaleza
de las fuerzas aplicadas. Como T es una función de (q), (q̇), t,
l
X
∂T ∂T
δT (q, q̇, t) = δqν + δ q̇ν (3.51)
ν=1
∂qν ∂ q̇
En tanto que δA puede escribirse en términos de las fuerzas generalizadas Qν :

N
X l
X
(a)
δA = F~i · δ~ri = Qν δqν (3.52)
i=1 ν=1
En δT podemos hacer la transformación siguiente:

∂T ∂T d d ∂T d ∂T
δ q̇ν = δqν = δqν − δqν (3.53)
∂ q̇ν ∂ q̇ dt dt ∂ q̇ν dt ∂ q̇ν
Reemplazando (3.51), (3.52) y (3.53) en la ecuación (3.12):
Z t2
(δA + δT )dt =
t1
Z l
t1 X
∂T d ∂T
Qν δqν + − δqν dt (3.54)
t1 ν=1 ∂qν dt ∂ q̇ν
t2
l
X ∂T

+ δqν = 0
∂ q̇ν
ν=1 t1
La parte integrada en (3.54) es nula debido a que las δqν se anulan en t = tl y

t = t2 , con lo cual se llega a:
Z t1 (X l )
∂T d ∂T
Qν + − δqν dt = 0 (3.55)
t1 ν=1
∂qν dt ∂ q̇ν
Como las δqν son arbitrarias, el integrando es una función arbitraria del tiempo;
si la integral es cero, es necesario entonces que el integrando sea cero. Ahora queda una
combinación lineal de las cantidades independientes δqν igualada a cero,
l
X
∂T d ∂T
Qν + − δqν = 0 (3.56)
ν=1
∂qν dt ∂ q̇ν
Como las δqν son independientes, se debe cumplir también que:

∂T d ∂T
Qν + − = 0 ; ν = 1, 2, ...l (3.57)
∂qν dt ∂ q̇ν
A estas ecuaciones no podrı́amos haber llegado cuando el sistema es no holónomo.

Estas ecuaciones son las correspondientes ecuaciones en cálculo funcional a las ecuaciones
(3.22) del cálculo de funciones, a las cuales se reducen en el caso estático cuando las
fuerzas son derivables de un potencial. Hemos llegado a las ecuaciones de Lagrange de
la segunda clase a partir del principio de Hamilton.
Supongamos que las fuerzas aplicadas se pueden descomponer en una parte deri-
vable de un potencial monogénico y otra no derivable de tal potencial. Se entiende por
potencial monogénico o potencial generalizado a una función de las coordenadas, las ve-
locidades y el tiempo, a partir de la cual se pueden derivar todas las fuerzas monogénicas
del sistema, mediante las fórmulas:
(a) ∂V d ∂V
F~i = − + + F~i′ ; i = 1, 2, ...N (3.58)
∂~ri dt ∂~r˙ i
Las fuerzas generalizadas correspondientes serán:
∂V d ∂V
Qν = − + + fν ; ν = 1, 2, ...l (3.59)
∂qν dt ∂ q̇ν
donde fν es la fuerza generalizada correspondiente a las fuerzas F~i′ . Es posible con este
tipo de fuerzas definir una función lagrangiana asociada a las fuerzas derivables del
potencial generalizado. fν contiene las fuerzas no incluidas en L.
Las ecuaciones de Lagrange toman la forma:
∂L d ∂L
− + fν = 0 ; ν = 1, 2, ...l (3.60)
∂qν dt ∂ q̇ν
donde L está definido como:
L(q, q̇, t) = T (q, q̇, t) − V (q, q̇, t) (3.61)
El lagrangiano para N partı́culas en un campo electromagnético. Sea un

sistema de partı́culas cargadas en presencia de un campo electromagnético descrito por
~ r , t) y B(~
los campos E(~ ~ r , t). La fuerza de interacción con la partı́cula i es:

~ ri , t) + qi ~ri × B(~
F~i ~ri , ~r˙ i , t = qi E(~ ~ ri , t) (3.62)
c
Los campos eléctrico y magnético se pueden derivar de los potenciales escalar y
~
vectorial φ, A:
~ r , t)
∂φ(~r, t) 1 ∂ A(~
~ r , t) =
E(~ − −
∂~r c ∂t
(3.63)
~ r , t) = ∂ ~ r , t)
B(~ × A(~
∂~r
Entonces F~i se puede escribir como:

∂φ(~ri , t) 1 ∂A(ri~, t) 1 ∂
F~i (~ri , ~r˙ i , t) = qi − − + r~i × ~ ri , t)
× A(~ (3.64)
∂~ri c ∂t c ∂~ri
Algunas manipulaciones con el rotacional nos llevan a:5

∂ ~ ~
~r˙ i × × A(~ ~ i − dAi + ∂ Ai
~ ri , t) = ∂ ~r˙ i · A (3.65)
∂~ri ∂~ri dt ∂t
Con lo cual (3.63) se puede escribir como:

F~i ~ri , ~r˙ i , t =
(3.66)
∂ 1 ~ ri , t) − 1 d ∂ ˙ ~
qi − φ(~ri , t) − ~r˙ i · A(~ ~ri · A(~ri , t)
∂~ri c c dt ∂~r˙ i
Como φ no depende de ~r˙ i :

F~i ~ri , ~r˙ i , t =
(3.67)
∂ 1˙ ~ 1 d ∂ 1˙
qi − φi − ~ri · Ai + φi − ~ri · Ai
∂~ri c c dt ∂~r˙ i c
Si se define la función V :
" #
X N ˙i
~
r
V ~r1 , ~r2 , ...~rN , ~r˙ 1 , ~r˙ 2 , ...~r˙ N , t = ~ ri , t) ,
qi φ(~ri , t) − · A(~ (3.68)
i=1
c
las fuerzas de interacción con el campo electromagnético se pueden derivar del

potencial monogenico V :
∂V d ∂V
F~i = − + (3.69)
∂~ri dt ∂~r˙ i
Entonces el lagrangiano de un sistema de partı́culas en un campo electromagnético
puede escribirse como:
N
" !#
˙ ˙ ˙
X 1 ˙2 ~r˙ i ~
L(~r1 , ~r2 , ...~rN , ~r1 , ~r2 , ...~rN , t) = mi~ri − qi φi − · Ai (3.70)
i=1
2 c
En este lagrangiano no están incluidas las fuerzas de interacción de las partı́culas

entre sı́.
Fuerzas viscosas. Son un tipo de fuerzas que no se pueden derivar de un potencial.

Para muchos casos de interés se pueden escribir en la forma:
F~i′ = −~k.~r˙ i (3.71)
Se define la función de disipación de Rayleigh como:
N
1X
F= kx ẋ2i + ky ẏi2 + kz żi2 (3.72)
2 i=1
5 Ver el texto Mecánica clásica de Goldstein, 1a ed, sección 1.5.
¯
Las fuerzas viscosas (3.71) se pueden obtener como el gradiente de velocidades de

F:
∂F
F~i = − (3.73)
∂~r˙ i
La fuerza generalizada correspondiente será:
N N
X ∂~ri X ∂F ∂~r˙ i ∂F
Fν = Fi′ · =− · =− (3.74)
∂qν ∂ ˙ i ∂ q̇ν
~
r ∂ q̇ν
i=1 i=1
Para el caso en que las fuerzas no potenciales sean todas viscosas, las ecuaciones
de Lagrange toman la forma:
d ∂L ∂L ∂F
− + = 0; ν = 1, 2, ...l (3.75)
dt ∂ q̇ν ∂qν ∂ q̇ν
de modo que deben darse dos funciones escalares, L y F , para obtener las ecuaciones de
movimiento. Estas serán las ecuaciones a aplicarse en el caso de un sistema de osciladores
amortiguados por ejemplo; L contiene las fuerzas de “resorte” y F las fuerzas disipativas.
3.3. Algunas propiedades de la función lagrangiana

Aditividad de L. Si el sistema consta de dos partes, A y B, que no interactúan,
entonces el lagrangiano del sistema se descompone en dos partes: L = LA + LB . Donde
LA contiene sólo las coordenadas y velocidades de la parte A y similarmente LB . Es el
caso de dos partı́culas que se mueven en presencia de un campo externo sin interactuar
entre sı́. También en el caso de un sistema de partı́culas que interactúan entre sı́ pero
no con un campo externo, L se puede descomponer en una parte que contiene sólo las
coordenadas y velocidades del centro de masa y otra que sólo contiene las coordenadas
y velocidades de las partı́culas respecto al centro de masa: no hay interacción del movi-
miento del centro de masa con el movimiento respecto al centro de masa.
Adición a L de una derivada total respecto al tiempo de una función

arbitraria. Sean dos funciones lagrangianas, que dependen de las mismas coordenadas
y velocidades generalizadas, tales que difieren por una derivada total respecto al tiempo:
d
L′ (q, q̇, t) = L(q, q̇, t) + f (g, t) (3.76)
dt
Las integrales de acción de L y de L′ tienen valores extremales simultáneamente:
S ′ = S + f [q(t2 ), t2 ] − f [q(t1 ), t1 ] (3.77)
Como δq(t2 ) = δq(t1 ) = 0 se sigue que δS ′ = δS = 0. Esto implica que L y L′
dan lugar a las mismas ecuaciones de movimiento; a este resultado se puede llegar de
manera más convincente transformando las ecuaciones de Lagrange mismas.6
que eiS/h̄ es el lı́mite clásico de la función de onda Ψ. Entonces la arbitrariedad de f
6 Veremos
implica una arbitrariedad en la fase de Ψ.

Ejemplo 3.3.1 Sea una partı́cula libre, descrita en un sistema de referencia inercial O
mediante el lagrangiano.
1 ˙2
L= m~r (3.78)
2
Si se realiza una transformación de Galileo, a un nuevo sistema de referencia inercial
O′ que se mueve respecto a O con velocidad constante V~ :
~
~υ = ~υ ′ + V (3.79)
Entonces el lagrangiano en el nuevo sistema de referencia inercial será:
1 1 2 1
L′ = m~r˙ ′2 = m~r˙ + m −2~r · V ~ +V ~2 (3.80)
2 2 2
Los dos lagrangianos están relacionados ası́:
d m
L′ = L + −2~r · V~ + V~ 2t (3.81)
dt 2
A la función:
m ~ +V ~ 2t

f (r, t) = −2~r · V (3.82)
2
por razones que se verán más adelante, se le denomina “función generadora de la trans-
formación de Galileo”. Vemos que:
m ~ − 2~r2 · V~ +V ~ 2 t2 − ~υ 2 t1

S′ = S + 2~r1 · V (3.83)
2
y por tanto δS ′ = δS dado que δ~r = δ~r ′ = 0 en t = t1 y t = t2 .
3.4. Simetrı́as de la lagrangiana y teoremas de con-

servación
Simetrı́a. Se dice que L posee una simetrı́a cuando no cambia bajo una trans-
formación de las coordenadas y del tiempo. Por ejemplo, sea una partı́cula libre, cuyo
lagrangiano esté dado por (3.78). Se le realiza un desplazamiento de la partı́cula por una
cantidad arbitraria ~a,
~r → ~r + ~a (3.84)
como ~a˙ = 0, se sique que L no cambia. Se dice que este lagrangiano es simétrico bajo
translaciones. Veremos que esta simetrı́a está asociada a la conservación del momento
lineal. Si se realiza una rotación arbitraria de la partı́cula, digamos alrededor del eje z
por un ángulo α,
x → x cos α + y senα
y → −x senα + y cos α (3.85)
z → z
y L no cambia, se dice que L es simétrico bajo rotaciones alrededor del eje z arbitrarias.
Veremos que esta simetrı́a está asociada con la conservación del momento angular. Si se
realiza una inversión de las coordenadas,
x, y, z → −x, −y, −z (3.86)
y L no cambia, esto implica la conservación de la paridad: L es siempre par o impar en

el transcurso del movimiento.
Al aplicar un campo externo las simetrı́as de L dependerán de las simetrı́as del
campo. Si el campo tiene menor simetrı́a que el lagrangiano libre, el nuevo lagrangiano
tendrá la simetrı́a del campo. Supongamos que se coloca una fuerza constante y uniforme
en la dirección z. L ahora será:
1 ˙2
L= m~r + Fz z (3.87)
2
Las simetrı́as de L son alteradas. Bajo la transformación de translación espacial,
(3.84):
L → L + Fz az (3.88)
L se altera a no ser que az sea cero. Ya no habrá simetrı́a de translación a lo largo del eje
z. Veremos que esto implica que sólo son constantes las componentes x y y del momento
lineal.
L no cambia bajo rotaciones alrededor del eje z (a lo largo del cual actúa la fuer-
za), pero obviamente no tendrá simetrı́a de rotación alrededor de ningún otro eje. Antes
de aplicar la fuerza, L tenı́a simetrı́a de rotación alrededor de cualquier eje (simetrı́a
esférica), ahora sólo tiene simetrı́a de rotación en el eje z (simetrı́a cilı́ndrica). Esta si-
metrı́a implica que sólo se conserva la componente z del momento angular, en tanto que
en ausencia del campo se conservan las tres componentes. En general, hay una relación
entre las simetrı́as de L y las variables dinámicas que se conservan.
Variables dinámicas. A cualquier función del estado del sistema y del tiempo
se le llama una variable dinámica. Para un sistema con l grados de libertad las va-
riables dinámicas son de la forma Dα (q1 , q2 , ...ql , q̇1 , q̇2 , ...q̇l , t). Ejemplos de variables
dinámicas son:
~ri ; mi~r˙ i ; ~li = mi~ri × ~r˙ i ; (3.89)
N
X N
X N
X 1 2
P~ = mi~r˙ i ; ~ =
L mi~ri × ~r˙ i ; T = mi~r˙ i (3.90)
i=1 i=1 i=1
2
Obviamente es posible definir un número infinito de variables dinámicas para un

sistema dado, pero sólo hay un número de variables dinámicas independientes igual al
doble del número de grados de libertad. En efecto, sólo es posible formar conjuntos de
2l funciones independientes de q1 , q2 , ... ql , q˙1 , q˙2 , ...q̇l , pero pueden definirse muchos
conjuntos diferentes. En general las 2l variables dinámicas independientes de un sistema
no son constantes de movimiento, aunque en principio siempre es posible encontrar un
conjunto de 2l constantes de movimiento, si el sistema es integrable.
Constantes de movimiento. Las ecuaciones de Lagrange dan lugar a un sistema

de l ecuaciones diferenciales acopladas de segundo orden con 2l incógnitas, q1 , q2 , ...ql ,
q̇1 , q̇2 , ...q̇l , independientes entre sı́. La solución a las ecuaciones de movimiento con-
tendrá 2l constantes de integración arbitrarias que determinan los valores iniciales de
(q) y (q̇). En el capı́tulo 1 se definió la especificación del estado del sistema mecánico en
un tiempo t por medio de los valores de las coordenadas y velocidades en ese instante.
Ahora vemos que las constantes de integración determinan no sólo el estado en el tiem-
po inicial, sino además todos los estados subsiguientes. Con sólo dar valores a t, para
unos valores dados de las constantes de integración, se obtienen los valores correspon-
dientes de las variables de estado. Las constantes de integración suministran una noción
global de estado: se dice que a cada conjunto de valores de las constantes de integra-
ción le corresponde un estado de movimiento del sistema. El tiempo inicial, o comienzo
del movimiento, siempre puede tomarse como una de las constantes de integración. La
integración de las ecuaciones de movimiento dará lugar a 2l funciones de la forma:
qν = qν (c1 , c2 , ...c2l−1 , t + t0 )
(3.91)
q̇ν = q̇ν (c1 , c2 , ...c2l−1 , t + t0 ) ; ν = 1, 2, ...l
Podemos en principio invertir estas ecuaciones para expresar las 2l constantes de
integración en función de (q), (q̇), t:
t0 = −t + θ(q, q̇) ; cα = cα (q, q̇) ; α = 1, 2, ..,2l − 1 (3.92)
Por otra parte, con las 2l constantes de integración se puede obtener cualquier otro
conjunto de 2l constantes independientes. En conclusión, a cualquier sistema dinámico
integrable se le pueden asociar 2l funciones de (q), (q̇) y t cuya derivada total respecto a t
sea cero. Estas cantidades son variables dinámicas, o sea que para cada sistema mecánico
integrable siempre es posible hallar 2l constantes de movimiento independientes, o en
otras palabras 2l variables dinámicas que se conservan, si es integrable.
En mecánica cuántica se pueden encontrar a lo sumo l variables dinámicas que
pueden tomar simultáneamente valores constantes. Se dice que para un sistema cuántico
de l grados de libertad hay sólo l operadores hermı́ticos independientes que conmutan
entre sı́ y que tienen estados propios con valores definidos de las correspondientes varia-
bles dinámicas.
Conservación de la energı́a. Se trata de mostrar que para aquellos sistemas

en que L sea simétrica bajo el cambio del origen del tiempo hay una constante de
movimiento que es la energı́a.7 Sea un sistema que cumple estas tres condiciones: (a)
puede ser descrito completamente a partir de L, es decir, se puede definir una función V
de la cual se obtienen todas las fuerzas; (b) el potencial no depende de las (q̇) ni de t; (c)
el sistema es tal que L no dependerá explı́citamente de t al introducir las coordenadas
generalizadas y además es esclerónomo. Mediante la condición (c) se garantiza que las
7 Veremos que si L no cambia al cambiar E, ∂L/∂E = 0, entonces t0 se conserva. Se dice que t0 y E
son dos cantidades canónicamente conjugadas.
ligaduras no realizan trabajo sobre el sistema, entonces para tal sistema se cumple que
L es simétrica bajo el cambio de origen del tiempo:
∂L ∂L
=0 ⇒ =0 (3.93)
∂t0 ∂t
La derivada total de L respecto al tiempo es:
l
dL X ∂L ∂L ∂L
= q̇ν + q̈ν + (3.94)
dt i=1
∂qν ∂ q̇ν ∂t
De las ecuaciones de Lagrange se tiene que:

∂L d ∂L
= − fν (3.95)
∂qν dt ∂ q̇ν
Con lo cual (3.94) toma la forma:
l
dL X d ∂L ∂L
= q̇ν − fν q̇ν + (3.96)
dt ν=1
dt ∂ q̇ν ∂t
O sea que se cumple:

l
! l
dL X ∂L X ∂L
q̇ν − L = fν q̇ν − (3.97)
dt ν=1
∂ q̇ν ν=1
∂t
La cantidad entre paréntesis se llama la función energı́a, denotada h(q, q̇, t) con lo
cual:
l
X ∂L
ḣ(q, q̇, t) = fν q̇ν − (3.98)
ν=1
∂t
De las condiciones (a) y (c) y del hecho de que V no depende de t se sigue que
fν = 0 y ∂L/∂t = 0, con lo cual:
h(q, q̇, t) = constante (3.99)
Esta constante se llama “energı́a” o “constante de Jacobi”. La función h es igual
al hamiltoniano H. La diferencia es que éste se define como una función de (q), (p), t y
aquella es función de (q), (q̇) y t. Veremos que si además se cumple que V no depen-
de de las (q̇), h coincide con la energı́a total T +V . (a) implica que el sistema es holónomo.
Teorema de Euler acerca de las funciones homogéneas. Sea una función f

de n variables: f (x1 , x2 , ...xn ) tal que:
F (λx1 , λx2 , ...λxn ) = λr F (x1 , x2 , ...xn ) (3.100)
Se dice que F es una función homógenea de grado r. El teorema dice que:
N
X ∂F
xi = rF (3.101)
i=1
∂xi
La prueba es la siguiente: derivando ambos lados en (3.101) respecto a λ,

d
F (λx1 , λx2 , ...λxN ) = rλn−1 F (x1 , x2 , ...xn ) (3.102)
dλ
la derivada del lado izquierdo es:
n
X ∂F (λx1 , λx2 , ...λxN ) ∂(λxi )
d
F (λx1 , λx2 , ...λxN ) = (3.103)
dλ i=1
∂(λxi ) ∂λ
Se sigue entonces que:

n
X ∂F (λx1 , λx2 , ...λxN )
xi = λn−1 rF (x1 , x2 , ...xn ) (3.104)
i=1
∂(λxi )
Haciendo ahora λ = 1 se obtiene la igualdad (3.101).
Teorema acerca de la energı́a cinética de un sistema esclerónomo. Si el

sistema es descrito mediante coordenadas generalizadas, en virtud de la ecuación (2.176)
la energı́a cinética puede escribirse como:
N
1 X ˙2
T = mi~ri =
2 i=1
" l l (3.105)
N l 2 #
1X X X ∂~ri ∂~ri X ∂~ri ∂~ri ∂~ri
mi · q˙ν q˙µ + 2 · q̇ν +
2 i=1 ν=1 µ=1
∂qν ∂qµ ν=1
∂qν ∂t ∂t
Como ~ri es función (q) y t, se sigue que T en coordenadas generalizadas toma la

forma:
l X
X l l
X
T (q, q̇, t) = Aνµ (q, t)q̇ν q̇µ + Aν (q, t)q̇ν + A(q, t) (3.106)
ν=1 µ=1 ν=1
O sea que T se puede escribir como la suma de tres funciones homogéneas de las
velocidades generalizadas de grados 2, 1 y 0:
T = T2 + T1 + T0 (3.107)
Se sigue que para un sistema esclerónomo (∂~ri /∂t = 0)

l X
X l
T (q, q̇, t) = T2 (q, q̇, t) = Aνµ (q, t)q̇ν q̇µ (3.108)
ν=1 µ=1
Es decir, que la energı́a cinética es una función homogénea cuadrática en las velo-
cidades. La función Aνµ (q, t) es simétrica:
Aνµ (q, t) = Aµν (q, t) (3.109)

En virtud del teorema de Euler acerca de las funciones homogéneas se sigue que
para un sistema esclerónomo:
Xl
∂T
q̇ν = 2T (3.110)
ν=1
∂ q̇ν
Conservación de la energı́a total T + V. Si se cumple (b), como L = T − V

se sigue que:
∂L ∂T
= (3.111)
∂ q̇ν ∂ q̇ν
Entonces h tomará la forma, en virtud de (3.110) y (3.111):
Xl
∂T
h(q, q̇, t) = q̇ν − T + V = T + V (3.112)
ν=1
∂ q̇ν
En este caso h coincide con la energı́a total.

Las fuerzas que son derivables de un potencial que no depende de las velocidades
ni del tiempo se llaman fuerzas conservativas. Si V depende de las (q̇) cumpliéndose las
otras condiciones, h es una constante de movimiento pero no es la energı́a total. Si se
cumple (c) y que V no dependa de las (q̇), será cierto que h = T + V , pero h no será una
constante de movimiento. En este caso:
X l
dh dE ∂L
= = fν q̇ν − (3.113)
dt dt ν=1
∂t
donde la dependencia que tiene L de t puede provenir sólo de que V dependa del tiempo.
Si las fuerzas fν son viscosas y se pueden obtener de la función de disipación de Rayleigh,
que es una función homogénea cuadrática de las velocidades, en virtud de las ecuaciones
(3.72), (3.74) y (3.101), se sigue que:
l
X Xl
∂F
fν q̇ν = − q̇ν = −2F (3.114)
ν=1 ν=1
∂ q̇ν
En este caso (3.113) será:
dh ∂L ∂E ∂V
= −2F − o = −2F + (3.115)
dt ∂t ∂t ∂t
En (3.115) resulta claro que la rata de cambio de la energı́a total consta de la rata
de disipación de energı́a 2F y de la rata de suministro de energı́a debida a la variación
temporal de V .
Ejemplo 3.4.1 Hallar la constante de Jacobi y la rata de cambio de la energı́a total para
una partı́cula cargada en presencia de un campo electromagnético.
De acuerdo con la ecuación (3.70):

1 ˙2 q
L= m~r − qφ + ~r˙ · A
~ (3.116)
2 c
La función energı́a será:
∂L ˙ 1 2
h= · ~r − L = m~r˙ + qφ (3.117)
∂~r˙ 2
Se ve que h no es la energı́a total E = T + V , lo cual es consecuencia de que V
dependa de la velocidad, h incluye sólo la energı́a potencial eléctrica. En virtud de (3.98)
h será:
∂L ∂V ∂φ q ˙ ∂ A ~
ḣ = − = =q − ~r · (3.118)
∂t ∂t ∂t c ∂t
O sea que en general h será constante de movimiento sólo si los campos no dependen
del tiempo, además del caso particular en que φ y A ~ tengan una forma tal que h sea
cero, como:
q
E = h − ~r˙ · A
~ (3.119)
c
Se sigue que para un campo electromagnético estático:
d q ˙ ~
Ė = − ~r · A (3.120)
dt c
Es decir, E no se conserva porque el potencial magnético no es constante. Si se
aplica el campo electromagnético constante de modo que B~ sea uniforme, A ~ se puede
escribir en la forma:
~ = 1B
A ~ × ~r (3.121)
2
~ es uniforme. En este caso el potencial magnético será:
que satisface a (3.63) si B
q ~ = − q ~r˙ · (B ~ · (~r × ~r˙ ) = − q B
~ × ~r) = − q B
− ~r˙ · A ~ · ~l (3.122)
c 2c 2c 2mc
donde ~l es el momento angular de la partı́cula. Entonces (3.120) y (3.122) nos dan:
q ~ ~˙ qB ˙
Ė = − B·l = − lB (3.123)
2mc 2mc
lB se conserva si L es simétrico bajo rotaciones alrededor del eje determinado por B, ~ lo
cual en general no se cumplirá; para ello basta que φ tenga simetrı́a cilı́ndrica alrededor
~
de B.
Ejemplo 3.4.2 Una partı́cula está sometida al efecto de la gravedad y a la condición

de ligadura de moverse siempre sobre un alambre circular de radio a. El alambre rota
uniformemente con velocidad angular ω alrededor de un eje vertical en el plano del
alambre que pasa por el centro. Calcular h y Ė y analizar su significado.
El problema tiene un grado de libertad. Tomemos el eje z en la dirección de la

fuerza de gravedad, coincidiendo con el eje de rotación. Definamos un sistema de ejes
que rotan solidariamente con el alambre ası́: el eje z ′ en la dirección de la fuerza de
gravedad, coincidiendo con el eje de rotación; el eje y ′ en el plano del alambre; y el eje x′
perpendicular al alambre en el centro. Las fórmulas que expresan a x, y y z en términos
de x′ , y ′ y z ′ son:
x = x′ cos ωt − y ′ senωt ; y = x′ senωt + y ′ cos ωt ; z = z′ (3.124)
Tomemos como coordenada generalizada el ángulo que hace el vector de posición
de la partı́cula con el eje z ′ y en términos del cual podemos expresar a x′ , y ′ y z ′ , puesto
que x′ = 0. Entonces, mediante (3.124) obtenemos:
x = −a senq senωt ; y = a senq cos ωt ; z = a cos q (3.125)
El lagrangiano del problema es en consecuencia:
1
L(q, q̇, t) = ma2 (q̇ 2 + ω 2 senq) + mga cos q (3.126)
2
El lector puede verificar fácilmente que si ω 2 < g/a, la posición q = 0 es de
equilibrio estable con frecuencia de pequeñas oscilaciones dada por Ω = ω 2 − g/a. Si
ω 2 > g/a, la posición de equilibrio estable no es q = 0 sino algún valor de q entre 0
y π/2 con frecuencia de pequeñas oscilaciones dada por Ω2 = g/a − ω 2 . Finalmente,
si ω 2 ≫ g/a, la posición de equilibrio estable será q = π/2, siendo ω la frecuencia de
pequeñas oscilaciones.
Sabemos que si se cumplen las condiciones (a) y (b), pero no se cumple (c), es
decir, si las ligaduras son reónomas, lo cual es el caso para este problema, entonces h no
será la energı́a total.
De (3.107) y (3.112) se sigue, usando el teorema de Euler acerca de las funciones
homogéneas, que:
h = 2T2 + T1 − L = T + V − T1 − 2T0 (3.127)
De (3.98) se sigue que cuando fν = 0,
∂L
ḣ = − = Ė − Ṫ1 − 2Ṫ0 (3.128)
∂t
Por tanto, si como en este ejemplo las ligaduras reónomas no dan lugar a que
t aparezca en L, h será constante de movimiento pero E no lo será. En efecto, en
este caso las ligaduras realizan trabajo sobre el sistema ya que los desplazamientos
virtuales son tangentes al alambre (o sea que éste no realiza trabajo virtual), pero como
un desplazamiento real de la partı́cula no coincide con una virtual, la ligadura realiza
trabajo bajo desplazamientos reales. Para este problema, T2 = 12 ma2 q̇ 2 ; T1 = 0 ; T0 =
1 2 2
2 ma ω sen q y V = −mga cos q. De (3.127) se sigue entonces que:
1
h = T2 − T0 + V = ma2 (q̇ 2 − ω 2 senq) − mga cos q (3.129)
2
la cual es una constante de movimiento. Podemos reinterpretar a h diciendo que es
la energı́a total respecto al sistema de ejes rotantes x′ , y ′ y z ′ . La energı́a cinética
es T ′ = (1/2)ma2 q̇ 2 y la energı́a potencial consta de dos partes, la energı́a potencial

gravitacional y la energı́a potencial centrı́fuga que resulta debido a que el sistema de
referencia x′ , y ′ y z ′ es no inercial, es decir:
1 1
T′ = ma2 q̇ 2 ; V ′ = − ma2 ω 2 senq − mga cos q (3.130)
2 2
En efecto, V ′ puede escribirse como V ′ = −(1/2)maω 2y ′ − mgz ′ y de él se deriva
la fuerza siguiente:
∂V ′ 1
F~ ′ = − ′ = maω 2 î′ + mg k̂ ′ (3.131)
∂~r 2
O sea que (1/2)maω 2 es la fuerza centrı́fuga; es como si existiera un campo gravi-
tacional homogéneo en la dirección x′ .
La energı́a total respecto a los ejes x, y y z será E y constará de dos términos: h
y el trabajo realizado por el alambre. Como ḣ = 0, de (3.128) se sigue que:
Ė = Ṫ1 + 2Ṫ0 = ma2 ω 2 cos q q̇ (3.132)
Para pequeñas oscilaciones alrededor de q = 0, Ė es de la forma Ė= ma2 ω 3 q0 senΩt,
o sea que E = h − (ma2 ω 3 /Ω)q0 cos Ωt, lo cual nos muestra que la energı́a total
tendrá fluctuaciones periódicas.
Conservación del momento lineal. Sea un sistema que cumple las siguientes
condiciones: (a) se describe completamente a partir de un lagrangiano; (b) L no depende
de alguna de las coordenadas generalizadas. Entonces se cumple:
∂L
=0 (3.133)
∂qν0
donde la coordenada qν0 que no aparece en L se llama cı́clica o ignorable. La ecuación
de Lagrange para la coordenada qν0 implica que:

d ∂L
= f0 (3.134)
dt ∂ q̇ν0
O sea que si fν0 = 0 la siguiente cantidad se conserva:
∂L
Pν0 ≡ = constante (3.135)
∂ q̇ν0
Se define el momento canónico conjugado a la coordenada qν ası́:8
∂L
Pν = ; ν = 1, 2, ...l (3.136)
∂ q̇ν
luego, el momento canónico conjugado a una coordenada cı́clica es una constante de
movimiento. Si L no depende de qν0 y fν0 = 0 se dice que el sistema es simétrico bajo
cualquier cambio en la coordenada qν0 .
8 La palabra “canónico” viene desde de época de Hamilton; significa “de acuerdo con el canon”. Se
usa ampliamente en fı́sica para designar diversos aspectos del formulismo hamiltoniano, que describe
los sistemas mecánicos mediante las variables (q, p).
Sea un lagrangiano dado por (3.87). Como L no depende de x ni de y, se sigue que

px = mẋ y py = mẏ son constantes de movimiento. Como L depende de z, pz = mż no
se conserva. Si qν0 es una coordenada lineal, pν0 será un momento lineal.
Homogeneidad espacial. Sea un sistema aislado. Es de esperarse que L no cam-

bie cuando se traslada el sistema como un todo. Esto equivale a desplazar todas las
partı́culas por la misma cantidad sin cambiarles su movimiento:
~ri → ~ri + ~ǫ ; ~r˙ i → ~r˙ i (3.137)
Entonces el cambio experimentado por L será:
XN XN
∂L ∂L
δL = · δ~ri = ~ǫ · (3.138)
i=1
∂~
ri i=1
∂~
qi
Por hipótesis no hay ligaduras, con lo cual las ecuaciones de Lagrange nos dan:
XN N
d ∂L d X dP~
δL = ~ǫ · = ~ǫ · p~i = ~ǫ · , (3.139)
i=1
dt ∂~r˙ i dt i=1 dt
donde P~ es el momento total del sistema. Se sigue que si hay homogeneidad espacial,
δL = 0, entonces se sigue que la variable dinámica ~ǫ· P~ se conserva. Como E es arbitrario,
se sigue que P~ es una constante. Si sólo hay simetrı́a de translación en determinada
dirección ~ǫ se sigue que sólo se conserva la componente de P~ en la dirección de ~ǫ. Como
L = T − V y T sólo depende de las velocidades de las partı́culas,
∂L ∂V
=− = F~i (3.140)
∂~ri ∂~ri
Entonces en (3.138) se tiene:
N
X
δL = ~ǫ · F~i (3.141)
i=1
δL será cero si el sistema no está sometido a una fuerza neta externa, es decir si el
sistema está aislado. O también: si el sistema es aislado, no debe haber fuerzas sobre el
centro de masa:
∂V
F~CM = − =0 (3.142)
∂R~ CM
luego V no depende de RCM y ésta será cı́clica. El momento canónico conjugado de
~ CM será el momento lineal total y será una constante de movimiento:
R
XN
∂L ∂L ∂~r˙ i
P~CM = = · (3.143)
~˙ CM
∂R r˙ i ∂ R
i=1 ∂ ~
~ CM
~ CM está dado por

Como R
N
˙
~ CM 1X ˙
R = mi~ri (3.144)
2 i=1
Se sigue que:
∂~r˙ i ~
= ~1 (3.145)
˙
~
∂ RCM
donde ~~1 es el diádico unidad, que se representa por una matriz unidad de dimensión
3 × 3 (véase sección 7.4). Por tanto:
X ∂LN X N
∂L
= = mi~r˙ i = P~CM (3.146)
˙~ ∂ ˙
~
r
∂ RCM i=1 i i=1
Conservación del momento angular. Sea un sistema que se describe comple-

tamente a partir de un lagrangiano y además tal que no depende de alguna coordenada
angular qν0 , entonces su momento canónico conjugado será un momento angular que se
conserva. Por ejemplo, sea una partı́cula cuyo lagrangiano es:
1 ˙2
L= m~r − V (~r) (3.147)
2
Sea n̂ un eje arbitrario y δφ una rotación alrededor de ese eje (véase figura 3.3).
n
δϕ
δr
r + δr
θ
Figura 3.3 Rotación por ángulo δφ alrededor de n̂
Supongamos que φ es una de las coordenadas generalizadas del sistema. En una

rotación alrededor de n̂ bajo un ángulo δφ, ~r se cambia en ~r + δ~r donde δ~r es un vector
perpendicular a ~r y a n̂ y cuya magnitud es r senθ δφ. Por tanto se cumple que:
δ~r = n̂ × ~rδφ (3.148)
y que:
∂~r
= n̂ × ~r (3.149)
∂φ
El momento canónico conjugado de φ será:
∂L ∂~r˙ ∂~r
pφ = = m~r˙ · = m~r˙ · = m~r˙ · (n̂ × ~r) = n̂ · m~r × ~r˙ (3.150)
∂ φ̇ ∂ φ̇ ∂φ
Se sigue que pφ es la componente del momento angular a lo largo de n̂. Si L no
depende de φ, pφ es una constante de movimiento.
Isotropı́a espacial. Sea un sistema tal que no cambia L cuando se rota como un
todo alrededor de un eje n̂. Esto es, si para cada partı́cula:
~ri → ~ri + n̂ × ~ri δφ ; ~r˙ i → ~r˙ i + n̂ × ~r˙ i δφ (3.151)
el cambio en L será:
X N X N
∂L ∂L ˙
δL = · δ~ri + · δ~ri = p~˙ i · δ~ri + p~i · δ~r˙ i (3.152)
i=1
∂~ri ∂~r˙ i i=1
Usando (3.151) y usando la invariancia del triple producto escalar bajo permutación
cı́clica de los factores:
N
X XN
d
δL = n̂ · ~ri × p~˙ i + p~i × ~r˙ i δφ = n̂δφ · ~ri × p~i (3.153)
i=1 i=1
dt
Con lo cual
~˙
δL = δφn̂ · L (3.154)
~ es el momento angular total. Por otra parte, en virtud de las ecuaciones de
donde L
Lagrange:
N
X
δL = F~i · δ~ri + p~i · δ~ri =
i=1
(3.155)
N
X N
X
δφn̂ · ~ri × F~i + ~r˙ i × p
~i = δφn̂ · ~ki = δφn̂ · K
~
i=1 i=1
~ es el torque total, por tanto:

donde K
∂L ~˙ = n̂ · K
~
= n̂ · L (3.156)
∂φ
Si no hay torque neto sobre el sistema entonces éste será isótropo y en consecuen-
cia se conserva el momento angular total. Si simplemente se anula el torque en cierta
dirección, L será simétrico bajo rotaciones alrededor de esa dirección y se conservará la
~ en esa dirección.
componente de L
Integrales de movimiento aditivas. Para un sistema aislado la energı́a total

E, el momento angular L ~ y el momento lineal P~ se conservan: hay siete constantes de
movimiento. Quedan aún otras 6N − 7 constantes de movimiento. Estas siete constantes
de movimiento tienen la caracterı́stica de ser aditivas. Es decir, si el sistema consta de
varias partes que no interactúan, cada parte tendrá valores determinados de la energı́a,
el momento angular y el momento lineal totales. Las correspondientes cantidades del
sistema total se pueden obtener adicionando las respectivas constantes de movimiento
de las partes.
3.5. El teorema del virial

Es un teorema de naturaleza estadı́stica porque se refiere a promedios temporales.
Sea un sistema que: (a) la energı́a potencial es función homogénea de las coordenadas;
(b) el movimiento es tal que en todo momento las coordenadas y las velocidades toman
valores finitos (el sistema es ligado). Se trata de calcular los valores medios de T y
V cuando el tiempo tiende a infinito. Del teorema de Euler acerca de las funciones
homogéneas se sigue:
N
X ∂T ˙
· ~ri = 2T (3.157)
∂~r˙ i
i=1
Entonces se cumple, dado que V no depende de las velocidades:

N
X N N
˙ d X X
2T = pi · ~ri =
~ p~i · ~ri − ~p˙ i · ~ri (3.158)
i=1
dt i=1 i=1
N N
d X X
2T = pi · ~ri −
~ F~i · ~ri (3.159)
dt i=1 i=1
si tomamos en (3.159) la media temporal a ambos lados, ası́:

Z
1 τ
lı́m 2T dt =
τ →∞ τ 0
!τ Z N (3.160)
1
N
X 1 τ X~

lı́m p~i · ~ri − lı́m Fi · ~ri dt
τ →∞ τ τ →∞ τ 0
i=1 0 i=1
La condición (b) conduce a la anulación del primer miembro del lado derecho, con
lo cual llegamos a:
N
X
2T = − F~i · ~ri , (3.161)
i=1
donde la barra indica promedio temporal. La ecuación (3.161) se denomina el teorema

del virial. El lado derecho de (3.161) es el doble del llamado virial de Clausius.
Si V es función homogénea de las coordenadas, se cumple:
N
X N
X ∂V
− F~i · ~ri = · ~ri = kV = 2T (3.162)
i=1 i=1
∂~ri
donde k es el grado de homogeneidad de V . Como T + V = E es una constante, se sigue
que T + V = E. Por lo tanto se cumple que:
2T + 2V = 2E ; kT + kV = kE (3.163)
De (3.162) y (3.163) se sigue que:
2 k k
V = E; T = E; T = V (3.164)
2+k 2+k 2
Para un potencial del tipo r−1 se cumple que 2T = −V = −2E. Para un potencial
del tipo r2 se cumple: T = V = (1/2)E. Se deduce que para un potencial del tipo r−1
hay movimientos acotados solamente si E < 0, dado que T es positiva, y que para un
potencial del tipo r2 sólo hay movimientos acotados para E > 0.
Ley de Boyle. Sea un sistema constituido por un gas de moléculas en un reci-

piente. En este caso N es muy grande. Si la energı́a cinética media por partı́cula es t,
entonces:
T = Nt (3.165)
La energı́a por partı́cula está relacionada con la temperatura θ a través de la
relación:
3
t = kB θ (3.166)
2
donde kB es la constante de Boltzmann. La ecuación (3.166) se obtiene del teorema de
la equipartición de la energı́a, según el cual por cada grado de libertad hay una energı́a
de (1/2)kθ.
La fuerza sobre la partı́cula i depende de la ligadura impuesta por el recipiente:
F~i = F~ig + R
~i (3.167)
donde F~iges la fuerza ejercida por todas las otras partı́culas del gas sobre la partı́cula i
~
y Ri es la fuerza ejercida por las paredes del recipiente sobre la partı́cula i. Si llamamos
I a:
N
X
I= F~ig .~ri (3.168)
i=1
El virial de Clausius se descompone en dos partes:

N
X N
X
F~i .~ri = I + ~ i .~ri
R (3.169)
i=1 i=1
Las fuerzas R~ i actúan sólo cuando la partı́cula i choca con las paredes del recipiente.
Estas fuerzas representan la reacción del muro a la colisión ejercida por los átomos sobre
la pared. Esto es lo que se denomina la reacción a la presión P que ejerce el gas sobre el
recipiente. PN ~
En un tiempo t dado, en i=1 R i ·~
ri sólo contribuyen los términos correspondientes
a las partı́ulas que en ese instante chocan con las paredes del recipiente. Podemos dividir
el área de las paredes en elementos infinitesimales de área dA. Todas las dN partı́culas
que choquen sobre un dA dado tendrán aproximadamente el mismo radio vector ~ri que
llamaremos ~r. La contribución de las dN partı́culas a la sumatoria será aproximadamente
R~ dN · ~r, donde R~ es la fuerza que ejerce el elemento de área sobre cada una de las dN
partı́culas que inciden sobre ella. Si llamamos R ~ dN = dR,
~ entonces tenemos que:
N
X Z
~ i · ~ri =
R ~
~r · dR (3.170)
i=1
~ en términos de la
Si n̂ es un vector normal a la superficie, podemos escribir a dR
presión de la siguiente manera:
~ = −n̂P dA
dR (3.171)
Como la presión es constante escribimos:
N
X Z
~ i · ~ri = −P
R n̂ · ~r dA (3.172)
i=1
Ahora, en virtud del teorema de la divergencia, podemos pasar de la integral de

superficie a una integral de volumen:
Z Z
~
~r · dS = ∇ · ~rdV = 3V (3.173)
S V
Entonces:
N
X
~ i · ~ri = −3P V
R (3.174)
i=1
Como esta cantidad no depende del tiempo se sigue que:

N
X
F~i · ~ri = I − 3P V (3.175)
i=1
En virtud del teorema del virial, que es válido en este caso porque el movimiento
es acotado, y usando (3.162) y (3.166) se sigue que:
3N KB θ = −I + 3P V (3.176)
Llegándose a la ecuación de estado para un gas real:
1
P V = N KB θ + I (3.177)
3
El término (1/3)I es una medida de la separación de la ecuación de estado del

gas real respecto al ideal en el cual no se consideran los efectos de interacción entre las
moléculas dada por 3.168, en tanto que P V proviene de la ligadura impuesta por el
recipiente.
4
La formulación hamiltoniana
4.1. Las variables hamiltonianas de estado

En el formalismo lagrangiano el estado de un sistema mecánico holónomo con l
grados de libertad se describe por medio de las qν y q̇ν . Por medio de la función L(q, q̇, t)
se hallan las ecuaciones de movimiento a partir de las ecuaciones de Lagrange. Las va-
riables (q, q̇, t) se llaman variables lagrangianas. Hamilton (1805-1865) propuso describir
el sistema mediante las variables (q, p, t), donde los pν son los momentos generalizados
canónicamente conjugados a las coordenadas generalizadas qν definidos por:
∂L(q, q̇, t)
pν = ; ν = 1, 2, ...l (4.1)
∂ q̇ν
Las variables (q, p, t) se llaman variables hamiltonianas. Las ecuaciones (4.1) cons-
tituyen las fórmulas de transformación de las variables (q, q̇, t) a las variables (q, p, t).
En (4.1) hay l ecuaciones que relacionan las l cantidades pν con las l cantidades q̇ν . En
principio se pueden expresar las (q̇) en términos de las (p) por la transformación inversa:
q̇ν = Φν (q, p, t) ; ν = 1, 2, ...l (4.2)
Es claro que el estado del sistema puede ser descrito indistintamente por las va-
riables lagrangianas o por las hamiltonianas. Decimos que L “genera” la transformación
(q, q̇, t) → (q, p, t). Según (3.106) y (3.107) T se puede escribir como:
T = T2 + T1 + T0 (4.3)
Si V no depende de las (q̇),
Xl
∂L ∂T
pν = = = Aνµ q̇µ + Aν ; ν = 1, 2, ...l (4.4)
∂ q̇ν ∂ q̇ν µ=1
Mediante este sistema de ecuaciones lineales podemos expresar a (q̇) en términos

de (p):
l
X
q̇ν = bνµ pµ + bν ; ν = 1, 2, ...l (4.5)
µ=1
85
Si V depende de las (q), (q̇) en la forma:

l
X
V (q, q̇, t) = Πν (q, t)q̇ν + Π(q, t) (4.6)
ν=1
que serı́a por ejemplo la forma que tomarı́a el potencial electromagnético (3.68) al ser
expresado en coordenadas generalizadas, entonces pν será:
l
X
pν = Aνµ q̇µ + Aν − Πν ; ν = 1, 2, ...l (4.7)
µ=1
Notación. Usaremos L para denotar a T −V , expresada en función de las variables

lagrangianas. Es claro que al expresarla en términos de las variables hamiltonianas la
función es diferente, aunque a veces, sin mucho rigor, se le escribe también como L. Lo
correcto es:
L(q, q̇, t) = L [q, q̇(q, p, t), t] = L(q, p, t) (4.8)
Ejemplo 4.1.1 Sea el lagrangiano:

1 2
L(~r, ~r˙ , t) = m~r˙ − ~r˙ · Π(~
~ r , t) − Π(~r, t) (4.9)
2
El momento canónico será:
∂L ~
p=
~ ~ ⇒ ~r˙ = p~ + Π
= m~r˙ − Π (4.10)
˙
∂~r m
Con lo cual:
~2
~2 − Π
p
L(~r, p~, t) = −Π (4.11)
2m
La función hamiltoniana. Se definió en (3.97) la función energı́a como:
Xl
∂L(q, q̇, t)
h(q, q̇, t) = q̇ν − L(q, q̇, t) (4.12)
ν=1
∂ q̇ν
A la función energı́a expresada en términos de las variables hamiltonianas se le

llama la función hamiltoniana:
l
X
H(q, p, t) ≡ h(q, p, t) = h[q, q ′ (q, p, t), t] = pν q̇ ν − L(q, p, t) (4.13)
ν=1
Los generadores de la transformación de Legendre. Sea X(x1 , x2 , ...xn ; α1 ,

α2 , ... αm ) una función que “genera” la siguiente transformación de variables (x1 , x2 , ...xn )
→ (y1 , y2 , ...yn ):
∂X
yi = ; i = 1, 2, ...n (4.14)
∂xi
La formulación hamiltoniana / 87
entonces existe una transformación de las variables y1 , y2 , ...yn a las variables x1 , x2 ,

...xn , la transformación inversa, “generada” por cierta función Y (y1 , y2 , ...yn ; α1 , α2 ,
...αm ):
∂Y
xi = ; i = 1, 2, ...n (4.15)
∂yi
Demostremos que las funciones X y Y están relacionadas por la fórmula:
Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) =
n
X (4.16)
xi yi − X(x1 , x2 , ...xn ; α1 , α2 , ...αm )
i=1
En efecto, es posible expresar las variables xi en términos de las yi :
xi = fi (x1 , x2 , ...xn ; α1 , α2 , ...αm ) ; i = 1, 2, ...n (4.17)
Con lo cual escribimos (4.16) como:
Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) =

n
X (4.18)
yk fk − X(f1 , f2 , ...fn , α1 , α2 , ...αm )
k=1
Entonces:
X n n
X
∂Y ∂fk ∂X ∂fk
= yk + fk δik − =
∂yi ∂yi ∂fk ∂yi
k=1 k=1
(4.19)
n
X
∂fk ∂fk
yk − yk + fi = xi
∂yi ∂yi
k=1
Demostremos el siguiente teorema:

∂Y ∂X
=− ; i = 1, 2, ...m (4.20)
∂αi ∂αi
Para evaluar ∂y/∂αi usemos la ecuación (4.18):
n
X ∂fk X ∂X ∂fk n
∂Y ∂X
= yk − − (4.21)
∂αi ∂αi ∂fk ∂αi ∂αi
k=1 k=1
En virtud de (4.14), los términos de la sumatoria se cancelan, con lo cual queda

demostrado el teorema. Una transformación de este tipo es llamada transfomación de
Legendre (1752-1833).
En sı́ntesis, las fórmulas caracterı́sticas de una transformación de Legendre son:
X = X(x1 , x2 , ...xn ; α1 , α2 , ...αm ) (4.22)

Y = Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) (4.23)
∂X ∂Y
yi = ; xi = ; i = 1, 2, ...n (4.24)
∂xi ∂yi
X ∂Y ∂X
Y = xk yk − X ; =− ; i = 1, 2, ...m (4.25)
∂αi ∂αi
k
Las ecuaciones de movimiento hamiltonianas. La transformación de las

variables lagrangianas a las hamiltonianas es una transformación de Legendre generada
por la función L. Aquı́ las q̇ν hacen el papel de las xi , el conjunto (q), t, hace el papel
de las (α), y las pν hacen el papel de las yi ; L es X. Comparando (4.13) y (4.16) vemos
que H es Y :
l
X
H(q, p, t) = pν q̇ν − L(q, q̇, t) (4.26)
ν=1
Es decir, L genera la transformación (q̇) → (p) y H genera la transformación

inversa (p) → (q̇):
∂H(q, p, t)
q̇ν = (4.27)
∂pν
De las ecuaciones (4.20) se sigue inmediatamente que:
∂H ∂L
=− ; ν = 1, 2, ...l (4.28)
∂qν ∂qν
∂H ∂L
=− (4.29)
∂t ∂t
teniendo en cuenta que el conjunto (q), t, hace el papel de las (α). De las ecuaciones de
Lagrange se sigue que:
∂L d ∂L
= − fν = ṗ − fν ; ν = 1, 2, ...l (4.30)
∂qν dt ∂ q̇ν
Las ecuaciones (4.27) a (4.30) nos dan:
∂H ∂H
q̇ν = ; p˙ν = − + fν ; ν = 1, 2, ...l (4.31)
∂pν ∂qν
Las ecuaciones (4.31) se denominan las ecuaciones canónicas de Hamilton y cons-
tituyen las ecuaciones de movimiento en las variables hamiltonianas. Son 2l ecuaciones
diferenciales que involucran sólo primeras derivadas de (q) y (p), en tanto que las de
Lagrange son l ecuaciones deferenciales de segundo orden en las (q). En esencia sólo el
segundo conjunto de ecuaciones (4.31) constituye las ecuacionnes de movimiento, pues
el primer conjunto sólo proporciona la transformación inversa a pν = ∂L/∂ q̇ν .
La función hamiltoniana. H no sólo permite escribir las ecuaciones de movi-

miento sino que tiene significado fı́sico directo. Veamos qué es Ḣ:
Xl
∂H ∂H ∂H
Ḣ = q̇ν + ṗν +
ν=1
∂qν ∂p ν ∂t
l
X ∂H
= [(fν − ṗν ) q̇ν + q̇ν ṗν ] + (4.32)
ν=1
∂t
l
X ∂H
= fν q̇ν +
ν=1
∂t
Si las ligaduras reónomas no dan lugar a que t aparezca en H y el potencial no
depende del tiempo, ∂H/∂t = 0, y si además no hay fuerzas no derivables del potencial,
se sigue que Ḣ = 0, o sea que H es una constante de movimiento. Si además las fuerzas
son derivables de un potencial que no depende de las velocidades, sabemos de (3.112)
que H = T + V . O sea que bajo estas condiciones la energı́a total E = T + V se conserva,
de lo contrario se cumple que H es constante pero no es cierto que H = E. Si V no
depende de (q̇) ni de t y las ligaduras reónomas no dan lugar a que t aparezca en H se
cumple que ∂H/∂t = 0 y que H = T + V . En este caso:
l
dE d(T + V ) X
= = fν q̇ν (4.33)
dt dt ν=1
Luego, dE/dt es igual a la rata a la cual las fuerzas no conservativas realizan tra-
bajo sobre el sistema. Si estas son nulas, la energı́a total se conserva.
Por otra parte, si las fν son cero, o bien V depende de t, o las ligaduras reónomas
dan lugar a que t aparezcan en H,
dH ∂H
= (4.34)
dt ∂t
Ejemplo 4.1.2 Usando la transformación de Legendre inversa, derivar las ecuaciones de
movimiento lagrangianas a partir de las ecuaciones de movimiento hamiltonianas.
Supongamos que fν = 0. Las ecuaciones de movimiento serán:
∂H ∂H
q̇ν = ; ṗ = − ; ν = 1, 2, ...l (4.35)
∂pν ∂qν
La transformación de Legendre inversa es (p) → (q̇) y está generada por H:
∂H(q, p, t)
q̇ν = ; ν = 1, 2, ...l (4.36)
∂pν
El generador de la transformación (q̇) → (p) es L:
l
X
L(q, q̇, t) = q̇ν pν − H(q, p, t) (4.37)
ν=1
En virtud del teorema dado por (4.20):

∂L ∂H ∂L ∂H
=− ; ν = 1, 2, ...l ; =− (4.38)
∂qν ∂qν ∂t ∂t
O sea:
∂L
= ṗν ; ν = 1, 2, ...l (4.39)
∂qν
Como L genera la transformación (q̇) → (p)
∂L
pν = ; ν = 1, 2, ...l (4.40)
∂ q̇ν
Con lo cual llegamos a las ecuaciones de Lagrange:
∂L d ∂L
= ; ν = 1, 2, ...l (4.41)
∂qν dt ∂ q̇ν
Ejemplo 4.1.3 Hallar las ecuaciones de movimiento correspondientes a las variables (p),
(ṗ) y t obtenidas mediante una transformación de Legendre.
El generador de la transformación (q) → (−ṗ) es H:

∂H
−ṗν = ; ν = 1, 2, ...l (4.42)
∂qν
Entonces el generador de la transformación (−ṗ) → (q) será cierta función L′ (p, ṗ, t)
dada por:
l
X
L′ (p, ṗ, t) = (−ṗν )qν − H(q, p, t) (4.43)
ν=1
En virtud del teorema (4.20):

∂L′ ∂H ∂L′ ∂H
=− ; ν = 1, 2, ...l; =− (4.44)
∂pν ∂pν ∂t ∂t
Como en virtud de las ecuaciones de Hamilton:
∂H
= q̇ν ; ν = 1, 2, ...l (4.45)
∂pν
y debido a que L′ genera la transformación (−ṗ) → (q)
∂L′
−qν = ; ν = 1, 2, ...l (4.46)
∂ ṗν
Se sigue de (4.44), (4.45) y (4.46) que:
∂L′ d ∂L′
= −q̇ν = ; ν = 1, 2, ...l (4.47)
∂pν dt ∂ ṗν
Entonces las ecuaciones de movimiento lagrangianas para las variables (p) y (ṗ)
son:
∂L′ (p, ṗ, t) d ∂L′ (p, ṗ, t)
− = 0; ν = 1, 2, ...l (4.48)
∂pν dt ∂ ṗν
Esta es la representación de momentos, que nos dice que mediante las variables
(p), (ṗ) es posible describir completamente el sistema.
Ejemplo 4.1.4 Hallar las ecuaciones de movimiento lagrangianas y hamiltonianas para

una partı́cula de masa m en el potencial V = −k/r (r distancia del origen a la partı́cula).
1 2 k
L=T −V = mṙ + (4.49)
2 r
L es esféricamente simétrico, luego se conserva el momento angular ~l = m~r × ~r˙ :

~l es constante en magnitud y dirección. Entonces ~r y ~r˙ son perpendiculares a ~l y en
consecuencia el movimiento es en un plano. Elegimos un sistema de coordenadas polares
en el plano del movimiento, con lo cual:
1 k
L= m(ṙ2 + r2 φ̇2 ) + (4.50)
2 r
El sistema, para ~l dado, tiene en esencia dos grados de libertad, luego hay dos
ecuaciones de Lagrange:
k
mr̈ − mrφ̇ + =0 y mr2 φ̇ = constante (4.51)
r2
Como ~l vale:
~l = m~r × ~r˙ = mr2 φ̇k̂ (4.52)
donde k̂ es un vector unitario normal al plano del movimiento, se sigue de (4.51) y (4.52)
que:
l2 k
mr̈ − + 2 =0 (4.53)
mr3 r
La anterior es una ecuación que permite hallar a r(t) para l dado. Una vez conocido
r(t), tenemos que φ(t) se determina al integrar:
l
φ̇ = (4.54)
mr2
Para pasar al formalismo hamiltoniano partimos de las fórmulas de transformación:
∂L ∂L
pr = = mṙ ; pφ = = mr2 φ̇ = l = constante (4.55)
∂ ṙ ∂ φ̇
El hamiltoniano será:
H(r, φ, pr , pφ ) = pr ṙ + pφ φ̇ − L =
! (4.56)
p2r p2φ 1 p2r 2
p2φ k
+ 2 − m + r −
m r 2 m2 m2 r 4 r
Con lo cual:
p2r p2φ k
H= + − =T +V (4.57)
2m 2mr2 r
Las ecuaciones de Hamilton serán:
∂H pr ∂H p2φ k
ṙ = − = ; ṗr = − =− 3 + 2
∂pr m ∂r mr r
(4.58)
∂H pφ ∂H
φ̇ = = ; ṗφ = − =0
∂pφ mr2 ∂φ
Las ecuaciones (4.58) de la izquierda no son más que las ecuaciones de la trans-
formación inversa a (4.55). Al reemplazar éstas en las ecuaciones (4.58) de la derecha,
se obtienen las ecuaciones (4.51), como es de esperarse. Es decir, el formalismo hamil-
toniano no aporta nada nuevo en cuanto a las ecuaciones de movimiento se refiere.
Notamos que φ es cı́clica tanto en L como en H. En consecuencia pφ se conserva.
H presenta las mismas simetrı́as que L y por tanto tiene los mismos teoremas de con-
servación.
Ejemplo 4.1.5 Hallar el hamiltoniano y las ecuaciones de movimiento para una partı́cula
en un sistema de coordenadas que rota uniformemente con velocidad angular ~ω .
En el sistema de ejes espaciales:
1
L ~r, ~r˙ = m~r˙2 − V (~r) (4.59)
2
Si instantáneamente coinciden los ejes espaciales y los ejes rotantes, se cumple que:
~r = ~r
(4.60)
~r˙ = ~r˙ + ~
ω × ~r
donde ~r es el vector de posición de la partı́cula respecto a los ejes rotantes y ~r˙ su velocidad
en esos ejes. Entonces usando la transformación (4.60), (4.59) tomará la forma:
1 2 2

~ ˙
~ ˙
~ ~˙ ~
L r, r = m r + 2r · ~ω × r + ~ω × r ~ − V ~r (4.61)
2
Las componentes del momento canónico son:
∂L
px = ... (4.62)
∂ ẋ
O vectorialmente:

~p = ∂L = m ~r˙ + ~
ω × ~r (4.63)
∂~r˙
La velocidad expresada en términos del momento es:
~
~r˙ = p − ~
ω × ~r (4.64)
m
El lagrangiano (4.61) en términos de las variables hamiltonianas es:
1 p2
L ~r, ~p = − V ~r (4.65)
2m
!
X ~p 1 p2
H ~r, ~p = pν q̇ ν − L = ~p · − ~ω × ~r − + V ~r (4.66)
ν
m 2m
Con lo cual:
1 p2 ~
H= ω × ~r + V ~r
−p· ~ (4.67)
2m
˙ H es:
En términos de ~r y ~r,
1 ~˙ 2 1 2
h= ω × ~r + V ~r
mr − m ~ (4.68)
2 2
Nótese que el hamiltoniano correspondiente a L(~r, ~r˙ ) difiere de h por el término
m(~ω × ~r)2 /2. Comparando las ecuaciones (4.61) y (4.68) vemos que h no es T + V . De
acuerdo con (3.124), h es T + V sólo si T es función cuadrática de las velocidades, en
tanto que en este caso hay en T términos de las formas T1 y T0 .
1 2
T2 = mṙ
2
T1 = m~r˙ · (~
ω × ~r ) (4.69)
1
T0 = ω × ~r)2
m(~
2
h es una constante de movimiento porque L no depende del tiempo y no hay fuerzas
disipativas, pero E = T + V no es constante de movimiento. De acuerdo con (3.126):
Ė = Ṫ1 + 2Ṫ0 (4.70)
Vemos que T1 + 2T0 actúan como un trabajo sobre el sistema que hace que E no
sea constante. Esto es debido a la rotación del sistema de coordenadas. Sucede que en
este caso la transformación ~r → ~r depende del tiempo debido a la rotación, con lo cual
la transformación es de tipo reónomo. T1 + 2T0 es un potencial “ficticio” inercial. T1
está asociada con la fuerza de Coriolis y T0 con la fuerza centrı́fuga. H puede escribirse
como:
p2
H= ω · ~r × ~p + V ~r
−~ (4.71)
2m
en términos de ~l = ~r × ~p se escribe como:

p2
H= ω · ~l + V ~r
−~ (4.72)
2m
como ~r depende explı́citamente del tiempo, es de esperarse que ~l no se conserve.

Las ecuaciones de movimiento son:
~p˙ = ∂H ~ ∂V
− = p × ~ω −
∂~r ∂~r
(4.73)
∂H ~p
~r˙ = = − ~ω × ~r
∂~p m
Como suponemos a ~ω constante,
~˙ ~p × ~ω
~¨r = p − ~
ω × ~r˙ = −
1 ∂V
− ~ω × ~r (4.74)
m m m ∂~r
Expresando en (4.74) a ~p en términos de ~r˙ obtenemos:

1 ∂V
ω × ~r˙ + ~
~¨r + 2~ ω × ~ω × ~r = − (4.75)
m ∂~r
Vemos que la fuerza en el sistema rotante no es masa por aceleración, sino que tiene
dos términos adicionales, el centrı́fugo y el de Coriolis, que caracterizan el movimiento
de una partı́cula descrito desde un sistema de referencia no inercial.
4.2. Simetrı́as y el teorema de conservación

Una coordenada cı́clica en L también es cı́clica en H. En efecto, de las ecuaciones
de Lagrange y de las ecuaciones de Hamilton se sigue respectivamente que:
∂L
ṗν = fν +
∂qν
(4.76)
∂H
ṗν = fν − ; ν = 1, 2, ...l
∂qν
Con lo cual siempre se cumple:
∂L ∂H
=− ; ν = 1, 2, ...l (4.77)
∂qν ∂qν
que en realidad es una propiedad general de la transformación de Legendre (q̇) → (p)

según (4.28). Se sigue que todos los resultados obtenidos para L en cuanto a la relación
entre simetrı́as y teoremas de conservación se aplican directamente en el formalismo
hamiltoniano.
De (4.32) se sigue que si no hay fuerzas disipativas y H no contiene el tiempo
explı́citamente (o, de (4.29), cuando L no contiene el tiempo explı́citamente):
dH ∂H
=− =0 (4.78)
dt ∂t
Además, si la transformación a coordenadas generalizadas no contiene el tiempo
explı́citamente y V no depende de las velocidades, H = T + V = E, o sea que la energı́a
se conserva. Si H no depende de t pero hay fuerzas disipativas:
X l
dH dA
= fν q̇ν = (4.79)
dt ν=1
dt
Si además H = T + V = E, se sigue:
dE dA
= (4.80)
dt dt
Si la transformación de coordenadas depende del tiempo explı́citamente, V no
depende de (q̇) y fν = 0,
T = T0 + T1 + T2 (4.81)
entonces se sigue que:

l
X
pν = 2 Aµν q̇µ + Aν ; ν = 1, 2, ...l (4.82)
µ=1
con lo cual
H = T2 − T0 + V = E − T1 − 2T0 (4.83)
la H anterior en general no se conserva.
Simetrı́as de cambio de escala. Supongamos que el sistema es conservativo,

de modo que E = T + V . Por simplicidad supondremos que no hay ligaduras, de modo
que las coordenadas cartesianas pueden tomarse como coordenadas generalizadas inde-
pendientes. La simetrı́a de cambio de escala se da en una clase restringida de sistemas:
aquellos en los cuales la energı́a potencial V es una función homogénea de grado k:
V (λ~r1 , λ~r2 , ...λ~rN ) = λk V (~r1 , ~r2 , ...~rN ) (4.84)
En coordenadas cartesianas T no depende de las coordenadas y es una función

homogénea cuadrática de las velocidades:
T (λ~r˙1 , λ~r˙2 , ...λ~rN

˙ ) = λ2 T (~r˙ 1 , ~r˙ 2 , ...~r˙ N ) (4.85)
Supongamos la siguiente transformación de cambio de escala en las longitudes y

tiempos:
~ri → α~ri ; i = 1, 2, ...N
(4.86)
t → βt
Entonces:
2
α
V → αk V ; T → T (4.87)
β
El cambio en H será:
2
α
H→ T + αk V (4.88)
β
H será función homogénea de grado k bajo la transformación (4.86) si:
α2
= αk ; H → αk H (4.89)
β2
Esta transformación no cambia la forma de las ecuaciones de Hamilton:
α2
1 ∂H α 1 β 2 ∂H
~r˙ i = → ~r˙ i = ; i = 1, 2, ...N (4.90)
m ∂~r˙ i β m α ∂~r˙ i
β
α2
∂H α β 2 ∂H
m~¨ri = − → m 2 ~¨r i = (4.91)
∂~ri β α ∂~ri
Esta transformación pertenece a la clase de las transformaciones canónicas, o sea
a las transformaciones que no cambian la forma de las ecuaciones canónicas.
La ecuación (4.86) dice que si las longitudes l se cambian por l′ = αl y los tiempos
t por t′ = βt, el sistema tendrá simetrı́a de cambio de escala si α y β son tales que se
cumple (4.89), β = α1−k/2 , o sea si la transformación en longitudes y tiempos cumple:
′ 1−k/2
t′ l
= (4.92)
t l
La ecuación (4.92) permite obtener algunas simples relaciones entre los perı́odos
de oscilación de sistemas periódicos que sólo difieren entre sı́ por sus dimensiones carac-
terı́sticas y para los cuales V sea función homogénea.
Para el péndulo simple, donde el potencial mgz es función homogénea de grado 1:
r
t′ l′
= , (4.93)
t l
como se ve, es general; vale no sólo para pequeñas oscilaciones.
Para el oscilador armónico simple V es función homogénea de grado k = 2. En este

caso:
t′
=1 (4.94)
t
Nos dice que el perı́odo del movimiento no depende de la amplitud.
Para el potencial gravitacional, V = −Gm1 m2 /r, k = −1. Entonces:
′ 3/2
t′ l
= (4.95)
t l
En este caso la longitud caracterı́stica es la distancia media al sol. La ecuación

(4.95) expresa la tercera ley de Kepler, que vale para un potencial del tipo 1/r solamente.
Una transformación canónica se refiere sólo a transformaciones de las coordena-
das y momentos, pero no del tiempo. Sin embargo, la transformación (4.86), cuando
las coordenadas cartesianas son a la vez generalizadas, es equivalente a la transforma-
ción canónica ~ri → α~ri ; ~
pi → (α/β)~pi , i = 1, 2, ...N . En rigor (4.86) debe llamarse
transfomación de semejanza mecánica.
4.3. La segunda forma del principio de Hamilton

La segunda forma del principio de Hamilton es simplemente el principio variacional
del cual puede obtenerse la trayectoria del sistema en el espacio de fases. En otras
palabras, se busca hallar qué principio variacional conduce a las ecuaciones de Hamilton
como ecuaciones de Euler-Lagrange, en el espacio de fases:
Z x2
d ∂f ∂f
δ f (y, y ′ , x)dx = 0 implica que ′
− =0 (4.96)
x1 dx ∂y ∂y
Sea la función:
l
X
L̃(q, p, q̇, ṗ, t) = pν q̇ν − H(p, q, t) (4.97)
ν=1
L̃ es función de las variables señaladas tomadas independientemente. En particular

(p) y (q̇) toman todos los valores compatibles con las ligaduras, independientemente de
que se puedan relacionar mediante una transfomación de Legendre. Sea ahora el siguiente
principio variacional en el espacio de fases:
Z t2
δ L̃(q, p, q̇, ṗ, t) dt = 0 (4.98)
t1
Con las condiciones en los extremos:
δpν = 0 , δqν = 0 en t = t1 y t = t2 ; ν = 1, 2, ...l (4.99)

Las ecuaciones correspondientes de Euler-Lagrange son:

d ∂ L̃ ∂ L̃
− = 0; ν = 1, 2, ...l
dt ∂ q̇ν ∂qν
(4.100)
d ∂ L̃ ∂ L̃
− = 0; ν = 1, 2, ...l
dt ∂ ṗν ∂pν
Las ecuaciones (4.97) y (4.100) conducen a las ecuaciones canónicas de Hamilton.
L̃ y L coinciden solamente sobre las trayectorias verdaderas, para las cuales se debe
cumplir que:
∂L
pν = ν = 1, 2, ...l (4.101)
∂ q̇ν
El espacio de fases. La formulación lagrangiana está definida en el espacio de
configuración l-dimensional constituido por las coordenadas generalizadas q1 , q2 , ...ql .
Matemáticamente, el espacio de configuración puede considerarse como una variedad
diferenciable de l dimensiones. El espacio de los momentos generalizados también es l
dimensional y está constituido por los p1 , p2 , ...pl y se llama espacio de los momentos,
que también es una variedad diferenciable de l dimensiones.
Como sabemos, el estado del sistema puede describirse igualmente por (q, q̇) o por
(p, ṗ), o por dos puntos del espacio de configuración o el de momentos respectivamente.
q1 , q2 , ...ql ; p1 , p2 , ...pl forman el espacio de fases que es una variedad diferenciable
2l-dimensional. Cada punto del espacio de fases representa un estado del sistema y ca-
da trayectoria de fases representa un estado de movimiento del sistema. En efecto, las
variables hamiltonianas (q, p) especifican exhaustivamente el estado del sistema.
Ejemplo 4.3.1 Sea una partı́cula de masa m sometida a la condición de ligadura de

moverse sobre la superficie de un cilindro, y sometida a una fuerza restauradora lineal
dirigida hacia el centro del cilindro, F~ = −k~r, donde se toma el origen de coordenadas
en el centro del cilindro. Hacer un estudio de la trayectoria en el espacio de fases.
Tomando el eje z a lo largo del eje del cilindro, la condición de ligadura se puede
expresar por:
x2 + y 2 = R2 (4.102)
Las coordenadas generalizadas pueden tomarse θ, z, donde θ es un ángulo en el
plano perpendicular al eje del cilindro. Entonces L(θ, θ̇, z, ż) será:
1 1
L=T −V = m(R2 θ̇2 + ż 2 ) − k(R2 + z 2 ) (4.103)
2 2
Los momentos canónicos son:
pθ = mR2 θ̇ ; pz = mż (4.104)
p2z p2θ 1
H =T +V = + 2
+ kz 2 (4.105)
2m 2mR 2
donde hemos suprimido una constante aditiva. Planteando las ecuaciones de Hamilton
e integrándolas se llega a la solución:
θ = θ0 + at (4.106)
r !
k
z = z0 sen t+δ (4.107)
m
donde θ0 , a, z0 y δ son constantes de integración. Las ecuaciones (4.106) y (4.107)

permiten hallar la ecuación de la trayectoria en el espacio de configuración:
r !
1 k
z = z0 sen θ+φ , (4.108)
a m
p
gráficamente tomamos θ0 = 0, δ = 0, de modo que φ = 0. Llamando ω = k/m
obtenemos:
ω
θ = at ; z = z0 sen ωt ; z = z0 sen θ (4.109)
a
–R
m
–z0 z
z0
–R
y
w=a
Figura 4.1 Partı́cula constreñida a moverse sobre la superficie de un cilindro
La figura 4.1 representa el caso en que ω = a. La trayectoria en el espacio de

configuración siempre será cerrada cuando ω/a sea un número racional. La proyección
del movimiento sobre el eje z es armónica simple y sobre el plano x − y es circular
uniforme.
Como l = 2, el espacio de fases es 4-dimensional, constituido por θ, pθ , z, pz .
Como pθ es constante, pθ = mR2 a, basta representar la proyección del espacio
4-dimensional sobre el subespacio 3-dimensional θ, z, pz . La proyección de la trayectoria
de fases sobre pθ es un punto.
El movimiento en z es armónico simple. El diagrama de fases ż, z, es una elipse.
Igualmente la proyección de la trayectoria de fases sobre el plano z, pz será una elipse. El
diagrama de fases θ̇, θ, es una lı́nea recta, como también la proyección de la trayectoria
de fases sobre el plano θ, pθ .
La proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz , es
una hélice elı́ptica. Esto es representado en la figura 4.2.
pz Ez = cte pθ
pθ = cte
z θ
pθ = mR2a
pz2 1
Ez = + kz 2
zm i2 pθ
pz
pθ = cte
z
Superficie Ez = cte
Figura 4.2 Arriba: diagramas de fases sobre los planos z-pz y θ-pθ respectivamente. Abajo:
Proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz .
Para este ejemplo, el principio de Hamilton dice que la trayectoria correcta en el

espacio de configuración es aquella para la cual la integral de acción es extremal:
Z t2 Z t2 "Xl
#
∂L
δ L(q, q̇, t) dt = δ q̇ν − h(q, q̇, t) dt = 0
t1 t1 ν=1
∂ q̇ν (4.110)
{δqν (t1 ) = δqν (t2 ) = 0}
En tanto que el principio de Hamilton en el espacio de fases (segunda forma del

principio de Hamilton) dice que la trayectoria correcta en el espacio de fases es aquella
para la cual es extremal la integral sobre dt de L̃ (véase figura 4.2):
Z t2 Z l
t2 X
δ L̃(q, q̇, p, ṗ, t) dt = δ [pν q̇ν − H(q, p, t)] dt = 0
t1 t1 ν=1
(4.111)
δqν (t1 ) = δqν (t2 ) = 0
δpν (t1 ) = δpν (t2 ) = 0

4.4. Las transformaciones puntuales. Las transforma-

ciones en el espacio de fases
Puntuales son las transformaciones de un sistema de coordenadas generalizadas a
otro:
qν → q ν = q ν (q, t) ; ν = 1, 2, ...l (4.112)
Las velocidades generalizadas se transforman como:
Xl
∂q ν ∂q
q̇ µ = q̇µ + ν = q̇ ν (q, q̇, t) ; ν = 1, 2, ...l (4.113)
ν=1
∂qµ ∂t
Bajo estas transformaciones, tanto las ecuaciones de Lagrange como las de Hamil-
ton son covariantes.
Transformaciones en el espacio de fases. Son transformaciones más generales

que las puntuales. Si para definir el estado del sistema se requiere todo el espacio de
fases, podemos pensar que cualquier conjunto de variables (2l) sirve equivalentemente
para describir el estado. Un cambio de variables en el espacio de fases involucra no sólo
las coordenadas generalizadas sino también los momentos:
qν , pν → q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l (4.114)
Ejemplo 4.4.1 Un oscilador armónico unidimensional. El espacio de fases es bidimen-
sional, definido por las “coordenadas cartesianas” x − px . Definir en el espacio de fases
una transformación a “coordenadas polares”; hallar a H y las ecuaciones de Hamilton
en esas variables (véase figura 4.3). Nota: es irrelevante reemplazar a px por px /mω.
La transformación a coordenadas polares está dada por:
p2x
x+ = r2 (4.115)
m2 ω 2
px
tan φ = (4.116)
mωx
Entonces H se transforma ası́:

p2x 1 1 p2 1
H= + mω 2 x2 = mω 2 x2 + 2x 2 = mω 2 r2 (4.117)
2m 2 2 m ω 2
Es decir, el nuevo hamiltoniano es:
1
H= mω 2 r2 (4.118)
2
Las ecuaciones de Hamilton se transforman ası́:
∂H ∂H ∂r ∂H ∂φ
ẋ = = +
∂px ∂r ∂px ∂φ ∂px
(4.119)
∂H px ∂H 1
= +
∂r m2 ω 2 r ∂φ mωx sec2 φ
px / mω
ϕ
x
Figura 4.3 Espacio de fases para el oscilador armónico unidimensional

∂H ∂H ∂r ∂H ∂φ
ṗx = − =− +
∂x ∂r ∂x ∂φ ∂x
(4.120)
∂H x ∂H −px
=− +
∂r r ∂φ mωx2 sec2 φ
Se obtiene entonces para ∂H/∂px y ∂H/∂x:
∂H ∂H senφ ∂H cos φ
= +
∂px ∂r mω ∂φ mωr
(4.121)
∂H ∂H ∂H sen φ
= cos φ −
∂x ∂r ∂φ r
Por otra parte se tiene para ẋ y ṗx :
∂x ∂x
ẋ = ṙ + φ̇ = cos φ ṙ − r senφ φ̇
∂r ∂φ
(4.122)
∂px ∂px
ṗx = ṙ + φ̇ = mω senφ ṙ + mωr cos φ φ̇
∂r ∂φ
o sea que las ecuaciones de Hamilton se transforman en:
∂H senφ ∂H cos φ
cos φ ṙ − r senφ φ̇ = + (4.123)
∂r mω ∂φ mωr
∂H ∂H senφ
mω senφ ṙ + mωr cos φ φ̇ = − cos φ + (4.124)
∂r ∂φ r
Podemos resolver simultáneamente a (4.123) y (4.124) para ṙ y φ̇. El resultado se

obtiene fácilmente con notación matricial:
  
cos φ −senφ ṙ
  =
senφ cos φ rφ̇
  (4.125)
 ∂H 
senφ cos φ  ∂r 
1   
 
mω  1 ∂H 
− cos φ senφ
r ∂φ
Esto se puede escribir también como:
   
cos φ senφ cos φ −senφ ṙ
   =
−senφ cos φ senφ cos φ rφ̇
  (4.126)
  ∂H 
cos φ +senφ senφ cos φ  ∂r 
1    
 
mω  1 ∂H 
−senφ cos φ − cos φ senφ
r ∂φ
De donde:
   
   ∂H  1 ∂H
ṙ 0 1  
 = 1  
∂r  1  
 r ∂φ 
 =   (4.127)
mω −1 0  1 ∂H  mω  ∂H 
rφ̇
r ∂φ −
∂r
Con lo cual las ecuaciones de movimiento en las nuevas variables son:
1 ∂H 1 ∂H
r= ; φ̇ = − (4.128)
mωr ∂φ mωr ∂r
Vemos que en las variables (r, φ) las ecuaciones de movimiento no toman la misma
forma que las ecuaciones canónicas (no son r = ∂H/∂φ; φ̇ = −∂H/∂r, por ejemplo).
En general, una transformación de variables en el espacio fásico cambia la forma de las
ecuaciones de movimiento. En general, las ecuaciones de Hamilton no son covariantes
bajo transformaciones arbitrarias en el espacio de fases. Notemos sin embargo, que hay
una transformación canónica en términos de (r, φ). Hagamos ahora el nuevo cambio de
variables:
(r, φ) → (r2 , φ) (4.129)

Si llamamos ρ = r2 , tenemos que:

∂H ∂H
= 2r ; ρ̇ = 2r ṙ (4.130)
∂r ∂ρ
O sea que las ecuaciones de Hamilton para las variables (ρ, φ), que obtenemos de
(4.128) y (4.130), son:
mω ∂H 2 ∂H
ρ̇ = ; φ̇ = − (4.131)
2 ∂φ mω ∂ρ
Notemos finalmente que si llamamos q, p, a:
mω
q = −φ ; p = ρ (4.132)
2
las ecuaciones (4.131) se convierten en:
∂H ∂H
ṗ = − ; q̇ = (4.133)
∂q ∂p
O sea que la transformación en el espacio fásico bidimensional definida por:
r
2p √
x= cos q ; px = − 2ωp senq
mω
(4.134)
2
mω p p x
p= x2 + 2x 2 ; q = −tan−1
2 m ω mωx
deja covariantes las ecuaciones de Hamilton, donde el nuevo hamiltoniano se obtiene del
anterior simplemente expresando a x y px en función de q y p mediante las fórmulas
(4.134):
H = (q, p) = H [x(q, p), px (q, p)] (4.135)
Se dice entonces que la transformación (4.134) es canónica. La referencia hecha en
el enunciado al oscilador armónico no es importante, pues la covariancia de las ecuacio-
nes de Hamilton bajo la transformación (4.134) no depende de la forma de H, siendo
aplicable a cualquier sistema de un grado de libertad.
En general, a la pregunta acerca de la covariancia de las ecuaciones de Hamilton
bajo una transformación arbitraria en el espacio de fases, (q, p) → (q, p), se responde
que no necesariamente son covariantes. Pero existe una clase de transformaciones para
las cuales esto se cumple; tales transformaciones se llaman canónicas o de contacto.
La transformación empleada en las ecuaciones (4.90), (4.91) y (4.134), son ejemplos de
transformaciones canónicas.
Ejemplo 4.4.2 Efectuar una rotación con velocidad angular constante a en el espacio
de fases bidimensional. Mostrar que tal transformación es canónica sólo si al nuevo
hamiltoniano se le adiciona un término. Mostrar que las fórmulas de transformación y
el nuevo hamiltoniano se pueden obtener a partir de las primeras derivadas de cierta
función F (q, q, t). Mostrar que F satisface una ecuación diferencial parcial si se anula el
nuevo hamiltoniano, lo cual es posible para un oscilador armónico.
Las fórmulas de la transformación y su inversa son:

p
q = q cos at + sen at ; p = −cq sen at + p cos at
c
(4.136)
q
q = q cos at − sen at ; p = cq sen at + p cos at
c
donde a y c son parámetros de la transformación que permanecen constantes.
Es simple probar que:
     q̇ 
q̇ cos at −sen at
    
 =  
ṗ ṗ
sen at cos at
c c
(4.137)
  q 
−sen at − cos at
+a   p 

cos at −sen at
c
y que:
   
∂H   ∂H
 ∂p  cos at −sen at  ∂p 
    
 =   (4.138)
 1 ∂H   1 ∂H 
sen at cos at
− −
c ∂q c ∂q
Igualando los lados derechos de (4.137) y (4.138) obtenemos:
 ∂H 
    q 
q̇
 ∂p  0 −1
     
 =  + a  p  (4.139)
 1 ∂H  q̇ 1 0
− c c
c ∂q
Las ecuaciones de movimiento para las variables q y p son:
∂H a ∂H
= q̇ − p ; = −ṗ − acq (4.140)
∂q c ∂q
Estas ecuaciones serán de forma canónica solamente si se cambia el nuevo hamil-
toniano:1
2
1 p
H(q, p) = H [q(q, p), p(q, p)] + a + cq 2 (4.141)
2 c
Notemos que las ecuaciones (4.136) permiten expresar a p/c y p/c en términos de
q, q:
p q − q cos at p −q + q cos at
= ; = (4.142)
c sen at c sen at
1 En general una transformación dependiente del tiempo es canónica si H es igual a H más ciertos
términos adicionales.
Si F es la función de q, q y t siguiente:
2qq − (q 2 + q 2 ) cos at
F (q, q, t) = c (4.143)
2 sen at
Comparando a (4.142) y (4.143) vemos que:
∂F (q, q, t) ∂F (q, q, t)
p= ; p=− (4.144)
∂q ∂q
Como las ecuaciones (4.144) son completamente equivalentes a las ecuaciones de
transformación (4.136), se dice que F es la función generatriz de la transformación, que
será canónica solamente si el nuevo hamiltoniano es:
∂F
H =H+ (4.145)
∂t
puesto que,

∂F (q, q, t) −2qq cos at + q 2 + q 2 ca 2 p2
= ca 2
= q + 2 (4.146)
∂t 2 sen at 2 c
Los anteriores resultados valen para cualquier sistema de un grado de libertad.
Para un oscilador armónico encontramos que:

p2 k 2 1 c2
H[q(q, p), p(q, p)] = + q + − k q 2 sen2 at
2m 2 2 m
(4.147)
c k p2 k 1
+ − q p sen at cos at + − sen2 at
m c 2 c2 m
Si escogemos el valor de c tal que:
c2 = km (4.148)
Obtenemos que:
q2 k a p2
H(q, p) = + q 2 + ( + cq 2 ) (4.149)
2m 2 2 c
H será cero solamente si a y c cumplen:
1 a
+ = 0; k + ac = 0 (4.150)
m c
Es decir, si a =√
−c/m = −k/c, valor que es compatible con el valor de c dado por
(4.148). Como c = ± km, a debe valer:
r
k
a=± (4.151)
m
Tomamos negativo
p el valor de c para que a sea positiva y coincida con la frecuencia
del oscilador ω = k/m. Notamos que H = 0 implica que q y p son constantes, o sea
que las fórmulas (4.136) nos dan directamente la solución en términos de q y p que se
determinan por las condiciones iniciales de q y p.2 Es simple verificar que F satisface la
ecuación diferencial llamada de Hamilton-Jacobi para el oscilador armónico:
2
1 ∂F 1 ∂F
+ kq 2 + =0 (4.152)
2m ∂q 2 ∂t
F es una solución de (4.152) que no posee la propiedad de ser la suma de una

función de t y una función de q. Posteriormente veremos que (4.152) posee otra solución
por el método de separación de variables (llamada solución completa) que genera otra
trasformación canónica que anula el hamiltoniano para un oscilador armónico.

o de contacto
Estas transformaciones en el espacio de fases son importantes, entre otras cosas,
porque conservan el formalismo canónico y permiten reemplazar el hamiltoniano H por
una H que tenga una forma mucho más simple. Ası́ por ejemplo, es posible mediante
una transformación canónica hacer que todas las coordenadas sean cı́clicas; con ello la
solución de un problema mecánico se reduce a un problema de geometrı́a en el espacio
de fases: hallar la transformación canónica adecuada.
Ejemplo 4.5.1 Mostrar que la transformación de cambio de escala es canónica indepen-

dientemente de las propiedades de homogeneidad del potencial. Tal transformación es:
q ν = αqν ; pν = βpν ; α 6= 0 , β 6= 0 ; ν = 1, 2, ...l (4.153)
Mediante esta transformación se tiene:

∂H ∂H ∂H ∂H
=α ; =β
∂qν ∂q ν ∂pν ∂pν
(4.154)
1 1
q̇ν = q˙ν ; ṗν = ṗν ; ν = 1, 2, ...l
α β
con lo cual las ecuaciones de Hamilton se convierten en:
∂H ∂H
q̇ ν = αβ ; ṗν = −αβ ; ν = 1, 2, ...l (4.155)
∂pν ∂q ν
En las nuevas variables (q, p) las ecuaciones de movimiento serán de la forma
canónica solamente si se cambia el hamiltoniano.
H(q, p, t) = αβH(q, p, t) (4.156)

2 También H = 0 si tomamos C = mω, a = −ω. Como el punto representativo del estado del oscilador
en el espacio fásico (véase figura 4.3), rota en el sentido de las agujas del reloj con velocidad angular ω,
con las coordenadas q y q se verá el punto estacionario. H describe pues, un problema de equilibrio.
Este ejemplo, al igual que los dos anteriores, ilustra el hecho de que el carácter
canónico de una transformación es algo inherente a la transformación misma, indepen-
dientemente de la forma del hamiltoniano, en particular, independientemente de sus
propiedades de simetrı́a. Por esto cualquier sistema de l grados de libertad posee ecua-
ciones de movimiento covariantes bajo la transformación (4.153), aunque solamente si el
potencial es función homogénea de las coordenadas el sistema posee simetrı́a de seme-
janza mecánica, ecuación (4.92). Ası́ mismo las transformaciones (4.115) y (4.116), no
canónicas, y (4.134), canónica, pueden hacerse sin referencia alguna a la forma del hamil-
toniano. Sin embargo, para un hamiltoniano dado, sólo cierta transformación canónica
permite obtener un nuevo hamiltoniano de forma simple. Ası́, para un oscilador armónico
lineal la transformación canónica (4.134) conduce a que H = ωp, o sea a que φ sea cı́clica
en H. Sin embargo (4.134) es aplicable a cualquier sistema de un grado de libertad. De
forma similar (4.136) conduce a H = 0 para el oscilador.
Ejemplo 4.5.2 Mostrar que es canónica la transformación:
q ν = αpν ; pν = βqν ; α 6= 0 , β 6= 0 ; ν = 1, 2, ...l (4.157)
En este caso:
H = −αβH (4.158)
En particular, la transformación con α = 1, β = −1:
q ν = pν ; pν = −qν ; ν = 1, 2, ...l, (4.159)
es canónica con H = H.
Este ejemplo muestra que las nociones de “coordenada” y “momento” pierden su
sentido inicial, pues mediante una transformación canónica (T.C.) es posible hacer que
los momentos pasen a hacer el papel de coordenadas y viceversa.
Como en general q ν = q ν (q, p, t) y pν = pν (q, p, t), con las fórmulas inversas
qν = qν (q, p, t); pν = pν (q, p, t), se ve que se requieren tanto (q) como (p) para po-
der especificar la posición del sistema en el espacio de configuración. (q) y (p) no son
pues “coordenadas” y “momentos” generalizados, sino simplemente pares de cantidades
canónicamente conjugadas. En conclusión, en el espacio de fases el estado del sistema
se especifica mediante un conjunto completo (de 2l) de cantidades canónicamente con-
jugadas.
4.6. La función generatriz

de una transformación canónica
Las ecuaciones canónicas pueden deducirse de un principio variacional en el espacio
de fases (segunda forma del principio de Hamilton) y viceversa:
Z t2 X l
!
∂H
δ pν q̇ν − H dt = 0 ↔ q̇ν =
t1 ν=1
∂pν
(4.160)
∂H
ṗν = − ; ν = 1, 2, ...l
∂qν
Si la transformación (q, p) ↔ (q, p) es canónica, entonces debe también cumplirse

que:
Z l
!
t2 X ∂H
δ pν q̇ ν − H dt = 0 ↔ q̇ ν = ;
t1 ν=1
∂pν
(4.161)
∂H
ṗν = − ; ν = 1, 2, ...l
∂qν
Las ecuaciones (4.160) y (4.161) indican que hay dos expresiones variacionales de las
cuales pueden deducirse las ecuaciones de Hamilton. De acuerdo con la propiedad enun-
ciada en (3.76), se sigue que los integrandos en las variacionales deben diferir a lo sumo
por la derivada total respecto al tiempo de una función arbitraria de las “coordenadas”
de que depende dicho integrando y del tiempo, o sea de (q, p, t), o de (q, p, t):
l
X l
X d
pν q̇ν − H = pν q̇ ν − H + F (q, p, t) (4.162)
ν=1 ν=1
dt
Debido a que (q, p) y (q, p) están relacionadas mediante la transformación canónica,
F (q, p, t) puede expresarse en función de cualquier subconjunto de 2l cantidades inde-
pendientes extraidos del conjunto de 4l cantidades (q, p, q, p) dependientes. La ecuación
(4.162) puede escribirse como:
l
X l
X
dF = pν dqν − pν dq ν + H − H dt (4.163)
ν=1 ν=1
En el caso en que las 2l cantidades (q, q) sean independientes, podemos expresar a

F en función de (q, q, t). En ese caso la T.C. se llama “transformación canónica libre de la
primera clase”. Matemáticamente, la independencia de las 2l cantidades (q, q) se expresa
mediante la condición de que el jacobiano de las (q) respecto a las (p) sea diferente de
cero, lo cual garantiza que las (p) se puedan expresar en términos de las (q):

q 1 , q 2 , ...q l ∂qµ
J ≡ det 6= 0 (4.164)
p1 , p2 , ...pl ∂pν
Si se cumple (4.164) entonces es posible expresar los pν en función de (q, q, t) y por
lo tanto representar cualquier función de (q, p, t) en términos de (q, q, t). En este caso es
posible escribir:
F (q, p, t) = F1 (q, q, t) (4.165)
Esto permite escribir:
Xl Xl
∂F1 ∂F1 ∂F1
dF = dF1 = dqν + dq ν + dt (4.166)
ν=1
∂qν ν=1
∂qν ∂t
Como las 2l + 1 cantidades (dq, dq, dt) son independientes, vemos que para una
transfomación canónica libre de la primera clase, de (4.163) y (4.166) se sigue que:
∂F1 (q, q, t) ∂F1 (q, q, t)
pν = ; pν = − ; ν = 1, 2, ...l (4.167)
∂qν ∂qν
Además se sigue que:

∂F1 (q, q, t)
H(q, p, t) − H(q, p, t) = (4.168)
dt
La ecuación (4.167) dice que a cada transformación canónica libre de la primera cla-
se le corresponde una función F1 y viceversa. F1 se llama la función generatriz de la
transformación canónica.3
Ejemplo 4.6.1 Hallar la transformación canónica generada por la función:
l
X
F1 (q, q, t) = − qν q ν (4.169)
ν=1
En (4.169) está implı́cito que (q) y (q) son independientes. Por lo tanto las fórmulas
de la transformación canónica serán:
∂F1
pν = = −q ν ⇒ q ν = −pν ; ν = 1, 2, ...l (4.170)
∂qν
∂F1
pν = − = qν ⇒ pν = qν ; ν = 1, 2, ...l (4.171)
∂qν
Es esencialmente la misma transformación (4.159), que intercambia coordenadas y
momentos. Este ejemplo muestra que cada función de (q, q, t) define una transformación
canónica
Ejemplo 4.6.2 Probar que la transformación canónica (4.134) es libre de la primera clase.
Hallar la correspondiente función F1 .
Sea q = x y p = px . Las fórmulas de transformación serán entonces:
r
2p p
q= cos q ; p = − 2mωp sen q (4.172)
mω

1 p2 p
p = mω x2 + 2 2 ; q = −tan−1 (4.173)
2 m ω mωq
El jacobiano (4.164) es trivial y diferente de cero:

q ∂q
J = 6= 0 (4.174)
p ∂p
O sea que la transformación es libre de la primera clase y puede ser generada por
cierta función de las variables independientes q y q. La transformación no depende del
tiempo, pues suponemos a m y a ω constantes. Notamos de (4.174) que toda transforma-
ción canónica no puntual es libre de primera clase para sistemas de un grado de libertad.
F1 (q, q, t) ha de ser tal que, de acuerdo con (4.163):

1 p2
dF1 = p dq − pdq = p dq − mω q 2 + 2 2 dq (4.175)
2 m ω
3 La función del ejemplo 4.4.2, (4.143), es la función generatriz de la transformación canónica (4.136).
Debemos expresar a p en términos de q y q lo cual se obtiene directamente de

(4.173):
p = −mωq tan q (4.176)
Reemplazando a (4.176) en (4.175) obtenemos:

1
dF1 = −mωq tan q dq − mωq 2 sec2 q dq
2
(4.177)
1 2
= −mωd q tan q
2
Se sigue entonces que, salvo una constante aditiva:
1
F1 (q, q) = − mωq 2 tan q (4.178)
2
Podemos probar directamente, usando las fórmulas (4.167), que F1 dada por (4.178)
efectivamente genera la transformación dada por (4.172) y (4.173):
∂F1 ∂F1 1
= −mωq tan q ; = − mωq 2 sec2 q (4.179)
∂q ∂q 2
O sea que:
1
p = −mωq tan q ; p= mωq 2 sec2 q (4.180)
2
Al despejar en (4.180) a p y q obtenemos a (4.170), y al despejar a p y q obtenemos
a (4.173). Notemos que −Et − mωq 2 tan q/2 es una solución a la ecuación de Hamilton-
Jacobi (4.152).
Ejemplo 4.6.3 Sea una partı́cula descrita por el hamiltoniano:
p2
H= − aq (4.181)
2m
donde m y a son constantes. Hallar la T.C. que lleva al hamiltoniano:
H=0 (4.182)
En las nuevas variables las ecuaciones de Hamilton con H = 0 conducen a la

solución trivial:
p = constante ; q = constante (4.183)
La transformación ha de ser tal que se cumpla para F1 , según (4.167) y (4.168):
∂F1 ∂F1 ∂F1

= p; = −p ; −H = (4.184)
∂q ∂q ∂t
Se sigue de (4.181) y (4.184) que F1 debe ser solución a la ecuación diferencial de

Hamilton-Jacobi:
2
1 ∂ ∂
F1 (q, q, t) − aq = − F (q, q, t) (4.185)
2m ∂q ∂t
La ecuación diferencial es de primer orden e involucra derivadas respecto a q y
respecto a t. La solución debe contener constantes de integración arbitrarias; una de
ellas puede ser aditiva. Podemos tomar a q como la constante no aditiva de integración.
La ecuación (4.185) tiene una solución de la forma:
F1 (q, q, t) = −qt + f (q, q) (4.186)
La ecuación (4.186) equivale a tomar la constante q igual a la energı́a, puesto que
H en (4.181) es constante, H = E:
q=E (4.187)
Con esta solución, (4.184) se reduce a:
2
1 df (q, q)
− aq = q (4.188)
2m dq
Integrando (4.188) obtenemos:
√
2 2m
f (q, q) = ± (q + aq)3/2 + constante (4.189)
3 a
Con lo cual, omitiendo la constante aditiva:
√
2 2m
F1 (q, q, t) = −qt ± (q + aq)3/2 (4.190)
3 a
La ecuación (4.190) genera la siguiente transformación canónica, de acuerdo con las
fórmulas (4.167):
√
p 2m p
p = ± 2m(q + aq) ; −p = −t ± q + aq (4.191)
a
Explı́citamente la transformación es:
q a
p(q, p, t) = (t − p)a ; q(q, p, t) = − + (t − p)2 (4.192)
a 2m
p p2
p(q, p, t) = t − ; q(q, p, t) = − aq (4.193)
a 2m
Como q y p son constantes, (4.192) proporciona la solución al problema del movi-
miento descrito por (4.181). En particular describe el problema del movimiento de una
partı́cula en presencia de la gravedad (a = −mg , q = z , p = mż).
E 1
z= − g(t − p) ; mż − mg(t − p) (4.194)
mg 2
Las constantes E y p tienen las siguientes expresiones en función de los valores de

z y ż en t = 0:
1 v0
E= mv 2 + mgz0 ; p= (4.195)
2 0 g
Entonces para z(t) y ż(t) obtenemos:
1
z = z0 + v0 t − gt2 ; ż = v0 − gt (4.196)
2
de acuerdo con el resultado obtenido usando métodos elementales.
Es claro que la transformación dada por (4.192) y (4.193) es canónica indepen-
dientemente de la forma de H y aplicable a cualquier sistema de un grado de libertad;
sin embargo, sólo para H dado por (4.181) mediante (4.192) se consigue H = 0 y por
tanto que q y p sean constantes. Este problema ilustra el método de resolver un pro-
blema mecánico mediante una transformación canónica sin integrar las ecuaciones de
Hamilton.
4.7. La evolución temporal de un sistema

considerada como una transformación
canónica
Sean qν0 y p0ν los valores de qν y pν en t = t0 (ν = l, 2, ...l). Estos valores deter-
minarán todos los valores sucesivos de las (q, p), de modo que en un tiempo t podemos
escribir:
qν (t) = qν (q 0 , p0 , t − t0 ) ; ν = 1, 2, ...l
(4.197)
pν (t) = pν (q 0 , p0 , t − t0 )
La ecuación (4.197) puede considerarse como una cierta transformación en el espa-
cio de fases, donde (q 0 , p0 ) son las viejas variables y (q, p) las nuevas. Esta transforma-
ción es canónica pues tanto (q 0 , p0 ) como (q, p) satisfacen las ecuaciones de Hamilton.
La función generatriz de esta transformación satisface:
l
X l
X
dF = p0ν dqν0 − pν dqν + (H 0 − H) dt (4.198)
ν=1 ν=1
Si no hay fuerzas disipativas y las ecuaciones que definen las coordenadas genera-
lizadas no dependen del tiempo, H se conserva, H = H 0 , luego:
t
X l Xl Xl
0 0
dF = pν dqν − pν dqν = − pν dqν (4.199)

ν=1 ν=1 ν=1 t0
Por otra parte, escribamos la integral de acción entre t0 y t:

Z t
S= L dt (4.200)
t0
Una variación de las (q) nos conduce a:

Z tX l
∂L ∂L
δS = δqν + δ q̇ν dt
t0 ν=1 ∂qν ∂ q̇ν
Z tX l
∂L d ∂L d ∂L
= δqν + δqν − δqν dt (4.201)
t0 ν=1 ∂qν dt ∂ q̇ν dt ∂ q̇ν
Xl
t Z t "X
l #
∂L ∂L d ∂L
= δqν + − δqν dt
ν=1 ∂ q̇ν t0 t0 ν=1 ∂qν dt ∂ q˙ν
Si asumimos que la trayectoria es real, se cumplen sobre ella las ecuaciones de
Lagrange, luego:
t t
X l
∂L l
X

δS = δqν = pν δqν (4.202)
∂ q̇ν t0
ν=1 ν=1 t0
Comparando a (4.199) y (4.202) vemos que:

F = −S (4.203)
En conclusión, la acción es la función generatriz de la transformación canónica
de evolución temporal del sistema. Ésta es una transformación del espacio de fases en
sı́ mismo: cambia el punto del espacio de fases (q 0 , p0 ) por el punto del espacio de fases
(q, p). En el ejemplo del oscilador armónico lineal, la figura 4.3 es una circunferencia.
La evolución temporal consiste simplemente en una rotación del vector de posición del
punto del espacio fásico que representa al sistema, lo cual también puede verse en las
fórmulas (4.172), y más claramente aún mediante el ejemplo 4.4.2.
4.8. El teorema de Liouville

El teorema de Liouville es un teorema básico para la mecánica estadı́stica, o sea la
mecánica de sistemas tales que:
(a) El número de grados de libertad es muy grande.
(b) No se pueden determinar las 2l condiciones iniciales, y por lo tanto tampoco el
estado del sistema en sentido clásico. Solamente se conoce el hamiltoniano del sistema,
las condiciones de ligadura, y a lo sumo siete de las 2l constantes de movimiento (las
aditivas: H, L,~ P~ ).
(c) Respecto a las condiciones iniciales, o sea a las posibles trayectorias del espacio
de fases, sólo se pueden hacer suposiciones estadı́sticas.
En particular se puede asumir que todas las trayectorias de fase compatibles con las
ligaduras y con los valores de las siete constantes de movimiento aditivas son igualmente
probables (distribución uniforme). En general, habrá una región del espacio de fases que
es accesible al sistema y se puede postular alguna distribución de probabilidades de las
distintas trayectorias de fase dentro de la región accesible (las trayectorias externas a la
región accesible tienen probabilidad cero).
Ejemplo 4.8.1 Analizar un oscilador armónico lineal cuando sólo se conoce exactamente
su energı́a.
Mediante la transformación canónica (4.172), la dinámica del oscilador está descrita
por:
r
2p p
q= cos q ; p=− 2mωp senq ; H = ωp = E (4.204)
mω
Las ecuaciones canónicas en las variables (q, p) tienen la solución:
E
q = ωt + δ ; p= = constante (4.205)
ω
donde δ es una constante arbitraria. La otra constante arbitraria es E. O sea que dados
E y δ queda determinado completamente el estado de movimiento:
r
2E
q(E, δ, t) = cos (ωt + δ)
mω 2 (4.206)
√
p(E, δ, T ) = − 2mE sen(ωt + δ)
p / mω
t>0
r
δ q
(2E / mω 2 ) 1/2
t=0
Figura 4.4 Espacio de fases del oscilador armónico lineal para E conocida
E define el radio de la trayectoria y δ el tiempo inicial de la misma (véase figura 4.4).

p La región accesible la constituyen todos los puntos de una circunferencia de radio
2E/(mω 2 ). Las diferentes trayectorias están definidas por los valores de δ.
Ejemplo 4.8.2 Analizar el oscilador tridimensional sometido a la ligadura de moverse
únicamente sobre la superficie de un cilindro, cuando sólo se conoce exactamente la
energı́a y el momento angular en la dirección z (ver ejemplo 4.3.1).
La figura 4.2 muestra que cada valor de Ez determina un “cilindro” en el espacio

de fases. La energı́a total es, de acuerdo con la ecuación (4.105):
L2z
E = Ez + (4.207)
2mR2
Parte de la energı́a está asociada al movimiento en z y parte a la rotación, siendo
ambas constantes por separado.
Para Lz arbitrario, la región accesible del espacio fásico está definida por el “cilin-
dro” E = constante. Todos los puntos interiores a este cilindro son accesibles.
Para Lz y Ez dados, habrá un conjunto infinito de trayectorias de fase en “espiral”,
caracterizada cada una por los valores de θ0 y δ [ecuaciones (4.106) y (4.107)], que pueden
estar entre 0 y 2π. En el caso en que se conozcan Lz y Ez , la distribución uniforme para
este sistema es aquella en la cual todos los valores de θ0 y δ tienen igual probabilidad.
En general cuando sólo se conocen exactamente la energı́a total, el momento lineal
total y el momento angular total del sistema, además de las ligaduras, la región del
espacio de fases accesible al sistema está definida por las ecuaciones:
E(q, p) = E0 ; ~ p) = L
L(q, ~0 ; P~ (q, p) = P~0 (4.208)
que definen una variedad de 2l − 7 dimensiones en el espacio de fases.4
Las 2l − 7 constantes de movimiento adicionales no son determinadas; la distri-
bución microcanónica asigna a cada uno de los estados caracterizados por (4.208) y los
valores de las 2l − 7 constantes restantes igual probabilidad.
Conjunto estadı́stico. Es una noción útil en los casos donde hay 2l−7 constantes
de movimiento no determinadas. Consiste en un conjunto de sistemas iguales (el mismo
número de grados de libertad, la misma clase de partı́culas y de interacciones, las mismas
ligaduras y los mismos valores de las constantes de movimiento aditivas).
Es decir, dos sistemas de un conjunto estadı́stico sólo pueden diferir por los valores
de las 2l − 7 constantes no aditivas. Se considera que el número de sistemas es muy
grande, de modo que es una muestra estadı́sticamente representativa de la distribución
de los valores de las 2l − 7 constantes indeterminadas. En cada instante del tiempo, el
estado de cada sistema del conjunto será representado por un punto del espacio fásico,
y su estado de movimiento por una trayectoria de fases. El conjunto estadı́stico de siste-
mas de l grados de libertad estará representado en cada instante por un “enjambre” de
puntos del espacio fásico. Como los sistemas del conjunto estadı́stico no interactúan, ca-
da punto se mueve independientemente de los demás en el espacio fásico 2l-dimensional.5
Teorema de Liouville. En cada elemento de volumen del espacio fásico la densi-

dad de puntos representativos del conjunto estadı́stico permanece constante en el tiempo.
Sea dΓ = dq1 dq2 , ...dql dp1 , dp2 , ...dpl = dΓq dΓp un elemento de volumen infini-
tesimal del espacio de fases. Sea:
dN = ρ(p, q, t)dΓq dΓp (4.209)
4 Estas constantes tienen la propiedad de ser aditivas. La variedad puede reducirse si tomamos en
cuenta que asociadas a la posición del centro de masa de un sistema libre hay tres constantes; quedarı́an
en ese caso 6N − 10 constantes no determinadas.
5 Un conjunto estadı́stico tiene analogı́a con los “ensambles” que mencionamos en la sección 2.3.
el número de sistemas dentro de dΓ. A ρ(q, p, t) se le llama la función de distribución

estadı́stica y hace el papel de función de densidad de probabilidad en el espacio de fases.
ρ satisface la condición de normalización:
Z
ρdΓq dΓp = 1 (4.210)
donde la integral abarca todo el espacio de fases. Matemáticamente el teorema dice que:
l
dρ X ∂ρ ∂ρ ∂ρ
ρ̇ = 0 o = q̇ν + ṗν + =0 (4.211)
dt ν=1
∂qν ∂ ṗν ∂t
Una forma cualitativa de visualizarlo se da a continuación. Sea un volumen arbi-

trario del espacio de fases en t = t0 . Como el número de sistemas es muy grande, en la
frontera de tal volumen habrá un gran número de puntos representativos de sistemas del
conjunto, de modo que aproximadamente podemos decir que la frontera del elemento
de volumen está definida por un conjunto de puntos representativos del conjunto es-
tadı́stico. Cuando transcurre el tiempo, el volumen se mueve al moverse los puntos de
la frontera. El tamaño del volumen podrá cambiar, pero no el número de puntos que
lo constituyen. En efecto, sea (q, p) un punto arbitrario de la frontera. Todo punto que
entre o salga del elemento de volumen deberá pasar por la frontera, pero al llegar a
la frontera tendrá los mismos (q, p) de un punto de la misma. Ambos puntos tendrán
las mismas condiciones iniciales para el movimiento posterior, en consecuencia deberán
seguir moviéndose juntos. En conclusión, el número de puntos en cualquier región del
espacio fásico es constante. Se puede demostar que:
Z Z
dΓq dΓp = dΓq dΓp (4.212)
donde la transformación (q, p) → (q, p) es canónica. Como la evolución temporal es una

T.C., se sigue que:
Z Z
dΓq0 dΓp0 = dΓq dΓp (4.213)
Como no cambian con el tiempo ni el volumen ni el número de puntos dentro de

él, la densidad será constante.
Demostración del teorema de Liouville. Sea un conjunto estadı́stico de siste-

mas de un grado de libertad, entonces el espacio fásico es bidimensional y dΓ = dq dp.
Además, dN = ρ dq dp es el número de sistemas en dΓ. Consideremos que cada uno de
los sistemas del conjunto tiene energı́a entre E y E + ∆E.
La figura 4.5 muestra la región accesible, definida por las lı́neas E = constante y
E + ∆E =p constante (depser osciladores armónicos, tal región serı́a una corona circular
de radios 2E/mω 2 y 2(E + ∆E)/mω 2 ). Cuando el tiempo transcurre, los puntos
representativos del conjunto se mueven dentro de esta región. Entre t y t + dt entran al
elemento de volumen dΓ todos los puntos que se mueven hacia el frente a las caras de
la izquierda e inferior. El número de los puntos que entran a dΓ durante el tiempo dt
E + dE
t
t + dt
dp
E pdt
(q,p)
dq
q
qdt
Figura 4.5 Espacio fásico. Región accesible definida por las lı́neas E = constante y E +∆E =
constante.
será igual a:
ρq̇ dt dp + ρṗ dt dq (4.214)
O sea que el número de puntos que entran a dΓ por unidad de tiempo es:
ρq̇ dp + ρṗ dq = ρ(q̇ dp + ṗ dq) (4.215)
Para hallar los puntos que salen, debemos considerar los que se mueven dentro de
dΓ hacia las caras derecha y superior y que las alcanzarán en el tiempo dt. Esto se puede
obtener de (4.215) mediante una expansión de Taylor alrededor de (q, p), para hallar
(4.215) en (q + dq, p + dp):
(ρq̇)|q+dq dp + (ρṗ)|p+dp dq̇ =

(4.216)
∂ ∂
ρq̇ + (ρq̇) dq dp + ρṗ + (ρṗ) dp dq
∂q ∂p
La variación del número de puntos dentro de dΓ es igual a lo que entra menos lo
que sale por unidad de tiempo, o sea a (4.215) menos (4.216):

∂ ∂
− (ρq̇) + (ρṗ) dq dp (4.217)
∂q ∂p
Dentro de dΓ la rata de incremento temporal de la densidad será ∂ρ/∂t y el cambio

del número de puntos en dΓ por unidad de tiempo es (∂ρ/∂t).dq dp y debe ser igual a
(4.217):

∂ρ ∂ ∂
dq dp = − (ρq̇) + (ρṗ) dq dp (4.218)
∂t ∂q ∂ρ

∂ρ ∂ q̇ ∂ρ ∂ ṗ ∂ρ
+ρ + q̇ + ρ + ṗ = 0 (4.219)
∂t ∂q ∂q ∂p ∂p
Usando las ecuaciones de Halmilton se tiene:
∂ q̇ ∂ ṗ ∂2H ∂2H
+ = − =0 (4.220)
∂q ∂p ∂q∂p ∂p∂q
Con lo cual (4.219) nos da el resultado:
∂ρ ∂ρ ∂ρ dρ
+ q̇ + ṗ = =0 (4.221)
∂t ∂q ∂p dt
La generalización a sistemas de varios grados de libertad es análoga. En ese caso
debemos reemplazar el plano p − q por el plano pν − qν correspondiente al grado de
libertad ν. dΓ → dqν dpν es la proyección del elemento de volumen dΓq dΓp sobre el
plano ν.
Las lı́neas E y E + dE son el corte del plano ν con las hipersuperficies en el espacio
de fases E = constante, E + dE = constante. dΓ será:
dΓ = dΓp dΓq = dq1 dq2 ...dqν−1 dqν+1 ...dql dp1 dp2
(4.222)
...dpν−1 dpν+1 ...dpl dqν dpν = dΓν dqν dpν ; ν = 1, 2, ...l
Debemos reemplazar las ecuaciones (4.215) y (4.216) por:
ρ dΓν (q̇ dpν + ṗν dqν ) y, (4.223)

ν ∂ ν
ρ dΓ q̇ν + (ρ dΓ q̇ν ) dqν dpν
∂qν
(4.224)
ν ∂ ν
+ ρ dΓ ṗν + (ρ dΓ ṗν ) dpν dqν
∂pν
Por tanto la variación del número de puntos en el área dqν dpν será igual a (4.223)-
(4.224):

∂ ν ∂ ν
− (ρ dΓ q̇ν ) + (ρ dΓ ṗν ) dqν dpν =
∂qν ∂pν
(4.225)
∂ ∂
− (ρq̇ν ) + (ρṗν ) dΓ
∂qν ∂pν
La variación del número de puntos en todo el volumen dΓ es igual a la suma de las
variaciones de los números de puntos sobre sus proyecciones q1 − p1 , q2 − p2 , ...ql − pl .
Ésta será:
Xl
∂ ∂
− (ρq̇ν ) + (ρṗν ) dΓ (4.226)
ν=1
∂qν ∂pν
Usando el resultado (4.220) para cada grado de libertad e igualando (4.226) a
∂ρ/∂t dΓ obtenemos el teorema de Liouville, ecuación (4.211).
Ejemplo 4.8.3 Sea un conjunto de cuatro partı́culas iguales que se lanzan hacia arriba
en un campo gravitacional uniforme, con las siguientes condiciones iniciales:
z10 = z0 , z20 = z0 + ∆z0
z30 = z0 , z40 = z0 + ∆z0

(4.227)
pz10 = p0 , pz20 = p0
pz30 = p0 + ∆p0 , pz40 = p0 + ∆p0
(a) Hallar la región que inicialmente ocupa el conjunto en el espacio de fases.

(b) Hallar las trayectorias de fase de las partı́culas.
(c) Considerar cómo cambia la región ocupada por el conjunto para t > 0.
El espacio fásico de cada sistema es 6-dimensional, pero sólo hay variaciones en
la proyección bidimensional z − pz . x, px , y y py permanecen constantes, ya que por
definición las partı́culas no interactúan entre sı́. La energı́a de cada partı́cula es constante.
Entonces:
p2zi
Hi = + mgzi = Ei = constante ; i = 1, 2, 3, 4 (4.228)
2m
La ecuación de la trayectoria de cada partı́cula en el espacio de fases será parabólica:
p
pzi = ± 2m(Ei − mgzi ) (4.229)
De acuerdo con (a) y (b) las Ei serán:
p20 p20
E1 = + mgz0 ; E2 = + mg(z0 + ∆z0 )
2m 2m
(p0 + ∆p0 )2
E3 = + mgz0 (4.230)
2m
(p0 + ∆p0 )2
E4 = + mg(z0 + ∆z0 )
2m
Asumiendo positivos a ∆p0 y ∆z0 , vemos que:
E4 > E3 ; E4 > E2 ; E3 > E1 ; E2 > E1 (4.231)
Además, para precisar, asumamos que ∆p0 y ∆z0 son tales que E3 > E2 , de modo
que:
E4 > E3 > E2 > E1 (4.232)
La solución a este problema es:

pzi0 1
pzi = pzi0 − mgt ; zi = zi0 + t − gt2 ; i = 1, 2, 3, 4 (4.233)
m 2
De modo que:
pz 1 = p0 − mgt ; pz2 = p0 − mgt
p0 1 p0 1
z1 = z0 + t − gt2 ; z2 = z0 + ∆z0 + t − gt2
m 2 m 2
pz 3 = p0 + ∆p0 − mgt ; pz4 = p0 + ∆p0 − mgt (4.234)

p0 + ∆p0 1
z3 = z0 + t − gt2
m 2
p0 + ∆p0 1
z4 = z0 + ∆z0 + t − gt2
m 2
Las ecuaciones (4.234) nos dicen que:
∆p0
Pz1 = pz2 = p < p0 ; z3 = z1 + t
m
z2 = z1 + ∆z0 ; Pz3 = pz4 = p + ∆p0

(4.235)
∆p0
z4 = z2 + t; z4 = z3 + ∆Z0
m
z1 = z
La figura 4.6 muestra la región ocupada por el conjunto en el espacio de fases, en

t = 0 y en t > 0. Vemos que el área (volumen) del espacio fásico ocupada por el conjunto
de sistemas permanece constante en el tiempo y es igual a:
∆z0 ∆p0 (4.236)
Dicha región se mueve distorsionándose pero sin cambiar el valor del área. El
resultado es el mismo en el caso en que dentro del área en mención haya un número
arbitrario de puntos: el área de la región limitada por las lı́neas 1 − 2, 2 − 4, 3 − 4 y 1 − 3
permanecerı́a constante y todos los puntos quedarı́an dentro. La densidad de puntos en
el espacio de fases también es una constante; en este caso.
4
= constante (4.237)
∆z0 ∆p0
De haber inicialmente en el centro del rectángulo una quinta partı́cula, esta per-
manecerı́a en el centro del cuadrilátero en t > 0.
La figura 4.7 muestra las trayectorias de fase.
Ejemplo 4.8.4 Sea una partı́cula que se lanza hacia arriba en presencia de un campo
gravitacional uniforme. Sus condiciones iniciales se conocen con cierta indeterminación:
pz
p0 + ∆p0 3 4
∆p0t / m
p0
1 2
p + ∆p0 3 4
p
1 2
z0 z0 + ∆z0 z z + ∆z0 z
Figura 4.6 Región ocupada por el conjunto de sistemas en el espacio de fases
pz
3 4
p0 + ∆p0
1 2
p0
z0 z0 + ∆z0
2
1
4
1 3
2
3
4
Figura 4.7 Trayectorias de fase. Caso en que dentro del área hay un número arbitrario de
puntos
∆z0 ∆p0
z(0) = z0 ± ; pz (0) = p0 ± (4.238)
2 2
Es decir, se sabe que en t = 0 la partı́cula está en un rectángulo de área ∆z0 ∆p0
en el espacio de fases. Analizar la evolución de la partı́cula.
Basta considerar el movimiento de la partı́cula en los valores extremos de las con-
diciones iniciales (z0 − ∆z0 /2 , p0 − ∆p0 /2 ; z0 − ∆z0 /2 , p0 + ∆p0 /2 ; z0 + ∆z0 /2 , p0 −
∆p0 /2 ; z0 + ∆z0 /2 , p0 + ∆p0 /2), que coinciden con las condiciones iniciales (4.227)
del ejemplo anterior, cambiando z0 por z0 + ∆z0 /2 y p0 por p0 + ∆p0 /2. Se concluye
inmediatamente que para una partı́cula se cumple:
∆z(t) ∆pz (t) = ∆z(0) ∆pz (0) = constante = ∆z0 ∆p0 (4.239)
Para un valor dado de esta constante, si se reduce la indeterminación en z, se
aumenta la indeterminación en ∆pz y viceversa. Clásicamente no hay lı́mite al valor más
pequeño que puede tomar la constante ∆p0 ∆z0 . Cuánticamente no puede ser menor que
h̄/2, donde h̄ es la constante de Planck, luego:
h̄
∆z ∆pz ≥ (4.240)
2
La ecuación (4.240) se denomina la desigualdad de Heisenberg.
El resultado (4.239) es válido en general, de acuerdo con el teorema de Liouville.
La proyección del volumen del espacio fásico dentro del cual inicialmente se en-
cuentra la partı́cula, ∆Γ0 = ∆p10 ∆q10 ∆p20 ∆q20 ...∆pl0 ∆ql0 , sobre el plano qν − pν ,
tiene un área ∆pν0 ∆qν0 . Se tiene entonces que:
∆pν (t) ∆qν (t) = ∆pν0 ∆qν0 = constante (4.241)

O sea que, cuánticamente se cumple que para cualquier par de variables canónica-
mente conjugadas:
h̄
∆pν ∆qν ≥ (4.242)
2
Clásicamente, para un valor dado de la constante ∆pν0 ∆qν0 , al aumentar la inde-
terminación de pν , se disminuye la indeterminación de qν y viceversa. Lo especı́fico de la
desigualdad de Heisenberg (el “efecto cuántico”) es que la constante no puede ser cero
sino que tiene un mı́nimo valor.
5
Movimiento de dos partı́culas
que interactúan por medio de una fuerza
central
Éste es un problema que en principio es soluble de manera exacta para cualquier

fuerza central. Pertenece a los pocos problemas de la mecánica clásica en que es posible
la separación de las variables. Como se sabe, no existen soluciones analı́ticas exactas para
el problema general de más de dos partı́culas interactuando mutuamente por fuerzas de
dos partı́culas.
5.1. Coordenadas de centro de masa

y coordenadas relativas
En general las coordenadas de las partı́culas individuales, por ejemplo X1 , Y1 ,
Z1 , X2 , Y2 y Z2 , no permiten desacoplar las ecuaciones de movimiento. Sólo cuando
las fuerzas son lineales ha sido diseñado un formulismo que desacopla las ecuaciones
de movimiento mediante la transformación a coordenadas normales. Afortunadamente,
el problema de dos partı́culas que interactúan a través de una fuerza central admite
la separación de variables mediante la transformación a las coordenadas relativas y de
centro de masa.
R~ = m1~r1 + m2~r2 , ~r = ~r2 − ~r1 ,
m1 + m2
(5.1)
~− m 2 ~+ m 1
~r1 = R ~r , ~r2 = R ~r
M M
Un potencial central es aquel que depende sólo de la distancia entre las partı́culas:
V (~r1 , ~r2 ) = V (|~r2 − ~r1 |) = V (r) (5.2)
Las fórmulas (5.1) permiten escribir la energı́a cinética ası́:
1 2 1 2 1 ~˙ 2 1 ˙ 2
T = m1~r˙ 1 + m2~r˙ 2 = M R + µ~r (5.3)
2 2 2 2
125
donde M es la masa total y µ la masa reducida:

m1 m2
M = m1 + m2 ; µ= (5.4)
m1 + m2

Entonces en vez de L ~r1 , ~r2 , ~r˙ 1 , ~r˙ 2 podemos escribir:
2
~ ~r˙ , R
L ~r, R; ~˙ + 1 µ~r˙ 2 − V (r)
~˙ = 1 M R (5.5)
2 2
R~ es cı́clica y por lo tanto el momento lineal del centro de masa es una constante de
movimiento. L consta de términos desacoplados, es decir, describe un sistema equivalente
de dos partı́culas, una libre de masa M colocada en el centro de masa y otra de masa µ
colocada por ejemplo en la posición de la partı́cula 2, y sometida al efecto de un centro
de fuerzas inmóvil colocado en la posición de la partı́cula 1, y exactamente sometida a
la misma energı́a potencial de interacción de las dos partı́culas originales:
1 ~˙ 2 1 ˙2
LCM = MR ; Lrel = µ~r − V (r) (5.6)
2 2
Lrel es esféricamente simétrico pues depende sólo de la magnitud de los vectores ~r
y ~r˙ . En consecuencia, el momento angular de la partı́cula de masa reducida µ, ~l = ~r × µ~r˙ ,
es una constante de movimiento.
Para pasar al formalismo hamiltoniano, evaluemos los momentos canónicos conju-
gados de ~r y R: ~
∂L ∂L ~˙
p=
~ = µ~r˙ ; P~ = = MR (5.7)
∂~r˙ ˙
~
∂R
Entonces el hamiltoniano del sistema será:
P~2 p~2
H= + + V (r) (5.8)
2M 2µ
H es una constante de movimiento, ası́ como por separado lo son la energı́a del
centro de masa y la de la partı́cula de masa reducida.
Sistema de coordenadas de centro de masa. Es un sistema de coordenadas

con origen colocado en el centro de masa. Las fórmulas de transformación son (véase la
figura 5.1):
m2 m2
~r1c = (~r1 − ~r2 ) = − ~r
M m1
(5.9)
m1 m1
~r2c = (~r2 − ~r1 ) = ~r
M M
Además se cumple que:
m1~r1c + m2~r2c = 0 ; ~r2c − ~r1c = ~r (5.10)
No existen fórmulas que expresen a ~r1 , ~r2 en función de ~r1c y ~r2c .
Movimiento de dos partı́culas que interactúan ... / 127
La energı́a total de las dos partı́culas en el sistema de referencia del centro de masa
es:
1 2 1 2 1 2
Ec = m1~r˙ 1c + m2~r˙ 2c + V (r) = µ~r˙ + V (r) (5.11)
2 2 2
y el momento angular respecto al centro de masa:

~ c = ~r1c × m1~r˙ 1c + ~r2c × m2~r˙ 2c = µ~r × ~r˙
L (5.12)
1
r1c
r2c
r1
2
R
r2
Figura 5.1 Sistema de coordenadas de centro de masa para dos partı́culas
Se ve que la energı́a total en el sistema del centro de masa coincide con la energı́a total
de la partı́cula de masa reducida, y el movimiento angular total coincide con el momento
angular de la partı́cula de masa reducida.
El momento angular total en el sistema de referencia del laboratorio es:

~ = ~r1 × m1~r˙ 1 + ~r2 × (m2~r˙ 2 ) = M R
L ~˙ + µ~r × ~r˙
~ ×R (5.13)
vemos que es igual al momento angular del centro de masa más el momento angular
respecto al sistema de referencia del centro de masa. Finalmente podemos afirmar que
los aspectos no triviales del problema están en el movimiento de la partı́cula de masa
reducida.
Ecuaciones de Lagrange para las coordenadas relativas. Tomemos un sis-

tema de coordenadas esféricas para ubicar la partı́cula de masa reducida µ (véase figura
êϕ êΦ
êr
Θ
y
ϕ
êΦ
Figura 5.2 Posición ~r de la partı́cula µ en coordenadas esféricas
5.2). No hay ninguna razón fı́sica para suponer dónde está el origen de ese sistema de
coordenadas. Si queremos podemos colocarlo en el centro de masa o, como se propuso
antes, en la posición de la partı́cula 1. Las componentes de ~r y ~r˙ es conveniente expre-
sarlas en coordenadas esféricas; esto es simple mediante las fórmulas de transformación
entre vectores unitarios:
êr = senθ cos φ î + senθ senφ ĵ + cos θ k̂
êθ = −senφ î + cos φ ĵ (5.14)
êφ = senθ k̂ − cos θ (cos φ î + senφ ĵ)
y las fórmulas inversas:
î = senθ cos φ êr − senφ êθ − cos θ cos φ êφ
ĵ = senθ senφ êr + cos φ êθ − cos θ senφ êθ (5.15)
k̂ = cos θ êr + senθ êφ
éstos son dos conjuntos ortonormales de vectores de base (véase figura 5.2). Entonces ~r
y ~r˙ tienen las siguientes expresiones:
~r = rêr ; ~r˙ = ṙêr − rθ̇êφ + r senθ φ̇êθ (5.16)

El lagrangiano en coordenadas esféricas es:

1
L = µ r2 + r2 θ̇2 + r2 sen2 θ φ̇2 − V (r) (5.17)
2
donde hemos suprimido la parte correspondiente al centro de masa. La coordenada φ es
cı́clica y por ello su momento canónico conjugado pφ es una constante de movimiento:
∂L
pφ = = µr2 sen2 θ φ̇ = constante (5.18)
∂ φ̇
Debido a la simetrı́a de rotación del lagrangiano, todas las componentes del mo-
mento angular son constantes de movimiento. Las componentes esféricas, o sea, a lo
largo de los vectores unitarios êr , êθ , êφ , son:
lr = 0 , lθ = µr2 θ̇ , lφ = µr2 senθ φ̇ (5.19)
en tanto que las componentes cartesianas son:
lx = −µr2 (θ̇senφ + φ̇ senθ cos θ cos φ)
ly = µr2 (θ̇ cos φ − φ̇ senθ cos θ senφ) (5.20)
lz = µr2 sen2 θ φ̇
Los otros momentos canónicos conjugados son:
∂L ∂L
pr = = µṙ ; pθ = = µr2 θ̇ (5.21)
∂ ṙ ∂ θ̇
pr y pθ no son constantes de movimiento. Podemos expresar las componentes de ~l,
(5.19) y (5.20), en función de los momentos canónicos:
pφ p2φ
lθ = pθ ; lφ = ; l2 = p2θ + (5.22)
senθ sen2 θ
lx = −pθ senφ − pφ cot θ cos φ
ly = −pθ cos φ − pφ cot θ senφ (5.23)
lz = pφ
Nótese la similitud de (5.23) con las correspondientes expresiones cuántico-mecáni-

cas, y aun con las componentes l± = lx ± ily :
l+ = (ipθ − pφ cot θ)eiφ ; l− = (−ipθ − pφ cot θ)e−iφ (5.24)
En coordenadas esféricas la constante de movimiento pφ , el momento canónico
conjugado a φ, coincide con la componente Z del momento angular. lθ y lφ no son
constantes de movimiento, pero sı́ lx , ly y lz , como también:
p2φ
lr = 0 ; lz = pφ ; l2 = p2θ + = µ2 r4 (θ̇2 + sen2 θφ̇2 ) (5.25)
sen2 θ
de lo anterior se sigue que existe un valor mı́nimo de θ dado por:

pφ
senθmin = ; θmax = π − θmin (5.26)
l
Como ~l es constante, tenemos que los vectores ~r y ~r˙ siempre permanecerán en un
plano perpendicular a ~l, o sea que cuando las fuerzas son centrales la partı́cula de masa
reducida permanece siempre sobre un plano; las órbitas son planas. θmin y θmax son
los ángulos de máximo y mı́nimo acercamiento de la partı́cula al eje Z respectivamente,
donde θ̇ cambia de signo.
Comparando la expresión (5.25) para ~l 2 , con (5.17), obtenemos:
1 l2
L= µṙ + − V (r) (5.27)
2 2µr2
En esta forma se nota la completa simetrı́a esférica del lagrangiano, ya que sólo
depende de r pues ~l es una constante. El hamiltoniano es:
p2r l2
H= + + V (r) (5.28)
2µ 2µr2
En esta expresión para H podemos tomar ventaja del hecho de depender sólo de
la parte radial: H describe el movimiento unidimensional equivalente de una partı́cula
de masa µ en un potencial efectivo:
l2
Vef (r) = + V (r) (5.29)
2µr2
La segunda ley de Kepler. Podemos definir las coordenadas de manera que
desaparezca del problema uno de los ángulos. Si tomamos el eje Z de modo que coincida
con la dirección de ~l, que es constante, entonces el movimiento permanecerá siempre
sobre el plano X − Y : θ = π/2 = constante; θ̇ = 0, con lo cual la magnitud del momento
toma la forma:
l = pφ = µr2 φ̇ = constante (5.30)
En el plano de la órbita, el área barrida por el radio vector en un tiempo dt es
dA = (1/2)r2 dφ, siendo dφ el ángulo que gira el radio vector en el tiempo dt. Entonces,
1 2 l
Ȧ = r φ̇ = = constante (5.31)
2 2µ
Nos dice que la velocidad areolar es constante para cualquier movimiento bajo
fuerzas centrales (segunda ley de Kepler, descubierta empı́ricamente en 1609 en obser-
vaciones planetarias. La primera y la tercera leyes de Kepler valen sólo para potenciales
de la forma 1/r).
El problema unidimensional equivalente. Del lagrangiano (5.27) se sigue la

ecuación de movimiento:

d l2 d
µr̈ = − V + = − Vef = fc + f (5.32)
dr 2µr2 dr
donde f es la fuerza derivable de V y fc es la llamada fuerza centrı́fuga, derivada

del potencial centrı́fugo l2 /(µr2 ). La ecuación radial (5.32) supone un observador fijo
respecto a la dirección del radio; como el radio vector gira, para este observador aparece
una fuerza inercial que es precisamente fc . Como el hamiltoniano (5.28) es una constante
de movimiento, la energı́a total en el centro de masa, que llamaremos E, proporciona
una ecuación diferencial para r que puede integrarse por cuadratura:
Z r
dr
t − t0 = 1/2 (5.33)
r0 2 l2
(E − V ) − 2 2
µ µ r
de (5.33) en principio puede obtenerse a r en función del tiempo, para cada conjunto de
valores de t0 , r0 , µ, E y l. Es de interés encontrar a r en función de φ, o sea, hallar la
ecuación de la órbita en coordenadas polares en el plano de la misma. De (5.30) podemos
notar que:
l dr
ṙ = (5.34)
µr2 dφ
de donde:
Z r
l dr
φ − φ0 = (5.35)
r0 r2
l2
1/2
2µ E − V −
2µr2
De manera similar puede hallarse a φ(t) si se conoce a r(t):
Z r
l dt
φ − φ0 = 2
(5.36)
r0 µ r (t)
Las fórmulas (5.34) y (5.35), recordemos, valen si se eligen las coordenadas de modo
que el eje z coincide con la dirección de ~l. Para una elección general de las coordenadas,
las expresiones para hallar la ecuación de la órbita y la dependencia temporal de θ
y φ resultan más complicadas: estas fórmulas las consideramos más adelante usando
el formalismo de Hamilton-Jacobi. La fórmula (5.33) no depende de la elección de las
coordenadas.
Hallemos ahora la llamada ecuación diferencial de la órbita. Es una ecuación dife-
rencial para r en función de φ. Se halla a partir de (5.34) y de:
l dυ l2 2 d2 υ 1
ṙ = − ; r̈ = − υ ; donde υ = (5.37)
µ dφ µ2 dφ2 r
Con la ayuda de (5.37), la ecuación (5.32) se transforma en la ecuación diferencial
de la órbita:
d2 υ µ F (υ)
=− 2 2 , (5.38)
dφ2 l υ
donde F (υ) = f (1/υ). Esta ecuación permite, dada f (r) hallar a r(φ), y dada r(φ) hallar
a f (r).
Coordenadas de retorno. Son los valores de las coordenadas en que la respectiva

velocidad se anula, o sea, que cambia de signo. Los puntos de retorno en r son aquellos
para los cuales ṙ = 0, o sea, los que satisfacen la ecuación algebraica:
l2
+ V (r) − E = 0 (5.39)
2µr2
En estos puntos la velocidad no es cero pues θ̇ y φ̇ no se anulan necesariamente. Si
ocurre que ṙ se anula solo cuando r es finito y que el movimiento es acotado o ligado,
habrá un punto de máximo acercamiento y uno de máximo alejamiento de la partı́cula al
centro de fuerza. Si ṙ = 0 en un punto r → ∞, el movimiento es no ligado; éste es el caso
de los procesos de colisiones o de dispersión. Los puntos de retorno en θ son aquellos en
que θ̇ = 0, o sea pθ = 0; en esos puntos θ vale θmax o θmin , ecuación (5.26). La ecuación
(5.26) nos dice que no existen valores de φ en los cuales φ̇ = 0; no hay puntos de retorno
en φ.
Si r tiene dos lı́mites, rmin y rmax , el movimiento es ligado y la órbita está contenida
dentro de una corona limitada por las circunferencias r = rmin y r = rmax . La órbita
puede o no ser cerrada; en general no lo será. Para los potenciales de la forma 1/r o r2
las órbitas son cerradas y pueden ser no circulares (son elı́pticas1 ).
Para precisar, consideremos un oscilador bidimensional armónico en el plano de
la órbita; este se obtiene tomando fuerzas restauradoras lineales perpendiculares de la
forma fx = −kX x y fy = −kY y donde kX y kY son las “constantes de resorte”.2 La
dependencia temporal de x y y es:
x(t) = Ax sen(ωX t + φX ) ; y(t) = Ay sen(ωY t + φY ) (5.40)
Eliminando t obtenemos la ecuación de la órbita en coordenadas cartesianas.
Cuando ωX es un múltiplo racional de ωY la órbita es una figura de Lissajous.
Si ωX = ωY , la figura es una elipse; si ωX y ωY difieren ligeramente, la elipse
aparece como si estuviera sometida a un movimiento de precesión (véase figura 5.3).
∆α es el ángulo que se desplaza el semieje mayor cuando la variación temporal de r
ha completado un perı́odo completo. La trayectoria será cerrada si después de cierto
número de ciclos completos de variación r la trayectoria se repite; o sea si al transcurrir
n perı́odos de variación de r, el radio a partir del cual la órbita se repite ha dado un
número m de vueltas completas, es decir, si:
n∆α = m2π (5.41)
Si la condición (5.41) no se cumple, entonces la trayectoria no es cerrada y cuando
t → ∞ llena toda la corona. Otra forma de obtener este resultado es la siguiente. El
movimiento en r tiene una frecuencia νr y el movimiento angular tiene una frecuencia
να . La órbita será cerrada sólo si νr y να son conmensurables.
~rmax y ~rmin se llaman vectores absidales. La órbita siempre es simétrica por refle-
xión en los vectores absidales, o sea que con sólo conocer la porción de órbita compren-
dida entre dos ~rmax y ~rmin consecutivos es posible por reflexión construir toda la órbita.
Esto se puede obtener fácilmente analizando la ecuación diferencial de la órbita.
1 Para otros potenciales pueden haber órbitas cerradas no circulares pero sólo accidentalmente, es
decir, para valores muy bien determinados de l y E.

2 Cuando k
X 6= kY la fuerza es no central. Esto no es esencial, pues aun con fuerzas centrales puede
presentarse la precesión de las órbitas.
∆α
rmáx
rmín
Figura 5.3 Órbitas de un oscilador armónico bidimensional
Ejemplo 5.1.1 Hallar la velocidad angular de precesión de la órbita de una partı́cula

sometida a fuerzas restauradoras lineales con kX ≈ kY .
Se cumple que ωX ≈ ωY . En (5.40) tomamos φX = φY = 0 y llamamos ∆ω a

ωY − ωX . Para hallar la ecuación de la órbita notemos que, al primer orden en ∆ω t:
y = AY cos ωY t = AY (cos ωX t − ∆ωt senωX t) (5.42)
de este modo la ecuación de la órbita es, al primer orden en ∆ω t:
x2 y2 xy
2
+ 2 +2 ∆ω t = 1 (5.43)
Ax Ay Ax Ay
que es la ecuación de una elipse con el eje mayor rotado. La ecuación (5.43) puede
escribirse como una forma cuadrática no diagonal:
  
A2y Ax Ay ∆ω t x
(x, y)    = A2x A2y (5.44)
2 y
Ax Ay ∆ω t Ax
Para llevar (5.43) a la forma estándar de la ecuación de la elipse, realicemos una

rotación de los ejes coordenados por cierto ángulo δ:
    ′ 
x cos δ −senδ x
 =   (5.45)
′
y senδ cos δ y
Luego, la matriz de la forma cuadrática será diagonal si:

2Ax Ay
tan 2δ = ∆ω t (5.46)
A2x − A2y
Si t es el tiempo que tarda r en completar un perı́odo en este problema de fuerza

no central, entonces, al primer orden en ∆ωt, la velocidad angular de precesión de la
órbita es:
Ax Ay
δ̇ ≈ (ωy − ωx ) (5.47)
A2x − A2y
si AX no es del orden de AY (órbitas muy excéntricas).
Ejemplo 5.1.2 Hallar para qué valores del momento angular es posible que sea acotado
el movimiento en presencia del potencial:
A l2
V (r) = − e−αr (5.48)
r 2µr2
La energı́a potencial efectiva es:

A l2
Vef (r) = − e−αr + (5.49)
r 2µr2
Vemos que Vef → +0 para r → ∞, y Vef → +∞ para r → 0. La figura 5.4 muestra
la forma de Vef . Hay posibilidad de movimiento acotado sólo si Vef tiene un mı́nimo, o
′
sea si la ecuación Vef = 0 tiene solución, esto es:
Aα −αr Ae−αr l2
e + − =0 (5.50)
r r2 µr3
Si llamamos x = αr, entonces (5.50) se puede llevar a la forma:
αl2
(x2 + x)e−x = (5.51)
µA
Hay solución solamente si la curva f (x) = (x2 + x)e−x corta a la recta αl2 /(µA)
(véase figura 5.5), esto es, si:
αl2
f (x0 ) > (5.52)
µA
donde x0 es la posición en la cual f (x) tiene un máximo. f ′ (x) = 0 si:
x2 − x − 1 = 0 (5.53)
La única solución aceptable de (5.53) es:

√
1+ 5
x0 = ≈ 1,618 (5.54)
2
Vef
l2
2µr2
E
1/α
r
–Ae–αr/r
Figura 5.4 Energı́a potencial efectiva Vef componente de los potenciales centrı́fugo y de
Yukawa
Entonces:
√ 1+√5
f (x0 ) = 2 + 5 e− 2 ≈ 0,84 (5.55)
′
Hay solución a Vef (r) = 0 sólo si:
αl2
0, 84 > (5.56)
µA
Si (5.48) se usa para describir la interacción nuclear, por ejemplo entre un neutrón
y un protón, habrá resonancias, o sea estados ligados de energı́a positiva, si se cumple la
condición (5.56). El momento angular l = 0 presenta estados ligados pero no resonancias.
Puede haber resonancias sólo si:
µA
0, 84 > h̄2 (5.57)
α
La barrera que se forma en Vef se llama “barrera centrı́fuga”. Se entiende por
resonancia (“de forma”) el efecto túnel que se produce cuando la partı́cula viene desde
r → ∞ y atraviesa la barrera quedando atrapada por el pozo de potencial durante cierto
tiempo. Este proceso no es clásicamente posible.
αl 2
µA
f(x)
x0
Figura 5.5 Solución f (x) al potencial efectivo
5.2. El oscilador armónico tridimensional

Es el problema del movimiento de la partı́cula de masa reducida en presencia de
la interacción central:
f~(r) = −kr êr (5.58)
Solución en coordenadas cartesianas. Tomando coordenadas cartesianas en el
plano de la órbita, la solución al oscilador armónico bidimensional es (5.40). La ecuación
de la órbita es:
x2 y2 2xy
+ − cos δ = sen2 δ ; δ = φy − φx (5.59)
A2x A2y Ax Ay
La ecuación (5.59) es la forma cuadrática bidimensional de la forma ~r · M̃~r = sen2 δ,

donde M̃ es la matriz:
 
a − cos δ
M̃ = A−1x Ay
−1   ; a = Ay (5.60)
Ax
−cosδ a−1
Realizando una rotación de coordenadas es posible diagonalizar a M̃ . Sea la rota-

ción ~r = R̃~r ′ , entonces:
~r ′ · R̃T M̃ R̃~r ′ = sen2 δ (5.61)
La matriz R̃ es ortogonal, R̃R̃T = I˜ y diagonaliza a M̃ si es de la forma:

 
cos α −senα
2 cos δ
R̃ =  ; tan 2α = −1 (5.62)
senα cos α a −a
R̃T es la transpuesta de R̃.

Por simplicidad tomaremos Ay = Ax (a = 1). Entonces α y M̃ diagonalizada son:
 
1 − cos δ 0
π 1  
α = (cos δ > 0) ; M̃ = 2 (5.63)
4 A
0 1 + cos δ
La ecuación de la órbita (5.60) se torna la estándar de la elipse, con semiejes mayor

a y menor b, y excentricidad ǫ:
r r
δ δ b2 2 cos δ
b = A sen ; a = A cos ; ǫ= 1− 2 = (5.64)
2 2 a 1 + cos δ
δ está relacionado con el momento angular y A con la energı́a total:
E
l=− senδ ; E = µA2 ω 2 (5.65)
ω
Entonces la excentricidad y el semieje mayor tienen la siguiente expresión en térmi-
nos de E y l:
s
kl2  s 
2 1− 2
µE 1E  2
kl 
E2 = s ; a2 = 1+ 1− 2
(5.66)
kl 2 2 k µE
1+
µE
Solución en coordenadas polares. En vez de hacer la transformación de coor-

denadas, usaremos las fórmulas halladas en el numeral anterior, cuando se toma el eje
Z perpendicular al plano de la órbita. De la ecuación (5.35) se sigue:
Z r
l dr
φ − φ0 = √ s (5.67)
2µ r0 1 l2
r2 E − kr2 −
2 2µr2
Haciendo la sustitución ρ = r2 , (5.67) toma la forma:

Z r2
l dρ
φ − φ0 = √ s (5.68)
2 µk r02 2E l2
ρ −ρ2 + ρ−
k µk
La integral se halla en tablas de integrales. El resultado es:

 r2
2
 2Eρ 2l 
 1 −
l  k µk  

φ − φ0 = √  sen−1 s  (5.69)
2 µk  l 4E 2 4l2 
√
µk ρ −
k2 µk 2
r0
Entonces llegamos a:
B2
r2 = (5.70)
1 − e sen2(φ − φ0 + β0 )
donde B, e y β0 son:
s s l2
r02 −
l2 kl2 µk
B= ; e= 1− ; 2β0 = arcsen (5.71)
µE µE 2 r02 e
La ecuación de la elipse centrada y no rotada en coordenadas polares es:
b2
r2 = (5.72)
1 − cos2 φ
ǫ2
Si se rota 45◦ toma la forma:
b2 b2 /(1 − ǫ2 /2)
r2 = = (5.73)
φ ǫ2
1 − ǫ2 cos2 (φ − ) 1− sen2φ
4 2 − ǫ2
Las ecuaciones (5.70) y (5.73) coinciden si:
b2 ǫ2
β0 = φ0 ; B2 = 2 ; e= (5.74)
ǫ 2 − ǫ2
1−
2
Las ecuaciones (5.71) y (5.74) conducen a los valores hallados en (5.66) para los paráme-
tros de la elipse en función de las constantes de movimiento. La órbita es una elipse y
el centro de la misma coincide con el centro de fuerza.
Cálculo de la variación temporal del radio. Para hacer este cálculo usamos
la ecuación (5.33):
Z r
dr
t − t0 = s (5.75)
r0 2 1 2 l2
E − kr − 2 2
µ 2 µ r
Los puntos de retorno se hallan resolviendo la ecuación (5.39):

s !
E kl 2 E
2
rmax, min = 1± 1− = (1 ± e) (5.76)
k µE 2 k
Vemos que:
l l
rmax = a = p ; rmin = b = p (5.77)
µE(1 − e) µE(1 + e)
Esto nos permite escribir la expresión bajo el signo de raı́z cuadrada en (5.75)
como:
r Z r
µ rdr
t − t0 = p (5.78)
k r0 (a − r2 )(r2 − b2 )
2
Haciendo el cambio de variable p = r−2 , llegamos a:

r Z r −2
1 µ dρ
t − t0 = p (5.79)
2 k r0−2 ρ (a ρ − 1)(1 − b2 ρ)
2
La solución a esta integral se encuentra en tablas. El resultado es:
r r−2
1 µ (a2 + b2 )ρ − 2 0
t = t0 = arcsen (5.80)
2 k ρ(a2 − b2 ) r−2
Incluyendo en t0 la parte que depende de r0 llegamos a:
a2 + b 2 a2 − b 2 E
r2 = + sen2ω(t − t0 ) = [1 + e sen2ω(t − t0 )] (5.81)
2 2 k
l no puede ser arbitrario, está restringido al rango:
E
0≤l≤ (5.82)
ω
La ecuación (5.82) corresponde al comportamiento cuántico, haciendo la corres-
pondencia con los números cuánticos l → lh̄ y E = nh̄ω, donde los valores permitidos
del número cuántico orbital l son: 0 ≤ l ≤ n; o sea l = 0, 1, 2, ...n.
Cuando l = E/ω, e =p 0 y ǫ = 0, la órbita es circular pues según (5.81) el radio de
la órbita es constante: r = E/k.
Cuando l = 0, e = 1 y ǫ = 1, la órbita es rectilı́nea. Según (5.81) la variación
temporal del radio será de forma pendular, con frecuencia ω y no 2ω como cuando
e 6= 1:
r
2E π
r= cos ω(t − t0 − ) (5.83)
k 4ω
Para hallar a r(t) a partir de (5.81) se requiere realizar una expansión en serie infi-
nita. Para l 6= 0 y diferente de un máximo valor, r(t) contiene la frecuencia fundamental
2ω y todos sus armónicos.
5.3. El potencial 1/r

Se trata de estudiar el movimiento de la partı́cula de masa reducida bajo la fuerza:
k
f~(r) = − 2 êr (5.84)
r
Este problema es separable en coordenadas esféricas, en coordenadas parabólicas
y tal vez en otras coordenadas. La solución en coordenadas parabólicas la hallaremos
posteriormente con el formalismo de Hamilton-Jacobi. Aquı́ resolveremos el problema
en coordenadas esféricas.
La ecuación de la órbita. Es cómodo usar la ecuación diferencial de la órbita

(5.38). La solución es simple; el resultado es:
l2 /µk
= 1 + ǫ cos(φ − φ0 ) (5.85)
r
donde ǫ y φ0 son las dos constantes de integración. Vemos que rmin ocurre cuando
φ = φ0 si k es positiva, o sea que en ese caso φ0 determina la dirección del vector rmin .
La órbita será simétrica respecto a la lı́nea φ = φ0 . Relacionemos a ǫ con las constantes
de movimiento E y l. Los puntos de retorno rmin y rmax ocurren cuando ṙ = 0 en:
1 2 l2 k
E= µṙ + − (5.86)
2 2µr2 r
O sea que:
s !
k 2El2
rmin, max =− 1± 1+ (5.87)
2E µk 2
Cuál de los signos corresponde a rmin o rmax depende del signo de k y del signo
de E.3 Si rmax es finito, el movimiento será ligado.
Por otra parte, de (5.85) vemos que:
l2 /µk
rmin, max = (5.88)
1±ǫ
Comparando a (5.88) con (5.87) hallamos que:
s
2El2
ǫ= 1+ (5.89)
µk 2
El signo de ǫ lo hemos tomado positivo. La ecuación (5.85) representa una sección

cónica.
Las secciones cónicas. Son las curvas que definen la intersección de un cono con
un plano. Sobre el plano una curva cónica es el lugar geométrico de los puntos cuya
3 En estos puntos cambia el signo de la velocidad radial. Además, para E ≥ 0, según veremos, sólo
existe un punto de retorno.
distancia a un punto dado llamado foco es proporcional a la distancia a una lı́nea dada,
la directriz. Si tomamos el origen del sistema de coordenadas polares en el foco y S es
la distancia del foco a la directriz (véase figura 5.6), se sigue de la definición, llamando
ǫ a la constante de proporcionalidad:
r = ǫ [S − r cos (φ − φ0 )] (5.90)
• Directriz
φ
φ0
x
Foco
Figura 5.6 Elementos de las secciones cónicas
ǫ debe ser positivo por ser la relación entre dos distancias. Se sigue de (5.90):
ǫS
= 1 + ǫ cos (φ − φ0 ) , ǫ>0 (5.91)
r
La curva es simétrica respecto a la lı́nea φ = φ0 . La longitud ǫS se llama parámetro
de la sección cónica y ǫ se llama excentricidad. Hay distintos tipos de secciones cónicas
dependiendo del valor de ǫ.
Si ǫ = 1, se obtiene la parábola, es decir, el lugar geométrico de los puntos equi-
distantes del foco y de la directriz. El punto de máximo acercamiento al foco se llama
vértice y está situado a una distancia S/2, en tanto que la máxima distancia es infinita:
1
rmin = S; rmax = ∞; ǫ = 1 (5.92)
2
Si ǫ < 1, se obtiene una elipse: curva con dos directrices y dos focos. Hay en este
caso dos distancias absidales finitas:
ǫS ǫS
rmin = ; rmax = ; ǫ<1 (5.93)
1+ǫ 1−ǫ
El promedio entre rmax y rmin lo llamaremos a, de modo que:
1 − ǫ2
S=a ; ǫS = a(1 − ǫ2 ) (5.94)
ǫ
La ecuación de una elipse en coordenadas polares con foco en el origen es:
a(1 − ǫ2 )
r= (5.95)
1 + ǫ cos (φ − φ0 )
La ecuación de una elipse en coordenadas polares con centro en el origen es (5.72).

Las directrices
√ están a distancias a/ǫ del centro (véase figura 5.8). Los semiejes son a y
b = a 1 − ǫ2 .
ε=1
S/2
S )φ0
F
Figura 5.7 Sección cónica: la parábola
D2
S
ε<1
D1 εS ) φ0
•
εa F2
S
F1
a /ε
Figura 5.8 Sección cónica: la elipse
Si ǫ > 1, la cónica es una hipérbola: curva de dos ramas con sus correspondientes
focos, directrices y ası́ntotas. De la definición (5.90) se sigue la siguiente ecuación para
la rama 2, respecto al origen de coordenadas mostrado, la cual es consistente con (5.85)
2 ε<1
D2
εS
D1 )φ0
F2
a S
a/ε
aε
1 F1
Figura 5.9 Sección cónica: la hipérbola
cuando k > 0 y φ0 se sustituye por φ0 + π:

ǫ
= −1 − ǫ cos (φ − φ0 ) ; rama 1 (k < 0)
r
(5.96)
ǫ
= 1 − ǫ cos (φ − φ0 ) ; rama 2 (k > 0)
r
Cuando φ − φ0 = π, r toma el valor rmin :
(1) ǫS (2) ǫS (2) (1)
rmin = ; rmin = ; rmin = rmin − 2a (5.97)
ǫ−1 1+ǫ
(2) (1)
cuando cos(φ − φ0 ) = 1/ǫ, r = rmax = ∞ y cuando cos(φ − φ0 ) = −1/ǫ, r = rmax = ∞.
Si llamamos la distancia entre los vértices 2a, también se cumple que rmin = a(ǫ − 1).
Las directrices están a distancias a/ǫ del centro. El parámetro S en función de a vale:
ǫ2 − 1
S= a (5.98)
ǫ
r → ∞ cuando 1 − ǫ cos (φ − φ0 ) = 0, sobre la rama 2. Entonces el ángulo entre las dos
ası́ntotas vale:
2 cos−1 ǫ−1 ; cos−1 ǫ−1 ≤ φ − φ0 ≤ π − cos−1 ǫ−1 (5.99)
Relación entre el signo de k y E, y el tipo de cónica. La excentricidad y el
parámetro están relacionados con la energı́a y el momento angular:
s
l2 2El2
ǫS = ; ǫ= 1+ (5.100)
µ|k| µk 2
Si el potencial es repulsivo, k es negativo. En este caso, sólo es posible que la
energı́a sea positiva, pues de lo contrario rmin serı́a negativo. Entonces ǫ es mayor que
la unidad y la trayectoria de la partı́cula es hiperbólica, o sea que el movimiento es

no ligado. Esto es consistente con el análisis de la curva de energı́a potencial efectiva
cuando k es negativo: la energı́a potencial no tiene un mı́nimo y el movimiento resulta
no acotado, con sólo un punto de retorno. Es el caso cuando la partı́cula llega desde el
infinito y “rebota” en la barrera de potencial. Este comportamiento incluye también el
caso lı́mite en que la energı́a es cero.
Si el potencial es atractivo, k es positiva. En este caso se presentan tres posibili-
dades. Si E > 0, entonces ǫ > 1 y el movimiento es hiperbólico. No hay lı́mite al valor
máximo que puede tomar l:
0≤l<∞ si E>0 (5.101)
A este caso, y al caso en que k es negativo, corresponden las dos ramas de la

hipérbola: si k es negativo, la partı́cula se mueve sobre la hipérbola correspondiente a
D1 ; si k es positivo y E > 0, se mueve sobre la hipérbola correspondiente a D2 . Si E = 0
entonces ǫ = 1. l se conserva pero no es cero porque el parámetro de impacto es infinito
y en r → ∞ la velocidad es cero:
0≤l<∞ si E=0 (5.102)
El movimiento es no ligado y r → ∞ para dos valores de φ: φ = φ0 ± π.

La trayectoria es parabólica y no tiene ası́ntotas (serı́an las rectas y = ±∞). De
(5.92) se sigue que:
1 l2
rmin = S= ⇒ l 6= 0 (5.103)
2 2µk
Este caso se presenta cuando la partı́cula parte del reposo desde el infinito.
Si E < 0, entonces ǫ < 1. En este caso:
s
2|E|l2
ǫ= 1− <1 (5.104)
µk 2
Es claro que el rango de valores posibles de l es finito:

r
µ
0≤l≤ k (5.105)
2|E|
Esto es análogo al comportamiento del número cuántico orbital en el átomo de
hidrógeno: l = 0, 1, ...n − 1.
ǫ cos (φ − φ0 ) nunca vale uno y por eso r nunca es infinito: el movimiento es ligado.
En este caso:
k k
rmin, max = (1 ∓ ǫ) ; a= (5.106)
2|E| 2|E|
Si ǫ = 0 siendo E < 0 entonces la trayectoria es circular con radio:
l2 k
r= = =a (5.107)
µk 2|E|
Como r es constante, se sigue de (5.31) que φ̇ también es constante.

Si ǫ = 1, entonces l = 0 y la trayectoria es la lı́nea recta φ = φ0 . En este caso:
rmin = 0 ; rmax = a (5.108)
Para ǫ < 1 la trayectoria es una elipse rotada en un ángulo φ0 y con semiejes mayor
y menor dados por:
k p l
a= ; b=a 1 − ǫ2 = p (5.109)
2|E| 2µ|E|
respectivamente. Vemos que b está comprendido, dependiendo de l, entre:
0≤b≤a (5.110)
El hecho de que las trayectorias sean elı́pticas es consecuencia de la primera ley de

Kepler (cuando k = GM m).
Las figuras desde 5.10 hasta 5.13 muestran las curvas de energı́a potencial efectiva para
cada uno de los casos. Del análisis de las mismas se obtiene cualitativamente el compor-
tamiento descrito.
Vef
r mín k<0 r
Figura 5.10 Energı́a potencial efectiva. Trayectoria hiperbólica.
La tercera ley de Kepler. El área de la elipse es:

s
p kl 2 l
2
A = πab = πa 1 − ǫ2 = π = πa2 (5.111)
4|E| µ|E| lmax
Recordando la ecuación (5.31) para la velocidad areolar, obtenemos que:

r
A πk p µ 3/2
τ= = 2
−2µE = 2π a (5.112)
Ȧ 2E k
Vef
r mín r
k > 0, E > 0
Figura 5.11 Energı́a potencial efectiva. Trayectoria hiperbólica.
Vef
E
rmín r
k > 0, E = 0
Figura 5.12 Energı́a potencial. Trayectoria parabólica.
Vemos que el perı́odo del movimiento no depende del valor de l.

Para la interacción gravitacional entre un planeta (masa m) y el Sol (masa M ),
(5.112) toma la forma:
s
1
τ = 2π a3/2 (5.113)
G(m + M )
Como para los planetas del sistema solar m ≪ M , se sigue que τ ∝ a3/2 , que es el
contenido de la tercera ley de Kepler, la cual como se ve, es un resultado aproximado.
Vef l = l máx l l=0

·
r mín r máx k > 0, E < 0 E
Figura 5.13 Energı́a potencial efectiva. Trayectoria elı́ptica.
La ecuación de Kepler. Encontrar a r(t) es interesante en muchos casos, por

ejemplo para predecir el movimiento de un satélite. Para hallar a r(t) debemos usar
la ecuación (5.33). Por simplicidad, consideraremos sólo el caso k > 0, E < 0. Es
conveniente expresar a E y l en términos de a y ǫ:
k p p
E=− ; l = µka 1 − ǫ2 (5.114)
2a
Entonces (5.33) toma la forma:
r Z
µa r rdr
t − t0 = p (5.115)
k r0 −r + 2ar − (1 − ǫ2 )a2
2
Usando la expresión para τ , ecuación (5.112), obtenemos:

Z r
τ r dr
t − t0 = p (5.116)
2πa r0 −r2 + 2ar − (1 − ǫ2 )a2
La solución a esta integral se encuentra en tablas. El resultado es:
2πa 1p 2 r−a
(t + δ) = − −r + 2ar − (1 − ǫ2 )a2 + arcsen (5.117)
τ a ǫa
donde δ es una constante arbitraria.
Definamos las siguientes variables:
2π a−r
M= (t + δ) ; ψ = cos−1 (5.118)
τ ǫa
Las cantidades M , ψ y φ reciben los siguientes nombres en astronomı́a: M , ano-
malı́a media; ψ, anomalı́a excéntrica y φ, anomalı́a verdadera (véase figura 5.14).
De simples argumentos geométricos se sigue a partir de las fórmulas de la elipse
que ψ y M tienen la siguiente interpretación geométrica:
y
R
P
M r
ψ φ x
Figura 5.14 Variables de la ecuación de Kepler.
ψ es el ángulo del vector de posición del punto Q, tomando como origen el centro
de la elipse. R es un punto que gira uniformemente sobre una circunferencia de radio a,
con velocidad angular 2π/τ . φ y M sirven para describir la posición del punto p (véase el
texto de Marion, Classical dynamics of particles and systems, segunda edición, sección
8,8). Expresando a (5.117) en función de (5.118) obtenemos:
r = (1 − ǫ cos ψ)a ; M = ψ − ǫsenψ (5.119)
En (5.119) hemos adicionado a M la constante π/2. La ecuación que relaciona a

ψ con M se denomina la ecuación de Kepler, y permite expresar a r en función del
tiempo. ψ es una función trascendental de M . Bessel halló en 1830 la solución exacta de
la ecuación de Kepler en forma de serie de Fourier. El resultado es:
∞
X sen(nM )
ψ =M +2 Jn (nǫ) (5.120)
n=1
n
donde Jn son las funciones de Bessel de orden entero. Entonces la expresión para r(t)
es:
( "
r(t) = a 1 − ǫ cos 2πν(t + δ)+
∞
#)
X sen{2πnν(t + δ)}
2 Jn (nǫ) (5.121)
n=1
n
Ejemplo 5.3.1 Demostrar la solución (5.120) de la ecuación de Kepler.

ψ es una función impar de M , luego su expansión de Fourier contendrá sólo funciones

seno y además contiene una componente no oscilante que será M misma. Entonces
busquemos soluciones de la forma:
∞
X
ψ=M+ Cn sen(nM ) (5.122)
n=1
La expansión de Fourier de la función ǫ senψ = f (M ) tiene coeficientes dados por:

Z
2 π
Cn = f (M ) sen(nM ) dM (5.123)
π 0
Utilizando la ecuación de Kepler, el integrando en (5.123) será:
Z
2ǫ π
Cn = senψ sen[n(ψ − ǫ senψ)](1 − ǫ cos ψ)dψ (5.124)
π 0
Efectuando los productos y expresando los productos de funciones seno como suma
de funciones coseno llegamos a:
Z
ǫ πn
Cn = cos[(n − 1)ψ − nǫsenψ] dψ − cos[(n + 1)ψ
π 0
1 (5.125)
−nǫsenψ] dψ − ǫ cos[(n − 2)ψ
2 o
1
−nǫ senψ]dψ + ǫ cos[(n + 2)ψ − nǫsenψ] dψ
2
La función de Bessel entera tiene la siguiente representación integral:
Z
1 π
Jκ (x) = cos (κθ − xsenθ)dθ ; κ : entero (5.126)
π 0
Con lo cual Cn toma la forma:
h
Cn = ǫ Jn−1 (nǫ) − Jn+1 (nǫ)
ǫ ǫ i
− Jn−2 (nǫ) + Jn+2 (nǫ) (5.127)
2 2
Las funciones Jκ tienen la siguiente relación de recurrencia:
2κ
Jκ+1 (x) = Jκ (x) − Jκ−1 (x) (5.128)
x
El uso de (5.128) nos permite llegar finalmente a:
2
Cn = Jn (nǫ) (5.129)
n
Con lo cual queda demostrada la expresión (5.120).
Precesión de las órbitas elı́pticas. Vimos que, bajo fuerzas centrales, las órbitas
son simétricas respecto a cualquier ábside, por lo tanto el ángulo entre cualquier par de
lı́neas absidales consecutivas es el mismo. En el problema de Kepler (k > 0, E < 0),
las órbitas son cerradas, o sea que el ángulo de precesión de los ábsides es cero. En
el movimiento planetario, por ejemplo, hay efectos “perturbadores”, que hacen que el
potencial no sea exactamente de la forma −k/r, aunque lo sea aproximadamente.
Para el movimiento de la luna alrededor de la tierra, además de la interacción
gravitacional entre estos dos cuerpos tomados como masas puntuales, hay efectos adi-
cionales como una fuerza externa no central debida al campo gravitacional homogéneo
producido por el sol sobre la órbita de la luna; esto se traduce en pequeñas oscilaciones
del plano de la órbita. La tierra y la luna no son masas puntuales y por ello la interacción
del tipo −k/r es sólo el primer término en una expansión multipolar, que dependerá de
la distribución de masa de los cuerpos; la parte central de esta interacción dará lugar
a la precesión de la órbita, o sea al giro del semieje mayor de la elipse, y la parte no
central da lugar a movimientos giroscópicos de la tierra y la luna.
En el caso de Mercurio hay efectos de precesión de su órbita debidos al efecto
combinado de todos los demás cuerpos del sistema solar y efectos residuales que sólo son
explicados por la teorı́a general de la relatividad.
Ejemplo 5.3.2 Analizar la precesión de la órbita de una partı́cula que se mueve en pre-
sencia del potencial:
k C C
V =− + 2; ≪1 (5.130)
r 2r ka
γ =2
Figura 5.15 Trayectoria para γ = 2
Tenemos que la fuerza sobre la partı́cula es central, ası́ que ~l es constante. La

ecuación diferencial de la órbita es:
d2 υ µ 1
+ υ = − 2 2 (−kυ 2 + Cυ 3 ) ; υ= (5.131)
dφ2 l υ r
γ =3
La solución de (5.131) es:

r
α γ 2 l2 µC
= 1 + ǫ cos γ(φ − φ0 ) ; α= ; γ= 1+ (5.132)
r µk l2
donde ǫ y φ0 son constantes de integración. φ0 es la dirección del vector absidal rmin y
ǫ se puede expresar en términos de las constantes de movimiento comparando las dos
expresiones para las distancias de retorno.
s !
k 2El2 2 α
rmax, min = − 1± 1+ γ = (5.133)
2E µk 2 1±ǫ

s
rmax − rmin 2El2 2 k
E= = 1+ γ ; a=− (5.134)
rmax + rmin µk 2 2E
El efecto del término adicional es variar ligeramente la excentricidad de la órbita e

introducir el factor de γ a φ − φ0 .
Cuando r = rmin , φ = φ0 y cuando r = rmax , φ = φ0 + φ/γ. Entonces el ángulo
entre los vectores absidades γmin y rmax es:
π
φmax − φmin = (5.135)
γ
γ=5
y no π como cuando C = 0. De esta forma, al cumplir un perı́odo, el vector rmin sufre

un desplazamiento angular dado por:

1
∆φ = 2π 1 − (5.136)
γ
Si la partı́cula tarda un tiempo Tr en ir de un valor de rmin al consecutivo, tar-
dará un tiempo mayor en φ dar una vuelta completa. La trayectoria será cerrada sola-
mente si ∆φ es un submúltiplo racional de 2π, o sea, si γ es un número racional, lo cual
ocurrirá sólo accidentalmente. Si r ≥ 1 la órbita es esencialmente una elipse que precesa;
el semieje menor rmin rota 2π(1 − γ −1) por cada ciclo de variación de r. Ver figuras 5.15
a 5.18.
Un ejemplo de aplicación del método variacional. Muchas veces no es po-

sible resolver exactamente un problema mecánico, pero es deseable obtener información
aproximada sobre el mismo. Supongamos que hay un sistema cuya solución conocemos
exactamente y que tiene aspectos similares al sistema original para el cual no conocemos
la solución; la solución para el sistema aproximado contendrá una serie de parámetros.
El principio variacional de Rayleigh expresa que la energı́a del sistema es menor que el
valor medio del hamiltoniano tomado sobre la trayectoria del sistema aproximado, de
modo que del sistema aproximado se puede obtener una aproximación óptima al proble-
ma original buscando cuáles son los valores de los parámetros que minimizan al valor
medio del hamiltoniano. En otras palabras: el sistema original posee un hamiltoniano
γ = 1,33
Figura 5.18 Trayectoria para γ ≈ 1
que es función de las variables de estado, H(q, p); para cada estado de movimiento (q, p),
H tendrá un valor definido. Si se toman q(t) y p(t) no de la solución exacta sino de una
aproximada, el valor de H siempre será en promedio mayor que el que tendrı́a tomando
para q(t), p(t), sus valores exactos. Este método está relacionado con el método varia-
cional usado en mecánica cuántica para hallar la energı́a del estado base de un sistema
usando funciones de onda de ensayo.
Veamos cómo trabaja por medio de un ejemplo.
Consideremos un átomo de litio y tratemos de hallar las energı́as del electrón ex-
terno usando la vieja mecánica cuántica. De acuerdo con el modelo de capas del átomo,
el Li consta de dos electrones internos y uno externo. E. Schrödinger en 1921 propuso el
siguiente modelo.4 El resto del átomo –los electrones internos– es reemplazado por una
capa esférica de distribución uniforme de carga negativa, externa a la cual hay entonces
un campo de fuerza coulombiano, correspondiente a una carga positiva +e del núcleo
“apantallado” por dos electrones, y en el interior hay un campo coulombiano, corres-
pondiente a una carga positiva +3e, la del núcleo. Llamemos ρ al radio del cascarón.
Entonces la energı́a potencial en este modelo será:

 3e2 2e2
 − + r<ρ
V = r ρ (5.137)
 2
 −e r>ρ
r
4 Véase el texto The mechanics of the atom de Max Born, sección 28.
donde la constante 2e2 /ρ asegura la continuidad de V en r = ρ. Para el caso en que la

energı́a sea lo suficientemente alta, la órbita permanecerá a distancias del núcleo mayo-
res que ρ, con lo cual la solución será, para el electrón externo, una trayectoria elı́ptica
como en la figura 5.13. Pero cuando el perihelio de la órbita resulta menor que ρ, la
órbita penetra al interior y no será más de forma elı́ptica pues será la correspondiente al
potencial (5.137) que no es coulombiano. Si el electrón externo sólo permanece dentro
de la esfera de radio ρ una fracción pequeña de tiempo es de esperarse que la órbita sea
una elipse que precesa, como en la figura 5.18. Durante un perı́odo la órbita exacta co-
rrespondiente al potencial (5.137) diferirá poco de la órbita correspondiente al potencial
coulombiano. Tomaremos entonces como soluciones de ensayo las órbitas elı́pticas en un
potencial:
ze2
V =− (5.138)
r
donde z será un parámetro variacional que se determina por la condición de que hHi
sea un mı́nimo.
Por simplicidad supondremos que el electrón externo está en un estado s, o sea
que tiene l = 0. Para este caso, según (5.104) la excentricidad será ǫ = 1. Como V es
central, el hamiltoniano es de la forma (5.28), o sea que interviene sólo la coordenada
radial. Usando (5.119) y (5.118) obtenemos, tomando δ = 0:
r = (1 − cos ψ)a ; 2πνt = ψ − senψ (5.139)
La ecuación (5.139) permite escribir a r y ṙ en la forma:
ψ ψ
r = 2a sen2 ; ṙ = 2πνa cot (5.140)
2 2
La ecuación (5.140) permite ahora expresar a H en términos de la solución de
ensayo ası́:

 2 2 2 2 ψ 3e2 2 ψ 2e2

 2π mν a cot − csc + r<ρ
 2 2a 2 ρ
H= (5.141)

 2

 2π 2 mν 2 a2 cot2 ψ − e csc2 ψ r>ρ
2 2a 2
El valor medio de H en un perı́odo será, usando la ecuación de Kepler:
Z 1/(2ν) Z π
2 ψ
hHi = 2ν Hdt = Hsen2 dψ (5.142)
0 π 0 2
Llamando ψ1 al valor de ψ cuando r = ρ obtenemos de (5.140):

r
ψ1 ρ
sen = (5.143)
2 2a
Podemos separar la integral (5.142) en dos, de 0 a ψ1 y de ψ a π, con lo cual

obtenemos después de manipulaciones simples:
Z
2 ψ1 2 2 2 2 ψ 3e2 2e2 2ψ
hHi = 2π mν a cos − + sen dψ
π 0 2 2a ρ 2
Z (5.144)
2 π ψ e 2
+ 2π 2 mν 2 a2 cos2 − dψ
π ψ1 2 2a
Efectuando las integraciones llegamos a:
2
2 e e2 e2 e2
hHi = − ψ1 + ψ1 − senψ1 + π 3 mν 2 a2 − π (5.145)
π a ρ ρ 2a
Es conveniente expresar a e2 /a en términos del número cuántico principal n, la
energı́a de Rydberg y el parámetro z, ası́:
e2 z z
= e 2 = 2R (5.146)
a n a0 n
donde a0 es el radio de Bohr y R = e2 /a0 . Como a = n2 a0 /z, notamos por analogı́a
que ρ será el radio de la órbita de los electrones internos, que se mueven en presencia
del núcleo que tiene carga 3e, y están en la primera órbita que tiene n = 1; entonces
ρ = a0 /3. De esta forma (5.143) es:
r
ψ1 1 z
sen = (5.147)
2 n 6
Usando (5.112) con k = ze2 obtenemos:
π z2
π 2 mν 2 a2 = R (5.148)
4 n2
de modo que (5.145) tomará la forma:
" r
2R 2z 1 z
hHi = 6 − 2 arcsen
π n n 6
r #
1 z2 π z2
− 6z − 2 + −z (5.149)
n n 2n 2
z es un parámetro que se determina por la condición de que minimice a hHi, es decir,

por la condición:
∂hHi
=0 (5.150)
∂z
Efectuando las manipulaciones algebraicas llegamos a que z satisface la siguiente
ecuación trascendental:
r
1 z π
= sen (z − 1) (5.151)
n 6 4
de (5.151) se sigue que z debe ser positiva. Una vez hallada z de (5.151) se reemplaza
en (5.149) para obtener la energı́a:
"
R n
E= 2
2z(z − 1) 1 −
2n 2
r #
4n z2
+zn(1 − 6n) + 6n + 6z − 2 (5.152)
π n
De acuerdo con el principio variacional, la aproximación óptima por medio de órbi-

tas de Kepler al movimiento bajo el potencial (5.137) se halla por medio del potencial
coulombiano −ze2/r, donde z es el número que se obtiene de (5.151) para cada n. Los
resultados que se obtienen al resolver numéricamente a (5.151) son aproximados, dando
errores grandes para n = 2 y errores que van disminuyendo a medida que n aumenta;
las energı́as variacionales siempre serán mayores que las experimentales. Ası́, por ejem-
plo, algunos resultados son: (n, Evar , Eexp )= (2; −0, 29; −0, 58); (8; −0, 06; -0, 12); (15;
−0, 03; −0, 06); (40; -0, 01; −0, 03).
Los resultados no son muy buenos pero ilustran el método variacional que es usa-
do extensivamente en muchas ramas de la fı́sica; las discrepancias se deben en parte al
modelo –suponer que el potencial es central y dado por (5.137)–, en parte al método
variacional en sı́, y en parte al uso de la aproximación clásica.
5.4. El problema de la dispersión bajo fuerzas cen-

trales
Esta sección trata con las soluciones que describen estados no ligados; tales son
los casos k < 0, k > 0 y E > 0 en el movimiento bajo el potencial −k/r. Cuando el
problema es causal, es decir se conocen exactamente las constantes de movimiento y
φ0 , las ecuaciones de la órbita nos dan la evolución de la partı́cula; este problema es
estrictamente mecánico. En fı́sica microscópica, cuando se trabaja con átomos, molécu-
las o electrones, entre otros, una descripción mecánica es muy difı́cil; entonces se acude
a conceptos estadı́sticos. En esta sección en gran parte trabajaremos con los conceptos
estadı́sticos de la sección eficaz, aptos para sistemas microfı́sicos, aunque también se
aplican por ejemplo en cosmologı́a.
La sección eficaz de dispersión. Un experimento tı́pico de dispersión consiste

en estudiar el efecto de un centro dirpersor sobre un haz de partı́culas. Se entiende por
dispersión el proceso de colisión en el cual la dirección del movimiento de las partı́culas
incidentes cambia al azar, como resultado de la interacción con el centro dispersor.
En el estudio estadı́stico se hacen las siguientes suposiciones: todas las partı́culas
del haz incidente son de la misma naturaleza y tienen la misma energı́a y dirección de
la velocidad inicialmente. La interacción es de corto rango, de modo que a partir de
distancias mayores que cierta cantidad α es esencialmente cero. El haz de partı́culas
incidentes tiene una sección transversal A que es mucho mayor que el área efectiva de
interacción σ = πα2 , las partı́culas se distribuyen al azar sobre el área de la sección
transversal del haz. El haz tiene un número muy grande de partı́culas para permitir
un tratamiento estadı́stico, pero no tan grande como para que una partı́cula del haz
interfiera con otra. Toda partı́cula que se acerque al centro dispersor a una distancia
menor que α es dispersada; la probabilidad a priori de una partı́cula ser dispersada es:
σ
p= ; σ = πα2 (5.153)
A
donde σ se llama sección eficaz total de dispersión y es una medida de la dispersión en
cualquier ángulo. Llamaremos θ al ángulo entre la dirección del haz incidente y la del
movimiento final de una partı́cula dispersada.
Las partı́culas que incidan sobre el blanco con un parámetro de impacto s serán
dispersadas en un ángulo θ; las que incidan con un parámetro de impacto s + ds serán
dispersadas en un ángulo θ + dθ donde dθ es negativo. Todas las partı́culas que incidan
sobre una corona circular de radios s y s + ds serán dispersadas dentro del rango angular
θ y θ + dθ. Todas las partı́culas que incidan sobre el área dσ (área rayada en la figura
5.19) se dispersarán con ángulos entre θ y θ + dθ y φ + dφ. Como suponemos que r ≫ α,
rd θ
A
dσ r
dϕ dϕ
θ θ + dθ
ds
Figura 5.19 Sección eficaz de dispersión
entonces hemos notado que no hay diferencia esencial en suponer que las partı́culas
emergen del centro dispersor en vez del centro del área rayada dσ. Estas partı́culas
serán dispersadas dentro de un ángulo sólido dΩ dado por:
dΩ = senθ dθ dφ (5.154)
La probabilidad de dispersión dentro del ángulo dΩ se expresa en función de la
llamada sección eficaz dσ.
dσ s ds dφ
dp = = (5.155)
A A
Supongamos que la intensidad del haz incidente es I:
∆N
I= (5.156)
A ∆t
donde ∆N es el número de partı́culas incidentes que pasan por el área A durante el

tiempo ∆t. De las ∆N que en ∆t pasan a través de A, solamente dN (θ) incidirán sobre
el área dσ y serán dispersadas dentro de dΩ en el tiempo ∆t.
Entonces la probabilidad de dispersión dentro de dΩ durante el tiempo ∆t será:
dN (θ) dσ
dp = = (5.157)
∆N A
Se sigue entonces de (5.156) y (5.157) que:
dN (θ)
= Idσ (5.158)
∆t
Definimos la sección eficaz diferencial σ(θ), como:

dσ
σ(θ) = (5.159)
dΩ
I(θ) 1 dN (θ)
σ(θ) = = (5.160)
I I ∆t dΩ
Es decir, σ(θ) es igual al número total de las partı́culas dispersadas dentro de dΩ
por unidad de tiempo y unidad de ángulo sólido, dividido por el número de partı́cu-
las incidentes por unidad de área por unidad de tiempo. Como esta definición de σ(θ)
incluye sólo conceptos macroscópicos, o sea conceptos de cantidades observables experi-
mentalmente, entonces es válido también en mecánica cuántica. La siguiente expresión
mecánica que resulta de (5.159) al reemplazar a dσ y dΩ en función de θ, φ y s sólo es
válida en mecánica clásica,
dσ −s ds
σ(θ) = = (5.161)
dΩ senθ dθ
La ecuación (5.161) está expresada en función de s, que en microfı́sica no es acce-
sible directamente al experimento.
La relación entre las tres definiciones de sección eficaz (sección eficaz, sección eficaz
total y sección eficaz diferencial) es:
Z Z
σ = dσ = σ(θ) dΩ (5.162)
Ejemplo 5.4.1 Sea una esfera dura de radio a y masa infinita. Sobre ella incide un haz de
partı́culas de masa m y radio b también duras, que se dispersan elásticamente al chocar.
Hallar la sección eficaz diferencial (véase figura 5.20).
El parámetro de impacto está dado por:

θ
s = (a + b) senα = (a + b) cos (5.163)
2
a
z
b α
α
θ
Figura 5.20 El haz partı́culas de masa m y radio b incide sobre una esfera de masa infinita
y radio a
Entonces:
1
σ(θ) = (a + b)2 ; σ = π(a + b)2 (5.164)
2
σ(θ) no depende de θ ni de la energı́a. Cuánticamente se halla que σ es cuatro veces
mayor debido a efectos de difracción.
Sección eficaz diferencial de Rutherford. Es la sección eficaz diferencial de

dispersión coulombiana, cuando inciden partı́culas cargadas sobre un blanco de masa
infinita y cargado eléctricamente. Asumamos que las cargas son positivas, ze y z ′ e, de
modo que k es negativo, igual a −zz ′e2 . La figura 5.21 muestra la trayectoria de una
de las partı́culas, que es hiperbólica. Tomamos por simplicidad a φ0 = 0 con lo cual
obtenemos de acuerdo con la figura 5.9, la figura 5.21.
De acuerdo con la definición de sección cónica, la ecuación de la hipérbola (rama
1 en la figura 5.9) es:
QF2 = ǫQD2 (5.165)
donde Q es el punto cuyo vector de posición es ~r, F2 es el foco de la derecha y D2 la

directriz de la derecha. Entonces la ecuación de la trayectoria es:
ǫs ǫs l2 /mk
= −1 − ǫ cos φ ⇒ φ = π → rmin = = (5.166)
r ǫ−1 1−ǫ
Que también se obtiene directamente de (5.85) cuando k < 0 y φ0 se sustituye por
φ0 + π. r → ∞ cuando −1 − ǫ cos φ = 0, o sea cuando φ toma el valor:

1
φmin = cos−1 − (5.167)
ǫ
φmin está relacionado con el ángulo de dispersión θ:
φ π θ
+ θ = φmin ; θ + φ = π ⇒ φmin = + (5.168)
2 2 2
z′e
•
Q
 r
Θ
θ / 2  ϕ


O •ze x
v∞
•u S
Figura 5.21 Dispersión de Rutherford. La trayectoria de las partı́culas es hiperbólica.
Entonces:
θ 1 θ
cos φmin = −sen = − ⇒ ǫ = csc (5.169)
2 ǫ 2
Por otra parte ǫ está relacionado con E y l, o sea con υ∞ y con s:
1
l = mυ∞ s ; E = mυ∞ 2 (5.170)
2
Como, según (5.89), ǫ2 = 1 + 2El2 /(mk 2 ), vemos que:
k2 2
s2 = (ǫ − 1) (5.171)
4E 2
De (5.169) y (5.171) se sigue que:
k θ
s= cot (5.172)
2E 2
Reemplazando a (5.172) en (5.161) obtenemos para σ(θ):
2
k θ
σ(θ) = csc4 (5.173)
4E 2
que es la fórmula de Rutherford.5 Como el resultado no depende del signo de k, la
fórmula también es válida cuando el potencial es atractivo.
5 Hallada en 1911. En el tomo I del Berkeley physics course, al final del capı́tulo 15, puede verse el
trabajo original de Rutherford.
La fórmula (5.173) coincide exactamente con la formula cuántica no relativı́stica;

es uno de los varios resultados en que para potenciales del tipo 1/r hay una identidad
con los resultados cuánticos.
La sección eficaz total que se calcula de (5.173) resulta infinita. Como σ es una
medida de la dispersión, el área efectiva para la dispersión de Coulomb es infinita por
ser un potencial de rango largo α = ∞. No importa a que distancia pase el proyectil del
blanco siempre habrá dispersión en alguna dirección.
Sistemas de referencia de centro de masa y de laboratorio. Hasta aquı́ las

consideraciones de las órbitas se han hecho suponiendo que el centro de fuerzas es
inmóvil, lo que equivale a decir que trabajamos en un sistema de referencia donde se
mueve una partı́cula de masa reducida µ, que puede asumirse que está colocada en vez de
la partı́cula 2, en tanto que el centro de fuerzas, inmóvil, está donde estaba la partı́cula
1. El radio vector ~r describe el movimiento de la partı́cula µ, ası́ como el movimiento
relativo de las dos partı́culas originales [ecuaciones (5.9) a (5.13)]. Aquı́ analizaremos
más en detalle la transformación de coordenadas, de manera adecuada a los procesos de
dispersión bajo fuerzas centrales.
Experimentalmente los procesos de dispersión se trabajan en el sistema de referen-
cia de laboratorio. Los cálculos teóricos se hacen en el sistema de centro de masa, donde
la dinámica de los problemas consiste en el movimiento de la partı́cula de masa µ. Es
necesario encontrar la conexión entre los resultados teóricos y los experimentales.
Todas las fórmulas anteriores de (5.153) a (5.173) han sido obtenidas suponiendo
que el centro dispersor es fijo (véase figura 5.22). En el laboratorio usualmente una de las
dos partı́culas, que llamaremos el blanco, está inicialmente en reposo y sobre ella incide
el proyectil con cierta velocidad. La velocidad inicial del proyectil, cuando la separación
de las dos partı́culas es mucho mayor que el rango de la interacción α, es ~υ y la del blanco
~ = 0. En el centro de masa estas dos velocidades son ~υc y V
es V ~c respectivamente. La
v -v m vc M1
m m
x x
c.m. vc
c.m. v=0
Laboratorio: inicial Laboratorio: final
Figura 5.22 Sistemas de referencia de centro de masa y de laboratorio
velocidad del centro de masa respecto al laboratorio es constante, la llamaremos ~υ .

~υ = m
~υ (5.174)
m+M
Los momentos lineales de las partı́culas inicialmente, cuando su separación es muy
grande de modo que no interactúan, son en el laboratorio:
p~P L = m~υ ; pBL = 0 (5.175)
y en el centro de masa son:
p~P C = m(~υ − ~υ) = µ~υ ; ~pBC = M (0 − ~υ) = −µ~υ (5.176)
Las energı́as cinéticas totales de acuerdo con lo hallado en (5.11) a (5.13) son:
1 1 2
TL = mυ 2 ; TC = µυ (5.177)
2 2
La energı́a cinética del centro de masa, que es constante, es:
1
TC.M = (M + m)υ 2 (5.178)
2
De modo que si p
~ es el momento lineal relativo, las energı́as cinéticas están conec-
tadas por:
P~ 2 p~2
TL = + = TC.M + Tc (5.179)
2(M + m) 2µ
o sea que en la región asintótica (r → ∞):
µ m
TL = EL ; EC.M = TC.M = EL ; EL = EC (5.180)
M µ
El momento lineal total anterior a la colisión (r → ∞), es igual al momento lineal
total después de la colisión (r → ∞). Usaremos primas para denotar las cantidades en
la región asintótica después de la colisión. En el centro de masa el momento lineal total
es cero, de modo que:
~C = 0 ;
m~υC + M V ′
m~υC ~′ =0
+ MV (5.181)
C
La ecuación de la conservación de la energı́a total en el centro de masa es:

1 2 1 ~2 1 ′2 1 ~ ′2
m~υC + MVC = m~
υC + MVC (5.182)
2 2 2 2
La fórmula (5.182) se puede escribir, usando (5.181), en la forma:
m m ′
′ ′
~υC · ~υC + ~υC = ~υC · ~υC + ~υ (5.183)
M M C
2 ′2
υC = υC ; VC2 = VC′2 ; ′
mυC = mυC = M VC = M VC′ (5.184)
es decir, las magnitudes de los cuatro momentos lineales, incidentes y emergentes, son
iguales, de modo que en el centro de masa cada partı́cula queda después de la colisión
con la misma energı́a inicial.6 En el proceso de colisión no interviene el ángulo φ, porque
con fuerzas centrales el movimiento ocurre en un plano (véase figura 5.23). Analicemos
ahora la relación entre los ángulos de dispersión θL y θC . La relación de las velocidades
de centro de masa y laboratorio es:
′
~υL ′
= ~υC + ~υ ; V~L′ = V~C′ + ~υ (5.185)
6 Seve que la partı́cula µ no coincide con m cuando se toma el origen de ~
r en el centro de masa.
Como sólo interesa θC , es irrelevante saber dónde está el origen de ~
r.
m v2′
Vc′
r m
Θc
v Θ2 v
vc
C.M.
r
C.M.
v=0 vc
Laboratorio v2′ Centro de mesa M
vc′
Figura 5.23 Sistemas laboratorio y centro de masa
Sabemos que:
~BC
p M~ ~C ′ = p~BC = −~υ
υC =
~ = υ; V (5.186)
m m M
′
Como υC = υC y VC′ = VC , la ecuación (5.186) nos dice que:
′ M
υC = υ; VC′ = −υ (5.187)
m
′
O sea que si M > m entonces υC > υ = VC′ y si M < m, entonces υC′
< υ = VC′ .
Podemos distinguir dos casos, M > m y M < m. Si m > M , de acuerdo con las figuras
5.24 y 5.25, θL es máximo cuando ~υC ′ es perpendicular a ~υL ′ , luego:
′
υC M
senθLmax = = (5.188)
υ m
o sea que hay una región angular en el laboratorio que está prohibida cuando m > M .
Si m < M , todos los valores de θL son posibles. La relación entre θC y θL es común para
los casos m > M y m < M . Dicha relación se obtiene a partir de:
υL senθL = υC senθC ; υL cos θL = υ + υC cos θC (5.189)

senθC m
tan θL = ; γ= (5.190)
cos θC + γ M
Vemos que si m ≪ M , entonces θL ≃ θC . Si m ≃ M y γ ≃ 1, entonces θL ≃
(1/2)θC .
Hallemos ahora la relación entre las secciones eficaces diferenciales σL (θL ) y σc (θc ).
La sección eficaz dσ es invariante por ser perpendicular a la dirección del movimiento
del proyectil en los dos sistemas de referencia:
dσC = dσL (5.191)

v ′L
vi′C
ΘL ΘC
γ>1
Figura 5.24 Relación entre los ángulos de dispersión θC y θL con γ > 1
v ′L vi′C
ΘL ΘC
v
γ<1
Figura 5.25 Relación entre los ángulos de dispersión θC y θL con γ < 1
de (5.159) se sigue entonces que:

d(cos θC )
σC (θC )dΩC = σL (θC )dΩL ; σL (θL ) = σC (θC ) (5.192)
d(cos θL )
Para hallar el factor en (5.192), notemos que de (5.190) se sigue:
senθL
tan θC = γ (5.193)
cos θL −
1+γ
Entonces usamos:
d(cos θC ) d(cos θC ) d(tan θC )
= = (5.194)
d(cos θL ) d(tan θC ) d(cos θL )
Para obtener finalmente:7

p 2
1 − γ 2 sen2 θ + γ cos θ
d(cos θC ) L L
= fγ (θL ) = p (5.195)
d(cos θL ) 1 − γ 2 sen2 θL
La fórmula σL (θL ) = fγ (θL )σC (θC ) da la conexión entre los cálculos teóricos,
centro de masa, y las medidas experimentales, laboratorio. Si γ = 1, vemos que f1 (θL ) =
4 cos θL , y si γ = 0, f0 (θL ) = 1.
Ejemplo 5.4.2 Hallar la sección eficaz diferencial de dispersión en el laboratorio para la

colisión de dos esferas duras de masas m y M , y radios b y a respectivamente.
En el centro de masa la dispersión es como en la figura 5.20, de modo que:
1
σC (θC ) = (a + b)2 (5.196)
4
El resultado se obtiene usando la siguiente consideración: el problema es como si
reemplazáramos la esfera de masa m por una de masa µ, y la esfera de masa M por una
de masa infinita. Como la interacción es la misma, entonces el radio de la esfera de masa
µ debe ser b y el de la esfera de masa infinita debe ser a.
Como la ecuación (5.164) no depende del valor de la masa, se sigue el resultado
(5.196). En el sistema de referencia de laboratorio la sección eficaz diferencial es:
1
σL (θL ) = (a + b)2 fγ (θL ) (5.197)
4
La sección eficaz diferencial en el centro de masa es isotrópica, en tanto que en
el laboratorio sı́ habrá una dependencia angular. En virtud del resultado (5.188), la
función fγ (θL ) debe definirse idénticamente igual a cero para ángulos θL mayores que
θL máximo, cuando γ > 1.
Ejemplo 5.4.3 Hallar la sección eficaz diferencial de Rutherford en el laboratorio cuando

la masa de la carga ze es finita.
7 Ver la demostración en el texto Classical dynamics of particles and systems de Marion, 2a ed.,
¯
sección 9.4.
En el centro de masa σC (θC ) está dada por (5.173):

2
k θC
σC (θC ) = csc4 ; k = −zz ′ e2 (5.198)
4E 2
En el laboratorio será:
 2 −2
γ
2  cos θL − 
k  1+γ 
σL (θL ) = 1 +  fγ (θL ) (5.199)
4E  sen2 θL 
o sea que la dependencia angular en el laboratorio es mucho más complicada que en el

centro de masa. Cuando γ = 1 sin embargo, los resultados son simples debido a que
θC = 2θL y f1 (θL ) = 4 cos θL :
2
k cos θL
σL (θL ) = ; γ=1 (5.200)
2E sen4 θL
6
Pequeñas oscilaciones de sistemas
de varios grados de libertad
En vez de exponer el formalismo general, resolveremos en detalle algunos problemas

que ilustran los aspectos principales del mismo. Veremos que las fórmulas que se obtienen
en forma de matrices se generalizan fácilmente. Al respecto, el lector puede ver los
correspondientes capı́tulos en los textos de Goldstein, Hauser, Marion, Gantmacher,
entre otros, donde además se explica en qué consiste la “pequeñez” de las oscilaciones.

no degenerado
La molécula triatómica lineal. Oscilaciones longitudinales. La molécula
triatómica lineal consta de dos átomos de masa m y uno de masa M , ligados entre
sı́ por fuerzas interatómicas de modo que en la configuración de equilibrio la molécula
es lineal, y al oscilar se conserva la forma lineal (véase figura 6.1). Supondremos que las
interacciones más importantes se presentan entre los átomos 1 y 2, y 2 y 3; más adelante
incluiremos una interacción un poco más general. La energı́a potencial de interacción
entre dos átomos puede variar como un pozo de potencial, a grandes distancias es atrac-
tiva y a pequeñas distancias es repulsiva, con un mı́nimo en una distancia dada. Nos
interesaremos en los movimientos que consisten en pequeñas oscilaciones alrededor de la
posición en que la energı́a potencial tiene un mı́nimo, que es una posición de equilibrio
estable.
m M m
x1 x2 x3
Figura 6.1 Molécula triatómica lineal
167
Para estos movimientos se cumple: (a) La energı́a potencial es del tipo de un “re-
sorte” con pequeñas elongaciones; (b) La energı́a cinética no depende de la posición, o
sea, es función cuadrática homogénea de las velocidades, con coeficientes que no depen-
den de la posición. Ver la discusión detallada de lo anterior, por ejemplo en Gantmacher,
numeral 40.
El número de grados de libertad necesarios para especificar las oscilaciones longitudina-
les es 3 − 1 = 2 descontando la traslación del centro de masa. La longitud del “resorte”
que une los átomos 1 y 2 es x2 − x1 . Supondremos que en la posición de equilibrio la
longitud de este “resorte” es b, o sea que x20 − x10 = b, siendo xi0 la coordenada de la
partı́cula i en la configuración de equilibrio. La elongación del resorte 1−2 será entonces:
(x2 − x1 ) − b = (x2 − x20 ) − (x1 − x10 ) (6.1)
Si llamamos a η1 , η2 y η3 la cantidad en que se separa cada átomo de su posición
de equilibrio:
ηi = xi − xi0 (6.2)
podemos escribir las elongaciones de los resortes 1 − 2 y 2 − 3 como:
η2 − η1 y η3 − η2 (6.3)
de modo que la energı́a potencial para pequeñas oscilaciones será:
1 1
V = k(η2 − η1 )2 + (η3 − η2 )2
2 2
(6.4)
1 2 2 2
k(η1 + 2η2 + η3 − 2η1 η2 − 2η2 η3 )
2
donde k es la “constante de resorte”, cuyo valor depende de factores que no entraremos a
considerar aquı́, pero que supondremos conocido. En (6.4) no se incluye interacción entre
los átomos 1 y 3. Las coordenadas η1 , η2 , η3 , no son todas vibracionales pues sabemos
que las vibraciones longitudinales requieren sólo dos coordenadas. V puede escribirse en
la forma:
3
1 X
V = kij ηi ηj (6.5)
2 i,j=1
donde kij son los elementos de la matriz 3 × 3, k̃:

 
1 −1 0
 
 
k̃ = k 
 −1 2 −1 
 (6.6)
 
0 −1 1
k̃ es una matriz simétrica, kij = kji . La energı́a cinética es:
1 1 1
T = mẋ21 + M ẋ22 + mẋ23
2 2 2
3 (6.7)
1 X
= mij η̇i η̇j
2 i,j=1
Pequeñas oscilaciones de sistemas de varios grados de libertad / 169
donde mij son los elementos de la matriz 3 × 3, m̃, que es diagonal y por lo tanto
simétrica:
 
m 0 0
 
 

m̃ =  0 M 0   (6.8)
 
0 0 m
El lagrangiano del problema es:

3
1 X
L= (mij η̇i η̇j − kij ηi ηj ) (6.9)
2 i,j=1
Para hallar las ecuaciones de Lagrange se requiere conocer las derivadas parciales
de L respecto a ηi y η̇i . Para ello evaluemos a dL:
3
1 X
dL = (mij dη̇i η̇j + mij η̇i dη̇j − kij dηi ηj + kij ηi dηj ) (6.10)
2 i,j=1
usando la simetrı́a de k̃ y m̃, un cambio adecuado de los ı́ndices mudos de la suma

permite escribir,
    
X3 X3 3
X
dL =  mij η̇j  dη̇i −  kij ηj  dηi  (6.11)
i=1 j=1 j=1
con lo cual obtenemos:

X3 X3
∂L ∂L
=− kij ηj ; = mij η̇j ; i = 1, 2, 3 (6.12)
∂ηi j=1
∂ η̇i j=1
Teniendo en cuenta que las mij son constantes, las ecuaciones de Lagrange son:
3
X
(mij η̈j + kij nj ) = 0; i = 1, 2, 3 (6.13)
j=1
Si definimos los vectores en el espacio de configuración del sistema,

     
η1 η̈1 0
     
     
η=  ¨   ~  
~  η2  ; ~η =  η̈2  ; 0 =  0  (6.14)
     
η3 η̈3 0
las ecuaciones de Lagrange (6.13) toman la forma condensada:
η¨ + k̃~η = ~0
m̃~ (6.15)
Veremos que (6.15) es la forma de la ecuación de movimiento para cualquier sistema

de muchos grados de libertad con pequeñas oscilaciones. El sistema que consideramos
tiene sólo oscilaciones en una dimensión; sin embargo, por tener tres grados de libertad
para los movimientos longitudinales, el espacio de configuración de tales movimientos es
tridimensional. El problema que sigue es buscar las soluciones de (6.15) que describirán
el movimiento del punto del espacio de configuración.
La ecuación para el vector ~η , (6.15), es lineal, luego la solución general puede
expresarse como una combinación lineal de las soluciones linealmente independientes.
Como el vector ~ η es tridimensional, existirán tres soluciones linealmente independientes,
en términos de las cuales puede expandirse a ~η ; tales soluciones las llamaremos ~ηα con
α = 1, 2, 3, de modo que la solución general de (6.15) será de la forma:
~η = C1 ~
η1 + C2 ~η2 + C3 ~η3 (6.16)
Como la ecuación de movimiento es de segundo orden, la solución contendrá dos
constantes de integración arbitrarias por cada grado de libertad. En total hay seis cons-
tantes de integración que son C1 , C2 , C3 , φ1 , φ2 , φ3 . Busquemos soluciones de la forma:
~ηα = ~
µα sen(ωα t + φα ); α = 1, 2, 3 (6.17)
~ α es un vector tridimensional constante y φα es una constante de integración. Las
µ
componentes de ~µα son µα1 , µα2 , µα3 . En términos de las componentes, (6.17) será:
ηαi = µαi sen(ωα t + φα ) ; i, α = 1, 2, 3 (6.18)
En (6.18) el ı́ndice i se refiere a los grados de libertad, en tanto que α numera
las soluciones diferentes. ωα es una constante que no debe depender de las constantes
de integración. Debido a que sen(ωα t + φα ) y sen(ωβ t + φβ ) son linealmente indepen-
dientes cuando ωα 6= ωβ , las ~ηα serán linealmente independientes cuando ωα 6= ωβ . Las
soluciones de la forma (6.17) y (6.18) representan los movimientos en los cuales todas
las partı́culas oscilan con la misma frecuencia y tienen una definida relación entre sus
amplitudes de oscilación.
La pregunta que sigue es: ¿cuánto valen las ωα y cuáles son las relaciones que deben
existir entre las µαi ?. Para responderla, reemplacemos a (6.18) en (6.15):
3
X
µα = ~0 ,
(−ωα2 m̃ + k̃)~ (ωα2 mij + kij )µαj = 0; i, α = 1, 2 , 3 (6.19)
j=1
La ecuación (6.19) es un sistema de tres ecuaciones lineales algebraicas homogéneo,

con las tres incógnitas µα1 , µα2 , µα3 , que tendrá solución para ciertos valores de ωα .
Hallar a ~
µα equivale a realizar la siguiente operación con matrices:
µα = (−ωα2 m̃ + k̃)−1~0
~ (6.20)
Vemos que ~µα será no trivial, es decir, diferente del vector ~0 solamente si la matriz
(−ωα2 m +k) es singular, o sea si su determinante es cero. Esto introduce una condición
que permite determinar las ωα :
det(ωα2 m̃ − k̃) = 0 (6.21)
La ecuación (6.21) se llama ecuación secular o determinante secular. El término

secular proviene del latin seculum, o sea, referente a los siglos; se usa a partir de una
ecuación análoga en astronomı́a que aparece al realizar cálculos perturbativos que pre-
dicen efectos sobre las órbitas apreciables sólo en tiempos muy largos. De acuerdo con
las ecuaciones (6.6) y (6.8) se tiene que:
 
mωα2 − k k 0
 
 
ωα2 m̃ − k̃ = 
 k M ωα2 − 2k k 
 (6.22)
 
0 k mωα2 − k
El determinante de la matriz (6.22) es:

det ωα2 m̃ − k̃ = mωα2 − k (M ωα2 − 2k)(mωα2 − k) − k 2
(6.23)

−k k(mωα2 − k)
Por tanto la ecuación (6.21) es una ecuación algebraica de tercer grado en ωα2 , que
tendrá tres raı́ces que serán ω12 , ω22 y ω32 :

k M + 2m
det ωα2 m̃ − k̃ = m2 M ω 2 − (ω 2 − 0) ω 2 − k
m Mm
(6.24)
= m2 M (ω 2 − ω22 )(ω 2 − ω12 )(ω 2 − ω32 )
En conclusión, las frecuencias con las cuales puede ocurrir la oscilación simultánea
de las tres coordenadas son:
k k m
ω12 = 0; ω22 = ; ω32 = 1+2 (6.25)
m m M
Si m ≪ M entonces ω2 ≈ ω3 presentándose una cuasidegeneración. Hay una matriz

de la forma (6.22) por cada una de las frecuencias (6.25):

 
−k k 0
 
 
ω12 m̃ − k̃ =  k −2k k 
 
 
0 k −k
 
0 k 0
 
 
 M − 2m 
ω22 m̃ − k̃ =  k k k 
 m  (6.26)
 
0 k 0
 m 
2 k k 0
 M 
 
 
 M 
ω32 m̃ − k̃ =  k k k 
 m 
 
 
m
0 k 2 k
M
Entonces las ecuaciones (6.19), que nos dan las relaciones entre las componentes
de los vectores ~
µ1 , µ
~ 2 y ~µ3 , son:
 
   0
−k k 0 µ11  
    
    0 
 k −2k k   =  
   µ12   
    
 0 
0 k −k µ13
   
0 k 0  0
µ21  
    
    0 
 M − 2m 
 k k k  µ22 =  
 m 


 
 
(6.27)
   0 
0 k 0 µ23
 m   
2 k k 0   0
 M  µ31  
    
    0 
 M  =  
 k k k   µ32   
 m    
   0 
 
m µ33
0 k 2 k
M
Siendo más explı́citos, respectivamente estas ecuaciones toman la forma:
µ11 = µ12 ; µ11 − 2µ12 + µ13 = 0; µ12 = µ13
µ22 = 0; µ21 + µ23 = 0; µ22 = 0 (6.28)

m M 2m
2 µ31 + µ32 = 0; µ31 + µ32 + µ33 = 0; µ32 + µ33 = 0
M m M
Las relaciones buscadas entre los componentes de los vectores ~µα para los movi-
mientos en que las tres partı́culas oscilan con la misma frecuencia son:
ω1 : µ11 = µ12 = µ13
ω2 : µ21 = −µ23 ; µ22 = 0 (6.29)

2m
ω3 : µ31 = µ33 ; µ32 = − µ31
M
Cada vector µα resulta indeterminado por una constante arbitraria, aunque las
relaciones entre sus componentes están bien definidas:1
     
1 1 1
     
     
     2m 
µ1 = µ11  1  ; ~
~ µ2 = µ21  0  ; ~µ3 = µ31  −  (6.30)
     M 
 
1 −1 1
Notamos que ~ µ1 , ~
µ2 y ~
µ3 no son ortogonales, puesto que: ~µ1 · ~µ2 = 0; ~µ1 · ~µ3 =
2µ11 µ31 (1 − m/M ); ~µ2 · ~
µ3 = 0. Es deseable, sin embargo, trabajar con vectores ortogo-
nales. Los vectores siguientes son ortogonales:
 √   √ 
m m
   
 √   
1/2
m̃ ~ 
µ1 = µ11  M  ; m̃ ~µ2 = µ21  0 
 1/2 

   
√ √
m − m
 √  (6.31)
m
 
 −2m 
 
m̃1/2 µ
~ 3 = µ31  √ 
 M 
 
√
m
1 Las trayectorias descritas en el espacio de configuración son rectilı́neas. ~
η1 corresponde a una lı́nea
infinita, describe una translación no acotada a lo largo del vector ~ µ1 . ~η2 y ~η3 describen oscilaciones
sobre segmentos rectos finitos a lo largo de los vectores ~µ2 y ~ µ3 respectivamente.
En vez de trabajar con estos vectores, es cómodo quedarse con los vectores (6.30),
pero cambiando la definición del producto escalar. Definiremos el producto escalar de
dos vectores ~
µ y ~ν ası́:
3
X
µ, ~ν ) = (m̃1/2 ~µ).(m̃1/2 ~ν ) = ~µ.(m̃~ν ) =
(~ mij µi νj (6.32)
i,j=1
Podemos ahora escoger las constantes arbitrarias µ11 , µ21 y µ31 de modo que los
vectores ~
µα formen una trı́ada ortonormal bajo el producto escalar (6.32), es decir,
normalizar los vectores a la unidad: (~µα , ~να ) = 1; α = 1, 2, 3. Este procedimiento nos
conduce inmediatamente a:
   
1 1
   
1   1  
µ1 = √
~  
1 ; ~µ2 = √  0 

2m + M   
2m  

1 −1
  (6.33)
1
 
1 
 −2m 
µ3 = r
~  
m  M 
2m(1 + 2 )  
M
1
La definición (6.32) se hace por comodidad matemática, pero nos aleja un poco
del sentido fı́sico original. La exigencia de ortonormalidad nos conduce a vectores que
no tienen dimensiones de desplazamiento y a soluciones que no dependen de las con-
diciones iniciales: contienen información sobre la relación de amplitudes pero no de su
valor absoluto. Por esto se les llama “modos normales de oscilación”. Se dice que los
movimientos longitudinales de la molécula triatómica lineal son no degenerados porque
las frecuencias de los tres modos normales son diferentes; en otras palabras, no hay dos
modos normales diferentes con la misma frecuencia.
La frecuencia w1 , que es nula, no corresponde a una oscilación. Esto es consistente
con la forma del vector propio correspondiente: las tres partı́culas se desplazan la misma
cantidad en todo momento, o sea que la molécula se traslada. En sentido estricto sólo
µ2,3 son modos normales de oscilación, de acuerdo con lo dicho anteriormente acerca de
~
que sólo hay dos coordenadas vibracionales longitudinales. En el modo ~µ2 la partı́cula 2
se queda quieta y las partı́culas 1 y 3 oscilan en contrafase. En el modo ~µ3 las partı́culas
1 y 3 oscilan en fase, pero la partı́cula 2 se desplaza respecto a 1 − 3 una cantidad que
depende de las masas y es en sentido opuesto. En el modo ~µ2 cada “resorte” actúa p inde-
pendientemente sobre una masa m; por esto la frecuencia correspondiente vale k/m.
Si se quiere indicar la magnitud de las oscilaciones es conveniente definir otras solu-
ciones, llamadas “coordenadas normales”, que, veremos, representan otro conjunto de
coordenadas generalizadas independientes para describir el estado del sistema y contie-
nen información sobre las condiciones iniciales.
Coordenadas normales para la molécula triatómica lineal. Las ecuaciones

de movimiento (6.13) son tres ecuaciones diferenciales de segundo orden acopladas. La
solución (6.18) fue obtenida por “tanteo”. Un método directo de solución consiste en
realizar una transformación de coordenadas donde las nuevas ecuaciones de movimiento
resulten desacopladas.
El lagrangiano (6.9) puede escribirse en forma compacta usando la notación ma-
tricial. Si ~η es un vector columna, ~η T es un vector fila:
1 ˙T ˙ 1 T
L= η − ~η k̃~
η m̃~
~ η (6.34)
2 2
L es una forma cuadrática no diagonal en η̇i y en ηi pues la matriz k̃ es no diagonal.
Esto conduce a que las ecuaciones de movimiento sean acopladas. Si se realiza una trans-
formación lineal de coordenadas que diagonalice a L, las correspondientes ecuaciones de
movimiento serán no acopladas, pues en ese caso L consta de una suma de términos
que dependen de sólo una de las coordenadas. Llamemos ~θ a las nuevas coordenadas
generalizadas y ÃT la matriz de la transformación:
η = ÃT ~
~ θ (6.35)
donde ÃT es la matriz transpuesta de Ã. En las nuevas variables L toma la forma:
1 ~˙ T ˙ 1 ~T
L= θ Ãm̃ÃT θ~ − θ Ãk̃ ÃT ~θ (6.36)
2 2
Ahora exigimos que Ã sea tal que m̃′ = Ãk̃ÃT y k̃ ′ = Ãm̃ÃT sean ambas diagona-
les, es decir, tales que m′ij = m′i δij y kij
′
= ki′ δij para i, j = 1, 2, 3 de modo que (6.36)
queda ası́:
3
1X ′ 2
L= (m θ̇ − kα′ θα2 ) (6.37)
2 α=1 α α
La ecuación de movimiento (6.37), será ahora:
m′α θ̇α2 − kα′ θα2 = 0 (6.38)
Las soluciones para las nuevas coordenadas, en función de las constantes de inte-
gración Cα y φα , serán:
s !
kα′
θα = Cα sen t + φα kα′ θα2 = 0; α = 1, 2, 3 (6.39)
m′α
De (6.35) y (6.39) se sigue que:

s !
X 3
kα′
ηi = Aαi Cα sen t + φα ; i = 1, 2, 3 (6.40)
α=1
m′α
Las coordenadas θα con α = 1, 2, 3, se llaman las coordenadas normales del sis-

tema. El problema matemático ahora consiste en hallar las nueve componentes de la
matriz Ã, que se obtienen resolviendo para las Aαi las ecuaciones que resultan de las
condiciones:
(Ãm̃ÃT )ij = m′i δij ; (Ãk̃ ÃT )ij = ki′ δij (6.41)
A partir de (6.16) y (6.17) vemos que ~ηi toma la forma:
3
X
ηi = Cα µαi sen(ωα + φα ) (6.42)
α=1
Las expresiones (6.40) y (6.42) coinciden si se cumple que:
kα′
Aαi = µαi y ωα2 = ; i, α = 1, 2, 3 (6.43)
m′α
Llegamos a la conclusión de que los vectores propios, o modos normales de oscila-
µα , son las filas de la matriz Ã, o sea las columnas de la matriz ÃT que realiza la
cion ~
transformación de ~η a θ~ según (6.35). Como los vectores ~µα son ortogonales y ortonor-
males según el producto escalar (6.32):
(µα , µβ ) = δαβ ; α, β = 1, 2, 3 (6.44)
Podemos escribir (6.44) también en la forma:
~ Tα m̃~µβ = δαβ ;
µ α, β = 1, 2, 3 (6.45)
Explı́citamente (6.45) es:
3
X
mij µαi µβj = δαβ ; α, β = 1, 2, 3 (6.46)
i,j=1
Notamos la identidad entre las filas de Ã y los vectores ~µTα , y por lo tanto podemos
escribir a (6.46) como:
Ãm̃ÃT = I˜ (6.47)
donde I˜ es la matriz unidad 3 × 3, o sea que m′i = 1 para i = 1, 2, 3. Entonces las
condiciones que nos definen las frecuencias ωα2 y la matriz Ã son de (6.41), (6.43) y
(6.47):
(Ãm̃ÃT )ij = δij ; (Ãk̃ ÃT )ij = ωi2 δij ; i, j = 1, 2, 3 (6.48)
T
Las columnas de Ã son los vectores ~µα y las ωα2
son los elementos diagonales de la
matriz k̃ ′ = Ãk̃ÃT . La ecuación (6.47) es la condición de que la matriz Ã sea ortogonal,
o sea que preserve el producto escalar (6.32) en una transformación de coordenadas
generalizadas. Explı́citamente la matriz ÃT es:
 −1/2 −1/2 
M 2m
 1 + 2m 1 1+
M 
 
 
 −1/2 −1/2 
1   
M 2m 2m 
ÃT = √  1+ 0 − 1+  (6.49)
2m   2m M 2M 

 
 −1/2 −1/2

 M 2m 
1+ −1 1+
2m M
y la matriz k̃ ′ es:
 
0 0 0
 
 
 k 
′  0 0 
k̃ =  m  (6.50)
 
 
 k 2m 
0 0 1+
m M
No es exacto que la coordenada normal correspondiente a ω1 = 0 sea de la forma

(6.39). En efecto, para esta frecuencia la ecuación de movimiento es:
θ̈1 = 0 (6.51)
cuya solución es:
θ1 = At + B (6.52)
donde A y B son constantes de integración, aunque podrı́a llegarse a (6.52) de (6.39)

mediante una expansión en serie de Maclaurin alrededor de ω1 = 0. Las otras dos
coordenadas normales son:
θα = Cα sen(ωα t + φα ) ; α = 2, 3 (6.53)
donde Cα y φα se determinan de las condiciones iniciales. Las ecuaciones (6.52) y (6.53)

nos permiten expresar los desplazamientos generales de las partı́culas, usando (6.35) y
(6.49):
 
1 
 rAt + B + C2 sen(ω2 t + φ2 ) + C3 sen(ω t + φ3 ) 
η1 = √  r 3 

2m M 2m
1+ 1+
2m M
 
1 
 rAt + B − 2m C3 sen(ω t + φ3 ) 
η2 = √  r 3 
 (6.54)
2m M M 2m
1+ 1+
2m M
 
1 
 rAt + B − C2 sen(ω2 t + φ2 ) + C3 sen(ω t + φ3 ) 
η3 = √  r 3 

2m M 2m
1+ 1+
2m M
Esto nos dice que el movimiento más general de las partı́culas consiste en una
traslación uniforme y en una superposición de oscilaciones de frecuencias ω2 y ω3 . La
oscilación de la partı́cula 2 es de frecuencia ω2 en tanto que las oscilaciones de las
partı́culas 1 y 3 se caracterizan por una diferencia de fase de π en la componente de

frecuencia ω2 .2
Las constantes A, B, C2 , C3 , φ2 y φ3 se pueden expresar en términos de los valores
en t = 0 de η1 , η2 , η3 , η̇1 , η̇2 y η̇3 a través de las fórmulas:
˙
~ η ; θ~ = Ãm̃~η ; ~θ = Ãm̃~η˙
θ = (AT )−1 ~ (6.55)
La matriz Ãm̃ explı́citamente es:
 −1/2 −1/2 
M M m −1/2
 m 1+ M 1+ m 1+ 
 2m 2m 2M 
 
1  

Ãm̃ = √  m 0 −m  (6.56)
2m 



 −1/2 −1/2 −1/2 
 2m 2m 2m 
m 1+ −2m 1+ m 1+
M M M
˙
En tanto que θ~ y θ~ en t = 0 son:
   
B A
   
  ˙  
θ~ =   ~ 
 C2 senφ2  θ =  ω2 C2 cos φ2

 (6.57)
   
C3 senφ3 ω3 C3 cos φ3
Los modos normales de oscilación no son entonces más que casos particulares de
la solución general (6.54) en que sólo contribuye una de las componentes normales.
Ası́ por ejemplo, el “modo 1” se obtiene haciendo C1 = C3 = 0. La transformación
a coordenadas normales puede interpretarse como la correspondencia con un sistema
equivalente que consiste en un conjunto de osciladores armónicos lineales no acoplados.
La descomposición en modos normales es muy útil en otras ramas de la fı́sica como
la teorı́a de campos, la cual tendremos ocasión de estudiar con un campo mecánico
unidimensional. Los modos normales para la molécula triatómica lineal en oscilaciones
longitudinales los podemos representar gráficamente (véase figura 6.2).
Generalización del formalismo anterior. Si se tiene un conjunto de osciladores
acoplados con pequeñas oscilaciones, de l grados de libertad oscilatorios, con frecuencias
no degeneradas, podemos fácilmente generalizar el anterior formalismo. No es difı́cil ver
que en general la matriz m̃ es simétrica, aunque no necesariamente diagonal. k̃ también
es simétrica. De esto se deducen importantes propiedades de los vectores propios y
frecuencias propias. Las matrices m̃ y k̃ son de dimensión l × l y los vectores del espacio
de configuración son de l componentes. La ecuación (6.19) puede escribirse en cualquiera
de las formas siguientes:
µα = ωα2 ~µα
(m̃−1 k̃)~ ó (m̃1/2 k̃m̃−1/2 )(m̃1/2 µ
~ α ) = ωα2 (m̃1/2 ~µα ) (6.58)
2 El vector η
~ con componentes (6.54) describe el movimiento de un punto del espacio de configuración.
En el plano formado por µ ~2 y ~µ3 , la proyección del movimiento da una figura de Lissajous. O sea que
la trayectoria de configuración se obtiene al desplazar dicha proyección a lo largo de ~
µ1 . Por ejemplo, si
m ≪ M , la trayectoria será una hélice elı́ptica alrededor de µ1 .
1 2 3
ω1 = 0 x
Traslación: η1 = η2 = η3
ns
√k
ω2 = x
m
Vibración simétrica: η1= –η3 , η2 = 0
√m ( 1 + M (
k 2m
ω3 = x
Vibración asimétrica: η1 = η3 , η2 = –2m/M η1
Figura 6.2 Modos normales para la molécula triatómica lineal en oscilaciones longitudinales
Con la primera forma podemos definir el producto escalar en términos del “tensor
métrico” de cierto espacio Riemanniano, mij :
l
X
~ ~η ) =
(ζ, mij ζi ηj (6.59)
i,j=1
La ecuación (6.58) tiene la forma de una ecuación de valores propios y vectores

propios de una matriz simétrica. En efecto, m̃−1 k̃ es el producto de matrices simétricas
que, según es fácil mostrar, da una matriz simétrica. Entonces se cumplen los siguien-
tes teoremas del algebra lineal: (a) los valores propios, ωα2 , de m̃−1 k̃ son reales y (b)
los vectores propios, ~µα , correspondientes a valores propios diferentes son ortogonales y
linealmente independientes. La ecuación correspondiente a la (6.16) representa la expan-
sión de un estado arbitrario de oscilación en un conjunto completo de vectores propios
de la matriz m̃−1 k̃. La prueba de la ortogonalidad de los vectores propios es simple.
Escribamos las ecuaciones de valores propios para ωα2 y ωβ2 :
µα = ωα2 ~
(m̃−1 k̃)~ µα ; (m̃−1 k̃)~µβ = ωβ2 ~µβ (6.60)
Tomemos el producto escalar de la primera por ~µβ y de la segunda por µ

~ α:
µβ , m−1 k̃~
(~ µα ) = ωα2 (~
µβ , ~µα )
(6.61)
(m−1 k̃~ µα ) = ωβ2 (~
µβ , ~ µβ , ~µα )
Como m̃−1 k̃ es simétrica, los lados izquierdos en (6.61) son iguales. En efecto:
l
X l
X
µβ , m̃−1 k̃~
(~ µα ) = µβi mij krs µαs (m̃)−1
jr
i,j=1 r,s=1
l
X l
X
= µβr krs µαs = krs µβr µαs
r,s=1 r,s=1
(6.62)
l
X l
X
(m̃−1 k̃~
µβ , ~
µα ) = (m̃)−1
ir krs µβs mij µαj
i,j=r r,s=1
l
X l
X
= krs µβs µαr = ksr µβr µαs
r,s=1 r,s=1
Entonces se sigue que:
(ωα2 − ωβ2 )(~

µβ , ~µα ) = 0 (6.63)
Si ωα2 6= ωβ2 entonces ~µα y ~µβ son ortogonales. Si α = β, (~µα , ~µα ) tiene algún valor
que tomamos igual a 1, entonces,
(~
µα , ~
µβ ) = δα,β α , β = 1, 2, l (6.64)
Ahora, si definimos con las componentes de las µα una matriz Ã de dimensión l × l:
Aαi = µαi ; α, i = 1, 2, ...l (6.65)
Entonces la ecuación (6.64) no es más que la condición de ortogonalidad de Ã en

el espacio riemanniano de configuración:
Ãm̃ÃT = I˜ (6.66)
La ortogonalidad ordinaria de una matriz es ÃÃT o Ã−1 = ÃT . La ecuación de

µα = ωα2 m̃~
valores propios k̃~ µα puede escribirse en términos de la matriz diagonal ω̃, con
elementos ωα , ωαβ = ωα2 δαβ de la siguiente forma:
2
Ãk̃ = ω̃Ãm̃ (6.67)
Si multiplicamos por ÃT y usamos la ortogonalidad de Ã, (6.67) toma la forma:
Ãk̃ ÃT = ω̃ (6.68)
vemos que la matriz Ã realiza sobre k̃ una transformación que la diagonaliza, siendo las
frecuencias propias los elementos diagonales. Las expresiones (6.66) y (6.68) nos dicen
que Ã diagonaliza simultáneamente a m̃ y a k̃. m̃ es el tensor métrico en el espacio de
configuración. Podemos entonces interpretar a Ã como la matriz de una transformación
lineal en el espacio de configuración que nos hace pasar de unos ejes oblicuos, ηi , (con m̃
no diagonal; el producto escalar, en particular el lagrangiano, contiene productos cruza-

dos de las componentes de los vectores) a unos ejes cartesianos ortogonales, θα (m̃ = I, ˜
de ahı́ que el lagrangiano en coordenadas normales tenga términos independientes entre
sı́). Estos nuevos ejes son los ejes principales de k̃ porque mediante Ã, k̃ se transforma
en ω̃ que es diagonal.
Las coordenadas normales son un sistema de “ejes principales” en el espacio de
configuración donde m̃ y k̃ son ambas diagonales.3 Esto tiene como consecuencia que las
ecuaciones de movimiento de las coordenadas normales sean desacopladas: θ̈α +ωα2 θα = 0;
α = 1, 2, ...l.

degenerado
Las oscilaciones transversales de la molécula del tipo “CO2 ” no se pueden conside-
rar con un modelo de “resortes”, pues con tal modelo estas oscilaciones son intrı́nseca-
mente no lineales. La demostración de esto se propone como ejercicio. Como el potencial
tiene un mı́nimo en la posición de equilibrio aun para desplazamientos transversales, es
válida una aproximación por un potencial parabólico, aunque la constante k no será la
misma que en las oscilaciones longitudinales. Otro aspecto de las oscilaciones transver-
sales es la degeneración de los modos normales que a continuación analizamos cualitati-
vamente.
Para especificar completamente la molécula, constituida a partir de tres partı́culas
puntuales, se requieren nueve coordenadas. Hay un grado de libertad correspondiente a
traslaciones a lo largo de la molécula (el modo ~µ1 analizado anteriormente) y dos grados
de libertad traslacionales en direcciones perpendiculares al eje de la molécula. Además,
para una posición dada del centro de masa, hay dos rotaciones alrededor de él, pues
no tiene sentido una rotación alrededor del eje de la molécula. En total, pues, hay tres
grados de libertad traslacionales y dos rotacionales, quedando cuatro grados de libertad
vibracionales (dos longitudinales y dos transversales).
La simetrı́a de rotación alrededor de la molécula implica que la constante k es la
misma para cualquier desplazamiento transversal y como hay dos modos de oscilación
transversales, éstos tendrán la misma frecuencia, es decir, la frecuencia de las oscilaciones
transversales es degenerada. Los dos modos los podemos llamar modo “z” y modo “y”,
como se representan en la figura 6.3.
y y
x x
z Modo y z Modo z
Figura 6.3 Modos de oscilación transversales.
3 En efecto, las filas de Ã determinan los vectores unitarios de los “ejes principales”, o sea los ~
µα .
Un movimiento transversal arbitrario será una combinación de los modos “y” y

“z”. Si las dos oscilaciones están en fase, el movimiento será lineal; si no, el movimiento
será elı́ptico. Si la diferencia de fase es de 900 las partı́culas se moverán en trayectorias
circulares, como se ve en la figura 6.4.
Al aplicar el formalismo general al problema completo de la molécula del tipo
“CO2 ”, se encuentra una ecuación secular de grado nueve en ω 2 pero a priori espera-
mos que los cinco grados de libertad no vibracionales den lugar a modos normales con
frecuencia ω 2 = 0, que los dos grados de libertad oscilatorios longitudinales tengan dos
frecuencias diferentes, y que los dos grados de libertad oscilatorios transversales den
lugar a modos normales con frecuencia doble. Es decir, el problema completo tedrá una
frecuencia quı́ntuple nula, dos frecuencias simples y una frecuencia doble; en total cuatro
raı́ces diferentes.
y En fase: oscilaciones lineales y En desfase: rotaciones
x x
z z
Figura 6.4 Modos normales de oscilación: dos frecuencias simples y una frecuancia doble.
La molécula triatómica lineal. Oscilaciones longitudinales y transversa-

les. Consideraremos sólo el problema de hallar los modos normales de oscilación, ya que
los modos traslacionales y rotacionales permiten un tratamiento trivial. Las coordena-
das vibracionales se llaman coordenadas internas. Si imponemos la condición de que el
centro de masa esté fijo y no haya rotaciones netas de la molécula, quedarán solamente
las coordenadas internas. El cálculo lo realizaremos en tres dimensiones. ~ri es el vector
de posición de la partı́cula i = 1, 2, 3 y ~ri0 el de la posición de equilibrio. La separación
de la posición de equilibrio es para la partı́cula i es:
d~i = ~ri − ~ri0 ; i = 1, 2, 3 (6.69)
d~i y ~ri son vectores ordinarios tridimensionales; no son vectores del espacio de configu-
ración. La coordenada del centro de masa es R ~ y la consideraremos fija, es decir:
R ~ 0 = m~r10 + M~r20 + m~r30

~ = m~r1 + M~r2 + m~r3 = R (6.70)
2m + M 2m + M
Se sigue entonces que las componentes de los d~i no son independientes sino que
están sometidos a las condiciones:
md~1 + M d~2 + md~3 = 0 (6.71)
La condición sobre la no rotación de la molécula alrededor del centro de masa es
que el momento angular total sea cero:
~ = m~r1 × ~r˙ 1 + M~r2 × ~r˙ 2 + m~r3 × ~r˙ 3
L
(6.72)
˙ ˙ ˙
= m(~r10 + d~1 ) × d~1 + M (~r20 + d~2 ) × d~2 + m(~r30 + d~3 ) × d~3 = 0
Las coordenadas de la posición de equilibrio son, tomando el origen de coordenadas

en la posición de la partı́cula 2: ~r10 = −bî; ~r20 = 0; ~r30 = bî. Por lo tanto la ecuación
(6.72) es:
~ = mbî × (d~˙ 3 − d~˙ 1 ) + m(d~1 × d~˙ 1 + d~3 × d~˙ 3 ) + M d~2 × d~˙ 2 = 0

L (6.73)
para pequeñas oscilaciones se cumple que di ≪ b, lo cual nos permite escribir en vez de
(6.73):
˙ ˙
î × (d~3 − d~1 ) = 0 (6.74)
o más explı́citamente:
d˙3y = d˙1y ; d˙3z = d˙1z (6.75)
Integrando (6.75) obtenemos: d3y = d1y + Constante; d3z = d1z + Constante; las
constantes deben anularse porque estas ecuaciones se deben cumplir aun en la posición
de equilibrio:
d3y = d1y ; d3z = d1z (6.76)
La condición (6.71) vale también para las velocidades, de donde:

m ˙ m ˙ ˙
d~2 = − (d~1 + d~3 ) ; d~2 = − (d~1 + d~3 ) (6.77)
M M
En conclusión, existen las siguientes cinco relaciones entre los nueve desplazamien-
tos, lo cual nos deja con 9 − 5 = 4 grados de libertad internos:
d1y = d3y ; d1z = d3z
2m 2m
d2y = − d1y ; d2z = − d1z (6.78)
M M
m
d2x = − (d1x + d3x )
M
Existen además cinco relaciones similares a (6.78) para las velocidades de los des-
plazamientos. Tomaremos como coordenadas generalizadas independientes vibracionales
a d1x , d3x , d1y , d1z , y las llamaremos η1 , η2 , η3 y η4 :
η1 = d1x , η2 = d3x , η3 = d1y , η4 = d1z (6.79)
Los otros cinco desplazamientos pueden expresarse en términos de los desplaza-

mientos internos por medio de las relaciones (6.78).
El espacio de configuración del sistema completo es 9-dimensional. El subespa-
cio correspondiente a las oscilaciones puras es 4-dimensional. El vector del espacio de
configuración que describe los movimientos de la molécula en que el centro de masa
permanece fijo y no hay rotación de la misma es ~η . También:
η~T = (η1 , η2 , η3 , η4 ) (6.80)

Ahora debemos expresar el lagrangiano en función de ~η y ~η˙ . La energı́a cinética es:

2
1 ˙ ˙2 1 ˙2
T = ~ ~
m d1 + d3 + M d~2
2 2
(6.81)
1 ˙2 m2 2
˙2 2 ˙2 ˙
~ ˙2
~ ˙ ~˙
~
= m d1x + d3x + 2ḋ1y + 2d1z + d1 + d3 + 2d1 · d3
2 2M
Si usamos (6.78) y (6.79) para expresar todos los d~i en función de los η̇ν , ν =
1, 2, 3, 4 obtenemos para T (~η˙ ):

1 m 2 2m m2
T = m 1+ η̇1 + η̇22 + m 1 + η̇32 + η̇42 + η̇1 η̇2 (6.82)
2 M M M
puede escribirse ası́ con notación matricial:
1 ˙T ˙
T = η m̃~
~ η (6.83)
2
o usando la notación de producto escalar:
1 ˙ ˙
T = (~
η , ~η ) (6.84)
2
donde m̃ es la matriz simétrica no diagonal siguiente:
 
m m2
 m 1 + 0 0 
 M M 
 
 
 m2 m 
 m 1+ 0 0 
 M M 
 
m̃ =   (6.85)
 2m 
 0 0 2m 1 + 0 
 M 
 
 
 
 2m 
0 0 0 2m 1 +
M
En el cálculo de la energı́a potencial vamos a considerar un modelo más realista.
Llamaremos k la constante de fuerza para los desplazamientos longitudinales rela-
tivos a la partı́cula 2; k ′ la constante de fuerza para los desplazamientos longitudinales
de la partı́cula 1 relativos a la partı́cula 3, y a K a la constante de fuerza para los des-
plazamientos transversales. La constante K no se puede expresar en función de k y k ′
mediante un modelo de resortes. La energı́a potencial de interacción entre las partı́culas
para pequeñas oscilaciones es:
1 1
V = k (d1x − d2x )2 + (d3x − d2x )2 + k ′ (d1x − d3x )2
2 2
1 (6.86)
+ K (d1y − d2y )2 + (d3y − d2y )2
2

+(d1z − d2z )2 + (d3z − d2z )2
Si usamos a (6.78) y (6.79) para expresar todos los d~i en función de los ην , ν =
1, 2, 3, 4 obtenemos para V (~
η ):

1 2m2 2m
V = k 1+ + + k (η12 + η22 )
′
2 M2 M
1h m m i
+ 4k 1+ − 2k ′ η1 η2 (6.87)
2 M M
" 2 #
1 2m
+ 2K 1 + (η32 + η42 )
2 M
En notación matricial V puede escribirse ası́:

1 T
V = η k̃~η
~ (6.88)
2
o usando la notación de producto escalar:
1
V = η , m̃−1 k̃~η )
(~ (6.89)
2
donde k̃ es la siguiente matriz simétrica no diagonal 4 × 4:
 
2m 2m2 ′ m m
 k(1+ M + M 2 )+k 2k (1+ )−k ′ 0 0 
 M M 
 
 
 m m 2m 2m2 
 2k (1+ )−k ′ k(1+ + 2 )+k ′ 0 0 
 M M M M 

k̃ =   (6.90)

 2m 2 
 0 0 2K(1+ ) 0 
 M 
 
 
 2m 2 
0 0 0 2K(1+ )
M
El lagrangiano será:
1 ˙ ˙ 1
L= (~ η , m̃−1 k̃~
η , ~η ) − (~ η) (6.91)
2 2
La ecuación de movimiento para ~η es:
η¨ + k̃~η¨ = 0
m̃~ (6.92)
Buscamos soluciones propias de la forma:
ηα = ~
~ µα sen(ωα t + φα ); α = 1, 2, 3, 4 (6.93)
Al reemplazar (6.93) en (6.92) obtenemos:
µα = ~0
(m̃ωα2 − k̃)~ (6.94)
La ecuación (6.94) admite soluciones no triviales para los ~µα sólo si las ωα son
tales que satisfacen la ecuación secular:
det(m̃ωα2 − k̃) = 0 ; α = 1, 2, 3, 4 (6.95)
Si usamos la siguiente notación (Classical mechanics, Corben-Stehle, capı́tulo 8):
2
2m m
α = 2K 1 + ; α′ = 2m 1 +
M M
(6.96)
2m m2 m
β= + 2 2; β′ =
M M M
Podemos escribir:
m̃ω 2 − k̃ =
 
m(1+β ′ )ω 2 −k(1+β)−k ′ mβ ′ ω 2 −kβ +k ′ 0 0
 
 
 ′ 2
mβ ω −kβ +k ′ ′ 2
m(1 +β )ω −k(1+β)−k ′
0 0  (6.97)
 
 
 
 0 0 α′ ω 2 − α 0 
 
 
0 0 0 α′ ω 2 −α
Usando la regla para el cálculo del determinante de una matriz M̃ :

n
X
detM̃ = Mij Cij (6.98)
i=1
donde Cij es el determinante de la matriz de los cofactores del elemento Mij :

Cij = (−1)i+j Dij (6.99)
donde Dij es el determinante menor complementario del elemento, entonces la ecuación
secular es:
n 2 2 o
m(1 + β ′ )ω 2 − k(1 + β) − k ′ − mβ ′ ω 2 − kβ + k ′
(α′ ω 2 − α)2 = 0 (6.100)
Entonces el determinante consta de tres factores, dos de ellos lineales en ω 2 y uno
cuadrático en ω 2 . Hay dos raı́ces dobles que son:

α K 2m
ω32 = ω42 = ′ = 1+ (6.101)
α m M
Las otras dos raı́ces son:

k + 2k ′ k 2m
ω12 = ; ω22 = 1+ (6.102)
m m M
ω1 y ω2 coinciden con las halladas cuando consideramos las oscilaciones longitu-

dinales por separado, cuando k ′ = 0. La ecuación de valores propios (6.94) es de la
forma:
    
Aα Bα 0 0 µα1 0
    
    
 Bα Aα 0 0     
   µα2   0 
  =  (6.103)
    
 0 0 C 0   µα3   0 
 α    
    
0 0 0 Cα µα4 0
Los valores de las Aα , Bα y Cα son:

2m ′ m m
A1 = 1+ k −k ; A2 = − k ′ − k
M M M

m 2m 2m 2m2
A3 = K 1+ 1+ −k 1+ + − k′
M M M M2

2m ′ 2m
C1 = 2 1+ k + 2k − K 1 +
M M
(6.104)
2
2m
C2 = 2 1+ (k − K) ; C3 = 0
M

2m ′ m m
B1 = 1+ k −k ; B2 = −k ′ − k
M M M

m 2m m m
B3 = K 1+ − 2k 1+ + k′
M M M M
La ecuación (6.103) da lugar a los cuatro siguientes sistemas de ecuaciones alge-
braicas:
Aα µα1 + Bα µα2 = 0 ; Bα µα1 + Aα µα2 = 0
(6.105)
Cα µα3 = 0 ; Cα µα4 = 0 ; α = 1, 2, 3, 4
Las primeras ecuaciones (6.105), dado que Aα y Bα no son cero, son:
Aα µα2 µα1
=− =− ⇒ µα1 = ±µα2 (6.106)
Bα µα1 µα2
Como se cumple que:
A1 = B1 ; A2 = −B2 y A3 6= ±B3 (6.107)
Entonces µα2 y µα1 deben necesariamente tener las relaciones:
µ11 = −µ12 ; µ21 = µ22 ; µ31 = µ41 = µ32 = µ42 = 0 (6.108)
Como C1 y C2 no son cero, en tanto que C3 es cero, se cumple:

µ13 = µ23 = µ14 = µ24 = 0
(6.109)
µ33 , µ43 , µ34 , µ44 : Arbitrarias
Tenemos en este problema seis cantidades indeterminadas. O sea que aquı́ no hay
simplemente una indeterminación por un factor arbitrario en los vectores ~µ3 y ~µ4 . Los
vectores propios para este problema son de la forma siguiente:
   
1 1
 −1   1 
µ1 = µ11 
~  
 0  ; ~µ2 = µ21  0 

0 0
    (6.110)
0 0
 0   0 
   
µ3 = µ33 
~ 1 ; µ
~ 4 = µ43  1 
 µ34   µ44 
µ33 µ43
Como en las ecuaciones (6.30), µ11 , µ21 , µ33 y µ43 pueden definirse por la condición
de normalización, sin embargo µ43 y µ44 quedan aún indeterminadas. Hay un número
infinito de vectores propios normalizados correspondientes a la frecuencia propia dege-
nerada ω3 = ω4 . La condición de normalización es:
~ Tα m̃~µα = 1 ; α = 1, 2, 3, 4
µ (6.111)
donde m̃ es la matriz (6.85). Esto nos conduce a los siguientes valores para µ11 , µ21 , µ33
y µ43 :
1 1
µ11 = √ ; µ21 = s
2m 2m
2m 1 +
M
v (6.112)
u 1
µα3 =u
u − µ2α4 ; α = 3, 4
t 2m
2m 1 +
M
Debido a que µ34 y µ44 son arbitrarios, µ ~ 3 y ~µ4 son linealmente independientes.
~3 y µ
µ ~ 4 generan entonces un espacio de dimensión dos, siendo cualquier vector de este
espacio un vector propio correspondiente al valor propio ω3 = ω4 . Podemos decir que a la
frecuencia propia doblemente degenerada, ω3 = ω4 , le corresponde un conjunto infinito
de vectores propios normalizados en un espacio bidimensional. Cualquier par de vectores
linealmente independientes genera el espacio; por esto podemos sin perder generalidad
escoger los vectores ~
µ3 y ~µ4 de modo que sean ortogonales entre sı́, bajo el producto
escalar (6.59):
µ33 µ43 + µ34 µ44 = 0 (6.113)
Como definimos a µ33 y µ43 positivos en (6.113), entonces µ34 y µ44 deben tener
signos opuestos; (6.112) y (6.113) conducen a:
1
µ234 + µ244 = (6.114)
2m
2m 1 +
M
Todavı́a los vectores no están bien definidos pues aún hay infinitos pares de vectores
ortonormales en el mencionado espacio bidimensional. ~µT3 y ~µT4 pueden escribirse en la
forma:
1
~ T3
µ = r (0, 0, cos δ, senδ)
2m
2m(1 + )
M
1
~ T4
µ = r (0, 0, senδ, − cos δ) (6.115)
2m
2m(1 + )
M
donde δ está comprendido entre 0 y π/2 de acuerdo con la elección del signo de µ33 y
µ43 .
Los vectores ~
µ3 y µ
~ 4 generan todas las posibles oscilaciones transversales con la
frecuencia degenerada ω3 = ω4 . Los modos normales de oscilación transversales son:
η~3T = µ
~ T3 sen(ω3 t + φ3 ) → (0, 0, d1y , d1z )
(6.116)
η~4T = η~4T sen(ω3 t + φ4 )
Vemos que δ es esencialmente el ángulo de los vectores de desplazamientos en el

plano y − z donde las oscilaciones normales tienen diferencia de fase arbitraria.
d1
(Modo µ3)
δ
y
d1 (Modo µ4)
Figura 6.5 Modos de oscilación transversales en el espacio de configuración

Podemos tomar δ = 0, con lo cual ~µ3 corresponde a las oscilaciones en “y” y ~µ4 a
las oscilaciones en “z”. Una oscilación transversal general será de la forma:
~η = C3 ~
η3 + C4 ~η4 (6.117)
Sin perder generalidad η~T puede escribirse en la forma:
~η T = C [0, 0, senγ sen(ω3 t + φ3 ), cos γ sen(ω3 t + φ4 )] (6.118)
φ3 y φ4 son arbitrarias. Si tomamos φ3 = φ4 obtenemos oscilaciones longitudinales en
una dirección que hace un ángulo γ con el eje z. Si tomamos φ3 = 0 y φ4 = π/2, el
movimiento será una circunferencia y en general será una elipse, donde γ será la dirección
del eje mayor de la elipse.
Recordando las fórmulas (6.78),
2m 2m
d2y = − d1y ; d2z = − d1z
M M (6.119)
d3y = d1y ; d3z = d1z
Vemos que el desplazamiento del átomo central es siempre contrario al de los
laterales. En general, el átomo central gira en sentido contrario a los laterales, en una
trayectoria elı́ptica, con una amplitud tal que el momento angular es cero. El movimiento
transversal general es pues una rotación de cada átomo. Véase figuras 6.3 y 6.4. Si
quisiéramos describir las nueve coordenadas del sistema, deberı́amos usar vectores 9-
dimensionales y matrices 9 × 9. Ası́ por ejemplo, en vez de ~µ3 y µ
~ 4 tendrı́amos, usando
las fórmulas (6.78):
1 2m
~eT3 = s (0, 1, 0; 0, − M , 0; 0, 1, 0)
2m
2m 1 +
M
(6.120)
1 2m
~eT4 = s (0, 0, 1; 0, 0, − M ; 0, 0, 1)
2m
2m 1 +
M
En el tratamiento completo aparecerán además los cinco vectores propios de fre-

cuencia cero correspondientes a las tres traslaciones y las dos rotaciones. La degeneración
puede ser removida por ejemplo introduciendo algún efecto que rompe la simetrı́a de ro-
tación de la interacción alrededor del eje de la molécula (de la cual se derivó que K no
depende de la dirección del desplazamiento). Si existiera algún efecto direccional (como
una interacción entre espines), ya no habrı́a la simetrı́a rotacional en la interacción y
desaparecerı́a la degeneración.
Este tema es susceptible de un estudio más completo usando la teorı́a de grupos
de simetrı́as. Los vectores propios constituyen representaciones del grupo de simetrı́as.
El subespacio generado por ~µ3 y µ ~ 4 es una representación irreductible bidimensional del
grupo de simetrı́as (rotaciones alrededor del eje de la molécula). En otros sistemas de
osciladores acoplados las ligaduras pueden dar lugar a cambio de frecuencia y a supresión
de la degeneración.
Tratamiento usando el método de diagonalización. Buscaremos una matriz

que diagonalice simultáneamente a m̃ y a k̃, de acuerdo con las fórmulas (6.66) y (6.68).
Tanto m̃ como k̃ son diagonales en bloques de matrices 2 × 2; es razonable suponer que
Ã sea de la misma forma:
 
D E 0 0
 
 
 F G 0 0 
 
Ã = 


 (6.121)
 0 0 H K 
 
 
0 0 L J
Llamaremos A, B y C a los elementos de la matriz m̃ o de la matriz k̃. Se requiere

entonces que mediante el siguiente producto se obtenga una matriz diagonal, con unos
en la diagonal si A, B y C son los elementos de m̃, y con las ω 2 si son los elementos de
k̃:
   
D E 0 0 A B 0 0 D F 0 0
   
   
 F G 0 0  B A 0 0  E G 0 0 
   
   
   
 0 0 H K  0 0 C 0  0 0 H L 
   
   
0 0 L J 0 0 0 C 0 0 K J
  (6.122)
d e 0 0
 
 
 f g 0 0 
 
=


 0 0 h l 
 
 
0 0 k j
donde hemos llamado las variables d = A(E 2 +D2 )+2BDE, e = A(AD+EG)+B(DG+

EF ), f = A(F D + EG) + B(EF + GD), g = A(F 2 + G2 ) + 2BF G, h = C(H 2 + K 2 ),
l = C(HL + JK), k = C(HL + JK) y j = C(J 2 + L2 ).
Asumimos que los elementos de Ã no dependen de las constantes k, k ′ y K en-
tonces, como los elementos de la matriz k̃ son combinaciones de las constantes, Ãk̃ÃT
será diagonal sólo si:
DF + EG = 0 ; DG + EF = 0 ; HL + JK = 0 (6.123)
Esto implica las relaciones siguientes entre los elementos de A:
G = F , D = −E o G = −F , D = E (6.124)
˜ Por
Cuando A, B y C son los elementos de m̃, entonces (6.122) debe ser igual a I.
tanto se cumple, usando las relaciones de la izquierda en (6.124), que:
2D2 A − 2BD2 = 1 ; 2F 2 A + 2F 2 B = 1
(6.125)
C(H 2 + K 2 ) = C(J 2 + L2 ) = 1
Recordando la expresión para A y B en m̃, ecuación (6.85), obtenemos para D y
F:
1 1
D=√ = −E ; F = s =G (6.126)
2m 2m
2m 1 +
M
En (6.126) por convención tomamos las raı́ces cuadradas positivas. Por otra parte,
para H, K, L, J, obtenemos las relaciones:
K = L , H = −J o K = −L , H = J (6.127)
Como hay sólo tres ecuaciones para determinar las cuatro incógnitas H, K, J, L,
podemos asignar el valor a una de ellas arbitrariamente. Sea que:
cos δ π
H=s ; ≤δ≤ 2 (6.128)
2m
2m 1 +
M
Con ello obtenemos las siguientes expresiones para J, K, L:

sen δ
J = −H ; K = s =L (6.129)
2m
2m 1 +
M
Entonces la matriz Ã tiene la siguente expresión explı́cita:

 r r 
2m 2m
 1+ M 1+
M
0 0 
 
 
 
1  1 1 0 0 
Ã = r   (6.130)
2m  


2m(1 + ) 0 0 cos δ senδ 
M  
 
0 0 senδ cosδ
Vemos que las filas de Ã coinciden con los vectores propios ~µα hallados anterior-
mente. Cuando tomamos como A, B y C los elementos de k̃ de la ecuación (6.96),
encontramos:
A(E 2 + D) + 2BDE = ω12 ; A(F 2 + G2 ) + 2BF G = ω22
(6.131)
C(H 2 + K 2 ) = C(J 2 + L2 ) = ω32
donde ω12 , ω22 y ω32 están dados en las ecuaciones (6.101) y (6.102). En este problema
el procedimiento de diagonalización se simplificó debido a la forma de m̃ y k̃ que nos
permitió partir de la forma (6.121) para la matriz Ã. Para sistemas más complicados no es
tan simple la elección de la forma de Ã. A pesar de esto, muchas veces la ecuación secular
resulta mucho más complicada, por requerir primero la evaluación de un determinante y
luego el cálculo de las raı́ces de una ecuación algebraica de grado l. En estos casos, donde
l es grande y m̃ y k̃ complicadas, es más conveniente el método de la diagonalización,
que se realiza usualmente en forma numérica, por ejemplo mediante el método numérico
de diagonalización de Jacobi.
Ejemplo 6.2.1 Una partı́cula se mueve en presencia de un potencial central de la forma:
A
V (r) = − (6.132)
rn−1
suponiendo que la órbita es circular, hallar los valores de n para los cuales hay pequeñas
oscilaciones estables.
Este es un ejemplo de pequeñas oscilaciones alrededor de un movimiento estable.
Se entiende por estabilidad el hecho de tender al estado de equilibrio al ser sometido el
sistema a una distorsión. En fuerzas centrales la órbita es plana, con lo cual podemos
describir la partı́cula con las coordenadas polares r, θ. El lagrangiano es:
1 A
L= m(ṙ2 + r2 θ̇) + n−1 (6.133)
2 r
Las ecuaciones de movimiento de Lagrange son:
mr̈ − mrθ̇2 + (n − 1)Ar−n = 0

(6.134)
mr2 θ̈ + 2mrṙ θ̇ = 0
El movimiento de “equilibrio” es circular uniforme, o sea que son constantes:
r = r0 y θ̇ = ω0 (6.135)
Si se hacen pequeñas alteraciones a este movimiento estable, ρ al radio y φ̇ a la

velocidad angular, habrá oscilaciones si el movimiento es estable,
r = r0 + ρ y θ̇ = ω0 + φ̇ (6.136)
En el movimiento de equilibrio se cumple que:
mr0 ω02 = (n − 1)Ar0−n (6.137)
Entonces las ecuaciones de movimiento para los pequeños desplazamientos ρ y φ̇,

al primer orden en los mismos, son:
mρ̈ − mω02 ρ − 2mr0 ω0 φ̇ − n(n − 1)Ar0−n−1 ρ = 0

(6.138)
mr02 φ̈ + 2mr0 ω0 ρ̇ = 0
estas son ecuaciones lineales acopladas para ρ y φ̇. Buscamos ahora los “modos normales
de oscilación” de ρ y φ̇:
ρ = ρ0 sen(ωt + α) ; φ̇ = φ̇0 sen(ωt + α) (6.139)
donde ω es la frecuencia propia del modo normal (esperamos que haya dos frecuencias),
y α la fase, como en la ecuación (6.93). ρ0 y φ̇0 son las componentes de los vectores
propios ~
µ, que satisfacen las ecuaciones algebraicas:
 
−m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 −2mω0 ωr0
 
2mω0 ωr0 mr02 ω
   
ρ0 0
× =  (6.140)
φ̇0 0
El sistema (6.140) tiene soluciones no triviales sólo si:
mωr02 [−m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 + 4mω02 ω] = 0 (6.141)
Las raı́ces de (6.141) son:
ω2 = 0 y ω 2 = (3 − n)ω02 (6.142)
La segunda raı́z si n < 3 conduce a una ω real, y si n > 3 es imaginaria. Si n=3

el movimiento es degenerado con dos raı́ces ω = 0. El movimiento será, pues, estable
solamente si n < 3. Para una órbita de Kepler, por ejemplo n = 2. Entonces:
ω02 = ω 2 (6.143)
ω0 es la frecuencia de rotación de la partı́cula. ω es la frecuencia de las oscilaciones en

el radio de la órbita y en la velocidad angular que coinciden con ω0 .
Para un potencial central armónico, V = Ar2 , n = −1, entonces:
ω = 2ω0 (6.144)
La frecuencia ω 2 = 0 corresponde a un desplazamiento de una órbita circular a

otra, o sea, a otro movimiento estable; no hay oscilaciones sino simplemente un cambio
constante en el radio de la órbita y en la velocidad angular. Hay una forma simple de
calcular directamente la frecuencia de las pequeñas oscilaciones.
La partı́cula se mueve radialmente dentro un “pozo” que consta del potencial
centrı́fugo y el potencial externo:
A 1 A l2
Vef (r) = − + mr2 θ̇2 = − n−1 + (6.145)
rn−1 2 r 2mr2
En el movimiento estable el potencial tiene un mı́nimo. Para pequeños desplaza-
mientos del movimiento estable, el “pozo” de potencial puede aproximarse a un pozo
parábolico. El problema consiste en determinar para qué valores de n es posible la for-

mación del potencial parábolico. Vef (r) puede expandirse alrededor de r0 para pequeños
desplazamientos:

dVef (r) 1 d2 Vef (r)
Vef (r) ≈ Vef (r0 ) + ρ + ρ2 =
dr r=r0 2 dr2 r=r0
(6.146)
1 2
Vef (r0 ) + kρ
2
donde el término lineal en ρ se anula en el equilibrio y k es la “constante de resorte”:

d2 Vef (r)
k= (6.147)
dr2 r=r0
La frecuencia de las pequeñas oscilaciones en r será:

2 1 d2 Vef (r)
ω = (6.148)
m dr2 r=r0
Efectuando las operaciones indicadas en (6.148), usando la relación (6.137) que se

cumple en la posición de equilibrio, y notando que la magnitud del momento angular es
l = mω0 r02 , llegamos finalmente al resultado ω 2 = (3 − n)ω02 , que nos da directamente
la frecuencia de las pequeñas oscilaciones alrededor de la órbita circular estable.
6.3. Un campo mecánico unidimensional:

la cuerda uniforme
Primero estudiaremos el sistema de n partı́culas de masa m unidas entre sı́ por
cuerdas elásticas sin masa. La cuerda uniforme se obtendrá del problema anterior co-
mo un caso lı́mite en que las masas se distribuyen uniformemente formando un continuo.
La cuerda estirada sin masa con un conjunto discreto de masas. Sea

una cuerda de longitud L a la cual se adhieren n masas iguales equidistantemente. La
cuerda está estirada y fija en sus extremos. Estudiaremos las oscilaciones transversales.
La longitud de cada segmento de cuerda en la posición de equilibrio es d = xi − xi−1 ;
i = 1, 2, ...n + 1. Entonces L = (n + 1)d.
Para los desplazamientos longitudinales, la energı́a potencial resulta de la elas-
ticidad de la cuerda k. Para los desplazamientos transversales, la contribución de la
elasticidad de la cuerda es de cuarto orden en la elongación, la demostración se propone
como un ejercicio; ası́ que la contribución cuadrática viene directamente de la tensión
de la cuerda τ . La tensión es independiente de los desplazamientos transversales si estos
son infinitesimales. El trabajo realizado para estirar un segmento es igual a la tensión
(constante) por la elongación. De modo que la energı́a potencial del segmento i cuando
la partı́cula i − 1 se desplaza transversalmente ηi−1 , y la partı́cula i en ηi , es:
hp i
Vi = τ d2 + (ηi − ηi−1 )2 − d (6.149)
η1 ηi + 1 ηn
η2 ηi – 1 ηi ηi + 1 ηn – 1 x
x1 x2 xi – 1 xi xi + 1 xi + 2 xn – 1 xn xn – 1
x0 = 0 d = L
Figura 6.6 Cuerda estirada sin masa con un conjunto discreto de masas
de modo que para pequeños desplazamientos la energı́a potencial total es:

n+1
1τ X
V = (ηi − ηi−1 )2 (6.150)
2d
i=1
El espacio de configuración es n-dimensional y las matrices m̃ y k̃ son de dimensión

n × n. En notación matricial:
1
V = ~η T k~η (6.151)
2
donde η~T = (η1 , η2 , ...ηn ) y la matriz k̃ es:
 
2 −1 0 0 ··· 0 0
 
 
 −1 2 −1 0 ··· 0 0 
 
 
 
 0 −1 2 −1 · · · 0 0 
 
 
τ 



k̃ =  0 0 −1 2 ··· 0 0  (6.152)
d 
 
 .. .. .. .. .. .. .. 
 . . . . . . . 
 
 
 
 0 0 0 0 ··· 2 −1 
 
 
0 0 0 0 · · · −1 2
La energı́a potencial es:
T
T = ~η˙ m̃~η˙ (6.153)
donde la matriz m̃ es un múltiplo de la matriz unidad:
m̃ = mI˜ (6.154)
La ecuación de valores propios es:
µα = ~0; α = 1, 2, ...n
(−ωα2 m̃ + k̃)~ (6.155)
Explı́citamente las ecuaciones de valores propios son:

τ τ τ
− µαi−1 + 2 − mωα2 µαi − µαi+1 = 0; i = 1, 2, ...n (6.156)
d d d
En (6.156) se debe cumplir µα0 = µα n+1 = 0. La matriz n × n en (6.155) es:
 
λ −1 0 0 ··· 0 0
 
 
 −1 λ −1 0 ··· 0 0 
 
 
 
 0 −1 λ −1 · · · 0 0 
 
 
2 τ
 0 0 −1 λ ··· 0 0 
 τ
−m̃ωα + k̃ =   = D̃ (6.157)
d  d
 
 .. .. .. .. .. .. .. 
 . . . . . . . 
 
 
 
 0 0 0 0 ··· λ −1 
 
 
0 0 0 0 ··· −1 λ
donde λ depende de ωα :
d
λ = 2 − mωα2 (6.158)
τ
Llamemos Dn al determinante de la matriz D̃, que es un polinomio de grado n

en λ. Haciendo tomar a n los valores 1, 2, 3, ..., obtenemos la siguiente secuencia de
polinomios:
D1 = λ
D2 = λ2 − 1
D3 = λ3 − 2λ = λD2 − D1
D4 = λ4 − 3λ2 + 1 = λD3 − D2 (6.159)
D5 = λ5 − 4λ3 + 3λ = λD4 − D3
D6 = λ6 − 5λ4 + 6λ2 − 1 = λD5 − D4

.. ..
. .
Notamos la siguiente relación de recurrencia entre los polinomios:
Dk = λDk−1 − Dk−2 ; k = 1, 2, ...n (6.160)

Los coeficientes de las potencias de λ pueden escribirse en términos de los números

combinatorios. Ası́ por ejemplo:

9 8 7
D9 = λ9 − λ7 + λ5
9 7 5

6 5
− λ3 + λ
3 1
(6.161)
10 10 9 8 8 6
D10 = λ − λ + λ
10 8 6

7 4 6 2 5
− λ + λ −
4 2 0
De (6.161) se puede obtener fácilmente una generalización. Las fórmulas resultantes

se demuestran fácilmente por el método matemático de inducción,
 n 
Xn/2 +k
 2  k+1 2k
Dn =   (−1) λ si n es par
k=0 2k
  (6.162)
n + 1
(n−1)/2
X  +k
2  k 2k+1
Dn =   (−1) λ si n es impar
k=0
2k + 1
Es conveniente el siguiente cambio de variable:
λ = 2 cos β (6.163)
En términos de β obtenemos la secuencia siguiente de los Dk :
D1 = 2 cos β
D2 = 2 cos 2β + 1
D3 = 2(cos 3β + cos β)
(6.164)
D4 = 2(cos 4β + cos 2β) + 1
D5 = 2(cos β + cos 3β + cos 5β)
D6 = 2(cos 6β + cos 4β + cos 2β) + 1
Se pasa de (6.159) a (6.164) usando identidades trigonométricas (fórmulas 5.53 a

5.67 del manual de fórmulas matemáticas de Spiegel). La generalización de (6.164) es
simple; el resultado es:

n/2
X
Dn = 2 cos 2kβ + 1 ; si n es par
k=1
(6.165)
(n−1)/2
X
Dn = 2 cos(2k + 1)β ; si n es impar
k=0
Las fórmulas (6.165) se pueden simplificar usando
(ei2β )k + (e−i2β )k
cos 2kβ = (6.166)
2
y similarmente para (2n + 1)β. Notamos luego que se obtienen series geométricas de
potencias. La expresión para la suma cerrada de una serie geométrica es conocida. En
este caso la razón de la serie es e±2β :
1 − (ei2β )r+1
1 + ei2β + (ei2β )2 + ...(ei2β )r = (6.167)
1 − ei2β
que vale si ei2β 6= 1. Ası́, si n es par:
1 − (ei2β )(n/2+1)
Dn = 2Re −1 (6.168)
1 − ei2β
El resto es un cálculo trigonométrico. Para n impar el procedimiento es similar.
El resultado final es que, para todo n:
sen(n + 1)β
Dn = ; n par o impar (6.169)
senβ
Se sigue entonces que la ecuación secular correspondiente a (6.156) es:
sen(n + 1)βα = 0; α = 1, 2, ...n (6.170)
Esta ecuación tiene n raı́ces, (n + 1)βα = απ, o sea:

π
βα = α ; α = 1, 2, ...n (6.171)
n+1
Entonces los λ serán, usando (6.163):
απ
λα = 2 cos ; α = 1, 2, ...n (6.172)
n+1
Recordando la relación entre las λα y las ωα , ecuación (6.158), obtenemos para las
frecuencias propias:
r
τ απ
ωα = 2 sen ; α = 1, 2, ...n (6.173)
md 2(n + 1)
Para hallar los vectores propios, reemplazamos a (6.157) en (6.155):

    
λα −1 0 0 ··· 0 0 µα1 0
 −1 λα −1 0 · · · 0 0   µα2   0 
    
 0 −1 λα −1 · · · 0 0     
   µα3   0 
 0 0 −1 λα · · · 0 0     
  =  (6.174)
 .. .. .. .. .. .. ..   ..   .. 
 . . . . . . 
.  .   . 
   
 0 0 0 0 · · · λα −1   µαn−1   0 
0 0 0 0 · · · −1 λα µαn 0
La ecuación (6.174) representa el siguiente sistema de ecuaciones lineales:
µα2 = λα µα1
µα3 = (λ2α − 1)µα1
µα4 = (λ3α − 2λα )µα1
µα5 = (λ4α − 3λ2α + 1)µα1
..
. (6.175)
senkβα
µαk = Dk−1 (λα )µα1 = µα1
senβα
..
.
α, k = 1, 2, ...n
La última lı́nea de (6.175) también puede obtenerse comparando a (6.160) con la

relación de recurrencia para los µαk , (6.156):
µα,k+1 = λα µα,k − µα,k−1 ; α, k = 1, 2, ...n (6.176)
Entonces los vectores propios son:

µα1
~ Tα =
µ (senβα , sen2βα , ...sennβα ); α = 1, 2, ...n (6.177)
senβα
µα1 es una constante que se determina por normalización:
n
µ2α1 X
(~ µα ) = m~µTα · ~µα = m
µα , ~ sen2 kβα = 1 (6.178)
sen2 βα
k=1
La sumatoria en (6.178) se puede tratar como una serie geométrica:

n
X n
1X
sen2 kβα = (1 − cos 2kβα )
2
k=1 k=0
n
n + 1 1 X i2βα k (6.179)
= − Re (e )
2 2
k=1
n + 1 sen(n + 1) βα cos 2nβα

= −
2 2senβα
como, según (6.170), sen(n + 1)βα = 0, se sigue que:
2 sen2 βα
µ2α1 = (6.180)
(n + 1)m
llamando M a la masa total, M = nm, (6.180) y (6.175) nos dan:

r
2 αk π
µαk = sen = µkα ; α, k = 1, 2, ...n (6.181)
M +m n+1
Como debe ser, las ~
µα son ortogonales pues todas las frecuencias propias ωα son
no degeneradas:
n
2 X
(~
µα , ~
µα ) = m~µα · µ
~β = senkβα senkββ = δαβ (6.182)
n+1
k=1
Las coordenadas normales para este problema son:

r
τ απ
θα = Cα sen 2 sen t + φα ; α = 1, 2, ...n (6.183)
md 2(n + 1)
p La matriz Ã que realiza la transformación de ~η a ~θ, η~ = Ãθ~ es simétrica, Aαβ =

2/(M + m) sen[αβπ/(n + 1)]:
 
π 2π nπ
 sen n + 1 sen n + 1 · · · sen
n+1 
 
 
 2nπ 
 sen 2π sen
4π
· · · sen 
r  
2  n+1 n+1 n+1 
Ã =   (6.184)
M +m  
.. .. .. .. 
 . . . . 
 
 
 
 nπ 2nπ n π 
2
sen sen · · · sen
n+1 n+1 n+1
Una oscilación arbitraria del sistema está descrita por una superposición de las
oscilaciones propias:
n
X r
αiπ τ απ
ηi (t) = Cα sen sen 2t sen + φα (6.185)
α=1
n+1 md 2(n + 1)
En los modos normales de oscilación todas las partı́culas están sobre una curva si-
nusoidal cuya longitud de onda depende del orden del modo, o sea de la frecuencia ωα . Es
una solución del tipo “onda estacionaria”, determinada por las condiciones de frontera
µα0 = µαn+1 . Corben y Stehle obtienen a partir de esta solución la solución para una on-
da viajera, imponiendo las condiciones de frontera periódicas, µα0 = µαn y µα1 = µαn+1 .
La cuerda uniforme. Lagrange demostró que mediante un procedimiento de paso

al lı́mite las oscilaciones de la cuerda uniforme pueden obtenerse a partir de las de la
cuerda cargada. La densidad lineal de masa ρ es:
M nm n m
ρ= = = (6.186)
L L n+1 d
en (6.173) puede obtenerse en el lı́mite en que n → ∞, m → 0, d → 0 manteniendo m/d
constante:
m
lı́m ρ = (6.187)
n→∞ d
Entonces el lı́mite de ωα cuando n → ∞ es:
r
τ (n + 1)n απ
ωα = 2 sen
ρ L2 2(n + 1)
r r (6.188)
2 τ απ π τ
→ =α ; α = 1, 2, ...∞
L ρ 2 L ρ
p
Esto expresa la Ley de Mersenne. ω1 = (π/L) τ /ρ es la frecuencia del tono
fundamental de una cuerda y ωα es el armónico de orden α. Cuando n → ∞, el número
de modos normales de oscilación es infinito aunque es contable. En cambio el ı́ndice que
numera las partı́culas se convierte en una variable continua:
x → kd ; k = 0, 1, 2, ...∞ ; d→0 (6.189)
x es una variable que define la posición de la partı́cula k. Entonces la fórmula
(6.181) se convierte en:
r πx
2
µα,k → µα (x) = sen α ; α = 1, 2, ...∞ (6.190)
M L
Una oscilación general de la cuerda estará dada por:
X∞ r
απx απ τ
η(x, t) = Cα sen sen t + φα (6.191)
α=1
L L ρ
donde Cα y φα es un conjunto contable infinito de constantes arbitrarias. Ã ya no

será una matriz, pues si bien las filas siguen siendo contables, las columnas forman un
continuo. Las fórmulas de transformación entre las coordenadas ~η y las coordenadas ~θ
son:
∞
X
η(x, t) = µα (x)θα (t) (6.192)
α=1
En vez de la matriz m̃ con elementos mij = mδij debemos tener una función delta
de Dirac, de modo que Ãm̃ÃT = I˜ se convierte en:
Z L Z L Z L
ρ dx dy µα (x)δ(x − y)µβ (y) = ρµα (x)µβ (x)dx =
0 0 0
(6.193)
Z L
2 απx βπx
dx sen sen = δαβ
L o L L
En vez de los elementos de m̃ y k̃, debemos tener:
m(x, x′ ) = ρδ(x − x′ )
τ
k(x, x′ ) = [2δ(x − x′ ) − δ(x − x′ − d) − δ(x − x′ + d)] (6.194)
d2
d2
= −τ 2 δ(x − x′ )
dx
Ãk̃ ÃT = ω̃ se convierte en:

Z L Z L
τ
2
dx dx′ µα (x) 2δ(x − x′ ) − δ(x − x′ + d)−
d 0 0
δ(x − x′ − d) µβ (x)
( Z )
L
τ 1
= 2 2 δαβ − µα (x) [µβ (x − d) + µβ (x + d)] dx
d ρ 0
(6.195)
( Z )
L
τ 2 2 απx βπx βπd
= δαβ − sen 2sen cos dx
d2 ρ M 0 L L L

2 τ πβd 4τ βπd
= 1 − cos δαβ = 2 sen2 δαβ
ρ d2 L ρd 2L
Entonces, los elementos diagonales de Ãk̃ ÃT son, tomando d → 0:
π2 τ
ωβ2 = β 2 (6.196)
L2 ρ
como debe ser. En vez de las ecuaciones algebraicas (6.156) tendremos ahora una ecua-
ción diferencial. En efecto, (6.156) se convierte en:

τ 2τ τ
− µα (x − d) + − ρdωα2 µα (x) − µα (x + d) = 0 (6.197)
d d d
Podemos escribir a (6.197) en la forma:

τ τ
[µα (x) − µα (x − d)] − [µα (x + d) − µα (x)] = ρdωα2 µα (x) (6.198)
d d
En el lı́mite cuando d → 0, en el lado izquierdo obtenemos:
−τ [µ′α (x) − µ′α (x + d)] = ρ dωα2 µα (x) (6.199)
Tomando una vez más el lı́mite cuando d tiende a cero obtenemos:

d2 µα (x) ρ 2
+ ωα µα (x) = 0; α = 1, 2, ...∞ (6.200)
dx2 τ
Reemplazando a (6.196) en (6.200) vemos que efectivamente (6.190) es la solución

de (6.200). De (6.188) podemos obtener la ecuación diferencial que obedece la amplitud
dependiente del tiempo. En efecto:
X∞ απ 2 r
∂2η απx απ τ
= − Cα sen sen t + φα
∂x2 α=1
L L L ρ
(6.201)
X∞ απ 2 τ r
∂2η απx απ τ
= − C sen sen t + φα
∂t2 α=1
L ρ L L ρ
De donde:
∂2η ρ ∂2η
2
− =0 (6.202)
∂x τ ∂t2
Esta ecuación se obtiene también directamente de (6.15) y (6.195). Es la ecua-
ción de onda en una dimensión. Hemos llegado a la teorı́a de las ondas mecánicas. No
seguiremos con el tema, que nos aleja del propósito del presente capı́tulo.
7
Cinemática del cuerpo rı́gido
7.1. Definición de cuerpo rı́gido

Es un sistema de partı́culas sometidas a las siguientes ligaduras holónomas:
|~ri − ~rj | = lij = Constante; i, j = 1, 2, ...N (7.1)
El número de relaciones de este tipo es:

N 1
= N (N − 1) (7.2)
2 2
Para N > 7 el número de ligaduras excede el número de coordenadas 3N . En

realidad, para N ≥ 4 el número de ligaduras independientes es menor que el número dado
por (7.2). Sea un cuerpo rı́gido formado por más de tres partı́culas no colineales. Dados
tres puntos no colineales del cuerpo rı́gido, las ligaduras fijan las posiciones de todos los
demás puntos, pues para ubicar un punto en el espacio bastan sólo las distancias a tres
puntos no colineales (véase figura 7.1). Luego, para especificar los grados de libertad de
un cuerpo rı́gido, basta determinar el número de coordenadas independientes necesarias
para ubicar la posición de tres puntos del cuerpo rı́gido. Como entre los tres puntos
dados, no colineales, hay tres condiciones de ligadura, r12 = l12 , r23 = l23 , r13 = l13 ,
se necesitan 9 − 3 = 6 coordenadas independientes para especificar la posición de tres
puntos no colineales del cuerpo rı́gido. En consecuencia el número de grados de libertad
de un cuerpo rı́gido es seis.
Otra manera de hallar lo anterior es la siguiente. Para especificar la posición del
punto 1 se requieren tres coordenadas. Para especificar la posición del punto 2, dado
el punto 1 y la distancia r12 se requieren dos coordenadas. Para especificar la posi-
ción del punto 3, dados los puntos 1 y 2 y las distancias r23 y r13 , se requiere sólo una
coordenada. O sea que en total se requieren seis coordenadas para ubicar los tres puntos.
205
l12 2
1
l23
l13
3
Figura 7.1 Posición de un punto respecto de tres puntos no colineales del cuerpo rı́gido
7.2. Sistemas de coordenadas espacial

y del cuerpo rı́gido
Para especificar la posición de un cuerpo rı́gido es suficiente: (a) Especificar la
posición en el espacio de un punto cualquiera del cuerpo, para ello se requieren tres
coordenadas; (b) Especificar la orientación del cuerpo respecto a unas coordenadas fijas
en el punto mencionado, para ello se requieren tres coordenadas dado que seis es el
número total de grados de libertad.
El sistema de coordenadas η, ξ, ζ, está fijado al cuerpo rı́gido (véase figura 7.2).
El sistema de coordenadas x′ , y ′ , z ′ , se obtiene del sistema x, y, z, sólo por translación
al origen de coordenadas fijado al cuerpo rı́gido.
z′
r′
r y′
a
η
ξ
x′
x
Figura 7.2 Sistemas de coordenadas espacial y del cuerpo rı́gido

Cinemática del cuerpo rı́gido / 207
Para una partı́cula del cuerpo rı́gido se tiene:

~r = ~r′ + ~a (7.3)
En el sistema de coordenadas del cuerpo rı́gido la partı́cula tiene coordenadas
η, ξ, ζ y en el sistema de coordenadas trasladado tiene coordenadas x′ , y ′ , z ′ . Estas
coordenadas difieren por una rotación, o sea que están relacionadas entre sı́ mediante
una transformación lineal:
   ′ 
η x
   
   
 ξ  = Ã  y ′  (7.4)
   
   
ζ z′
donde Ã es la matriz de la transformación. Llamemos las coordenadas ası́:
x1 = x x′1 = x′ x1 = η a1 = ax
x2 = y x′2 = y ′ x2 = ξ a2 = ay (7.5)
x3 = z x′3 = z ′ x3 = ζ a3 = az
Con lo cual podemos describir:
3
X
xi = x′i + ai ; xi = aij x′j ; i = 1, 2, 3 (7.6)
j=1
donde aij son los elementos de la matriz Ã. La transformación de las coordenadas espa-
ciales (x) a las coordenadas del cuerpo rı́gido (x) son:
3
X
xi = a−1
ij xj + ai i = 1, 2, 3 (7.7)
j=1
donde a−1ij son los elementos de la matriz inversa ã

−1 −1
. Obviamente aij no es l/aij ·. a−1
ij
son un conjunto de nueve números que especifican la dirección de los ejes de coordenadas
fijos al cuerpo respecto a los ejes de coordenadas situados en el mismo punto de los
anteriores pero no rotados respecto a los espaciales.
Como la descripción del movimiento translacional del cuerpo rı́gido es posible usan-
do los métodos de la cinemática de partı́culas, podemos sin perder generalidad hacer
coincidir los sistemas de coordenadas (x) y (x′ ).
Nos interesaremos pues, en la relación entre las coordenadas (x) y (x). La longitud
del vector ~r es la misma en los dos sistemas de coordenadas con origen común: r2 = r 2 .
Por tanto:
  !
X3 3
X X3 X3
2
r = xi xi =  −1 
aij xj −1
a xk ik
i=1 i=1 j=1 k=1
(7.8)
3
X 3 X
X 3
r2 = xi xi = δjk xj xk
i=1 j=1 k=1
Igualando las ecuaciones (7.8) obtenemos:

3 X3 3 X 3 3
!
X X X
−1 −1
δjk xj xk = aij aik xj xk (7.9)
j=1 k=1 j=1 k=1 i=1
Como las x son independientes por definición, se sigue que:

3
X
a−1 −1
ij aik = δjk (7.10)
i=1
En términos de los elementos (Ã−1 T )lm de la matriz traspuesta de la matriz Ã−1 , que
se obtiene por intercambio de filas y columnas, podemos escribir (7.10) como:
3
X
˜ jk
(Ã−1 T )ij (Ã−1 )ik = (I) (7.11)
i=1
donde I˜ es la matriz identidad 3 × 3. En forma de matriz (7.11) es:
Ã−1 T Ã−1 = I˜ ⇒ Ã−1 = ÃT (7.12)
donde hemos usado el hecho de que: Ã−1 Ã = I˜ y (Ã−1 T )T = Ã−1 .

Llegamos a la conclusión que: Ã−1 = ÃT . Una matriz para la cual su inversa
coincide con su transpuesta se llama ortogonal.
La matriz de rotación Ã contiene nueve parámetros, pero entre ellos hay las rela-
ciones:
3
X 3
X
aji aTik = δjk ⇒ aji aki = δjk (7.13)
i=1 i=1
Tres relaciones se obtienen cuando j = k:

3
X
(aji )2 = 1; j = 1, 2, 3 (7.14)
i=1
Hay seis relaciones cuando j 6= k:

3
X
aji aki = 0 j 6= k; j, k = 1, 2, 3 (7.15)
i=1
Pero de (7.15) también se sigue que:

3
X
aki aji = 0 j 6= k; j, k = 1, 2, 3 (7.16)
i=1
O sea que sólo hay tres relaciones independientes para j 6= k. En total hay seis
relaciones entre los elementos de la matriz Ã. Como era de esperarse, Ã contiene sólo
tres parámetros independientes.
x2
x2
r,r
x1
θ
θ
φ
x1
Figura 7.3 Rotación de los ejes (x) alrededor del eje x3 = x3 .
Ejemplo 7.2.1 Supongamos que los ejes (x) y (x) difieren simplemente por una rotación
por un ángulo φ alrededor del eje x3 = x3 (véase figura 7.3). Encontrar las fórmulas de
transformación.
Las fórmulas de transformación se obtienen fácilmente de la figura 7.3, que repre-

senta el plano x1 − x2 :
x= r cos θ
(7.17)
x= r senθ
donde hemos usado que r = r. Como θ = θ − φ podemos escribir:
cos θ = cos θ cos φ + senθ senφ

(7.18)
senθ = senθ cos φ − cos θ senφ
Teniendo en cuenta que:
x1 = r cos θ ; x2 = r senθ (7.19)
Se sigue inmediatamente que las fórmulas de transformación son:
x1 = x1 cos φ + x2 senφ
x2 = −x1 senφ + x2 cos φ (7.20)
x3 = x3
O en forma de matriz:
    
x1 cos θ senφ 0 x1
    
    
 x2  =  −senφ cos φ 0   x2 
  (7.21)
   
    
x3 0 0 1 x3
Esta matriz satisface idénticamente las relaciones de ortogonalidad (7.13). Para
j = k:
j= primera fila , cos2 φ + sen2 φ + 02 = 1
j= segunda fila , sen2 φ + cos2 φ + 02 = 1 (7.22)
j= tercera fila , 02 + 02 + 12 = 1
satisface también las relaciones para j 6= k (ortogonalidad de las filas entre sı́ o de las
columnas entre sı́):
j = 1, k = 2 ( 1a y 2a filas) : − cos φ senφ + senφ cosφ + 0 = 0
j = 1, k = 3 ( 1a y 3a filas) : 0 +0 +0 =0 (7.23)
j = 1, k = 2 ( 2a y 3a filas) : 0 +0 +0 =0
y similarmente para la ortogonalidad entre columnas.
En general, las relaciones (7.13) pueden expresarse en la siguiente manera. Para
una matriz ortogonal Ã se cumple que el producto escalar de una fila por sı́ misma, o
de una columna por sı́ misma, es igual a la unidad. Dos filas diferentes o dos columnas
diferentes son ortogonales entre sı́. No es cierto sin embargo que una fila sea ortogonal
a una columna. Es claro en el ejemplo anterior que Ã−1 = ÃT .
7.3. Los cosenos directores

Sean dos sistemas de ejes cartesianos con origen común (x) y (x). Los ejes (x) están
rotados respecto a los ejes (x). Sean ~e1 , ~e2 y ~e3 tres vectores unitarios a lo largo de los
ejes x1 , x2 y x3 respectivamente. Sean ~e′1 , ~e′2 y ~e′3 los tres vectores unitarios a lo largo
de los ejes x1 , x2 y x3 respectivamente. Se definen los cosenos directores de los ejes (x)
respecto a los ejes (x) como los cosenos de los ángulos que hacen cada uno de los ejes
(x) con cada uno de los ejes (x). Los denotaremos αij . De su definición se sigue que:
αij = ~e′i · ~ej ; i, j = 1, 2, 3 (7.24)
Es claro que αij es el coseno del ángulo entre el eje xi y el eje xj . En total hay
nueve cosenos directores, que no son independientes. Es claro que la transformación de
los vectores ~ei a los vectores ~e′i es:
3
X 3
X
~e′i = αij ~ej = (~e′i · ~ej )~ej (7.25)
j=1 j=1
en efecto:
3
X 3
X
~e′i · ~ek = (~e′i · ~ej )(~ej · ~ek ) = (~e′i · ~ej )δjk = ~e′i · ~ek (7.26)
j=1 j=1
Un vector cualquiera V~ puede expresarse de dos maneras equivalentes:

3
X 3
X
V~ = Vi~ei = Vi′~e′i (7.27)
i=1 i=1
Multiplicando escalarmente (7.27) a ambos lados por ~e′k :

3
X 3
X
Vi~ek · ~ei = Vi′~e′k · ~e′i = Vk′ (7.28)
i=1 i=1
~ se transforman de la siguiente manera:

Por tanto se tiene que las componentes de V
3
X
Vk′ = αkj Vj (7.29)
j=1
En tanto que:
3
X
~e′k = αkj ~ej (7.30)
j=1
Es decir, las componentes de los vectores se transforman de la misma manera que

los vectores unitarios. Notamos que las componentes Vi y Vi′ de V~ se pueden escribir
como:
Vi = ~ei · V~ ; Vi′ = ~e′i · V~ (7.31)
De acuerdo con (7.29):

3
X
~ =
Vi′ = ~e′i · V (~e′i · ~ej )(~ej · V~ ) (7.32)
j=1
~ como ~e′ , según (7.32):

Tomando V i
3
X 3
X
1= (~e′i · ~ej ) → α2kj = 1 ; i = 1, 2, 3 (7.33)
j=1 j=1
~ como ~e′ con k 6= i, según (7.32):

Tomando V k
3
X 3
X
0= (~ei · ~ej )(~ej · ~e′k ) → αij αkj = 0 ; i, k = 1, 2, 3 (7.34)
j=1 j=1
Vemos que la fórmula de transformación de los vectores ~e′i a los vectores ~ei es:
3
X 3
X
~ei = αij ~e′j = (~e′j · ~ei )~e′j (7.35)
j=1 j=1
puesto que:
3
X
~ei · ~e′k = (~e′j · ~ei )δjk = (~e′k · ~ei ) (7.36)
j=1
Esto nos dice que la matriz traspuesta de (αij ) produce la rotación de los ejes (x)
a los ejes (x). Las componentes de un vector se transforman según:
3
X 3
X
Vk = αjk Vj′ = αTkj Vj′ (7.37)
j=1 j=1
Las relaciones (7.33) y (7.34) entre los cosenos directores pueden escribirse como:
3
X 3
X
αij αkj = αij αTjk = δik (7.38)
j=1 j=1
En sı́ntesis, vemos que la matriz de los (αij ) es ortogonal y cumple todas las propie-
dades de la matriz de rotación Ã. Los cosenos directores son los elementos de la matriz Ã.
Dı́adas y diádicos. Se define un diádico como una entidad algebraica que se

representa por una matriz 3 × 3, de la misma manera que un vector es una entidad
algebraica que se representa por una matriz columna 3 × 1.
De acuerdo con (7.27) un vector unitario se puede expresar como:
~e1 = 1 · ~e1 + 0 · ~e2 + 0 · ~e3
~e2 = 0 · ~e1 + 1 · ~e2 + 0 · ~e3 (7.39)
~e3 = 0 · ~e1 + 0 · ~e2 + 1 · ~e3

Entonces los vectores unitarios se pueden representar por las tres matrices columna
siguientes:
     
1 0 0
     
     
~e1 →      
 0  ; ~e2 →  1  ; ~e3 →  0  (7.40)
     
0 0 1
~ se puede representar mediante una matriz columna:
Un vector arbitrario V
       
V1 1 0 0
       
       
~ →  V2  = V1  0  + V2  1  V3  0 
V (7.41)
       
       
V3 0 0 1
Análogamente podemos suponer que una matriz 3 × 3 es la representación de cierta

entidad que llamaremos diádico. Una dı́ada unitaria es el análogo de un vector unitario
y un diádico es el análogo de un vector cualquiera. Definimos la dı́ada unitaria como
una entidad algebraica ~ei~ej que se puede representar por una matriz 3 × 3 que tiene un
1 en la fila i columna j, y cero en todos los otros lugares. Podemos formar nueve dı́adas
unitarias. Ası́ por ejemplo:
   
1 0 0 0 0 0
   
   
  
~e1~e1 →  0 0 0  ~e2~e3 →  0 0 1   (7.42)
   
0 0 0 0 0 0
Notamos que ~ei~ej se puede representar por el producto de una matriz columna por
una matriz fila:
   
1 1 0 0
   
   
~e1~e1 →  0
 
 (1 0 0) =  0 0 0 
 
   
0 0 0 0
    (7.43)
0 0 0 0
   
   
~e2~e3 →  1
 
 (0 0 1) =  0 0 1 
 
   
0 0 0 0
~B
Es de notarse que en general ~ei~ej 6= ~ej ~ei . Definimos una dı́ada A ~ como un poli-
nomio de dı́adas unitarias ası́:
X3 X 3
A~B~ = Ai Bj ~ei~ej
i=1 j=1
(7.44)
3 X
X 3
~A
B ~= Bi Aj ~ei~ej
i=1 j=1
Un diádico en general es un polinomio de dı́adas unitarias, pero no necesariamente

de la forma A~ B:
~
X3 X 3
~~
D = Dij ~ei~ej (7.45)
i=1 j=1
~~
Es claro que la representación de D es:
 
D11 D12 D13
 
~~  
D →  D21 D22 D23 

 (7.46)
 
D31 D32 D33
Ası́ como el producto de un vector fila por una matriz da un vector fila y el
producto de una matriz por un vector columna da un vector columna, definimos por
analogı́a el producto de un vector por un diádico y de un diádico por un vector para
obtener vectores. Definimos los productos entre dı́adas unitarias y vectores ası́:
~ = ~ei (~ej · V
~ei~ej · V ~ ) = ~ei Vj
(7.47)
V~ · ~ei~ej = ~ · ~ei )~ej = ~ej Vi
(V
y el producto entre diádicos y vectores ası́:
 
3 X
X 3 X
3 3
X
~~ ~ ~ =  Dij Vj  ~ei
D ·V = Dij ~ei ~ej · V
i=1 j=1 i=1 j=1
(7.48)
!
X 3
3 X 3
X 3
X
~~
V~ · D = Dij V~ · ~ei ~ej = Dij Vi ~ej
i=1 j=1 j=1 i=1
Se define el diádico unidad como:

~
~1 = ~e ~e + ~e ~e + ~e ~e (7.49)
1 1 2 2 3 3
~
~1 claramente tiene las propiedades:
3
X 3
X
~ ~=
~1 · A ~=
~ei~ei · A ~
~ei Ai = A
i=1 i=1
(7.50)
3
X 3
X
~ ·~
A ~1 = ~ · ~ei~ei =
A ~
Ai~ei = A
i=1 i=1
La dı́ada ~ei~ej tiene la propiedad de proyección. Al multiplicarla por un vector se

obtiene la componente del vector en la dirección ~ei :
3
X
~=A
~ei~ei · A ~ · ~ei~ei = Aj (~ei · ~ej )~ei = Ai~ei (7.51)
j=1
Se define el producto escalar de dos matrices ası́:

3 X
X 3
Ã : B̃ = Aij Bij (7.52)
i=1 j=1
que corresponde al producto escalar de dos diádicos:

~~ ~~
A : B = Ã : B̃ (7.53)
Para el diádico (7.44) y uno similar tenemos:
3
X
~B
A ~ :C
~D~ = ~ · C)(
Ai Bj Ci Dj = (A ~ B ~ · D)
~ (7.54)
i=1
Vemos que esto es lo mismo que:

3 X
X 3
~ ·A
C ~B~ ·D
~ = ~ · ~ei )(~ej · D)
Ai Bj (C ~
i=1 j=1
(7.55)
3 X
X 3
= ~ · A)(
Aj Bj Ci Dj = (C ~ B ~ D)
~
i=1 j=1
Por tanto:
~B
A ~ :C
~D~ =C
~ ·A
~B~ ·D
~ (7.56)
Veremos que existe completa correspondencia entre los diádicos y los tensores.
Un tensor es una entidad algebraica, con componentes Tij tales que bajo rotaciones se
transforma ası́:
3 X
X 3
Tij′ = αik αjl Tkl (7.57)
k=1 l=1
donde (αij ) son los elementos de la matriz de rotación. En efecto, Tij son los elementos
~
de la matriz que representa a cierto diádico T~ :
~ ~
Tij′ = T~ · ~e′i~e′j = ~e′i · T~ · ~e′j (7.58)
~
T~ se puede expresar bien en términos de ~ei~ej o de ~e′i~e′j :
XX 3 3 XX 3 3
~
T~ = Tij ~ei~ej = Tij′ ~e′i~e′j (7.59)
i=1 j=1 i=1 j=1
Por tanto (7.57) se puede escribir como:

3 X
X 3 3 X
X 3
Tij′ = Tlk ~ei · ~ek ~el · ~ej = αik αjl Tkl (7.60)
k=1 l=1 k=1 l=1
Se denomina relación de completidad de la base ~ei a:

X ~
~ei~ei = I~ (7.61)
i=1
y relación de ortonormalidad de la base ~ei a:

~ei · ~ej = δij ; i, j = 1, 2, 3 (7.62)
En mecánica cuántica la notación de Dirac es la notación diádica en el espacio de
Hilbert.
Dos forma. Se define el diádico antisimétrico:

~ei ∧ ~ej = ~ei~ej − ~ej ~ei (7.63)
se cumple que ~ei ∧ ~ei = 0 y además:

   
0 1 0 0 0 1
   
   
~e1 ∧ ~e2 =  −1 0 0   0 0 0 
  , ~e1 ∧ ~e3 =  ,
   
0 0 0 −1 0 0
  (7.64)
0 0 0
 
 
~e2 ∧ ~e3 =  0 0 1 
 
 
0 −1 0
Una 2-forma entre dos vectores es:

3 X
X 3 3 X
X 3
~∧B
A ~ = Ai Bj ~ei ∧ ~ej = (Ai Bj − Aj Bi )~ei~ej (7.65)
i=1 j=1 i=1 j=1
Se cumplen las propiedades:
~ ·A
C ~∧B
~ ·D
~ = (C
~ · A)(
~ B ~ · D)
~ − (C
~ · B)(
~ A ~ · D)
~
(7.66)
~∧B
A ~ :C
~ ∧D
~ = 2(D
~ · B)(
~ A ~ · C)
~ − 2(C
~ · B)(
~ A ~ · D)
~
El deteminante de la matriz de rotación. Sabemos que la matriz de los

cosenos directores de un sistema de ejes (x) rotado respecto a otro sistema de ejes (x)
es ortogonal:
ÃT Ã = I˜ (7.67)
Tomando el determinante a cada lado de (7.67) y teniendo en cuenta el teorema

matemático que dice que el determinante de un producto de matrices es igual al producto
de los determinantes, tenemos que:
det(ÃT Ã) = det ÃT · det Ã = det I˜ (7.68)
otro teorema matemático dice que los determinantes de una matriz y de su traspuesta
son iguales, entonces:
det(Ã)2 = 1 ⇒ det Ã = ±1 (7.69)
Es fácil ver que det Ã = −1 ocurre cuando la matriz Ã contiene una inversión del
sistema de coordenadas. Entonces los desplazamientos de un sólido rı́gido con un punto
fijo sólo pueden ser descritos mediante una matriz de determinante +1.
7.4. El teorema de Euler acerca del movimiento de

un cuerpo rı́gido
El teorema dice: el desplazamiento general de un cuerpo rı́gido con un punto fijo es
un giro alrededor de cierto eje. En otras palabras: es suficiente un solo giro para pasar de
los ejes (x) fijos al cuerpo, a los ejes espaciales (x). El teorema se demuestra teniendo es-
tas dos propiedades de una rotación alrededor de un eje: (a) El eje de rotación permanece
inalterado; (b) La rotación no cambia la longitud de los vectores. El teorema de Euler
queda demostrado si para una rotación arbitraria, descrita por la matriz Ã, podemos
hallar siempre un vector que no cambie, es decir, que tenga las mismas componentes en
los dos sistemas:
V~ ′ = ÃV
~ =V
~ (7.70)
Esta ecuación es un caso particular de:
V~ ′ = ÃV
~ = λV
~ (7.71)
Como Ã es unitaria (ortogonal) pero no hermı́tica (no simétrica), sus valores pro-
pios no tienen por qué ser reales. Esto nos permite enunciar el teorema de Euler de otra
manera: “la matriz real y ortogonal que determina el movimiento fı́sico de un cuerpo
rı́gido con un punto fijo siempre tiene el valor propio +1”. La ecuación de valores propios
(7.71) puede escribirse:
˜V
(Ã − λI) ~ = ~0 (7.72)
Es un sistema homogéneo de tres ecuaciones lineales, donde las incógnitas son las
componentes de V~ :
(a11 − λ)V1 + a12 V2 + a13 V3 = 0
a21 V1 + (a22 − λ)V2 + a23 V3 = 0 (7.73)
a31 V1 + a32 V2 + (a33 − λ)V3 = 0
Como es conocido, habrá solución no trivial sólo si el determinante de la matriz

˜ es igual a cero. Esto hace que exista solución solamente para ciertos valores de
(Ã − λI)
λ:
 
a11 − λ a12 a13
 
 

det  a21 a22 − λ a23  =0 (7.74)
 
a31 a32 a33 − λ
La ecuación (7.74) es de tercer grado en λ con coeficientes reales:
λ3 + bλ2 + cλ + d = 0 (7.75)
donde:
b = −a11 − a22 − a23
c = a22 a11 + a33 a11 + a21 a33 − a23 a32 − a12 a21 − a13 a31
(7.76)
d = a23 a32 a11 + a12 a21 a33 + a13 a31 a22
−a22 a33 a11 − a12 a23 a31 − a13 a21 a32

cuyas principales propiedades son:
(a) λ puede ser complejo pero con módulo 1. Si λ es complejo, V ~ podrı́a ser
complejo. En este caso escribimos el módulo de V como |V | = V · V donde V~ † es la
~ ~ 2 ~ ~
~ y tomando el complejo conjugado: V
matriz fila que se obtiene trasponiendo V ~ † = (V
~ T )⋆ .
La longitud de V ~ es la misma de V~ :
′
~ ′ |2 = V
|V ~ ′† · V
~ ′ = (ÃV
~ )† · (ÃV~ ) = V
~ † ÃT ÃV~ (7.77)
~ ′ |2 = | V
Como Ã es ortogonal, se sigue que |V ~ |2 . Por otra parte, V
~ ′ = λV
~ , por
tanto:
~ ′ |2 = V
|V ~ ′† · V
~ ′ = (λV
~ )† · (λV
~ ) = λ⋆ λV
~†·V
~ = |λ|2 |V
~ |2 (7.78)
En conclusión:
|λ|2 = 1 (7.79)
(b) La ecuación secular (7.75) tiene al menos una raı́z real. Grafiquemos
la ecuación real:
f (x) = x3 + bx2 + cx + d (7.80)
asumiremos x real. De la ecuación (7.76) sabemos que b, c y d son reales.
Claramente:
f (x) → ∞ para x → ∞
(7.81)
f (x) → −∞ para x → −∞
Como f (x) es continua debe en alguna parte cruzar el eje x. Llamemos x = λ el
punto donde corta el eje, o sea el cero de f (x):
λ3 + bλ2 + cλ + d = 0 (7.82)
Como por (a) sabemos que |λ| = 1, se sigue que el valor propio real debe ser λ = −1
o λ = +1 (véase figura 7.4).
(c) Si λ es un valor propio compleio, λ⋆ también es un valor propio. Como

a, b, c y d son reales, si λ es complejo y satisface (7.75) entonces λ⋆ también la satisface:
de (a), (b) y (c) se sigue que la matriz Ã tendrá tres valores propios λ, λ⋆ , +1 o −1.
Para cada valor propio habrá un vector propio:
~α = λα V~α ;
ÃV α = 1, 2, 3 con λα = λ, λ⋆ , 1 o − 1 (7.83)
λ x
Figura 7.4 Gráfico de la función real f (x) = x3 + bx2 + cx + d
En términos de las componentes podemos escribir a (7.83) como:

3
X 3
X
aij Vαj = λα Vαj = λβ Vβi δαβ (7.84)
j=1 β=1
Definimos las siguientes matrices formadas con las componentes de los vectores
propios y con los valores propios:
Ṽ = (Vαi ) , λ̃ = (λβ δαβ ) (7.85)
Entonces (7.84) puede reinterpretarse como productos de matrices:

~ )αi = (Ṽ T λ̃T )iα = (Ṽ T λ̃)iα
(ÃṼ T )iα = (λ̃V (7.86)
O también:
ÃṼ T = Ṽ T λ̃ ⇒ (Ṽ T )−1 ÃṼ T = λ̃ (7.87)
Es decir, los vectores propios forman una matriz que diagonaliza a Ã siendo los
elementos de la diagonal los valores propios.
(d) El producto de las raı́ces de la ecuación secular es ±1. Tomando de-

terminantes a ambos lados de (7.87) y teniendo en cuenta que el determinante de una
matriz es igual al inverso del determinante de la matriz, obtenemos:
1
det Ã det Ṽ = det λ̃ ⇒ det Ã = det λ̃ (7.88)
det Ṽ
De (7.69) se sigue que:
det λ̃ = ±1 (7.89)
Hemos dicho que para rotaciones se debe cumplir que det Ã = +1 y para inversio-
nes det Ã = −1. Entonces, cuando Ã representa rotaciones:
det λ̃ = λ1 λ2 λ3 = |λ|2 λ3 = +1 (7.90)
Como |λ|2 = +1 se sigue que siempre el valor propio real debe ser igual a +1. Esto
es lo que afirma el teorema de Euler: existe un vector que no cambia al realizar una
transformación cualquiera Ã (corresponde al valor propio +1).
~:
Los vectores propios. El vector invariante bajo rotaciones es V
~ =V
ÃV ~ (7.91)
~α formamos la matriz Ṽ que diagonaliza a Ã:
Con las componentes de V
Ṽ ÃṼ T = λ̃ (7.92)
La traza de λ̃ es:
tr λ = λ1 + λ2 + λ3 = λ + λ⋆ + 1 (7.93)
Como |λ| = 1, podemos escribir:
λ = eiΦ (7.94)
De donde:
tr λ̃ = 2 cos Φ + 1 (7.95)
Como, según un teorema matemático, la traza es invariante bajo transformaciones
de semejanza (Ṽ ÃṼ T es una transformación de semejanza sobre Ã):
tr Ã = tr λ̃ = 1 + 2 cos Φ (7.96)
Es decir,
a11 + a22 + a33 = 1 + cos Φ (7.97)
Podemos mediante una transformación de semejanza rotar los ejes de modo que
~ , de modo que la matriz de rotación tendrá la forma dada por
x3 esté a lo largo de V
(7.21):
 
cos φ senφ 0
 
 
Ã =  −senφ cos φ 0 
 (7.98)
 
0 0 1
Vemos entonces de (7.97) y (7.98) que cos φ = cos Φ, luego Φ puede identificarse
~ . La ecuación de valores
como el ángulo de rotación alrededor del eje determinado por V
propios para la matriz Ã es:
    
cos Φ senΦ 0 V1 V1
    
    
 −senΦ cos Φ 0   V2  =  V2  (7.99)
    
    
0 0 1 V3 V3
Con lo cual obtenemos:

V1 cos Φ + V2 senΦ = V1
−V1 senΦ + V2 cos Φ = V2 (7.100)
V3 = V3
Esto nos da, multiplicando la primera por V2 y la segunda por V1 y restando:
(V12 + V22 ) senΦ = 0 (7.101)
Como Φ es arbitrario, los vectores propios deben cumplir V1 = V2 = 0, quedando

V3 indeterminado, luego V ~ = V3~e3 . Para una elección general de los ejes, seguirá siendo
válido que Φ representa la rotación alrededor de V ~ , pero no quedará determinado com-
pletamente el vector V~ sino sólo su dirección: su magnitud quedará indeterminada. En
cualquier caso la traza de Ã nos determina el ángulo de rotación.
Teorema de Chasles. El desplazamiento más general de un cuerpo rı́gido consiste

en una translación más una rotación. Este teorema se demuestra en el texto Dynamics
of a rigid body, de Routh.
7.5. El rotador rı́gido

Es un sólido rı́gido que se mueve sometido a la condición de ligadura que un punto
permanezca fijo. Los movimientos de un rotador rı́gido quedarán especificados por medio
de las tres componentes de la matriz Ã que relaciona las componentes de los vectores en
el sistema de ejes espacial con el sistema de ejes unido al sólido rı́gido:
3
X
~r = Ã~r o xi = aij xj (7.102)
j=1
En efecto, es suficiente especificar las tres coordenadas de un punto arbitrario del

sólido rı́gido respecto al sistema de ejes espacial para conocer completamente la ubicación
de todos los demás puntos del sólido rı́gido. Es decir, los tres parámetros independientes
de la matriz Ã sirven para especificar las posiciones de un rotador rı́gido. Es claro que
estos tres parámetros serán funciones del tiempo.
El grupo de rotaciones. El conjunto de todas las infinitas rotaciones de un

cuerpo rı́gido con un punto fijo constituye un grupo. Cada rotación Ã está especificada
por tres parámetros independientes q1 , q2 y q3 . Un grupo es la siguiente estructura
algebraica:
(i) Existe un conjunto de elementos g = {Ã(q), ∀q1 , q2 , q3 }.
(ii) Si Ã1 y Ã2 ∈ g entonces Ã1 Ã2 ∈ g.
˜
(iii) Si Ã ∈ g, ∃Ã−1 ∈ g tal que ÃÃ−1 = I.
˜ ˜
(iv) ∃I ∈ g tal que I Ã = Ã, ∀Ã ∈ g.
(v) ∀ Ã, B̃, C̃ ∈ g se cumple Ã(B̃ C̃) = (ÃB̃)C̃.
Estas propiedades se siguen del hecho de que las matrices de rotación son ortogo-
nales. Es sencillo demostrar a partir de lo anterior que:
(a) El producto de dos matrices ortogonales es ortogonal.
(b) Como para toda matriz de rotación det Ã = 1, se sigue que toda matriz de
rotación tiene inverso.
(c) I˜ es ortogonal.
(d) El producto de matrices obedece la ley asociativa.
Las rotaciones consideradas en abstracto como simples transformaciones geométri-
cas forman un grupo. El conjunto de matrices ortogonales 3 × 3 constituye una repre-
sentación del grupo de rotaciones.
7.6. Los ángulos de Euler

Los nueve cosenos directores no son independientes, sólo tres lo son. Podemos
pensar que todos los cosenos directores sean expresados en términos de tres parámetros
independientes φ, θ, ψ:
αij = αij (φ, θ, ψ) ; i, j = 1, 2, 3 (7.103)
La elección de estos tres parámetros independientes no es única. Una conveniente

elección de φ, θ y ψ, es la siguiente (véase figura 7.5). Se puede efectuar la transformación
de (x) a la posición del cuerpo rı́gido dada por (x) por medio de las siguientes rotaciones:
una rotación por un ángulo φ alrededor del eje x3 , con lo cual los ejes cambian de (x)
a (µ). Una rotación por un ángulo θ alrededor de µ1 , con lo cual los ejes se cambian de
(µ) a (µ′ ). Finalmente una rotación por un ángulo ψ, alrededor del eje µ′3 , con lo cual
los ejes se cambian de (µ′ ) a (x).1 Para expresar la matriz de rotación S̃ en términos
de los ángulos φ, θ y ψ (ángulos de Euler) debemos calcular los cosenos directores en
términos de estos ángulos.
x3, µ 3 x3 x3 x2
µ3′ µ2′ χ3, µ3′
µ2 θ θ
ϕ
x2 x2
x2
ϕ ϕ x1 ϕ ψ
x1 x1
x1
µ1 µ1, µi
Línea de nodos
Figura 7.5 Angulos de Euler
1 (θ,φ − π/2) son los ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 , y (θ, π/2 − ψ) son los
ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 .
Para hallar α11 = ~e′1 · ~e1 tomemos los planos que se cortan en la lı́nea de nodos y
que contienen los ejes x1 − x2 y x1 − x2 como en la figura 7.6. Vemos que:
x3
x3 π- θ
x2
x2
α
a b
φ ψ
l x1
x1 θ
Figura 7.6 Planos que se cortan en la lı́nea de nodos
a cos φ = b cos ψ (7.104)
l2 = a2 + b2 − 2ab cos α (7.105)
l2 = (a senφ)2 + (b senψ)2 − 2(a senφ)(b senψ) cos (π − θ) (7.106)
Igualando (7.105) y (7.106) llegamos a:
−b cos α = −a cos2 φ + b senφ senψ cos θ (7.107)
Ahora, reemplazando (7.104) en (7.107) obtenemos finalmente:
α11 = cos α = cos ψ cos φ − senφ senψ cos θ (7.108)
α12 = ~e′1 · ~e2 se obtiene de α11 reemplazando a φ por φ + 3π/2:
α12 = cos ψ senφ + cos φ senψ cos θ (7.109)
α21 = ~e′2 · ~e1 se obtiene de α11 reemplazando a ψ por ψ + π/2:
α21 = −senψ cos φ − senφ cos ψ cos θ (7.110)
α22 = ~e′2 · ~e2 se obtiene de α21 reemplazando a φ por φ + 3π/2:
α22 = −senψ cos φ + cos φ cos ψ cos θ (7.111)

α33 = ~e′3 · ~e3 se obtiene directamente:

α33 = ~e′3 · ~e3 = cos θ (7.112)
α13 y α23 se obtienen de las relaciones de ortogonalidad siguientes, ecuación (7.38):
α2j1 + α2j2 + α2j3 = 1 (7.113)
Con lo cual se obtiene para α13 :
α213 = 1 − (α211 + α212 ) = 1 − (1 − sen2 ψ sen2 θ)
(7.114)
⇒ α13 = senψ senθ
Similarmente, α221 + α222 = sen2 ψ + cos2 ψ cos2 θ, con lo cual:

α23 = cos ψ senθ (7.115)
Para calcular a α32 y a α31 usamos la ecuación (7.38) ası́:
α31 α21 + α32 α22 + α33 α23 = 0 (7.116)
α31 α11 + α32 α12 + α33 α13 = 0 (7.117)
Multiplicando a (7.116) por α11 y a (7.117) por α21 y restando:

α13 α21 − α23 α11
α32 = α33 (7.118)
α22 α11 − α12 α21
Con lo cual se obtiene:
α32 = −senθ cos φ (7.119)
Por otra parte la relación (7.38) para la fila tres:
α231 + α232 + α233 = 1 (7.120)
nos permite escribir:
α31 = senθ senφ (7.121)
con lo cual la matriz de rotación es, en definitiva:
Ã =
 
cos φ cos ψ − senφ cos θ senψ senφ cos ψ + cos φ cos θ senψ senθ senψ
  (7.122)
 
− cos φ senψ − senφ cos θ cos ψ −senφ senψ + cos φ cos θ cos ψ senθ cos ψ 
 
 
senφ senθ − cos φ senθ cos θ
Por la forma como fue obtenida, a partir de los cosenos directores, se tiene que Ã
es una matriz ortogonal. Es decir, que Ã−1 se obtiene simplemente trasponiendo a Ã.
Del teorema de Euler se sigue que de alguna manera Ã representa una rotación
única alrededor de cierto eje n̂ = c1~e1 + c2~e2 + c3~e3 bajo un ángulo Φ. El eje de rotación
se halla resolviendo la ecuación de valores propios (7.91), con λ = 1:
3
X
(aij − δij )Cj = 0 ; i = 1, 2, 3 (7.123)
j=1
El resultado para los cosenos directores del eje n̂ es:

senθ(cos ψ − cos φ)
C1 =
2 senΦ
senθ(senφ − senψ)
C2 = (7.124)
2senΦ
sen(Φ + ψ) (1 + cos θ)
C3 =
2senΦ
Donde Φ es el ángulo de rotación alrededor de n̂ que se halla a partir de la traza
de Ã, ecuación (7.97):
1 − tr Ã
cos φ = (7.125)
2
Calculando la traza de Ã se llega finalmente a:
Φ θ ψ+φ
cos = cos cos (7.126)
2 2 2
Como C12 + C22 + C32 = 1, vemos que dos cosenos directores de n̂ y Φ especifican la
rotación.2
Se puede ver que Ã se puede obtener también a partir de la definición de los ángulos
de Euler, de acuerdo con la figura 7.5:
    
µ1 cos φ senφ 0 x1
    
    
 µ2  =  −senφ cos φ 0   x2  o ~µ = Ãφ ~x (7.127)
    
    
µ3 0 0 1 x3
 ′    
µ1 1 0 0 µ1
    
 ′    
 µ2  =  0 cos θ senθ   µ2  o µ~′ = Ãθ ~µ (7.128)
    
    
µ′3 0 −senθ cos θ µ3
    ′ 
x1 cos ψ senψ 0 µ1
    
    
 x2  =  −senψ cos ψ 0   µ′2  o ~x = Ãψ µ ~′ (7.129)
    
    
x3 0 0 1 µ′3
2 Las ecuaciones (7.124) y (7.126) se obtienen al comparar los elementos de (7.122) y (7.138).
De modo que ~x puede obtenerse de ~x a través de:

~x = Ãψ Ãθ Ãφ ~x = Ã~x (7.130)
Ası́ que:
Ã = Ãψ Ãθ Ãφ (7.131)
Al hacer el producto de matrices se llega al resultado para la matriz Ã dado por

(7.122).
Definiciones alternas de los ángulos de Euler. La convención usada en

mecánica cuántica en los textos de teorı́a de grupos de Wigner, y de momentos an-
gulares de Rose, es diferente a la presentada anteriormente. Allı́ la segunda rotación es
tomada no alrededor del eje intermedio µ1 sino alrededor de µ2 . Es la llamada “con-
vención y” que obviamente dará lugar a expresiones diferentes para la matriz Ã. Es
fácilmente demostrable que para obtener la matriz Ã en la convención “y” a partir de
la matriz Ã en la convención “x” bastan las sustituciones:
π
φ →φ+
2
(7.132)
π
ψ →ψ−
2
donde se entenderá a φ como el ángulo de la primera rotación y a ψ como el ángulo de
la tercera rotación, con lo cual:
senφ → cos φ senψ → − cos ψ

(7.133)
cos φ → −senφ cos ψ → senψ
Se propone como ejercicio probar estas afirmaciones.

Otra convención es la llamada convención “xyz”, usada en aeronáutica: la primera
rotación es por ángulo φ alrededor de x3 , la segunda por ángulo θ alrededor de x2 y
la tercera por ángulo ψ alrededor de x1 . Es la llamada secuencia 3 2 1. Por ejemplo,
tomando los ejes de coordenadas fijos a un avión de la siguiente manera: x3 perpendicular
al avión en el centro de masa, x2 paralelo a las alas y x1 a lo largo del eje principal del
avión, una posición arbitraria de la nave se puede obtener a partir de la posición en que
los ejes (x) coinciden con los ejes (x) por medio de la siguiente secuencia de rotaciones:
una alrededor de x3 por ángulo φ, otra alrededor de x2 por ángulo θ y la tercera alrededor
de x1 por un ángulo ψ.
7.7. Descripción de las rotaciones en términos de n̂ y

Φ. Parámetros de Euler
Hemos mostrado que los desplazamientos de un cuerpo rı́gido con un punto fijo
se pueden expresar por medio de rotaciones. Cada rotación puede especificarse por tres
parámetros independientes que pueden ser por ejemplo tres cosenos directores indepen-
dientes, tres ángulos de Euler, o un eje de rotación y un ángulo. Vimos que las rotaciones
constituyen un grupo matemático que tiene una representación obvia en términos de ma-
trices 3 × 3 ortogonales (hay un homomorfismo entre las rotaciones fı́sicas y las matrices
ortogonales 3 × 3).
Queremos buscar una representación de la transformación de coordenadas en términos
de los parámetros de una rotación: dos cosenos directores del eje de rotación y el ángulo
de rotación.
Formas “activa” y “pasiva” de una rotación. Hasta ahora hemos considerado

que la matriz Ã rota los ejes coordenados, de modo que la ecuación ~r = Ã~r simplemente
expresa cómo están relacionadas las componentes de un vector vistas respecto a dos
diferentes sistemas de coordenadas: Ã actúa sobre el sistema de coordenadas dejando
los vectores inalterados. Hay además la siguiente interpretación: Ã puede pensarse como
un operador que actúa sobre los vectores ~r para cambiarlos por vectores diferentes ~r′
con respecto al mismo sistema de coordenadas. Por ejemplo, en dos dimensiones, en vez
de rotar en el sentido contrario a las agujas del reloj al sistema de coordenadas por un
ángulo φ, se puede rotar al vector ~r en el sentido del reloj por un ángulo φ para obtener
el vector ~r′ (véase figura 7.7). Las componentes del nuevo vector, ~r′ , estarán entonces
x2 x2 Pasiva: x2 Activa
r = Ar r ′ = Ar
i
x1
r r r r′
i
φ x1 x1
Figura 7.7 Formas activa y pasiva de una rotación
relacionadas con las del viejo vector ~r, por medio de la ecuación ~r′ = Ã~r. En general Ã
corresponde a una rotación en sentido contrario a las agujas del reloj por un ángulo φ
cuando sea aplicada al sistema de coordenadas, y como una rotación en sentido de las
agujas del reloj por un ángulo φ cuando sea aplicada a los vectores.
Rotaciones finitas. Usaremos el punto de vista activo, según el cual en un sistema

de coordenadas dado realizamos una rotación de un vector por un ángulo Φ alrededor
de un eje n̂. Se trata de encontrar la matriz Ã que relaciona las componentes del viejo
y del nuevo vector.
De las figuras 7.8 y 7.9 se ve que:
~ + N~V + N~Q
~r′ = ON (7.134)
donde los vectores tienen las siguientes expresiones en términos de ~r, n̂ y Φ, teniendo en
N V P
Φ
r′
i
Figura 7.8 Rotación de un vector alrededor de un eje n̂. Vista lateral.
N V P
Φ
r ×n
Figura 7.9 Rotación de un vector alrededor de un eje n̂. Vista en dirección ~n.
cuenta que N V = N Q cos Φ y V Q = N Q senΦ:

~ =
ON (n̂ · ~r)n̂
N~Q = ~ ) cos Φ
(~r − ON (7.135)
V~Q = ~r × n̂ senΦ
~r′ = ~r cos Φ + n̂(n̂ · ~r)(1 − cos Φ) + ~r × n̂ senΦ (7.136)
Esta fórmula es válida para cualquier rotación finita de un vector. Para Φ infinite-
simal, dicha expresión toma la forma:
~r′ = ~r + ~r × n̂Φ (7.137)
en concordancia con la fórmula (3.148). Escrita en forma de matriz, la ecuación (7.136)
es:
 ′
x1
 
 ′
x2  =
 
 
x′3
   (7.138)
cos Φ+C12 c C1 C2 c + C3 senΦ C1 C3 c−C2 senΦ x1
  
  
C1 C2 c−C3 senΦ cos Φ+C 2
c C C c+C senΦ x2 
 2 2 3 1  
  
C1 C3 c+C2 senΦ C2 C3 c−C1 senΦ cos Φ+C32 c x3
donde hemos llamado c = (1 − cos Φ).
En (7.138) la matriz Ã depende de los cuatro parámetros no independientes C1 ,
C2 , C3 y Φ. Suele expresarse esta matriz en términos de los llamados parámetros de
Euler, no independientes, e0 , e1 , e2 , e3 , definidos ası́:
Φ
e0 = cos
2
(7.139)
Φ
ei = Ci sen ; i = 1, 2, 3
2
En términos de estos parámetros (7.136) toma la forma:
~r′ = ~r(e20 − e21 − e22 − e23 ) + 2~e(~e · ~r) + 2(~r × ~e)e0 (7.140)
y la matriz Ã entonces será:
 2 
e0 + e21 − e22 − e23 2(e1 e2 + e0 e3 ) 2(e1 e3 − e0 e2 )
 
 
Ã = 
 2(e1 e2 − e0 e3 ) e20 − e21 + e22 − e23 2(e2 e3 + e0 e1 ) 
 (7.141)
 
2(e1 e3 + e0 e3 ) 2(e2 e3 − e0 e1 ) e20 − e21 − e22 + e23
Usando las ecuaciones (7.124), (7.126) y (7.139) se obtienen las siguientes relaciones
entre los parámetros de Euler y los ángulos de Euler:
θ φ+ψ
e0 = cos cos
2 2
θ φ−ψ
e1 = sen cos
2 2
(7.142)
θ φ−ψ
e2 = sen sen
2 2
θ φ+ψ
e3 = cos sen
2 2
Los parámetros y los ángulos de Euler fueron hallados por Euler en 1776, quien
llamó ei a los parámetros simétricos.
7.8. Representación del grupo de rotaciones

por medio de matrices 2 × 2. Los parámetros
de Cayley-Klein
Representación de un grupo. En el numeral 7.5 hemos mencionado que el con-
junto de todos los desplazamientos de un cuerpo rı́gido con un punto fijo satisface los
axiomas de un grupo matemático: (i) Dos desplazamientos sucesivos cualesquiera del
cuerpo equivalen a un desplazamiento; (ii) Existe el desplazamiento identidad que con-
siste en no desplazar el cuerpo; (iii) Para todo desplazamiento existe el desplazamiento
inverso o sea aquel que retorne el cuerpo a su posición original; (iv) Los desplazamientos
sucesivos del cuerpo rı́gido satisfacen la propiedad asociativa.
El conjunto de todas las matrices ortogonales 3 × 3 constituyen una representación
del grupo de los desplazamientos de un rotador rı́gido en el sentido de que a cada despla-
zamiento del rotador se le puede asociar una matriz ortogonal 3 × 3 y sólo una. Se dice
entonces que hay un homomorfismo entre el grupo de los desplazamientos del rotador
rı́gido y el grupo de las matrices ortogonales 3×3. El grupo de matrices ortogonales 3×3
es llamado el grupo O(3). El grupo de las matrices ortogonales 3 × 3 con determinante
+1, que en rigor es el que corresponde a los desplazamientos de un rotador rı́gido, se
llama el grupo SO(3).
Vectores y diádicos en un espacio bidimensional. En un espacio bidimensio-

nal, un vector arbitrario V~ puede expresarse en términos de los vectores unitarios ~e1 , e~2 :
~ = V1~e1 + V2~e2 . V
V ~ y ~ei pueden representarse por matrices 2 × 1:
     
V1 1 0
V~ →   ~e1 →   ~e2 →   (7.143)
V2 0 1
Podemos definir las dı́adas unitarias ~e1~e1 , ~e1~e2 , ~e2~e1 y ~e2~e2 , que pueden represen-
tarse por matrices 2 × 2:
   
1 0 0 1
~e1~e1 →   ~e1~e2 →  
0 0 0 0
    (7.144)
0 0 0 0
~e2~e1 →   ~e2~e2 →  
1 0 0 1
En una dı́ada unitaria el primer vector se representa por una matriz columna y el
segundo por una matriz fila. Por ejemplo:
   
1 0 1
~e1~e2 →   (0 1) =   (7.145)
0 0 0
Nótese que:
 
0 1
~e1 ∧ ~e2 = ~e1~e2 − ~e2~e1 =   (7.146)
−1 0
~~
Un diádico D puede expresarse en términos de las dı́adas unitarias:
~~
D = D11~e1~e1 + D12~e1~e2 + D21~e2~e1 + D22~e2~e2 (7.147)
y puede representarse por medio de una matriz 2 × 2:
 
D11 D12
~~
D →  (7.148)
D21 D22
El diádico unidad, ~
~1, es:
 
1 0
~
~1 = ~e1~e1 + ~e2~e2 →   (7.149)
0 1
Se definen los diádicos ~ ~σ x , ~
~σ y y ~~σ z de la siguiente manera:
 
0 1
~
~σ x = ~e1~e2 + ~e2~e1 →   = σ̃x
1 0
 
0 −i
~
~σ y = −i~e1~e2 + i~e2~e1 →   = σ̃y (7.150)
i 0
 
1 0
~
~σ z = ~e1~e1 − ~e2~e2 →   = σ̃z
0 −1
Las dı́adas unitarias pueden expresarse en términos de ~~σ i y ~~1:

1 ~ 1 ~
~e1~e1 = (~1 + ~~σ z ) ; ~e1~e2 = (~σ x + i~~σ y )
2 2
(7.151)
1 1 ~
~e2~e1 = (~
~σ x − i~~σ y ) ; ~e2~e2 = (~1 − i~~σ z )
2 2
~
Un diádico arbitrario puede igualmente expresarse en términos de ~1 y ~~σ i :
~~ 1 ~1 + 1 (V11 − V22 )~~σ z + 1 (V12 + V21 )~~σ x + i (V12 − V21 )~~σ y
D = (V11 + V22 )~ (7.152)
2 2 2 2
O sea que cualquier diádico de traza cero puede expresarse en términos de ~~σ x , ~~σ y ,
~ ~
~ a cualquier diádico de traza cero:
~σ z . Llamaremos V
~ ~
~σ x ~~σ y ~~σ z
~ = Vx √
V + Vy √ + Vz √ (7.153)
2 2 2
Existe un isomorfismo entre los diádicos bidimensionales de traza cero y los vectores
ordinarios V~ . En efecto, el conjunto de todos los diádicos bidimensionales de traza cero
satisface las mismas propiedades que el conjunto de todos los vectores ordinarios: (i) La
suma de dos diádicos de traza cero es un diádico de traza cero, la suma es conmutativa;
(ii) El producto de un número por un diádico de traza cero es un diádico de traza cero;
(iii) La suma de diádicos es asociativa; (iv) Existe el diádico cero. Además, si se define
el producto escalar de dos diádicos como:
~ ~
~ : W
~ = V ⋆ W11 + V ⋆ W12 + V ⋆ W21 + V ⋆ W22
V 11 12 21 22 (7.154)
Vemos que este producto escalar satisface las mismas propiedades del producto
escalar de vectores. Para ello es suficiente mostrar que:
~
~σ i : ~
~σ j = 2δij ; i, j = x, y, z (7.155)
lo cual es evidente de las ecuaciones (7.150) y (7.154). En resumen, a cada diádico de

traza cero de la forma (7.153) se le puede hacer corresponder el vector ordinario:
~ = Vx~e1 + Vy ~e2 + Vz ~e3
V (7.156)
Homomorfismo entre las rotaciones en el espacio bidimensional y las

~ es rotado para convertirse en V
rotaciones en el espacio ordinario. Si el vector V ~ ′:
~ ′ = ÃV
V ~ (7.157)
donde Ã es la matriz de rotación 3 × 3, el diádico correspondiente en el espacio bidimen-
sional deberá presentar una transformación correspondiente en virtud del mencionado
homomorfismo. Como:
3
X
Vi′ = aij Vj (7.158)
j=1
~′
entonces V~ será:
3 3
~ ′ XX 1
V~ = aij Vj √ ~~σ i (7.159)
i=1 j=1
2
Por otra parte, una transformación de un diádico es de la forma:
~ ′ ~~ ~ ~~ †
V~ = Q ~ ·Q
·V (7.160)
~~ † ~~
donde Q es el adjunto de Q:
†
~~
Q = Q⋆11 ê1 ê1 + Q⋆21 ê1 ê2 + Q⋆12 ê2 ê1 + Q⋆22 ê2 ê2 (7.161)
′
~
~ es:
Explı́citamente V
    !
X2 2
X 2
X
~′ = 
V Qij êi êj  ·  Vkl êk êl  · Q⋆mn ên êm
i,j=1 k,l=1 m,n=1
(7.162)
2
X
(Q̃Ṽ Q̃† )im êi êm
i,m=1
~′
Por otra parte V~ está dado por (7.159). Por tanto, según (7.152) y (7.153):
1 h i
3
1 X
√ a1j Vj = Q̃Ṽ Q̃† + Q̃Ṽ Q̃†
2 j=1 2 12 21
i h i
3
1 X
√ a2j Vj = Q̃Ṽ Q̃† − Q̃Ṽ Q̃† (7.163)
2 j=1 2 12 21
1 h i
3
1 X
√ a3j Vj = Q̃Ṽ Q̃† − Q̃Ṽ Q̃†
2 j=1 2 11 22
~~
Estas ecuaciones nos permiten relacionar Ã con Q̃. El diádico Q en (7.160) debe
ser unitario:
~~ † ~~ ~~ ~~ †
Q ·Q=1=Q ·Q (7.164)
~~
Si llamamos α, β, γ y δ las componentes de Q:
~~
Q = αê1 ê1 + βê1 ê2 + γê2 ê1 + δê2 ê2 (7.165)
~~ † ~~
Q .Q = (α⋆ ê1 ê1 + γ ⋆ ê1 ê2 + β ⋆ ê2 ê1 + δ ⋆ ê2 ê2 )·
(αê1 ê1 + βê1 ê2 + γê2 ê1 + δê2 ê2 )
= (|α|2 + |γ|2 )ê1 ê1 + (α⋆ β + γ ⋆ δ)ê1 ê2 (7.166)
+(β ⋆ α + δ ⋆ γ)ê2 ê1 + (|β|2 + |δ|2 )ê2 ê2
= ê1 ê1 + ê2 ê2 + ê3 ê3 = ~~1
|α|2 + |γ|2 = 1
α⋆ β + γ ⋆ δ = 0 (7.167)
|β|2 + |δ|2 = 1
Las ecuaciones (7.167) representan cuatro condiciones sobre los elementos α, β, γ y

δ, que por ser complejos contienen ocho parámetros. Las relaciones (7.167) dejan 8−4 = 4
parámetros independientes. Si además se impone la condición de que el determinante de
Q̃ sea +1, obtenemos:
αδ − βγ = 1 ⇒ β = −γ ⋆ ; δ = α⋆ ; αα⋆ + ββ ⋆ = 1 (7.168)
Con lo cual quedan sólo tres parámetros independientes de los ocho que contiene
Q̃. Entenderemos pues, que en (7.165) α, β, γ y δ satisfacen las condiciones de unitaridad
(7.167) y de unimodularidad (7.168).
En (7.163) se requiere conocer la matriz Q̃Ṽ Q̃† . Esto es:
   
α β V11 V12 α⋆ γ⋆
Q̃Ṽ Q̃† =    
γ δ V21 V22 β⋆ δ⋆
(7.169)
!
|α|2 V11 +|β|2 V22 +α⋆ βV21 +αβ ⋆ V12 γ ⋆ αV11 +γ ⋆ βV21 +δ⋆ αV12 +βδ⋆ V22
=
α⋆ γV11 +α⋆ δV21 +β ⋆ γV12 +β ⋆ δV22 |γ|2 V11 +|δ|2 V22 +γ ⋆ δV21 +δ⋆ γV12
De (7.163) y (7.169) obtenemos las siguientes relaciones:
3
√ X
2 a1j Vj = (γ ⋆ α + α⋆ γ)V11 + (γ ⋆ β + α⋆ δ)V21
j=1
+(δ ⋆ α + β ⋆ γ)V12 + (βδ ⋆ + β ⋆ δ)V22
3
√ X
2 a2j Vj = i(γ ⋆ α − α⋆ γ)V11 + i(γ ⋆ β − α⋆ δ)V21
j=1 (7.170)
+i(δ ⋆ α − β ⋆ γ)V12 + i(βδ ⋆ − β ⋆ δ)V22
3
√ X
2 a3j Vj = (|α|2 − |γ|2 )V11 + (|β|2 − |δ|2 )V22
j=1
+(α⋆ β − γ ⋆ δ)V21 + (αβ ⋆ − δ ⋆ γ)V12
Como por otra parte:
1
V1 = √ (V12 + V21 )
2
i
V1 = √ (V12 − V21 ) (7.171)
2
1
V1 = √ (V11 + V22 )
2
Obtenemos usando (7.170) y (7.171) las siguentes relaciones entre las componentes
de Ã y las de Q̃, igualando coeficientes de los Vij :
a13 = γ ⋆ α + α⋆ γ
(a11 + ia13 ) = δ⋆α + β ⋆γ
a23 = i(γ ⋆ α − α⋆ γ)
(7.172)
(a21 + ia22 ) = i(δ ⋆ α − β ⋆ γ)
a33 = |α|2 − |γ|2
(a31 + ia32 ) = αβ ⋆ − δ ⋆ γ
Con lo cual la matriz Ã toma la forma:

 1 i 2 
(α2 − γ 2 + δ 2 − β 2 ) (γ − α2 + δ 2 − β 2 ) γδ − αβ
 2 2 
 
 
Ã =  i
 (α2 + γ 2 − β 2 − δ 2 )
1 2
(α + γ 2 + β 2 + δ 2 ) −i(αβ + γδ)

 (7.173)
 2 2 
 
βδ − αγ i(αγ + βδ) αδ + βγ
donde hemos usado además las relaciones α⋆ = δ, γ ⋆ = −β de la ecuación (7.168). Ã

es una matriz que está expresada en términos de α, β, γ, δ, o sea que los parámetros
α, β, γ, δ, sirven para especificar las rotaciones de un cuerpo rı́gido. Son llamados los
parámetros de Cayley-Klein, estudiados por estos autores en los años 1875-1879.
En resumen, hemos mostrado que si al efectuar una rotación un vector V~ ′ se cambia
~ , entonces el diádico V~~ en el espacio bidimensional que corresponde
~ ′ = ÃV
en el vector V
~ ′ ~~ ~~ ~~ †
a V~ se transforma en el diádico V~ = Q· V ·Q . Por tanto, a cada rotación del cuerpo rı́gido
le corresponde una matriz Ã y una matriz Q̃ 2 × 2. La matriz Q̃ es unitaria, Q̃Q̃† = I, ˜ y
unimodular, det Q̃ = 1. El conjunto de todas las matrices unitarias y unimodulares 2 × 2
es llamado el grupo SU (2). Hay pues un homomorfismo entre los grupos SO(3) y SU (2).
Si en (7.173) se hacen las siguientes sustituciones de los parámetros de Cayley-Klein en
términos de e0 , e1 , e2 y e3 :
α = e0 + ie3 ; γ = −β ⋆
(7.174)
β = e2 + ie1 ; δ = α⋆
Se obtiene exactamente la matriz (7.141), o sea que en efecto e0 y ei son los

parámetros de Euler definidos en (7.142). Usando (7.174) y las expresiones para e0 y ei
en términos de los ángulos de Euler, ecuación (7.142), obtenemos para α, β, γ y δ en
términos de los ángulos de Euler:
θ θ
α = ei(φ+ψ)/2 cos ; β = iei(ψ−φ)/2 sen
2 2
(7.175)
θ θ
γ = ie−(ψ−φ)/2 sen ; δ = e−i(φ+ψ)/2 cos
2 2
~~
El diádico Q definido en (7.166) puede escribirse en términos de los diádicos de
~
Pauli y el diádico unidad, ~~σ i , ~1, reemplazando (7.151) en (7.165):
~~ 1 ~ 1 1 i
Q = (α + δ)~1 + (α − δ)~~σ z + (β + γ)~~σ x + (β − γ)~~σ y (7.176)
2 2 2 2
que usando (7.174) toma la forma:3
~~
Q = e0~
~1 + ie1~~σ x + ie2~~σ y + ie3~~σ z (7.177)
3 Los e0 , ei , forman un sistema de cuaterniones.
Para una rotación alrededor del eje x1 , de acuerdo con (7.142) se tiene que e1 =
senθ/2, e2 = e3 = 0. Por tanto:
~~ θ~~1 + i sen θ ~
Q θ = cos ~σ x (7.178)
2 2
donde θ es el ángulo de rotación. Para una rotación por φ alrededor del eje x3 :
~~ φ~~1 + i sen φ ~
Q φ = cos ~σ z (7.179)
2 2
Cada diádico de Pauli ~
~σ i está asociado con una rotación alrededor de un eje par-
ticular y puede considerarse como el “rotador unitario” para dicho eje.
Ejemplo 7.8.1 Mostrar que los diádicos de Pauli anticonmutan mutuamente, esto es,
que:
~
~σ i · ~
~σ j = −~
~σ j · ~
~σ i (7.180)
Hagamos los nueve productos ~~σ i · ~~σ j , usando las definiciones (7.150):
~ ~
~σ x · ~
~σ x = ê1 ê1 + ê2 ê2 = ~1 ; ~~σ x · ~~σ y = iê1 ê1 − iê2 ê2 = i~~σ z
~
~σ x · ~
~σ z = −ê1 ê2 + ê2 ê1 = −i~~σy ; ~~σ y · ~~σ x = −iê1 ê1 + iê2 ê2 = −i~~σ z
~ ~σ y = ê1 ê1 + ê2 ê2 = ~

~σ y · ~ ~1 ; ~~σ y · ~~σ z = iê1 ê2 + iê2 ê1 = i~~σ x (7.181)
~
~σ z · ~
~σ x = ê1 ê2 − ê2 ê1 = i~
~σ y ; ~~σ z · ~~σ y = −iê1 ê2 − iê2 ê1 = −i~~σx
~ ~σ z = ê1 ê1 + ê2 ê2 = ~

~σ z · ~ ~1
Las ecuaciones (7.181) se pueden escribir en forma compacta ası́:

3
X
~ ~σ j = ~
~σ i · ~ ~1δij + i ǫijk ~
~σ k (7.182)
k=1
donde ǫij es el tensor de Levi-Civita completamente antisimétrico. Se puede ver direc-

tamente que las ~~σ i obedecen las relaciones de conmutación siguientes:
3
X
~
~σ i · ~
~σ j − ~
~σ j · ~
~σ i = 2i ǫijk ~~σ k (7.183)
k=1
y de anticonmutación:
~σ i · ~
~ ~σ i = 2~
~σ j · ~
~σ j + ~ ~1δij (7.184)
~~
Ejemplo 7.8.2 Mostrar que Q θ puede escribirse simbólicamente como:
~~ i~
~
σx (θ/2)
Q θ = e (7.185)
2
donde el exponencial denota una serie infinita de términos. Como según (7.181) ~~σ x ≡
~ 2n ~ 2n+1
~
~σ x · ~
~σ x = ~1, se sigue que ~~σ = ~1 y que ~~σ = ~~σ x para n = 0, 1, 2, ... Por lo tanto:
x x
∞
X 2n
θ 1 ~~σ x θ θ
cos ~
~σ x ≡ (−1)n = ~~1 cos
2 n=0
(2n)! 2 2
(7.186)
∞
X 2n+1
~ θ 1 ~ θ θ
sen ~σ x ≡ (−1)n
~σ x = ~~σ x sen
2 n=0
(2n + 1)! 2 2
~~
Con lo cual Q θ puede expresarse en la forma:
~~ ~ θ θ θ θ ~
Q ~
θ = 1 cos + +i~~σ x sen = cos(~~σ x ) + i sen(~~σ x ) = ei~σ x (θ/2) (7.187)
2 2 2 2
†
Como ~
~σ i son hermı́ticos, ~~σ i = ~~σ i , se sigue que:
~~ † −i~
~
σx (θ/2)
Q θ = e (7.188)
Ejemplo 7.8.3 Hallar la forma de la matriz de rotación para una rotación arbitraria,
definida por los ángulos de Euler.
~~
Q puede escribirse como el producto de tres rotaciones sucesivas, en virtud del
homomorfismo con el grupo de rotaciones:
~~ † ~ ~ ~
Q = ei~σz (ψ/2) ei~σ µ1 (θ/2) ei~σ z (φ/2) (7.189)
~~
Las tres rotaciones que aparecen en Q son alrededor de los ejes z, µ1 y z. Es
deseable expresarlas en términos de rotaciones alrededor de ejes del mismo sistema de
coordenadas. Para ello hay que notar que cada uno de los diádicos que aparece en el
operador de rotación está asociado con el respectivo eje de rotación.
Como el eje x conduce al eje µ1 por medio de la rotación Aφ , correspondientemente
~
~σ µ1 será, de acuerdo con la ecuación (7.160):
~ ~ ~
~σ µ1 = ei~σ z (θ/2)~~σ x · e−i~σz (θ/2) (7.190)
Como por otra parte:

θ θ
ei~σµ1 (θ/2) = ~
~
~1 cos + i~~σ µ1 sen (7.191)
2 2
~~
Se sigue, usando la ecuación (7.190) y la unitariedad Q φ:
~ ~ ~ ~
ei~σµ1 (θ/2) = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (φ/2) (7.192)
~~
Por tanto Q toma la foma:
~~ ~ ~ ~
Q = ei~σz (ψ/2) ei~σ z (φ/2) ei~σ x (θ/2) (7.193)
Por otra parte, el eje z se obtiene del eje µ′3 por medio de la rotación Aψ , y µ′1 se
obtiene de µ3 = z por medio de Ãθ . Por lo tanto ~~σ z puede escribirse en términos de ~~σ z
como:
~ ~ ~ ~ ~
~σ z = ei~σ z (ψ/2) ei~σ µ1 (θ/2)~
~σ z e−i~σµ1 (θ/2) e−i~σz (ψ/2) (7.194)
Usando (7.192):
~ ~ ~ ~ ~ ~
~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · e−i~σz (φ/2) · σz .ei~σ z (φ/2) ·
(7.195)
−i~
~
σ x (θ/2) −i~
~
σ z (φ/2) −i~
~
σ z (ψ/2)
e ·e ·e
~~ ~~
Notando que ~
~σ z y Q φ conmutan y que Qφ es unitario:
~ ~ ~ ~ ~ ~ ~
~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σx (θ/2) · σz · e−i~σ x (θ/2) · e−i~σz (φ/2) · e−i~σ z (ψ/2) (7.196)
~ ~ ~ ~ ~ ~
ei~σ z (ψ/2) = ei~σz (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σ z (ψ/2) · e−i~σ x (θ/2) ·
(7.197)
~ ~
e−i~σz (φ/2) · e−i~σz (ψ/2)
O sea:
~ ~ ~ ~ ~ ~
ei~σ z (ψ/2) = ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σz (ψ/2) · e−i~σx (θ/2) · e−i~σz (φ/2) (7.198)
~~
Reemplazando (7.198) en (7.193) obtenemos para Q:
~~ ~ ~ ~ ~ ~ ~ ~
Q = ei~σz (φ/2) ·ei~σ x (θ/2) ·ei~σ z (ψ/2) ·e−i~σ x (θ/2) ·e−i~σ z (φ/2) ·ei~σ z (φ/2) ·ei~σ x (θ/2) (7.199)
~~
Con lo cual, usando la unitaridad de los operadores, se obtiene finalmente para Q:
~~ ~ ~ ~
Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2) (7.200)
~~
Hemos conseguido expresar a Q en términos de rotaciones alrededor de los ejes
~~
del sistema de coordenadas espacial. Es posible, de manera análoga, expresar a Q en
~~
términos de rotaciones respecto a los ejes fijos al cuerpo rı́gido Q de donde toma la
forma:
~~ ~ ~ ~
Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2) (7.201)
Ejercicio 7.8.1 Demostrar que si (e0 , ei ) y (e′0 , e′i ) son los parámetros de Euler que des-
criben dos rotaciones A y A′ , entonces los parámetros de la rotación A” = A′ A están
expresados en términos de los parámetros de las rotaciones A, A′ , por:
e′1 ′ = e1 e′0 + e2 e′3 − e3 e′2 + e0 e′1
e′2 ′ = −e1 e′3 + e2 e′0 + e3 e′1 + e0 e′2

(7.202)
e′3 ′ = e1 e′2 − e2 e′1 + e3 e′0 + e0 e′3
e′0 ′ = e0 e′0 − e1 e′1 − e2 e′2 − e3 e′3
Ejercicio 7.8.2 Demostrar que si (α, β, γ, δ) y (α′ , β ′ , γ ′ , δ ′ ) son los parámetros de Cayley-
Klein que describen dos rotaciones A y A′ , entonces los parámetros (α′′ , β ′′ , γ ′′ , δ ′′ ) de
la rotación A′′ = A′ A están expresados en términos de los parámetros de A, A′ , por:
α′′ = αα′ + γ ′ β β” = αβ ′ + βδ ′
(7.203)
γ ′′ = γα′ + δ ′ γ δ” = γβ ′ + δδ ′
Ejercicio 7.8.3 Interpretación geométrica del homomorfismo entre SO(3) y SU (2). Sea
una esfera y una figura geométrica F en ella (véase figura 7.10). Se coloca la esfera sobre
un plano. La normal al plano en el punto de contacto corta a la esfera en el punto T .
La proyección estereográfica de F en el plano es P . Al punto T se le llama vértice de la
proyección.
Figura 7.10 Figura geométrica F dentro de una esfera
Al rotar la esfera alrededor de n̂, en la figura, F se cambia en F ′ y su proyección

estereográfica P se cambia en P ′ . Entonces a cada rotación de la esfera le corresponde
cierta transformación en el plano, llamada transformación homográfica.
Estas transformaciones cambian cı́rculos en el plano por cı́rculos en el plano. Sea
z = x + iy un punto del plano y z ′ = x′ + iy ′ el punto del plano que se obtiene de z
mediante la transformación homográfica. (a) Mostrar que:
az + b
z′ = (7.204)
cz + d
donde a, b, c y d son constantes reales o complejas.

(b) Mostrar que el resultado de dos homografı́as sucesivas:
α′ z + β ′ α′′ z ′ + β ′′
z′ = y z ′′ = (7.205)
γ ′z + δ′ γ ′′ z ′ + δ ′′
Es una homografı́a:
α′′′ Z + β ′′′
z ′′′ = (7.206)
γ ′′′ Z + δ ′′′
donde la relación entre (α′′′ , β ′′′ , γ ′′′ , δ ′′′ ) con (α′ , β ′ , γ ′ , δ ′ ) y (α′′ , β ′′ , γ ′′ , δ ′′ )
está dada por expresiones análogas a (7.203). Argumentar que lo anterior muestra cone-
~~
xión entre las rotaciones y las transformaciones homográficas, y que por tanto las Q del
grupo SU (2) corresponden a transformaciones homográficas, donde los parámetros de
Cayley-Klein son los parámetros que caracterizan la transformación homográfica corres-
pondiente a una rotación de un sólido rı́gido (véase el texto de L.V. Ahlfors, Análisis de
variable compleja, Aguilar, 1966).
7.9. Las rotaciones infinitesimales. Cinemática de las

rotaciones
Las coordenadas rı́gidamente unidas al cuerpo rı́gido permiten representar cual-
quier punto del mismo ~r = (x1 , x2 , x3 ). La rigidez del cuerpo se puede expresar diciendo
que ningún punto se puede desplazar con relación al origen.
Es decir:
~r˙ = 0 (7.207)
Los desplazamientos del cuerpo son detectables en el sistema de coordenadas es-

pacial relacionado con el del cuerpo rı́gido por medio de la matriz de rotación ÃT ,
~r = ÃT ~r. Como el cuerpo rı́gido se desplaza respecto al sistema de coordenadas espa-
cial, ÃT habrá de ser función del tiempo, con lo cual:
~r(t) = ÃT (t)~r (7.208)
Es posible escoger los sistemas de coordenadas de modo que ~r(0) = ~r, lo cual
implica que:
ÃT (0) = I˜ (7.209)
Podemos decir que el cuerpo rı́gido en el tiempo t estará descrito por la transforma-
ción ÃT (t) que evoluciona de manera continua a partir de la transformación identidad.
Además es posible suponer que para un tiempo infinitesimal, ÃT (∆t) difiere de la iden-
tidad I˜ por términos del orden de ∆t.
Rotaciones infinitesimales. Al cabo de un tiempo infinitesimal ∆t, un punto del

cuerpo se habrá desplazado una cantidad infinitesimal ∆~r = ~r(∆t) − ~r(0) = ~r(∆t) − ~r0 ,
respecto a los ejes espaciales. Por lo tanto:
~r(∆t) = ~r0 + ∆~r (7.210)
Existe alguna matriz, con componentes infinitesimales, ǫ̃(∆t), tal que:
∆~r = ǫ̃(∆t)~r0 (7.211)
Por lo cual:
~r(∆t) = (I˜ + ǫ̃)~r0 = (I˜ + ǫ̃)~r(0) (7.212)
La matriz I˜ + ǫ̃ describe cómo están relacionadas las componentes del vector de
posición de un punto del cuerpo rı́gido en los sistemas de coordenadas espacial y del
cuerpo rı́gido, según la interpretación pasiva de la matriz de rotación cuando los ejes
fijos al cuerpo rı́gido han rotado alrededor de un eje n̂ un ángulo δΦ en el sentido de la
mano derecha. Desde el punto de vista activo, I˜ + ǫ̃ describe cómo cambia el vector de
posición de un punto del cuerpo rı́gido, en el sistema de coordenadas espacial, cuando
se rota el cuerpo rı́gido alrededor del eje n̂ por un ángulo δΦ según la regla de la mano
izquierda. De acuerdo con esta última interpretación, para Φ infinitesimal, Ã = I˜ + ǫ̃
estará dada por la ecuación (7.138):
 
1 C3 δΦ −C2 δΦ
 
 
I˜ + ǫ̃ = 
 −C 3 δΦ 1 C 1 δΦ 
 (7.213)
 
C2 δΦ −C1 δΦ 1
donde C1 , C2 y C3 son los cosenos directores del eje de rotación. De acuerdo con (7.210),
(7.137) y (7.211), podemos escribir:
∆~r = ǫ̃~r0 = (~r0 × n̂)δΦ = −(n̂δΦ) × ~r0 (7.214)
Usando el tensor de Levi-Civita para expresar el producto vectorial:
3
X 3 X
X 3
ǫij x0j = ǫijk x0j Ck δΦ (7.215)
j=1 j=1 k=1
Como ~r0 es arbitrario, se debe cumplir:

3
X
ǫij = ǫijk Ck δΦ (7.216)
k=1
Es decir, la matriz ǫ̃ es completamente antisimétrica: ǫ̃T = −ǫ̃ y proporcional a δΦ.

Las rotaciones infinitesimales próximas a la identidad tienen la propiedad conmutativa:
(I˜ + ǫ̃a )(I˜ + ǫ̃b ) = I˜ + ǫ̃a + ǫ̃b + ǫ̃a ǫ̃b
(7.217)
(I˜ + ǫ̃b )(I˜ + ǫ̃a ) = I˜ + ǫ̃b + ǫ̃a + ǫ̃b ǫ̃a
Vemos que al primer orden en la cantidad infinitesimal δΦ las rotaciones conmutan.

En general dos rotaciones finitas no conmutan. Tampoco conmuta una rotación finita
con una infinitesimal:
Ã(I˜ + ǫ̃) = Ã + Ãǫ̃

(7.218)
(I˜ + ǫ̃)Ã = Ã + ǫ̃Ã
La rotación inversa a I˜ + ǫ̃ es I˜ − ǫ̃, al primer orden en δΦ:
(I˜ + ǫ̃)(I˜ − ǫ̃) = I˜ − ǫ̃2 (7.219)
O sea que:
~r0 = (I˜ − ǫ̃)~r (7.220)
Por tanto al primer orden en δΦ, ǫ̃~r = ǫ̃~r0 = ∆~r.
Generadores infinitesimales del grupo de rotaciones. La matriz ǫ̃ puede

escribirse en la forma siguiente, según (7.213):
   
0 0 0 0 0 −1
   
   
ǫ̃ = C1 
 0 0 1  δΦ + C2  0 0 0  δΦ
  
   
0 −1 0 1 0 0
  (7.221)
0 1 0
 
 
+C3   −1 0 0  δΦ

 
0 0 0
o también:
3
X
ǫ̃ = Ci G̃i δΦ = (C1 ê2 ∧ ê3 + C2 ê3 ∧ ê1 + C3 ê1 ∧ ê2 )δΦ (7.222)
i=1
Las matrices G̃i se llaman los generadores infinitesimales del grupo de rotaciones.
Satisfacen:
~~ 1
G i = ǫijk êj ∧ êk (7.223)
2
El conmutador de dos generadores obedece la siguiente propiedad:
3
X
G̃i G̃j − G̃j G̃i = ǫijk G̃k (7.224)
k=1
Las ecuaciones (7.224) definen el álgebra de Lie del grupo de rotaciones. Con esta
notación podemos escribir a (7.214) como:
X 3
d~r
= Ci G̃i ~r (7.225)
dΦ i=1
Estas fórmulas, como hemos dicho, están dentro de la interpretación activa de las
rotaciones.
Velocidad angular. Se define el vector velocidad angular como:

dΦ d~r
ω = n̂
~ ⇒ = −~ω × ~r (7.226)
dt dt
El vector ~ω está situado en el eje de la rotación. Esta dirección se conoce como eje
instantáneo de rotación: el eje n̂ no cambia al realizar la rotación infinitesimal por un
ángulo dΦ. Sin embargo el desplazamiento del cuerpo rı́gido puede involucrar el cambio
del eje n̂. Por esta razón ~ω no es en general la derivada temporal de algún vector; en
otras palabras, Ci dΦ no es el diferencial de alguna cantidad, a no ser que los Ci no
cambien con el tiempo.
Cálculo de d~r/dt cuando n̂ también cambia con el tiempo. En este caso

partimos directamente de la expresión:
~r(t) = Ã(t)~r0 (7.227)
donde de la matriz Ã convierte al vector ~r0 en el vector ~r. El vector ~r˙ estará dado por:
˙ r = Ã
~r˙ = Ã~ ˙ ÃT ~r (7.228)
0
Por otra parte, ~r0 = ÃT ~r nos da:
0 = Ã ˙ T ~r = −ÃÃ
˙ T ~r + ÃT ~r˙ ⇒ ~r˙ = −(ÃT )−1 Ã ˙ T ~r (7.229)
Definimos la matriz Ω̃ ası́:
˙ T = Ã
Ω̃ = −ÃÃ ˙ ÃT (7.230)
De (7.228) y (7.229) vemos que ~r = Ω̃~r0 . Además:
˙ T = −(Ã
Ω̃ = −ÃÃ ˙ ÃT )T = −Ω̃ (7.231)
Por tanto Ω̃ es una matriz antisimétrica. Sus elementos son entonces de la forma:
3
X
Ωij = ǫijk ωk (7.232)
k=1
Entonces (7.228) se puede escribir como:

3 X
X 3
ẋi = (Ω~r)i = ǫijk ωk xj = (~r × ~ω)i = −(~ω × ~r)i (7.233)
j=1 k=1
Por tanto:
~r˙ = −~
ω × ~r (7.234)
Podemos expresar a ωi en términos de las Ωij . Para ello multiplicamos (7.232) por
ǫijl y sumamos sobre i, j:
X 3
3 X 3 X
X 3
ǫijl Ωij = ǫijl ǫijk ωk (7.235)
i=1 j=1 i=1 k=1
Ahora usamos la siguiente propiedad de la densidad de Levi-Civita:
3 X
X 3
ǫijl ǫijk = 2δlk (7.236)
i=1 j=1
con lo cual llegamos a:
3 3
1 XX
ωl = ǫijl Ωij (7.237)
2 i=1 j=1
Usando la definición de Ω̃, (7.230), obtenemos:
3 3 3
1 XXX
ωl = Ȧik Ajk ǫijl (7.238)
2 i=1 j=1
k=1
donde ~ω es la velocidad angular de rotación del cuerpo rı́gido en el sistema de coorde-

nadas espacial, de acuerdo con la interpretación activa de las rotaciones que estamos
utilizando. La ecuación (7.238) permite hallar las componentes de ω en términos de la
representación que se tenga de la matriz Ã.
En términos de los parámetros Ci y Φ, usamos la expresión (7.138) para Ã. Notamos
que los elementos de Ã son de la forma:
3
X
Aij = δij cos Φ + Cj Ck (1 − cos Φ) + ǫjkl Cl senΦ (7.239)
l=1
Con lo cual Ȧik es:
X3
d d
Ȧik = −δik senΦ Φ̇ + [Ci Ck (1 − cos Φ)] + ǫjkm (Cm senΦ) (7.240)
dt m=1
dt
Como ATkj = Ajk , podemos escribir:

3
X d
Ȧik Ajk = −δik senΦ cos Φ Φ̇ + cos Φ [Ci Cj (1 − cos Φ)]+
dt
k=1
3
X d
ǫijm cos Φ (Cm senΦ) − Ci Cj (1 − cos Φ)senΦ Φ̇+
m=1
dt
d
Cj [Ci n̂(1 − cos Φ)] · n̂(1 − cos Φ)+
dt
3 (7.241)
X d
ǫikm (Cm senΦ)Cj Ck (1 − cos Φ)−
m=1
dt
3
X 3
X d
ǫjil Cl sen2 Φ Φ̇ + ǫjkl [Ci Ck (1 − cos Φ)]Cl senΦ+
dt
l=1 l=1
3
X d
(δji δlm − δjm δli )Cl senΦ (Cm senΦ)
dt
l,m=1
P3
donde hemos usado la conocida propiedad del tensor de Levi-Civita, l=1 ǫkij ǫklm =
δil δjm − δim δjl . Las ecuaciones (7.241) se simplifican notando que n̂.n̂˙ = 0 y n̂ × n̂ = 0 y
P3 ~ ~
k=1 ǫijk Ai Bj = (A × B)k . Luego, al multiplicar por ǫikl y sumar sobre i y sobre j, no-
tando además que ǫijk se anula cuando tiene subı́ndices repetidos, obtenemos finalmente
para ~ ω:
ω = n̂Φ̇ + n̂˙ × n̂(1 − cos Φ) + n̂˙ senΦ

~ (7.242)
En términos de los parámetros de Euler, definidos en (7.139):
ω = 2e0~e˙ − 2ė0~e + 2~e˙ × ~e

~ (7.243)
Con la interpretación activa de las rotaciones, la velocidad angular que hemos ob-
tenido nos permite hallar, por medio de (7.234), la forma en que cambia con el tiempo
el vector de posición de un punto arbitrario del cuerpo rı́gido.
La velocidad angular en la interpretación pasiva de las rotaciones. En

esta interpretación, ~r(t) es el vector de posición de un punto en el sistema de coordenadas
espacial, y ~r en el sistema de coordenadas del cuerpo rı́gido. En este caso:
~r(t) = ÃT (t)~r (7.244)
y ~r˙ estará dado por:
~r˙ = Ω̃~r = −~
ω × ~r (7.245)
ahora ~
ω es la velocidad angular de los ejes unidos al cuerpo rı́gido en el sistema de
coordenadas espacial. El tratamiento es igual al anterior, con sólo reemplazar a Ã por
ÃT :
Ω̃ = −ÃT Ã ˙ T Ã
˙ = Ã (7.246)
donde ÃT se obtiene de (7.138) con sólo reemplazar a Φ por −Φ. ~ω estará dada en
términos de Ã por:
3 3 3
1 XXX T
ωl = Ȧik Akj ǫijl (7.247)
2 i=1 j=1
k=1
Se obtiene entonces que:
~ = −n̂Φ̇ + n̂˙ × n̂(1 − cos Φ) − n̂˙ senΦ

ω (7.248)
y en términos de los parámetros de Euler:
~ = −2ė0~e + 2e0~e˙ + 2~e˙ × ~e

ω (7.249)
ahora n̂ es el eje alrededor del cual giran los ejes coordenados unidos al cuerpo rı́gido,
y Φ es el ángulo de rotación en el sentido de la regla de la mano derecha (contrario a
las agujas del reloj). ~
ω puede también ser evaluada en términos de los ángulos de Euler.
Para ello hay varias posibilidades de cálculo.
(a) Considerar que ~ ω tiene componentes a lo largo de los ejes de las rotaciones
sucesivas que definen los ángulos de Euler:
~ = φ̇êz + θ̇êµ1 + ψ̇êz

ω (7.250)
Obviamente (7.250) permite hallar a ω ~ respecto a los ejes espaciales (x, y, z) o

respecto a los ejes rotantes (x, y, z). Para hallar a ~ω respecto a los ejes espaciales, basta
expresar a ~eµ1 y êz en términos de (~ex , ~ey , ~ez ). Usando las expresiones (7.30), podemos
escribir:
êµ1 = (êµ1 · êx )êx + (êµ1 · êy )êy + (êµ1 · êz )êz
= cos φ êx + senφ êy

(7.251)
êz = (êz · êx )êx + (êz · êy )êy + (êz · êz )êz
= senθ senφ êx + senθ cos φêy + cos θêz
donde en (7.251) hemos usado la ecuación (7.122). Las ecuaciones (7.251) permiten
escribir a (7.250) en la forma:
ω = (φ̇ + cos ψ̇)êz + (θ̇senθ − ψ̇ senψ cos φ)êy +

~
(7.252)
(θ̇ cos φ + ψ̇ senθ senφ)êx
De manera similar se obtiene para ~ω respecto a los ejes fijos al cuerpo rı́gido:
~ω = (ψ̇ + φ̇ cos θ)êz + (φ̇ senθ cos ψ − θ̇ senψ)êy
(7.253)
+(φ̇ senθ senψ + θ̇ cos ψ)êx
(b) La otra posibilidad de cálculo consiste en usar la ecuación que define a Ω̃,
(7.246). Ã se puede expresar como producto de tres rotaciones según (7.131). Por tanto:
Ω̃ = ÃTφ ÃTθ ÃTψ (Ã ˙

˙ Ã Ã + Ã Ã ˙
ψ θ φ ψ θ Ãφ + Ãψ Ãθ Ãφ ) (7.254)
Usando la ortogonalidad de las matrices Ã:

˙ + ÃT ÃT Ã
Ω̃ = ÃTφ Ã ˙
˙ Ã + ÃT ÃT ÃT Ã
φ φ θ θ φ φ θ ψ ψ Ãθ Ãφ (7.255)
˙ , ...
Si llamamos Ω̃φ = ÃTφ Ãφ
Ω̃ = Ω̃φ + ÃTφ Ω̃θ Ãφ + ÃTφ ÃTθ Ω̃φ Ãθ Ãφ (7.256)
Usando las definiciones (7.127) se llega fácilmente a:

   
0 1 0 0 0 0
   
   
Ω̃φ = φ̇  −1 0 0  Ω̃θ = θ̇  0 0 1 
  

   
0 0 0 0 −1 0
  (7.257)
0 1 0
 
 
Ω̃ψ = ψ̇ 
 −1 0 0 

 
0 0 0
con lo cual (7.256) conduce al resultado (7.252).

(c) Otra vı́a es expresar a ~ω en términos de los ángulos de Euler usando (7.249) y
(7.142), lo cual se deja como ejercicio al lector.
Las ecuaciones (7.252) y (7.253) muestran que no hay una relación simple entre las
componentes de ~ ω expresadas respecto a los ejes fijos al sólido rı́gido y respecto a los ejes
espaciales. La ecuación (7.247) da las componentes de ω ~ respecto a los ejes espaciales.
Llamaremos ~ω a la velocidad angular respecto a los ejes fijos al sólido rı́gido. Para hallar
~ empecemos por notar que ~r˙ = Ω̃~r, de (7.245). Como ~r = ÃT ~r, tenemos que:
ω
~r˙ = Ω̃ÃT ~r (7.258)
De transformar ~r˙ a las coordenadas del sólido rı́gido obtenemos:
Ã~r˙ = ÃΩ̃ÃT ~r (7.259)

Claramente Ã~r˙ no es ~r˙ , puesto que esta última es cero. Usando (7.246) y la or-
togonalidad de Ã obtenemos que Ã Ω̃ Ã = ÃÃ ˙ T , matriz que llamaremos Ω̃ que es Ω̃
transformada a las coordenadas fijas al sólido rı́gido. La matriz Ω̃ es antisimétrica:
T
Ω̃ = Ã ˙ ÃT = −ÃΩ̃ÃT = −Ω̃
˙ ÃT = Ã(ÃT Ã) (7.260)
por tanto puede expresarse como:
3
X
Ωij = ǫijk ω k (7.261)
k=1
Esto conduce a:
Ã~r˙ = Ω̃~r = −ω
~ × ~r (7.262)
3 3 3
1 XXX
ωl = ǫijk Aik ȦTkj (7.263)
2 i=1 j=1
k=1
Comparando a (7.238) y (7.263) vemos que ω ~ y ~ω en el punto de vista activo de

las rotaciones son antiparalelas, como es de esperarse, o sea que, de acuerdo con (7.243):
~ = −2e0~e˙ + 2~eė0 − 2~e˙ × ~e
ω (7.264)
Usando (7.264) y (7.142) se obtiene el resultado (7.253).
No existen en general, funciones λi (φ, θ, ψ) tales que:
d
ωi = λi (φ, θ, ψ) (7.265)
dλ
Por ejemplo, si ω1 = λ̇1 se deberı́a cumplir que:
dλ1 dλ1 dλ1
φ̇ + θ̇ + ψ̇ = θ̇ cos θ + ψ̇ senθ senφ (7.266)
dφ dθ dψ
y por tanto:
dλ1 dλ1 dλ1
=0; = cos φ ; = senθ senφ (7.267)
dφ dθ dψ
λ1 no existe puesto que:
∂ 2 λ1 ∂ 2 λ1
= 0 ; en tanto que = −senφ
∂θ ∂φ ∂φ∂θ
∂ 2 λ1 ∂ 2 λ1
= 0 ; en tanto que = cos θ senφ (7.268)
∂ψ ∂θ ∂θ∂ψ
∂ 2 λ1 ∂ 2 λ1
= 0 ; en tanto que = sen θ cos φ
∂ψ ∂φ ∂φ∂ψ
La ecuación (7.265) se cumple solamente cuando φ = θ = 0 o sea cuando ω1 = 0.

Las componentes de ω ~ son combinaciones no integrables de φ̇, θ̇, ψ̇ (o de las derivadas
temporales de los parámetros usados para describir la rotación), llamadas las derivadas
de cuasicoordenadas, o seudocoordenadas. Las ecuaciones de Appell son las ecuaciones
de movimiento cuando se usan seudocoordenadas para describir el sistema (véase el texto
de Gantmacher, Lectures in analytical mechanics, sección 10).
El cálculo de ωi implica considerar desplazamientos infinitesimales alrededor de
una posición dada del sólido rı́gido. Pero hay maneras diferentes de realizar esos des-
plazamientos. Como una rotación finita no conmuta con una infinitesimal, depende del
orden en que se efectúen las transformaciones. Es de esperarse que ωi sea una derivada
total respecto al tiempo sólo en el caso en que el desplazamiento infinitesimal sea alre-
dedor del mismo eje de rotación en que se hizo la rotación finita. Por ejemplo, si Ã = Ãφ
y ǫ̃ = ǫ̃φ con θ = φ = 0, entonces ω1 = 0; ω2 = 0; ω3 = φ̇.
Tasa de cambios temporales de un vector. Seguimos con el punto de vista

pasivo de las rotaciones. Un vector arbitrario G~ cambia con el tiempo en el sistema de
~ respecto a los ejes espaciales proviene
coordenadas fijo al cuerpo rı́gido. El cambio de G
de dos efectos: de la rotación del sistema de ejes del sólido rı́gido y de la rotación
~ Es decir:
intrı́nseca de G.

~
dG = ~˙
G dt
cuerpo cuerpo
(7.269)
~
dG = ~
−~ω × G dt
rotacional espacio
En (7.269) ~
ω está dada por (7.248), que es el negativo de la velocidad angular que
usan algunos
autores para describir
las
rotaciones desde el punto de vista pasivo y para
los cuales dG~ = −~ω × G ~ dt.
rotacional espacio
~ visto en los ejes espaciales es:
Entonces el cambio en G

~
dG ~
= dG ~
− ~ω × Gdt (7.270)
espacio cuerpo
o también:
! !
~
dG ~
dG
= ~
− ~ω × G (7.271)
dt dt
espacio cuerpo
~ es:
La segunda derivada temporal de G
! ! !
~
d2 G ~
d2 G ~
dG
2
= 2
− 2~ω ×
dt dt dt
espacio cuerpo espacio (7.272)
+~ω × (~ω × G) ~˙ × G
~ −ω ~
La ecuación (7.270), y por tanto también (7.271) y (7.272), es válida sólo cuando
los ejes espaciales y del cuerpo rı́gido coinciden instantáneamente. Para una posición
arbitraria del cuerpo rı́gido se cumple:
~ =
G ~
ÃG
~˙ =
G ˙G
Ã ~˙
~ + ÃG (7.273)
~¨ =
G ¨G
Ã ˙G
~ + 2Ã ~˙ + ÃG
¨
~
~˙ y G
Las (7.273) pueden expresarse en función de ~ω . Los vectores G ~¨ se pueden
escribir respecto a los ejes espaciales ası́:
~˙ = G
ÃT G ~˙ + ÃT Ã
˙G~ y ~¨ = G
ÃT G
¨~ ˙G
+ 2ÃT Ã ~˙ + ÃT Ã
¨G ~ (7.274)
˙ obtenemos:
Usando la definición Ω̃ = −ÃT Ã,
Ω̃˙ = ˙ T Ã
−Ã ˙ − ÃT Ã
¨
(7.275)
2
Ω̃ = ˙ T Ã −ÃT Ã
Ã ˙ T Ã
˙ = −Ã ˙ ⇒ Ω̃˙ = Ω̃2 − ÃT Ã
¨
~˙ = G
ÃT G ~˙ − Ω̃G
~
(7.276)
~¨ = G
ÃT G
¨~ ~˙ + (Ω̃2 − Ω̃)
− 2Ω̃G ˙ G~
Usando (7.245) obtenemos:

~ = −~
Ω̃G ~
ω×G (7.277)
˙ T = d(Ω̃T )/dt = −Ω̃

Como Ω̃ ˙ se sigue también que:
Ω̃˙ G ω˙ × G
~ = −~ ~ (7.278)
Además se cumple que:

~ = Ω̃ −~
Ω̃2 G ω×G ~ = −~ ~
ω × −~ω × G (7.279)
De (7.277) y (7.278) se obtiene para (7.276):
~˙ = G
ÃT G ~˙ + ~ ~
ω×G
(7.280)
T~¨ = G
Ã G
¨~
+ 2~ ~˙ + ω
ω×G ~ + ~ω˙ × G
~ × (~ω × G) ~
Explı́citamente las ecuaciones (7.280) se pueden escribir ası́:

! !
~
d2 G h dG
~ i
= Ã + ω
~ × ~
G
dt2 dt
cuerpo espacio
! ! !
~
d2 G h d2 G
~ ~
dG (7.281)
2
= Ã 2
+ 2~ω ×
dt dt dt
cuerpo espacio espacio
i
~ + ~ω˙ × G
+~ω × (~ω × G) ~
Vemos que (7.271) y (7.272) coinciden con (7.281) cuando Ã = I, ˜ esto es, cuando
escogemos los ejes de modo que coincidan instantáneamente.
En particular, para el vector de posición de una partı́cula moviéndose en el sistema
de coordenadas fijo a la Tierra, siendo ~ω la velocidad angular de la Tierra respecto al
sistema de ejes espacial, (7.281) nos da para Ã = I:˜
ω × (~r˙ − ~ω × ~r ) + ~ω × (~ω × ~r ) + ~ω˙ × ~r

~¨r = ~¨r + 2~
(7.282)
ω × ~r˙ − ~ω × (~ω × ~r) + ~ω˙ × ~r
= ~¨r + 2~
Como para la Tierra ~ω = −n̂Φ̇ podemos escribir:
~¨r = ~¨r − 2Φ̇n̂ × ~r˙ − Φ̇2 n̂ × (n̂ × ~r) (7.283)

~ = m~¨r y F~ = m~¨r se sigue que:
Como F
~ = F~ − 2mΦ̇n̂ × ~r˙ − mΦ2 n̂ × (n̂ × ~r)
F (7.284)
En el sistema de coordenadas rotante, fijo a la Tierra, la fuerza efectiva no es
F~ = m~g sino que hay otros dos términos de naturaleza inercial. El segundo es la fuerza
de Coriolis y el tercero es la fuerza centrı́fuga. La discusión completa de estos efectos
puede verse en el texto Classical mechanics de Goldstein, sección 4-9, o en el texto Fı́sica,
vol. I de Alonso-Finn, sección 6.5.
8
Dinámica del cuerpo rı́gido
El fin de la dinámica del cuerpo rı́gido es describir la evolución del cuerpo rı́gido, o
sea, hallar las coordenadas generalizadas de rotación en función del tiempo cuando son
conocidas: (i) La distribución de masa del cuerpo rı́gido en reposo y (ii) Las fuerzas y
ligaduras que actúan sobre él. Cuando no hay ligaduras, los ángulos de Euler constituyen
un conjunto adecuado de coordenadas generalizadas independientes.
Hay distintas formas de llegar a las ecuaciones de movimiento para los ángulos de
Euler: a partir del lagrangiano, por medio de tres constantes de movimiento o por medio
de las ecuaciones de movimiento de Euler. Cuál forma se utiliza es algo que depende del
problema particular.
8.1. El tensor de inercia

Un cuerpo rı́gido puede considerarse como un sistema de partı́culas sometido a las
ligaduras de que cualquier par de partı́culas permanece siempre a la misma distancia una
de la otra. En muchos casos es útil considerar una distribución continua de materia, de
acuerdo con cierta función de densidad de masa ρ(~r). La masa total, para distribuciones
discreta y continua respectivamente, es:
N
X Z
M= mi ; M= ρ(~r)d3~r (8.1)
i=1
Las correspondientes expresiones para la energı́a cinética y el momento angular

son:
N
X Z
1 2 1
T = mi~r˙ i ; T = ρ(~r)~r˙ 2 d3~r (8.2)
i=1
2 2
N
X Z
~ =
L mi~ri × ~r˙ i ; ~ =
L ρ(~r)~r × ~r˙ d3~r (8.3)
i=1
253
254 / Mecánica clásica
Similarmente el torque total es:

N
X Z
~ =
K ~ri × F~i ; ~ =
K ~r × F~ (~r) d3~r (8.4)
i=1
donde F~ (~r) es la fuerza por unidad de volumen en el punto ~r. Las ecuaciones (8.2),
(8.3) y (8.4) son cantidades evaluadas en el sistema de coordenadas espacial; es deseable
expresarlas en función de las coordenadas del cuerpo rı́gido.
Supondremos que el cuerpo rı́gido se translada a la vez que rota, siendo V ~ la
velocidad de translación del origen de coordenadas fijo al cuerpo y ω~ la velocidad angular
de rotación. Las fórmulas de transformación para la posición y la velocidad de un punto
arbitrario son, según las fórmulas (7.5), (7.244) y (7.245):
~r = V~ t + AT ~r ; ~ + AT ~r˙ − ~ω × ~r ′
~r˙ = V (8.5)
Por simplicidad hemos tomado a V ~ constante. El vector ~ω está dado por (7.248).
Si el punto en consideración es del cuerpo rı́gido entonces se cumple que ~r˙ = 0.
Constancia de ω respecto a diferentes sistemas de coordenadas fijos al

cuerpo rı́gido. Sean O1 y O2 dos puntos del cuerpo rı́gido en los cuales se toma el
origen de dos sistemas de coordenadas fijos al cuerpo rı́gido. R~1 y R~ 2 son los vectores de
~
posición de O1 y O2 respecto a los ejes espaciales, de modo que R = R ~2 −R~ 1 es el vector
de posición de O2 respecto a O1 . Sea ~ω1 la velocidad angular de los ejes del cuerpo rı́gido
con origen en O1 y ~ ω2 respecto a O2 . De las fórmulas R ~2 = R
~ +R ~1 y R ~1 = R~2 − R ~ se
sigue que:

~ 2
dR dR~ 1 dR ~ dR~ 1 dR~
= + = + −ω
~1 × R~ (8.6)
dt dt dt dt dt
esp esp esp esp 1

~ 1
dR ~ 2
dR ~
dR ~ 2
dR ~
dR
= − = − +ω ~
~2 × R (8.7)
dt dt dt dt dt
esp esp esp esp 2
en donde usamos los resultados de (7.269) y siguientes.

Por tratarse de un cuerpo rı́gido se sigue que:

dR~ ~
dR
= =0 (8.8)
dt dt
1 2
Entonces obtenemos de (8.6) y (8.7):

~ 1
dR dR~ 1
= −ω
~1 × R~ + ~ω2 × R
~ (8.9)
dt dt
esp esp
Por tanto:
(~ ~ =0
ω2 − ω~1 ) × R (8.10)
Dinámica del cuerpo rı́gido / 255
Entonces ~ ~ siendo λ arbitraria. Como esta expresión debe cumplirse

ω2 − ω~1 = λR,
en el caso lı́mite en que el cuerpo rı́gido esté en reposo, λ debe anularse, por lo que se
llega al resultado importante de que el vector ~ω es independiente del punto del cuerpo
rı́gido que se tome como origen del sistema de coordenadas fijo al cuerpo rı́gido.
Energı́a cinética. La energı́a cinética respecto a los ejes espaciales, ecuación (8.2),
puede descomponerse usando (8.5):
1X
N h i
T = mi V~ 2 − 2V
~ · (~
ω × ~ri ) + (~ω × ~ri ′ )2 (8.11)
2 i=1
Si escogemos el origen de coordenadas del sistema de coordenadas del cuerpo rı́gido

(que coincide con el origen de las coordenadas ~r ′ , según la figura 7.2) en el centro de
masa, se cumple que:
N
X
~ CM
mi~ri ′ = M R ′
=0 (8.12)
i=1

N
1 ~2 1X
T = MV + ω × ~ri ′ )2
mi (~ (8.13)
2 2 i=r
Cuando los ejes del cuerpo rı́gido coinciden instantáneamente con los espaciales,
~r = ~ri ′ , en vez de (8.13) podemos escribir:
N
1 ~2 1X 2
T = MV + ω × ~r i
mi ~ (8.14)
2 2 i=r
La energı́a cinética, pues, consta de dos partes independientes: la energı́a cinética

del centro de masa y la energı́a cinética de rotación respecto al centro de masa. Como
~ω depende de la orientación del cuerpo rı́gido, según (7.252), se sigue que la energı́a
cinética de rotación depende de los ángulos de Euler y sus derivadas temporales:
T = Ttraslacional + Trotacional (φ, θ, ψ, φ̇, θ̇, ψ̇) (8.15)
Es conveniente escribir a Trotacional de la siguiente manera. Usamos la expresión
para el producto cruz en términos del tensor de Levi-Civita:
2
ω × ~ri = ǫmnp ωn rip ǫmst ωs r it
~ (8.16)
donde los ı́ndices mudos m, n, p, s, t, toman los valores 1, 2, 3, que representan a x, y,
z, y usamos la convención de Einstein. El tensor de Levi-Civita tiene la propiedad:
ǫmnp ǫmst = δns δpt − δnt δps (8.17)
de la cual se sigue que:
2 2
~ ~ · ~r i
ω × ~ri = ω 2 r 2i − ω (8.18)
La ecuación (8.18) permite escribir a Trotacional como:

XN
1
Trotacional = ωs ωt mi r2i δst − ris r it (8.19)
2 i=1
Definimos el tensor de inercia ası́:

N
X
Ist = mi (r 2i δst − r is r it ) (8.20)
i=1
o usando la notación diádica, ecuación (7.45),

N
~~ X
I= mi r 2i ~~1 − ~r i r~i (8.21)
i=1
~
donde ~1 es el diádico unidad; vemos entonces que:
1 ~~ 1
Trotacional = ~ω · I · ~ω = ωs Ist ωt (8.22)
2 2
~ ~
En la definición de I~ tomamos los ejes del cuerpo rı́gido; I~ es el tensor de inercia
respecto a los ejes del cuerpo rı́gido con origen en el centro de masa. Sin embargo, cuando
~ = 0, T = Trotacional y la fórmula (8.22) resulta aplicable también en el caso en que el
V
origen de coordenadas no esté en el centro de masa.
Momento angular. El momento angular en el sistema de coordenadas espacial,

ecuación (8.3), puede descomponerse en una parte del centro de masa y una parte res-
pecto al centro de masa. Cuando los ejes ~r ′ y ~r coinciden instantáneamente, el momento
angular de rotación alrededor del centro de masa es:
N
X XN h 2 i
~ rotacional =
L mi~r i × ω
~ × ~ri = mi ~ω~ri − r i ω
~ .~r i (8.23)
i=1 i=1
Desarrollando el triple producto vectorial llegamos a una expresión que contiene el

tensor de inercia:
~ rotacional = ~I~ · ~ω
L (8.24)
~ rotacional son, usando los resultados de la sección 7.3:
o sea que las componentes de L
~
(Lrotacional )s = ~es · I~ · ~ω ; s = 1, 2, 3 (8.25)
~
donde I~ es el tensor de inercia respecto a los ejes del cuerpo rı́gido con origen en el
centro de masa.
Momentos de inercia y productos de inercia. Los elementos diagonales del

tensor de inercia reciben el nombre de momentos de inercia:
N
X 2
~~
Iss = ~es · I · ~es = mi ~r i − r 2is ; s = 1, 2, 3 (8.26)
i=1
~
Los elementos no diagonales de I~ reciben el nombre de productos de inercia (y a
veces el de momentos centrı́fugos respecto a los planos coordenados):
N
X
Ist = − mi r is rit ; s 6= t = 1, 2, 3 (8.27)
i=1
~~
I es un tensor simétrico, por lo tanto puede ser diagonalizado mediante una trans-
formación de semejanza realizada por una matriz ortogonal, sus valores propios son
reales y sus vectores propios son ortogonales, de acuerdo con conocidos teoremas del
álgebra de matrices.1
Momento de inercia respecto al eje de rotación. Por simplicidad tomaremos

el caso en que el eje de rotación instantáneamente está fijo, de modo que ~ω está dada por
la fórmula (7.226), ω
~ = ωn̂. Entonces de acuerdo con (8.22), Trotacional puede escribirse
como:
1 2
T = Iω (8.28)
2
donde el número I está definido ası́:
N
X h 2 i
I = n̂ · I · n̂ = I n̂n̂ = mi r 2i − ~ri · n̂ (8.29)
i=1
I se denomina el momento de inercia respecto al eje de rotación. De manera similar

puede calcularse el momento de inercia respecto a un eje arbitrario, que por supuesto
será diferente del I dado en (8.29). La componente de Lrotacional en la dirección de n̂ es:
~ · n̂ = n̂ · ~I~ · n̂
Ln̂ = L ω = Iω (8.30)
~ rotacional al cuadrado es:
La magnitud de L
~ ~
ω · I~ · I~ · ω
L2 = ~ ~ 6= I 2 ω 2 (8.31)
o sea que en general L ~ será distinto de Ln̂ ; en otras palabras, en general L

~ y ~ω no son
paralelos.
De acuerdo con la definición elemental, el momento de inercia del cuerpo rı́gido
respecto al eje n̂ depende de las distancias Ai de las partı́culas al eje:
N
X
In = A2i mi (8.32)
i=1
De acuerdo con su definición:

A2i = (~r i × n̂)2 = ~r i · n̂ × ~ri × n̂ (8.33)
1 Véase
por ejemplo el texto de V. I. Smirnov, A course of higher mathematics, vol. III, numeral 40,
Pergamon Press, 1964.
Utilizando un desarrollo similar al de las ecuaciones (8.16), (8.17) y (8.18):

n̂ × ~r i × n̂ = ~ri − n̂ n̂ · ~r i (8.34)
Reemplazando (8.34) en (8.32) llegamos a:

N
X h 2 2 i
In = mi ~r i − ~r i .n̂ (8.35)
i=1
~
Si n̂ es el eje de rotación vemos que In coincide con I = n̂ · I~ · n̂.
Teorema de Steiner. Es un teorema que permite relacionar los momentos de

inercia respecto a ejes diferentes. Se llama también el teorema de los momentos de
inercia respecto a ejes paralelos. Si ~r es el vector de posición de la partı́cula i respecto
a los ejes del cuerpo rı́gido con origen en el centro de masa y ~ri ′ respecto a los ejes
del cuerpo rı́gido con un origen diferente O′ , colocado en R ~ respecto al centro de masa,
entonces:
~ + ~r i ′
~r i = R (8.36)
Manipulaciones simples nos conducen a la relación:
I ′ = I + M a2 (8.37)
donde a2 es:
~ × n̂)2
a2 = (R (8.38)
y I ′ es el momento de inercia respecto a un eje paralelo a n̂ que se separa de él una

cantidad a. El teorema de Steiner para el tensor de inercia mismo es:

~~ ′ ~~
I = I + M R2~~1 − R
~R~ (8.39)
~ ~
donde I~ es el tensor de inercia respecto al centro de masa y I~ ′ es el tensor de inercia
~
respecto a unos ejes del cuerpo rı́gido con origen en R respecto al centro de masa.
~ ~~
Ejemplo 8.1.1 Expresar a I~ en términos de R i definida ası́:
 
0 z i −y i
 
  ~~
R̃i = 
 −z i 0 x i 
 o sea : R i = ǫmnl xil êm ên (8.40)
 
y i −xi 0
Utilizando la propiedad del tensor de Levi-Civita dada en (8.17), llegamos a la

~~ ~~
siguiente expresión par R i · Ri :
~~ ~~ ~
R r i~r i − r 2i ~1
i · Ri = ~ (8.41)
~~
Se sigue entonces la siguiente expresión para I:
N
X ~ ~
~~
I =− mi R i · R i (8.42)
i=1
Ejemplo 8.1.2 Hallar el lagrangiano para una placa uniforme rectangular rı́gida horizon-
tal que está colocada sobre cuatro resortes iguales, para el caso en el cual el centro de
la placa sólo puede tener movimientos perpendiculares a la placa. La placa sólo puede
desplazarse verticalmente y girar de modo que el centro permanezca fijo.
Entonces las correspondientes energı́as cinéticas son:

1 1 ~~
M Ż 2 ; Trotacional = ~ω · I.~
Ttraslacional = ω (8.43)
2 2
Para una placa rectangular homogénea rı́gida usamos la fórmula correspondiente
a (8.21) para una distribución uniforme de masa:
Z
~~ M 2~~
I= r I − ~r~r d2~r (8.44)
A
donde A es el área de la placa y d2~r el elemento diferencial de área. Tomando el plano
x − y sobre la placa, con origen en el centro de la misma, y llamando 2a la longitud de
la placa (dirección x) y 2b la anchura (dirección y), (8.44) toma la forma:
Z Z
~~ M ~
I= (r2 I~ − ~r~r) dx dy (8.45)
4ab
Con la elección de coordenadas que hemos hecho, los productos de inercia se anulan
~~
(I es diagonal). Los momentos de inercia son:
1 1 1
Ixx = M b2 ; Iyy = M a2 ; Izz = M (a2 + b2 ) (8.46)
3 3 3
En vez de tomar como coordenadas generalizadas de rotación a los ángulos de
Euler ordinarios, con lo cual la velocidad angular estarı́a dada por las fórmulas (7.252)
o (7.253), tomaremos los ángulos de rotación alrededor de los tres ejes perpendiculares
fijos a la placa. Esta es la llamada convención “xyz” de los ángulos de Euler; ver el final
de la sección 7.6. Las componentes de ~ω a lo largo de los ejes de las rotaciones sucesivas
que definen los ángulos de Euler en la convención “xyz” son:
~ = φ̇ êz + θ̇ êµ2 + ψ̇ êµ′1
ω (8.47)
Con lo cual se obtiene para las componentes de la velocidad angular respecto a los
ejes del cuerpo rı́gido:2
~ω = (ψ̇ − φ̇ senθ)êx̄ + (θ̇ cos ψ + φ̇ cos θ senψ)êy
(8.48)
+(−φ̇ senψ + φ̇ cos θ cos ψ)êz̄
2 Las componentes respecto a los ejes espaciales son (ψ̇ cos θ cos φ − θ̇ senφ, φ̇ cos θ senφ + θ̇ cos φ, φ̇ −
ψ̇ senθ). Véase apéndice B del texto de Goldstein, Classical mechanics, 2a ed., Addison Wesley, 1980.
¯
En las fórmulas dinámicas hemos supuesto que los ejes espacial y de cuerpo rı́gido
coinciden instantáneamente. Por esto debemos tomar nulos los valores de los ángulos de
Euler, con lo cual ω
~ yω ~ coinciden instantáneamente:
ω = φ̇ êz + θ̇ êy + ψ̇ êx

~ (8.49)
Entonces Trotacional será:
1 2 1 1
Trotacional = ψ̇ Ixx + θ̇2 Iyy + φ̇2 Izz (8.50)
2 2 2
Con la convención ordinaria para los ángulos de Euler aparecerán términos en φ̇ψ̇.
La energı́a potencial en función de z y de los ángulos de Euler es:
1 1 1 1
V = (4k)z 2 + (4k)(aθ)2 + (4k)(bψ)2 + (4k ′ )(a2 + b2 )φ2 (8.51)
2 2 2 2
En (8.51), k es la constante de estiramiento de los resortes, en tanto que k ′ es la
constante asociada a los desplazamientos horizontales, en que no se estiran los resortes
y por lo tanto k ′ no se puede expresar en función de k. El lagrangiano buscado es:
M 2 2 1
L= |b ψ̇ + a2 φ̇2 + (a2 + b2 )φ̇2 | + M ż 2 − 2kz 2
6 2 (8.52)
2 2 2 2 ′ 2 2 2
−2ka θ − 2kb ψ − 2k (a + b )φ
Vemos que z, φ, θ, ψ, son coordenadas normales.
8.2. Diagonalización del tensor de inercia

El tensor de inercia es simétrico, Ist = Its , con lo cual sus valores propios son reales
y los vectores propios correspondientes a valores propios diferentes son ortogonales. En
general los productos de inercia no son nulos, o sea que cada componente de L ~ depende
de todas las componentes de ω ~:
Ls = Is1 ω1 + Is2 ω2 + Is3 ω3 ; s = 1, 2, 3 (8.53)
si se anulan los productos de inercia, cada componente de L ~ será proporcional a la

respectiva velocidad angular y T será una forma cuadrática en las componentes de ~ω sin
términos cruzados.
~
Como I~ es simétrico, siempre es posible hallar un sistema de coordenadas fijo
al cuerpo rı́gido en que sea diagonal. Esto se logra resolviendo el problema de valores
~~
propios y vectores propios para I:
~~ ~ ~α ;
I · Xα = Iα X α = 1, 2, 3 (8.54)
o en términos de las componentes:
3
X
Irt Xαt = Iα Xαr ; r, α = 1, 2, 3 (8.55)
t=1
Vamos a admitir que los valores propios Iα puedan ser complejos. Entonces Iβ⋆
satisface:
X 3
⋆ ⋆
Itr Xβr = Iβ⋆ Xβt
⋆
; t, β = 1, 2, 3 (8.56)
r=1
⋆
Multiplicando a (8.55) por Xβr y a (8.56) por Xαt , sumando sobre r y t y restando
los resultados obtenemos:
X3 X 3 3 X
X 3 3
X
⋆ ⋆ ⋆ ⋆ ⋆
Irt Xαt Xβr − Itr Xβr Xαt = Iα Xαr Xβr Iβ
r=1 t=1 t=1 t=1 r=1
(8.57)
3
X
⋆
− Xβt Xαt
t=1
como Irt es real y simétrica, el lado izquierdo de (8.57) es nulo. El lado derecho puede
escribirse como un producto escalar ordinario, quedando:
~α · X
(Iα − Iβ⋆ )X ~ ⋆ = 0 ; α, β = 1, 2, 3 (8.58)
β
Para α = β se sigue de (8.58), debido a que X~α ·X~ ⋆ es real y positivo, que I ⋆ = Iα ,
α α
o sea que los valores propios son reales. Cuando X~α y X~ β corresponden a valores propios
diferentes, se sigue que son ortogonales. Escogiendo los vectores propios X ~ α normalizados
a la unidad y notando que cuando ocurra que Iα = Iβ entonces Xα · X ~ ~ β puede no ser
cero, pero que puede escogerse cero, obtenemos de esta manera que X ~ 1, X
~2 y X~ 3 , forman
una trı́ada ortonormal de vectores unitarios:
X~α · X
~ β = δαβ ; α, β = 1, 2, 3 (8.59)
Analicemos más en detalle el caso en que ocurran valores propios degenerados,
Iα = Iβ con α 6= β. De (8.58) se sigue que se debe cumplir, en el caso en que I1 6= I2 = I3 ,
que X~1 · X~2 = X~1 · X~ 3 = 0, pero no necesariamente se debe cumplir que X ~2 · X
~ 3 = 0.
~
Todos los vectores perpendiculares a X1 son vectores propios correspondientes al mismo
valor propio I2 , formando un espacio bidimensional, o sea que sólo hay dos vectores
propios de I2 linealmente independientes, con lo cual podemos escoger cualquier par
de vectores ortogonales, lo cual nos está a su vez indicando que el sólido rı́gido posee
~ 1.
simetrı́a de rotación alrededor del eje X
Los ejes principales y la transformación principal. Los vectores propios X ~α

constituyen un sistema de tres ejes cartesianos fijos al cuerpo rı́gido, respecto a los cuales
el tensor de inercia es diagonal. Estos ejes se llaman ejes principales de inercia. Los valores
propios Iα se llaman momentos principales de inercia. En cualquier caso es posible
hallar una transformación de coordenadas que nos permita pasar a los ejes principales.
Tal transformación se llama transformación principal y consiste en una rotación. De
acuerdo con las fórmulas (7.30) y (7.60), las fórmulas de transformación para los vectores
unitarios y para el tensor de inercia serán:
3
X 3
X
~r =
X αrs ês ; ′
Irs αrt αsu Itu ; r, s = 1, 2, 3 (8.60)
s=1 t,u
donde αrs son los cosenos directores de la transformación. Vemos que las componentes
de los nuevos vectores unitarios coinciden con los cosenos directores:
Xrs = αrs ; r, s = 1, 2, 3 (8.61)
Es decir, con los elementos de los vectores propios formamos una matriz que coin-
cide con la matriz de la transformación principal siendo las filas de tal matriz formadas
con las componentes de los vectores propios. Esta matriz es ortogonal.
Los cosenos directores también pueden escribirse en la forma αrs = X ~ r · ês y las
~~ ~ ~
componentes del tensor de inercia en las formas Irs = Xr · I · Xs y Itu = êt · I~ · êu , con
′ ~
lo cual las ecuaciones (8.60) de la derecha quedan en la forma de la identidad siguiente:
3
X
X~ r · ~I~ · X
~s = ~ r · êt ) êt · ~I~ · êu (êu · X
(X ~ s) (8.62)
t,u=1
′
Como Irs es diagonal, podemos escribir:
′
Irs ~ r · ~I~ · X
=X ~ s = Is δrs ; r, s = 1, 2, 3 (8.63)
Usando la completidad de los vectores X~ r, X ~1 + X

~ 1X ~ 2X~2 + X ~ 3 = ~~1, obtenemos
~ 3X
~ r y sumando sobre r la ecuación de valores propios para ~I.
al multiplicar a (8.63) por X ~
En términos de componentes la ecuación de valores propios es (8.55):
3
X
(Irt − Iα δrt )Xαt = 0 ; r, α = 1, 2, 3 (8.64)
t=1
El anterior es un sistema de tres ecuaciones homogéneas en las incógnitas Xαt ,

que admite soluciones no triviales solamente si los Iα tienen un valor tal que se anule el
determinante de la matriz de los coeficientes:

~~ ~
~
det I − Iα 1 = 0 (8.65)
que en forma explı́cita es:

 
Ixx − Iα Ixy Ixz
 
 
det 
 Ixy Iyy − Iα Iyz =0
 (8.66)
 
Ixz Iyz Izz − Iα
La ecuación (8.66) es cúbica en Iα , que tendrá tres raı́ces reales según hemos
visto; esta ecuación se llama ecuación secular. Un cuerpo rı́gido cuyos tres momentos
principales de inercia son diferentes es asimétrico. Si por ejemplo I1 = I2 6= I3 , el
~ 3 . Por simetrı́a de rotación
cuerpo tiene simetrı́a de rotación alrededor del eje principal X
entendemos una rotación que deja inalterado el tensor de inercia; tal rotación puede
~~
representarse mediante cierto diádico ortogonal R.
~~ ~~ ~~ −1 ~~
R ·I ·R = I (8.67)
Mediante (8.67) la ecuación de valores propios para I1 puede escribirse como:

~~ ~ ~~ ~~ ~~ −1 ~
~1 = R ~
I · X1 = I1 X · I · R · X1 = I1 X (8.68)
~~
o por la ortogonalidad de R:

~~ ~~ −1 ~ ~~ −1 ~
I · R X1 = I · (R · X1 ) (8.69)
~1 y R~~ ~
Las ecuaciones (8.68) y (8.69) nos dicen que los vectores X X1 son vectores
~~
propios de I con el mismo valor propio I1 ; estos dos vectores no necesariamente son
ortogonales pero sı́ son linealmente independientes y permiten escribir cualquier vector
en el plano perpendicular al eje de simetrı́a X ~ 3 . Si I1 = I2 = I3 se dice que el cuerpo
~~
rı́gido es esférico; en este caso I será diagonal respecto a cualquier sistema de ejes del
cuerpo rı́gido con origen en el centro de masa.
Ejemplo 8.2.1 Sea un cuerpo rı́gido formado por once masas discretas iguales distri-
buidas como se muestra en la figura 8.1. Las ocho masas del plano están sobre una
circunferencia de radio a, con un ángulo entre sı́ de 45o . Las masas del eje están a una
distancia a del centro de la circunferencia. Al rotar el cuerpo alrededor del eje un ángulo
2π/8, coincide consigo mismo; se dice que posee un eje de simetrı́a de orden 8. Sobre
el plano hay también cuatro ejes de simetrı́a de orden 2. Calcular las componentes del
tensor de inercia para este cuerpo y mostrar que dos momentos principales de inercia
son iguales.
Figura 8.1 Cuerpo rı́gido formado por once masas discretas iguales.
Podemos elegir los ejes del cuerpo rı́gido de modo que coincidan con la posición de
algunas de las masas, digamos, tomando el plano x − y en el plano de la figura y el eje z
a lo largo del eje de simetrı́a. Con esta elección se anulan los productos de inercia o sea
que dichos ejes forman un conjunto de ejes principales y los momentos de inercia serán
también momentos principales de inercia. Los valores de los Iα son:
I1 = Ixx = 6ma2 ; I2 = Iyy = 6ma2 ; I3 = Izz = 8ma2 (8.70)
Vemos que ninguno de los tres momentos principales de inercia es mayor que la
suma de los otros dos y que los momentos principales respecto a los ejes del plano de
simetrı́a son iguales.
Se puede demostrar que si en vez de x − y se toma cualquier par de ejes en ese
plano, perpendiculares o no entre sı́, el tensor de inercia resulta diagonal, siempre que
un eje pueda obtenerse a partir del otro eje mediante una de las operaciones de simetrı́a
del cuerpo. Es decir, cualquier par de ejes no colineales que hagan entre sı́ un ángulo
que sea un múltiplo de 2π/8, forma parte del conjunto de ejes principales del cuerpo.
Usando el lenguaje de la teorı́a de grupos, decimos que el cuerpo rı́gido posee un grupo
de simetrı́as de orden 8, el grupo puntual D4 , que consta de cuatro rotaciones alrededor
del eje de simetrı́a de orden 8, y cuatro rotaciones de π alrededor de ejes horizontales.
Además posee un conjunto de simetrı́as de reflexión en planos horizontales y verticales.
El conjunto de los vectores propios correspondientes al valor propio degenerado I1 cons-
tituye una representación irreductible del grupo de simetrı́as D4 .3
El elipsoide de inercia. Sea n̂ el vector unitario que define una dirección cual-
quiera. El momento de inercia respecto al eje n̂ es:
3
X
~
I = n̂ · I~ · n̂ = nr Irs ns (8.71)
r,s=1
donde nx , ny , nz , son los cosenos directores del eje (véase figura 8.2). Si tomamos un
punto cualquiera sobre el eje, estará descrito respecto al centro de masa por el vector de
posición ~r = (x, y, z) = r(nx , ny , nz ); por lo tanto si multiplicamos por r2 ambos lados
en (8.71) obtenemos:
In r2 = Ixx x2 + Iyy y 2 + Izz z 2 + 2Ixy xy + 2Ixz xz + Iyz yz (8.72)
Ahora consideremos un conjunto de ejes que pasen por el centro de masa. Entonces
podemos hallar el lugar geométrico de los puntos ~r para los cuales In r2 toma el mismo
valor. Este lugar geométrico es una superficie elipsoidal llamada el elipsoide de inercia
o elipsoide de momentos de inercia. Es claro que eligiendo adecuadamente el sistema de
coordenadas fijo al cuerpo rı́gido4 se obtiene la ecuación estándar para un elipsoide:
x2 y2 z2
2
+ 2 + 2 =1 (8.73)
a b c
3 Véase el capı́tulo de teorı́a de la simetrı́a en el libro de Mecánica cuántica no relativı́stica de Landau-
Lifshitz.
4 Que coincide instantáneamente con el sistema de coordenadas espacial.
La ecuación (8.73) se identificará con (8.72) si se satisfacen las relaciones:

In r2 In r2 In r2
a2 = ; b2 = ; c2 = ;
I1 I2 I3 (8.74)
I1 = Ixx ; I2 = Iyy ; I3 = Izz ; Irs = 0 si r 6= s
Es claro que tal sistema de coordenadas coincide con el sistema de ejes principales
ortogonales del cuerpo rı́gido y que I1 , I2 , I3 , coinciden con los momentos principales
de inercia.
Cuerpo r
rígido n
Elipsoide
de inercia:
In r 2 = constante
Figura 8.2 Superficie elipsoidal
El elipsoide de inercia es una superficie de la forma:

F (x, y, z) = 0 (8.75)
La normal a F en un punto es el gradiente de F en ese punto.
En los ejes principales de un elipsoide el gradiente es paralelo al eje:
∂F
= K n̂ (8.76)
∂~r
En forma explı́cita (8.76) es:
∂F
= 2xIxx + 2yIxy + 2zIxz = Knx
∂x
∂F
= 2xIxy + 2yIyy + 2zIyz = Kny (8.77)
∂y
∂F
= 2xIxz + 2yIyz + 2zIzz = Knz
∂z
Si estas ecuaciones las dividimos por 2r, luego multiplicamos la primera por nx y la
tercera por nz , el resultado que se obtiene al sumarlas coincide con (8.72) si la constante
K se identifica con K = 2rIn . Entonces (8.77) coincide con el siguiente sistema de

ecuaciones:
(Ixx − In )nx + Ixy ny + Ixz nz = 0
Ixy nx + (Iyy − In )ny + Iyz nz = 0 (8.78)
Ixz nx + Iyz ny + (Izz − In )nz = 0

O sea que las ecuaciones (8.76), (8.77) y (8.78) nos dan los ejes principales y los
momentos principales de inercia, ya que los ejes principales de inercia coinciden con los
ejes principales del elipsoide de inercia.
La construcción del elipsoide de inercia permite interesantes análisis cualitativos
del movimiento del cuerpo rı́gido. Es la base de la representación de Poinsot para el
estudio del movimiento de un cuerpo rı́gido no sometido a torques.
Ejemplo 8.2.2 ¿Cuál es la relación entre el diámetro y la altura de un cilindro circular

recto tal que el elipsoide de inercia en el centro del cilindro es una esfera?
Tomamos el origen en el centro de masa. En virtud de la simetrı́a de rotación,

cualquier par de ejes perpendiculares al eje y del cilindro forman un sistema de ejes
principales.
El momento de inercia Izz = I3 , siendo z el eje del cilindro, es:
Z Z Z
M
I3 = (y 2 + x2 ) d3~r (8.79)
V
donde M es la masa total y V el volumen. Tomando el elemento de volumen como un
anillo cilı́ndrico de radios ρ y ρ + dρ y altura dl:
d3~r = 2πρ dρ dl (8.80)
Entonces una integración elemental nos lleva a:
1
I3 = M R2 (8.81)
2
siendo R el radio de la circunferencia de la base del cilindro.
El momento de inercia Ixx = I1 es:
Z Z Z
M
I1 = (z 2 + y 2 ) d3~r (8.82)
V
En las dos integrales que aparecen en (8.79) y (8.82) es cómodo tomar respectiva-
mente los siguientes elementos de volumen:
p
d3~r = πr2 dz y d3~r = 2lx dy = 2l R2 − y 2 dy (8.83)
Entonces obtenemos para I1 , que además será igual a I2 :
2
1 l
I1 = M + R2 (8.84)
4 3
El elipsoide de inercia será una esfera si I1 = I2 = I3 , de acuerdo con las fórmulas

(8.74). De (8.81) y (8.84) se sigue entonces que:
l2 = 3R2 (8.85)
Ejemplo 8.2.3 Tres masas iguales están en los puntos (a, 0, 0), (0, a, 2a) y (0, 2a, a),
hallar los momentos principales de inercia y un conjunto de ejes principales respecto al
origen de coordenadas.
Los elementos del tensor de inercia para este problema son:

 
5 0 0
~~ 
I= 0 3 −2  2ma2 (8.86)
0 −2 3
El valor del determinante secular, ecuación (8.66), es:

~~ ~
~
det I − I 1 ⇒ (5 − i)[(3 − i)2 − 4] = 0 (8.87)
donde hemos llamado:

I
i= (8.88)
2ma2
Las tres raı́ces de la ecuación secular son entonces i = 5, 5, 1, con lo cual los tres
momentos principales de inercia valen:
I1 = 2ma2 ; I2 = 10ma2 ; I3 = 10ma2 (8.89)

~ ~ ~
Las ecuaciones de valores propios son ~i · X α = iα Xα , que explı́citamente son:
(5 − iα )Xα1 = 0; (3 − iα )Xα2 − 2Xα3 = 0; −2Xα2 + (3 − iα )Xα3 = 0 (8.90)
Para i1 obtenemos las siguientes relaciones entre los componentes del vector propio
~ 1:
X
X11 = 0 ; X12 = X13 (8.91)

~ 1 normalizado a la unidad es entonces:
El vector propio X

~ 1 = 0, √1 , √1
X (8.92)
2 2
Para la raı́z doble i2 = i3 = 5 las relaciones entre los componentes de los vectores
~ 2, X
propios X ~ 3 , son:
0.Xα1 = 0 ; Xα2 = −Xα3 ; α = 2, 3 (8.93)
Vemos que los Xα1 pueden asignarse arbitrariamente, ya que la condición de nor-
malización sólo nos permite expresar a Xα2 en función de Xα1 . Este comportamiento es
caracterı́stico de los problemas de valores propios cuando hay degeneración. Una pareja
posible de vectores propios normalizados y ortogonales correspondientes al valor propio

degenerado i2 = i3 = 5 es:

~ 1 1 ~ 3 = (1, 0, 0)
X2 = 0, − √ , √ ; X (8.94)
2 2
La matriz de la correspondiente transformación principal es:
 1 1 
0 √ √
 2 2 
 
 
 1 
ÃT =  0 − √1 √  (8.95)
 
 2 2 
 
1 0 0
Es claro que con cualquier par de ejes perpendiculares a X ~ 1 se puede construir

igualmente un sistema de ejes principales respecto al origen de coordenadas (véase figura
8.3). Otro problema serı́a hallar los momentos principales y los ejes principales respecto
al centro de masa que está localizado en el punto:

~ = a , a, a
R (8.96)
3
z
m
x2
x1
y
x3
x m
Figura 8.3 Ejes principales de sistema de masas puntuales
8.3. Las ecuaciones de movimiento de Euler

Vamos a suponer que el cuerpo rı́gido no tiene ligaduras adicionales a la de poderse
mover sólo de modo que un punto permanezca fijo; entonces los ángulos de Euler son
coordenadas generalizadas para la descripción del movimiento del cuerpo rı́gido.
El lagrangiano del cuerpo rı́gido. La energı́a cinética es puramente rotacional

y está dada por la ecuación (8.22). La energı́a potencial dependerá de la orientación del
cuerpo, con lo cual la lagrangiana será:
1
L(φ, θ, ψ; φ̇; θ̇, ψ̇) = (I1 ωx2 + I2 ωy2 + I3 ωz2 ) − V (φ, θ, ψ) (8.97)
2
donde se supone que los ejes fijos al cuerpo rı́gido son ejes principales. Las fuerzas
generalizadas de este problema son:
∂V ∂V ∂V
Fφ = − ; Fθ = − ; Fψ = − (8.98)
∂φ ∂θ ∂ψ
Fφ , Fθ y Fψ representan respectivamente el torque externo alrededor del eje espacial z,
el torque alrededor de la lı́nea de nodos y el torque alrededor del eje principal del cuerpo
rı́gido z.
Las ecuaciones de movimiento de Euler. Son las ecuaciones de movimiento.

La ecuación de Lagrange que contiene el torque alrededor de la coordenada z del cuerpo
rı́gido es:
d ∂T ∂T ∂V
− =− = Kz (8.99)
dt ∂ ψ̇ ∂ψ ∂ψ
~ obtenemos que:
Recordando las fórmulas (7.253) para las componentes de ω
∂T ∂T ∂ωx ∂T ∂ωy
= + = ωx ωy (I1 − I2 ) (8.100)
∂ψ ∂ωx ∂ψ ∂ωy ∂ψ
Por otra parte:
∂T ∂T ∂ωz ∂T
= = = I3 ωz (8.101)
∂ ψ̇ ∂ω z ∂ ψ̇ ∂ω z
Entonces la ecuación de Lagrange (8.99) toma la forma:

I3 ω̇z − ωx ωy (I1 − I2 ) = Kz (8.102)
La ecuación (8.102) no depende de las coordenadas generalizadas especı́ficas que
se usen para describir el movimiento; en particular no depende de la convención usada
para definir los ángulos de Euler, ya que esta sólo influye en las expresiones para las
componentes de ~ ω. Si hubiéramos usado convenciones para los ángulos de Euler en que
se intercambiaran los papeles de los ejes z y x, y z y y respectivamente, las ecuaciones
de movimiento serı́an en vez de (8.102), las siguientes:
I2 ω̇y − ωx ωz (I3 − I1 ) = Ky
(8.103)
I1 ω̇x − ωy ωz (I2 − I3 ) = Kx
Por tanto las ecuaciones (8.102) y (8.103) son tres ecuaciones diferenciales inde-
pendientes que no dependen de la convención usada para definir los ángulos de Euler. En
la convención adoptada en el numeral 7.6, las ecuaciones (8.103) no son las ecuaciones
de lagrange para φ y θ, en tanto que (8.102) es la ecuación de Lagrange para ψ. No vale

tampoco que Fφ y Fθ correspondan a Ky y Kx pues como digimos representan el torque
alrededor de z, Kz , y el torque alrededor de la lı́nea de nodos, Kµ1 , respectivamente.
Una deducción más simple de las ecuaciones de Euler es la siguiente: el torque total
es igual a la rata de cambio temporal de L ~ respecto a los ejes espaciales:

d ~
L
~ =
K (8.104)
dt
esp
~ respecto a los ejes rotantes se introduce mediante la fórmula:

La derivada de L

~
dL ~
dL
= ~
+ ~ω × L (8.105)
dt dt
esp rot
donde hemos tomado los ejes coincidiendo instantáneamente. Las ecuaciones (8.104) y
(8.105) nos dan:
dLr
+ ǫr st ωs ωt Lt = Kr ; r = 1, 2, 3 (8.106)
dt
Como escogemos los ejes rotantes coincidiendo con los ejes principales se cumple
que Lr = Ir ωr , de modo que obtenemos de (8.106) directamente las ecuaciones de Euler:
Ir ω˙r + ǫr st ωs ωt Is = Kr ; r = 1, 2, 3 (8.107)
Principales casos en que las ecuaciones de Euler se pueden reducir a

cuadraturas. Las ecuaciones de Euler han sido reducidas a cuadraturas para valores
arbitrarios de las constantes de movimiento en los siguientes casos:
(a) El punto fijo es el centro de gravedad del cuerpo, de modo que no hay torques
externos. Los valores de los momentos de inercia son arbitrarios. Es el problema del
cuerpo rı́gido libre. Para el cuerpo rı́gido asimétrico (I1 6= I2 6= I3 ) el problema se
reduce a cuadraturas en términos de funciones elı́pticas y fue resuelto por Euler en 1758.
Para el cuerpo rı́gido simétrico (I1 = I2 6= I3 ) la solución está dada en términos de
funciones trigonométricas. Para el cuerpo libre esférico (I1 = I2 = I3 ) la solución es
trivial.
(b) El caso en que dos momentos principales de inercia alrededor de un punto del
cuerpo que no coincide con el centro de masa y fijo en el espacio son iguales (trompo
simétrico con un punto fijo). Tanto el punto fijo como el centro de masa están sobre el
eje de simetrı́a. No hay torques de fricción en el punto fijo y el único torque es producido
por un campo gravitatorio homogéneo. El problema se reduce a cuadraturas en términos
de funciones elı́pticas y fue resuelto por Lagrange en 1788.
(c) En 1887 la señora S.V. Kovalevski halló otro ejemplo soluble. Es el caso en
que dos momentos principales de inercia alrededor del punto fijo que no coincide con el
centro de masa son iguales entre sı́, y dos veces más grandes que el tercero (I1 = I2 =
2I3 ). Además, el centro de masa está sobre el plano formado por los ejes principales
correspondientes a los momentos principales iguales, y el único torque externo es el de
la gravedad. La solución está expresada en términos de las funciones hiper-elı́pticas.
Ejemplo 8.3.1 Sea un sistema de ejes primados que coinciden en el origen con un sistema
de ejes inercial pero que rota con respecto a los ejes inerciales con una velocidad angular
fija ω
~ 0 . Hallar las ecuaciones de movimiento de Euler para un cuerpo rı́gido que se mueve
respecto a este sistema de ejes rotantes en el caso en que no haya torques externos, V = 0.
El lagrangiano del sistema, considerado como un sistema de partı́culas, es:

N
1 X ˙2
L= mi~ri (8.108)
2 i=1
Transformemos primero el lagrangiano de los ejes espaciales a los ejes rotantes,

usando fórmulas de la sección 7.8. Llamemos Ã a la matriz de rotación de los ejes rotantes
respecto a los ejes espaciales, más adelante usaremos la notación Ã′ para denotar la
matriz de rotación de los ejes del cuerpo rı́gido respecto a los ejes rotantes. La velocidad
angular total es Ω̃′ + Ã′ Ω̃ Ω̃′T y por esto no podemos decir a priori que el vector velocidad
angular sea ω ~ +~ ω0 .
Si ~r ′ es el vector de posición en los ejes rotantes, sabemos que:
~r ′ = Ã~r ; ˙ T ~r˙ ′ + ÃT ~r˙ ′

~r˙ = Ã (8.109)
de modo que:
2
~r˙ = ~r˙ ′T ÃÃT ~r˙ ′ + ~r ′T Ã ˙ T ~r ′ + ~r ′T Ã
˙ ÃT ~r˙ ′ + ~r˙ ′T ÃÃ ˙ T ~r ′
˙ Ã (8.110)
Usando la siguiente definición de Ω̃′0 y las propiedades de Ã:
ÃÃT = I˜ ; Ã ˙ T = 0;
˙ ÃT + ÃÃ ˙ ÃT ;
Ω̃′0 = Ã Ω̃′2 ˙ ˙T
0 = −ÃÃ (8.111)
llegamos a:
2
~r˙ = ~r˙ ′2 + 2~r ′T Ω̃′0 ~r˙ ′ − ~r ′T Ω̃′2
0 ~r′ (8.112)
Expresando ahora la matriz antisimétrica Ω̃′0 en términos del vector velocidad
angular respecto a los ejes rotantes:
Ω̃′0~r ′ = −~
ω0′ × ~r ′ ; Ω̃20~r ′ = ω
~ 0′ × (ω0′ × ~r ′ ) (8.113)
Entonces podemos escribir a (8.112) como:
2 2
~r˙ = ~r˙ ′ − 2~
ω0′ · (~r˙ ′ × ~r ′ ) − ω
~ 0 · [(~ω0′ × ~r ′ ) × ~r ′ ] (8.114)
La ecuación (8.114) puede llevarse a la forma:

~ 0′ · ~~1 × ~r ′2 − ~r ′~r ′ · ~ω0′
2 2
~r˙ = ~r˙ ′ + 2~
ω0′ · (~r ′ × ~r˙ ′ ) + ω (8.115)
con lo cual llegamos a la siguiente expresión para L:
L = T′ + ω ~′ + 1ω
~ 0′ · L
~
~ ′ · I~ · ~ω0 (8.116)
2 0
donde L~ ′ es el momento angular total respecto a los ejes rotantes e ~I~ es el momento de
inercia respecto a dichos ejes.
Si ahora el cuerpo rı́gido se mueve respecto a los ejes primados con velocidad
angular ~ω , es claro que:
1~ ~
T′ = ω · ~I · ~ω (8.117)
2
~
donde ~I es el momento de inercia respecto a los ejes del cuerpo rı́gido, que podemos
tomarlos como ejes principales.
Ahora se cumple que:
~r ′ = Ã′T ~r ; ~r = Ã′~r ′ ; Ω ˙ ′ Ã′T ;

˜ = Ã ˜ r = −~ω × ~r
Ω~ (8.118)
˜ la matriz Ω̃′ respecto a los ejes del cuerpo rı́gido:
Llamamos además Ω 0 0
Ω ˜ ′ Ã′T
˜ = Ã′ Ω (8.119)
0 0
Entonces el segundo término de la derecha en (8.112) puede escribirse ası́:

T ˜ ′ Ã
2~r ′T Ω̃′0~r˙ ′ = 2~r Ã′ Ω ˙ ′T ~r = 2(ω
~ 0 × ~r) · (~ω × ~r) (8.120)
0
El tercer término de (8.115) puede escribirse como:

~1(~r ′ · ~r ′ ) − ~r ′~r ′ = ~~1r 2 − Ã′T ~r ~rÃ′ = Ã′T ~~1r2 − ~r ~r Ã′
~
(8.121)
Con lo cual construimos el tensor de inercia respecto a los ejes del cuerpo rı́gido.
Finalmente, L toma la forma:
XN
1~ ~~ ~
L= ~+
ω·I ·ω ~ × ~r i + 1 ω
mi ~ω 0 × ~ri · ω ~ 0 · ~I · ω
~0 (8.122)
2 i=1
2
que aún puede transformarse en el segundo miembro para dar:

1~ ~~ ~ 1 ~ ~~ ~
L= ~ + ~ω · ~I · ω
ω·I ·ω ~0 + ω0 · I · ω 0 (8.123)
2 2
~ 0′ está en la dirección del eje x′3 , de modo que las compo-
Vamos a suponer que ω
nentes de ~ω 0 serán:
~ 0 = (senθ senψ, senθ cos φ, cos θ)ω0
ω (8.124)
Entonces los términos que contienen a ~ω0 en (8.123) son de la forma:
~ ~
~ · ~I · ~ω 0 + 1 ~ω0 · ~I · ~ω0 = ωx ω0 senθ senψ I1
ω
2
+ωy ω0 senθ cos ψ I2 + ωz ω0 cos θ I3 (8.125)
1
+ (sen2 θ sen2 ψ I1 + sen2 θ cos2 ψ I2 + cos2 θI3 )ω02
2
La derivada parcial de (8.125) respecto a ψ es:

ω0 (ωy senθ senψ + ωx senθ cos ψ + ω0 sen2 θ senψ cos ψ)I1
+ω0 (−ωx senθ cos ψ − ωy senθ senψ − ω0 sen2 θ cos ψ senψ)I2

(8.126)
= ω0 ωy senθ senψ(I1 − I2 ) + ω0 ωx senθ cos ψ(I1 − I2 )
+ω02 sen2 θ senψ cos ψ(I1 − I2 )

La derivada de estos términos respecto a ψ̇ es I3 ω0 cos θ de modo que la ecuación
de Lagrange para ψ es:
(ωx ωy + ωy ω0 senθ senψ + ωx ω0 senθ cos ψ
(8.127)
+ω02 sen2 θ senψ cos ψ)(I1 − I2 ) − (ω˙z − θ̇ ω0 senθ)I3 = 0
Esta ecuación podemos expresarla en términos de las componentes de ~ω 0 :
(ωx + ω0x )(ωy + ω0y )(I1 − I2 ) − (ω̇z + ω̇0z )I3 = 0 (8.128)
Usando los mismos argumentos que en las ecuaciones (8.102) y (8.103), podemos
concluir que las otras dos ecuaciones de Euler son:
(ωx + ω0x )(ωz + ω0z )(I3 − I1 ) − (ω̇y + ω̇0y )I2 = 0
(8.129)
(ωy + ω0y )(ωz + ω0z )(I2 − I3 ) − (ω̇x + ω̇0x )I1 = 0
El resultado exhibe una dependencia “aditiva” con las velocidades angulares.
Ejemplo 8.3.2 Si en el lagrangiano de un cuerpo rı́gido se realiza el siguiente cambio de
variables:
(φ, θ, ψ; φ̇, θ̇, ψ̇) → (φ, θ, ψ; ω 1 , ω 2 , ω2 ) (8.130)
encontrar las ecuaciones de Lagrange correspondientes a las nuevas variables, o sea las
ecuaciones de Euler.5
De acuerdo con las fórmulas (7.253), las fórmulas de transformación son:
ω 1 = cos ψ θ̇ + senθ senψ φ̇ ;
ω 2 = −senψ θ̇ + senθ cos ψ φ̇ ; (8.131)
ω 3 = ψ̇ + cos θ φ̇
y las inversas:
senψ ω 1 + cos ψ ω2
φ̇ = ; θ̇ = cos ψ ω1 − senψ ω2
senθ (8.132)
ψ̇ = − cot θ(senψ ω 1 + cos ψ ω 2 ) + ω3
5 Ver el texto de Corben y Stehle, Classical mechanics, sección 77, capı́tulo 13, 1960.
Si llamamos q̇1 = φ̇, q̇2 = θ̇, q̇3 = ψ̇, estas fórmulas pueden escribirse en forma de
matrices:
~ω = α̃~q˙ ; q~˙ = β̃ ω
~ (8.133)
donde α̃ y β̃ son:
 
senθ senψ cos ψ 0
 
 
α̃ = 
 senθ cos ψ −senψ 0 

 
cos θ 0 1
  (8.134)
senψ cos ψ
0
 senθ senθ 
 
 
β̃ =  cos ψ −senψ 0 
 
 
−senψ cot θ − cos ψ cot θ 1
Si llamamos L̃(q, ω) a L[q, q̇(ω)] obtenemos que:
∂L ∂ L̃ ∂ L̃ ∂αsu
= + q̇u (8.135)
∂qr ∂qr ∂ωs ∂qr
y que:
d ∂L d ∂ L̃
= αsr (8.136)
dt ∂ q̇r dt ∂ωs
Multiplicando a (8.135) y (8.136) por βrt y sumando sobre r llegamos a la siguiente
expresión para las ecuaciones de Lagrange en L̃:
∂ L̃ ∂ L̃ ∂αsu
βrt + βrt βuυ ω υ =
∂qr ∂ωs ∂qr
d ∂ L̃ ∂ L̃ ∂αsr
βrt αsr + βuυ ωυ βrt (8.137)
dt ∂ω s ∂ωs ∂qu
Usando la propiedad α̃β̃ = I˜ obtenemos finalmente:
∂ L̃ d ∂ L̃ ∂ L̃
βrt − = γtυs ωυ ; t = 1, 2, 3 (8.138)
∂qr dt ∂ωt ∂ω s
donde:

∂αsr ∂αsu
γtυs = − βrt βuυ (8.139)
∂qu ∂qr
Para nuestro caso, el lagrangiano está dado por la ecuación (8.97):
1 ~ ~~ ~
L̃(q, ω) = ω · I · ω − V (q) (8.140)
2
y ası́:
∂ L̃ ∂V ∂ L̃
=− = Kr ; = ωr Ir (8.141)
∂qr ∂qr ∂ωr
Por tanto obtenemos de (8.138):
3
X
Kr βrt − ω̇ t It = γtυs ωυ ω s Is ; t = 1, 2, 3 (8.142)
υ,s=1
Notemos que γtυs puede escribirse como Astυ − Atsυ , donde:

∂αsm
Astυ = βmt βnυ (8.143)
∂qn
que también puede escribirse como:

∂ α̃
Astυ = β̃ βnυ (8.144)
∂qn st
De la expresión explı́cita para α̃ obtenemos que:

 
cot θ sen2 ψ cot θ senψ cos ψ 0
 
∂ α̃ ∂ α̃  
β̃ = 0̃ ; 
β̃ =  cot θ senψ cos ψ 2
cot θ cos ψ 0
∂q1 ∂q2 
 
−senψ − cos ψ 0
  (8.145)
0 1 0
 
∂ α̃  
β̃ =  −1 0 0
∂q3  
 
0 0 0
 
cot θ sen2 ψ cot θ senψ cos ψ 0
 
 
Astυ = 
 cot θ senψ cos ψ cot θ cos ψ 2
0 
 (cos ψ, senψ, 0)υ
 
−senψ − cos ψ 0 st
  (8.146)
0 1 0
 
 
+ 
 −1 0 0 
 (−senψ cot θ, − cos ψ cot θ, 1)t
 
0 0 0 sυ
Es simple concluir a partir de (8.146) que:
γtυs = ǫtυs (8.147)
Por tanto las ecuaciones (8.142) son:

3
X
ω̇t It + ǫtυs ωυ ω s Is = Kr βrt ; t = 1, 2, 3 (8.148)
υ,s=1
Kr son los torques alrededor de los ejes z, µ1 y z, en tanto que los lados derechos
de (8.148) son los torques alrededor de los ejes x, y, z.
Ejemplo 8.3.3 Otra variante de solución del ejemplo 8.3.1 puede obtenerse partiendo de
las ecuaciones de Lagrange (8.138).
Para este problema tenemos que:
∂ L̃ ~ ∂ω0 ∂ L̃ ~ + ~ω 0 ) · ~I~
ω + ~ω 0 ) · I~ ·
= (~ ; = (ω (8.149)
∂~q ∂~q ∂ω~
En términos de componentes, las ecuaciones (8.138) son:
3
X ∂ω0m
βrt (ω 0m + ωm )Im − ω̇ 0t + ω̇t It =
r,m=1
∂qr
3
X
ǫtυs (ω s + ω0s )Is ω υ (8.150)
υ,s=1
O en otra forma:
X 3
∂ω0m
(ω̇ 0t + ω̇t )It = βrt − ǫt,m,r ω r (ω 0m + ω m )Im (8.151)
r,m=1
∂qr
Para cualquier función F se cumple que:

  
senψ/senθ cos ψ −senψ cot θ ∂F/∂φ
  
∂F   
β̃ = 
 cos ψ/senθ −senψ cos ψ cot θ
  ∂F/∂θ 
  (8.152)
∂~q   
0 0 1 ∂F/∂ψ
Usando la expresión (8.124) para ω~ 0 , hallamos que:

 
0 −ω03 ω 02
 
∂ ~ω0  
β̃ = 
 ω 03 0 −ω 01 
 (8.153)
∂~q  
−ω 02 ω 01 0
O en forma más explı́cita:
∂ ~ω0m
βrt = −ǫmrt ω0r (8.154)
∂qr
Con lo cual concluimos que (8.151) toma la forma:

3
X
(ω̇ 0t + ω̇ t )It = ǫtrm (−ω0r − ωr )(ω 0m + ω m )Im (8.155)
r,m=1
que coinciden con las ecuaciones (8.128) y (8.129)
8.4. El movimiento de un cuerpo rı́gido libre

En este caso en las ecuaciones (8.102) y (8.103) no aparecen torques, Kr = 0. Esto
se presenta, por ejemplo, cuando el centro de masa coincide con el punto fijo de modo
que la gravedad no produce torques.
El cuerpo rı́gido esférico. Se define por la condición I1 = I2 = I3 = I.

~ yω
Es el único caso en el cual los vectores L ~ son paralelos:
~ = I~
L ω (8.156)
~ como ~ω serán constantes en magnitud y dirección. Cada
Si no hay torques, tanto L
punto del cuerpo rı́gido se moverá sobre trayectoria circular. No hay precesión de ~ω .
La representación de Poinsot. Es una construcción geométrica que permite

analizar el movimiento de un cuerpo rı́gido libre, el cual puede ser asimétrico. Fue elabo-
rada por Poinsot (Parı́s, 1834) y se basa en el elipsoide de inercia, descrito en la sección
8.2. La ecuación del elipsoide de inercia está dada en (8.73). La normal al elipsoide en
un punto cualquiera tiene la dirección del vector gradiente de F , siendo F la superficie
(8.75):
∂F
= (2xI1 , 2yI2 , 2zI3 ) = 2r(n1 I1 , n2 I2 , n3 I3 ) (8.157)
∂~r
donde hemos tomado un sistema de ejes principales. Si escogemos el punto (x, y, z)
sobre el eje de rotación, entonces:
ω
~ = ω(n1 , n2 , n3 ) (8.158)
De modo que (8.149) toma la forma:
∂F 2r 2r ~
= (ω1 I1 , ω2 I2 , ω3 I3 ) = L (8.159)
∂~r ω ω
Hay dos puntos donde el eje de rotación corta la superficie del elipsoide de inercia.
De (8.159) podemos concluir que en esos dos puntos siempre se cumple que la normal
~ Cuando no hay torques se cumple que L
a la superficie está en la dirección de L. ~ y por
lo tanto ∇F~ son constantes, independientemente de la forma que tenga el movimiento
del elipsoide de inercia, el cual se mueve solidariamente con el cuerpo rı́gido. La energı́a
cinética se puede escribir en la forma:
1 ~ = ω ~r · L
~
T = ω·L
~ (8.160)
2 2r
Cuerpo
rígido
Elipsoide
de inercia b
a
c
r
P
∆
F L
ω
Figura 8.4 Elipsoide de inercia
que se puede llevar a la forma:

~ ·L
(~r − d) ~ =0 (8.161)
donde d~ es un vector definido por la relación:
~ = 2r T
d~ · L (8.162)
ω
si escogemos a d~ paralelo a L,
~ entonces adquiere la forma:
2r ~
L
d~ = T 2 (8.163)
ω L
~ y es la normal al plano
La expresión (8.161) es la ecuación de un plano, donde L
y ~r es un punto del mismo.
Como ~r es un punto particular (el punto donde se cortan el eje de rotación y el
elipsoide de inercia) que puede estar cambiando con el tiempo, vemos entonces que el
elipsoide se mueve de tal manera que el punto donde se corta con el eje de rotación
siempre permanece sobre un plano (véase figura 8.4). d~ es un vector constante, pues
usando las relaciones:
1 2
Ir2 = constante y T = Iω = constante (8.164)
2
podemos escribir el vector d~ como una expresión que solo depende de T y L:
~
√
2Ir2 T ~
d~ = L (8.165)
L2
Como d~ y L~ son constantes, el plano es constante y se llama plano invariable. d~

es la perpendicular trazada desde el centro del elipsoide al plano tangente, o sea que es
~ la lı́nea que contiene a d~ se llama lı́nea invariable.
igual a la proyección de ~r sobre L;
Línea invariable
Polodia
Plano invariable
0
r d
P
Herpolodia
r –d
ω L
Figura 8.5 El elipsoide de inercia rueda sin deslizar sobre el plano invariable
Podemos concluir que el elipsoide de inercia toca al plano invariable en el punto

donde el eje de rotación corta al elipsoide. El radio vector de O a P, ~r, está sobre el
eje instantáneo de rotación; no hay movimiento relativo entre un punto del elipsoide y
un punto del plano; por lo tanto el elipsoide de inercia rueda sin deslizar sobre el plano
invariable; en efecto, P está sobre el eje de rotación y por ello es el único punto del
elipsoide de inercia que está en reposo instantáneamente (véase figura 8.5). Como ω~ es
~ es proporcional a d:
proporcional a ~r, la proyección de ~ω sobre L ~
r
ω
~ ·L~
~ = 2T L
L ~ = 2T ~
d (8.166)
L 2 L2 Ir2
o sea que la proyección de ~ ~ es constante; es decir, ω

ω sobre L ~ precesa alrededor de L,~
pero sin mantenerse constante el ángulo entre estos dos vectores, cuyo coseno está dado
por:
ω ~
~ ·L Ir2 ω
= (8.167)
ωL L r2
Como ω y r pueden cambiar, se sigue que el ángulo entre ~ω y L ~ también puede

cambiar, lo cual ocurre cuando el cuerpo es asimétrico.
La curva trazada por el punto de contacto sobre el elipsoide de inercia se llama
polodia (de odos, camino y polein, girar) y la curva correspondiente sobre el plano
invariable se llama herpolodia (de herpeton, reptil).
~ no es constante, ver ecuación (8.105). De
Respecto a los ejes del cuerpo rı́gido L
modo que (8.160) ya no representa un plano, sino un elipsoide que es precisamente
el elipsoide de inercia. Es fácil demostrar que respecto a los ejes del cuerpo rı́gido la
magnitud de L ~ es una constante:
d 2
L = 2L~ ·L~˙ = −2L~· ω ~ =0
~ ×L (8.168)
dt
Esto implica que respecto a los ejes del sólido rı́gido ~r está además sobre el elipsoide:
Ir2 L2
I12 x2 + I22 y 2 + I32 z 2 = (8.169)
2T
La polodia es, en consecuencia, el lugar geométrico de los puntos del elipsoide de
inercia que satisfacen simultáneamente las ecuaciones (8.73) y (8.169); es decir, es el
lugar geométrico de la intersección de dos elipsoides cuyos semiejes están dados respec-
tivamente por:
Ir2 Ir2 L2 Ir2 Ir2 L2 Ir2 Ir2 L2
a2 : , ; b2 : , ; c2 : , (8.170)
I1 I1 2T I1 I2 I2 2T I2 I3 I3 2T I3
La existencia de una intersección está asegurada por las desigualdades evidentes:
~
I = ~n · I~ · ~n ≥ I1 ; I ≤ I3 ⇒ 2T I1 < L2 < 2T I3 (8.171)
siendo I1 el más pequeño de los tres momentos principales de inercia e I3 el mayor.
El cuerpo rı́gido simétrico libre en la representación de Poinsot. Cuando

I1 = I2 6= I3 , dos de los semiejes del elipsoide de inercia son iguales, siendo éste un
elipsoide de revolución. Las ecuaciones de la polodia son (8.169) y (8.73):
Ir2 L2
I1 (x2 + y 2 ) + I3 z 2 = Ir2 ; I12 (x2 + y 2 ) + I32 z 2 = (8.172)
2T
De estas ecuaciones obtenemos las siguientes:

L2
(I1 I3 − I32 )z 2 = Ir2 I1 −
2T
(8.173)
2 2 2 L2
I1 (I1 − I3 )(x + y ) = Ir − I3
2T
Vemos que la polodia está situada a una distancia constante del origen, sobre el eje
de simetrı́a, y es una circunferencia. El elipsoide rueda sin deslizar sobre el plano siendo
la polodia una circunferencia, o sea que ~r es paralelo ~ω (el vector de posición del centro
de la polodia). El vector forma el mismo ángulo con ~ω, es decir que está a lo largo del
eje de simetrı́a, siempre tienen el mismo ángulo; es decir, el eje de simetrı́a y ~ω forman
un ángulo que permanece constante, lo cual significa que ω ~ efectúa un movimiento de
precesión alrededor del eje de simetrı́a.
La proyección de ~ω sobre el eje z es constante y las proyecciones sobre los ejes
x y y ejecutan movimientos armónicos simples con cierta frecuencia Ω. Respecto a los
ejes espaciales, como se dijo, ~ω precesa alrededor de L ~ (véase figura 8.6). El vector ~ω
precesa en los dos sistemas de ejes generando dos conos. En el sistema espacial ~ω precesa
Cono del cuerpo rígido
Cono fijo
ω
z
L
Figura 8.6 El cono del cuerpo rı́gido rueda sin deslizar sobre el cono fijo
alrededor del vector constante L ~ y en el sistema del cuerpo rı́gido precesa alrededor del
eje de simetrı́a. En conclusión, el movimiento del cuerpo rı́gido puede obtenerse a partir
del movimiento del cono del cuerpo rı́gido que rueda sin deslizar sobre el cono fijo.
Es claro que para un cuerpo no simétrico la polodia no será una circunferencia, ~ω
no será constante, como tampoco el ángulo entre los vectores ~ω y L.~ En el cuerpo rı́gido
asimétrico se presentarán estos tres movimientos: rotación alrededor del eje instantáneo
de rotación; precesión del eje instantáneo de rotación alrededor del vector constante L ~
~
y nutación del eje instantáneo de rotación al cambiar el ángulo entre los vectores ~ω y L.
Es claro que la frecuencia de nutación es el doble de la frecuencia de rotación.
Solución de las ecuaciones de Euler para un cuerpo rı́gido simétrico

libre. Las ecuaciones de Euler para este problema toman la forma:
I1 ω̇x = ωy ωz (I1 − I3 ) (8.174)
I1 ω̇y = −ωx ωz (I1 − I3 ) (8.175)
I3 ω̇z = 0 (8.176)
De (8.174) y (8.175) obtenemos las siguientes dos ecuaciones:
I12 ω̈x + ωx ωz (I1 − I3 )2 = 0 ; I1 ω̇y = −ωz ωx (I1 − I3 ) (8.177)
O sea que la solución a las ecuaciones de Euler puede escribirse como:

Ω
ωx = A sen(|Ω|t + δ) ; ωy = A cos(|Ω|t + δ) (8.178)
|Ω|
ωz = constante, donde Ω está definida por:
I1 − I3
Ω= ωz (8.179)
I1
El resultado nos dice que el vector ~ω precesa alrededor de z a una rata constante
|Ω|. Como no hay nutación se dice que la precesión es regular. El resultado está de
acuerdo con las conclusiones obtenidas mediante la construcción de Poinsot.
Ejemplo 8.4.1 Analizar el movimiento rotacional de la Tierra con un modelo de cuerpo
rı́gido simétrico libre.
La Tierra puede suponerse aproximadamente como un elipsoide achatado y con una
distribución uniforme de materia. Entonces la masa total puede asumirse que está en el
centro de masa, de modo que con esta aproximación los demás cuerpos celestes no reali-
zarán torques. Los momentos principales de inercia respecto al centro para un elipsoide
son:
1 1 1
I1 = M (b2 + c2 ) ; I2 = M (a2 + c2 ) ; I3 = M (a2 + b2 ) (8.180)
5 5 5
Con este modelo tenemos que para la Tierra se cumple:
I3 ≈ I1 = I2 ; c≈a=b (8.181)
La relación entre los diámetros polar y ecuatorial nos da:
c
= 0, 9672 (8.182)
a
Tomando el eje z a lo largo del eje polar y sabiendo que la rotación completa
alrededor de un eje es un dı́a, obtenemos:
2π
ωz ≈ = 7, 272 × 10−5 rad/s (8.183)
dı́a
La magnitud de la precesión, A, dependerá de la medida en que difieran ω y ωz ,
que es pequeña. La frecuencia de precesión está dada por:

I1 − I3
|Ω| = ωz ≈ 1 − c ωz = 0, 00328ωz (8.184)
I1 a
El perı́odo de precesión será pues de unos 305 dı́as. Se ha observado que tal pre-
cesión se presenta siendo su amplitud pequeña. El “radio” de la polodia es aproximada-
mente de 5 a 8 metros. La polodia es una curva complicada que exhibe algo ası́ como una
nutación. El perı́odo observado es de unos 427 dı́as; es una precesión no atribuible a tor-
ques; las discrepancias se deben a la idealización del modelo. Esta precesión es diferente
a la precesión de los equinoccios, debida a los torques ejercidos por el Sol y la Luna,
pues en realidad el centro de masa de la Tierra no coincide con el centro geométrico, el
perı́odo de esta precesión es de 25.800 años. Esta precesión tampoco es la responsable
de las estaciones. Éstas se deben a que el plano de la elı́ptica hace un ángulo de 23◦ con
el plano ecuatorial de la Tierra.
Las funciones elı́pticas de Jacobi. Haremos un resumen de las principales

propiedades de estas funciones que, sabemos, aparecen en la solución general para un
cuerpo rı́gido libre asimétrico.6
6 Véase el texto de Abramowitz y Stegun, Handbook of mathematical functions, capı́tulos 16 a 18,
1965; y las referencias dadas en él, especialmente el curso de análisis de Whittaker y Watson.
Si z es una variable compleja, en general una función elı́ptica Fpq (z) es una función
que posee un cero en el punto z = p y un polo en el punto z = q, donde p y q son los
puntos de una red rectangular infinita en el plano complejo. En la construcción de esta
red se parte de una celdilla elemental constituida por un rectángulo cuyos vértices están
en los puntos O, K, K + iK ′ , iK ′ , llamados respectivamente s, c, d, n. Los números
reales K y K ′ están definidos de la siguiente manera en función de un parámetro real
m, 0 ≤ m ≤ 1:
Z π/2 Z π/2
dθ dθ
K= √ ; K′ = p (8.185)
0 1 − msen2 θ 0 1 − (1 − m)sen2 θ
K se llama el cuartiperı́odo real e iK ′ el cuartiperı́odo complejo de la función

elı́ptica Fpq (z). Estas funciones se llaman funciones elı́pticas de Jacobi y usualmente se
denotan en la forma pqz. Hay doce de estas funciones que son sc z, sd z, sn z, cs z, cd z,
cn z, ds z, dn z, dc z, ns z, nc z, nd z.
La definición de las funciones elı́pticas de Jacobi es: (i) pq z tiene solamente singula-
ridades aisladas; tiene un cero en p y un polo en q; (ii) Las funciones pq z son periódicas.
Entre p y q hay un semiperı́odo de la función pq z, siendo 2K, 2iK ′ , 2K + 2iK ′ los
perı́odos.
Ası́ por ejemplo, las funciones copolares con polo en iK ′ , sn, cn y dn tienen res-
pectivamente los perı́odos 2iK ′ , 2K + 2iK ′ y 2K, o equivalentemente los perı́odos 4K,
4K y 2K.
Las funciones elı́pticas de Jacobi pueden definirse también con respecto a ciertas
integrales. Si:
Z φ
dθ
z= √ (8.186)
0 1 − m sen2 θ
el ángulo φ es llamado la amplitud y m el parámetro.
φ = am z (8.187)
Entonces se definen las funciones ası́:

p
sn z = sen φ ; cn z = cos φ ; dn z = 1 − m sen2 φ (8.188)
Todas las otras nueve funciones pueden expresarse en función del trio copolar sn,
cn, dn. Estas funciones aparecen al evaluar ciertas integrales, llamadas integrales elı́pti-
cas, que son de la forma:
Z
R(x, y) dx (8.189)
donde R(x, y) es una función racional de x, y, donde y 2 es igual a un polimonio en x de

grado 3 o de grado 4. Cuando R(x, y) sólo contiene potencias pares de y, o cuando el
polimonio y 2 tiene un factor repetido la integral (8.189) es elemental. En todos los demás
casos aparecerán las funciones elı́pticas. Cualquier integral elı́ptica puede expresarse
en términos de las integrales elı́pticas de primera, segunda y tercera clase, definidas

respectivamente por:
Z φ Z φp
dθ
√ ; 1 − m sen2 θ dθ ;
0 1 − m sen2 θ 0
Z φ (8.190)
dθ
p
0 (1 − n sen2 θ)(1 − m sen2 θ)
Cuando φ = π/2, las integrales (8.190) se llaman integrales elı́pticas completas de
primera, segunda y tercera clase. Cuando el parámetro toma el valor cero las funciones
elı́pticas coinciden con funciones circulares. Cuando el parámetro es tan pequeño que
podemos despreciar términos de orden superior a m2 tenemos las aproximaciones:
1
sn z = sen z − m(z − sen z cos z) cos z + ...
4
1
cn z = cos z + m(z − sen z cos z) sen z + ...
4
(8.191)
1
dn z = 1 − m sen2 z + ...
2
1
an z = z − m(z − sen z cos z) + ...
4
Cuando m tiende a la unidad, las funciones elı́pticas coinciden con funciones hi-
perbólicas; por ejemplo sn z → tanh z; cn z → 1/ cosh z; dn z → 1/ cosh z. A partir
de la ecuación diferencial que sirve para definir la función sn podemos obtener buena
información del comportamiento de las funciones elı́pticas, para z real.
La ecuación (8.186) equivale a la ecuación diferencial:
2
dφ
= 1 − msen2 φ (8.192)
dx
Mediante la sustitución y = sen φ, (8.192) se transforma en:
2
dy
= (1 − y 2 )(1 − my 2 ) (8.193)
dx
2
Claramente y = sen x es la solución cuando m = 0 (véase figura 8.7). (dy/dx)√
es igual a una función continua de y que se anula en y = ±1 y √ en y = ±1/ m; en
y = ±1 la derivada
√ de esa función vale ±2(m − 1) y en y = ±1/ m la derivada vale
∓2(m − 1)/ m.
De (8.193) podemos deducir las siguientes propiedades de la solución, y = s nx:
(i) Si y(x) es una solución, y(x + c) es una solución ya que ni y ni dy/dx cambian
en una translación en el eje x.
(ii) y(x) está siempre contenida √ entre los valores y = −1 y y = +1 puesto que para
valores absolutos de y entre√1 y 1/ m, dy/dx es imaginaria, como también lo es para
valores de y mayores que 1/ m.
(iii) Como para todos los valores de y entre −1 y +1 la derivada dy/dx es no nula,
se sigue que en el intervalo (−1, +1) no hay otros puntos diferentes a y = ±1 donde la
pendiente se anule dentro del intervalo.
(iv) Sólo hay una curva y(x) que toca una de las lı́neas y = −1 o y = +1 en un
punto x0 dado. Para x < x0 y para x > x0 la pendiente de y en la vecindad de x0 tiene
valores opuestos. Por ejemplo, si (x = x0 , y = −1) es el punto en cuestión, se sigue
integrando (8.193):
Z y
dy
x − x0 = − p
−1 (1 − y )(1 − my 2 )
2
Z y (8.194)
dy
x − x0 = p
−1 (1 − y 2 )(1 − my 2 )
según que dy/dx sea negativa o positiva respectivamente.
y=1
dn x
sn x
x0
x
2K
cn x
y = –1
Figura 8.7 Funciones circulares cuando se desprecian términos de orden superior a m2
Cuando (x, y) tiende a (x0 , −1), las ecuaciones (8.194) dan la única curva y(x) que
satisface la condición de tangencia.
(v) La curva y(x) es inalterada mediante una reflexión en el origen. Basta con
conocer la curva entre y = 0 y y = 1, o equivalentemente entre x = 0 y x = K para
construir la curva total.
(vi) La distancia en x entre dos sucesivos contactos de y(x) con las lı́neas y = −1
y y = +1 está dada por:
Z +1
dy
2K = p (8.195)
−1 (1 − y )(1 − my 2 )
2
(vii) De la simetrı́a de la curva respecto a la normal en el punto de contacto con

una de las lı́neas y = −1 o y = +1, se sigue que y(x) es periódica con perı́odo 4K.
Podemos entonces definir a sn x por las siguientes propiedades:
2
dsn x
= (1 − sn2 x)(1 − msn2 x) ; sn0 = 0
dx
(8.196)
dsn x
= 1 ; sn(x + 4K) = sn x
dx x=0
Podemos definir las funciones cn x y dn x por las ecuaciones:
cn2 x = 1 − sn2 x ; dn2 x = 1 − msn2 x (8.197)
con la condición de que las funciones y sus derivadas sean continuas. Como 0 ≤ m ≤ 1,
dnx siempre puede tomarse positiva. El perı́odo de cn x es 4K y el de dn x es 2K. Se
sigue de (8.196) que:
dsn x
= cn x dn x (8.198)
dx
de (8.196) y (8.197) se sigue entonces que:
dcn x ddn x
= −sn x dn x ; = −m sn x cn x (8.199)
dx dx
La figura 8.7 muestra las funciones elı́pticas de Jacobi sn, cn y dn, para m = 1/2.
Con las funciones elı́pticas es posible hallar fórmulas análogas a las de la trigono-
metrı́a ordinaria. Por ejemplo, la fórmula de adición para la función sn es:
sn u cn υ dn υ ± sn υ cn u dn u
sn(u ± υ) = (8.200)
1 − m sn2 u sn2 υ
Algunos valores notables de sn son:
sn 0 = 0 ; sn K = 1 ; sn iK ′ = ∞
1 K 1 (8.201)
sn(K + iK ′ ) = √ ; sn =p √
m 2 1 + m1
Con estas fórmulas podemos hallar la siguiente relación últil:

1
±√ = ±sn(u ± iK ′ ) (8.202)
m sn u
dada por la fórmula 16.8.1 del libro de Abramowitz, Op. cit.
Relacionadas con las funciones elı́pticas están las funciones θ, denotadas por θ1 (z, q),
θ2 (z, q), θ3 (z, q), θ4 (z, q), cuyas definiciones están en la sección 16.27 del libro de Abra-
mowitz. Otros autores usan la notación siguiente para las mismas funciones: θ11 , θ10 , θ00 ,
θ01 , como en el Tratado de mecánica analı́tica de Wittaker, o en el texto de mecánica de
Landau (ver bibliografı́a). Nos interesará la función θ4 que tiene la siguiente expresión
como un producto infinito (fórmula 16.37.4 del del libro de Abramowitz):
1/2 Y∞
m
θ4 (v) = θ4 (0) (1 − 2q 2n−1 cos 2v + q 4n−2 ) (8.203)
16qm21 n=1
donde m y m1 = 1 − m tienen la misma significación que en las funciones elı́pticas, y ϑ

y q están definidas por:
πu ′
v= ; q = e−πK /K (8.204)
2K
La siguiente expresión para θ4 (v) como un producto infinito es más útil:
∞
Y
θ4 (v) = constante (1 − q 2n−1 e2iv )(1 − q 2n−1 e−2iv ) (8.205)
n=1
Tomando logaritmos en esta expresión y derivando respecto a v llegamos a la

siguiente fórmula para la derivada logarı́tmica de θ4 :
∞
θ4′ (v) X −2iq 2n−1 e2iv 2iq 2n−1 e−2iv
= + (8.206)
θ4 (v) n=1 1 − q 2n−1 e2iv 1 − q 2n−1 e−2iv
Esta expresión tiene polos simples donde θ4 tiene ceros simples, o sea cuando v es
tal que:
′
e±2iv = ei(2n−1)πiK /K
(8.207)
es decir, cuando u = 2Kv/π, vale:
urm = (2r + 1)iK ′ + 2mK ; r, n = 0, ±1, ±2. . . ± ∞ (8.208)
Con esta expresión para los polos de θ4′ /θ4 podemos formar la serie de Laurent
para esta función:
+∞
X +∞
X
θ4′ (v) brm
= (8.209)
θ4 (v) r=−∞ m=−∞ v − vrm
donde brm son los residuos de la función que obtenemos de:

θ4′ (v)
brm = lı́m (v − vrm ) (8.210)
v→vrm θ4 (v)
Evaluando esta expresión llegamos finalmente a:
+∞
X +∞
X
θ4′ (v) 1
= (8.211)
θ4 (v) r=−∞ m=−∞ v − vrm
Solución de las ecuaciones de Euler para un cuerpo rı́gido asimétrico

libre.7 Supondremos que I3 > I2 > I1 . De acuerdo con la representación de Poinsot,
7 Este problema fue resuelto por Jacobi en 1849.
las ecuaciones de la polodia están dadas por la intersección del elipsoide de inercia con
el elipsoide del momento angular:
I1 ω21 + I2 ω 22 + I3 ω 23 = 2E
(8.212)
I12 ω21 + I22 ω 22 + I32 ω23 = L2
De estas ecuaciones podemos obtener las siguientes expresiones para ω21 y ω23 en
función de ω 22 :
1
ω21 = [(2EI3 − L2 ) − I2 (I3 − I2 ) ω 22 ] (8.213)
I1 (I3 − I1 )
1
ω23 = [(L2 − 2EI3 ) − I2 (I2 − I1 ) ω 22 ] (8.214)
I3 (I3 − I1 )
La ecuación de Euler para ω2 , (8.214), toma entonces la forma:

1
ω̇2 = √ (2EI3 − L2 ) − I2 (I3 − I2 )ω 22 ·
I2 I1 I3
2 1/2
(L − 2EI1 ) − I2 (I2 − I1 )ω 22 (8.215)
Al separar variables e integrar obtenemos una expresión que se puede reducir a

una integral elı́ptica incompleta de primera clase en la forma normal, llamando:
2EI3 − L2 L2 − 2EI1
b2 = ; a2 = (8.216)
I2 (I3 − I2 ) I2 (I2 − I1 )
Si para precisar suponemos que 2EI3 > L2 > 2EI2 , encontramos entonces que a2
2
y b son positivas. Notamos que al expresar a L y a E en función del momento de inercia
alrededor del eje de rotación I, esta condición nos dice que I3 > I > I2 > I1 , con lo cual
obtenemos que a es mayor que b. Con estas sustituciones, y escogiendo t = 0 de modo
que ω 2 sea igual a cero, la integral de (8.215) es de la forma:
1/2 Z ω2
I1 I2 I3 a dω 2
t= p (8.217)
(I3 − I2 )(L2 − 2EI1 ) 0 (a − ω 22 )(b2 − ω 22 )
2
Mediante la fórmula 17.4.45 del Handbook of mathematical functions de Abramowitz

y Stegun, la integral en (8.217) puede llevarse a la forma de una integral elı́ptica de
primera clase con parámetro m dado por:
b2 I2 − I1 2EI3 − L2
m= 2
= (8.218)
a I3 − I2 L2 − 2EI1
Esta integral puede expresarse en términos de la función elı́ptica sn de acuerdo
con (8.188). En efecto, haciendo en (8.217) la sustitución señalada en la fórmula del
Handbook:
ω2 = b sn v (8.219)
y teniendo en cuenta que, según (8.198):

dω 2 = b cn v dn v dv (8.220)
obtenemos en el lugar de la integral de (8.217):
Z v
dn v dv ω2
√ = v = sn−1 (8.221)
0 1 − msn v2 b
Si llamamos:
1/2
(I3 − I2 )(L2 − 2EI1 )
c= (8.222)
I1 I2 I3
entonces (8.217) se reduce, llamando b2 = b, a:
ω 2 = b2 sn ct (8.223)
Reemplazando a ω2 (t) en (8.213) y (8.214) obtenemos para ω 1 y ω 3 :
ω1 = b1 sn ct
(8.224)
ω3 = b3 sn ct
donde b1 y b3 están dadas por:
2EI3 − L2 L2 − 2EI1
b21 = ; b23 = (8.225)
I1 (I3 − I1 ) I3 (I3 − I1 )
Al reemplazar la solución (8.224) en las ecuaciones de Euler, éstas resultan com-
patibles si el producto b1 b2 b3 es negativo.
ω1 y ω2 son periódicas con perı́odo 4K y ω3 es periódica con perı́odo 2K, donde
K es la integral elı́ptica completa de primera clase. El perı́odo que nos interesa es con
respecto al tiempo que está dado por:
4K
T = (8.226)
c
De acuerdo con la construcción de Poinsot, al cabo de un tiempo T el vector ω ~
completa un ciclo de precesión alrededor del eje z, es decir, ω 1 y ω 2 coinciden consigo
mismas, en tanto que al cabo de un tiempo T /2, ω 3 coincide consigo misma.
El problema no termina hallando a ω r (t), pues interesa describir el movimiento
absoluto del cuerpo rı́gido en el espacio, o sea hallar los ángulos de Euler en función del
tiempo.
Reemplazando las expresiones (8.224) y (8.225) en (8.131), obtenemos tres ecua-
ciones diferenciales para θ, φ y ψ, cuya solución es complicada cuando los ejes espaciales
se toman arbitrariamente, pero se simplifica un poco tomando el eje z en la dirección de
~ Como el ángulo polar y el ángu-
la lı́nea invariable definida por el vector constante L.
~
lo acimutal del vector L, que coincide con el eje z, son respectivamente θ y π/2 − ψ,
podemos sin más escribir:
L1 = L senθ senψ ; L2 = L senθ cos ψ ; L3 = L cos ψ (8.227)
Como Lr = Ir ω r obtenemos que:

1/2
I3 ω 3 I3 (L2 − 2EI1 )
cos θ = = dn ct
L L2 (I3 − I1 )
(8.228)
1/2
I1 ω 1 I1 (I3 − I2 ) cn ct
tan ψ = =
I2 ω 2 I2 (I3 − I1 ) sn ct
θ y ψ al igual que las componentes de ~ω son funciones periódicas, con perı́odo igual
al de la función dn, o sea T /2. En efecto, dn z y cn z/sn z = cs z son coperiódicas con
perı́odo 2K. El ángulo φ se puede obtener de (8.132) y (8.228). El resultado para φ̇ en
función de las componentes de ~ω solamente es:
I1 ω 21 + I2 ω 22
φ̇ = L (8.229)
I12 ω 21 + I22 ω22
φ̇ es periódica con perı́odo T /2. En general, φ no se incrementará por un múltiplo de 2π
en un perı́odo y por ello el movimiento del cuerpo rı́gido como un todo no es periódico,
o sea que el cuerpo rı́gido en general no vuelve nunca a su posición inicial. En efecto,
reemplazando en (8.229) las expresiones (8.224) y (8.225) obtenemos:
(I3 − I2 ) + (I2 − I1 )sn2 ct
φ̇ = L (8.230)
I1 (I3 − I2 ) + I3 (I2 − I1 )sn2 ct
Ahora, podemos definir una cantidad real β por medio de estas expresiones que
son mutuamente consistentes:
1/2 1/2
I3 (I − I1 ) I(I3 − I1 )
sn iβ = i ; cn iβ =
I1 (I3 − I) I1 (I3 − I)
(8.231)
1/2
I2 (I3 − I1 )
dn iβ =
I1 (I3 − I2 )
I que no es el momento de inercia respecto al eje de rotación, está dado por:
L2
I= (8.232)
2E
de modo que la expresión para m toma la forma:
I3 − I I2 − I1
m= (8.233)
I − I1 I3 − I2
φ̇ toma la siguiente forma al reemplazar a (8.231) en (8.230):
L I2 + (I1 dn2 iβ − I2 )sn2 ct
φ̇ = (8.234)
I1 I2 1 − m sn2 iβ sn2 ct
Esta expresión es de la forma (Ax + Bsn2 ct)/(Cx + Dsn2 ct) o sea es el cociente
de dos funciones lineales de x. Al efectuar el cociente llegamos a:

L 1 1 dn2 iβ sn2 ct
φ̇ = +L − (8.235)
I1 I2 I1 1 − m sn2 iβ sn2 ct
Examinemos la estructura analı́tica del segundo término en (8.235). Tiene singu-

laridades en los valores de ct tales que se anula el denominador:
±1
sn ct = √ = sn (±iβ + iK ′ ) (8.236)
m sn iβ
donde hemos usado la fórmula (8.202). Usando la propiedad de la función sn de ser
doblemente periódica, con perı́odos 2iK ′ , 4K y 4K + 4iK ′, podemos concluir de (8.236)
que snu = (−1)r sn (u + 2mK + 2riK ′ ) y por lo tanto:
(−1)r ct = ±iβ + (2r + 1)iK ′ + 2mK ; r, m = 0, ±1, ±2, ... (8.237)
Estos ceros del denominador son simples, o sea que la función puede expandirse en
series de Laurent de la forma (8.209):
X+∞ +∞
"
1 1 X arm
L −
I2 I1 r=−∞ m=−∞ (−1)r ct + iβ − urm
# (8.238)
brm
− + constante
(−1)r ct − iβ − urm
Para evaluar los residuos, expandimos el denominador en (8.235) en serie de Taylor

alrededor de los ceros, (8.237):
1 − m sn2 iβ sn2 ct = 1 − m sn2 iβ sn2 (±iβ + iK ′ )
+ [(−1)r ct − (±iβ + urm )] 2m sn2 iβ sn(±iβ + iK ′ )· (8.239)
cn(±iβ + iK ′ ) dn(±iβ + iK ′ )
donde hemos usado la periodicidad de las funciones elı́pticas. Usando (8.236) y luego las
expresiones (8.231), llegamos a que arm y brm valen respectivamente:
1/2
dn iβ 1 I1 I2 (I3 − I2 )(I − I1 )
± =± (8.240)
2m sn iβ cn iβ 2i II3 (I2 − I1 )
Los residuos del segundo término de (8.235) son entonces:
c
±i (8.241)
2
Por tanto el segundo término del lado derecho de (8.235) es:
+∞ +∞
"
c X X 1
i r
2 r=−∞ m=−∞ (−1) ct + iβ − urm
# (8.242)
1
− + constante
(−1)r ct − iβ − urm
Es fácil ver que u−r,−m = ur−1,m , con lo cual es posible hacer que los términos
con r impares tengan la misma forma de los términos con r pares. Entonces (8.242) es
igual a una expresión que no contiene el (−1)r . Usando la expresión (8.226) para c y
luego multiplicando numeradores y denominadores por π/(2K), obtenemos:
+∞ +∞
"
π X X 1
i
T r=−∞ m=−∞ π (ct + iβ) − vrm
2K
# (8.243)
1
− π + constante
(ct − iβ) − vrm
2K
Comparando ahora a (8.243) con (8.236), obtenemos finalmente la siguiente expre-
sión para φ̇ en términos de las funciones θ:
"
L iπ θ4′ [(ct + iβ)π/(2K)]
φ̇ = +
I1 T θ4 [(ct + iβ)π/(2K)]
#
θ4′ [(ct − iβ)π/(2K)] θ4′ (iβπ/2K)
− −2 (8.244)
θ4 [(ct − iβ)π/(2K)] θ4 (iβπ/(2K)
La integración ahora es simple:

2π
θ4
t + iα
L 2πi θ4′ (iα) i T
φ(t) = − t + ln (8.245)
I1 T θ4 (iα) 2 2π
θ4 t − iα
T
donde definimos a α = πβ/(2K).
De acuerdo con la expresión (8.203), la función θ4 (v) tiene perı́odo π y además es
función par de v, de modo que al completarse un perı́odo de θ y ψ, o sea cuando t = T /2,
el término logarı́tmico de φ se anula. Entonces:

T L T θ′ (iα)
φ = − πi 4 (8.246)
2 I1 2 θ4 (iα)
Como θ4 tiene la expansión:
θ4 (v) = 1 − 2q cos v + 2q 4 cos4 v − ... (8.247)
Entonces:

T LT q senh2α − 2 q 4 senh4α + ...
φ = + 4π (8.248)
2 2I1 1 − 2q cosh 2α + 2q 4 cosh 4α − ...
sólo en circunstancias muy especiales esta expresión será un múltiplo entero de 2π; por
esta razón el cuerpo rı́gido no vuelve nunca a su posición inicial.
Ejemplo 8.4.2 Estudiar la estabilidad de las rotaciones de un cuerpo rı́gido asimétrico
libre alrededor de cada uno de los ejes principales.
Asumamos que el cuerpo inicialmente gira alrededor del eje x1 y que además
I3 > I2 > I1 . Por efecto de alguna pequeña perturbación el cuerpo adquiere rotaciones
alrededor de los otros ejes; asumiremos que ω2 y ω3 son entonces cantidades pequeñas
en comparación con ω1 . La ecuación de Euler para ω1 contendrá el producto ω2 ω3 , o sea
que al primer orden en estas cantidades ω 1 es constante. Esto permite resolver fácilmente
las otras dos ecuaciones de Euler:

I3 − I1 I1 − I2
ω˙2 = ω 1 ω 3 ; ω˙3 = ω1 ω 2 (8.249)
I2 I3
De aquı́ obtenemos la siguiente ecuación diferencial para ω2 :
(I1 − I3 )(I1 − I2 ) 2 2
ω¨2 + ω1 ω2 = 0 (8.250)
I2 I3
Esta ecuación tiene como solución:
ω 2 = A sen(Ω1 t + δ) (8.251)
donde A es una cantidad pequeña y Ω1 satisface:
1/2
(I3 − I1 )(I2 − I1 )
Ω1 = ω1 (8.252)
I2 I3
Como Ω1 es real, entonces ω 2 y ω 3 tendrán movimientos oscilatorios con frecuencia
Ω1 . La rotación alrededor de x1 es estable. De manera similar, cuando el cuerpo rota
inicialmente alrededor de x3 , el movimiento es estable con frecuencia:
1/2
(I3 − I2 )(I3 − I1 )
Ω3 = ω3 (8.253)
I1 I2
Sin embargo, cuando el cuerpo rota inicialmente alrededor de x2 el movimiento
es inestable porque Ω2 resulta imaginario. O sea que para rotaciones alrededor del eje
de menor momento de inercia o del eje de mayor momento de inercia hay estabilidad,
siendo inestable la rotación alrededor del eje correspondiente al momento de inercia in-
termedio. Para un cuerpo rı́gido simétrico, digamos para el cual I1 = I2 , es fácil mostrar
que solamente es estable la rotación alrededor del eje x3 .
Ejemplo 8.4.3 Calcular los diferentes perı́odos asociados con el movimiento libre de un
elipsoide homogéneo asimétrico cuyos semiejes tienen las longitudes a = 0, 1m, b = 0, 2m,
c = 0, 3m y cuya masa es de 1 kg. Los valores iniciales de las componentes de la velocidad
angular alrededor de los ejes principales son ω1 = πs−1 , ω 2 = 10πs−1 , ω 3 = πs−1 ,
asumiendo que I1 < I2 < I3 .
De acuerdo con las fórmulas (8.180), los valores de los momentos principales de
inercia son:
I1 = 0, 010 kg m2 ; I2 = 0, 020 kg m2 ; I3 = 0, 026 kg m2 (8.254)
Los valores de las constantes de movimiento 2E y L son:
2E = 2, 036π 2J ; L2 = 0, 040776π 2J2 s2 (8.255)
Reemplazando estos valores en (8.232) hallamos que I vale:
I = 0, 0200275 kg m2 (8.256)
Definiendo el ángulo modular γ como m = sen2 γ, y usando la fórmula (8.218) para

m hallamos que m y γ valen:
m = 0, 9926866 ; γ = 85, 09◦ (8.257)
La tabla 17.2 del texto de Abramowitz y Stegun nos da los siguientes valores para
q, K y K ′ , usando interpolación lineal:
K = 3, 8516333 ; K ′ = 1, 5736950 ; q = 0, 2770075 (8.258)
La cantidad c, dada por (8.222), vale:
c = 4, 8535462 πs−1 (8.259)
El perı́odo de los ángulos θ y ψ es T = 4K/c, que tiene el valor 1,010 s. Para hallar
el perı́odo de φ debemos calcular el valor de β. La fórmula (8.231) nos da que:
dn iβ = 2, 3094003 (8.260)
La transformación imaginaria de Jacobi dice que dn iβ = dc1 β, donde el subı́ndice

indica que el módulo de la función elı́ptica es m1 . Notando que dc1 = dn1 /cn1 y luego
expresando a cn1 y dn en función de sn1 , obtenemos que:
1 − dn2 iβ
sn21 β = = 0, 8136155 (8.261)
1 − m − dn2 iβ
Entonces sn1 β = 0, 9020063. β será igual al valor de la integral elı́ptica incompleta
de primera clase con ángulo modular γ1 = 90◦ − 85, 09◦ = 4, 91◦ y amplitud igual a
arcsen(0, 9020063) = 64, 45◦. De la tabla 17.5 del manual hallamos el valor mediante
interpolación:
β = 1, 1258087 (8.262)
Entonces α = πβ/(2K) = 0, 459134. Reemplazando este valor en (8.248) obtene-

mos:

T
φ = 7, 303 × 2π (8.263)
2
O sea que al movimiento en φ hay asociado otro perı́odo T ′ cuyo valor es T ′ = 0, 069
s, que es el perı́odo precesional alrededor de la lı́nea invariable, o sea el movimiento medio
de φ. Este problema pertenece al caso tercero del ejemplo 8.4.2, donde se señaló que Ω22
resulta negativa. En efecto:
(I2 − I1 )(I2 − I3 )
Ω22 = ω22 = −227, 759 s−2 (8.264)
I1 I3
a lo cual corresponde un tiempo caracterı́stico de 0, 0662 s.
8.5. El trompo con el punto inferior fijo en un campo

gravitacional homogéneo
Whittaker en su tratado de dinámica analı́tica define un trompo como un cuerpo
rı́gido simétrico alrededor de un eje, que termina en una punta en un extremo del eje.
Aquı́ estudiaremos el movimiento del trompo bajo la acción de la gravedad cuando la
punta permanece fija. Este problema fue estudiado por Lagrange en 1788.
La figura 8.8 muestra el sistema de ejes empleados. Los ejes x, y, z, son un sistema
z
y
c.g.
l
mg θ
y
0
ψ
x φ
Figura 8.8 Trompo con el punto inferior fijo en un campo gravitacional. Sistema de ejes.
de ejes principales en el punto fijo O. Si los momentos principales respecto al centro de

gravedad son I1c , I2c , I3c , podemos usar el teorema de Steiner para evaluarlos respecto
al punto O:
I1 = ml2 + I1c ; I2 = ml2 + I2c ; I3 = I3c (8.265)
como el cuerpo rı́gido es simétrico entonces I1 = I2 .
Las ecuaciones de movimiento. El lagrangiano respecto a los ejes x, y, z, es:

1 1
L= I1 (ωx2 + ωy2 ) + I3 ωz2 − mgl cos θ (8.266)
2 2
Usando las ecuaciones (8.131) que expresan las ωi en función de los ángulos de
Euler podemos expresar a L en términos de los ángulos de Euler:
1 1
L= I1 (θ̇2 + φ̇2 sen2 θ) + I3 (ψ̇ + φ̇ cos θ)2 − mgl cos θ (8.267)
2 2
φ y ψ son coordenadas cı́clicas y por lo tanto sus momentos canónicos conjugados

son constantes de movimiento:
pφ = (I1 sen2 θ + I3 cos2 θ)φ̇ + I3 ψ̇ = Lz ≡ I1 b
(8.268)
pψ = I3 (ψ̇ + φ̇ cos θ) = Lz = I3 ωz ≡ I1 a
a, b y ωz son constantes. El torque de la gravedad produce rotaciones sólo alrededor de
la lı́nea de nodos, en tanto que alrededor de z y z no hay torques, razón por la cual Lz y
Lz han de conservarse. Las otras componentes de L ~ no son constantes pero sı́ la energı́a
total:
1 1
E= I1 (θ̇2 + φ̇2 sen2 θ) + I3 (ψ̇ + φ̇ cos θ)2 + mgl cos θ (8.269)
2 2
Las ecuaciones (8.268) y (8.269) constituyen un conjunto de tres ecuaciones di-
ferenciales simultáneas para θ, φ, ψ; por lo tanto son equivalentes a las ecuaciones de
Lagrange para estas cantidades. En efecto, φ̇ y ψ̇ pueden expresarse en función de θ
solamente:
b − a cos θ
φ̇ =
sen2 θ
(8.270)
I1 a b − a cos θ
ψ̇ = − cos θ
I3 sen2 θ
Como E depende sólo de ψ̇, θ̇, φ̇ y θ, puede expresarse en términos de θ̇ y θ dando

una ecuación diferencial para θ:
1 1 1 (b − a cos θ)2
E= I3 ωz2 + I1 θ̇2 + I1 sen2 θ + mgl cos θ (8.271)
2 2 2 sen4 θ
o sea que:
1 1 1 (b − a cos θ)2
E ′ = E − I3 ωz2 = I1 θ̇2 + I1 + mgl cos θ (8.272)
2 2 2 sen2 θ
Vemos que la variación de θ es la misma que se presentarı́a en un sistema dinámico
con un grado de libertad para el cual las energı́as cinética y potencial son respectiva-
mente:
1 2 1 (b − a cos θ)2
I1 θ̇ ; I1 + mgl cos θ (8.273)
2 2 sen2 θ
Llamando u = cos θ la ecuación (8.272) toma la forma:
u̇2 = (α − βu)(1 − u2 ) − (b − au)2 = f (u) (8.274)
donde se definen a α y β como:

2E ′ 2mgl
α= ; β= (8.275)
I1 I1
La energı́a potencial efectiva. Está dada por la segunda expresión en (8.273),

que en términos de u toma la forma:

1 (b − au)2
Vef (u) = I1 + βu (8.276)
2 1 − u2
Podemos entonces escribir a f (u) como:
2
f (u) = [E ′ − Vef (u)] (1 − u2 ) (8.277)
I1
Las figuras 8.9 y 8.10 muestran las funciones Vef (θ), Vef (u) y f (u).
Vef (u)
f (u)
E′
E′0
–1 u1 0 u2
u0 +1 u3
Figura 8.9 Funciones Vef (u) y f (u)
Vemos que para un valor dado de E ′ habrá dos valores de u, u1 y u2 para los cuales
′
E = Vef (u), o sea para los cuales u̇ = 0 (θ̇ = 0). Éstos son los puntos de retorno de
la coordenada θ. Vemos que en general θ oscilará entre θ1 y θ2 esto es, habrá nutación.
Cuando E ′ = E0′ entonces u1 = u2 = u0 y no habrá nutación; este caso corresponde a
la precesión estable o regular. u1 y u2 corresponden a los ceros de la función f (u) en el
intervalo entre u = −1 y u = 1.
La función f (u) es un polimonio cúbico en u que tiene el siguiente comportamiento.
En u = ±1 la función f es negativa, puesto que f (±1) = −(b ∓ a)2 . Para algunos valores
de u entre −1 y +1, f (u) debe de ser positiva porque el lado izquierdo en (8.274) es
positivo. Cuando u → ∞, f (u) es positiva y cuando u → −∞, f (u) es negativa. La
figura 8.9 muestra el comportamiento de f (u), la cual tiene por lo tanto dos raı́ces reales
u1 y u2 que se sitúan entre −1 y +1, y la tercera raı́z u3 es también real y mayor que +1
(que corresponde a un valor de θ imaginario puro). Llamemos a esas raı́ces cos θ1 , cos θ2 ,
cosh θ3 , donde hemos convenido en designar con θ3 al módulo del ángulo correspondiente
a u3 y donde cos θ2 > cos θ1 , con lo cual θ1 > θ2 .
E0′ es el valor de E ′ para el cual θ1 y θ2 son iguales, o sea, el valor de E ′ en el cual
Vef tiene un mı́nimo. Este caso es análogo al de las órbitas circulares en el problema de
Vef (θ)
E′
E′0
0 θ2 θ0 θ1 π θ
Figura 8.10 Energı́a ptencial efectiva Vef (θ) y Vef (u)
las fuerzas centrales entre dos partı́culas.
Integración de la ecuación diferencial para θ. Realicemos la siguiente trans-

formación (Whittaker, Op. cit., p. 157):
4 α + a2
u= z+ (8.278)
β 3β
Al sustituir esta expresión en (8.274) obtenemos:
ż 2 = 4z 3 − g2 z − g3 = 4s(z) (8.279)
Si u1 , u2 y u3 son las raı́ces del polinomio cúbico f (u) entonces las raı́ces del
polinomio cúbico s(z) son:
β α + a2
zi = ui − = ei ; i = 1, 2, 3 (8.280)
4 12
Los coeficientes g2 y g3 pueden expresarse en función de los ei mediante las fórmulas
18.1 del texto de Abramowitz y Stegun:
g2 = 2(e21 + e22 + e23 )

(8.281)
g3 = 4e1 e2 e3
La conexión entre z y t está dada en consecuencia por medio de una función elı́ptica
de Weierstrass, de acuerdo con la fórmula 18.1.6 del libro de Abramowitz:8

zi = P(t + ǫ) (8.282)
donde ǫ es una constante de integración. En consecuencia:
2I1 2E ′ + I1 a2
cos θ = u(t) = P(t + ǫ) + (8.283)
mgl 6mgl
La función elı́ptica de Weierstrass puede expresarse en términos de la función
elı́ptica sn de Jacobi, según la fórmula 18.9.11 de dicho manual, para el caso en que e1 ,
e2 , e3 , son reales y tomando e3 > e2 > e1 :
e3 − e1
P(x) = e1 + 2 √ (8.284)
sn (x e3 − e1 )
donde el parámetro de la función sn es:
e2 − e1
m= (8.285)
e3 − e1
Conociendo las raı́ces ei podemos calcular el perı́odo de la función sn y en consecuencia
el perı́odo del ángulo θ, llamado el perı́odo nutacional.
Integración de las ecuaciones diferenciales para φ y ψ. φ̇ y ψ̇ están dados

por las ecuaciones (8.270). Notamos que θ no depende del valor de I3 , puesto que a no es
más que una constante de integración. En consecuencia la expresión para ψ̇ difiere de la
correspondiente expresión para un trompo esférico sólo por una constante (I1 a/I3 − a).
En el cálculo de la parte no trivial de ψ podemos asumir que el trompo es esférico
(I1 = I2 = I3 ), para el cual se cumple:
b − a cos θ a − b cos θ
φ̇ = ; ψ̇ = (8.286)
sen2 θ sen2 θ
Podemos expresar a φ̇ y ψ̇ en la forma:
a+b a−b
φ̇ = +
2(cos θ + 1) 2(cos θ − 1)
(8.287)
a+b b−a
ψ̇ = +
2(cos θ + 1) 2(cos θ − 1)
Podemos ahora sustituir la expresión para cos θ en función del tiempo, ecuación
(8.283). De (8.283) y (8.284) se sigue que el argumento de P debe ser complejo cuando
cos θ = 1 y cos θ = −1. Para θ = 0 y θ = π, según (8.283) P vale respectivamente:
mgl 2E ′ + I1 a2
P(iγ) = −
2I1 12I1
(8.288)
mgl 2E ′ + I1 a2
P(iδ) = − −
2I1 12I1
8 Véase también el texto de E. T. Whittaker y G. N. Watson, A course of modern analysis, capı́tulo
XX, Cambridge University Press, 1965; A treatise on analytical dynamics de E. T. Whittaker, capı́tulo
VI, Cambridge University Press, 1960.
donde γ y δ son reales. Reemplazando a (8.288) y a (8.283) en las fórmulas (8.287)

obtenemos:
mgl(a + b) 1
φ̇ =
4I1 P(t + ǫ) − P(iδ)
mgl(b − a) 1
−
4I1 P(t + ǫ) − P(iγ)
(8.289)
mgl(a + b) 1
ψ̇ =
4I1 P(t + ǫ) − P(iδ)
mgl(b − a) 1
+
4I1 P(t + ǫ) − P(iγ)
Cuando θ = 0 y θ = π la ecuación (8.274) nos dice que u̇2 vale:

u̇2 θ=0 = −(b − a)2 ; u̇2 θ=π = −(b + a)2 (8.290)
En consecuencia Ṗ(iγ) y Ṗ(iδ) valen, usando (8.278):

i i
Ṗ(iγ) = β(b − a) ; Ṗ(iδ) = β(b + a) (8.291)
4 4
Este resultado nos permite escribir a (8.290) en la forma:
Ṗ(iδ) Ṗ(iγ)
2iφ̇ = −
P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ)
(8.292)
Ṗ(iδ) Ṗ(iγ)
2iψ̇ = +
P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ)
De acuerdo con (8.284), la función P tiene un polo doble en el origen, o sea que la
función:
Ṗ(iδ)
(8.293)
P(x) − P(iδ)
tiene ceros en x = 0, tiene polos en x = iδ y x = −iδ, y en todos los puntos congruentes a
estos, es decir, que se obtengan por translaciones en múltiplos enteros de los perı́odos de
la función elı́ptica P(x), que son ciertos ω1 y ω2 , análogos a 2K y 2iK ′ en las funciones
elı́pticas de Jacobi. Los residuos de la función (8.293) en ésos polos son +1 y −1. En la
teorı́a de las funciones elı́pticas de Weierstrass existe una función, de la familia de las
funciones θ, que tiene una estructura analı́tica idéntica a la de la función (8.293). En
efecto, la función σ(x + iδ) tiene ceros en x = −iδ y en los puntos congruentes a éste, y
la función σ ′ (x + iδ)/σ(x − iδ) tiene polos en los puntos congruentes a x = −iδ y residuo
igual a −1, en tanto que σ ′ (x − iδ)/σ(x − iδ) tiene polos en x = iδ y residuo igual a +1.
En consecuencia la función (8.293) puede escribirse en la forma:
Ṗ(iδ) σ̇(x − iδ) σ̇(x + iδ) σ̇(iδ)

= − +2 (8.294)
P(x) − P(iδ) σ(x − iδ) σ(x + iδ) σ(iδ)
Llamando ς(iδ) = σ̇(iδ)/σ(iδ) y usando el resultado (8.294), las ecuaciones (8.292)

pueden ser integradas inmediatamente para dar a φ y ψ en función de logaritmos de la
función σ. Finalmente, φ y ψ pueden escribirse en la forma:
σ(t + ǫ − iδ) σ(t + ǫ + iδ)
e2i(φ−φ0 ) = e2[ς(iδ)−ς(iσ)]t
σ(t + ǫ + iδ)σ(t + ǫ − iδ)
(8.295)
σ(t + ǫ − iδ) σ(t + ǫ − iδ)
e2i(ψ−ψ0 ) = e2[ς(iδ)+ς(iσ)]t
σ(t + ǫ + iδ)σ(t + ǫ + iδ)
donde φ0 y ψ0 son constantes de integración.
Expresión para los parámetros de Cayley-Klein de un trompo esférico

en función del tiempo. Los parámetros de Cayley-Klein especifican la posición del
cuerpo rı́gido y están expresados en función de los ángulos de Euler mediante las fórmulas
(7.175) de la sección 7.8:
θ i(φ+ψ)/2 θ
α′ = cos e ; β ′ = i sen ei(ψ−φ)/2
2 2
(8.296)
′ θ −i(φ−ψ)/2 ′ θ −i(φ+ψ)/2
γ = i sen e ; δ = cos e
2 2
Para expresar a cos(θ/2) en función de t, notemos que 2 cos2 (θ/2) = 1 + cos θ.
Ahora, usando (8.283) y (8.288) llegamos fácilmente al resultado siguiente usando la
fórmula 18.4.4 del citado manual:
θ 2I1
2 cos2 = [P(t + ǫ) − P(iδ)]
2 mgl
(8.297)
2I1 σ(t + ǫ + iδ)σ(t + ǫ − iδ)
= −
mgl σ 2 (iδ) σ 2 (t + ǫ)
Para 2 sen2 (θ/2) hallamos una expresión similar reemplazando δ por γ. Combinan-
do (8.297) con (8.295), obtenemos:
r
′ I1 ei(φ0 +ψ0 )/2 σ(t + ǫ − iδ) tς(iδ)
α = i e
mgl σ(iδ) σ(t + ǫ)
r
I1 ei(ψ0 −φ0 )/2 σ(t + ǫ − iγ) tς(iγ)
β′ = i e
mgl σ(iγ) σ(t + ǫ)
r (8.298)
I1 ei(φ0 −ψ0 )/2 σ(t + ǫ + iγ) tς(iγ)
γ′ = i e
mgl σ(iγ) σ(t + ǫ)
r
′ I1 e−i(φ0 +ψ0 )/2 σ(t + ǫ + iδ) −tς(iδ)
δ = i e
mgl σ(iδ) σ(t + ǫ)
Para un trompo no esférico las fórmulas correspondientes a (8.295) y (8.298) se
obtienen simplemente por reemplazar la función ς por ς + i(I3 − I1 )a/(2I3 ).
La precesión estable o regular. Es el movimiento que se presenta cuando no

hay nutación, o sea cuando θ es constante. En este caso θ̇ y θ̈ son permanentemente
cero. Se sigue de las ecuaciones (8.270) que φ̇ y ψ̇ también son constantes. El valor de
u0 = cos θ0 se obtiene resolviendo la ecuación algebraica dVef /dt = 0. De acuerdo con
(8.276) esto nos da:
2(a − ub)(b − au) − β(1 − u2 )2 = 0 (8.299)
De aquı́ obtenemos el valor de u0 , y en consecuencia el valor que debe tomar la
constante E ′ para que se produzca la precesión sin nutación. La ecuación (8.299) es la
condición para que la “fuerza” en θ sea nula, o sea que es la condición para que θ̈ sea cero,
que junto con θ̇ = 0 caracteriza la precesión regular. Esta ecuación debe ser compatible
con la ecuación (8.270). Si sustituimos en (8.299) a b − au0 por su valor φ̇0 (1 − u20 ) y a
b por φ̇(1 − u20 ) + au0 , obtenemos:
β
φ̇20 u0 − aφ̇0 + =0 (8.300)
2
Esta ecuación nos da para φ̇ los valores:
s !
a 4mglI1
φ̇0 = 1± 1− u0 (8.301)
2u0 p2ψ
Como φ̇0 debe ser real, debe cumplirse que:

4mglI1 u0 2βu0
−∞ < ≤ 1 → −∞ < ≤1 (8.302)
p2ψ a2
Esta expresión limita drásticamente los posibles valores de la velocidad angular del
trompo ωz alrededor de su eje de simetrı́a z:
4mglI1 u0
≤ ωz2 (8.303)
I32
φ̇0 es la velocidad angular de precesión alrededor del eje espacial z. La ecuación

(8.301) nos dice que hay dos posibles valores de la velocidad angular de precesión que
(+) (−)
llamaremos φ̇0 (precesión rápida) y φ̇0 (precesión lenta).
El trompo rápido. Si ωz es tan grande que 2βu0 /a2 es mucho menor que la
unidad tenemos el caso del trompo rápido. De (8.303) vemos que la condición de trompo
rápido puede escribirse en la forma:

I3 1
mgl ≪ I3 ωz2 (8.304)
I1 2
Expandiendo al primer orden la raı́z cuadrada en (8.301) obtenemos para las fre-
cuencias de precesión de un trompo rápido:
(+) I3 ωz (−) mgl
φ̇0 = ; φ̇0 = (8.305)
I1 u0 I3 ωz
Para el caso en que θ0 > π/2 (u0 negativo), la condición de precesión estable
(8.302) se cumple para todos los valores de ωz . Este es el caso en que el trompo “cuelga”
(+) (−)
del punto fijo O. Según (8.305), cuando u0 < 1, φ̇0 y φ̇0 tienen signos opuestos.
Precesión con nutación. Ocurre cuando E > E ′ ; en este caso θ oscila entre θ1
y θ2 . La frecuencia angular de precesión está dada por (8.270):
b − a cos θ b/a − cos θ
φ̇ = =a (8.306)
sen2 θ sen2 θ
Se pueden presentar varios casos en cuanto al signo de φ̇:
(a) φ̇ tiene el mismo signo para todos los valores de θ. Ocurre que es positivo para
todos los valores de θ si:
b
> cos θ (8.307)
a
El trompo precesa siempre en la misma dirección alrededor del eje z en tanto que
el eje z oscila entre θ1 y θ2 . La precesión es monotónica con φ̇ siempre positivo. Si se
toma una esfera fija en el espacio, con centro en O, la “marca” que dejarı́a el eje z sobre
la esfera se representa en la figura 8.11.
z
Z
θ2 θ2 θ2
θ1 θ1 θ1
φ
a b c
Figura 8.11 “Marcas” que dejarı́a el eje z sobre la esfera: a. para b/a > cos θ, b. para
cos θ1 < b/a < cos θ2 y c. para cos θ2 = b/a
(b) φ̇ cambia de signo cuando el eje va de θ2 a θ1 . Si ocurre que:

b
cos θ1 < < cos θ2 (8.308)
a
entonces cuando θ = θ1 , φ̇ es positivo y cuando θ = θ2 , φ̇ es negativo. Por lo tanto la
precesión no es monotónica, sino que se da un avance neto en forma de rizo como en la
figura 8.11b. Es claro que en este movimiento φ̇ no se anula en la media.
(c) Puede ocurrir que:
b
cos θ2 = (8.309)
a
Esto implica que φ̇ es positivo para todo θ mayor que θ2 y se anula para θ =
θ2 . Entonces, como θ = θ2 es un punto de retorno, allı́ θ̇ es igual a cero. En θ =
θ2 el eje z se encontrará simultáneamente sin precesión y sin nutación, o sea que se
encuentra instantáneamente en reposo. El movimiento se representa en la figura 8.11c.
Esta situación corresponde al método más simple de dejar girando un trompo. Primero
se hace girar alrededor del eje z y luego se suelta haciendo un ángulo θ2 con la vertical.
Las condiciones para t = 0 son entonces θ = θ2 y θ̇ = φ̇ = 0. Las ecuaciones (8.272) y
(8.309) nos dicen entonces que la constante E ′ vale:
E ′ = mgl cos θ2 (8.310)
Como en (8.272) los términos que contienen a I1 son positivos, para tiempos ma-
yores que cero la energı́a potencial debe disminuir o sea θ debe aumentar hasta alcanzar
el valor θ1 y según (8.306) entonces φ̇ aumenta a partir de cero hasta alcanzar el valor
máximo positivo dado por:
cos θ2 − cos θ1
φ̇1 = a (8.311)
sen2 θ1
O sea que el trompo al dejarse caer desde θ = θ2 con θ̇ = φ̇ = 0 en t = 0, en un
tiempo mayor adquiere precesión y nutación. Ocurre cuando el trompo es rápido y hay
rozamiento en el punto O que la nutación se amortigua rápidamente, dando la impresión
de que las condiciones iniciales señaladas no dan lugar a precesión con nutación sino a
una precesión regular.
Los comportamientos descritos en (a), (b) y (c) están contenidos en la expresión
analı́tica (8.295). El producto que contiene las funciones σ es puramente periódico, de
modo que el exponencial del lado derecho da el movimiento medio de φ, esto es el mo-
vimiento precesional neto. La ecuación (8.295) nos dice que ψ tiene un comportamiento
análogo al de φ o sea una rotación neta acompañada de fluctuaciones periódicas.
La precesión seudoregular. Es el comportamiento usual de un trompo rápido,

que de acuerdo con (8.304) se presenta cuando el efecto de la gravedad es pequeño y
puede asimilarse a una pequeña perturbación. En la aproximación cero se presentará la
precesión regular propia de un cuerpo rı́gido simétrico libre, ecuación (8.179). El efecto
de la gravedad es perturbar ligeramente ese movimiento dando lugar a una pequeña
nutación.
Los valores de las constantes de movimiento para la precesión con nutación en el
caso (c), correspondientes a las condiciones iniciales θ(0) = θ2 , θ̇(0) = φ̇(0) = 0, según
las ecuaciones (8.268) son:
I3 ψ̇(0) cos θ2 = I1 b
I3 ψ̇(0) = I1 a (8.312)
E′ = mgl cos θ2
que pueden expresarse en términos de la energı́a de rotación, inicialmente dada por:
1 1
R= I3 ωz2 = I3 ψ̇ 2 (0) (8.313)
2 2
Entonces:
√
2RI3 I3
a= = ωz ; b = a cos θ2
I1 I1
(8.314)
′ I1 β
E = mgl cos θ2 = cos θ2
2
Entonces podemos escribir a f (u) en la forma:
f (u) = β(1 − u2 )(u2 − u) − a2 (u2 − u)2 (8.315)
Las raı́ces de f (u) son:
" s #
a2 4β β
u3,1 = 1± 1+ 2 − u2 (8.316)
2β a a2
a2 /β está dado por:

a2 I3 R
= (8.317)
β I1 mgl
O sea que cuando el trompo es rápido podemos escribir a (8.316) en la forma
aproximada:

a2 2β 2β 2 2
u3,1 = 1 ± 1 − 2 u2 + 4 (1 − u2 ) (8.318)
2β a a
lo cual nos da inmediatamente:
a2 β
u3 ≈ ; u1 ≈ u2 − (1 − u22 ) (8.319)
β a2
La magnitud de la nutación está dada por:
β
cos θ2 − cos θ1 ≈ sen2 θ2 (8.320)
a2
O sea que cuando θ2 = 0, el eje z permanece vertical (trompo “dormido”). Además,
la magnitud de la nutación varı́a como R−1 ; cuanto más rápido gire el trompo menor
será la nutación.
Calculemos ahora la frecuencia de la nutación para un trompo rápido. Llamemos
cos θ al promedio de cos θ, o sea a:
cos θ1 + cos θ2 β
cos θ = = cos θ2 − 2 sen2 θ2 (8.321)
2 2a
Podemos especificar la magnitud del desplazamiento del eje z en un tiempo t por:
x = cos θ − cos θ = u − u (8.322)
Usando las raı́ces de la función f (u) podemos escribir la ecuación diferencial para
u en la forma aproximada:

β a2
u̇2 = β(u − u2 ) u − u2 + 2 (1 − u22 ) u − (8.323)
a β
Como para un trompo rápido se cumple que a2 /β ≫ u, podemos aproximar aún

más a (8.323). Luego expresamos a u en términos de x para obtener:

2 β2 2 2
ẋ = − 4 sen θ2 − x (8.324)
4a
Derivando (8.324) respecto a t llegamos a:
ẍ + a2 x = 0 (8.325)
La solución que satisface la condición θ(0) = θ2 es, en consecuencia:
β sen2 θ2 β at
x= cos at ; cos θ = cos θ2 − sen2 θ2 sen2 (8.326)
2a2 a2 2
La frecuencia angular de la nutación es:
1 I3
a= ωz (8.327)
2 2I1
O sea que la frecuencia de las nutaciones es mayor a medida que ωz es mayor.
(8.306) nos da la frecuencia angular de precesión. Como según (8.326) x es del orden de
β/(2a2 ), podemos escribir aproximadamente a φ̇ como:
u2 − u u2 − u β at
φ̇ = 2
a≈ 2 a = sen2 (8.328)
1−u 1 − u2 a 2
β/(2a2 ) = mgl/(I3 ωz ), según (8.305), coincide con la velocidad angular de prece-

sión lenta del trompo rápido, lo cual nos permite escribir a φ̇ como:
(−) at
φ̇ = 2φ̇0 sen2 (8.329)
2
La frecuencia angular de precesión media durante un ciclo de la nutación es:
(−)
φ̇ = φ̇0 (8.330)
Vemos que mientras mayor sea ωz , menor será la velocidad angular de precesión.
Para un trompo rápido el movimiento es una nutación pequeña y una precesión pe-
queña que coincide con la velocidad angular de precesión lenta de un trompo rápido.
Esta precesión se llama precesión seudoregular, pues aunque las condiciones iniciales no
son las de la precesión regular, en la práctica se comporta como ésta porque la fricción
amortigua rápidamente la nutación y aparentemente el eje z del trompo empieza ins-
tantáneamente a precesar, con movimiento normal a la gravedad. Ésta es la paradoja de
Klein-Sommerfeld quienes explicaron que esta precesión no implica aceleraciones infini-
tas sino que se trata de una precesión con una imperceptible nutación.
El trompo “dormido”. Es el caso cuando el eje z permanece vertical, sin prece-

sión ni nutación, o sea cuando:
θ(t) = 0 ; θ̇(t) = 0 (8.331)

f (u)
u1 = u2 = 1 u3
–1 0 +1 u
Figura 8.12 Comportamiento de f (u) para u1 = u2 = 1
f (u)
0 +1
–1 u1 u2 = u 3 = 1 u
Figura 8.13 Comportamiento de f (u) para u2 = u3 = 1
Esta situación es un caso lı́mite de la precesión estable cuando el mı́nimo de Vef (u)
está en u0 = 1. Como cuando E ′ = E0′ , los dos puntos de retorno coinciden, la función
f (u) tiene el comportamiento mostrado en las figuras 8.12 y 8.13.
Para este caso los valores de las constantes de movimiento son:
I1 a = I3 (ψ̇ + φ̇) ; b = a; E ′ = mgl (8.332)
Se sigue de (8.275) y (8.332) que:
α=β (8.333)
La ecuación (8.274) tiene entonces la forma:

u̇2 = (1 − u)2 α(1 + u) − a2 (8.334)
Las raı́ces de f (u) son en consecuencia:
a2
1, 1, −1 (8.335)
α
Veamos qué condiciones se requieren en cada uno de los casos mostrados en las
figuras 8.12 y 8.13. Para ello examinemos la curvatura de f (u) en la raı́z doble:
2
′′ a
f (1) = 2α 1 − −1 (8.336)
α
Claramente en el caso de la figura 8.12, donde (a2 /α) − 1 es mayor que 1, la
curvatura es negativa y en la figura 8.13 la curvatura es positiva. Los resultados de la
precesión estable en general se aplican en este caso en que u0 = 1. La condición (8.303)
en este caso es:
a2
≥1 (8.337)
2α
que señala la velocidad angular crı́tica ωc debajo de la cual cesa la precesión regular, o
sea:
4mglI1
ωc2 = (8.338)
I32
Vemos pues que el caso de la figura 8.12 es en rigor el de precesión regular en tanto
que el caso de la figura 8.13 es inestable y mediante una pequeña perturbación degenera
en el de precesión con nutación; para este caso ωz < ωc y para el caso de la figura 8.12,
ωz > ωc . Cuando ωz sea igual a ωc entonces a2 /α = 2 y según (8.335) las tres raı́ces de
f (u) coinciden y el movimiento aún es estable.
Ejemplo 8.5.1 A partir de la solución analı́tica hallar los valores de la frecuencia angular
de nutación y de la velocidad angular de precesión media para la precesión con nutación
de un trompo pesado bajo las condiciones iniciales (8.312), caso (c).
De acuerdo con las fórmulas (8.283) y (8.284), el perı́odo de la nutación coincide
con el perı́odo de la función elı́ptica ns2 que es 2K. O sea que:
√
T e3 − e1 = 2K (8.339)
El parámetro de la función, según (8.285) y (8.280) es:
√
u2 − u1 λu2 − 1 + 1 + λ2 − 2λu2 2β
m= = √ ; λ= 2 (8.340)
u3 − u1 2 1 + λ2 − 2λu2 a
donde hemos usado (8.316). Para precisar, asumamos que:
1
u2 = ; λ=1 (8.341)
2
√
Entonces los valores de m y de e3 − e1 son:
√ a
m = 0, 25 ; e3 − e1 = (8.342)
2
De la tabla 17.1 del manual de Abramowitz y Stegun obtenemos:
K(0, 25) = 1, 685 (8.343)
con lo cual el valor exacto del perı́odo T es:
4K 6, 74
T = = (8.344)
a a
y el valor exacto de la frecuencia de nutación es:
Ωnut = 0, 932 a (8.345)
Promediando sobre un perı́odo de las funciones P obtenemos que el término de φ̇
que en (8.292) da lugar a precesión neta es:
σ̇(iδ) σ̇(iγ)
2iφ̇ = 2 −2 (8.346)
σ(iδ) σ(iγ)
Según (8.288) y (8.314) se cumple para este caso que:
β βu2 + a2 5λ − 4 2 1 2
P(iγ) = − = a = a
4 12 48 48
(8.347)
β βu2 + a2 7λ + 4 2 11
P(iδ) = − − =− a = − a2
4 12 48 48
Según la expansión en serie para P(x) el término dominante es x−2 de modo que:
1 1
P(iγ) ≈ − ; P(iδ) ≈ − (8.348)
γ2 δ2
Entonces hallamos que:
√ r
48 48 1
iγ ≈ ; iγ ≈ −i (8.349)
a 11 a
Por otra parte, el término dominante en la expansión en serie para ς(x) es x−1 lo
cual nos dice que:
r
1 11 1 1
ς(iδ) ≈ ≈i a ; ς(iγ) ≈ ≈√ a (8.350)
iδ 48 iγ 48
Entonces resulta que φ̇ vale:
φ̇ ≈ 0, 48a + 0, 14ai (8.351)

El resultado nos indica que para las condiciones iniciales (8.341) no hay precesión
neta estable; que el movimiento en φ dura menos de un perı́odo de P, en tanto que
(8.346) supone que existe movimiento en φ durante más de un perı́odo. En efecto, para
λ mayor que 0,8 domina el efecto de la gravedad y el trompo cae. La fórmula (8.340)
resulta aplicable para λ < 0,8. El movimiento descrito por la figura 8.11c existe si:
I1 2mgl
< 0, 8 (8.352)
I3 R
Si tomamos λ = 0, 1 y u2 = 0, 5, mediante idénticos procedimientos llegamos a los
siguientes resultados:
e1 = −0, 079659a2 ; e2 = −0, 079166a2 ; e3 = 0, 1188257a2 (8.353)
En consecuencia:
m = 0, 6659781 ; K(m) = 2, 025 (8.354)
Entonces un valor para la frecuencia de nutación más exacto que el resultado

(8.327) es:
Ωnut = 0, 691a (8.355)
Sin embargo en el cálculo de la velocidad angular de precesión entran en juego las

aproximaciones hechas para evaluar las ς. Para iδ y iγ obtenemos:
i i
iγ ≈ −3, 7032803 ; iδ ≈ −3, 1957416 (8.356)
a a
lo cual nos conduce a:
φ̇ = 0, 04 a (8.357)
que esta vez no tiene la contribución imaginaria. Según (8.330) que es aplicable en este
caso pues λ ≪ 1, φ̇ debe valer:
β
φ̇ ≈ = 0, 0025 a (8.358)
2a
8.6. Movimiento en un sistema de referencia no iner-

cial
Ya a lo largo del texto hemos considerado varios casos de sistemas de referencia no
inerciales. En el ejemplo 4.1.5, sección 4.1, encontramos las ecuaciones de movimiento
para una partı́cula en un sistema de referencia que rota uniformemente con velocidad
angular ~ ω . Encontramos que la rotación añade a la energı́a un término que depende
sólo de las coordenadas de la partı́cula y es proporcional al cuadrado de la velocidad
angular. Este término adicional, −m(~ω × ~r)2 /2 se llama energı́a potencial centrı́fuga.
En la ecuación de movimiento aparecen dos términos adicionales de tipo inercial. La
fuerza 2m~r˙ × ~
ω se llama fuerza de Coriolis; es una fuerza no disipativa que depende de la
velocidad de la partı́cula, pero no da contribución a la energı́a. La fuerza m~ω × (~ω × ~r)
se llama fuerza centrı́fuga; está en el plano formado por ~r y ~ω , siendo perpendicular al
eje de rotación y alejándose de él; el módulo de esta fuerza es mρω 2 siendo ρ la distancia
de la partı́cula al eje de rotación.
Al final de la sección 7.9 encontramos expresiones más exactas para las ecuaciones
de movimiento, en función de la matriz de rotación. Encontramos en la ecuación (7.282)
un término adicional, la fuerza m~r × ~ω˙ debida a la no uniformidad de la rotación. Con-
sideremos ahora el sistema de referencia no inercial más general. Consiste en un sistema
de referencia que rota no uniformemente y cuyo origen se translada con aceleración no
uniforme. Se supone que la aceleración A(t) ~ del origen de coordenadas y la velocidad an-
gular de rotación ω~ (t) son funciones del tiempo conocidas a priori. Entonces la ecuación
de movimiento más general para una partı́cula que se mueve en un sistema de referencia
no inercial es:
∂V
m~¨r = − − mA ~ + m~r × ~ω˙ + 2m~r˙ × ~ω + m~ω × (~r × ~ω) (8.359)
∂~r
Ya hemos considerado el movimiento de un cuerpo rı́gido en un sistema de refe-
rencia que rota uniformemente. En el ejemplo 8.3.1 hallamos la forma que toman las
ecuaciones de Euler en tal sistema de referencia, ecuaciones (8.128) y (8.129).
Ejemplo 8.6.1 Resolver el problema del péndulo de Foucault considerándolo como un
cuerpo rı́gido y usando las ecuaciones de Euler en un sistema de referencia rotante.
En este problema intervienen tres sistemas de ejes. Los ejes inerciales, los ejes
rotantes fijos a la Tierra y los ejes fijos al cuerpo rı́gido. Llamaremos x′ , y ′ , z ′ , a los ejes
fijos a la Tierra y x, y, z, a los ejes fijos al cuerpo rı́gido. El vector de velocidad angular
de la Tierra, que asumiremos constante respecto a los ejes inerciales, vale:
~ 0 = ω0~k
ω (8.360)
donde ~k está en la dirección de la lı́nea sur-norte que asumiremos fija en el espacio (ver
la figura 8.14).
El péndulo está suspendido de un punto O fijo respecto a la Tierra. En ese punto
tomaremos el origen común de los ejes fijos a la Tierra y al cuerpo rı́gido. Este es un
cuerpo rı́gido trivial que consiste en una partı́cula mantenida a distancia fija de O por
medio de un hilo sin masa y longitud l. El eje z lo tomamos a lo largo del hilo, de modo
que la posición de la partı́cula respecto a los ejes fijos al cuerpo rı́gido está en (0, 0, l).
Los momentos principales de inercia de este cuerpo rı́gido son:
I1 = ml2 ; I2 = ml2 ; I3 = 0 (8.361)
Los ejes x y y son perpendiculares a z pero pueden tomarse arbitrariamente, pues
este cuerpo rı́gido no permite especificarlos. Podemos, sin perder generalidad, tomar el
eje y perpendicular al plano de oscilación del péndulo y el eje x en el plano de oscilación
del péndulo y cuando aparezca la velocidad de rotación alrededor del eje z, ψ̇, asumir
que es cero, lo mismo que ψ.
Las componentes del vector de velocidad angular de la Tierra respecto a los ejes
primados son:
ω0 ′ =
~ ω0 [(~k · ~i ′ )~i ′ + (~k · ~j ′ )~j ′ + (~k · ~k ′ )~k ′ ]
(8.362)
= ω0 (cos λ, 0, −senλ)
N
0 i
φ i′ j′
j′ i′
j k′ k
0
k
k′
θ ω0
l
φ
λ
m
S
a b
Figura 8.14 Péndulo de Foucault considerado como un cuerpo rı́gido: a. Sistema de ejes y
b. Componentes del vector de velocidad angular de la tierra respecto a los ejes primados.
La energı́a potencial vale V = −mgz ′ = −mgl cos θ. Entonces los torques alrededor
de los ejes z ′ y z, y de la lı́nea de nodos, son respectivamente:
Kφ = 0 ; Kψ = 0 ; Kθ = −mgl senθ (8.363)
Las ecuaciones de Euler en un sistema de referencia rotante fueron halladas en los

ejemplos 8.3.1 y 8.3.3, en la sección 8.3. Las ecuaciones requeridas para este problema
deben incluir los torques, o sea que a las ecuaciones (8.155) debemos adicionar en el lado
derecho:
3
X
Kr βrt ; t = 1, 2, 3 (8.364)
r=1
donde las Kr están dadas por (8.363) y βrt es la matriz (8.134). Los torques (8.364),
que llamaremos K1 , K2 , K3 , son en consecuencia:
K1 = −mgl senθ cos ψ ; K2 = mgl senθ senψ ; K3 = 0 (8.365)
para escribir las ecuaciones (8.155) se requiere además conocer las componentes del
ω0′ respecto a los ejes fijos al cuerpo rı́gido. Para ello debemos evaluar:
vector ~
~ 0 = Ã~
ω ω0′ (8.366)
donde Ã es la matriz de rotación entre los ejes con primas y los ejes con barras, dada
por la ecuación (7.122) sección 7.6. Las ecuaciones (8.128) y (8.129) con torques, con los
momentos de inercia (8.361) nos dan:

(ω̇z + ω̇0z ) · 0 = 0
g
(ω̇y + ω̇0y ) = −(ωx + ω0x )(ωz + ω0z ) + senθ senψ (8.367)
l
g
(ω̇x + ω̇0x ) = (ωy + ω0y )(ωz + ω0z ) − senθ cos ψ
l
Debido a que I3 = 0 y I1 = I2 , la ecuación (8.367) da un valor indeterminado
para ω̇z + ω̇0z y en consecuencia para ωz + ω0z , la indeterminación proviene del hecho
ya señalado al definir las coordenadas x, y, z. En efecto, como la masa m es puntual,
carece de sentido hablar de rotación alrededor de z, por ello el lagrangiano (8.123) no
contiene ni a ψ ni a ψ̇. Entonces, como se señaló, podemos tomar ceros los valores de ψ
y ψ̇.
De la ecuación (7.122), junto con las ecuaciones (8.366) y (8.131) podemos escribir
~ , cuando ψ = 0 y ψ̇ = 0:
para el vector ~ω 0 y ω
 
θ̇ + ω0 cos φ cos λ
 
 
~ + ~ω0 =  senθ φ̇ − ω0 cos θ senφ cos λ − ω0 senθ senλ 
ω (8.368)
 
 
cos θ φ̇ + ω0 senθ senφ cos λ − ω0 cos θ senλ
Las derivadas de este vector respecto al tiempo son:
 
θ̈−ω0 senφ cos λ φ̇
 
~ 0 =φ̈ senθ+ θ̇ φ̇ cos θ+ω0 θ̇(senφ senθ
~ω + ω cos λ−cos θ senλ)−ω0 φ̇ cos θ cos φ cos λ (8.369)
 
φ̈ cos θ− θ̇ φ̇ senθ+ω0 θ̇(senφ cos θ cos λ+senθ senλ)+ω0 φ̇ senθ cos φ cos λ
Ciertamente las ecuaciones (8.367) son consistentes cuando ωz + ω0z valga cero.
En efecto, las dos últimas igualdades de (8.367) se convierten en:
g
θ̈ − ω0 φ̇ senφ cos λ + senθ = 0
l
(8.370)
senθ φ̇ − ω0 cos θ senφ cos λ − ω0 senθ senλ = constante
Si tomamos cero el valor de la constante en (8.370), esta ecuación será consistente

con la ecuación ωz + ω0z = 0,
cos θ φ̇ + ω0 senθ senφ cos λ − ω0 cos θ senλ = 0 (8.371)
solamente si se cumple que:
φ̇ = ω0 senλ ; φ=0 (8.372)
Esto quiere decir que tomar simultáneamente ceros los valores de ωy + ω0y y ωz + ω0z da
lugar a la solución cuando los ejes x′ −y ′ y x−y coinciden instantáneamente. La ecuación
(8.372) muestra una rotación uniforme del plano de oscilación del péndulo alrededor del
eje z, en sentido positivo. En efecto, si el péndulo oscilara en el polo norte, donde
senλ = 1, un observador en la Tierra verı́a rotar el plano del péndulo uniformemente
en sentido contrario al de la rotación de la Tierra y con una velocidad angular igual a
ω0 ; esto se ve claramente al notar que el plano de oscilación del péndulo en un sistema
de referencia inercial no cambia, o sea que los ejes x − y no cambian en un sistema de
referencia inercial y respecto a ellos los ejes x′ − y ′ rotan uniformemente.
Para un péndulo de 100 m, g/l vale aproximadamente 10−1 s−2 en tanto que ω0 ≈
−8 −1
10 s , de modo que las ecuaciones (8.367) pueden resolverse fácilmente, sin hacer las
suposiciones: ωz + ω0z = ωy + ω0y = 0, despreciando los términos que contengan a ω02
y ω0 φ̇. El resultado es que el plano de oscilación del péndulo rota uniformemente con
una velocidad angular ω0 senλ, aun en donde los ejes x′ − y ′ y x − y no coinciden, y en
que la rotación de la Tierra no tiene efecto sobre la coordenada θ sino con un término
centrı́fugo, que es del orden de ω02 .
Ejemplo 8.6.2 Un giróscopo es un cuerpo rı́gido simétrico montado sobre anillos de

suspensión de cardán de modo que el cuerpo rı́gido se puede mover libremente con el
centro de gravedad fijo, por lo cual no hay torque gravitacional. La brújula giroscópica
es un giróscopo al cual se le impone la ligadura que consiste en impedir que el eje de
simetrı́a se mueva fuera del plano horizontal. Demuéstrese usando las ecuaciones de
Euler que cuando la velocidad angular del giróscopo es grande comparada con la de
la Tierra, este giróscopo oscilará alrededor de un meridiano, pudiendo utilizarse como
brújula (brújula giroscópica de Foucault).
Los ejes principales del giróscopo x, y, z, los definimos de modo que el eje de simetrı́a
es el eje z, que permanecerá en el plano horizontal. La figura 8.15a muestra los ejes fijos
a la Tierra x′ , y ′ , z ′ , y la figura 8.15b los ejes x, y, z.
N Línea de nodos x′ x
(φ = 0)
Vertical
z
j′ ψ z′
k′ Norte
0 i′ θ
k′ y′
0 Este
ω0
λ Línea
del meridiano
S y
a b
Figura 8.15 Ejes principales del giróscopo: a. Ejes x′ , y ′ y z ′ fijos a la Tierra,

b. Ejes principales x, y y z del giróscopo.
La condición de ligadura impuesta a la suspensión de Cardán es:
φ=0 (8.373)
Ésta implica que φ̇ = 0, o sea que la ligadura impuesta a las velocidades angulares
ωx , ωy , ωz , de acuerdo con las ecuaciones (8.132) es:
senψ ωx + cos ψ ωy = 0 (8.374)
Usando la notación de la sección 2.8, escribimos la ligadura en la forma a1 ωx +

a2 ωy + a3 ωx donde a1 = tan ψ, a2 = 1, a3 = 0. Entonces los componentes de la fuerza
de ligadura son:
Rx = λ tan ψ ; Ry = λ ; Rz = 0 (8.375)
donde λ es un multiplicador indeterminado de Lagrange.

Las ecuaciones de movimiento son las ecuaciones de movimiento de Euler en un
sistema de referencia rotante, ecuaciones (8.128) y (8.129), donde de acuerdo con los
resultados de la sección 2.8, debemos incluir los términos de torque debidos a la ligadura,
(8.375). Por lo anterior, tales ecuaciones son:
(ω̇z + ω̇0z )I3 = 0
(ω̇y + ω̇0y )I1 = (ωx + ω0x )(ωz + ω0z )(I3 − I1 ) + λ (8.376)
(ω̇x + ω̇0x )I1 = (ωy + ω0y )(ωz + ω0z )(I1 − I3 ) + λ tan ψ

Las componentes de la velocidad angular de la Tierra en los ejes primados son:
~ 0′ = ω0 (senλ, 0, cos λ)
ω (8.377)
~ 0 debemos usar la matriz de rotación Ã, ecuación (7.122) de la
Para hallar a ω
sección 7.6, tomando φ = 0:
 
senλ cos ψ + cos λ senψ senθ
 
 
~ 
ω 0 = ω0  −senλ senψ + cos λ cos ψ senθ  (8.378)
 
cos λ cos θ
~ según (8.131) es:

En tanto que ω,
~ = (cos ψ θ̇, −senψ θ̇, ψ̇)
ω (8.379)
~ω˙ + ~ω˙ 0 está dada por:

 
θ̈cψ− θ̇sψ(e−ω0 cλ cθ)+ω0 (−sλ sψ+cλ cψ sθ)(e − ω0 cλ cθ)+ω0 θ̇ cλ sψ cθ
 
ω+ ~˙ 0 =−θ̈sψ− θ̇cψ(e−ω0 cλ cθ)+ω0 (−sλ cψ−cλ sψ sθ)(e − ω0 cλ cθ)+ω0 θ̇ cλ cψ cθ
~˙ ω (8.380)
 
−θ̇ω0 cλ sθ
donde usamos s y c en vez de sen y cos, y e es el valor de la constante que se obtiene

de (8.376) o sea un espı́n axial neto que incluye una componente de la rotación de la
Tierra:
e = ωz + ω0z (8.381)
Reemplazando las ecuaciones (8.378) a (8.381) en las ecuaciones (8.376) obtenemos:
θ̈ cψ + θ̇ sψ(−e + 2ω0 cλ cθ + A)
+ω0 sψ(−e sλ + ω0 sλ cλ cθ + sλ A) (8.382)
+ω0 cψ(e cλ sθ − ω0 c2 λ sθ cθ − A cλ sθ) = Λ tan ψ
−θ̈ sψ + θ̇ cψ(−e + 2ω0 cλ cθ + A)
+ω0 cψ(−e sλ + ω0 sλ cλ cθ + sλ A) (8.383)
+ω0 sψ(−e cλ sθ + ω0 c2 λ sθ cθ + A cλ sθ) = Λ
donde Λ es igual a λ/I1 y A está defnida por:

I1 − I3
A= e (8.384)
I1
Multiplicando (8.382) por cos ψ y (8.383) por senψ y restando las ecuaciones re-
sultantes, obtenemos:
I3
θ̈ + ω0 e cos λ senθ − ω02 cos2 λ senθ cos θ = 0 (8.385)
I1
Para un lugar que no esté en los polos, cos λ 6= 0, y para una alta velocidad de
rotación del giróscopo, e ≫ ω0 , la ecuación (8.385) se puede aproximar a:
I3 eω0 cos λ
θ̈ + senθ = 0 (8.386)
I1
Ésta es una ecuación similar a la de un péndulo simple. Indica que el eje del girósco-
po oscila alrededor de la lı́nea del meridiano, siendo el perı́odo de pequeñas oscilaciones:
r
I1
T = 2π (8.387)
I3 eω0 cos λ
es decir, el mecanismo indica el norte, por lo tanto sirve de brújula que indica el norte
verdadero, a diferencia de una brújula magnética que indica el norte magnético. Para
una discusión más detallada que incluye el caso en que el giróscopo está montado sobre
un barco, véase el texto de Atkin, Dinámica clásica, John Willey, 1959, o referencias
especializadas sobre el giróscopo. La ecuación de ligadura (8.374) permite obtener a ψ(t)
al reemplazar el resultado de integrar a (8.386), y la ecuación (8.376) permite entonces
hallar a λ, y en consecuencia la fuerza de ligadura. Como la solución de (8.386) es una
función elı́ptica, sn, las ecuaciones (8.374), (8.376) y (8.386) permiten expresar a θ, ψ y
λ en términos de funciones elı́pticas.
Ejercicio 8.6.1 Integrar las ecuaciones (8.374), (8.376) y (8.386) para hallar explı́cita-
mente a θ, ψ y λ en función del tiempo. Analizar los resultados.
9
Las transformaciones canónicas
9.1. La acción en función de las variables de estado

Según el principio de Hamilton, entre todas las trayectorias en el espacio de confi-
guración que parten de un punto (q1 ) en t = t1 y terminan en un punto (q2 ) en t = t2 ,
el sistema sigue efectivamente a través de la trayectoria que extremaliza la integral de
acción o, equivalentemente, por aquella que satisface las ecuaciones de Lagrange. Para
expresar la acción en función de las coordenadas, debemos considerar todas las posibles
trayectorias reales y circuitosas en el espacio de configuración y no solamente aquellas
que pasan por dos puntos dados.
Entre un par de puntos dados, (q1 ) en t = t1 y (q2 ) en t = t2 , sólo pasa una
trayectoria recta (o real). O sea que a una familia de parejas de puntos [(q1 ) en t = t1 ,
(q2 ) en t = t2 ], definida de acuerdo con cierta regla, le corresponde una familia de
trayectorias en “lı́nea recta” (o reales). Ası́ por ejemplo, para un sistema de dos grados
de libertad las trayectorias estarán situadas en un plano. Para precisar, asumamos que
se trata de partı́culas en presencia del campo gravitacional, el cual actúa a lo largo de
la dirección y. La figura 9.1 muestra la familia de puntos extremos (x1 , y1 en t1 ; x2 , y2
en t2 ), definida de la siguiente manera:
r
2a π
x1 = a cos θ ; y1 = a senθ ; t1 = senθ ; 0 ≤ θ ≤
g 2
2
1 b − a cos θ
x2 = b ; y2 = a senθ + g (9.1)
2 vx
r
b − a cos θ 2a
t2 = + senθ
vx g
Este ejemplo muestra que para a, b, dados se puede definir una familia de trayec-
torias por hacer variar a θ entre 0 y π/2, con lo cual se varı́an además los tiempos t1
y t2 . Los correspondientes puntos inicial y final están sobre un arco de circunferencia y
sobre un segmento de lı́nea recta respectivamente. Obviamente para un par de puntos
319
0 b
x
θ′ θ
P1 (x1, y1, t1)
a
P1′ (x1′, y1′, t1′)

P2 (x2, y2, t2)
y P2′ (x2′, y2′, t2′)
Figura 9.1 Familia de trayectorias dependiente de θ entre 0 y π/2
inicial y final dados, P1 , P2 , o sea para un valor dado de θ, se puede encontrar una
familia de trayectorias circuitosas que pasan por esos dos puntos en t = t1 y t = t2 .
Haciendo variar la tripleta de parámetros (a, b, θ) sobre todo el rango de sus valores
posibles podrı́amos obtener todas las posibles trayectorias “rectas” en el plano x − y;
para definir las trayectorias circuitosas requerirı́amos de parámetros adicionales.
En general, sea (α) un conjunto completo de parámetros que define una familia
de trayectorias rectas en el espacio de configuración. A esa familia de trayectorias le
corresponde una familia de puntos iniciales y finales P1 , P2 y de tiempos t1 y t2 , dada
por:
t1 = t1 (α) ; qν1 = qν1 (α)
t2 = t2 (α) ; qν2 = qν2 (α) (9.2)
ν = 1, 2, ...l
Debemos definir desplazamientos virtuales entre una trayectoria real y las corres-
pondientes trayectorias circuitosas y entre trayectorias reales. Esto se logra consideran-
do: (a) Cambios virtuales en las qν , como antes y (b) Cambios virtuales en el tiempo,
con lo cual los tiempos de los puntos inicial y final son distintos para cada trayectoria.
Queremos evaluar el cambio en la integral de acción:
Z t2
S= L dt (9.3)
t1
cuando se pasa de una trayectoria real a otra de la familia. La diferencia de las coorde-
nadas de las dos trayectorias la denotaremos ∆qν = qν (α + ∆α) − qν (α).
Tal cambio consta de dos partes, uno virtual producido con t fijo y otro debido al
cambio virtual en el tiempo:
∆qν = δqν + q̇ν δt ; ν = 1, 2, ...l
(9.4)
∆t = t(α + ∆α) − t(α)
Las transformaciones canónicas / 321
La figura 9.2 muestra dos trayectorias reales en el espacio de configuración que

difieren por cantidades pequeñas. C1 y C2 son dos curvas que describen la familia de
puntos extremos, o sea definidas por las ecuaciones (9.2).
C2
P2
t2
(α)
t t2 + ∆t2
C1 (∆q) (∆q) t2 P2′
P1
t1 + ∆t1 q∆t t + ∆t
t1 t (α + ∆α)
t1 + ∆t1 (q + δq) (q + ∆q)
P1′
Figura 9.2 Trayectorias reales en el espacio de configuración
A cada una de las dos trayectorias reales le corresponde un valor de la integral de

acción (9.3). La diferencia de los valores de S es:
∆S = S′ − S
Z t2 +∆t2 Z t2 (9.5)
= dt L(q + δq, q̇ + δ q̇, t) − dt L(q, q̇, t)
t1 +∆t1 t1
Para ∆t1 y ∆t2 lo suficientemente pequeños se cumple:

Z t2 +∆t2 Z t2
Ldt ≈ L dt + L(t2 ) ∆t2 − L(t1 ) ∆t1 (9.6)
t1 +∆t1 t1
t
t1 t1 + ∆t1 t2 t2 + ∆t2
Figura 9.3 Cambio en el tiempo ∆t al variar (α)

Z t2 t2

∆S = L(q + δq, q̇ + δ q̇, t)dt + L(q + δq, q̇ + δ q̇, t)∆t
t1 t1
Z t2
− L(q, q̇, t)dt (9.7)
t1
Por otra parte sabemos que:

L(q + δq, q̇ + δ q̇, t) − L(q, q̇, t) =
l
X (9.8)
∂L d
δqν + (pν δqν ) − ṗν δqν
ν=1
∂qν dt
al primer orden en (δq). Entonces:

t2 t2
Z t2 l
X l
X
∂L
∆S = − ṗν δqν + pν ∆qν + L ∆t (9.9)
t1 ∂qν
ν=1 ν=1 t1 t1
donde despreciamos todos los términos de orden superior al primero en (δq) y (q̇ ∆t).
Como los (p) corresponden a la trayectoria real P1 P2 , de acuerdo con las ecuaciones de
Lagrange la integral en (9.9) es cero, luego:
!t2
l
X

∆S = pν δqν + L ∆t (9.10)

ν=1 t1
Debido a que δqν = δqν − q̇ν ∆t, obtenemos:

!t2
Xl

∆S = pν ∆qν − H ∆t (9.11)

ν=1 t1
Esta expresión nos dice que:

∂S ∂S ∂S ∂S
pν = , H=− en t = t2 ; pν = − , H= en t = t1 (9.12)
∂qν ∂t ∂qν ∂t
Es claro que ∆S es la diferencia de dos términos infinitesimales, evaluados en t1 y
t2 . Ahora, si llamamos t a t2 y escogemos a C1 de modo que se reduzca a un punto, es
decir, tomamos fijo el punto p1 :
δqν (t1 ) = 0, ∆t1 = 0; ν = 1, 2, ...l (9.13)
Obtenemos:
l
X
∆S = pν ∆qν − H ∆t (9.14)
ν=1
Esta expresión nos da la diferencial total de cierta función S de las coordenadas

y del tiempo sobre la curva C2 . De P1 sale un haz de trayectorias reales que cortan la
curva C2 . La ecuación (9.14) nos da la diferencia en la acción para dos trayectorias reales
diferentes cuando cortan la curva C2 . Es claro entonces que:
∂S ∂S
pν = ; ν = 1, 2, ...l; H = − (9.15)
∂qν ∂t
Siendo S = S(q, t) la acción en función de las coordenadas y del tiempo:

Z t2
S(q, t) = L dt (9.16)
t1
Si se impone la condición de que las variaciones en el lı́mite superior se anulen,

obviamente lo que se obtiene es ∆S = 0, y de ahı́ las ecuaciones de movimiento.
A la función S[q(t), t] se le denomina la acción en función de las coordenadas: es
el número que se asocia a la trayectoria que comienza en P1 y termina en q(t), t, o sea
sobre la lı́nea C2 . Como q y t dependen de (α), S es una función de (α).
9.2. La integral invariante de Poincaré-Cartán

En lugar del espacio de configuración l-dimensional, consideramos el espacio de
fases 2l-dimensional, en el cual cada punto en el tiempo t se especifica por (q, p). En
este espacio definamos dos curvas cerradas, C1 y C2 , cuyos puntos sean el comienzo y
el final de una familia de trayectorias rectas en el espacio de fases; es decir, tales que si
el sistema inicialmente estaba descrito por un punto de C1 evolucionará de acuerdo con
las ecuaciones canónicas hasta llegar a cierto punto final sobre C2 . Las ecuaciones que
definen las curvas cerradas C1 , C2 , son análogas a (9.2):
t1 = t1 (α); qν1 = qν1 (α) ; p1ν = p1ν (α)

(9.17)
t2 = t2 (α) ; qν2 = qν2 (α) ; p2ν = p2ν (α) ; α = 1, 2, ...l
donde ahora los parámetros (α) son tales que varı́an entre (αi ) y (αf ) de modo que
las funciones de (α) definidas por (9.17) son periódicas, es decir toman el mismo valor
cuando (α) = (αi ) que cuando (α) = (αf ). Por ejemplo, para el oscilador tridimensional
ligado a moverse sobre un cilindro, la familia de trayectorias correspondiente a (9.17) es
mostrada en la figura 9.4. (Véase el ejemplo 4.3.1 en la sección 4.3). Es claro que C1 y
C2 deben estar sobre la hipersuperficie Ez constante.
En general, la familia de trayectorias tiene la apariencia de un “tubo”1 donde C1
y C2 son las curvas que describen la forma de las “puntas”. Por la causalidad, es claro
que las trayectorias no se intersectan. A cada valor de las (α) le corresponde uno y sólo
un punto sobre C1 , un punto sobre C2 y una trayectoria y sólo una. Cada trayectoria
tiene un valor dado de la acción:
Z t2 (α)
S̃ = L̃ [q(α, t), q̇(α, t), p(α, t), ṗ(α, t), t] (9.18)
t1 (α)
donde L̃ es definido en (3.77), según:

l
X
L̃ (q, p, q̇, ṗ, t) = pν q̇ν − H(q, p, t) (9.19)
ν=1
1 Llamado también “tubo de lı́neas caracterı́sticas”.

Pz
C1
θ
z
C2
Figura 9.4 Familia de trayectorias para el oscilador tridimensional ligado a moverse sobre un
cilindro
Por un procedimiento análogo al que conduce a (9.9), hallamos para la diferencia

de la acción entre dos trayectorias vecinas:
( l Z
" !
X ∂H
∆S̃ = dt q̇ν − δpν
ν=1
∂pν
# )t2
∂H d

− ṗν + δqν + (pν ∆qν ) + L ∆t (9.20)
∂qν dt
t1
Teniendo en cuenta que las trayectorias en el espacio de fases son “rectas”, definidas
por las ecuaciones de Hamilton, se sigue:
" #t2
l
X

∆S̃ = pν δqν + L ∆t (9.21)

ν=1 t1
Ahora, usando (9.4) en (9.21) obtenemos que ∆S̃ = ∆S, ecuación (9.11):
" #t2
l
X

∆S̃ = pν ∆qν − H ∆t (9.22)

ν=1 t1
∆S̃ es el cambio en la acción al cambiar infinitesimalmente de una trayectoria

de fases real a otra, o sea al variar infinitesimalmente las (α). Podemos integrar cada
término en (9.22) respecto a (α), desde (α) = (αi ) hasta (α) = (αf ), o sea sobre todas
las trayectorias que comienzan y terminan en las curvas cerradas C1 y C2 :

Z (αf ) "X
l
#t2

S(αf ) − S(αi ) = pν ∆qν − H ∆t
(αi )
ν=1 t1
Z l
!
(αf ) X
= p2ν ∆qν2 2
− H ∆t2
(αi ) ν=1
Z l
!
(αf ) X
− p1ν ∆qν1 1
− H ∆t1 (9.23)
(αi ) ν=1
I l
!
X
= pν ∆qν − H ∆t
C2 ν=1
I l
!
X
− pν ∆qν − H ∆t
C1 ν=1
Como S(αi ) = S(αf ) obtenemos:

I l
! I l
!
X X
pν ∆qν − H ∆t − pν ∆qν − H ∆t =0 (9.24)
C2 ν=1 C1 ν=1
Hemos demostrado que la integral de lı́nea,

I X l
!
I= pν ∆qν − H ∆t (9.25)
ν=1
no cambia su valor tomada sobre un contorno arbitrario del espacio fásico, a través del
cual pasan trayectorias reales que lo deforman al desplazarse sobre la “manguera” de
trayectorias reales. I es una integral invariante, llamada la integral invariante de Poin-
caré-Cartán (véase el texto de Gantmacher, Lectures in analytical mechanics, sección 18).
Teorema de Poincaré-Cartán. I es una integral invariante a lo largo de un haz

de trayectorias arbitrario en el espacio de fase si y sólo si esas trayectorias son solución
a las ecuaciones canónicas de Hamilton. Hemos demostrado que si las trayectorias son
solución a las ecuaciones de Hamilton, I es una integral invariante. Restarı́a por mostrar
que si I es una integral invariante entonces las trayectorias son solución a las ecuaciones
de Hamilton. La demostración está en el texto de Gantmacher indicado anteriormente.
Como en este teorema se muestra que las ecuaciones de Hamilton son consecuencia
de la invariancia de I, ésta puede plantearse como un principio general de la mecánica,
que fue hallado por Poincaré en el año 1890.
Las ecuaciones de Whittaker. En la integral de Poincaré-Cartán (9.25), pode-

mos ver que hay analogı́a entre las pν y −H, y entre las qν y t. Podemos pensar en un
formalismo en el cual se intercambien los papeles de (−H, t) y una pareja de variables

canónicamente conjugadas, digamos (p1 , q1 ),2 en un espacio de fases ampliado 2l + 1-
dimensional, donde t no es simplemente un parámetro.
Sean (S = −H, t) las cantidades que cambiaremos por (p1 , q1 ):
s = −H(q, p, t) (9.26)
La ecuación (9.26) nos permite expresar a p1 en términos de (q), p2 , ...pl , s, t:
p1 = −K(q1 , q2 , ...ql , p2 , p3 , ...pl , s, t) (9.27)
Entonces podemos escribir la integral invariante I como:

I
I = (s∆t + p2 ∆q2 + pl ∆ql − K ∆q1 ) (9.28)
En estas variables, K hace las veces de H y q1 las veces de t. Hemos probado, pues,
que el movimiento del sistema con las nuevas variables obedece las ecuaciones:
dt ∂K ∂s ∂K
= ; =−
dq1 ∂s dq1 ∂t
(9.29)
dqν ∂K dpν ∂K
= ; =− ; ν = 1, 2, ...l
dq1 ∂pν dq1 ∂qν
donde ahora q1 es la variable independiente o “tiempo”.
Sea ahora un sistema generalizado conservativo (o sea un sistema arbitrario para
el cual H no depende del tiempo). En este caso:
H(q, p) = h = constante (9.30)
que sabemos, en general no coincide con E = T + V .

Ahora, en la integral invariante I tomemos sólo aquellos estados para los cuales la
constante h toma un mismo valor, h0 . Todas las trayectorias tendrán la misma energı́a.
Entonces:
I I
H ∆t = h0 ∆t = 0 (9.31)
La integral invariante será:3

I X
l
I= pν ∆qν (9.32)
ν=1
Si ahora en (9.30) despejamos p1 obtenemos:
p1 = −K(q1 , q2 , ...ql ; p2 , p3 , ...pl , h0 ) (9.33)

2 Véase el texto de Whittaker, A treatise on the analytical dynamics of particles and rigid bodies,
capı́tulo XII, numeral 141.

3 La invariancia de I es análoga a un teorema de hidrodinámica que establece que la circulación en
cualquier curva cerrada que se mueve con un fluido no cambia con el tiempo.
con lo cual (9.32) se puede escribir en la forma:

I X l
!
I= pν ∆qν − K∆q1 (9.34)
ν=2
Esta integral toma la forma de la integral invariante de Poincaré-Cartán, tomando

como variables de estado a q2 , p2 , q3 , p3 , ...ql , pl , a q1 como el tiempo, y a K en lugar
de H. En virtud del teorema mencionado, se cumple que el movimiento de este sistema
obedece las ecuaciones de Hamilton siguientes (2l − 2 en total):
dqν ∂K dpν ∂K
= ; =− ; ν = 2, 3, ...l (9.35)
dq1 ∂pν dq1 ∂qν
Las ecuaciones (9.35) son las ecuaciones de Whittaker. O sea que para un sistema
generalizado conservativo (para el cual H es constante) se requieren sólo 2l − 2 ecua-
ciones para definir la trayectoria del sistema. El sistema de ecuaciones hamiltonianas de
Whittaker puede ser expresado en forma lagrangiana:
d ∂M ∂M
− = 0; ν = 2, 3, ...l (9.36)
dq1 ∂qν′ ∂qν
donde qν′ = dqν /dq1 y M (la función análoga de la lagrangiana) es el generador de
la transformación de Legendre de las variables (qν , qν′ ) a las variables (qν , pν ). M y K
tienen una relación análoga a L y H, véase (3.16).
M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) =
l
X
pν qν′ − K(q1 , q2 , q3 , ...ql , p2 , p3 , ...h0 ) (9.37)
ν=2
La integración de las ecuaciones de Whittaker nos conduce a qν , pν , en función de

q1 , es decir, a las ecuaciones de la trayectoria en el espacio de fases. La solución de (9.35)
contendrá 2l − 2 constantes de integración y dependerá además de la constante h0 :
qν = qν (q1 , h0 , C1 , C2 , ...C2l−2 )
(9.38)
pν = pν (q1 , h0 , C1 , C2 , ...C2l−2 ) ; ν = 2, , 3, ...l
Reemplazando (9.38) en (9.33) llegamos a:
p1 = p1 (q1 , h0 , C1 , C2 , ...C2l−2 ) (9.39)
Las expresiones (9.38) y (9.39) constituyen las ecuaciones de las trayectorias en el
espacio de fases. La dependencia temporal de las coordenadas se recobra de la ecuación
q̇1 = ∂H/∂p1 :
Z
dq1
t= + C2l−1 (9.40)
∂H/∂p1
donde ∂H/∂p1 se puede expresar en términos de q1 por medio de las ecuaciones (9.38)
y (9.39).
Para sistemas que poseen la constante de movimiento h, se puede resolver el pro-
blema mecánico con sólo 2l − 2 ecuaciones del tipo hamiltoniano o con l − 1 ecuaciones
del tipo lagrangiano, (9.35) y (9.36) respectivamente.
9.3. El principio de mı́nima acción y expresiones equi-

valentes
El principio de mı́nima acción de Maupertuis-Euler-Lagrange. Como las
ecuaciones (9.36) son de tipo lagrangiano, pueden ser obtenidas de un principio varia-
cional, ∆Σ = 0, donde:
Z q22
Σ= M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) dq1 (9.41)
q11
La variable Σ es llamada la acción de Lagrange, en tanto que S se llama la acción

de Hamilton. ∆Σ = 0 caracteriza las trayectorias que pasan por los puntos definidos
por q1 = q11 y q1 = q12 , o sea las soluciones de (9.36) tales que ∆qν (q11 ) = ∆qν (q12 )
para ν = 2, 3, ...l. ∆ representa “desplazamientos virtuales” respecto a q1 , es decir,
desplazamientos realizados con q1 fijo y que no cambian los extremos de la trayectoria;
en cuanto al tiempo la situación es diferente, pues t1 y t2 pueden variar cuando se pasa
de una trayectoria real a una circuitosa. Esto es esquematizado en la figura 9.5, donde
B representa una trayectoria real y A una circuitosa, ambas con el mismo valor de la
energı́a.4
t2 + ∆t2
(q + ∆q) P2
2
q1
t t + ∆t
A t2
(q) (∆q)
t1 + ∆t1 B
t
t1
P1 1
q1
Figura 9.5 Paso de una trayectoria real B a una circuitosa A
La función M se puede expresar en términos de L. En efecto, se sigue de (9.27) y

(9.37) que:
l
X l
1X 1 1
M= pν qν′ + p1 = pν q̇ν = (L + H) = (2T2 + T1 ) (9.42)
ν=2
q̇ ν=1 q̇ 1 q̇ 1
4 Lastrayectorias A y B que se cortan en P1 y P2 en el espacio de configuración, son las proyecciones

de dos trayectorias en el espacio de fases ampliado, sobre H = h0 , que no se cortan.
En la igualdad (9.42) se ha usado la ecuación (3.127). La integral (9.41) se puede

escribir como:
Z t2
Σ= (L + H)dt = S + h(t2 − t1 ) (9.43)
t1
se ve que ∆Σ = ∆S + h(∆t2 − ∆t1 ), cuando tomamos sólo trayectorias circuitosas con

el mismo valor de la energı́a. La expresión ∆Σ = 0 define la ecuación de la trayectoria
entre todas las que satisfacen la conservación de la energı́a, con ∆qν = 0 en P1 y P2 .
Además, se sigue de (9.41) y (9.43):
Z t2 Xl
Σ= pν q̇ν dt (9.44)
t1 ν=1
Para un sistema conservativo ordinario (tal que T + V es constante), T1 = 0 y

T = T2 , con lo cual (9.42) nos dice que M = 2T /q1 . Entonces:
Z t2 XN Z ri2
Σ= 2T dt = mi ṙi dri (9.45)
t1 i=1 ri1
Esto nos dice: “dada la configuración inicial y final de un sistema descrito por un
hamiltoniano constante, e igual a la energı́a total, con un valor dado de la energı́a, la
trayectoria del sistema en el espacio de configuración es aquella para la cual la integral
de la energı́a cinética es estacionaria, cuando se compara con las trayectorias vecinas que
satisfacen dichas condiciones”. Este principio es aplicable sólo a sistemas conservativos.
Los tiempos requeridos para moverse sobre las diferentes trayectorias pueden cambiar
pero la energı́a es la misma sobre cada curva. En el principio de Hamilton aplicado a sis-
temas conservativos, se consideran sólo aquellas trayectorias para las cuales el tiempo de
movimiento a lo largo de ellas es el mismo, aunque las energı́as asociadas a ellas pueden
diferir. Las trayectorias variadas en el principio de Hamilton no corresponden necesa-
riamente con trayectorias posibles del movimiento del sistema, H puede no conservarse
sobre ellas.
En el principio de mı́nima acción se consideran trayectorias variadas donde el
tiempo puede variar pero H sı́ se conserva. En estos dos principios se halla la trayectoria
verdadera “escogiendo” entre las trayectorias de dos conjuntos de trayectorias definidas
de manera diferente.
Otra forma de obtener que ∆Σ = 0 es la siguiente:
Z t2 X l Z t2
Σ= pν q̇ν dt = (L + H) dt = S + h(t1 − t2 ) (9.46)
t1 ν=1 t1
Tomando variaciones en (9.46) y usando la expresión (9.11) para ∆S:

" l #t2 t2

X
∆Σ = ∆S + h(∆t1 − ∆t2 ) = pν ∆qν − h∆t + h∆t

ν=1 t1 t1
t2
Xl

= pν ∆qν (9.47)

ν=1 t1
Tomando a ∆qν = 0 en t1 y t2 y ν = 1, 2, ...l, se sigue que ∆Σ = 0. A la función S

se le llama acción principal ( o de Hamilton) y a la función Σ se le llama acción reducida
(o de Lagrange).
Resumen Histórico. Fermat, matemático francés (1601-1665), formuló el prin-

cipio del mı́nimo tiempo en la óptica de rayos: un rayo de luz se propaga sobre aquella
trayectoria para la cual el tiempo de tránsito es mı́nimo. En lenguaje variacional (mo-
derno):
Z B Z B
dl
∆ dt = 0 ⇒ ∆ =0 (9.48)
A A v
Maupertuis, especulando con las concepciones filosóficas de Leibnitz, expresó en

1744 la conjetura de que la evolución de una partı́cula material se da de tal manera que
el producto m.v.l es mı́nimo, dio ejemplos en los cuales las trayectorias son rectilı́neas y
por tanto v es constante.
El matemático suizo Euler (1703-1793) enunció en 1744 el principio de mı́nima
acción, esta vez como un teorema, basado en sus trabajos sobreRel cálculo de variaciones.
Tal enunciado es de la forma: la diferencia entre la integral vdl para una partı́cula,
tomada a lo largo de una trayectoria real, y la misma integral sobre una trayectoria
vecina (es decir sobre una trayectoria sobre la cual se mueve la partı́cula sin obedecer
las leyes de Newton), que pasan por dos puntos dados, es una cantidad infinitesimal de
segundo orden; se supone que la partı́cula viaja sobre la trayectoria variada con una
velocidad para la cual la energı́a total tiene un valor dado:
Z B
∆E=C v dl = 0 (9.49)
A
donde C es una constante. En 1760 Lagrange (1736-1813) extendió el principio de Euler

a sistemas de partı́culas:
Z N
BX
∆E=C m~vi · d~ri = 0 (9.50)
A i=1
Lagrange mostró además que (9.50) se cumple si y sólo si vale la segunda ley de
Newton, mi~¨r i = −∂V /∂~ri , i = 1, 2, ...N . Además, Lagrange fue el primero que introdujo
las coordenadas generalizadas, con las cuales (9.50) es:
Z N
BX
∆E=C pν dqν = 0 (9.51)
A i=1
Cuando en (9.51) se asume que T es función cuadrática de las velocidades genera-

lizadas se tiene:
Z B
∆E=C 2T dt = 0 (9.52)
A
Lagrange llamó a (9.52) el principio de la más pequeña o más grande fuerza viva.
Hamilton, escocés que vivió entre 1805 y 1865, aportó en 1835 la formulación gene-
ral del principio de mı́nima acción y las ecuaciones de Hamilton. Extiende la formulación
al considerar trayectorias circuitosas en que la energı́a no se conserva:
Z B Z B
∆ L dt = ∆ (2T − H)dt = 0 (9.53)
A A
El conjunto de trayectorias es tal que pasa simultáneamente por los mismos puntos
inicial y final. Es claro ya por qué a Σ se llama la acción de Lagrange y a S la acción
de Hamilton. Los principios de Hamilton y de mı́nima acción son aplicables equivalente-
mente para sistemas conservativos, sin embargo, el primero es más general pues se aplica
además a sistemas holónomos generales, con una generalización a sistemas holónomos
con fuerzas no derivables de un potencial, ecuación (3.12).
Las ecuaciones de Jacobi. Para el caso de un sistema conservativo ordinario T

l
X
T = T2 = aµν q̇µ q̇ν = q12 G(q1 , q2 , ...ql , q2′ , q3′ , ...ql ) (9.54)
µ,ν=1
donde:
l
X
G= aµν qµ′ qν′ (q1′ = 1) (9.55)
µ,ν=1
Como H = h = T + V , (9.54) conduce a:

r
h−V
q̇1 = (9.56)
G
Para M , (9.56) nos da:
2T p
M= = 2 G(h − V ) (9.57)
q̇1
Las ecuaciones diferenciales lagrangianas de Whittaker, (9.36) con M dado por
(9.57), que son aplicables a sistemas conservativos ordinarios, se llaman las ecuaciones
de Jacobi (1886).
Otras formas del principio de acción estacionaria de Maupertuis-Euler-

Lagrange. Definimos en el espacio de configuración los vectores l-dimensionales ρ~ =
{q1, q2, ...ql }. Entonces el vector ρ~ determina la posición del sistema en el espacio de
configuración. La energı́a cinética está relacionada con la velocidad del punto represen-
tativo del sistema en el espacio de configuración, ρ ~˙ . Para un sistema esclerónomo la
energı́a cinética es función cuadrática de las velocidades generalizadas, de acuerdo con
(9.54):
l l
1 X 1 X
T = 2aµν q̇µ q̇ν = mµν dqµ dqν (9.58)
2 µ,ν=1 2dt2 µ,ν=1
Si definimos en el espacio de configuración la métrica no cartesiana mµν = 2aµν ,

donde aµν está dada por (3.105), el producto escalar de dos vectores, ρ
~ y ~n, estará dado
por:
l
X
(~
ρ, ~η ) = mµν ρµ ην (9.59)
µ,ν=1
O sea que es posible asociar al espacio de configuración de un sistema mecánico

un espacio riemanniano, dado por la métrica (tensor métrico) mµν (véase el texto de
Lichnerowicz, Cálculo tensorial, capı́tulo VI). De las expresiones (9.58) y (9.59), tenemos
que:
1 ˙2 dρ
T = ~ ⇒ dt = √
ρ (9.60)
2 2T
Se sigue que la energı́a cinética de un sistema dinámico siempre coincide con la
energı́a cinética del punto representativo en el espacio de configuración, si a ese punto
se le asigna una masa m = 1.
El principio de acción estacionaria tomará la forma:
Z t2 Z (q2 ) √
∆Σ = ∆ 2T dt = ∆ 2T dρ = 0 (9.61)
t1 (q1 )
Para sistemas conservativos, tales que h = T + V :

Z (q2 )
√
∆ h − V dρ = 0 (9.62)
(q1 )
La ecuación (9.62) se llama la forma de Jacobi del principio de acción estacionaria.

Para un movimiento libre, V = 0:
Z (q2 )
∆ dρ = 0 (9.63)
(q1 )
La ecuación (9.63) indica

√ que la trayectoria es la √ más corta, la lı́nea recta; donde
la longitud recorrida es ρ = 2h, donde ρ = (t1 − t2 ) 2h.
Para V = 0, el punto representativo
√ del sistema en el espacio de configuración se
mueve uniformemente con velocidad 2h sobre una trayectoria recta.
En general, para V 6= 0, de la forma de Jacobi del principio de acción estacionaria
se deduce que la trayectoria del sistema en el espacio de configuración (trayectoria real)
es la geodésica. Esta trayectoria también es la “más recta” o sea la de mı́nima curvatura
(principio variacional de Hertz de la mı́nima curvatura).
9.4. El teorema de Li Hua Chung

Sea la integral invariante de Poincaré-Cartán, I, definida en (9.25). Según (9.24),
I tiene el mismo valor sobre cualquier contorno cerrado que envuelva el mismo haz de
trayectorias reales en el espacio de fases. Particularicemos para el caso en que los puntos
sobre C1 y C2 tienen los mismos tiempos. Es decir, sea C1 un conjunto de puntos del
espacio de fases que forma una lı́nea cerrada y que corresponde a estados simultáneos
de un sistema de acuerdo con (9.17), las ecuaciones paramétricas de C1 son:
t1 (α) = constante ; qν1 = qν1 (α) ; p1ν = p1ν (α) ; ν = 1, 2, ...l (9.64)
C2 está definida similarmente. A lo largo de estos contornos se cumple que ∆t = 0,
reduciéndose la ecuación (9.24) a:
I l
X I l
X
pν ∆qν = pν ∆qν = I1 (9.65)
C2 ν=1 C1 ν=1
La integral I1 fue introducida por Poincaré pero fue Cartán quien la extendió a
contornos formados por estados no simultáneos con la introducción del término adicional
−Ht.5
Sea C un contorno arbitrario en el espacio de fases (véase figura 9.6). Es claro
que las proyecciones de C sobre cada uno de los planos de fase (qν , pν ), ν = 1, 2, ...l,
constituye una curva cerrada bidimensional, que llamaremos Cν , ν = 1, 2, ...l.
Pν
Cν
Aν
qν
Figura 9.6 C es un contorno arbitrario en el espacio de fases con proyecciones Cν

I
(p1 ∆q1 + p2 ∆q2 + ...pl ∆ql ) =
C
I I I
p1 ∆q1 + p2 ∆q2 + ... pl ∆ql (9.66)
C1 C2 Cl
El área encerrada por el contorno Cν es Aν , donde:

I
pν ∆qν = ±Aν (9.67)
Cν
5 La mecánica de Hamilton puede desarrollarse postulando un espacio de dimensión par dotado de
una estructura definida por la invariancia de I1 .
Se toma el signo más si se evalúa

H la integral Hen el sentido de las agujas del reloj y
menos en el sentido contrario. Como C pν ∆qν = cν pν ∆qν , el sentido del contorno Cν
dependerá del sentido de C. Entonces:
I X l X l
I1 = pν ∆qν = ±Aν (9.68)
C ν=1 ν=1
donde C consta de estados simultáneos. Los contornos C y Cν varı́an durante el mo-

vimiento del sistema y las áreas Aν también varı́an, pero la suma algebraica de esas
áreas, (9.68), permanece constante. La anterior es pues la interpretación geométrica de
la invariancia de la integral de Poincaré I1 .
Como H no aparece en I1 , hallamos que la invariancia de I1 no depende del sistema
mecánico particular, es decir, I1 es invariante para cualquier sistema hamiltoniano. Por
esto se llama a I1 la integral universal invariante.
Es válido entonces enunciar el siguiente teorema: si q̇ν = ∂H/∂pν ; ṗν = −∂H/∂qν , ν =
1, 2, ...l, entonces I1 es invariante. Si I1 es invariante para algún sistema de ecuaciones
diferenciales q̇ν = Qν = Qν (q, p, t), ṗν = Pν (q, p, t), ν = 1, 2, ...l, entonces ese sistema
debe ser hamiltoniano. Para demostrar la segunda parte, sea:
I X l
dI1 dpν d∆qν
= ∆qν + pν
dt ν=1
dt dt
I X
l
= (ṗν ∆qν + pν ∆q̇ν )
ν=1
I X
l
= (ṗν ∆qν + ∆(pν q̇ν ) − ∆pν q̇ν ) (9.69)
ν=1
I X
l
= (ṗν ∆qν − q̇ν ∆pν )
ν=1
I X
l
= (Pν ∆qν − Qν ∆pν )
ν=1
Como I1 = 0, se sigue que (9.69) debe ser igual a la integral de una diferencial ∆
exacta de alguna función de (q, p, t) que llamaremos −H:
I X l
(Pν ∆qν − Qν ∆pν ) =
ν=1
I l
Z X
∂H ∂H
−∆H = − ∆qν + ∆pν (9.70)
ν=1
∂qν ∂pν
entonces, Pν = −∂H/∂qν ; Qν = ∂H/∂pν ; ν = 1, 2, ...l, con lo cual se concluye la prueba.

Teoremas de Stockes. En la teorı́a de campos vectoriales se muestra que la

integral de lı́nea a lo largo de una curva rectificable es igual a la integral de superficie
sobre la región encerrada por esa lı́nea del rotacional del vector:
I Z Z
V~ · d~r = ~ · dS
rotV ~ (9.71)
C
S
En términos de las componentes:
I X 3 Z Z X 3
∂Vj
Vi dxi = dSk ǫijk (9.72)
C i=1 ∂xi
S i,j,k=1
donde ǫijk es el tensor de Levi-Civita. dSk es la componente de dS ~ que determina un

plano perpendicular a la dirección ~ek ; por tanto dSk = dxi dxj con i 6= j 6= k, o sea que:
I X 3 Z Z X 3
∂Vj ∂Vi
Vi dxi = − dxi dxj (9.73)
C i=1 i<j=1
∂xi ∂xj
S
En geometrı́a diferencial se llama a una integral sobre un contorno cerrado “integral
relativa” y a una integral sobre una región que no es cerrada “integral absoluta”; una
integral de lı́nea se llama de “primer orden” y una de superficie se llama “de segundo
orden” porque aparecen uno y dos diferenciales respectivamente.
En el espacio de fases, el teorema de Stockes toma la forma:
I X 2l Z Z X 2l
∂Vj ∂Vi
Vi ∆xi = − ∆xi ∆xj (9.74)
C i=1 i<j=1
∂xi ∂xj
S
donde x1 = q1 , ...xl = ql ; xl+1 = p1 , ...x2l = pl . Ası́, para l = 1, (9.74) es:
I Z Z
∂B ∂A
(A∆q + B∆p) = − ∆q ∆p (9.75)
C ∂q ∂p
S
En particular, para A = p y B = 0, como es de esperarse:
Z Z Z
p ∆q = ∆p ∆q (9.76)
C
S
La ecuación (9.74) puede escribirse como:
I X l
(Aν ∆qν + Bν ∆pν ) =
C ν=1
Z Z " Xl
∂Aν ∂Aµ
− ∆qµ ∆qν +
µ<ν=1
∂qµ ∂qν
S
X l
∂Bν ∂Aµ
− ∆qµ ∆pν +
µ,ν=1
∂qµ ∂qν
X l #
∂Bν ∂Aµ
− ∆pµ ∆pν (9.77)
µ<ν=1
∂pµ ∂pν
Para Aν = pν y Bν = 0, se cumple:
I X l Z Z X l
pν ∆qν = ∆pν ∆qν (9.78)
C ν=1
S ν=1
En general, una integral relativa de orden 2ν − 1, de orden impar, puede escribirse

como una integral absoluta de orden par 2ν, para ν = 1, 2, ...l. Ası́ por ejemplo, se
cumple que:
I X l Z Z X l
I1 = pν ∆qν = J2 = ∆qν ∆pν (9.79)
ν=1 S ν=1
Z Z Z l
X
I3 = pν ∆qν ∆pµ ∆qµ = J4
µ,ν=1
Z Z Z Z X
l
= ∆qν ∆pν ∆qµ ∆pµ (9.80)
µ,ν=1
Z Z Z l
X
I2l−1 = ··· pν1 ∆qν1 ∆pν2 ∆qν2 ... ∆pνl ∆qνl = J2l
ν1 , ν2 , ...νl =1
(9.81)
Z Z Z Z l
X
= ... ∆q1 ∆p1 ... ∆ql ∆pl
ν1 , ν2 , ...νl =1
Se puede mostrar que I1 , I3 , ...I2l−1 son integrales universales invariantes. O sea

que una integral universal invariante relativa de orden impar I2ν−1 puede representarse
como una integral invariante absoluta de orden par J2ν .
En 1947 Li Hua Chung probó que cualquier integral universal invariante difiere por
un factor constante de una de las integrales (9.79), (9.80) o (9.81). Gantmacher presenta
la demostración de que cualquier integral universal invariante relativa de primer orden
es un múltiplo de I1 , para l = 1.
Teorema de Li Hua Chung. Este teorema dice que si:

ZZ Z h Xl
I (ν) = ··· Aµ1 ∆qµ1 ∆pµ2 ∆qµ2 ...
µ1 , µ2 , ...µl =1
Vν (9.82)
i
∆pµν ∆qµν + Bµ1 ∆pµ1 ∆pµ2 ∆qµ2 ... ∆pµν ∆qµν
es una integral universal invariante relativa, entonces:

I (ν) = CIν (9.83)
donde C es una constante, e Iν es una de las l integrales universales invariantes de
Poincaré. Vν es una variedad cerrada de ν dimensiones en el espacio de fases, donde
ν = 1, 3, ..,2l − 1.
Notación vectorial en el espacio de fases. V~ denotará una matriz columna

de l dimensiones con componentes Vν , ν = 1, 2, ...l. M̃ es una matriz cuadrada, l × l,
con componentes Mµν . El gradiente de una función F respecto a las coordenadas y a los
momentos, se denota respectivamente por:
∂F ∂F
, (9.84)
∂~q ∂~
p
y es un vector, o sea una matriz columna con componentes ∂F/∂qν y ∂F/∂pν respecti-
vamente; ν = 1, 2, ...l.
El gradiente de un vector es una matriz l × l, ası́:
! !
~
∂V ∂Vµ ∂V~ ∂Vµ
= ; = ; µ, ν = 1, 2, ...l (9.85)
∂~q ∂qν ∂~
p ∂pν
µν µν
El producto escalar de dos vectores es:

l
X
~ ·V
U ~ = Uν Vν (9.86)
ν=1
~ , es un vector.
y el producto de una matriz por un vector, M̃ V
Prueba del teorema de Li Hua Chung para ν = 1. Usando la notación vec-

torial, se cumple que:
I X
l h i I
′
I = ~ · ∆~q + B
q , p~, t)∆qν + Bν (~q, ~p, t)∆pν = (A
Aν (~ ~ · ∆~
p) (9.87)
C ν=1
Las ecuaciones de movimiento en el espacio de fases son:

∂H ˙ ∂H
q~˙ = ; p~ = − (9.88)
∂~
p ∂~q
La solución de las ecuaciones (9.88) es de la forma:
q=~
~ q (~
q0 , ~
p0 , t); p~ = p~(~
q0 , p~0 , t) (9.89)
donde ~q0 y p~0 son los valores de ~
q y ~q para t = t0 . En el tiempo t = t0 definimos la curva
cerrada C0 , constituida por un conjunto de estados simultáneos, caracterizada por un
conjunto de parámetros (α):
q0 = ~
~ q (α); p~0 = ~
p0 (α); (αi ) ≤ (α) ≤ (αf ) (9.90)
Los puntos que en t = t0 estaban sobre el contorno C0 , formarán un contorno C en
algún otro instante de tiempo t. Los puntos del contorno C se obtienen reemplazando
(9.90) en (9.89):
q=~
~ q (α, t); ~
p = p~(α, t); (αi ) ≤ (α) ≤ (αf ) (9.91)
Poniendo (9.91) en (9.87) se obtiene a I ′ en función de t. De la invariancia de I ′

se sigue que dI ′ /dt = 0. Derivando a (9.87):
I
˙
I =′
A~˙ · ∆~q + A ~˙ · ∆~
~ · ∆~q˙ + B ~ · ∆p~˙ = 0
p+B (9.92)
donde se usó la propiedad d(∆~q)/dt = ∆~q˙ . La ecuación (9.92) también se puede escribir
como:
I h i
I˙′ = ~˙ · ∆~q + ∆(A
A ~ · ~q˙ ) − ∆A ~˙ · ∆~
~ · ~q˙ + B ~ · p~˙ ) − ∆B
p + ∆(B ~ · p~˙ (9.93)
Se cumple que:
I (αi )

~ ˙
∆(A · ~ ~ ˙
q ) = A · ~q =0 (9.94)
C (αf )
debido a que ~
q (αi , t) = ~q(αf , t); ~p(αi , t) = p~(αf , t), por ser C un contorno cerrado. Por
otra parte:
~ ~ ~
~˙ = ∂ A · ~q˙ + ∂ A · ṗ + ∂ A
A (9.95)
∂~q ∂~p ∂t
∂A~ ∂A~
~=
∆A · ∆~q + · ∆~
p (9.96)
∂~q ∂~p
Usando (9.95) y (9.96), obtenemos:

I " ~ ~ ~
!
~ ~
!
∂A ˙ ∂A ∂A ∂A ∂A
˙
I =′
· ~q + · ṗ + · ∆~q − · ∆~q + p · ~q˙
· ∆~
∂~q ∂~p ∂t ∂~q ∂~p
! ! # (9.97)
~
∂B ~
∂B ~
∂B ~
∂B ~
∂B
+ · ~q˙ + · ṗ + · ∆~
p− · ∆~q + p · ~p˙
· ∆~
∂~q ∂~p ∂t ∂~q ∂~p
Reagrupando términos y expresando a ~q˙ y ~p˙ por medio de (9.88) obtenemos:

I " ~
!
~
! #
˙ ′ ∂H ∂A ∂H ∂B
I = −Z̃ + · ∆~q + −Z̃ + · ∆~
p (9.98)
∂~q ∂t ∂~p ∂t
donde la matriz Z̃ se define como:

~
∂A ~
∂B
Z̃ = − (9.99)
∂~
p ∂~q
Como I˙′ = 0, el integrando en (9.98) debe ser el diferencial de alguna función F :

∂F ∂F
∆F = · ∆~q + · ∆~
p (9.100)
∂~q ∂~p
comparando (9.98) y (9.100) vemos que:
∂F ∂H ~
∂A ∂F ∂H ~
∂B
= −Z̃ + ; = −Z̃ + (9.101)
∂~q ∂~q ∂t ∂~p ∂~p ∂t
En términos de componentes (9.101) toma la forma:
X l X l
∂F ∂H ∂Aν ∂F ∂H ∂Bν
=− Zνλ + ; =− Zνλ + (9.102)
∂qν ∂qλ ∂t ∂pν ∂pλ ∂t
λ=1 λ=1
Como F ha de ser una función continua de ~q y p~ se debe cumplir:

∂2F ∂2F ∂2F ∂2F ∂2F ∂2F
= ; = ; = (9.103)
∂qµ ∂qν ∂qν ∂qµ ∂pµ ∂pν ∂pν ∂pµ ∂pµ ∂qν ∂qν ∂pµ
De (9.102) y (9.103) se sigue que:
X ∂Zνλ ∂H X ∂2H ∂ 2 Aν
− − Zνλ + =
∂qµ ∂qλ ∂qµ ∂qλ ∂qµ ∂t
λ λ
X ∂Zµλ ∂H X ∂2H ∂ 2 Aµ
− − Zµλ +
∂qν ∂qλ ∂qν ∂qλ ∂qν ∂t
λ λ
X ∂Zνλ ∂H X ∂2H ∂ 2 Bν
− − Zνλ + =
∂pµ ∂pλ ∂pµ ∂pλ ∂pµ ∂t
λ λ
(9.104)
X ∂Zµλ ∂H X ∂2H ∂ 2 Bµ
− − Zµλ +
∂pν ∂pλ ∂pν ∂pλ ∂pν ∂t
λ λ
X ∂Zνλ ∂H X ∂2H ∂ 2 Aν
− − Zνλ + =
∂pµ ∂qλ ∂pµ ∂qλ ∂pµ ∂t
λ λ
X ∂Zµλ ∂H X ∂2H ∂ 2 Bµ
− − Zµλ +
∂qν ∂pλ ∂qν ∂pλ ∂qν ∂t
λ λ
En (9.104) consideremos los casos µ = ν y µ 6= ν. Para µ = ν se tiene sólo una

relación no trivial, la tercera:
X ∂Zνλ ∂H Zνλ ∂H ∂2H ∂2H

− − + Zνλ − Zνλ
∂pν ∂qλ ∂qν ∂pλ ∂pν ∂qλ ∂qν ∂pλ
λ
2 2

∂ ∂ Aν ∂ Bν
+ − =0 (9.105)
∂t ∂pν ∂qν
Como H es arbitrario, (9.105) se cumple sólo si:
∂Zνν ∂Zνν ∂Zνν
Zνλ = Zνν δνλ ; = 0; = 0; =0 (9.106)
∂pν ∂qν ∂t
Para µ 6= ν y usando (9.106), las relaciones (9.104) quedan:
∂Zνν ∂H ∂2H ∂ 2 Aν
− − Zνν + =
∂qµ ∂qν ∂qµ ∂qν ∂qµ ∂t
∂Zµµ ∂H ∂2H ∂ 2 Aµ
− − Zµµ +
∂qν ∂qµ ∂qν ∂qµ ∂qν ∂t
∂Zνν ∂H ∂2H ∂ 2 Bν
− − Zνν + =
∂pµ ∂pν ∂pµ ∂pν ∂pµ ∂t
(9.107)
∂Zµµ ∂H ∂2H ∂ 2 Bµ
− − Zµµ +
∂pν ∂pµ ∂pν ∂pν ∂pν ∂t
∂Zνν ∂H ∂2H ∂ 2 Aν
− − Zνν + =
∂pµ ∂qν ∂pµ ∂qν ∂pµ ∂t
∂Zµµ ∂H ∂2H ∂ 2 Bµ
− − Zµµ +
∂qν ∂pµ ∂qν ∂pµ ∂qν ∂t
Las ecuaciones (9.107) pueden escribirse ası́:
∂Zνν ∂H ∂Zµµ ∂H ∂2H

− + + (Zµµ − Zνν )
∂qµ ∂qν ∂qν ∂qµ ∂qµ ∂qν

∂ ∂Aν ∂Aµ
+ − =0
∂t ∂qµ ∂qν
∂Zνν ∂H ∂Zµµ ∂H ∂2H

− + + (Zµµ − Zνν )
∂pµ ∂pν ∂pν ∂pµ ∂pµ ∂pν
(9.108)
∂ ∂Bν ∂Bµ
+ − =0
∂t ∂pµ ∂pν
∂Zνν ∂H ∂Zµµ ∂H ∂ 2H
− + + (Zµµ − Zνν )
∂pµ ∂qν ∂qν ∂pµ ∂pµ ∂qν

∂ ∂Aν ∂Bµ
+ − =0
∂t ∂pµ ∂qν
Como H es arbitrario, de (9.108) se sigue que:

∂Zνν ∂Zµµ
= 0; = 0 ; Zµµ = Zνν
∂qµ ∂pµ

∂ ∂Aν ∂Aµ ∂ ∂Bν ∂Bµ
− = 0; − =0 (9.109)
∂t ∂qµ ∂qν ∂t ∂pµ ∂pν

∂ ∂Aν ∂Bµ
− =0
∂t ∂pµ ∂qν
Las relaciones (9.106) y (9.109) nos dan que para todos µ, ν, se cumple:
∂Z ∂Z
Zνλ = Z δνλ ; = 0; =0
∂qν ∂pν
∂Z
= 0 ⇒ Z = constante
∂t
(9.110)
∂ ∂Aν ∂Aµ ∂ ∂Bν ∂Bµ
− = 0; − =0
∂t ∂qµ ∂qν ∂t ∂pµ ∂pν

∂ ∂Aν ∂Bµ
− =0
∂t ∂pµ ∂qν
donde Z = Zνν .
Para µ = ν cumple Zµν = 0, o sea:
∂Aµ ∂Bµ
= ; µ=ν (9.111)
∂pν ∂qν
reemplazando (9.111) en la última igualdad (9.110) se obtiene:

∂ ∂Aν ∂Aµ
− =0 (9.112)
∂t ∂pµ ∂pν
La ecuación (9.112) y la primera igualdad (9.110) nos dan:
∂ ∂Aν ∂ ∂Aµ ∂ ∂Aν ∂ ∂Aµ
= ; = (9.113)
∂pµ ∂t ∂pν ∂t ∂qµ ∂t ∂qν ∂t
Las expresiones (9.113) se cumplen si Aν (q, p, t) son de la forma:
∂f (q, t) ∂g(p, t)
Aν = + (9.114)
∂qν ∂pν
donde f y q son funciones continuas. Bν satisfacen, por los mismos argumentos, relacio-
nes similares a (9.113), por tanto:
∂f ′ (q, t) ∂g ′ (p, t)
Bν = + (9.115)
∂qν ∂pν
~ y B
Las ecuaciones (9.114) y (9.115) son las condiciones que deben satisfacer A ~ para
que (9.87) sea una integral universal invariante.
Se cumple entonces que, para µ 6= ν:
∂Aν ∂Aµ ∂2f ∂2f
− = − =0
∂qµ ∂qν ∂qµ ∂qν ∂qν ∂qµ
∂Bν ∂Bµ ∂ 2g′ ∂ 2g′

− = − =0 (9.116)
∂pµ ∂pν ∂pµ ∂pν ∂pν ∂pµ
∂Aν ∂Bµ ∂Aν ∂Aµ ∂2g ∂2g

− = − = − =0
∂pµ ∂qν ∂pµ ∂pν ∂pµ ∂pν ∂pν ∂pµ
Para µ = ν las dos primeras igualdades en (9.116) siguen siendo válidas, en tanto
que la tercera se reemplaza por:
∂Aν ∂Bν
− = Zνν = C (9.117)
∂pν ∂qν
Por tanto, (9.116) y (9.117) nos dan para todos µ, ν:
∂Aν ∂Aµ ∂Bν ∂Bµ ∂Aν ∂Bµ
= ; = ; − = Cδµν (9.118)
∂qµ ∂qν ∂pµ ∂pν ∂pµ ∂qν
También podemos escribir a (9.118) ası́:
∂Aν ∂Aµ ∂Bν ∂Bµ ∂ ∂Bµ
= ; = ; (Aν − Cpν ) = (9.119)
∂qµ ∂qν ∂pµ ∂pν ∂pµ ∂qν
Las expresiones (9.119) nos dicen que debe existir cierta función Φ(~q, ~p, t) tal que:
∂Φ ∂Φ ~ − C~ ~ · ∆~
∆Φ = · ∆~q + · ∆~
p = (A p) · ∆~q + B p (9.120)
∂~q ∂~p
puesto que:
∂Φ ∂Φ
= Aν − C pν ; = Bν (9.121)
∂qν ∂pν
Lo anterior implica que se cumplan las relaciones (9.119) a fin de que Φ sea conti-
nua. Se tiene entonces que:
I I I
~
(A · ∆~ ~
q + B · ∆~
p) = C~ p · ∆~q + ∆Φ (9.122)
La integral universal invariante (9.87) es entonces igual a:

I I
′ ~
I = (A · ∆~ ~
q + B · ∆~p) = C p~ · ·∆~q = CI1 (9.123)
lo cual constituye la prueba del teorema de Li Hua Chung para I ′ . De paso hemos hallado
que A~ yB ~ deben tener la forma (9.114) y (9.115) respectivamente a fin de que I ′ sea
una integral universal invariante. Esta prueba es una generalización para l grados de
libertad de la presentada en Gantmacher para l = 1.

En la sección 4.5 se dio la definición de una transformación canónica como una
transformación de coordenadas en el espacio de fases 2l-dimensional, que en general
puede depender del tiempo y que no cambia la forma de las ecuaciones de Hamilton.
Allı́ derivamos las fórmulas de la transformación a partir de la segunda forma del prin-
cipio de Hamilton. Aquı́ usaremos la invariancia de la integral de Poincaré-Cartán y el
teorema de Li Hua Chung.
La función generatriz de una transformación canónica. Sean dos espacios

de fase 2l dimensionales (q, p), (q, p). La transformación canónica establece una corres-
pondencia biunı́voca entre los puntos de estos dos espacios en cada instante t:
q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l (9.124)

q 1 , q 2 , ...q l , p1 , p2 , ... pl
J 6= 0 (9.125)
q1 , q2 , ...ql , p1 , p2 , ... pl
Un conjunto de trayectorias rectas en el espacio (q, p) está definido por el sistema

de ecuaciones diferenciales:
dqν ∂H(q, p, t) dpν ∂H(q, p, t)
= ; =− ; ν = 1, 2, ...l (9.126)
dt ∂pν dt ∂qν
A cada una de las trayectorias definidas por (9.126) la transformación canónica le
hace corresponder una trayectoria recta en el espacio (q, p), definida por el sistema de
ecuaciones diferenciales:
dq ν ∂H(q, p, t) dpν ∂H(q, p, t)
= ; =− ; ν = 1, 2, ...l (9.127)
dt ∂pν dt ∂q ν
Sea un “tubo” de trayectorias en el espacio de fases y sea C un contorno arbitrario
que rodea ese tubo de trayectorias en el espacio (q, p). En el espacio (q, p) en virtud de
la transformación habrá otro tubo de trayectorias rectas y C es un contorno que corres-
ponde a C. C0 y C 0 son los contornos definidos por un conjunto de estados simultáneos,
t = constante, y que se corresponden mediante la transformación. C0 y C 0 están dadas
por ecuaciones paramétricas del tipo de (9.64), y C y C por ecuaciones como (9.17). Es
decir, C 0 y C0 obedecen a:
C : t= t(α) ; qν = qν (α) ; pν = pν (α)

(9.128)
C0 : t = t(α) = constante ; qν = qν (α) ; pν = pν (α) ; ν = 1, 2, ...l
y análogamente para C 0 y C. Como las trayectorias son hamiltonianas en (q, p) y en

(q, p), se sigue de la invariancia de la integral de Poincaré-Cartán, (9.25), que:
I l
! I l
X X
pν ∆qν − H ∆t = pν ∆qν (9.129)
C ν=1 C0 ν=1
I l
! I l
X X
pν ∆q ν − H ∆t = pν ∆q ν (9.130)
C ν=1 C 0 ν=1
Como t es invariante bajo una transformación canónica, se sigue que el lado derecho
de (9.129) está evaluado en el mismo tiempo que el lado derecho de (9.130). Si en la
H Pl
integral universal invariante ν=1 pν ∆q ν pasamos a las variables (q, p) por medio de
la transformación canónica (9.124), obtenemos:
I l
X
pν ∆q ν =
C 0 ν=1
I l
" l
! l
! #
X X ∂qµ X ∂q µ
pµ ∆qν + pµ ∆pν (9.131)
C0 ν=1 µ=1
∂qν µ=1
∂pν
La ecuación (9.131) es de la forma de (9.87): es una cierta integral universal inva-

riante de primer orden en el espacio (p, q). Por el teorema de Li Hua Chung, el invariante
obtenido puede diferir de I1 sólo por un factor constante C, ecuación (9.123):
I l
X I X
l
pν ∆q ν = C pν ∆qν (9.132)
C 0 ν=1 C ν=1
de las ecuaciones (9.129), (9.130) y (9.132) se sigue entonces que:

I l
! I l
!
X X
pν ∆q ν − H ∆t = C pν ∆qν − H ∆t (9.133)
C ν=1 C ν=1
Si en la primera integral expresamos a (q, p) en función de las (q, p), la trayectoria

de integración C será reemplazada por C, por lo cual podemos escribir a (9.133) como:
I " X l
!
Xl
!#
pν ∆q ν − H ∆t − C pν ∆qν − H ∆t =0 (9.134)
C ν=1 ν=1
C es un contorno arbitrario en el espacio (q, p), o sea que el integrando en (9.134)

debe ser la diferencial exacta ∆ de alguna función de (q, p, t), que llamaremos −F (q, p, t).
Por tanto podemos escribir:
l
! l
!
X X
∆F = C pν ∆qν − H ∆t − pν ∆q ν − H ∆t (9.135)
ν=1 ν=1
donde además se tiene que:

l
X
∂F ∂F ∂F
∆F = ∆qν + ∆pν + ∆t (9.136)
ν=1
∂qν ∂pν ∂t
Pl
Como ν=1 pν ∆q ν − H ∆t no es un diferencial exacto, o sea no es igual a −∆F , se
sigue que C nunca es cero. La función F se llama la función generatriz y la constante C
la valencia de la transformación canónica (9.124). La transformación canónica se llama

univalente, o simplemente transformación canónica cuando C = 1. Algunos autores lla-
man las transformaciones canónicas con C 6= 1 transformaciones canónicas extendidas.
En conclusión, una condición necesaria y suficiente para que la transformación (9.124)
sea canónica es la existencia de una función generatriz F y alguna constante C para
las cuales la ecuación (9.135) se satisfaga idénticamente en virtud de la transformación
(9.124). Es de notarse que la ecuación (9.135) vale para toda transformación canónica
independientemente de cuál sea la función H: vale para todo sistema hamiltoniano, o
sea F no depende de H. Esto se prueba fácilmente para un hamiltoniano arbitrario H1
definiendo a H 1 de modo que H 1 − H = C(H1 − H), con lo cual se llega a que (9.135)
vale también para H 1 y H1 .
Formas alternas de definir la función generatriz de una transformación

canónica. El principio de Hamilton modificado también puede expresarse como:
Z t2 l
!
X
δ − qν ṗν − H dt = 0 (9.137)
t1 ν=1
puesto que las ecuaciones de Euler-Lagrange correspondientes al principio variacional

(9.137) son las ecuaciones de Hamilton o ecuaciones de movimiento en el espacio de
fases. En lugar de (9.22) podemos escribir:
!t2
l
X

∆S̃ = − qν ∆pν − H∆t (9.138)

ν=1 t1
Consecuentemente se obtiene la siguiente forma para la integral invariante de Poin-

caré-Cartán, (9.25):
I l
!
X
I= − qν ∆pν − H∆t (9.139)
ν=1
Es fácil ver que (9.139) se puede derivar directamente de (9.25) mediante la trans-
formación canónica ~ q → −~p, p~ → q~. Se sigue entonces que además de (9.129) son posibles
las siguientes relaciones:
I l
! I l
X X
− qν ∆pν − H∆t = − qν ∆pν
C ν=1 C0 ν=1
! (9.140)
I l
X I l
X
− q ν ∆pν − H∆t = − q ν ∆pν
C ν=1 C0 ν=1
P
Por el teorema de Li Hua Chung se sigue que lν=1 qν ∆pν , que es una integral
universal invariante, es proporcional a I1 . Usando (9.129) y (9.140) conjuntamente con
el teorema de Li Hua Chung, podemos obtener además de (9.132) las siguientes tres
relaciones, que nos darán otras tres expresiones para la función generatriz completamente
equivalentes (9.135):
I l
X I l
X
pν ∆q ν = C − qν ∆pν
C 0 ν=1 C0 ν=1
I l
X I l
X
− q ν ∆pν = C pν ∆qν (9.141)
C0 ν=1 C0 ν=1
I l
X I l
X
− q ν ∆pν = C − qν ∆pν
C0 ν=1 C0 ν=1
Es claro que las “C” que aparecen en (9.132) y en (9.141) no tienen por qué ser
la misma. De cada una de las expresiones (9.141) se obtiene una forma diferente para la
función generatriz de la transformación canónica por un procedimiento igual al que con-
duce a la forma (9.135). En primer lugar, y en virtud de (9.129) y (9.140), las ecuaciones
(9.141) son equivalentes a:
I l
! I l
!
X X
pν ∆q ν − H∆t = C − qν ∆pν − H∆t (9.142)
C ν=1 C ν=1
I l
! I l
!
X X
− q ν ∆pν − H∆t =C pν ∆qν − H∆t (9.143)
C ν=1 C ν=1
I l
! I l
!
X X
− q ν ∆pν − H∆t =C − qν ∆pν − H∆t (9.144)
C ν=1 C ν=1
de (9.144) se sigue que:

l
! l
!
X X
∆F = C − qν ∆pν − H∆t − pν ∆q ν − H∆t (9.145)
ν=1 ν=1
l
! l
!
X X
∆F = C pν ∆qν − H∆t − − q ν ∆pν − H∆t (9.146)
ν=1 ν=1
l
! l
!
X X
∆F = C − qν ∆pν − H∆t − − q ν ∆pν − H∆t (9.147)
ν=1 ν=1
Las transformaciones canónicas libres. En el conjunto de todas las transfor-

maciones canónicas hay una clase que se puede caracterizar por la siguiente propiedad:
su función generatriz puede expresarse como una función de un conjunto de (2l) varia-
bles independientes que pueden ser (q q), (q p), (p q) o (p p). A estas transformaciones las
llamaremos transformaciones canónicas libres de la primera, segunda, tercera y cuarta
clase respectivamente. Es posible que una transformación canónica dada sea a la vez
canónica libre de más de una clase.
En (3.20) encontramos transformaciones canónicas libres de la primera clase.
Ejemplo 9.5.1 Demostrar que la transformación canónica (4.134), para l = 1, es libre
de primera clase:

1 2 p2 p
p = mω q + ; q = −tan−1 (9.148)
2 mω 2 mωq
Las fórmulas de transformación pueden escribirse en la forma:
1
p = mωq tan q ; p= mωq 2 sec2 q (9.149)
2
o sea que es libre de la primera clase. También se puede escribir como:
s r
−1 mωq 2 2p
q = cos ; p = −mω − q2 (9.150)
2p mω
o sea que también es libre de la segunda clase. Es fácil ver que también es libre de tercera
y cuarta clase.
Ejemplo 9.5.2 Demostrar que la transformación identidad es canónica de segunda y
tercera clase pero no es de primera ni de cuarta clase.
La transformación identidad es:
q ν = qν ; pν = pν ; ν = 1, 2, ...l (9.151)
Esta transformación puede escribirse en cualquiera de las formas siguientes:
qν = qν ; pν = pν
(9.152)
qν = q ν ; pν = pν ; ν = 1, 2, ...l
o sea que sólo es posible tomar independientes a (q, p) o a (q, p). Esta transformación es
canónica de segunda y tercera clase pero no es de primera ni de cuarta clase.
Ejemplo 9.5.3 Mostrar que la transformación que intercambia coordenadas y momentos
y cambia de escala, es libre de primera y cuarta clase pero no de segunda ni de tercera
clase:
1
qν = αpν ; qν = p
β ν
(9.153)
1
pν = βqν ; pν = q ν ; ν = 1, 2, ...l
α
Ejemplo 9.5.4 Mostrar que la transformación canónica q = −αp/q, p = q 2 /2α, con
l = 1, es una transformación canónica libre de primera y de cuarta clase pero no de
segunda ni de tercera clase:
αp p
q= −√ ; q= 2αp
2αp
(9.154)
q2 qq
p= ; p=−
2α α
Las transformaciones canónicas libres de primera clase se caracterizan porque (p, p)
se pueden expresar en función de (q, q). Esto dice que las (p) dependen de (q), o sea que:

q 1 , q 2 , ...q l
J 6= 0 (9.155)
p1 , p2 , ...pl
En este caso la función generatriz F (q, p, t) puede representarse mediante una fun-
ción de (q, q) que llamaremos F1 :
F (q, p, t) = F1 (q, q, t) (9.156)
De (9.135) y (9.156) se sigue que:
l
! l
!
X X
∆F1 (q, q, t) = C pν ∆qν − H∆t − pν ∆q ν − H∆t (9.157)
ν=1 ν=1
Como para estas transformaciones ∆qν y ∆q ν son todos independientes se sigue

entonces que:
∂F1 ∂F1
= Cpν ; = −pν ; ν = 1, 2, ...l (9.158)
∂qν ∂qν
∂F1
= H − CH (9.159)
∂t
Las ecuaciones (9.158) definen la transformación canónica bajo consideración, esto
es, ellas pueden reducirse a la forma (9.124). Con ello probaremos que toda transforma-
ción canónica libre de primera clase define una función F1 (q, q, t) y que a cada función
F1 (q, q, t) le corresponde una transformación canónica libre de primera clase. Debemos
mostrar que es posible resolver las ecuaciones (9.158) para expresar a (q, p) en función
de (q, p).
Empecemos por mostrar que todas las derivadas parciales ∂F1 /∂qν son indepen-
dientes. Supongamos que no lo fueran, es decir, que pudiéramos encontrar una expresión
para una de ellas en función de las demás. Ello requerirı́a que exista una función Ω
diferente de cero tal que:

∂F1 ∂F1 ∂F1
Ω , , ... , q1 , q2 , ...ql = 0 (9.160)
∂q1 ∂q2 ∂ql
donde en (9.160) los (q) son tomados como parámetros. De (9.158) se sigue:
Ω(Cp1 , Cp2 , ...Cpl , q1 , q2 , ...ql ) = 0 (9.161)
como (q, p) son cantidades independientes, se sigue de (9.161) que Ω ≡ 0 y en conse-
cuencia las ∂F1 /∂qν son independientes, consideradas como funciones de las variables
q 1 , q 2 , ...q l . Que las l cantidades independientes ∂F1 /∂qν sean funciones de las l can-
tidades independientes q ν se expresa diciendo que el jacobiano de esas funciones no es
idénticamente cero:
2
∂F1 /∂~q ∂ F1
J = det 6= 0 (9.162)
q
~ ∂~q ∂~q
De la desigualdad (9.162) se sigue que las primeras l ecuaciones (9.158) pueden
resolverse para las q ν , con lo cual todas las nuevas variables de fases q ν , pν (ν = 1, 2, ...l)
pueden expresarse en función de las viejas variables qν , pν (ν = 1, 2, ...l). La ecuación
(9.162) también permite que en (9.158) las l últimas ecuaciones sean resueltas para qν en
función de las q ν , pν . En conclusión, las ecuaciones (9.158) definen una transformación
canónica libre de primera clase con función generatriz y valencia dadas, F1 y C 6= 0,
en tanto que la fórmula (9.159) permite relacionar las funciones hamiltonianas H y H,
que serán proporcionales sólo en el caso en que la transformación canónica no dependa
explı́citamente del tiempo.
Podemos decir que la clase de las transformaciones canónicas libres de primera
clase se puede obtener hallando todas las funciones generatrices F1 que satisfacen la
condición (9.162) y las diferentes valencias C 6= 0, y usando las fórmulas (9.158).
Para las transformaciones canónicas libres de primera clase univalentes (C = 1),
(9.158) y (9.159) toman la forma más simple:
∂F1 ∂F1 ∂F1
= pν ; = −pν ; ν = 1, 2, ...l ; H = H + (9.163)
∂qν ∂qν ∂t
La última ecuación (9.163), dice que H − H no depende del sistema hamiltoniano

especı́fico que se tenga sino simplemente de cuál es la transformación canónica, que
puede ser definida sin hacer referencia a la forma del hamiltoniano.
La discusión de los otros tipos de transformaciones canónicas libres es comple-
tamente análoga a la de las transformaciones canónicas libres de primera clase. Las
fórmulas son las siguientes, que se obtienen usando las formas (9.145), (9.146) y (9.147)
para la función generatriz. En las Transformaciones Canónicas (T.C.) libres de segunda
clase (q, p) son independientes, luego:
!
~p
J 6= 0 (9.164)
p~
Como (q, p) son independientes, (9.146) permite escribir:

∂F2 ∂F2
= Cpν ; = q ν ; ν = 1, 2, ...l (9.165)
∂qν ∂pν
∂F2
= H − CH (9.166)
∂t
donde F2 es función de (q, p, t) y satisface la condición:
2
∂ F2
det 6= 0 (9.167)
∂~q ∂~p
En las T.C. libres de tercera clase (p, q) son independientes, luego:

!
~q
J 6= 0 (9.168)
q
~
como (p, q) son independientes, (9.145) permite escribir:

∂F3 ∂F3
= −Cqν ; = −pν ; ν = 1, 2, ...l (9.169)
∂pν ∂qν
∂F3
= H − CH (9.170)
∂t
donde F3 es función de (p, q, t) y satisface la condición:
2
∂ F3
det 6= 0 (9.171)
p ∂~q
∂~
En las T.C. libres de cuarta clase (p, p) son independientes, luego:
!
~p
J 6= 0 (9.172)
q
~
Como (p, p) son independientes, (9.147) permite escribir:

∂F4 ∂F4
= −Cqν ; = qν ; ν = 1, 2, ...l (9.173)
∂pν ∂pν
∂F4
= H − CH (9.174)
∂t
donde F4 es función de (p, p, t) y satisface la condición:
2
∂ F4
det 6= 0 (9.175)
p ∂~p
∂~
Se tienen, pues, 4l cantidades no independientes (q, p, q, p) de las cuales, además de
(q, p) y (q, p), se pueden extraer conjuntos de variables independientes (q, q), (q, p), (p, q),
(p, p). En cada uno de estos cuatro casos decimos que la transformación canónica es libre.
Una transformación canónica arbitraria es no libre y obedece fórmulas de transformación
en términos de una función generatriz que veremos más adelante y de las cuales (9.158)
y (9.164) a (9.175) no son más que casos particulares.
Ejemplo 9.5.5 Hallar la función generatriz del tipo F2 para la transformación canónica
(9.148).
Usando (9.146) y (9.150) obtenemos:
∆F2 = C(p ∆q − H ∆t) − (−q ∆p − H ∆t) = Cp ∆q + q ∆p (9.176)

La última igualdad en (9.176) se sigue de que la transformación no depende del

tiempo. También:
r s
2p −1 mωq 2
∆F2 = C(−mω)∆q − q 2 + ∆p cos (9.177)
mω 2p
Como ∆F2 es exacto se sigue que ∂ 2 F2 /∂p ∂q = ∂ 2 F2 /∂q ∂p lo cual implica que la
transformación es univalente, o sea C = 1. La función generatriz es:
s r
−1 mωq 2 1 2p
F2 (q, p) = p cos − mωq − q2 (9.178)
2p 2 mω
Para esta misma transformación se cumple que:

p p2
q=− cot q ; p = csc2 q (9.179)
mω 2mω
Entonces para una función generatriz del tipo F3 se cumple:
∂F3 p ∂F3 p2
= cot q ; =− csc2 q (9.180)
∂p mω ∂q 2mω
donde hemos usado (9.169) con C = 1. Es claro que:
1
∆F3 = (2p cot q ∆p − p2 csc2 q ∆q)
2mω

1 2
= ∆ p cotq (9.181)
2mω
con lo cual:
p2
F3 = cot q (9.182)
2mω
similarmente hallamos para F4 :
p2 p p
F4 = 2mωp − p2 + p sen−1 √ (9.183)
2mω 2mωp
En sı́ntesis, las funciones generatrices de la transformación canónica (3.107) son:
1
F1 = − mωq 2 tan q
2 s r
−1 mωq 2 1 2 2p
F2 = p cos − mωq −1
2p 2 mωq 2
(9.184)
p2
F3 = cot q
2mω r s
p2 2mωp −1 p2
F4 = − 1 + p sen
2mω p2 2mωp
Ejemplo 9.5.6 Hallar las funciones generatrices del tipo F2 y F3 para la transformación
canónica identidad.
Sabemos que no existen funciones del tipo F1 o F4 . La transformación no depende

del tiempo, luego, de (9.146) y (9.152):
l
X l
X l
X l
X
∆F2 = C pν ∆qν + q ν ∆pν = C pν ∆qν + qν ∆pν (9.185)
ν=1 ν=1 ν=1 ν=1
de la condición ∂ 2 F2 /∂qν ∂pµ = ∂ 2 F2 /∂pµ ∂qν se sigue que la transformación debe ser
univalente, en consecuencia:
l
X l
X
∆F2 = (pν ∆qν + qν ∆pν ) = ∆ q ν qν (9.186)
ν=1 ν=1
Por tanto:
l
X
F2 = pν qν (9.187)
ν=1
Similarmente:
l
X
F3 = − q ν pν (9.188)
ν=1
Ejemplo 9.5.7 Hallar las funciones generatrices del tipo F1 y F4 para la transformación
canónica de cambio de escala e intercambio de coordenadas y momentos (9.153).
Sabemos que F2 y F3 no existen para esa transformación. El resultado es:

l
X
C = −α β ; F1 = −β q ν qν (9.189)
ν=1
l
X
C = −α β ; F4 = α pν pν (9.190)
ν=1
Ejemplo 9.5.8 Hallar las funciones generatrices de la transformación de cambio de escala:

q ν = αqν ; pν = βpν
l
X
C = α β ; F2 = α pν qν (9.191)
ν=1
l
X
C = α β ; F3 = −β q ν pν (9.192)
ν=1
Ejemplo 9.5.9 Sea una transformación canónica libre de primera clase (q, p) → (q, p)
con generatriz F1 (q, q, t). Mostrar que la transformación inversa (q, p) → (q, p) también
es canónica, y hallar la correspondiente función generatriz.
La transformación original satisface:

l
! l
!
X X
∆F1 = C pν ∆qν − H ∆t − pν ∆q ν − H ∆t (9.193)
ν=1 ν=1
∂F1 ∂F1 ∂F1

= Cpν ; = −pν ; ν = 1, 2, ...l ; = H − CH (9.194)
∂qν ∂qν ∂t
La desigualdad (9.162) garantiza que las dos últimas ecuaciones (9.194) se pueden
resolver para (q) en función de (p), tomando (q) como parámetros, con lo cual se pueden
expresar (p, q) en función de (q, p), o sea que las ecuaciones (9.124) se pueden invertir.
Esto prueba que la transformación inversa existe, la cual además es canónica. Para la
transformación inversa:
l
! l
!
X X
i i
∆F1 = C pν ∆q ν − H ∆t − pν ∆qν − H ∆t (9.195)
ν=1 ν=1
∂F1i ∂F1i ∂F1i

= C i pν ; = −pν ; ν = 1, 2, ...l ; = H − CiH (9.196)
∂q ν ∂qν ∂t
∂F1i 1 ∂F1 ∂F1 1 ∂F1i

− = ; − = i
∂qν C ∂qν ∂qν C ∂qν
∂F1 ∂F1i (9.197)

Ci + = (−CC i + 1)H
∂t ∂t
∂F1i ∂F1
C + = (−CC i + 1)H
∂t ∂t
1
F1 = −CF1i ; F1i = −C i F1 ; Ci = (9.198)
C
o más explı́citamente:
1 1
F1i (q, q, t) = − F1 (q, q, t) ; Ci = (9.199)
C C
Para una transformación canónica libre univalente de primera clase se cumple
simplemente:
F1i (q, q, t) = −F1 (q, q, t) (9.200)

o sea que la función generatriz de la transformación canónica inversa es el negativo de

la función generatriz de la T.C. original. Para una transformación canónica arbitraria,
se cumplen las expresiones siguientes para las funciones generatrices F y F i , aunque no
se cumplen las fórmulas (9.194) y (9.196):
l
! l
!
X X
∆F (q, p, t) = C pν ∆qν − H ∆t − pν ∆q ν − H ∆t (9.201)
ν=1 ν=1
l
! l
!
X X
i i
∆F (q, p, t) = C pν ∆q ν − H ∆t − pν ∆qν − H ∆t (9.202)
ν=1 ν=1
La ecuación (9.202) también se puede escribir como:

l
! l
!
1 i 1 X X
− i ∆F (q, p, t) = pν ∆qν − H ∆t − pν ∆q ν − H ∆t(9.203)
C C i ν=1 ν=1
de donde se llega al resultado general:

1 1
F i (q, p, t) = − F (q, p, t) ; C i = (9.204)
C C
Ejemplo 9.5.10 Mostrar que el resultado de dos transformaciones canónicas sucesivas es
una transformación canónica.
El generador de la transformación resultante es la suma de los generadores de las

transformaciones separadas. Si las transformaciones son libres de primera clase:
(a+b) (a) (b)
F1 (q, q, t) = F1 (q, q, t) + F1 (q, p, t) (9.205)
donde a es la transformación (q, p) → (q, p) y b es la transformación (q, p) → (q, p); a + b
representa la transformación combinada (q, p) → (q, p).
Ejemplo 9.5.11 Mostrar que la realización de tres transformaciones canónicas sucesivas
es asociativa.
Para transformaciones libres de primera clase esto se expresa ası́:

a+(b+c) (a+b)+c
F1 q, q, t = F1 q, q, t (9.206)
lo que se sigue de la propiedad (9.205):

a+(b+c) (a) (b+c)
F1 q, q, t = F1 (q, q, t) + F1 q, q, t =
(9.207)
(a) (b) (c)
F1 (q, q, t) + F1 q, q, t + F1 q, q, t
donde c es la transformación (q, p) → (q, p).

Las ecuaciones (9.205), (9.206) y (9.207) valen también para transformaciones

canónicas arbitrarias.
Significado de la valencia de una transformación canónica. Sea la transfor-

mación de cambio de escala (9.191) y una transformación canónica univalente arbitraria.
Si esas dos transformaciones se realizan en sucesión, las respectivas funciones generatri-
ces se pueden escribir como:
l
! l
!
X X
∆Fc.e. = αβ pν ∆qν − H ∆t − pν ∆q ν − H ∆t (9.208)
ν=1 ν=1
l
! l
!
X X
∆Fµ.v. = pν ∆q ν − H ∆t − pν ∆q ν − H ∆t (9.209)
ν=1 ν=1
Entonces la propiedad (9.205), permite escribir para la función generatriz de la

transformación completa:
l
! l
!
X X
∆Fµ.v. = αβ pν ∆qν − H ∆t − pν ∆q ν − H ∆t (9.210)
ν=1 ν=1
O sea que cualquier transformación canónica no univalente puede suponerse com-

puesta de una transformación de cambio de escala donde c = αβ seguida de una trans-
formación univalente. Lo anterior permite que en la práctica se usen sólo las transfor-
maciones canónicas univalentes.
El grupo de las transformaciones canónicas. El conjunto de todas las trans-

formaciones canónicas de un sistema de l grados de libertad es un conjunto infinito no
contable. Este conjunto posee la estructura algebraica de grupo:
(i) Hay una ley de composición interna, mediante la cual a dos transformacio-
nes canónicas se les puede asociar una tercera; es decir, está definida la suma de dos
transformaciones canónicas para dar una transformación canónica, ecuación (9.205).
(ii) Existe la transformación canónica identidad, ecuación (9.189).
(iii) La transformación inversa de una transformación canónica dada existe y es
canónica, (9.204).
(iv) La realización de transformaciones canónicas sucesivas es asociativa, (9.206).
Por todo lo anterior podemos decir que la forma de las ecuaciones canónicas es
invariante con respecto al grupo de las transformaciones canónicas. La integral de Poin-
caré-Cartán, las integrales invariantes de Poincaré, los corchetes de Poisson y otras
cantidades también poseen esta propiedad de invariancia bajo el grupo de las transfor-
maciones canónicas.
Relación entre las diferentes funciones generatrices de transformaciones

canónicas libres. Interpretación en términos de transformaciones de Legen-
dre. En la sección (4.1) se definió la transformación de Legendre. Sea una transformación
canónica libre de primera clase, univalente, las fórmulas de transformación se obtienen

de:
∂F1 ∂F1
pν = ; −pν = ; ν = 1, 2, ...l (9.211)
∂qν ∂qν
Usando la notación de la sección 4.1, sea (x) = (q); (α) = (q, t); (y) = (p) y
X = F1 . Entonces (9.211) se pueden escribir como:
∂X(x, α) ∂X ∂X
yν = ; −pν = ; H −H = (9.212)
∂xν ∂q ν ∂t
Podemos interpretar, pues, a F1 , como el generador de la transformación de Le-
gendre (q) → (p). El generador de la transformación de Legendre inversa, (y) → (x) es
Y (y, α), tal que:
l
X ∂Y
Yν = xν yν − X ; xν = (9.213)
ν=1
∂yν
donde además se satisface:

∂X ∂Y ∂X ∂Y ∂X ∂Y
=− → =− ; =− (9.214)
∂αi ∂αi ∂q ν ∂qν ∂t ∂t
se cumple, pues, que:
∂Y ∂Y ∂Y
qν = ; −pν = − ; H −H =− (9.215)
∂pν ∂qν ∂t
Si llamamos Y = −F 3(p, q, t), las ecuaciones (9.215) quedan ası́:
∂F3 ∂F3 ∂F3
qν = − ; pν = − ; H −H =− (9.216)
∂pν ∂qν ∂t
que coinciden con las fórmulas (9.168) a (9.171). En conclusión, F1 y F3 están relacio-
nadas mediante una transformación de Legendre:
l
X
F3 = F1 − pν qν (9.217)
ν=1
Con argumentos completamente análogos llegamos a:

l
X
F2 = F1 + q ν pν (9.218)
ν=1
l
X l
X
F4 = F1 + q ν pν − qν pν (9.219)
ν=1 ν=1
Ejercicio 9.5.1 Usar las relaciones (9.217), (9.218) y (9.219) para obtener a F2 , F3 y F4
a partir de F1 para un oscilador armónico lineal. Comparar con las fórmulas (9.184).
Ejemplo 9.5.12 Verificar las expresiones (9.187) y (9.188) usando la transformación de

legendre:
l
X l
X
F3 = F2 − q ν pν − pν qν (9.220)
ν=1 ν=1
Usando (9.187) obtenemos:

l
X
F3 = (pν qν − q ν pν − pν qν )
ν=1
l
X l
X
= (pν q ν − q ν pν − pν q ν ) = −q ν pν (9.221)
ν=1 ν=1
en efecto, (9.221) coincide con (9.188).
Notación de las funciones generatrices. Corben-Stehle usan la siguiente no-

tación para las funciones generatrices de las T.C. libres F1, 2, 3, 4 de Goldstein:
F1 = φ(q, q, t)
F2 = ψ ′ (q, p, t)
(9.222)
F3 = ψ(q, p, t)
F4 = φ′ (q, p, t)
Landau usa F1 = F y F2 = Φ.
Las transformaciones puntuales. Una transformación de coordenadas llamada

transformación puntual, puede escribirse como una transformación canónica.
Las nuevas coordenadas son funciones de las viejas coordenadas pero no de los viejos
momentos. Entonces en una transformación puntual pueden tomarse como independien-
tes (p, q) o (p, q), o sea que una transformación puntual es libre de segunda y de tercera
clase. Puede expresarse en las siguientes formas:
q ν = fν (q, t) ; pν = gν (q, p, t) (9.223)
∂F2 ∂F2
pν = ; qν = (9.224)
∂qν ∂pν
∂F3 ∂F3
qν = − ; pν = − (9.225)
∂pν ∂q ν
Se requiere entonces que F2 y F3 sean de la forma:
l
X
F2 = fν (q, t)pν (9.226)
ν=1
l
X
F3 = − fν−1 (q, t)pν (9.227)
ν=1
donde fν−1 son las funciones inversas a fν , o sea, qν = fν−1 (q, t). Entonces se tiene para
pν y pν :
Xl
∂fµ (q, t)
pν = pν (9.228)
µ=1
∂qν
Xl
∂fµ−1 (q, t)
pν = pµ (9.229)
µ=1
∂q ν
Según lo anterior es claro que (p) y (p) estarán conectados por una transformación
lineal que depende de las coordenadas que llamaremos T̃ de modo que en forma de
matrices y vectores l-dimensionales (9.228) y (9.229) toman la forma:
p = T̃ (q, t)~p ; ~p = T̃ −1 (q, t)~

~ p (9.230)
−1
∂fν −1
∂fµν
Tµν = ; Tµν = (9.231)
∂qµ ∂qµ
Por poderse expresar en términos de funciones generatrices, la transformación pun-

tual es canónica. Entonces, tanto las ecuaciones de Hamilton como las de Lagrange son
covariantes bajo transformaciones puntuales. Las ecuaciones (9.223) y (9.228) pueden
tomarse como las fórmulas de una transformación canónica puntual.
Ejemplo 9.5.13 Sea un sistema de tres grados de libertad y la transformación de coor-

denadas cartesianas a coordenadas esféricas. Expresar esta transformación como trans-
formación canónica.
La transformación es:
p
r = x2 + y 2 + z 2 = fr (q)
z
θ = cos−1 p = fθ (q) (9.232)
x + y2 + z 2
2
y
φ = tan−1 = fθ (q)
x
x = r senθ cos φ = fx (q)
y = r senθ senφ = fy (q) (9.233)
z = r cos θ = fz (q)
donde tomamos a (q) = (x, y, z) y (q) = (r, θ, φ). Además usamos la notación (fν−1 ) =
(fx , fy , fz ). La función generatriz F2 , de acuerdo con (9.226) y (9.232) es:
F2 (q, p) = pr f r + pθ f θ + pφ f φ
p z
= pr x2 + y 2 + z 2 + p2θ cos−1 p (9.234)
x + y2 + z 2
2
−1 y
+pφ tan
x
Similarmente para F3 (q, p) tenemos:
F3 (q, p) = −px fx − py fy − pz fz
(9.235)
= −px r senθ cos φ − py rsenθ senφ − pz r cos θ
Usando (9.228) junto con (9.234) y (9.235) obtenemos las siguientes fórmulas para
la transformación de los momentos:
x y xz
px = p pr − 2 p +p
2 φ
pθ
2
x +y +z2 2 x + y x + y (x2 + y 2 + z 2 )
2 2
y x yz
py = p pr + 2 pφ + p pθ
x2 + y 2 + z 2 x +y 2
x2 + y 2 (x2 + y 2 + z 2 ) (9.236)
p
z x2 + y 2
px = p pr − 2 pθ
2 2
x +y +z 2 x + y2 + z 2
y similarmente:
pr = px senθ cos φ + py senθ senφ + pz cos θ
pθ = px r cos θ cos φ + py r cos θ senφ − pz r senθ (9.237)
pr = −px r senθ senφ + py rsenθ cos φ

Notemos que:
p2φ p2θ
p~2 = p2x + p2y + p2z = p2r + + (9.238)
r2 sen2 θ r2
Expresadas en términos de r, θ, φ, las matrices T̃ y T̃ −1 son:
 
1 senφ
 senθ cos φ cos θ cos φ −
 r r senθ 
 
 1 cos φ 
 senθ senφ cos θ senφ 
T̃ (q) = 
 r r senθ   (9.239)
 
 1 
 
 cos θ − senθ 0 
r
 
senθ cos φ cos θ senφ cos θ
 
 
T̃ −1
(q) = 
 r cos θ cos φ r cos θ senφ −r senθ 
 (9.240)
 
−r senθ senφ r senθ cos φ 0
˜ Sin embargo T̃ −1 6= T̃ T , o sea que

Se ve, como debe ser, que T̃ T̃ −1 = T̃ −1 T̃ = I.
la transformación de los momentos no es ortogonal.
Transformación puntual lineal. En este caso se tiene:

l
X
qν = Sνµ qµ + bν = fν (q, t) (9.241)
ν=1
donde asumimos que Sνµ y bν pueden depender explı́citamente del tiempo, aunque
obviamente no dependen de (q) ni de (p).
La transformación inversa es:
l
X
−1

qν = Sνµ q µ − bµ = fν−1 (q, t) (9.242)
ν=1
−1
donde Sνµ es la matriz inversa de Sνµ . Las funciones generatrices F2 (q, p, t) de la trans-
formación, y −F2 (q, p, t) = F3 (q, p, t) de la transformación inversa son:
l
X l
X
F2 (q, p, t) = Sµν pµ qν + b ν pν (9.243)
µ,ν=1 ν=1
l
X
−1

F2 (q, p, t) = − Sµν q µ − b µ pν (9.244)
µ,ν=1
La relación entre los momentos también será lineal:

l
X l
X
−1
pν = Sµν pµ ; pν = Sµν pµ (9.245)
µ=1 µ=1
La “representación” de las coordenadas y la “representación” de los

momentos. La transformación (q, p) → (p, −q) es canónica. De acuerdo con (9.189)
puede ser generada por las funciones generatrices.
l
X l
X
F1 (q, q) = q µ qν ; F4 (p, p) = pµ pν (9.246)
ν=1 ν=1
Como la transformación no depende del tiempo, H = H:
H(q, p, t) = H(q, p, t) = H(−p, q, t) (9.247)

Ası́ por ejemplo, para un oscilador armónico lineal:

1 2 k 2
H(q, p, t) = q + p (9.248)
2m 2
Ciertamente en el formalismo hamiltoniano las ecuaciones de movimiento son cova-
riantes. El contenido de esta transformación es el siguiente: en el espacio de configuración
el estado del sistema se puede representar mediante dos puntos, o equivalentemente, me-
diante las coordenadas y velocidades generalizadas; la transformación nos dice que en
el espacio de momentos también está toda la información requerida para describir el
estado; en el espacio de momentos el estado se puede representar entonces mediante los
momentos generalizados y sus derivadas temporales.
PHallemos las ecuaciones de lagrange en el espacio de los momentos. Partimos de
l
L = ν=1 pν q̇ν − H y usamos la transformación canónica generada por (9.246):
l l l
! l
X X X X
L= pν q̇ν − H = pν q̇ν + pν q̇ ν − H − pν q̇ ν (9.249)
ν=1 ν=1 ν=1 ν=1
El nuevo lagrangiano L estará entonces relacionado con L por:

l
X l
X l
d X
L= pν q̇ ν − H = L − pν q̇ν − pν q˙ν = L − pν qν (9.250)
ν=1 ν=1
dt ν=1
Como L y L difieren por una derivada total respecto al tiempo, el principio de

Hamilton nos dice que las ecuaciones de movimiento son:
∂L(p, ṗ, t) d ∂L(p, ṗ, t)
− = 0 ; ν = 1, 2, ...l (9.251)
∂pν dt ∂ ṗν
lo cual coincide con el resultado (4.48) que se obtuvo con base en consideraciones sobre
las transformaciones de Legendre.
El paso del formalismo lagrangiano al hamiltoniano, sección 3.1, se realiza mediante
la transformación pν = ∂L(q, q̇, t)/∂ q̇ν , que se expresa en términos de transformaciones
de Legendre. Esta transformación tiene la forma de cierta transformación (p, q) → (p =
q̇, q) en el espacio de fases. Podrı́amos investigar si es una transformación canónica donde
los nuevos momentos sean las (q̇).
También la transformación puede escribirse en una forma tal que q ν = q̇ν ; que
es más útil en el contexto de las transformaciones canónicas pues permite interpretar
a L(q, q̇, t) = L(q, q, t) como la función generatriz del tipo F1 de cierta transformación
canónica. Es decir, L genera la transformación:
∂L(q, q, t) ∂L(q, q, t) ∂L(q, q, t)
pν = ; pν = − ; H −H = (9.252)
∂qν ∂q ν ∂t
que equivale a la transformación (q, ṗ) ↔ (−p, q̇). H es el hamiltoniano en las variables
canónicas (q, ṗ) y H en las variables (−p, q̇). Si quisiéramos expresar esta transformación
mediante una función generatriz del tipo F4 (p, p, t), dada de acuerdo con (9.219) por
Pl Pl
L(q, q, t)+ ν=1 (q ν pν −qν pν ) = L(q, q̇)− ν=1 (pν q̇ν +qν ṗν ), notamos que ese generador,
de acuerdo con (9.250), serı́a precisamente la función que llamamos L(p, ṗ, t).
Ejercicio 9.5.2 Hallar los hamiltonianos y las ecuaciones de movimiento que correspon-
den a los conjuntos de variables canónicas (q, ṗ) y (−p, q̇).
Ejercicio 9.5.3 Analizar la transformación (q, p) ↔ (q, q̇) como una transformación en
el espacio de fases, e investigar si es canónica. De serlo hallar la correspondiente función
generatriz.
La función generatriz de una transformación canónica arbitraria. En

general, una transformación canónica es no libre, o sea que no se puede describir mediante
funciones generatrices del tipo F1, 2, 3, 4 . Ası́ por ejemplo para un sistema de dos grados
de libertad la transformación:
q 1 = q1 , p1 = p1 , q 2 = p2 , p2 = −q2 (9.253)
es canónica pero no se puede describir mediante una función generatriz de una transfor-
mación canónica libre, pues involucra una mezcla de los cuatro tipos. El tratamiento de
estas transformaciones se basa en el lema de Carathéodory, cuya demostración está dada
en el texto de Gantmacher, Lectures in analytical mechanics, sección 29. El enunciado
del lema es el siguiente.
Lema. Si hay 2l funciones independientes q 1 , q 2 , ...q l , p1 , p2 , ...pl de las 2l can-

tidades independientes q1 , q2 , ...ql , p1 , p2 , ...pl , entonces del conjunto de 4l cantidades
qν , pν , q ν , pν (ν = 1, 2, ...l) siempre es posible escoger 2l cantidades independientes de
tal manera que no hay ni un sólo par de cantidades conjugadas (qν , pν ) o (q ν , pν ) entre
ellas. Tenemos entonces que de las 4l cantidades qν , pν , q ν , pν (ν = 1, 2, ...l) que están
conectadas mediante la transformación canónica:
~q , ~p
q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l ; J( ) 6= 0 (9.254)
q, p
es posible tomar las siguientes 2l cantidades independientes:
q1 , q2 , ...qr , pr+1 , pr+2 , ...pl , q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl
(9.255)
0 ≤ r ≤ l, 0 ≤ s ≤ l
donde, de acuerdo con el lema de Carathéodory no hay ni un par de variables canóni-
camente conjugadas. Como la transformación es canónica existe cierta función F (q, p, t)
tal que:
l
! l
!
X X
∆F = C pν ∆qν − H ∆t − pν ∆q ν − H ∆t (9.256)
ν=1 ν=1
de acuerdo con (9.136). Es claro que igualmente podrı́amos haber usado cualquiera de
las expresiones (9.145), (9.146) o (9.147), obteniéndose cuatro expresiones para F que
sólo difieren por una transformación de Legendre. La expresión (9.256) usando (9.255)
se puede separar ası́:
r
X l
X s
X s
X
∆F = C pν ∆qν +C pν ∆qν − pν ∆q ν − pν ∆q ν + H − H ∆t (9.257)
ν=1 ν=r+1 ν=1 ν=s+1
Usando las siguientes expresiones:

l l
! l
X X X
pν ∆qν = ∆ pν qν − qν ∆pν
ν=r+1 ν=r+1 ν=r+1
! (9.258)
l
X l
X l
X
pν ∆q ν = ∆ pν q ν − q ν ∆pν
ν=s+1 ν=s+1 ν=s+1
podemos escribir a (9.257) como:

l l
!
X X
∆ F+ q ν pν − C qν pν =
ν=s+1 ν=r+1
r l
!
X X
C pν ∆qν − qν ∆pν
ν=1 ν=r+1
l l
!
X X
+ − pν ∆q ν + q ν ∆pν + H − CH ∆t (9.259)
ν=1 ν=s+1
según (9.255), ∆qν (ν = 1, 2, ...r), ∆pν (ν = r + 1, r + 2, ...r), ∆q ν (ν = 1, 2, ...s),

∆pν (ν = s + 1, s + 2, ...l) son independientes y por tanto:
∂U
C pν = ; ν = 1, 2, ...r
∂qν
∂U
−C qν = ; ν = r + 1, r + 2, ...l
∂pν
∂U
qν = ; ν = s + 1, s + 2, ...l
∂pν
∂U
−pν = ; ν = 1, 2, ...s
∂qν
∂U
H − CH = (9.260)
∂t
donde U es función de las cantidades (9.255) y está definida por:
l
X l
X
U =F+ q ν pν − C pν qν (9.261)
ν=s+1 ν=r+1
Las fórmulas (9.260) son equivalentes a las fórmulas (9.254) y determinan la trans-
formación canónica por medio de la valencia C y la función generatriz U de las variables
independientes (9.255).
Las fórmulas (9.260) relacionan el conjunto de variables independientes (9.255) con
el siguiente conjunto de variables independientes complementarias:
p1 , p2 , ...pr , qr+1 , qr+2 , ...ql , p1 , p2 , ...ps , q s+1 ; q s+2 , ...q l
(9.262)
0 ≤ r ≤ l, 0 ≤ s ≤ l
El jacobiano de las variables p1 , p2 , ...ps , q s+1 , q s+2 , ...q l respecto a las variables
q1 , q2 , ...qr , pr+1 , pr+2 , ...pl es diferente de cero. Ese jacobiano puede escribirse como:
 
∂~ps ∂~ps
!  ∂~qr
~ps , ~q l−s  ∂~pl−r 
J = det   
qr , p~l−r
~ 
 ∂~q l−s ∂~q l−s 
∂~qr ∂~pl−r
 2 
∂ U ∂2U
−
 ∂~qr ∂~q −
 s ∂~pl−r ∂~q s 

= det  

 (9.263)
 ∂2U ∂2U 
∂~qr ∂~pl−s ∂~pl−r ∂~pl−s
donde ~ps es el vector p1 , p2 , ...ps . p~l−r es el vector pr+1 , pr+2 , ...pl , con significado análo-
go para los otros vectores que aparecen en (9.263). En vista de (9.263), las ecuaciones
(9.260) de la primera lı́nea pueden resolverse para expresar a q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl
en función de p1 , p2 , ...pr , qr+1 , qr+2 , ...ql . Después se reemplazan las expresiones obte-
nidas en las l ecuaciones de la segunda lı́nea de (9.260) para obtener las ecuaciones de
la transformación canónica (9.254). Las fórmulas de la transformación canónica inversa
pueden obtenerse de manera análoga mediante una función generatriz que depende de
las variables (9.262) en vez de las variables complementarias igual a (9.255), −C −1 U y
una valencia igual a C −1 .
Queda claro que las transformaciones canónicas libres resultan como casos parti-
culares de la transformación canónica arbitraria, al definir apropiadamente los valores
de r y s.
9.6. La ecuación de Hamilton-Jacobi

En la sección 3.4 hemos discutido la especificación del estado del sistema mediante
las constantes de movimiento. Por simplicidad estamos considerando que el sistema es
integrable y posse por lo tanto un conjunto de 2l constantes de movimiento uniformes.
El objetivo de la descripción clásica es encontrar a las variables de estado en función
del tiempo para cada valor de las constantes de movimiento, considerados como un
conjunto completo de variables dinámicas independientes. Si se quiere pueden tomarse
como constantes de movimiento los 2l valores iniciales de las variables de estado. La
solución estará dada por:
q = ~q(~
~ q0 , p~0 , t) ; p~ = ~p(~q0 , p~0 , t) (9.264)
La ecuación (9.264) puede interpretarse como una transformación canónica de las varia-
bles ~
q0 , p~0 a las variables ~q, p~. En la sección 4.7 vimos que para un sistema conservativo
la acción coincide con el negativo de la función generatriz de la transformación canónica
de evolución temporal (9.264). Veamos que este resultado vale en general. En la sección
9.1 vimos que la diferencia de acción entre dos trayectorias rectas infinitesimalmente
próximas, ∆S, cuyos puntos iniciales y finales están sobre ciertas curvas C1 y C2 res-
pectivamente, del espacio de configuración, está dada por la ecuación (9.11),
l
! l
!
X X
∆S = pν ∆qν − H ∆t − pν ∆qν − H ∆t (9.265)
ν=1 C2 ν=1 C1
Describiendo la transformación canónica (9.264) mediante la función generatriz

(9.135) con C = 1 y tomando a (q, p) como las nuevas variables y a q0 , p0 , como las
viejas variables, obtenemos:
l
! l
!
X X
−∆F = pν ∆qν − H ∆t − pν0 ∆qν0 − H0 ∆t (9.266)
ν=1 ν=1
Si en (9.265) definimos la curva C1 como el conjunto de puntos iniciales simultáneos,

t1 (α) = constante = t0 y dejamos a C2 arbitraria, entonces (9.265) tomará la forma:
l
X l
X
∆S = pν ∆qν − H ∆t − pν0 ∆qν0 (9.267)
ν=1 ν=1
Las expresiones (9.266) y (9.267) coincidirán si la transformación canónica gene-

rada por F , (9.264), satisface:
−∆F − H0 ∆t = ∆S (9.268)
Tomando H0 = 0 obtenemos F = −S. Además como ∂F/∂t = H − H0 se sigue que:
∂S
F = −S ; → +H =0 (9.269)
∂t
El resultado (9.269) fue obtenido por Hamilton (1805-1865) en 1835, quien además
supuso que la transformación canónica (9.264), es libre de primera clase, con lo cual
(9.267) conduce a:
∂S ∂S
pν = ; pν0 = ; ν = 1, 2, ...l (9.270)
∂qν ∂qν0
Las fórmulas (9.270) conducen a la transformación canónica (9.264). 6 S se llama la
función principal de Hamilton (o simplemente acción de Hamilton). Que F = −S, sin em-
Rt
bargo, no da un método para encontrar a F , puesto que para evaluar a S = t0 L(q, q̇, t) dt
se requiere conocer a q(t), q̇(t), o sea haber resuelto el problema, es decir conocer la
“transformación” (9.264). El resultado de Hamilton fue un cı́rculo vicioso: para escribir
a partir de (9.270) las ecuaciones (9.264) se requiere conocer la función principal de
Hamilton, y para evaluar esta función se requiere conocer la solución (9.264). La con-
tribución de Jacobi (1804-1851), en 1837, fue romper este cı́rculo vicioso; mostró que al
resolver la ecuación diferencial que resulta de (9.269), llamada la ecuación de Hamilton-
Jacobi, para obtener una función S mediante las fórmulas (9.270), se obtiene la solución
6 Esuna transformación canónica a unas variables donde el sistema está completamente en equilibrio;
su trayectoria de fases se reduce a un punto.
buscada (9.264).
La ecuación de Hamilton-Jacobi para la función principal de Hamilton.

Tratemos de hallar la transformación canónica libre univalente de primera clase que
transforma las ecuaciones de Hamilton:
∂H ∂H
q̇ν = ; ṗν = − ; ν = 1, 2, ...l (9.271)
∂pν ∂qν
en las ecuaciones de Hamilton:
∂H ∂H
q̇ ν = ; ṗν = − ; ν = 1, 2, ...l (9.272)
∂pν ∂qν
donde H sea idénticamente cero:

H ≡0 (9.273)
Las ecuaciones (9.272) y (9.273) conducen a la solución inmediata:
q ν = βν ; pν = αν ; ν = 1, 2, ...l (9.274)
donde αν y βν son 2l constantes arbitrarias. En virtud de (9.158), las fórmulas de
transformación estarán dadas por:
∂S(q, β, t) ∂S(q, β, t)
= pν ; = −αν ; ν = 1, 2, ...l (9.275)
∂qν ∂βν
En tanto que por (9.159) y (9.273) S necesariamente satisface:
∂S
+H =0 (9.276)
∂t
La ecuación (9.276) junto con (9.275) nos da la siguiente ecuación diferencial en
derivadas parciales para S:
!
∂S(~ ~ t)
q, β, ~ t)
∂S(~q, β,
+ H ~q, (9.277)
∂t ∂~q
~ t)
La ecuación (9.277) se llama la ecuación de Hamilton-Jacobi.7 La solución S(~q, β,
de la ecuación de Hamilton-Jacobi con l constantes arbitrarias β1 , β2 , ...βl se llama la
integral completa de la ecuación de Hamilton-Jacobi si se cumple la condición:
∂2S
det 6= 0 (9.278)
~
∂~q ∂ β
La expresión (9.278) es equivalente a la (9.162) que es la condición necesaria
para que las ecuaciones (9.275) puedan resolverse para expresar a ~q, p~, en la forma
q = ~q(~
~ ~ t); ~
α, β, p = p~(~ ~ t). Lo anterior constituye el teorema de Jacobi cuyo enunciado
α, β,
7 Ya en 1824 el mismo Hamilton halló una ecuación diferencial de esta forma en conexión con la
óptica.
es el siguiente: “si S(~ ~ t) es alguna integral completa de la ecuación de Hamilton-

α, β,
Jacobi (9.277), entonces la solución para las variables de estado ~q y p~ del sistema puede
escribirse en la forma (9.275) para cualquier hamiltoniano H”.8 Según esto, en vez de
integrar directamente las ecuaciones de movimiento (9.271), que nos darán a ~q, p~, con 2l
constantes de integración arbitrarias, el teorema de Jacobi nos permite hacerlo encon-
trando la integral completa de la ecuación de Hamilton-Jacobi. Una integral completa
de la ecuación de Hamilton-Jacobi no es una solución más general de esta ecuación. Pero
en este contexto sólo es importante saber que existe una solución completa.
Hasta aquı́ no hemos impuesto ninguna restricción sobre las constantes αν , βν .
Si las escogemos de tal manera que coincidan con los valores iniciales de pν y qν ob-
tendremos una solución completa que coincide con la acción principal de Hamilton –es
la función generatriz de la transformación inversa de (9.264)–. En este caso S coincide
con el generador de la transformación canónica de evolución hacia atrás en el tiempo,
pero para otra elección de las constantes αν , βν , la solución completa S de la ecua-
ción de Hamilton-Jacobi no admite esta interpretación. En esto se basa el aporte de
Jacobi, quien no sólo rompió el cı́rculo vicioso que mencionamos antes sino que además
mostró que cualquier solución completa de la ecuación (9.277) permite escribir a ~q(~ ~ t)
α, β,
y ~q(~ ~ t) en la forma (9.275) donde las βν son las constantes de integración de la ecua-
α, β,
ción de Hamilton-Jacobi. Hay en efecto, un número infinito de integrales completas de
la ecuación de Hamilton-Jacobi.
Ejemplo 9.6.1 Formar la función principal de Hamilton para el movimiento de una
partı́cula en caı́da libre en presencia de la gravedad.
En este caso (tomando t0 = 0):
1
x = 0, y = 0, z = z0 + ż0 t − gt2 (9.279)
2
Z t
1 1 1
S= mż 2 − mgz dt = m ż02 t − ż0 gt2 + g 2 t3
0 2 2 3

1 2 1 3
−mg z0 t + ż0 t − gt (9.280)
2 6
teniendo en cuenta que E = 1/2 mż02 + mgz0 :
1
S = −Et + mż02 t − mż0 gt2 + mgt3 (9.281)
2
y como:
s !
ż0 2g
t= 1− 1 + 2 (z0 − z) (9.282)
g ż0
podemos escribir a S en la forma:
3/2
mż03 2g
S = −Et − 1 + 2 (z0 − z) (9.283)
3g ż
8 Este enunciado constituye la contribución de Jacobi a este problema y fue publicado en el año 1837.
donde omitimos una constante. La expresión (9.283) también se puede escribir en térmi-
nos de E como:
3/2
m 2
S(z, E, t) = −Et − (E − mgz)3/2 (9.284)
3g m
que coincide con la ecuación (4.190), que fue obtenida integrando la ecuación de Hamilton-
Jacobi.
Otras formas de la ecuación de Hamilton-Jacobi. Si queremos hallar una

transformación canónica libre univalente de segunda, tercera o cuarta clase que haga a
H idénticamente igual a cero, podemos emplear un procedimiento análogo al que nos
condujo a la ecuación (9.277) y también buscar una integral completa de la misma. Una
forma equivalente de hallar esas transformaciones es por medio de las fórmulas (9.217),
(9.218) y (9.219). Además son útiles:
l
X
F2 = F1 + q ν pν
ν=1
(9.285)
l
X
F4 = F3 + q ν pν
ν=1
La ecuación de Hamilton-Jacobi para las diferentes funciones generatrices de las

transformaciones canónicas libres que hacen a H idénticamente cero son:
!
∂F1 (~ ~ t)
q , β, ~ t)
∂F1 (~q, β,
+ H ~q, ,t = 0
∂t ∂~q

∂F2 (~
q, α
~ , t) ∂F2 (~q, α
~ , t)
+ H ~q, ,t = 0
∂t ∂~q
! (9.286)
∂F3 (~ ~ t)
q , β, ∂F3 (~ ~ t)
p, β,
+H − , p~, t =0
∂t ∂~p

∂F4 (~
q, α
~ , t) ∂F4 (~q, α
~ , t)
+H − , p~, t = 0
∂t ∂~p
Vemos que F1 y F2 satisfacen la misma ecuación diferencial, lo cual es consistente
con (9.285), esto es, F1 y F2 difieren por una constante aditiva. Similarmente F3 y F4
satisfacen la misma ecuación. F3 y F4 en la práctica son de poco interés en el método
de Hamilton-Jacobi puesto que las qν entran en la energı́a potencial que es una función
complicada y se hace por ello más difı́cil la separación de variables.
Es posible hallar la ecuación de Hamilton-Jacobi asociado a la transformación
canónica (9.260), lo cual se deja como ejercicio.
Ejemplo 9.6.2 El oscilador armónico lineal. Resolver la ecuación de Hamilton-Jacobi
y con ella hallar la solución a las ecuaciones de movimiento.
El hamiltoniano es:
p2 kq 2
H= + (9.287)
2m 2
La ecuación de Hamilton-Jacobi (9.277) es:
2
∂S(q, β, t) ∂S(q, β, t) kq 2
+ + =0 (9.288)
∂t ∂q 2
Aquı́ podemos buscar una solución separando las variables q y t en la forma:9
S(q, β, t) = −ht + Σ(q, β) (9.289)
donde h es la constante de Jacobi que en este caso coincide con la energı́a total E. Como
el sistema tiene sólo un grado de libertad hay sólo una constante de integración, por
tanto, podemos hacer h = E = β. Σ(q, E) será solución a la ecuación:
2
1 d Σ(q, E) kq 2
+ =E (9.290)
2m dq 2
La ecuación (9.290) puede resolverse directamente:
r
√ Z q 2E
Σ(q, E) = mk − q 2 dq (9.291)
q0 k
No evaluaremos a (9.291) por cuanto el objetivo no es hallar a S sino, mediante

las fórmulas (9.275) encontrar a q y p en función del tiempo:
√ Z qr
2E
S(q, E, t) = Σ(q, E, t) = −Et + mk − q 2 dq (9.292)
q0 k
reemplazando a (9.292) en (9.275) obtenemos:

r
∂S √ 2E
p= = mk − q2 (9.293)
∂q k
√ Z q
∂S 2/k
−α = = −t + mk r (9.294)
∂E q0 2E
2 − q2
k
La ecuación (9.294) se puede integrar directamente, incorporando la constante que

depende de q0 en α para obtener:
!
√ −1 q
−α = −t + mk sen p (9.295)
2E/k
9 En la sección 4.4 encontramos una segunda solución de esta ecuación en la cual las variables no
están separadas. Tal solución está dada por la ecuación (4.143).
La ecuación (9.295) nos da a q en función del tiempo y reemplazándolo en (9.293)

obtenemos a p en función del tiempo:
r
2E
q(E, α, t) = sen ω(t − α)
k (9.296)
√
p(E, α, t) = 2mE cos ω(t − α)
Vemos que, como β y α son cantidades canónicamente conjugadas, la energı́a E y
el tiempo α son un par de cantidades canónicamente conjugadas. E y α no coinciden
con las condiciones iniciales, aunque están relacionadas con ellas:
r r
2E √ k
q0 = − sen ωα ; p0 = 2mE cos ωα ; ω = (9.297)
k m
Ejemplo 9.6.3 Comparar a S con la acción para el oscilador armónico:
Z t Z t
p2 kq 2
L dt = − dt =
t0 t0 2m 2
Z t
E [cos2 ω(t − α) − sen2 ω(t − α)] dt = (9.298)
t0
E E
sen 2ω(t − α) − sen 2ω(t0 − α) (9.299)
2ω 2ω
Omitiendo la constante aditiva podemos escribir:
Z t
E 1
L dt → sen ω(t − α) cos ω(t − α) = mω 2 q 2 cot ω(t − α) (9.300)
t0 ω 2
Evaluando a S en (9.292):
√
S = −Et + mk×
" r #
1 2E 2
2E −1 q
q −q + sen p + constante (9.301)
2 k k 2E/k
reemplazando a (9.296) en (9.301) y omitiendo una constante aditiva:
1√
S = −Et + 2mEq cos ω(t − α) + E(t − α)
2
(9.302)
1
⇒ S → mωq 2 cot ω(t − α)
2
Comparamos (9.300) y la parte final de (9.302) para encontrar el resultado que se
espera: la solución a la ecuación de Hamilton-Jacobi coincide con la integral de acción.
La ecuación de Hamilton-Jacobi independiente del tiempo. Si el sistema

es conservativo generalizado (puede ser esclerónomo, aunque no hay fuerzas disipativas
y H no depende del tiempo explı́citamente) posee una constante de movimiento que es

la constante de Jacobi h, que coincide con la energı́a total cuando además el sistema es
esclerónomo –véase la ecuación (3.99)–. Entonces la ecuación de Hamilton-Jacobi (9.277)
tiene la forma:
!
∂S(~ ~ t)
q , β, ∂S(~ ~ t)
q , β,
+H ~ q, =0 (9.303)
∂t ∂~q
Una solución completa puede escribirse en la forma:10
S(~
q , β1 , β2 , ...βl−1 , h, t) = −ht + Σ(~q, β1 , β2 , ...βl−1 , h) (9.304)
donde β1 , β2 , ...βl−1 son constantes con valores arbitrarios. Reemplazando a (9.304) en

(9.303) y llamando β~l−1 a β1 , β2 , ...βl−1 obtenemos:
!
∂Σ(~ ~l−1 , h)
q, β
H ~ q, =h (9.305)
∂~q
La integral completa de (9.305) satisface (9.278) es decir:

2
∂ Σ
det 6= 0 (βl = h) (9.306)
~
∂~q ∂ β
Conocida la solución de la ecuación de Hamilton-Jacobi independiente del tiempo
(9.305), la condición (9.306) permite obtener a qν y pν en función del tiempo (ν =
1, 2, ...l) a partir de las ecuaciones que corresponden a (9.275):

∂Σ ~ q, β~l−1 , h
= pν ; ν = 1, 2, ...l
∂qν
(9.307)
∂Σ ~ ~
q , βl−1 , h
= −αν ; ν = 1, 2, ...l − 1
∂βν
q , β~l−1 , h)
∂Σ(~
= t − αl (9.308)
∂h
donde αν , βν , h, son constantes arbitrarias.
Usando las segundas l − 1 ecuaciones (9.307) podemos expresar a l − 1 coordenadas
en términos de la restante l-ésima coordenada y de las 2l − 1 constantes arbitrarias
~l−1 , h, α1 , α2 , ...αl−1 , como en la ecuación (9.38). Éstas son las ecuaciones de las
β
trayectorias en el espacio de configuración. La ecuación (9.308) conecta las coordenadas
con la variable temporal t, y equivale a la ecuación (9.40).
Ası́ como la acción principal de Hamilton coincide con una de las integrales com-
pletas de la ecuación de Hamilton-Jacobi dependiente del tiempo, la acción de Lagrange
10 El ejemplo 4.4.2, sección 4.4, ilustra la propiedad general de la ecuación de Hamilton-Jacobi de
poseer soluciones en las cuales las variables t y ~
q no están separadas.
Σ coincide con una de las integrales completas de la ecuación de Hamilton-Jacobi in-

dependiente del tiempo (Véase sección 9.3). La conexión entre la acción principal de
Hamilton S, y la acción reducida, Σ, está dada por la ecuación (9.46). Si tomamos allı́ a
t2 = t y a t1 arbitrario, y omitimos una constante aditiva, vemos que la ecuación (9.46)
coincide con la ecuación (9.304). Como se señalaba en la sección 9.3, la acción reducida
Σ permite determinar las trayectorias en el espacio de configuración, consistentemente
con el principio de mı́nima acción.
S es la función generatriz de la transformación canónica que lleva a unas cantida-
des canónicas que son constantes. Σ es la función generatriz de cierta transformación
canónica que no depende del tiempo, que no coincide con la transformación generada
por S pero que tiene alguna relación con ella, según veremos.
Σ considerada como la función generatriz de una transformación canóni-

ca. Sea una transformación canónica independiente del tiempo que al ser aplicada a un
sistema conservativo generalizado (∂H/∂t = 0) nos lleva a unas nuevas variables canóni-
cas q ν , pν , donde todas las pν sean cı́clicas. Por tanto todos los q ν serán constantes de
movimiento. Llamemos βν a esas constantes. Esta transformación satisface:
∂F1
=0⇒H =H; H = H(q) = constante = h (9.309)
∂t
∂F1 ∂F1
= pν ; = pν ; ν = 1, 2, ...l (9.310)
∂qν ∂qν
F1 , según (9.309) y (9.310), debe ser solución a la ecuación diferencial:

!
q , ~q)
∂F1 (~
H q,
~ =h (9.311)
∂~q
Si llamamos βl = h, (9.309) y (9.310) se pueden escribir como:

!
q , β~l−1 , h)
∂F1 (~
H q,
~ =h (9.312)
∂~q
∂F1 (~ ~l−1 , h)
q, β
= p~
∂~q
∂F1 (~ ~l−1 , h)
q, β
= −~pl−1 (9.313)
~l−1
∂β
∂F1 (~ ~l−1 , h)
q, β
= −~
pl
∂h
Las ecuaciones de Hamilton y sus soluciones para las variables pν y qν son:

~
~q˙ = ∂H(q) = 0 ⇒ ~q = constante = β
~
∂~p
~
~p˙ = − ∂H(q ) = − ∂βl (9.314)
~
∂p ~
∂β
⇒ ~pl−1 = constante = α
~ l−1 ; pl = −t + αl
Las ecuaciones (9.312) y (9.313) junto con las (9.314) quedan ası́:
∂F1 (~ ~l−1 , h)
q, β
= pν ; ν = 1, 2, ...l
∂~qν
∂F1 (~ ~l−1 , h)
q, β
= −αν ; α = 1, 2, ...l − 1 (9.315)
∂βν
∂F1 (~ ~l−1 , h)
q, β
= t − αl
∂h
Comparando (9.312) con (9.305) y a (9.315) con (9.307), vemos que la función
generatriz de la transformación buscada, F1 (q, q), coincide con la función Σ.
Σ puede considerarse como la función generatriz de una transformación canónica
libre univalente de primera clase que al ser aplicada a un sistema conservativo genera-
lizado nos conduce a unas variables canónicas (q, p) donde todas las q ν son constantes,
lo mismo que l − 1 pν . Una de las constantes q ν coincide con h y el l-ésimo pν es una
función lineal del tiempo, pl = −t + αl . Si esta transformación se aplica a un sistema
para el cual ∂H/∂t 6= 0, es claro que las nuevas variables canónicas ya no tendrán las
caracterı́sticas señaladas.
No es drástica la exigencia βl = h. Podrı́amos haber dejado a h = H(β), ~ lo cual
nos conducirı́a a que todos los q ν son constantes y todos los pν son funciones lineales
del tiempo.
Tratamiento cuando H(q, p) tiene coordenadas cı́clicas. Si el sistema es con-

servativo generalizado y además hay l − r coordenadas cı́clicas, entonces H = H(q1 , q2 ,
...qr , p1 , p2 , ...pl ). Los momentos pr+1 , pr+2 , ...pl , conjugados a las coordenadas cı́clicas
serán constantes de movimiento. La solución completa de la ecuación de Hamilton-Jacobi
l
X
S = −ht + βν qν + Σ0 (q1 , q2 , ...qr , β1 , β2 , ...βl , h) (9.316)
ν=r+1
donde la función Σ0 es solución a la ecuación diferencial:

∂Σ0 ∂Σ0 ∂Σ0
H q1 , q2 , ...qr , , , ... , βr+1 , βr+2 , ...βl = h (9.317)
∂q1 ∂q2 ∂qr
en la cual hemos tomado los momentos constantes coincidiendo con l − r constantes βν .
9.7. Las transformaciones canónicas infinitesimales

Ecuaciones de transformación. Las transformaciones canónicas infinitesimales
(T.C.I.) son las transformaciones canónicas en las que (p, q) difieren infinitesimalmente
de (p, q):
q ν = qν + δqν ; pν = pν + δpν ; ν = 1, 2, ...l (9.318)
aquı́ δ no denota desplazamientos virtuales sino simplemente los cambios infinitesimales

en las coordenadas y momentos en la T.C.I. La T.C.I. (9.318) difiere infinitesimalmen-
te de la transformación identidad. Si la transformación infinitesimal sólo depende de un
parámetro ε, podemos decir que la función generatriz de la T.C.I. serı́a igual a la función
generatriz de la transformación identidad más un término del orden de ε. La transfor-
mación identidad es univalente libre de tercera y de segunda clase, según las ecuaciones
(9.184) a (9.188). La función generatriz de la T.C.I. (9.318) será pues:
l
X
F2 (q, pν , t) = pν qν + ε G(q, p, t) (9.319)
ν=1
Si la T.C.I. posee m parámetros infinitesimales, F2 será:

l
X m
X
F2 = pν qν + εj Gj (9.320)
ν=1 j=1
Es decir, las T.C.I. son las que se obtienen a partir de la identidad variando de
manera continua uno o varios parámetros.
Los Gj se llaman los generadores infinitesimales de la T.C.I., en términos de los
cuales se pueden expresar las fórmulas (9.135). Una transformación canónica del tipo F2
satisface:
∂F2 ∂F2 ∂F2
pν = ; qν = ; ν = 1, 2, ...l ; H − H = (9.321)
∂qν ∂pν ∂t
Entonces para la T.C.I. con función generatriz (9.319) tenemos:
∂G ∂G
δpν = −ε ; δqν = ε ; ν = 1, 2, ...l
∂qν ∂pν
(9.322)
∂G
H =H +ε
∂t
donde en (9.322) hemos notado que ε f (q, p, t) = εf (q, p, t) al primer orden en ε.
La T.C.I. de evolución temporal. Sabemos que la evolución temporal puede

considerarse como una transformación canónica. Queremos hallar el generador de la
T.C.I. de evolución temporal.
qν (t); pν (t) → q ν (t) = qν (t + τ )pν (t) = pν (t + τ ) ; ν = 1, 2, ...l (9.323)

donde tomamos a τ infinitesimal. De acuerdo con (9.269), la función generatriz de la

transformación canónica de evolución temporal entre t0 y t es −S,
Z t
e.t.
F1 = − L dt (9.324)
t0
O sea que para la transformación (9.323) con τ infinitesimal, la función generatriz

es:
Z l
!
t+τ X
F1e.t. = − L dt ≈ −Lτ = − pν q̇ν − H τ
t ν=1
l
X
= − pν q̇ν τ + Hτ (9.325)
ν=1
Por otra parte, q̇ν = (q ν − qν )/τ → q̇ν τ = q ν − qν , o sea que:

l
X
F1e.t. ≈ − (pν qν − pν q ν ) + Hτ (9.326)
ν=1
De acuerdo con (9.217), (9.218), (9.187) y (9.188) vemos que:

l
X l
X
F1id. = F2id. + (pν qν + pν q ν ) = (−q ν pν + pν qν + pν q ν ) (9.327)
ν=1 ν=1
donde F2id. es la función generatriz de la T.C. identidad y F1e.t. se refiere a la evolución

temporal. Comparando (9.326) y (9.327) obtenemos:
l
X
F1e.t. = F2id. − pν q ν + Hτ (9.328)
ν=1
Comparando (9.328) con (9.218) obtenemos:

l
X
F1e.t. = F2id. + Hτ = pν qν + Hτ (9.329)
ν=1
Si comparamos a (9.329) con (9.319) vemos que en este caso τ hace el papel del
parámetro infinitesimal ε y H es el generador infinitesimal de la T.C.I. de evolución
temporal. Al mismo resultado llegamos de la siguiente manera, notemos que:
q ν = qν + τ q̇ν ⇒ δqν = τ q̇ν = dqν (9.330)
∂H
pν = pν + τ ṗν ⇒ δpν = τ ṗν = dpν ; H = H + τ (9.331)
∂t
Comparando a (9.322) con (9.330) obtenemos:
∂G ∂G ∂G ∂H
ε = τ q̇ν ; −ε = τ ṗν ; ε =τ (9.332)
∂pν ∂qν ∂t ∂t
De las ecuaciones de Hamilton obtenemos para (9.332):

∂G ∂H ∂G ∂H ∂
ε =τ ; −ε = −τ ⇒ (εG − τ H) = 0
∂pν ∂pν ∂qν ∂qν ∂pν
(9.333)
∂ ∂
(εG − τ H) = 0 ; ν = 1, 2, ...l ; (εG − τ H) = 0
∂qν ∂t
Las ecuaciones (9.333) nos dicen que εG = τ H. En efecto, podemos tomar τ como
ε y a H como el generador de la T.C.I.
El movimiento finito del sistema puede considerarse como una sucesión de T.C.I.
Si H es constante, el generador de la T.C.I. de evolución temporal es el mismo para
cada una de las transformaciones en tal sucesión. Si H depende de t, H es G para la
evolución de t a t + τ y H + (∂H/∂t)τ es G para la evolución de t + τ a t + 2τ , etc. En
el lı́mite τ → 0, la evolución finita es el desarrollo continuo de una T.C. En este caso el
generador de la T.C.I. es H. En general, el generador de cualquier T.C.I. es una variable
dinámica del sistema.
La T.C.I. de translación espacial. Esta transformación involucra tres paráme-

tros infinitesimales. Supongamos que el sistema es libre, de modo que las coordenadas
cartesianas son a la vez coordenadas generalizadas independientes. La transformación
es:
xi = xi + εx ; y i = yi + εy ; z i = zi + εz ; i = 1, 2, ...N (9.334)
Además, como para este sistema p~i = mi~r˙ i , se tiene que:

~pi = p~i ; i = 1, 2, ...N (9.335)
En este caso δxi = εx , δyi = εy , δzi = εz , δ~
pi = 0; i = 1, 2, ...N . Entonces las ecuaciones
(9.322) toman la forma:
∂ ~ = ~ε ; ∂ ~ = 0;
(~ε · G) (~ε · G) i = 1, 2, ...N (9.336)
∂~
pi ∂~ri
donde nos basamos en (9.320) con m = 3 y formamos los εj con el vector ~ε y con los Gj
~ De (9.336) se sigue que G
el vector G. ~ tiene la expresión:
n
X
~ =
G pi = P~
~ (9.337)
i=1
Vemos que el momento total del sistema P~ es el generador infinitesimal de la trans-

formación canónica de translación espacial. Más exactamente, en la translación por una
cantidad ε a lo largo del vector unitario ~n, entonces ~ε = ε~n y el generador infinitesimal
~ = Pn . El generador infinitesimal de translaciones a lo largo de la dirección
será ~n · G
~n es la componente del momento total en esa dirección, Pn . El hecho de que se emplee
(9.335) no implica que P~ o Pn sea constante en el tiempo. Veremos que P~ es constante
sólo si H no depende de la coordenada de posición del centro de masa.
ri
ε
r
θi
x
Figura 9.7 Rotación de las partı́culas alrededor del eje z
La T.C.I. de rotación espacial. Suponemos también qué sistema es libre. Por

simplicidad consideremos una rotación de todas las partı́culas alrededor del eje z (véase
figura 9.7).
xi = ri cos(θi + ε)
yi = ri sen(θi + ε) (9.338)
zi = zi ; i = 1, 2, ...N
y similarmente para las componentes de P~i . Al primer orden en ε, las ecuaciones (9.338)
y sus similares para p~i nos dan:
xi = xi − εyi ; yi = yi + εxi ; z i = zi
(9.339)
pxi = pxi − εpyi ; pyi = pyi + εpxi ; pzi = pzi ; i = 1, 2, ...N
Comparando (9.339) con (9.322) hallamos:
∂G ∂G ∂G
−εyi = δxi = ε ; εxi = δyi = ε ; 0 = δzi = ε
∂pxi ∂pyi ∂pzi
∂G
−εpyi = δpxi = −ε (9.340)
∂pxi
∂G ∂G
εpxi = δpyi = −ε ; 0 = δpzi = −ε
∂yi ∂zi
vemos que G no depende de zi ni de pzi . (9.340) se satisfacen si:
N
X
G= (xi pyi − yi pxi ) = Lz (9.341)
i=1
O sea que Lz es el generador infinitesimal de una rotación del sistema alrededor

del eje z, donde Lz es la componente z del momento angular total del sistema.
Vemos que:
N
X N
X
Lz = (xi pyi − y i pxi ) = (xi pyi − yi pxi ) + 0 (ε2 ) (9.342)
i=1 i=1
O sea que, como debe ser, Lz = Lz . Veremos que Lz será constante en el tiempo
sólo si H no depende de la coordenada φ del vector de posición del centro de masa.
9.8. Los corchetes de Poisson

En el numeral anterior vimos que los generadores infinitesimales H, Pn y Lz corres-
ponden a cantidades con claro significado fı́sico. Aquı́ consideraremos algunas propieda-
des de las funciones del estado del sistema que hemos definido como variables dinámicas
(véase sección 3.4).
Las variables dinámicas. Definimos una variable dinámica como una función del
estado del sistema y del tiempo que no cambia su valor en una transformación canónica.
Ası́ que bajo una transformación canónica (q, p) → (q, p), f será una variable dinámica
si se cumple:
f (q, p, t) = f [q(q, p, t), p(q, p, t)] = f (q, p, t) (9.343)
De acuerdo con esta definición, como en una transformación canónica:

∂F
H(q, p, t) = H(q, p, t) + (9.344)
∂t
se sigue que el hamiltoniano no es una variable dinámica cuando se consideran transfor-
maciones canónicas que dependen del tiempo. Ası́ por ejemplo, para un sistema conser-
vativo H = E, igual a la energı́a total, en tanto que por medio de una transformación
canónica dependiente del tiempo podemos hacer H = 0. Tenemos en general que el
generador de una T.C.I. es una variable dinámica, como L ~ o p~. Ası́ también, la energı́a
cinética es una variable dinámica. En esta definición de variables dinámicas está implı́ci-
ta la idea de las transformaciones canónicas desde un punto de vista pasivo.
Formas “activa” y “pasiva” de una transformación canónica. En la sección

7.7 vimos que las rotaciones de un cuerpo rı́gido admiten las interpretaciones “activa”
y “pasiva”. Análogamente esas consideraciones se pueden hacer a las transformaciones
en el espacio de fases.
En la interpretación “pasiva”, una transformación canónica es una regla de co-
rrespondencia que asocia a cada punto del espacio de fases (q, p) un punto del espacio
de fases (q, p), tal que las ecuaciones de movimiento toman la misma forma en los dos
espacios. Es una aplicación de un espacio en otro espacio. Una variable dinámica es una
función del estado del sistema, considerado como algo intrı́nseco o sea independiente del
espacio de fases que se use para describirlo. Ası́, si el estado del sistema en un tiempo
dado se describe por el punto A(q, p) en un espacio de fases y por el punto A(q, p) en
otro espacio de fases, una variable dinámica tiene el mismo valor en A que en A.
Por otra parte, hay transformaciones canónicas que admiten una interpretación
activa. Son aquellas transformaciones canónicas del espacio de fases en sı́ mismo; o sea
aquellas en que se tiene una aplicación del espacio de fases sobre sı́ mismo. Ası́, la trans-
formación canónica de evolución temporal asocia al estado del sistema en el tiempo t0 ,
(q0 , p0 ) el estado en el tiempo t, (q, p); la transformación canónica de translación espacial
asocia a la posición del sistema (~r1 , ~r2 , ...~rN ) una posición en la cual todas las partı́culas
se han desplazado una distancia ~ ε: (~r1 + ~ε, ~r2 + ~ε, ...~rN + ~ε); la transformación canónica
de rotación espacial es la misma estudiada en el capı́tulo 7. Son susceptibles de una in-
terpretación “activa” todas aquellas transformaciones canónicas que se pueden obtener
a partir de la transformación identidad por medio de la variación continua de uno o
varios parámetros. Ası́ por ejemplo, la inversión de las coordenadas, o la transformación
canónica que intercambia coordenadas y momentos, no son susceptibles de una interpre-
tación activa. Tampoco mediante una variación continua de parámetros podemos llegar
de las coordenadas cartesianas a las coordenadas esféricas, por ejemplo.
Toda T.C.I. es pues susceptible de ser tratada en las formas pasiva (el sistema
descrito desde diferentes espacios de fases) o activa (el sistema es cambiado de un estado
a otro). En (9.318) es entonces válido tomar desplazamientos del tipo ∆.
Cambio de una variable dinámica en una T.C.I. En la interpretación “pa-

siva” no tiene sentido preguntarse por el “cambio de una variable dinámica f bajo una
transformación canónica”, pues de acuerdo con (9.343) no hay tal cambio. En la inter-
pretación “activa”, si tiene sentido preguntarse cómo cambia el valor de f al pasar el
sistema de un estado A(q, p) a un estado B(q, p). Usaremos el sı́mbolo ∂ para denotar
tal cambio:
∂f (q, p, t) = f (q, p, t) − f (q, p, t) (9.345)
Para ser más precisos, en la interpretación “pasiva” podemos preguntarnos por el

cambio en la forma funcional de la variable dinámica al ser descrita desde dos espacios
de fases diferentes, lo cual es mucho más difı́cil de visualizar. Este cambio de forma
funcional está definido por:
f (q, p, t) − f (q, p, t) (9.346)
de acuerdo con la notación (9.343). Usando (9.343) podemos escribir a (9.346) como:
f (q, p, t) − f (q, p, t) = −∂f (9.347)
∂f = −∂f (9.348)
Los dos cambios (9.345) y (9.346) son iguales, o sea que ∂f puede significar el
cambio del valor de f al pasar el sistema del estado (q, p, t) al estado (q, p, t) o el cambio
funcional de la función f en el mismo estado, en la interpretación “pasiva”. La T.C.I. es
(9.318) y expresada en términos de generadores es (9.322). Con la interpretación “activa”

∂f es:
∂f = f (q + δq, p + δp, t) − f (q, p, t)

X l
∂f (q, p, t) ∂f (q, p, t)
= δqν + δpν
ν=1
∂qν ∂pν
Xm X l
∂f (q, p, t) ∂Gj (q, p, t) ∂f (q, p, t) ∂Gj (q, p, t)
= εj − εj
j=1 ν=1
∂qν ∂pν ∂pν ∂qν
m
X
= εj [f (q, p, t), Gj (q, p, t)] (9.349)
j=1
donde hemos definido el corchete de Poisson de dos variables dinámicas g(q, p, t) y

h(q, p, t) como:
Xl
∂g ∂h ∂g ∂h
[g, h] = − (9.350)
ν=1
Vemos que el corchete de Poisson de dos variables dinámicas a su vez es una variable
dinámica. En sı́ntesis:
f (q, p, t) − f (q, p, t) = f (q, p, t) − f (q, p, t)

 
Xm
= f (q, p, t), εj Gj (q, p, t) (9.351)
j=1
Si la T.C.I. es la evolución temporal, tenemos que ε = τ y G = H. En este caso:

l
∂f X ∂f ∂f
f˙ = + q̇ν + ṗν
∂t ν=1 ∂qν ∂pν
l
∂f X ∂f ∂H ∂f ∂H (9.352)
= + −
∂t ν=1 ∂qν ∂pν ∂pν ∂qν
∂f
⇒ f˙ = + [f, H]
∂t
Si la variable dinámica f no depende explı́citamente del tiempo, su rata de cambio
es igual a su corchete de Poisson con H. Si f es una constante de movimiento, el corchete
de Poisson de f con H es igual al negativo de su derivada parcial respecto al tiempo; si f
no depende explı́citamente del tiempo será una constante de movimiento si su corchete
de Poisson con H es cero.
Simetrı́a y leyes de conservación. Sabemos que la simetrı́a dinámica de un

sistema se expresa mediante las simetrı́as de las funciones L o H.
Sea una T.C.I. y sea G el generador de la misma; G es una variable dinámica.

Entonces es correcto expresar el siguiente teorema: G es una constante de movimiento
si H es invariante bajo la transformación generada por G.
Recordemos que H no es en general una variable dinámica. Por esta razón al realizar
la T.C.I. generada por G el cambio en H no está dado por (9.349). H es simplemente una
función que en un espacio de fases dado define las ecuaciones canónicas de movimiento.
Por esta razón, cuando la transformación canónica depende del tiempo, no se cumple
que H(q, p, t) = H(q, p, t). Denotemos por ∂H a la siguiente diferencia. Ver ecuación
(9.346):
∂H = H(q, p, t) − H(q, p, t) (9.353)
H(q, p, t) y H(q, p, t), de acuerdo con (9.344) y (9.319) están relacionadas por:
∂G
H(q, p, t) − H(q, p, t) = ε (9.354)
∂t
reemplazando a (9.354) en (9.353) tenemos:
∂G
∂H = H(q, p, t) − H(q, p, t) + ε (9.355)
∂t
Ahora sı́ podemos usar la ecuación (9.351) para H:
H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)] (9.356)

La diferencia entre H y H es del orden de ε, luego, al primer orden en ε (9.356)
toma la forma:
H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)] (9.357)
Ahora, reemplazamos a (9.357) en (9.355) para obtener:

∂G ∂G
∂H = −ε [H, G] + ε =ε + [G, H] (9.358)
∂t ∂t
De (9.352) vemos entonces que:
∂H = ε Ġ (9.359)
La ecuación (9.359) nos permite inmediatamente obtener el enunciado del teorema:

G es una constante de movimiento si y sólo si es el generador de una transformación
canónica infinitesimal que no cambia la forma funcional del hamiltoniano.
Ası́ pues, si H no cambia al desplazar el sistema a lo largo de una dirección ~n, P~ .~n
es una constante de movimiento y si H no cambia al rotar el sistema alrededor del eje
~ n es una constante de movimiento. P~ es el momento lineal total y L
~n entonces L.~ ~ es el
momento angular. Este resultado ya lo habı́amos obtenido en unos casos particulares en
la sección 3.4.
Como según este teorema las constantes de movimiento han de ser los generadores
de T.C.I. que dejan invariante a H, se sigue que hallando todas las transformaciones de
simetrı́a de H podemos encontrar todas las constantes de movimiento.
Por otra parte si se conocen 2l constantes de movimiento del sistema se tendrá re-
suelto el problema mecánico, si esas 2l constantes son independientes. En efecto, el
método de Hamilton-Jacobi permite mediante una transformación canónica expresar las
coordenadas y momentos del sistema en términos de las constantes de movimiento y del
tiempo. En el capı́tulo 11 se muestra que el resultado falla si el sistema es no integrable.
La conservación del momento que vimos en el capı́tulo 3 se sigue de este teorema. Si
qν0 es cı́clica, H no depende de ella y por tanto es invariante en una T.C.I. que implique
el cambio de qν0 , y el generador infinitesimal de esta transformación habrá de ser una
constante de movimiento. Las ecuaciones de tal transformación canónica serán:
δqν = ε δνν0 ; δpν = 0 ; ν = 1, 2, ...l (9.360)
por otra parte se tiene que:
∂G ∂G
δqν = ε ; δpν = −ε ; ν = 1, 2, ...l (9.361)
∂pν ∂qν
Se sigue de (9.360) y (9.361) que:
G = pν0 (9.362)
O sea que el generador es precisamente el momento canónico conjugado de la coor-

denada cı́clica qν0 . En general, un cambio en cualquier variable canónica del sistema,
qν o pν , es generado por su variable canónicamente conjugada, pν o −qν , respectivamente.
Las ecuaciones de movimiento en términos de los corchetes de Poisson.

Si en la ecuación (9.352) reemplazamos a f por qν y por pν obtenemos:
q̇ν = [qν , H] ; ṗν = [qν , H] ; ν = 1, 2, ...l (9.363)
o también, usando las ecuaciones de Hamilton:
∂H ∂H
= [qν , H] ; = −[pν , H] ; ν = 1, 2, ...l (9.364)
∂pν ∂pν
Las expresiones (9.363) son las ecuaciones de movimiento de Poisson, totalmente equi-
valentes a las ecuaciones de movimiento de Hamilton. Las ecuaciones (9.364) no son más
que el resultado de aplicar el párrafo que sigue a la ecuación (9.362), conjuntamente con
(9.351).
Ejemplo 9.8.1 Hallar las ecuaciones de movimiento de Poisson para una partı́cula car-
gada en presencia de un campo electromagnético externo.
Usamos la ecuación (3.117) para h conjuntamente con la ecuación (4.1) para ~r˙ en
función del momento canónico p~:
1 e ~ 2
H= p~ − A + eφ (9.365)
2m c
donde A ~ y φ son los potenciales vectorial y escalar del campo externo. Evaluemos los
corchetes de Poisson de ~r con H y de p~ con H para mostrar la consistencia con las
fórmulas (9.363):
∂rn ∂H ∂rn ∂H
[rn , H] = · − ·
∂~r ∂~ p ∂~p ∂~r
e~
∂H p~ − A
= ~n · = ~n · c ; ~n = ~i, ~j, ~k (9.366)
∂~p m
Por otra parte:
∂pn ∂H ∂pn ∂H ∂H ∂H
[pn , H] = · − · = −~n · =−
∂~r ∂~ p ∂~p ∂~r ∂~r ∂rn
e e ~ ∂A ~ ∂φ
= p~ − A · −e (9.367)
mc c ∂rn ∂rn
La ecuación (9.367) también puede escribirse ası́:
[pn , H] =
~
e ˙ ∂A ∂φ e ∂ ˙ ~ ∂An
~r · −e = (~r · A) − Ȧn + + (9.368)
c ∂rn ∂rn c ∂rn ∂t
e e ∂An ∂φ
Ȧn − −e
c c ∂t ∂rn
~ y E se pueden expresar en términos de A
Notamos que B ~ y φ ası́:
~
~ = − ∂φ − 1 ∂ A ;
E ~ = ∂ ×A
B ~ (9.369)
∂~r c ∂t ∂~r
Notemos que:

∂ ∂Aµ
~r˙ × ~
×A = ǫnms ǫstµ ṙm
∂~r n ∂rt
∂Aµ
= (δnt δmµ − δnµ δmt ) ṙm (9.370)
∂rt
∂A~ ∂Aµ
= ~r˙ · − ~r˙ ·
∂rn ∂~r
y,
∂An ˙ ∂An
Ȧn = + ~r · (9.371)
∂t ∂~r
con lo cual:
∂ ~
~r˙ × ~ = ~r˙ · ∂ A + ∂An − Ȧn = ∂ (~r˙ · A)
×A ~ + ∂An − Ȧn (9.372)
∂~r ∂rn ∂t ∂rn ∂t
remplazando (9.372) en (9.369) obtenemos:

e ˙ ∂ ~ e ∂φ 1 ∂An
[pn , H] = ~r × ×A + Ȧn − e +
c ∂~r n c ∂rn c ∂t
(9.373)
e ˙ ~ e
= (~r × B)n + eEn Ȧn + Ȧn
c c
pero, según la expresión para la fuerza de Lorentz:
e
mr̈n = (~r˙ × B)~ n + eEn (9.374)
c
Usando (9.374), (9.373) queda como:
e d e
[pn , H] = mr̈n + Ȧn = mṙn + An = ṗn (9.375)
c dt c
en concordancia con (9.363). También de (9.366) se sigue que:
[rn , H] = ṙn (9.376)
El corchete de Poisson de dos componentes del momento cinemático es:
∂pci ∂pcj ∂pci ∂pcj
[pci , pcj ] = · − · (9.377)
∂~r ∂~p ∂~p ∂~r
~
pero p~c = p~ − (e/c) A, por tanto:

e ∂Ai e ∂Aj
[pci , pcj ] = − · ~nj − ~ni ·
c ∂~r c ∂~r
(9.378)
e ∂Aj ∂Ai e ∂ ~
= − = ǫijk ×A
c ∂ri ∂rj c ∂~r k
de donde:
e
[pci , pcj ] = ǫijk Bk (9.379)
c
Esto último también puede escribirse como:
e
[ṙi , ṙj ] = 2 ǫijk Bk (9.380)
m c
O sea que el corchete de Poisson de ẋ con ẏ es cero sólo si Bz se anula.
Algunas propiedades de los corchetes de Poisson. Para cualesquiera tres

funciones f (q, p, t), g(q, p, t) y h(q, p, t), se cumple:
(i) [f, g] = −[g, f ]
(ii) [cf, g] = [f, cg] = c[f, g] ; c : constante
(iii) [f + g, h] = [f, h] + [g, h]

(9.381)
(iv) [f g, h] = f [g, f ] + g[f, h]

∂ ∂f ∂g
(v) [f, h] = , g + f,
∂t ∂t ∂t
Estas propiedades se siguen directamente de la definición de los corchetes de Pois-

son, ecuación (9.350).
La identidad de Jacobi. Para cualesquiera tres funciones f , g y h se cumple:

[f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 0 (9.382)
esta relación se llama la identidad de Jacobi. Para demostrarla es útil la siguiente inter-
pretación del corchete de Poisson:
Xl
∂g ∂ ∂g ∂
[g, φ] = − φ = D̂g φ (9.383)
ν=1
donde D̂g es un operador diferencial lineal en el espacio de fases.

Con esta notación podemos escribir el siguiente conmutador:

D̂g D̂h − D̂h D̂g f = [g, [h, f ]] − [h, [g, f ]]
(9.384)
= [g, [h, f ]] + [h, [f, g]]
La expresión (9.384) sólo contiene derivadas primeras respecto a pν y qν de la
función f . En efecto:
2l
X ∂
D̂g = gi ; xν = qν ; xν+l = pν ; ν = 1, 2, ...l (9.385)
i=1
∂xi
por tanto, tenemos que:

D̂g D̂h − D̂h D̂g f
X2l X2l
∂ ∂ ∂ ∂
= gi hj − hi gj f
∂xi ∂xj ∂xi ∂xj
i=1 j=1
2l X2l
"
X ∂2 ∂hj ∂ ∂2
= g i hj + gi − hi g j
i=1 j=1
∂xi ∂xj ∂xi ∂xj ∂xi ∂xj
#
∂gj ∂
− hi f
∂xi ∂xj
X2l X2l
∂hj ∂gj ∂f
= gi − hi (9.386)
i=1 j=1
∂xi ∂xi ∂xj
Por otra parte tenemos que:

2l
X
∂g
[f, [g, h]] = [[h, g], f ] = [D̂h g, f ] = hi ,f
i=1
∂xi
(9.387)
X2l Xl
∂ ∂g ∂f ∂ ∂g ∂f
= hi − hi
i=1 ν=1
∂qν ∂xi ∂pν ∂pν ∂xi ∂qν
La ecuación (9.386) se puede escribir como:
"
X2l Xl
∂hν ∂gν ∂f
D̂g D̂h − D̂h D̂g f= gi − hi
i=1 ν=1
∂xi ∂xi ∂qν
# (9.388)

∂hl+ν ∂gl+ν ∂f
+ gi − hi
∂xi ∂xi ∂pν
Sumando (9.387) y (9.388) obtenemos:
[f, [g, h]] + [g, [h, f ]] + [h, [f, g]] =
X2l Xl
∂hν ∂gν ∂ ∂g ∂f
gi − hi − hi
i=1 ν=1
∂xi ∂xi ∂p ν ∂xi ∂qν (9.389)
X2l Xl
∂hl+ν ∂gl+ν ∂ ∂g ∂f
+ gi − hi + hi
i=1 ν=1
∂xi ∂xi ∂qν ∂xi ∂pν
De (9.383) y (9.385) se sigue que:
∂g ∂g
gν = − ; gl+ν = ; ν = 1, 2, ...l (9.390)
∂pν ∂qν
Por tanto:

∂hν ∂gν ∂ ∂g
gµ − hµ − hµ
∂qµ ∂qµ ∂pν ∂qµ
∂g ∂ 2 h ∂h ∂ 2 g
= −
∂pµ ∂qµ ∂pν ∂pµ ∂qµ ∂pν
(9.391)
∂ 2 h ∂g ∂h ∂ 2 g
+ +
∂pν ∂pµ ∂qµ ∂pµ ∂pν ∂qµ
∂g ∂ 2 h ∂g ∂ 2 h
= +
∂pµ ∂qµ ∂pν ∂qµ ∂pµ ∂qν
Similarmente hallamos que:

∂hν ∂gν ∂ ∂g
gl+µ − hl+µ − hl+µ =
∂qµ ∂pµ ∂pν ∂pµ
∂g ∂ 2 h ∂g ∂ 2 h
− −
∂qµ ∂pµ ∂pν ∂pµ ∂pν ∂qµ

∂hl+ν ∂gl+ν ∂ ∂g
gµ − hµ + hµ =
∂qµ ∂qµ ∂qν ∂qµ
(9.392)
∂g ∂ 2 h ∂g ∂ 2 h
− −
∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ

∂hl+ν ∂gl+ν ∂ ∂g
gl+µ − hl+µ + hl+µ =
∂pµ ∂pµ ∂qν ∂pµ
∂g ∂ 2 h ∂g ∂ 2 h
+
∂qµ ∂pµ ∂qν ∂pµ ∂qν ∂qµ
Reemplazando (9.391)y (9.392) en (9.389) obtenemos:
[f, [g, h]] + [g, [h, f ]] + [h, [f, g]] =
l
X ∂g ∂ 2 h ∂g ∂ 2 h
+
µ,ν=1
∂pν ∂qµ ∂pν ∂qµ ∂pµ ∂pν
!
∂g ∂ 2 h ∂g ∂ 2 h ∂f
− − (9.393)
∂qµ ∂pµ ∂pν ∂pµ ∂pµ ∂qν ∂qν
l
X ∂g ∂ 2 h ∂g ∂ 2 h
+ − −
µ,ν=1
∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ
!
∂g ∂ 2 h ∂g ∂ 2 h ∂f
+ +
∂qµ ∂pµ ∂qν ∂pν ∂qν ∂qµ ∂pν
La ecuación (9.393) es idénticamente cero, lo cual prueba la identidad de Jacobi.
Invariancia de los corchetes de Poisson bajo T.C.I. Se trata de mostrar que:
[f (q, p, t), g(q, p, t)] = [f (q, p, t), g(q, p, t)] (9.394)
De la definición (9.343) se sigue que:
Xl
∂f ∂f ∂f ∂qµ ∂f ∂pµ
= = + (9.395)
∂q ∂q ν µ=1
∂qµ ∂qν ∂pµ ∂q ν
De (9.318) y (9.322) se sigue:
∂qµ ∂2G ∂pµ ∂2G

= δµν − ǫ ; =ǫ (9.396)
∂q ν ∂qν ∂pµ ∂q ν ∂qν ∂qµ
Por tanto, se cumple:

∂f ∂f ∂G ∂f ∂ ∂f
= +ǫ ,f = +ǫ [G, f ] − ǫ G, (9.397)
∂qν ∂qν ∂qν ∂qν ∂qν ∂qν
donde la última igualdad se sigue de (9.381-v). De (9.318) y (9.322) se sigue:
∂pµ ∂2G ∂qµ ∂2G

= δµν + ǫ ; = −ǫ (9.398)
∂pν ∂pν ∂qµ ∂pν ∂pν ∂pµ
y análogamente se llega a:

∂f ∂f ∂ ∂f
= +ǫ [G, f ] − ǫ G, (9.399)
∂pν ∂pν ∂pν ∂pν
Reemplazando (9.397) y (9.399) y expresiones análogas para g, en (9.394):
l
"
X ∂f ∂[G, f ] ∂f
f, g (q,p)
= +ǫ − ǫ G, ·
ν=1
∂qν ∂pν ∂qν

∂g ∂[G, g] ∂g
+ǫ − ǫ G, +
∂pν ∂pν ∂pν
(9.400)
∂f ∂[G, f ] ∂f
+ǫ − ǫ G, ·
∂pν ∂pν ∂pν
#
∂g ∂[G, g] ∂g
+ǫ − ǫ G,
∂qν ∂qν ∂qν
Al primer orden en ε podemos escribir:
Xl
∂[G, f ] ∂g
f, g (q,p)
= [f, g](q,p) + ε
ν=1
∂qν ∂pν

∂f ∂g ∂f ∂[G, g]
− G, +
∂qν ∂pν ∂qν ∂pν

∂f ∂g ∂[G, g] ∂f ∂g ∂f
− G, − + G,
∂qν ∂pν ∂qν ∂pν ∂qν ∂pν
(9.401)

∂g ∂[G, f ] ∂g ∂f
− + G, =
[f, g](q,p) + ǫ ([[G, f ], g] + [f, [G, g]])
Xl
∂g ∂f ∂g ∂f
+ǫ ,G − ,G
ν=1
∂pν ∂qν ∂qν ∂pν
En la última igualdad se ha hecho uso de la propiedad (9.381-iv). Ahora los últimos

términos en (9.401) dan [[f, g], G], con lo cual el término del orden de ε es cero con base
en la identidad de Jacobi, por tanto:
[f , g](q,p) = [f, g]q,p (9.402)
Llegamos a la conclusión de que el corchete de Poisson de dos variables dinámicas es

una variable dinámica que es invariante bajo transformaciones canónicas infinitesimales.
En otras palabras, el corchete de Poisson de dos variables dinámicas es una variable
dinámica con un valor independiente de las variables usadas para describir el estado del
sistema: los corchetes de Poisson son invariantes canónicos.
Veremos que esta invariancia se cumple aun bajo transformaciones canónicas que
no se pueden obtener de manera continua a partir de la transformación identidad, o sea
como sucesión de T.C.I.
El teorema de Jacobi-Poisson. Si f y g son dos constantes de movimiento,

entonces [f, g] también es una constante de movimiento.11
De (9.352) se sigue que si f y g son constantes de movimiento se cumple:
∂f ∂g
+ [f, H] = 0 y + [g, H] = 0 (9.403)
∂t ∂t
Debemos probar que esto implica que:
∂[f, g]
+ [[f, g], H] = 0 (9.404)
∂t
11 Este teorema fue enunciado por Poisson en 1809.
En efecto:

∂ ∂f ∂g
[f, g] = , g + f, = − [[f, H] , g] − [f, [g, h]]
∂t ∂t ∂t
(9.405)
[[H, f ] , g] + [g, [H, f ]] = − [[f, g] , H]
La última igualdad en (9.405) se sigue de la identidad de Jacobi, lo cual demuestra
el teorema. El corchete de Poisson de dos variables dinámicas que se conservan es una
variable dinámica que se conserva. Esto permite, por ejemplo, construir a partir de
un conjunto de s constantes de movimiento independientes C1 , C2 , ...Cs (s < 2l) las
2l − s constantes independientes restantes Cs+1 , Cs+2 , ...C2l por formar los corchetes
de Poisson entre todos los posibles pares de estas S variables dinámicas. En total hay
s(s − 1)/2 corchetes de Poisson, de los cuales algunos pueden ser cero o funciones de
constantes de movimiento conocidas antes, pero es de esperarse que haya 2l − s que
sean independientes. Es claro que puede haber un número mı́nimo s de constantes de
movimiento independiente tal que a partir de ellas se pueda obtener el conjunto completo
de 2l constantes de movimiento independientes.
Ejemplo 9.8.2 Sea una partı́cula en una dimensión, sometida a una fuerza constante.
Hallar dos constantes de movimiento independientes y mostrar que el corchete de Poisson
de ellas no da lugar a una tercera constante de movimiento.
La solución al problema es:
1
x = v(t + t0 ) + g(t + t0 )2 ; p = mv + mg(t + t0 ) (9.406)
2
donde t0 y v son constantes. Dos constantes de movimiento son t0 y la energı́a total E.
x puede escribirse en la forma:
p 1
x= (t + t0 ) − g(t + t0 )2 (9.407)
m 2
Entonces las expresiones para t0 y E en función de p y x son:
s
p p2 2x p2
t0 = −t + − − ; E = − mgx (9.408)
mg m2 g 2 g 2m
El corchete de Poisson de t0 y E es:
∂t0 ∂E ∂t0 ∂E
[t0 (p, x, t), E(p, x, t)] = − (9.409)
∂x ∂p ∂p ∂x
Haciendo el cálculo indicado en (9.408), usando (9.409), obtenemos:
[t0 , E] = 1 (9.410)
La ecuación (9.408) puede interpretarse como una transformación canónica que
permite expresar las nuevas variables canónicas t0 y E en función de las viejas x y p.
Tal transformación depende del tiempo. Esto ilustra un resultado más general: [qν , pν ] =
[q ν , q ν ] = 1, para todo ν, que veremos más adelante.
Ejemplo 9.8.3 Sea una partı́cula para la cual lz y py son constantes de movimiento.
Hallar una tercera constante de movimiento.
Por el teorema de Poisson, [lz , py ] es constante.

[lz , py ] = [xpy , py ] − [ypx , py ]
(9.411)
= x[py , py ] + py [x, py ] − y[px , py ] − px [y, py ]
Es fácil, de la definición, verificar que:
[x, py ] = 0 ; [px , py ] = 0 ; [y, py ] = 1 (9.412)
Por tanto, [lz , py ] = −px . O sea que px es constante de movimiento si lz y py lo
son.
Ejemplo 9.8.4 Demostrar que si dos componentes del momento angular son constantes
de movimiento, la tercera también lo es.
Si li y lj son dos componentes de ~l constantes, por el teorema de Poisson [li , lj ]
también es una constante.
Recordando que:
li = ǫikl xk pl (9.413)
Vemos que:
[li , lj ] = ǫikl ǫjmn [xk pl , xm pn ] (9.414)
Usando la propiedad (9.381-iv) vemos que:
[xk pl , xm pn ] = xk [pl , xm pn ] + pl [xk , xm pn ]
= −xk [xm pm , pl ] − pl [xm pn , xk ]

(9.415)
= −xk (xm [pn , pl ] + pn [xm , pl ])
−pl (xm [pn , xk ] + pn [xm , xk ])

Es fácil ver que:
[pn , pl ] = 0 ; [xm , pl ] = δml ; [xm , xk ] = 0 (9.416)
con lo cual (9.415) queda:
[xk pl , xm pn ] = −xk pn δml + pl xm δnk (9.417)
reemplazando (9.417) en (9.414) obtenemos:
[li , lj ] = −ǫikl ǫjln xk pn + ǫikl ǫjnk pl xn (9.418)
Usando la propiedad:
ǫikl ǫjnl = δij δkn − δin δjk (9.419)
obtenemos:
[li , lj ] = (δij δkn − δin δkj )xk pn − (δij δkn − δin δkj )pk xn (9.420)
Finalmente encontramos que:
[li , lj ] = δij ~r · ~p − rj pi − δij ~r · ~p + pj ri = ri pj − pi rj (9.421)
no es otra cosa que:
[li , lj ] = ǫijk lk (9.422)
Ası́, vemos que [lx , ly ] = xpy − ypx = lz , o sea que si lx y ly son constantes de
movimiento, lz también lo es.
Los corchetes de Poisson fundamentales. Son los corchetes de Poisson para

las coordenadas y los momentos del sistema. Se sigue de la definición de corchete de
Poisson que:
[qν , qµ ] = 0 ; [pν , pµ ] = 0 ; [qν , pµ ] = δµν ; µ, ν = 1, 2, ...l (9.423)
De acuerdo con la invariancia de los corchetes de Poisson bajo transformaciones

canónicas se tiene que las relaciones (9.423) se cumplen independientemente de las varia-
bles canónicas usadas para describir el estado del sistema; veremos que esta propiedad
proporciona un criterio para saber si una transformación en el espacio de fases es o no
canónica.
Algunos corchetes de Poisson de interés. En principio el corchete de Pois-

son de un par de variables dinámicas se obtiene a partir de los corchetes de Poisson
fundamentales. Algunos corchetes de Poisson que se calculan directamente son:
∂f ∂f
[qν , f ] = ; [pν , f ] = − ; µ, ν = 1, 2, ...l (9.424)
∂pν ∂qν
siempre t0 es una de las constantes de movimiento y tiene una forma similar a (9.408),
ver también la ecuación (3.91):
t0 (q, p, t) = −t + θ(q, p) (9.425)
de acuerdo con (9.411) se cumple que:

∂t0
[t0 , H] = − = 1 ⇒ [t0 , H] = 1 (9.426)
∂t
La ecuación (9.423) nos dice que el corchete de Poisson de un par de variables canónica-
mente conjugadas es igual a +1; [qν , pν ] = 1 ; ν = 1, 2, ...l (9.426) nos dice entonces que
t0 y H son un par de variables dinámicas canónicamente conjugadas. Muchos autores
señalan que t y H son canónicamente conjugadas, pero esto es erróneo, pues realmente t
no es una variable dinámica, como sı́ lo es t0 . Enfaticemos que f es una variable dinámica
si satisface f (q, p, t) = f (q, p, t).
Vimos que el método de Hamilton-Jacobi permite mediante una transformación

canónica describir el estado por medio de constantes de movimiento. Los corchetes fun-
damentales de Poisson, (9.423), permiten a priori saber si dos constantes de movimiento
dadas pueden tomarse como dos “coordenadas” o dos “momentos” o una “coordenada”
y su “momento” canónicamente conjugado. La ecuación (9.426) nos dice categóricamen-
te que t0 y H pueden tomarse como un par de variables canónicamente conjugadas pero
no es posible que ambos sean “coordenadas” o “momentos”. Algo análogo se concluye
de las siguientes relaciones entre componentes de los momentos angular y lineal:
[li , lj ] = ǫijk lk ; [pi , lj ] = ǫijk pk ; [xi , lj ] = ǫijk xk
(9.427)
[ li , ~l2 ] = 0 ; [~
p, ~l2 ] = 2~l × ~p ; i, j, k = 1, 2, 3
Se sigue que dos componentes de ~l no pueden tomarse como variables canónicas de

estado, como tampoco una componente de p~ y ~l2 . Sin embargo, por ejemplo, [px , lx ] = 0
y [lz , lx ] = 0, permiten que px y lx sean momentos canónicos respectivamente, lo mismo
que la componente de p~ paralela a ~l y ~l2 .
Como ejemplo, para una partı́cula en un campo de fuerzas centrales se cumple que
[ ~l2 , H] = 0 y [lz , H] = 0. Para este sistema se cumple:
[~l, H] = 0 ; [lz , H] = 0 ; [~l2 , lz ] = 0 (9.428)
O sea que H, ~l2 y lz pueden tomarse como tres “momentos” constantes, que jun-
to con sus tres “coordenadas” canónicamente conjugadas, que son funciones lineales
del tiempo según se vio al final del capı́tulo 2, constituyen un conjunto de seis varia-
bles canónicas que describen exhaustivamente el sistema. Por ser independientes, li y lj
podrı́an servir de variables de estado pero en un formalismo no canónico (no hamilto-
niano).
Funciones escalares y vectoriales del estado de una partı́cula. Una función

escalar por definición, es aquella que no cambia al efectuar una rotación del sistema de
coordenadas (punto de vista “pasivo”). Al efectuar la rotación los vectores de estado ~r
y p~ cambian en ~r y ~p, ver sección 7.7:
~r = Ã~r ; ~p = Ã~
p (9.429)
donde Ã es la matriz de rotación. Entonces φ(~r, p~) es escalar si:
φ(~r, p~) = φ(~r , ~p) (9.430)
Una función vectorial del estado de la partı́cula es una función F que se transforma
de acuerdo con (9.428), es decir, F~ tiene tres componentes que se transforman por
rotaciones como las componentes de ~r:
~ (~r, ~p)
F~ (~r, ~p) = ÃF~ (~r, p~) = F (9.431)
Para rotaciones infinitesimales Ã está dada por:
Ã = I˜ + Ci G̃i δφ (9.432)
donde los G̃i están dados en la ecuación (7.221), los Ci son los cosenos directores del eje
de rotación y δφ es el ángulo de rotación. De acuerdo con (9.318) y (9.432):
~r = ~r + Ci G̃i ~r δφ ; ~p = p~ + Ci G̃i p~ δφ (9.433)
De acuerdo con (9.318), (9.322) y (9.433) tenemos que:
∂
δ~r = Ci G̃i~r δφ = ǫ G(~r, ~p)
∂~p
(9.434)
∂
δ~
p= Ci G̃i p
~ δφ = ǫ G(~r, ~p)
∂~r
donde G es el generador infinitesimal de la rotación, que de acuerdo con (9.340) es la
componente de ~l a lo largo del eje de rotación:
G(~r, p~) = ~n · ~r × ~p = Ci li (9.435)
Vemos entonces que δφ = ǫ y que:
∂ ∂
Ci G̃i ~r = Ci li = (~n · ~r × ~p) = ~n × ~r
∂~
p ∂~p
(9.436)
∂ ∂
Ci G̃i p~ = − Ci li = − (~n · ~r × p~) = ~n × p~
∂~p ∂~r
Tomando componentes en (9.432) a (9.436):

Ci G̃i xl = ǫkil Ci xl ⇒ G̃i = ǫkil (9.437)
kl kl
El lector puede verificar fácilmente que este resultado es consistente con las ecua-
ciones (7.222), teniendo en cuenta que allı́ se tenı́an rotaciones “activas”. De (9.436)
vemos que se puede escribir:
p) = ~l · ~n = Ci p~ · G̃i~r = −Ci~r · G̃i p~

G(~r, ~
(9.438)
⇒ li = p~ · G̃i~r = −~r · G̃i ~p ; i = 1, 2, 3
consistente con la antisimetrı́a de G̃i , (9.437).

Evaluemos el corchete de Poisson de dos componentes de ~l:
∂li ∂li ∂li ∂lj
[li , lj ] = · − · = (−G̃i p~) · (G̃j ~r) − (G̃i ~r) · (−G̃j p~)
∂~r ∂~
p ∂~p ∂~r
= G̃i~r · G̃j p
~ − G̃j ~r · G̃i ~p (9.439)
= ~rT G̃Ti G̃j ~p − ~rT G̃Tj G̃i p~ = ~rT (G̃Ti G̃j − G̃Tj G̃i )~
p
Como los G̃i son antisimétricos, G̃Ti = −G̃i ,

[li , lj ] = ~rT (G̃j G̃i − G̃i G̃j )~
p (9.440)
De acuerdo con la ecuación (7.224) que define el álgebra de Lie de las rotaciones:
G̃j G̃i − G̃i G̃j = ǫjik G̃k
[li , lj ] = ǫjik ~rT G̃k p~

(9.441)
= −ǫijk ~r · G̃k p~
= ǫijk lk
lo cual concuerda con el resultado obtenido en (9.422).
Decimos que li y G̃i tienen la misma álgebra de Lie, definida por corchetes de
Poisson de variables dinámicas y de conmutadores de matrices respectivamente.
Volvamos al problema de las funciones escalares y vectoriales. Para rotaciones
infinitesimales una función escalar cumple:
∂φ ∂φ
φ(~r, p~) = φ(~r + δ~r, p~ + δ~
p) = φ(~r, ~p) + δ~r · + δ~
p· (9.442)
∂~r ∂~p
o sea que se cumple:

∂φ ∂φ ∂G ∂φ ∂G ∂φ
δ~r · + δ~
p· =ǫ · − · = −ǫ [G, φ] = 0 (9.443)
∂~r ∂~
p ∂~
p ∂~r ∂~r ∂~p
lo cual es consistente con (9.351). La ecuación (9.443) también implica que:

∂φ ∂φ ∂φ ∂φ
~n × ~r · + ~n × p~ · = 0 ⇒ ~n · ~r × + p~ × =0 (9.444)
∂~r ∂~
p ∂~r ∂~p
Como ~n es arbitrario, a fin de que φ sea escalar debe cumplirse:
∂φ ∂φ
~r × + p~ × =0 (9.445)
∂~r ∂~
p
se cumple si ∂φ/∂~r = a~r + b~
p y ∂φ/∂~p = c~r + d~
p puesto que:
∂φ ∂φ
~r × + p~ × = b~r × p~ + c~
p × ~r = 0 si b = c (9.446)
∂~r ∂~
p
es decir, φ es de la forma:
1 2 1 2
φ= p = A~r2 + B~
a~r + c~r · p~ + d ~ p2 + c~r · ~p (9.447)
2 2
donde A, B y C no dependen de ~r ni de ~p. Ası́ pues:
[~r2 , li ] = 0 ; [~
p2 , li ] = 0 ; [~r · p~, li ] = 0 implican : [φ, li ] = 0 (9.448)
Una función vectorial F~ (~r, p~) puede escribirse en la forma:
p + f3 ~l
F~ = f1 ~r + f2 ~ (9.449)
donde f1 , f2 y f3 son funciones escalares, o sea de la forma (9.447).
Usando las fórmulas (9.427) vemos que:
[Fi , lj ] = ǫijk Fk → [F~ , li ] = ~ei × F~ (9.450)
De (9.428) se sigue que F~ se transforma bajo rotación como (9.431). Los vectores de
la forma (9.449) dependen del estado del sistema, en tanto que los vectores unitarios de
base ~ei son independientes de él como también los vectores ~n, que definen las rotaciones.
Si ~n mismo estuviera determinado por los vectores ~r y p~, entonces una rotación cambiarı́a
no sólo los componentes de la función F~ sino la naturaleza misma de la función (algo
análogo a lo que sucede con el hamiltoniano cuando las transformaciones canónicas
dependen del tiempo). En una rotación el cambio en F~ es:
∂ F~ = δφ [F~ , ~l.~n] (9.451)
donde los vectores unitarios no son rotados por ~l · ~n. Éste no serı́a el caso si F~ fuera un
vector externo como un campo magnético, que no depende del estado de la partı́cula.
La expresión (9.451) vale pues sólo para funciones vectoriales de la forma (9.449). La
ecuación (9.450) también puede escribirse usando la notación diádica en términos del
diádico unidad ~
~1 = ~e1~e1 + ~e2~e2 + ~e3~e3 :
~
[F~ , ~l] = −~1 × F~ (9.452)
Sean dos vectores de estado del sistema, F~ , G.

~ Es fácil mostrar que:
[F~ · G,
~ ~l · ~n] = 0 (9.453)
En efecto, F~ · G
~ es una función escalar, que no cambia por rotaciones.
Por contraste, F~ · ~n′ donde ~n′ es un vector independiente del estado, no es una
función escalar y satisface que:
[F~ · ~n′ , ~l · ~n] = (~n′ × ~n) · F~ (9.454)
que en general no es cero.
Ejemplo 9.8.5 Mostrar que (9.450) no se cumple cuando F~ no depende exclusivamente

del estado de la partı́cula, por ejemplo cuando es el potencial vectorial A~ = (~r × B)/2
~
donde B ~ = B~l3 , o sea un campo
~ es un vector fijo y constante en el espacio; digamos B
magnético homogéneo en la dirección z.
1 1
[Ai , li ] = B[(~r × ~e3 )i , lj ] = Bǫik3 [xk , li ] (9.455)
2 2
usando (9.427) obtenemos:
1 1
[Ai , lj ] = Bǫik3 ǫkjl xl = − B(δij δ3l − δil δ3j ) xl
2 2
(9.456)
1
= − B(δij x3 − δ3j xi )
2
Por otra parte, el lado derecho en (9.450) es:

1
ǫijk Ak = Bǫijk ǫkl3 xl
2
(9.457)
1 1
= B(δil δj3 − δi3 δjl ) xl = B(δj3 xi − δi3 xj )
2 2
Comparando (9.456) con (9.457) vemos que no son iguales. En conclusión, no hay
una fórmula general para evaluar el corchete de Poisson de un vector que depende del
estado solamente y un vector espacial.
Correspondencia del formalismo de Poisson con el cuadro de Heisenberg

de la mecánica cuántica.12 Hay una correspondencia entre el conjunto de las variables
dinámicas en la descripción clásica y el conjunto de los operadores hermı́ticos en la
descripción cuántica de un sistema de l grados de libertad. En esos dos conjuntos se
puede definir un álgebra de Lie, de la siguiente manera:
(i) En esos conjuntos se puede definir una ley de composición interna mediante la
cual se hace corresponder a cada par de elementos del conjunto un tercer elemento del
mismo conjunto: C = [a, b]. Tal ley de composición satisface:
(ii) La propiedad reflexiva: [a, a] = 0, para todo elemento del conjunto, siendo 0
elemento del mismo.
(iii) La propiedad antisimétrica: [a, b] = −[b, a].
(iv) La propiedad de linealidad: [αa + βb, c] = α[a, c] + β[b, c] siendo α y β números
cualesquiera.
(v) La identidad de Jacobi: para cualesquiera tres elementos a, b, c, del conjunto
se cumple [a, [b, c]] + [b, [c, a]] + [c, [a, b]] = 0.
Esta álgebra es en general no conmutativativa, además de ser no asociativa: [a, [b, c]]
6= [[a, b], c].
En el conjunto de las variables dinámicas clásicas el álgebra de Lie está dada por
los corchetes de Poisson, que satisfacen todas las propiedades (i) a (v). En el conjunto
de los operadores hemı́ticos cuánticos se satisfacen las propiedades (i) a (v) definiendo
la ley de composición interna por medio de conmutadores: [â, b̂] = âb̂ − b̂â.
La correspondencia entre el formalismo de Poisson y el de Heisenberg se establece
de la siguiente manera: a cada variable canónica de estado pν o qν , ν = 1, 2, 3, ...l,
le corresponde un operador hermı́tico, p̂ν o q̂ν , ν = 1, 2, ...l. En consecuencia a cada
variable dinámica f (q, p, t) le corresponde un operador hermı́tico construido a partir
de los operadores p̂ν o q̂ν : fˆ(q̂, p̂, t). A cada corchete de Poisson fundamental le corres-
ponde un conmutador fundamental. La correspondencia entre el corchete de Poisson y
conmutadores es:
1 1
[f, g] → [fˆ, ĝ] = (fˆĝ − ĝfˆ) (9.458)
ih̄ ih̄
En particular a los corchetes fundamentales de Poisson, (9.423), les corresponde:
q̂µ q̂ν − q̂ν q̂µ = 0 ; p̂µ p̂ν − p̂ν p̂µ = 0
(9.459)
q̂µ p̂ν − p̂ν q̂µ = ih̄δµν ; µ, ν = 1, 2, ...l
12 Véase el capı́tulo 12.
A la relación (9.426) le corresponde:
t̂0 Ĥ − Ĥ t̂0 = ih̄ (9.460)
similarmente,
l̂i ˆ lj ˆ
lj − ˆ li = ih̄ǫijk l̂k (9.461)
Las ecuaciones de movimiento de Heisenberg son:

ˆq̇ ν = 1 q̂ν Ĥ − Ĥ q̂ν ; ˆṗν = 1 p̂ν Ĥ − Ĥ p̂ν ; ν = 1, 2, ...l (9.462)
ih̄ ih̄
Si G̃i (q, p, t) son los generadores infinitesimales de un grupo de simetrı́as, que
satisface las relaciones de álgebra de Lie clásicas,
h i
G̃i , G̃j = Cijk G̃k (9.463)
donde G̃i (q, p, t) son llamadas las constantes estructurales, las correspondientes relacio-
nes de álgebra de Lie cuánticas son:
Ĝi Ĝj − Ĝj Ĝi = iCijk h̄Ĝk (9.464)
en particular para el grupo de rotaciones tridimensional, Cijk = ǫijk , que caracterizan

al grupo SO(3).
Toda la mecánica cuántica puede hacerse corresponder con la mecánica clásica a
partir de las relaciones que hemos mencionado; con la mecánica cuántica en el formalismo
de Heisenberg y con la mecánica clásica en el formalismo de Poisson. La analogı́a llega
hasta el punto de formularse un principio de Hamilton cuántico (principio de acción de
Schwinger) y construirse una integral de Poincaré-Cartán.
Ejemplo 9.8.6 Sea una variable dinámica B independiente del tiempo, la cual satisface
la última igualdad de la ecuación (9.352). Mostrar que la solución de dicha ecuación coin-
cide formalmente con la fórmula de Hausdorff-Baker-Campbell (H.B.C.) de la mecánica
cuántica.
En mecánica cuántica se obtiene un operador en el tiempo t a partir del operador

en el tiempo cero por la relación:
B̂(t) = eiĤt/h̄ B̂(0)e−iĤt/h̄ (9.465)
donde Ĥ es el operador hamiltoniano. Se puede mostrar que esta ecuación equivale a la

fórmula de H.B.C:
2
it 1 it
B̂(t) = B̂0 + [Ĥ, B̂0 ] + [Ĥ, [Ĥ, B̂o ]]
h̄ 2! h̄
n
1 it (9.466)
+... [Ĥ, [Ĥ, ...[Ĥ, B̂0 ]...]] + ...
n! h̄ | {z }
n corchetes
(véase el texto de Messiah, Mécanique quantique, tomo 1, capı́tulo 8). Clásicamente la

ecuación de movimiento para la variable dinámica B es (9.352):
Ḃ = [B, H] (9.467)
Formalmente B puede expandirse en serie de Tayor alrededor de t = 0:

t2 tn (n)

B = B0 + tḂ + B̈ + ... B + ... (9.468)
2!
0 0n! 0
Notando que:
B̈ = [Ḃ, H] = [[B, H], H], ... (9.469)
obtenemos:

t2
B = B0 − t[H, B]|0 + [H, [H, B]]
2! 0

(9.470)
1

+ ... (−t)n [H, [H ...[H, B] ...]] + ...
n! | {z }

n corchetes 0
Es clara la correspondencia entre (9.466) y (9.470) con sólo reemplazar el corchete
de Poisson por i/h̄ veces el conmutador.
La expresión (9.466) puede también obtenerse a partir de las fórmulas cuánticas
que corresponden a (9.467) y (9.468):
ˆ = i [Ĥ, B̂]
Ḃ (9.471)
h̄
Como ilustración, sea una partı́cula en un campo homogéneo gravitacional −mg.
El hamiltoniano cuántico será:
p̂2
Ĥ = − mg x̂ (9.472)
2m
Sea B̂ = Ĥ y B̂0 = x̂0 . Hallemos a x̂ usando la fórmula (9.466). Es necesario
evaluar los siguientes conmutadores:
1 2 −1
[Ĥ, x̂0 ] = p̂0 , x̂0 = x̂0 , p̂20
2m 2m
(9.473)
−1 ih̄
= ([x̂0 , p̂0 ] p̂0 + p̂0 [x̂0 , p̂0 ]) = − p̂0
2m m

ih̄
[Ĥ, [Ĥ, x0 ]] = −mg x̂0 , − p̂0 = −gh̄2 (9.474)
m
Como el conmutador (9.474) es constante, todos los conmutadores de orden supe-
rior se anulan. Reemplazando (9.473) y (9.474) en (9.466):
p̂0 1
x̂ = x̂0 + t + gt2 (9.475)
m 2
La ecuación (9.475) es formalmente igual a la expresión clásica que se obtendrı́a a
partir de (9.470).
9.9. Pruebas del carácter canónico de una transfor-

mación
La prueba más directa consiste en usar la transformación junto con las ecuaciones
de Hamilton en las variables originales para obtener las ecuaciones de movimiento en las
nuevas variables; la transformación será canónica si las nuevas ecuaciones de movimiento
lo son para un hamiltoniano cualquiera; esto se usó en los ejemplos de las ecuaciones
(3.92) y (3.93). Otra prueba consiste en mostrar que existe una función generatriz U
para la transformación, tal que las fórmulas de la transformación se puedan llevar a la
forma (9.260). A continuación veremos otros métodos de prueba como son los corchetes
de Lagrange y Poisson y la llamada condición simplicial.
Veamos que en la prueba del carácter canónico de una transformación es suficiente
demostrar que la transformación para un tiempo dado es canónica. Sea la transformación:
q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l (9.476)
Si la transformación es canónica se debe cumplir:
l l
!
X X
pν ∆q ν − H ∆t = C pν ∆qν − H ∆t − ∆F (q, p, t) (9.477)
ν=1 ν=1
Si en (9.477) tomamos un tiempo fijo y arbitrario t = t′ obtenemos:
l
X l
X
pν δq ν = C pν δqν − δF (q, p, t) (9.478)
ν=1 ν=1
Ahora (9.478) es la identidad que define una transformación canónica que no de-
pende del tiempo,
q ν = q ν (q, p, t′ ) ; pν = pν (q, p, t′ ) ; ν = 1, 2, ...l (9.479)
Entonces, las ecuaciones (9.479) definen una transformación canónica con valencia C
y función generatriz F (q, p, t′ ) que no depende del valor escogido para t = t′ . Veamos
ahora cómo la identidad que define el carácter canónico de la transformación dependiente
del tiempo, ecuación (9.477), puede obtenerse de la identidad correspondiente para la
transformación independiente del tiempo, ecuación (9.478). La ecuación (9.4) relaciona
las variaciones δ con las variaciones ∆:
∆q ν = δq ν + q̇ ν ∆t ; ν = 1, 2, ...l (9.480)
Con expresiones análogas para ∆pν , ∆qν , ∆pν . Entonces la relación entre ∆F y
δF será:
" l #
X ∂F ∂F ∂F
∆F = δF + q̇ν + ṗν + ∆t (9.481)
ν=1
∂qν ∂pν ∂t
Usando las fórmulas (9.480) y (9.481), la ecuación (9.478) se transforma en:

l
X l
X

p ∆q ν − q̇ ν ∆t = C pν (∆qν − q̇ν ∆t) − ∆F
ν=1 ν=1
" l #
X ∂F ∂F ∂F
+ q̇ν + ṗν + ∆t (9.482)
ν=1
∂qν ∂pν ∂t
La ecuación (9.482) coincidirá con (9.477) si se define la función H por la ecuación:

X l
∂F ∂F ∂F
H = CH + pν q̇ ν − Cpν q̇ν + q̇ν + ṗν + (9.483)
ν=1
∂qν ∂pν ∂t
El paréntésis en (9.483) se puede escribir también en la forma siguiente si asumimos

que la transformación es libre de primera clase, de modo que F es función de (q, q, t):
Xl
∂F1 ∂F1
pν q̇ ν − Cpν q̇ν + q̇ν + ṗν (9.484)
ν=1
∂qν ∂pν
Esta expresión es cero, de acuerdo con las fórmulas de la transformación (9.158).

∂F1
H = CH + (9.485)
∂t
Se llega al resultado correspondiente a (9.485) si la transformación tiene una estru-
tura arbitraria, es decir, regida por las fórmulas (9.260). Concluimos que a fin de que la
transformación (9.476) sea canónica es necesario y suficiente que todas las transforma-
ciones independientes del tiempo obtenidas de la transformación (9.476) por reemplazar
a t por un valor árbitrario t′ , sean canónicas, es decir, que satisfagan la ecuación (9.478),
con una y la misma valencia C y una y la misma función generatriz F . Por esta razón,
al formular las pruebas para el carácter canónico de una transformación, basta restrin-
girse a la consideración de las transformaciones que no contienen la variable temporal t
explı́citamente:
!
~q, ~p
q ν = q ν (q, p) ; pν = pν (q, p) ; ν = 1, 2, ...l ; J 6= 0 (9.486)
~q, p~
Los corchetes de Lagrange. Para la transformación canónica (9.486), la identi-

dad (9.477) toma la forma:
l
X l
X
pν ∆ q ν = C pν ∆qν − ∆K(q, p) (9.487)
ν=1 ν=1
Si en (9.487) expresamos a ∆q ν en función de ∆qν y ∆pν usando las fórmulas

(9.486) obtenemos:
l
" l
! l
! #
X X ∂q ν X ∂qν
∆K = Cpν − pν ∆qν − pµ ∆pν (9.488)
ν=1 ν=1
∂qν µ=1
∂pν
∆K será un diferencial exacto si se cumplen las condiciones:

l
! l
!
∂ X ∂q µ ∂ X ∂q µ
Cpλ − pµ = Cpν − pµ
∂qν µ=1
∂qλ ∂qλ µ=1
∂qν
l
! l
!
∂ X ∂q µ ∂ X ∂qµ
− pµ = − pµ (9.489)
∂pν µ=1
∂pλ ∂pλ µ=1
∂pν
l
! l
!
∂ X ∂q µ ∂ X ∂q µ
Cpλ − pµ = − pµ
∂pν µ=1
∂qλ ∂qλ µ=1
∂pν
Si efectuamos las operaciones, las ecuaciones (9.489) se transforman en:
Xl
∂pµ ∂q µ ∂pµ ∂q µ
− = 0
µ=1
∂qν ∂qλ ∂qλ ∂qν
Xl
∂pµ ∂qµ ∂pµ ∂q µ
− = 0 (9.490)
µ=1
∂pν ∂pλ ∂pλ ∂pν
Xl
∂pµ ∂q µ ∂pµ ∂q µ
− − = Cδνλ
µ=1
∂pν ∂qλ ∂qλ ∂pν
Se define el corchete de Lagrange de dos variables dinámicas f y g como:
Xl
{f (q, p, t), g(q, p, t)} ≡ − (9.491)
ν=1
∂f ∂g ∂g ∂f
Con esta notación, las fórmulas (9.490) toman la forma:
{qν (q, p, t), qλ (q, p, t)} = 0 ; {pν (q, p, t), pλ (q, p, t)} = 0
(9.492)
{qν (q, p, t), pλ (q, p, t)} = Cδνλ ; ν, λ = 1, 2, ...l
En las fórmulas (9.492) hemos colocado la variable t, teniendo en cuenta el resul-

tado anterior, según el cual el carácter de la transformación dependiente del tiempo es
el mismo que el de la transformación realizada en un tiempo fijo t = t′ . Las ecuacio-
nes (9.492) expresan las condiciones suficientes y necesarias para que la transformación
(9.476) sea canónica. Esta es una de las mencionadas pruebas del carácter canónico de
una transformación.
Las fórmulas (9.492) se llaman los corchetes de Lagrange fundamentales: con las
ecuaciones (9.492) se pueden formar las siguientes igualdades entre matrices l × l:
{~
q, ~ p, p~)} = 0̃l ; {~q, ~p)} = C I˜l
q )} = 0̃l ; {~ (9.493)
donde el elemento ν, λ, de la matriz {~q, ~q}, es {qν , qλ }, ..., y 0̃l y I˜ son las matrices
cero e identidad de orden l × l respectivamente. A su vez las fórmulas (9.493) se pueden
condensar en la siguiente expresión con matrices 2l × 2l:
   
{~
q, ~
q )} −{~
q, ~
p)} 0̃l −I˜l
 =  ≡ Ẽ (9.494)
{~
q, p~)} {~
p, p~)} I˜l 0̃l
Ẽ es una matriz 2l × 2l antisimétrica, ortogonal, de cuadrado igual al negativo de

la matriz identidad, y de determinante +1:
Ẽ T = −Ẽ
Ẽ T = Ẽ −1
(9.495)
Ẽ 2 = −I˜
det Ẽ = +1
Vectores y matrices simpliciales. Se trata de una notación vectorial en el

espacio de fases con vectores de 2l elementos y matrices de dimensión 2l × 2l. Con
esta notación se “entremezclan” las coordenadas y momentos generalizados, y de ahı́ el
nombre de “simplicial” que recibe esta notación. El término matriz simplicial se reserva
para una cierta clase de matrices 2l × 2l, las matrices M̃ que satisfacen la relación:
M̃ T Ẽ M̃ = Ẽ (9.496)
el conjunto de todas las matrices simpliciales de dimensión 2l × 2l forma un grupo,

llamado el grupo simplicial. En efecto:
(i) El producto de dos matrices simpliciales es una matriz simplicial.
(ii) Las matrices simpliciales son no singulares, o sea que para toda matriz simplicial
existe la matriz inversa. La matriz inversa de una matriz simplicial es simplicial.
(iii) La matriz identidad 2l × 2l es simplicial.
(iv) El producto de matrices simpliciales es asociativo.
Los vectores de 2l elementos en el espacio de fases se pueden escribir en la forma
[~u, ~v ], donde ~u y ~v son vectores columna de l elementos.
Una forma bilineal de dimensión 2l es:
l
X
f= (−uν vν′ + vν u′ν ) = ~v · ~u ′ − ~u · ~v ′ (9.497)
ν=1
que puede escribirse en la forma:

 ′ 
~u
f = (~u, ~v ) Ẽ   (9.498)
′
~v
Si ahora se someten los vectores [~u, ~v ] y [~u ′ , ~v ′ ] a una transformación mediante una
matriz simplicial M̃ :
     ′   ′ 
~u ~u ~u ~u
  = M̃  ;   = M̃   (9.499)
~v ~v ′ ′
~v ~v
Entonces se cumple que:
 ′   ′ 
~u ~u

f = ~u, ~v Ẽ   = (~u, ~v ) M̃ T Ẽ M̃  
~v ′ ′
~v
 ′ 
~u
= (~u, ~v ) Ẽ  =f (9.500)
′
~v
Es decir, la forma bilineal f es invariante bajo transformaciones de los vectores
[~u, ~v ] realizados por matrices simpliciales; en otras palabras, f es invariante bajo las
transformaciones del grupo simplicial.
La matriz jacobiana de una transformación canónica. Sea la matriz jaco-

biana de una transformación canónica:
 
∂q1 ∂q 1 ∂q 1 ∂q1 ∂q 1 ∂q1
... ...
 ∂q1 ∂q2 ∂ql ∂p1 ∂p2 ∂pl 
 
 
 ∂q ∂q 2 ∂q 2 ∂q2 ∂q 2 ∂q2 
 2
... ... 
 
 ∂q1 ∂q2 ∂q l ∂p 1 ∂p 2 ∂pl 
 
 
 ... ... ... ... ... ... ... ... 
 
 
   
 ∂ql ∂q l ∂ql ∂q l ∂q l ∂ql  ∂~q ∂~q
 ... ... 
 ∂q ∂q2 ∂ql ∂p1 ∂p2 ∂pl   ∂~q ∂~p 
 1   
J˜ = 
=
 

 (9.501)
 ∂p1 ∂p1 ∂p1 ∂p1 ∂p1 ∂p1   ∂~p ∂p 
~
 
 ∂q1 ∂q2 . . . ∂ql ∂p1 ∂p2 . . . ∂pl  ∂~q ∂~p
 
 
 
 ∂p2 ∂p2 ∂p2 ∂p2 ∂p2 ∂p2 
 ... ... 
 ∂q1 ∂q2 ∂q l ∂p 1 ∂p 2 ∂pl 
 
 
 
 ... ... ... ... ... ... ... ... 
 
 
 ∂p ∂pl ∂pl ∂pl ∂pl ∂pl 
l
... ...
∂q1 ∂q2 ∂ql ∂p1 ∂p2 ∂pl
donde ∂~p/∂~q, etc., son matrices jacobianas de orden l. Mostremos que J˜ satisface la
relación:
J˜T Ẽ J˜ = C Ẽ (9.502)
donde C es la valencia de la transformación canónica. En efecto:

 T T
  
∂~q ∂~p ∂~q ∂~q
  ˜


 ∂~q
 ∂~q  
0̃l −Il  ∂~q ∂~p 
J˜T Ẽ J˜ =   


 (9.503)
 T   ∂~p
 ∂~q T ∂~p  I˜l 0̃l ∂p 
~
∂~p ∂~p ∂~q ∂~p
efectuando el producto de matrices indicado en (9.503), teniendo en cuenta que cuando
las matrices constan de bloques se siguen las mismas reglas de la multiplicación ordinaria
de matrices, obtenemos:
 T T T T

∂~p ∂~q ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p
 − − 
 ∂~q ∂~q ∂~q ∂~q ∂~q ∂~p ∂~q ∂~p 
 
J˜ Ẽ J˜ = 
T
 (9.504)
 T T T T 
 ∂~p ∂~q ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p 
− −
∂~p ∂~q ∂~ p ∂~q ∂~p ∂~p ∂~p ∂~p
∂~p/∂~qT indica la matriz traspuesta de ∂~p/∂~q. Notemos que los corchetes de Langrange
fundamentales, (9.490) y (9.492), se pueden escribir en forma de matrices. En efecto, las
ecuaciones (9.490) son los siguientes elementos de matriz:
 ! ! ! ! 
X l
∂~p T ∂~q ∂~q T ∂~p
 −  =0
µ=1
∂~q ∂~q ∂~q ∂~q
νµ µλ νµ µλ
 ! ! ! ! 
l
X ~T ∂~q ∂~q
T
∂~p
 ∂p −  =0 (9.505)
µ=1
∂~
p ∂~p ∂~p ∂~p
νµ µλ νµ µλ
 ! ! ! ! 
l
X ~T ∂~p ∂~q
T
∂~q
 ∂q −  = Cδνλ
µ=1
∂~
p ∂~q ∂~p ∂~q
νµ µλ νµ µλ
Comparando a (9.504) con (9.505) obtenemos que:

 
0̃l −C I˜l
J˜T Ẽ J˜ =   = C Ẽ (9.506)
C I˜l 0̃
Con lo cual queda demostrada la relación (9.502). Si la transformación canónica
es univalente, C = 1, entonces J˜ es una matriz simplicial. En general, para C 6= 1, se
dice que J˜ es una matriz simplicial generalizada, con valencia C. El conjunto de todas
las matrices simpliciales generalizadas (todas con la misma C) forma un grupo. Si M̃
es una matriz simplicial generalizada, se cumple que det M̃ = ±C l . En efecto, tomando
el determinante de (9.506) y teniendo en cuenta que el determinante de un producto de
matrices es igual al producto de los determinantes y que det Ẽ = +1,
det J˜T detẼ detJ˜ = C 2l det Ẽ (9.507)
Como det J˜T = det J˜ se sigue que:

˜ 2 = C 2l ⇒ detJ˜ = ±C l
(det J) (9.508)
O sea que para una matriz simplicial se cumple que det M̃ = ±1, o sea que las
matrices simpliciales son no singulares.
Sabemos que las igualdades (9.492), o sea (9.505), son las condiciones suficientes
y necesarias para que la transformación sea canónica. Por tanto la igualdad (9.506) se
cumple solamente si la transformación es canónica. Llegamos pues, a otra prueba del
carácter canónico de una transformación:
Para que la transformación q ν = q ν (q, p, t), pν = pν (q, p, t), ν = 1, 2, ...l sea
canónica, es necesario y suficiente que la matriz jacobiana J˜ correspondiente a esta
transformación sea una matriz simplicial generalizada con valencia constante C. Si la
transformación es univalente, entonces J˜ es una matriz simplicial ordinaria. Entonces,
˜ ecuación (9.502), debe cumplirse idéntica-
la condición de la naturaleza simplicial de J,
mente para todos las variables (q, p, t).
El teorema de Liouville. En la sección 9.6, ecuación (9.269), se halló que el

movimiento de un sistema hamiltoniano puede considerarse como una transformación
canónica libre de primera clase univalente. En consecuencia, su matriz jacobiana es
simplicial y su determinante vale ±1. Se sigue entonces que el volumen de una región
arbitraria del espacio de fases es constante en el tiempo. Tal volumen es:
Z Z Z
Γ= ... dq 1 dq 2 ...dq l dp1 dp2 ...dpl (9.509)
que puede expresarse también en la forma:

Z Z Z !
~q, ~p

Γ= ... J dq1 dq2 ...dql dp1 dp2 ...dpl (9.510)
~q, p~
˜ Si la transformación es canónica,
donde J es el determinante de la matriz jacobiana J.
˜ l
J = det J = ±C , o se a que:
Γ = Γ|C|l (9.511)
En particular, Γ es invariante bajo la transformación canónica de evolución tem-
poral, o sea que:
dΓ
=0 (9.512)
dt
La ecuación (9.512) puede considerarse como una prueba del teorema de Liouville,
véase ecuación (3.137). Γ es una de las integrales invariantes de Poincaré, ecuación (9.81).
Invariancia de los corchetes de Poisson bajo transformaciones canónicas.

Hemos ya mostrado esta invariancia bajo transformaciones canónicas infinitesimales,
ecuación (9.394) y siguientes. Veremos ahora que esta invariancia vale para cualquier tipo
de tranformación canónica univalente; no solamente para aquellas que pueden obtenerse
a partir de la transformación continua de parámetros.
Empecemos por mostrar que la condición de canonicidad (9.502) puede expresarse

en la forma:
J˜Ẽ J˜T = C Ẽ (9.513)
˜T −1
en efecto, multiplicando por (J ) a (9.502) por la izquierda y por J por la derecha, ˜−1
obtenemos:
1
(J˜T )−1 Ẽ J˜−1 = Ẽ (9.514)
C
En (9.514) ahora tomamos las matrices inversas de ambos lados y usamos las
propiedades de las ecuaciones (9.495):
h i−1 −1
1
(J˜T )−1 Ẽ J˜−1 = J˜Ẽ −1 J˜T = −J˜Ẽ J˜T ; Ẽ = −C Ẽ (9.515)
C
O sea que la siguiente es otra expresión de la condición de canonicidad:
J˜Ẽ J˜T = C Ẽ (9.516)
La ecuación (9.516) puede obtenerse a partir de (9.502) intercambiando los papeles
de J˜ y J˜T . Comparando con (9.503) vemos que J˜Ẽ J˜T se puede obtener de (9.504)
intercambiando a ∂~q/∂~q y ∂~p/∂~
p por sus respectivas traspuestas y a ∂~p/∂~q por (∂~q/∂~p)T .
Es decir:
 T T T T

∂~q ∂~q ∂~q ∂~q ∂~q ∂~p ∂~q ∂~p
 − − 
 ∂~ ∂~q ∂~p 
˜T ˜  p ∂~q ∂~q ∂~p ∂~p ∂~q 
J Ẽ J =   (9.517)
 T T T T 
 ∂~p ∂~q ~
∂p ∂q~ ~
∂p ∂p~ ~
∂p ∂p~ 
, − −
∂~
p ∂~q ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p
Los corchetes de Poisson fundamentales pueden escribirse en forma de matriz. En
efecto:
 ! ! ! ! 
Xl
∂~q ∂~p T ∂~q ∂~p T
[q ν , pλ ] =  − 
µ=1
∂~q ∂~p ∂~p ∂~q
νµ µλ νµ µλ
(9.518)
T T
!
∂~q ∂~p ∂~q ∂~p
= −
∂~q ∂~p ∂~p ∂~q
νλ
y similarmente:
T T
! T T
!
∂~q ∂~q ∂~q ∂~q ∂~p ∂~p ∂~p ∂~p
[q ν , q λ ] = − ; [pν , pλ ] = − (9.519)
∂~q ∂~p ∂~p ∂~q ∂~q ∂~p ∂~p ∂~q
µλ µλ
Se sigue entonces que (9.516) se puede escribir como:

 ~ ~   
− q, q − ~q, ~p 0̃l −I˜l C
J˜Ẽ J˜T =   = C Ẽ =   (9.520)
T ˜
~q , ~p ~ ~
− p, p Il C 0̃l
O sea que las condiciones de canonicidad de la transformación también se pueden

expresar por medio de los corchetes de Poisson, según (9.520): [~q , ~q ] = 0̃l ; [~p, ~p] = 0̃l ;
[~q, ~p] = C I˜l , o en términos de los elementos de matriz.
[q ν , q λ ] = 0 ; [pν , pλ ] = 0 ; [q ν , pλ ] = Cδνλ ; ν, λ = 1, 2, ...l (9.521)
Las ecuaciones (9.521) coinciden con (9.423) cuando la transformación canónica es

univalente.
Sean ahora dos variables dinámicas f (q, p, t) y g(q, p, t). Al expresar a las qν , pν ; ν =
1, 2, ...l, en términos de las variables (q, p, t) por medio de la transformación canónica,
obtenemos las variables dinámicas f (q, p, t) y g(q, p, t). O sea que los corchetes de Poisson
de f con g pueden evaluarse bien respecto a las variables (q, p) o respecto a las variables
(q, p). Mostremos qué vale la identidad:
[f, g](q,p) = C[f, g](q,p) (9.522)
notemos que:
Xl
∂f ∂g ∂f ∂g
[f, g](q,p) = −
ν=1
∂f ∂g ∂f ∂g
= −
∂~q ∂~p ∂~p ∂~q
(9.523)
Xl
∂f ∂g ∂f ∂g
[f, g](q,p) = −
ν=1
∂q ν ∂pν ∂pν ∂q ν
∂f ∂g ∂f ∂g
= −
∂~q ∂~p ∂~p ∂~q
Las ecuaciones (9.523) se pueden expresar de la siguiente manera con la notación

de (9.498):
 
∂f
 ∂~q 
∂g ∂g  
[f, g](q,p) = , Ẽ   (9.524)
∂~q ∂~p  ∂f 
∂~p
y similarmente [f, g](q,p) . Veamos cómo se transforman las derivadas respecto a qν y

respecto a pν en función de las derivadas respecto a q ν y respecto a pν :
l T T
!
∂f X ∂f ∂qµ ∂f ∂pµ ∂~q ∂f ∂~p ∂f
= + = − (9.525)
∂qν µ=1
∂q ν ∂qν ∂pµ ∂qν ∂~q ∂~q ∂~q ∂~p
ν
y similarmente para ∂f /∂pν . Vemos entonces que:

 T T 
  ∂~q ∂f ∂~p ∂f
∂f
 + 
 ∂~q   ∂~q ∂~q ∂~q ∂~p 
   
 =  =
 ∂f   T T 
 ∂~q ∂f ∂ p ∂f 
~
∂~
p +
∂~p ∂~q ∂~p ∂~p
(9.526)
 T T
 
∂~q ∂~p ∂f
 
 ∂~q
 ∂~q   ∂~q 

   
 T T   ∂f 

 ∂~q ∂~p 
∂~p ∂~p ∂~p

Comparando a (9.526) con (9.501) vemos que: [∂f /∂~q, ∂f /∂~p] = J˜T ∂f /∂~q, ∂f /∂~p
Es decir:
 
∂f
 ∂~q 
∂g ∂g ˜ ˜T  
[f, g](q,p) = , J Ẽ J 


 (9.527)
∂~
q ∂p~  ∂f 
∂~p
De acuerdo con (9.516) obtenemos entonces:
 
∂f
 ∂~q 
∂g ∂g  
[f, g](q,p) = , C Ẽ 

 = C [f, g]
 (q,p) (9.528)
q ∂~p
∂~  ∂f 
∂~p
Hemos mostrado que si la transformación (q, p) → (q, p) es canónica entonces se
cumple la igualdad (9.522). El inverso también vale: si para cualquier par de variables
dinámicas f y g vale la identidad (9.522) para una y la misma constante C 6= 0, entonces
la transformación de las 2l variables qν y pν a las 2l variables q ν y pν es canónica con
valencia C.
Este es pues otro test del carácter canónico de una transformación. Para una
transformación canónica univalente, C = 1, se cumple:
[f, g](q,p) = [f, g](q,p) (9.529)
En otras palabras, los corchetes de Poisson son invariantes bajo transformaciones
canónicas univalentes, lo cual es el mismo resultado (9.402). En resumen, para estas
transformaciones es innecesario especificar respecto a cuales variables se evalúan los cor-
chetes de Poisson.
Otras propiedades de los corchetes de Lagrange. Sea el siguiente conjunto

de 2l variables dinámicas: u1 , u2 , ...ul , v1 , v2 , ...vl . Usando notación vectorial, dicho
conjunto se puede escribir como (~u, ~v ). Podemos formar con estas variables los siguientes
corchetes de Lagrange y Poisson:
[~u, ~u]; [~u, ~v ]; [~v , ~v ]; {~u, ~u}; {~u, ~v }; {~v , ~v }
A su vez con estos corchetes podemos formar las siguientes matrices de orden 2l:
   
[~u, ~u] [~u, ~v ] {~u, ~u} {~u, ~v }
P̃ =   ; L̃ =   (9.530)
[~v , ~u] [~v , ~v ] {~v , ~u} {~v , ~v }
Mostremos que se cumple lo siguiente: L̃P̃ = I, donde I˜ es la identidad de orden

2l.
Los corchetes de Langrange se pueden expresar en forma similar a (9.524):
 
∂~q
 ∂f 
∂~q ∂~p  
{f, g} = , Ẽ   (9.531)
∂g ∂g  ∂~p 
∂f
Un elemento tı́pico de la matriz L̃P̃ es de la forma siguiente:

2l 2l
! !
X X ∂~z T ∂~z ∂xm T ∂xi
{xn , xi } [xi , xm ] = Ẽ Ẽ (9.532)
i=1 i=1
∂xi ∂xn ∂~z ∂~z
donde xi es una componente del vector [~u, ~v ] y zi representa una componente del vector
q , p~].13 Notando que:
[~
X2l
∂zr ∂xi ∂zr
= = δrs ; Ẽ 2 = −I˜ (9.533)
i=1
∂xi ∂z s ∂zs
y que:
∂zt ∂xm
Eµr Ert = −δnm (9.534)
∂xn ∂zµ
obtenemos entonces que:

2l
X
{xn , xi } [xi , xm ] = −δnm ⇒ L̃P̃ = −I˜ (9.535)
i=1
O sea que el corchete de Lagrange es, excepto por el signo, el recı́proco del corchete
de Poisson. La invariancia del uno implica la invariancia del otro. Vimos que los corchetes
de Poisson son invariantes bajo transformaciones canónicas univalentes, por tanto se
13 Véase las fómulas (9.385).
sigue la invariancia de los corchetes de Lagrange bajo estas fransformaciones.14 Otras

propiedades de los corchetes de Lagrange son las siguientes:
   
 ~ q ~q 
  ,   = Ẽ
 
p~ p
~
∂~p ∂~q
{~
q, f } = ; {~
p, f } = − (9.536)
∂f ∂f
{g, f } = −{f, g}
1
{cf, g} = {f, cg} = {f, g}
c
No se cumplen las propiedades de linealidad ni la identidad de Jacobi, o sea que
los corchetes de Lagrange no permiten definir un álgebra.
Ejemplo 9.9.1 Analizar la siguiente transformación compleja, y si es canónica, hallar la
función generatriz y la valencia.
1 1
q = √ (q + ip) ; p = √ (q − ip) (9.537)
2 2
La transformación puede escribirse en la forma:
√ √
p = i(q − 2q) ; p = 2q − q (9.538)
La transformación será canónica libre de primera clase con valencia C, si, de acuer-
do con (9.158), puede generarse por una función tal que:
∂F ∂F
Cp = ; p=− (9.539)
∂q ∂q
Es simple mostrar que la transformación (9.537) será canónica si F y C están dadas
por:
1 2 1 2 √
F = q + q − 2qq ; C = −i (9.540)
2 2
De acuerdo con (9.159), el nuevo hamiltoniano será:
H = iH (9.541)
Es simple mostrar de (9.492) que {q, p} = −i.
Ejemplo 9.9.2 En la transformación canónica del ejemplo 9.9.1 hallar el corchete de
Poisson de q, y de p. Resolver el problema del oscilador armónico lineal usando dicha
transformación canónica.
14 El corchete de Lagrange de dos constantes de movimiento es una constante de movimiento. Sin
embargo, a diferencia de los de Poisson, los corchetes de Lagrange no sirven para hallar nuevas constantes
de movimiento porque para evaluarlos hay que conocer todas esas constantes.
Como la transformación (9.537) es canónica con valencia C = −i, se sigue de la

fórmula general para los corchetes de Poisson que:
[q, p] = −i (9.542)
resultado que también puede obtenerse directamente de las fórmulas de la transforma-

ción.
Nótese que toda transformación lineal con coeficientes constantes en el espacio de
fases bidimensional será canónica con valencia igual al determinante de la matriz de la
transformación:
q = aq + bp ; p = eq + f p ⇒ c = af − be (9.543)
El hamiltoniano del oscilador armónico lineal es:

p2x 1
H= + kx2 (9.544)
2m 2
y puede escribirse en la forma siguiente:
1
H= I(q 2 + p2 ) (9.545)
2
mediante la transformación:
r
I √
x= q ; px = Imω p (9.546)
mω
donde k = mω 2 e I es una constante que puede tomar cualquier valor. En la transforma-
ción (9.546) procedemos por analogı́a con una correspondiente transformación cuántica.
Si ahora realizamos la transformación canónica:
1 i
q = √ (q + p) ; q = √ (p − q) (9.547)
2 2
obtenemos para H:
H = Iωqp (9.548)
entonces el hamiltoniano CH será:
−iH = −iIωN (9.549)
donde llamamos N a:
N = qp (9.550)
podemos ver que E = IN y que:

N , q = −q ; N , p = p (9.551)
Vemos que q, p y N son análogos a los operadores de destrucción, de creación y de

número, â, â+ , N̂ , de la mecánica cuántica.
La transformación (9.543) es de cambio de escala, o sea que según las fórmulas

(9.191) y (9.192) es libre de segunda clase, con valencia igual al producto de los factores
de escala:
r
mω 1 1
C= ·√ = (9.552)
I Imω I
de modo que el hamiltoniano correspondiente a las variables canónicas q y p será ωqp.
Entonces, el hamiltoniano correspondiente a q y p es:
H = −iωq p (9.553)
Las fórmulas (9.551) nos permiten escribir directamente las ecuaciones de movi-
miento de Poisson, ecuaciones (9.363):

q̇ = q, H ; ṗ = p, H (9.554)
con lo cual de (9.553) y (9.551) obtenemos:
q̇ = −iωq ; ṗ = iωp (9.555)
Que podemos integrar fácilmente:
q = q 0 e−iωt ; p = q ⋆0 eiωt (9.556)
donde hemos notado que q y p son complejo conjugadas entre sı́. Utilizando las fórmulas
(9.547) obtenemos a q y p en función del tiempo:
√ √
q = 2Re (q 0 e−iωt ) ; p = 2Im(q 0 e−iωt ) (9.557)
Es claro que q 0 puede determinarse de las condiciones iniciales sobre q y p:

√ √
q0 = 2Re q 0 ; p0 = 2Imq0 (9.558)
Entonces obtenemos para q(t) y p(t) en términos de sus valores iniciales:
q = q0 cos ωt + p0 sen ωt
(9.559)
p = p0 cos ωt + q0 sen ωt
y para las variables originales x y px , obtenemos:

px0
x = x0 cos ωt + sen ωt
mω
(9.560)
px = px0 cos ωt − mωx0 sen ωt
Ejemplo 9.9.3 Analizar las dispersiones de x y de px para un ensamble de osciladores

armónicos lineales que tengan la misma energı́a. El ensamble está ilustrado en el ejemplo
4.8.1, sección 4.8.
Los distintos sistemas del ensamble difieren sólo por la fase. La dispersión en x se
caracteriza por su varianza (∆x)2 , definida por:
(∆x)2 = h(x − hxi)2 i = hx2 i − hxi2 (9.561)
donde h...i denota el promedio sobre el ensamble. Como x(t) puede escribirse en la forma:
x = Ax sen(ωt + δ) (9.562)
Si promediamos sobre todos los posibles valores de δ, 0 ≤ δ ≤ 2π, obtenemos los
promedios de ensamble microcanónicos:
A2x
hx2 i = ; hxi = 0 (9.563)
2
px se comporta análogamente. Obtenemos entonces que:
1 1
(∆x)2 = A2x ; (∆p)2 = A2p (9.564)
2 2
El producto ∆x ∆px será entonces:
1
(∆x) (∆px ) = Ax Ap (9.565)
2
Notamos según el ejemplo 9.9.2 que los máximos valores de x y px , que se obtienen
de las fórmulas (9.560), son:
px
A2x = x20 + 2 0 2 ; A2p = p2x0 + m2 ω 2 x20 (9.566)
m ω
que pueden expresarse en función de q0 y p0 mediante (9.546):
I
A2x = (q 2 + p20 ) ; A2p = Iωm(q02 + p20 ) (9.567)
mω 0
(∆x) (∆px ) = I(q02 + p20 ) (9.568)
Notando que según (9.550):
N = (Re q 0 )2 + (Im q 0 )2 (9.569)
Entonces obtenemos al usar (9.549):
E
∆x ∆px = IN = (9.570)
ω
Este valor no depende del tiempo, en concordancia con el teorema de Liouville,
ejemplo 4.8.4, sección 4.8. El resultado (9.569) es una propiedad del ensamble o sea que
para un valor dado de E, queda determinado de manera única el valor del producto
∆x ∆px . Solamente disminuyendo el valor de E es posible disminuir el valor de este
producto; o sea que una disminución de ∆x implica un aumento en ∆px y viceversa.
Según la desigualdad de Heisenberg para osciladores mecánico-cuánticos:
h̄
∆x ∆px ≥ (9.571)
2
se sigue entonces de (9.551) que E ≥ h̄ω/2. Si tomamos I igual a la constante de
Planck, se sigue también de (9.551) que E = nh̄ω. Estos resultados recuerdan a análogos
resultados mecánico-cuánticos.
10
La ecuación de Hamilton-Jacobi con
variables de acción-ángulo
Aquı́ estudiaremos más en detalle el significado fı́sico de las soluciones de la ecua-

ción de Hamilton-Jacobi con énfasis en los sistemas que presentan movimientos multi-
periódicos. Se desarrollará la teorı́a hasta el punto en el cual se perciban claramente las
diferencias y similitudes con la mecánica cúantica, cuando se trate con sistemas atómicos.
Las soluciones y los métodos de solución de la ecuación de Hamilton-Jacobi han
merecido numerosos estudios. El método de separación de variables permite en principio
resolver cualquier problema integrable introduciendo las coordenadas adecuadas. Los
modelos no integrables, como el famoso problema de los tres cuerpos, son objeto de
muchas investigaciones en la actualidad. Un estudio matemático de los principales casos
en que se resuelve la ecuación de Hamilton-Jacobi está en la sección 27 del texto de
(Gantmacher Op. cit.).
10.1. Los invariantes adiabáticos

Desde cuando el fı́sico aleman Max Planck en 1899 descubrió que la absorción y
la emisión de energı́a radiante por la materia no se producen en cantidades arbitrarias
sino de una manera cuantizada, los fı́sicos han tratado de introducir las ideas cúanti-
cas en la mecánica clásica. En 1913 Niels Bohr explicó el espectro del hidrógeno con la
mecánica clásica más dos suposiciones de tipo cúantico: que los electrones sólo tienen
ciertos movimientos periódicos (órbitas) estables y no un continuo de tales movimientos,
y que pueden pasar entre dos órbitas adyacentes por emitir o absorber un cuanto de luz.
Los movimientos ligados de los sistemas cuánticos aislados que son estables o estaciona-
rios forman un conjunto discreto. Los demás estados son inestables, aunque ligados, y
forman un conjunto continuo; son estados no estacionarios. Desde entonces hasta la ac-
tualidad (y pasará algún tiempo hasta que la cuestión sea definitivamente resuelta), los
fı́sicos téoricos investigan los movimientos estables que presentan los sistemas atómicos;
con ello se busca determinar la causa de que ciertos estados sean estables y los demás
sean inestables. A comienzos del siglo la cuestión de interés no era tanto las causas de
415
la cuantización de los sistemas atómicos (lo cual se tomó como un dato experimental)
sino determinar cuales son las cantidades susceptibles de ser cuantizadas. Se halló que
las cantidades a ser cuantizadas deben satisfacer los siguientes dos requisitos: pueden
cambiar sólo por múltiplos enteros de la constante de Planck h̄ y deben permanecer
absolutamente inalteradas cuando se someta el sistema a una influencia externa que no
sea capaz de causar una alteración de magnitud h̄ en esa cantidad. Tales cantidades se
llaman invariantes adiabáticos y fueron extensivamente estudiados por P. Ehrenfest en
los años 1914-1923.1 Los invariantes adiabáticos de la vieja teorı́a cúantica coinciden con
las llamadas variables de acción.
Un invariante adiabático para un sistema de un grado de libertad. Sea

un sistema de un grado de libertad en un estado arbitrario de movimiento acotado con
lo cual el movimiento además será periódico. Sea λ un parámetro caracterı́stico de los
efectos externos sobre el sistema; si λ cambia, cambian los efectos externos sobre el
sistema con lo cual se realizará un trabajo y posiblemente cambie también la frecuencia
de la oscilación además de la energı́a total.
Ciertamente la energı́a total dependerá del valor de λ siendo constante para cada
valor que tenga λ: E = E(q, p, λ). Las expresiones para la energı́a total y el perı́odo del
movimiento son de la forma:
1
E = a(q, λ) q̇ 2 + U (q, λ) (10.1)
2
Z q2 √
2a dq
T = √ (10.2)
q1 E −U
donde q1 y q2 son las raı́ces de la ecuación E = U (q, λ) para valores dados de E y λ.

Puesto que E depende de λ, T depende de E y de λ. Si λ cambia con el tiempo, E
dependerá del tiempo a través de λ:
∂E
Ė = λ̇ (10.3)
∂λ
Se dice que el parámetro λ varı́a adiabáticamente si:
λ
λ̇ ≪ (10.4)
T
es decir, si λ varı́a muy poco en el curso de un perı́odo del movimiento del sistema. Un
invariante adiabático es una cantidad que no cambia cuando el sistema se somete a una
variación adiabática de λ. Sabemos que, en virtud de las ecuaciones de Hamilton:
∂H
Ḣ = (10.5)
∂t
O sea que para un sistema conservativo como el que consideramos aquı́:
∂H ∂H
Ė = = λ̇ (10.6)
∂t ∂λ
1 El tema continúa estudiándose en la actualidad. Véase por ejemplo: K.P. Marzlin, B.C. Sanders,
Physics review letters 93, 160408(2004). También http://xxx.lanl.gov/abs/quant-ph/0405059.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 417
Como λ varı́a muy poco en un perı́odo del movimiento, podemos considerar que
λ̇ también es constante. Entonces al promediar la ecuación (10.6) sobre un perı́odo
obtenemos:
Z
1 T ∂H
Ė = λ̇ dt (10.7)
T 0 ∂λ
De acuerdo con una de las ecuaciones de Hamilton se cumple:
dq
dt = (10.8)
∂H/∂p
La ecuación (10.7) se puede entonces escribir como:
I
∂H/∂λ
dq
∂H/∂p
Ė = λ̇ I (10.9)
1
dq
∂H/∂p
H
donde denota la integral de lı́nea sobre la trayectoria de fases del sistema en un
perı́odo de movimiento. En un perı́odo, por hipótesis, λ cambia muy poco, por tanto E
es constante, según (10.6). Como una trayectoria de fases se caracteriza por la relación:
p = p(q; E, λ) (10.10)
donde E y λ son fijos, entonces p (o q) solo, es suficiente para especificar el estado. Sobre
una trayectoria de fases dada C se cumple entonces que H(q, p, λ) = HC (p, λ), luego:
dHc ∂Hc ∂Hc ∂p
= + (10.11)
dλ ∂λ ∂p ∂λ
Como durante un perı́odo E no cambia apreciablemente y HC = E se cumple
aproximadamente que:
∂Hc ∂Hc /∂λ
=− (10.12)
∂p ∂p/∂λ
como por otra parte ∂HC /∂E = (∂HC /∂p)(∂p/∂E) = 1, cumple:
∂Hc 1
= (10.13)
∂p ∂p/∂E
Reemplazando a (10.12) y (10.13) en (10.9) obtenemos:
I
∂p
− dq
∂λ
Ė = λ̇ I (10.14)
∂p
dq
∂E
La ecuación (10.14) se puede escribir en la forma:
I
∂p ∂p
Ė + λ̇ dq = 0 (10.15)
∂E ∂λ
Dado que durante un perı́odo E y λ permanecen prácticamente constantes, de

(10.10) se sigue que:
∂p ∂p ∂p
= Ė + λ̇ (10.16)
∂t ∂E ∂λ
y podemos sin mayor error reemplazar a Ė por Ė, con lo cual en vez de (10.15) podemos
escribir:
I I
∂p d
dq = 0 (λ̇2 ) ⇒ p dq = 0 + 0(λ̇2 ) (10.17)
∂t dt
Se define la variable de acción J como:
I
J = p dq (10.18)
Entonces (10.17) nos dice que J˙ = 0, o sea que J es un invariante adiabático (una
cantidad que no cambia cuando λ varı́a adiabáticamente). Concluimos que J depende
de la energı́a del sistema pero varı́a muy poco con λ. Esto permite calcular a partir de
J la frecuencia del movimiento:
I I I
∂J ∂p 1
= dq = dq = dt = T (10.19)
∂E ∂E ∂HC /∂p
o sea que:
1
ν= (10.20)
∂J/∂E
La ecuación (10.18) tiene la siguiente interpretación geométrica: J es el valor del
área encerrada por la curva de fases que describe el sistema en un perı́odo. La invariancia
adiabática de J permite concluir que una perturbación al sistema que varı́a lentamente
con el tiempo puede producir una deformación de la trayectoria de fases pero de tal
manera que no se cambia el valor del área encerrada por esa curva. J también se puede
escribir como una integral de superficie:
Z
J = dq dp (10.21)
Ejemplo 10.1.1 Evaluar la variable de acción J para un oscilador armónico unidimen-

sional.
En este caso el hamiltoniano constante es:

p2 1
H= + mω 2 q 2 = E (10.22)
2m 2
que puede escribirse en la forma:
p2 q2
+ =1 (10.23)
2mE 2E/(mω 2 )
√
p La ecuación (10.23) define una elipse en el plano de fases cuyos semiejes son 2mE
y 2E/(mω 2 ). El valor de J es igual al área encerrada por la elipse, esto es:
√ p E
J = π ( 2mE) ( 2E/(mω 2 )) = 2π (10.24)
ω
La invariancia adiabática de J significa en este caso que al variar lentamente los
parámetros del oscilador (m y ω), la energı́a varı́a de manera proporcional a la frecuencia
ω.
Ejemplo 10.1.2 Mostrar explı́citamente la invariancia adiabática de J para un péndulo

simple sometido a un acortamiento o alargamiento adiabático de la cuerda, para pe-
queñas oscilaciones.
En este caso el hamiltoniano, constante, es:

1 2 2
H= ml ϕ̇ + mgl(1 − cos ϕ) = E (10.25)
2
para pequeñas oscilaciones:
1 2 2 1 ϕ̇2 ϕ2
ml ϕ̇ + mgl ϕ2 = E ⇒ 2
+ =1 (10.26)
2 2 2E/(ml ) 2E/(mgl)
que es la ecuación de una elipse en el plano ϕ − ϕ̇, el área encerrada es:
p p 2πE E 1
π 2E/(ml2 )
2E/(mgl) = √ = 2π (10.27)
ml gl ω ml2
H
Es claro que J = p dq está dada también por la expresión (10.24):
E
J = 2π (10.28)
ω
para probar la invariancia adiabática de J, calculemos el trabajo realizado al variar la
longitud del hilo del péndulo en una cantidad dl. Este trabajo es:

dA = −mlϕ̇2 − mg cos ϕ dl (10.29)
en (10.29) el primer término representa el trabajo de la fuerza de la ligadura y el segundo

el trabajo de la fuerza de gravedad. Para pequeñas oscilaciones (10.29) se puede escribir
como:

1
dA = −mg dl + mg ϕ2 − mlϕ̇2 dl (10.30)
2
El primer término en (10.30), −mg dl, representa el trabajo hecho para subir la
posición de equilibrio de la masa del péndulo; y el otro término representa la energı́a
comunicada a la oscilación, que llamaremos dE:

1
dE = mg ϕ2 − mlϕ̇2 dl (10.31)
2
Sabemos que para un valor dado de l los valores medios de las energı́as cinética y
potencial son iguales, e iguales a la mitad de la energı́a total E (teorema del virial):
1 2 2 1 1
ml ϕ̇ = mgl ϕ2 = E (10.32)
2 2 2
Comparando (10.32) y (10.31), al tomar el promedio temporal de dE, obtenemos
que:
E
dE = − dl (10.33)
2l
p
Como la frecuencia angular es ω = g/l, vemos que el cambio fraccional de ω es
proporcional al cambio fraccional de l cuando la longitud del péndulo se altera en dl:
dω 1 dl
=− (10.34)
ω 2 l
Comparando a (10.33) y (10.34) obtenemos que:
dE dω
= (10.35)
E ω
Se sigue por integración de (10.35) que:
J E
= = Constante (10.36)
2π ω
Argumentos similares se pueden usar cuando ω se varı́a lentamente a causa de
alguna otra influencia externa. Se usó el carácter adiabático de la variación en l, dl, al
tomar en (10.31) el promedio temporal: se asumió que dl es prácticamente constante
durante un perı́odo de la oscilación.
Como el oscilador armónico del ejemplo de (10.22) equivale matemáticamente a un
péndulo con una amplitud de oscilación pequeña, se sigue que E/ω es constante en tal
caso. Sin embargo, se puede mostrar que para otros sistemas de un grado de libertad,
E/ω no es un invariante adiabático, aunque para tales sistemas habrá otros invariantes
adiabáticos.
10.2. Los toroides invariantes

En la sección 9.6 analizamos en detalle la solución de las ecuaciones de movimiento
de un sistema conservativo generalizado por el método de Hamilton-Jacobi. Esto nos
condujo a la ecuación de Hamilton-Jacobi independiente del tiempo, ecuaciones (9.305)
y siguientes del capı́tulo anterior. El resultado es que para tales sistemas es posible hallar
una transformación canónica generada por Σ, que permite expresar a (~q, p~) en función de
(~q, ~p), dados por pν = αν (ν = 1, 2, ...l − 1), pl = −t + αl , q ν = βν (ν = 1, 2, ...l) donde
αν y βν son 2l constantes y se exige que Bl = h. Si no se toma a h coincidiendo con una
de las βν sino que se deja en general h = H(β) ~ se obtendrá la solución en términos de
~p = β, ~ ~q = ~γ t + α
~ donde α ~ ~
~ y β son las constantes de integración y ~γ son funciones de β.
El formalismo de las variables acción-ángulo se caracteriza por:
(a) Es aplicable a sistemas conservativos generalizados.

(b) Se define para sistemas ligados.
(c) Se identifican las l constantes pν con l invariantes adiabáticos del sistema.
(d) Si existen las l constantes de movimiento se dice que el sistema es integrable.
Los sistemas integrables se caracterizan por poseer un número de constantes de
movimiento uniformes igual al número de grados de libertad:2 en un sistema no integrable
el número de constantes de movimiento uniformes es menor que l, y la trayectoria fásica
cubrirá (total o parcialmente) regiones de más de l dimensiones en el espacio fásico.
Veremos que si el sistema posee más constantes de movimiento uniformes que el número
de grados de libertad, entonces la trayectoria fásica cubre regiones de dimensión menor
que l y además la separación de variables es posible en más de un sistema de coordenadas.
Las ecuaciones de movimiento de un sistema hamiltoniano de l grados de libertad
son de la forma:
ẋi = fi (x1 , x2 , ...x2l , t) ; i = 1, 2, ..,2l (10.37)
Una integral primera del sistema (10.37) es una función constante que se obtiene
a partir del mismo:
d
Φ(x1 , x2 , ...x2l , t) = 0 (10.38)
dt
La integral primera Φ = C es una superficie 2l dimensional en el espacio de 2l + 1
dimensiones, de coordenadas x1 , x2 , ...x2l , t, que posee la propiedad de que cada curva
integral que tiene un punto común con esta superficie está enteramente contenida en
ella. Si se han hallado k integrales primeras:
Φi (x1 , x2 , ...x2l , t) = Ci ; i = 1, 2, ...k (10.39)
Y si todas estas integrales son independientes, o sea, si al menos un determinante:

Φ1 , Φ2 , ...Φk
J 6= 0 (10.40)
xj1 , xj2 , ...xjk
donde xj1 , xj2 , ...xjk son k funciones cualesquiera de las x1 , x2 , ...x2l , entonces a partir
de las ecuaciones (10.39) se pueden expresar k funciones de t desconocidas xj1 , xj2 , ...xjk
en función de las demás y sustituyéndolas en (10.37), reducir el problema a la integración
de un sistema de ecuaciones con menos incógnitas que 2l. Si k = 2l y todas las integrales
son independientes, entonces (10.39) es un sistema de 2l ecuaciones algebraicas con
las 2l incógnitas xi , que puede resolverse en el caso en que todas las funciones Φi sean
uniformes. Sucede a veces que entre las Φi hay algunas que son funciones multiformes del
estado del sistema y entonces las funciones Φ1 , Φ2 , ...Φ2l no determinan unı́vocamente
el estado cuando toman los valores constantes C1 , C2 , ...C2l .
Para que un sistema de ecuaciones diferenciales (10.37) sea integrable es suficiente,
pues, que existan l integrales primeras uniformes. Cuando el sistema permite la separa-
ción de variables en la forma:
Z
Fi (xi ) dxi = t; i = 1, 2, ..,2l (10.41)
2 Es posible que un sistema sea integrable mas no separable, es decir, que no se puede desacoplar las
ecuaciones de movimiento.
se dice que el sistema se integra por cuadraturas.
Teorema de Liouville sobre los sistemas integrables. Recordemos que una

función Φ es una integral primera de un sistema de hamiltoniano H si su corchete de
Poisson con H es nulo:
[H, Φ] = 0 (10.42)
Estamos excluyendo la constante t0 , conjugada canónica de H, y funciones de t0 .
Dos funciones F1 y F2 del estado de un sistema hamiltoniano están en involución
si su corchete de Poisson es nulo. Liouville demostró que si en un sistema de l grados
de libertad se conocen l integrales primeras independientes y uniformes en involución
entonces ese sistema se integra por cuadraturas. El enunciado exacto del teorema es:
sean l funciones en involución:
Φ1 , Φ2 , ...Φl ; [Φµ , Φν ] = 0 ; µ, ν = 1, 2, ...l (10.43)
en un espacio fásico de dimensión 2l. Consideremos los subespacios (hipersuperficies
2l − 1 dimensionales):
Sν = {(q, p) : Φν (q, p) = Cν } ; ν = 1, 2, ...l (10.44)
y el producto directo de los mismos:
Mc = {(q, p) : Φν = Cν ; ν = 1, 2, ...l} (10.45)
Suponemos que sobre Mc las l funciones Φν son independientes (esto es, que los
l gradientes de las hipersuperficies Sν son linealmente independientes en cada punto de
Mc ).
Entonces, recordando el teorema sobre simetrı́as y leyes de conservación de la sec-
ción 9.8, como los Φν son generadores infinitesimales de las transformaciones canónicas
que dejan invariante a H, se cumple que:
(i) Mc es un subespacio invariante bajo cada una de las transformaciones canónicas
infinitesimales generadas por Φ1 = H, Φ2 , ...Φl .
(ii) Si las funciones Φν son continuas y uniformes y tales que (q) y (p) siempre
toman valores finitos, entonces el subespacio Mc corresponde con un toroide de dimensión
l:
T l = {ϕ1 , ϕ2 , ...ϕl } mod 2π (10.46)
donde ϕ1 , ϕ2 , ...ϕl son coordenadas angulares sobre el toroide invariante T l .
(iii) El hamiltoniano H genera sobre Mc un movimiento que se denomina cuasipe-
riódico, definido en términos de las coordenadas angulares ϕ~ = (ϕ1 , ϕ2 , ...ϕl ) sobre el
toroide invariante T l :
d ~
ϕ
~=~
ω; ω
~ =ω
~ (C) (10.47)
dt
(iv) Las ecuaciones canónicas de Hamilton se integran por cuadraturas.3
3 Una demostración rigurosa del teorema puede verse en el libro de V. Arnold, Les méthodes matéma-
tiques de la mecánique classique, Mir, Moscú, 1976.
Ejemplo 10.2.1 Aplicar el teorema de Liouville al estudio del oscilador bidimansional.
Según el teorema de Liouville sobre sistemas integrables, si en un sistema canónico

de dos grados de libertad se conoce una integral primera F que no depende de H,
entonces el sistema se integra por cuadraturas; el subespacio definido por H = h y
F = f siendo f y h dos constantes, es un toro invariante sobre el cual el movimiento
es cuasiperiódico. Para precisar, consideremos un oscilador bidimensional descrito por
el hamiltoniano:
p2x p2y 1
H= + + m(ωx2 x2 + ωy2 y 2 ) (10.48)
2m 2m 2
El sistema de ecuaciones diferenciales (10.37) para este caso es:
px py
ẋ = ; ẏ =
m m
(10.49)
ṗx = −mωx2 x ; ṗy = −mωy2 y
Es fácil ver que:

px py
p˙x + mωx2 x ẋ = ṗy + mωy2 y ẏ = 0 (10.50)
m m
Con lo cual se obtiene que las siguientes son integrales primeras:
p2x 1 p2y 1
+ mωx2 x = E1 ; + mωy2 y 2 = E2 (10.51)
2m 2 2m 2
La hipersuperficie bidimensional ME1 E2 tiene intersecciones con los planos de fase
(x, px ) y (y, py ) dadas por las elipses (10.51).
Si se quiere, pueden tomarse como integrales primeras a H y una de las dos (10.51);
dado que H = E1 + E2 .
La hipersuperficie H = h es una esfera (o mejor elipsoide) en el espacio fásico; tal
hipersuperficie es de dimensión 3, en tanto que H1 = E1 es unidimensional siendo la
hipersuperficie MEE1 bidimensional.
El producto directo de las elipses definidas por (10.51) es un toroide de dimensión 2,
en tanto que los puntos del producto directo de las regiones H = h y H1 = E1 constituyen
una superficie bidimensional, que se puede hacer corresponder topológicamente con un
toroide bidimensional (véase figura 10.1).
El movimiento cuasiperiódico generado por H sobre ME1 E2 se define en términos
de las coordenadas angulares ϕ ~ = (ϕ1 , ϕ2 ) de los puntos de la superficie de un toro que
se mueven uniformemente sobre las circunferencias ϕ1 = Constante y ϕ2 = Constante,
con frecuencias angulares constantes que dependen de los valores de E1 y E2 :
d~
ϕ
=~
ω(E1 , E2 ) (10.52)
dt
Si ω1 y ω2 son inconmensurables, entonces la trayectoria de fases llena totalmente
el toro cuando t → ∞, en tanto que cuando ω1 y ω2 son conmensurables la trayectoria
de fases es cerrada y por lo tanto ocupa una región de dimensión menor a la del toro, es
ϕ2
ϕ1
Figura 10.1 Toroide generado por H.
decir, unidimensional. Para que esto ocurra es necesario que exista una nueva constante
de movimiento además de E1 y E2 .
Por ejemplo, cuando ωx = ωy , existe otra constante de movimiento relacionada
con la degeneración, que es el momento angular:
A = xpy − ypx (10.53)
Cuando ωy = 2ωx la constante es:
A = (m2 ωx2 x2 − p2x ) y + xpx py (10.54)
y cuando ωx = 2ωy , es constante:
A = (m2 ωy2 y 2 − p2y ) x + ypx py (10.55)
Para el caso ωx = ωy es fácil ver que hay otra constante dada por:
B = px py + m2 ω 2 xy (10.56)
y que se cumple:
B
[E2 , B] = −mω 2 A ; [E2 , A] = (10.57)
m
o sea que E2 con B1 y E2 con A no están en involución. Tampoco A y B están en
involución puesto que su corchete de Poisson vale E2 − E1 . Pero aún es posible formar
una combinación lineal de A y B que esté en involución con E1 y con E2 :
C = B + mω tan(ϕ10 − ϕ20 ) A (10.58)
donde ϕ10 − ϕ20 es la diferencia de fase de los dos movimientos oscilatorios.
Resultados análogos se esperan cuando las frecuencias satisfacen la relación nωx =
mωy donde n y m son números enteros.
Vectores tangentes a Mc . Como las l funciones Φν son independientes, también

serán linealmente independientes los l vectores gradientes 2l-dimensionales, perpendicu-
lares a las superficies Φν = Cν , que llamaremos V~ν .

∂Φν ∂Φν ∂Φν
V~ν = , , ... (10.59)
∂q1 ∂q2 ∂pl
Un vector V ~ν no tiene componentes a lo largo de un vector Ẽ V
~µ , donde la matriz
simplicial Ẽ fue definida en la sección 9.9. En efecto:
 
∂Φµ
 ∂~q 
∂Φν ∂Φν  
V~ν · Ẽ V~µ = , Ẽ   = [Φµ , Φν ] = 0 (10.60)
∂~q ∂~ p  ∂Φµ 
∂~p
Entonces concluimos que sobre el subespacio l-dimensional Mc existen l vectores
linealmente independientes, tangentes a Mc en cada punto. En efecto, los V~ν son lineal-
mente independientes, y como los autovalores de Ẽ son todos diferentes se concluye que
los Ẽ V~ν son linealmente independientes.
Se sigue entonces que en cada punto de Mc un vector tangente (por ejemplo la
dirección de la trayectoria de fases en ese punto) puede expresarse como combinación
lineal de los l vectores Ẽ V~ν (ν = 1, 2, ...l).
Si se realiza en un punto de Mc la transformación canónica infinitesimal generada
por Φν , de acuerdo con la fórmula (9.349), el cambio experimentado por una variable
dinámica f está dado por:

∂f ∂f ~ν
∂ν f = ǫ [f, Φν ] = −ǫ , · Ẽ V (10.61)
∂~q ∂~p
Se sigue entonces que el cambio experimentado por el vector de estado (~q, ~p) es:
 
1 0 0 . . . 0
 
 
   0 1 0 . . . 0 
 
~q  
  ~ ~
∂ν   = −ǫ  . . . .. .. .. ..  Ẽ Vν = −ǫẼ Vν (10.62)
 .. .. .. . . . . 
p
~  
 
 
 0 0 0 . . . 1 
O sea que los desplazamientos producidos por cada una de las transformaciones
canónicas infinitesimales generadas por Φ1 , Φ2 , ...Φl están contenidos totalmente den-
tro del subespacio Mc . Con esto queda demostrada la proposición (i) del teorema de
Liouville.
En particular, para cuando Φ1 = H se tiene que:
   
q
~ −∂H/∂~p
∂   = −ǫ   ⇒ ~q˙ = ∂H ; ~p˙ = −
∂H
(10.63)
∂~p ∂~q
p~ ∂H/∂~q
como debe ser.

Hemos mostrado que cualquier desplazamiento sobre Mc se puede obtener por
medio de las l transformaciones canónicas asociadas a las integrales primeras Φν en
involución.
Como en cada punto de Mc cada uno de los vectores tiene una dirección bien de-
finida, concluimos que a cada integral primera Φν se le puede asociar una familia de
trayectorias “paralelas” sobre la superficie de Mc y que en consecuencia a las l integrales
primeras en involución Φν se les puede asociar un sistema de coordenadas curvilı́neas
sobre Mc . En efecto, los l desplazamientos finitos asociados a los l grupos de transfor-
maciones correspondientes a las Φν se pueden describir mediante l parámetros reales. Si
fijamos sobre Mc un punto (~q, p~) ≡ x0 , entonces cualquier punto de Mc se puede obtener
de éste por acción de los l grupos de transformaciones asociados a Φ1 , Φ2 , ...Φl :
g(~r)x0 ≡ g1 (r1 ) g2 (r2 ) ...gl (rl )x0 = xr1 , r2 , ...rl ∈ Mc (10.64)
donde gν (rν ) es la transformación finita asociada a Φν siendo rν el parámetro. Entonces

los vectores ~r ≡ (r1 , r2 , ...rl ) definen unı́vocamente los puntos de Mc .
Correspondencia entre Mc y un toroide de dimensión l. Por hipótesis la

región Mc es acotada, ya que estamos tratando con sistemas ligados. Como consecuencia
de esto, los vectores ~r = (r1 , r2 , ...rl ) que sirven para caracterizar los puntos de Mc tienen
componentes acotadas. Para precisar, llamemos Rl al espacio euclı́deo l-dimensional en
el cual están definidos los vectores ~r; en consecuencia, la región del espacio fásico Mc
está asociada a un subespacio l-dimensional acotado de Rl mediante la fórmula (10.64).
Como la región Mc es acotada, ciertamente existen transformaciones g(~r) que re-
tornan un punto arbitrario x0 de Mc en sı́ mismo:
g(~r)x0 = x0 (10.65)
Podemos, por ejemplo, definir l transformaciones independientes que retornen a x0

en sı́ mismo de la siguiente manera:
g1 (1)x0 = x0 ; g2 (1)x0 = x0 ; ...gl (1)x0 = x0 (10.66)
Es decir, asociar el intervalo (0, 1) a cada una de las lı́neas cerradas que se obtienen
por desplazar el punto x0 mediante las transformaciones gν (rν ). Es claro entonces que
gν (mν )x0 = x0 donde mν es un número entero.
Por tanto podemos caracterizar el conjunto de todas las transformaciones de la
forma (10.65) mediante los vectores enteros:
~r = (m1 , m2 , ...ml ) ; mν = ... − 2, −1, 0, 1, ... (10.67)
A su vez el intervalo (0, 1) corresponde con el intervalo (0, 2π), de modo que pode-
mos hacer corresponder a la región Mc un toroide de dimensión l, T l , definido como el
producto cartesiano de l cı́rculos, siendo definidos los puntos de los l cı́rculos mediante
coordenadas angulares ϕν mod 2π:
T l = {(ϕ1 , ϕ2 , ...ϕl )} ; ϕ
~ mod 2π (10.68)
Existe una completa correspondencia entre T l y la región de Rl que representa los

puntos de Mc . Por tanto es posible asociar a los puntos de Mc un toroide de dimensión
l. Toda la argumentación depende de la existencia de transformaciones sobre Mc de la
forma (10.65) para cualquier punto de Mc .
Existencia en Mc de movimientos cuasiperiódicos. La transformación canóni-

ca generada por H tiene por parámetro a t. Entonces la correspondencia entre Mc y T l
permite asociar a cada valor de t un punto (ϕ1 , ϕ2 , ...ϕl ) mod 2π sobre T l . El movimien-
to generado por H en Mc se presenta uniforme sobre T l debido a que una variación ∆t
en el parámetro t se traduce en variaciones ∆ϕ1 , ∆ϕ2 , ...∆ϕl en las coordenadas sobre
T l . Como ciertamente la variación del parámetro t es uniforme, de igual manera serán
uniformes las variaciones en las coordenadas angulares sobre T l . En consecuencia:
ϕ̇ν = ων ; ων = ων (~c) ; ϕ
~ (t) = ϕ
~ (0) + ~ω t (10.69)
Hemos justificado las tres primeras proposiciones del teorema de Liouville.
Las superficies de sección de Poincaré. Asumamos que el espacio de fases es

4-dimensional (sistema autónomo de dos grados de libertad). Escojamos una superficie
bidimensional, que puede o no coincidir con uno de los planos de fase; para precisar
tomemos el plano x − px en un valor de y determinado. Cada vez que la trayectoria
de fases cruza el plano x − px en una dirección dada, un punto en el valor de x y
px es marcado sobre la superficie. Después de muchos ciclos de la trayectoria, en el
plano quedará formada una figura de puntos. Si tomamos como referencia el oscilador
armónico bidimensional (ejemplo 10.2.1), la figura tendrá forma elı́ptica (véase figuras
10.2 y 10.3). Cada elipse corresponde a una trayectoria. Un comportamiento similar
ocurre en las intersecciones con el plano x = 0. Los planos x − px y y − py son ejemplos
de superficies de sección y las figuras de puntos formados permiten obtener conclusiones
acerca de las frecuencias del movimiento. Si las frecuencias son conmensurables, las
intersecciones de la trayectoria con las superficies de sección se repiten debido a que la
trayectoria es cerrada, en caso contrario, las intersecciones cuando t → ∞ forman una
curva continua sobre la superficie de sección, que no es otra cosa que la intersección del
toroide invariante con la superficie de sección.
Que las intersecciones de la trayectoria con una superficie de sección están locali-
zadas sobre una curva única es una consecuencia de la existencia de una constante de
movimiento además de la energı́a. En efecto la conservación de la energı́a,
H(x, y, px , py ) = E (10.70)
permite expresar una variable en términos de las otras tres, py = py (x, y, px ).

Entonces es suficiente considerar la proyección de la trayectoria sobre el volumen
tridimensional (x, y, px ). Si hay una constante de movimiento además de H,
I(x, y, px , py ) = C (10.71)
entonces (10.70) y (10.71) se pueden combinar para darnos:
px = px (x, y) (10.72)
px
0 x
Figura 10.2 Superficies de sección de Poincaré en el plano x − px
py
0 y
Figura 10.3 Superficies de sección de Poincaré en el plano y − py
O sea que las intersecciones sucesivas de la trayectoria con la superficie de sección

y = 0 deben estar sobre la curva única px = px (x, 0).
Consideremos ahora el toroide asociado a las constantes de movimiento E y C,
MEC . Las coordenadas angulares sobre MEC son ϕ1 y ϕ2 siendo ω1 y ω2 las frecuencias
correspondientes. Ciertamente la relación de frecuencias es función de E y C:
ω1 (E, C)
α(E, C) = (10.73)
ω2 (E, C)
Para α = r/S, con r y S enteros, la trayectoria sobre el toro es periódica, cerrándo-
se al completarse r revoluciones en ϕ1 y S revoluciones en ϕ2 . En la superficie de sección
ϕ2 = Constante habrán S puntos fijos sobre una circunferencia de radio R que depen-
de solamente de E y C. Las sucesivas intersecciones están separadas por un tiempo
∆t = 2π/ω2 . Durante este intervalo, ϕ1 avanza por ω1 ∆t = 2πα.
La aplicación “twist” de Moser. Las ecuaciones que describen el movimiento

de la N -ésima a la (N +1)-ésima intersección de la trayectoria con la superficie de sección
son:
RN +1 = RN ; ϕN +1 = ϕN + 2πα (10.74)
La ecuación (10.74) constituye una aplicación (o mapeo discreto) de los puntos de
la superficie de sección en ella misma.
10.3. Las variables acción-ángulo

~ ϕ
Mostremos que es posible definir una transformación canónica (~q, p~) → (I, ~ ) de
manera tal que hay l integrales primeras Φν dependientes únicamente de I, ~ que son los
momentos canónicamente conjugados de las coordenadas angulares sobre el toroide T l
correspondiente a Mc .
Ciertamente (~ ~ son coordenadas de los puntos de Mc en el espacio fásico 2l-
ϕ, Φ)
dimensional y satisfacen las ecuaciones direrenciales ordinarias siguientes:
dΦ~ d~ϕ
= 0; =ω ~
~ (Φ) (10.75)
dt dt
que se integran inmediatamente para darnos:

~
Φ(t) ~
= Φ(0) ; ϕ ~ (t) = ϕ ~
~ (0) + ~ω Φ(0) t (10.76)
Aunque las variables (~ ~ no son necesariamente canónicas, es posible construir l

ϕ, Φ)
~ tales que (I,
funciones de las Φν , que llamaremos Iν = Iν (Φ), ~ ϕ
~ ) sean variables canónicas.
Las Iν , son llamadas las variables de acción y junto con las variables angulares ϕν forman
en la vecindad de Mc un sistema de variables canónicas acción-ángulo. Las cantidades Iν
son integrales primeras del sistema de hamiltoniano H = Φ1 puesto que son funciones de
integrales primeras. A su vez, las Φν pueden expresarse en función de las Iν . Entonces en
las variables acción-ángulo las ecuaciones canónicas con hamiltoniano que sólo depende
de los “momentos” canónicos, son:
dI~ ∂H d~
ϕ ∂H ~
=− = 0; = = ~ω (I) (10.77)
dt ∂ϕ
~ dt ∂ I~
Las funciones ων están restringidas por la condición que resulta de la continuidad
~
de la función H(I):
∂2H ∂2H ∂ων ∂ωµ
= ⇒ = (10.78)
∂Iν ∂Iµ ∂Iµ ∂Iν ∂Iµ ∂Iν
Variables acción ángulo para l = 1. Debemos encontrar una transformación
canónica (q, p) → (I, ϕ) que satisfaga las dos condiciones siguientes:
I
I = I(h) y dϕ = 2π (10.79)
Mh
En este caso el “toro” es una lı́nea cerrada. Es claro que la función generatriz del
tipo F2 para esta transformación es Σ(I, q), que satisface:
∂Σ ∂Σ
p= ; ϕ= (10.80)
∂q ∂I

∂Σ
H ,q = h(I) (10.81)
∂q
siendo H(p, q) = h(I) el hamiltoniano del sistema. Como la relación h(I) es biunı́voca
se sigue que cada curva Mh está definida por un valor de I. Sobre una curva definida h
por un valor de I, se sigue de (10.80) que:
dΣ|I=Constante = p dq (10.82)
En la vecindad de un punto q0 la acción vale:4
Z q
Σ(I, q) = p dq = Area (10.83)
q0
La segunda condición en (10.79) depende del comportamiento global de Σ(I, q).

La función Σ no es uniforme pues al dar un ciclo completo sobre la curva Mh
cambia su valor por una constante igual al área encerrada por la curva. Esto no afecta
el valor de ∂Σ/∂q pero sı́ el de ϕ = ∂Σ/∂I puesto que el área depende de I. Si llamamos
∆Σ(I) al área,
I
∆Σ(I) = p dq (10.84)
Mh
Entonces (10.80) define a ϕ con la indeterminación de un múltiplo entero de

d∆Σ/dI.
Para que se satisfaga la segunda condición de (10.79) es necesario entonces que:
d∆Σ(I) ∆Σ A
= 2π ⇒ I = = (10.85)
dI 2π 2π
o sea que I debe valer:
I
1
I= p dq (10.86)
2π Mh
Si el área A depende de h, entonces existe la función h(I) inversa de I(h).
El perı́odo del movimiento sobre la curva cerrada Mh en el plano de fases (q, p)
está dado por:
dA(h)
T = (10.87)
dh
Hemos demostrado además que la variable de acción es un invariante adiabático,
de acuerdo con la definición dada por (10.18).
4 Esta integral de lı́nea ciertamente está sobre la trayectoria del sistema, pero no está evaluada
siguiendo el movimiento del sistema: es una propiedad intrı́nseca de los puntos q y q0 del “toro”.
Ejemplo 10.3.1 Resolver las ecuaciones de movimiento para el oscilador armónico uni-
dimensional del ejemplo 10.1.1 usando las variables acción-ángulo.
De acuerdo con el ejemplo 10.1.1, para un oscilador armónico de constante k, con
p
ω0 ≡ k/m el área encerrada por la elipse definida por H = E es:
2πE E
A= ⇒ I= (10.88)
ω0 ω0
La frecuencia del movimiento es entonces:
∂E
ω= = ω0 (10.89)
∂I
que en este caso particular resulta independiente del valor de I.
Las fórmulas (10.80) permiten resolver las ecuaciones de movimiento usando el
formalismo de las variables acción-ángulo. En efecto:
Z q Z qq
Σ(I, q) = p dq = 2mE − m2 ω02 q 2 dq (10.90)
q0 q0
entonces:
Z q r
∂Σ dq mω0
ϕ= = r = sen−1 q (10.91)
∂I q0 2I 2I
− q2
mω0
lo cual nos dice que:
r r
2I 2I
q= sen ϕ = sen (ϕ0 + ω0 t) (10.92)
mω0 mω0
donde hemos absorbido en ϕ la constante de integración de (10.91). Resulta que la
variable angular ϕ es la fase de las oscilaciones.
Ejemplo 10.3.2 Aplicar el formalismo de las variables acción-ángulo para hallar la solu-
ción a las ecuaciones de movimiento del péndulo plano y realizar un estudio del espacio
fásico correspondiente.
Las ecuaciones de movimiento son:

ṗ = −F sen θ ; θ̇ = Gp (10.93)
donde F = mgL, G = 1/(mL2 ) siendo mg la fuerza gravitacional, L la longitud del
péndulo, θ el ángulo respecto a la vertical y p el momento angular conjugado a θ. El
hamiltoniano es:
1 2
H= Gp − F cos θ = E (10.94)
2
El problema es completamente separable, como ocurre siempre cuando hay un
grado de libertad. Una descripción cualitativa del movimiento se obtiene a partir de un
diagrama de energı́a y otro de las trayectorias de fase (véase figura 10.4). F es el mayor
valor de la energı́a potencial. Si E > F , entonces p es siempre diferente de cero y el

movimiento es no acotado en θ (rotación).
Para E < F , el movimiento es acotado (libración).
Para E = F , tenemos el movimiento separatriz, en el cual el perı́odo de oscilación se
hace infinito.
Hay dos puntos singulares en p = 0: el origen en θ = 0, que es estable o punto
singular elı́ptico; y la intersección de las dos ramas de la separatriz en θ = ±π, que
es inestable o punto singular hiperbólico. Una trayectoria de fases cerca a un punto
singular elı́ptico permanece en su vencindad, en tanto que una trayectoria cerca a un
punto hiperbólico diverge de él. El perı́odo está dado por:
r I
1 dθ
T = √ (10.95)
2G E + F cos θ
Sobre la separatriz vemos de (10.93) que la fuerza restauradora y la velocidad son
cero en θ = π, de modo que T es infinito.
p
Punto elíptico Rot.
Sep.
Lib.
E>F
E=F
E<F
–2π –π 0 π 2π θ
Punto hiperbólico
Figura 10.4 Curvas de fase para el péndulo
Transformemos ahora el hamiltoniano a variables acción ángulo, usando la defini-

ción (10.86):
Z r
2 θmax 2
I(E) = (E + F cos θ) dθ (10.96)
π 0 G
y las expresiones (10.80) y (10.83):
Z
∂Σ 1 dE θ dα
φ(θ, E) = = r (10.97)
∂I G dI 0 2
(E + F cos α)
G
donde θmax = π/2 para rotación (E > F ) y cos θmáx = −H/F para libración (E < F ).
El nuevo hamiltoniano se obtiene notando que H = H = E, con lo cual (10.96) permite
en principio expresar a E en función de I.
En (10.79) se supone que Mc representa una lı́nea cerrada. Sin embargo la definición
es posible ampliarla para incluir no sólo libración sino rotación.
Si en (10.96) y (10.97) efectuamos el cambio de variable siguiente:
s
1 E θ
1+ sen η = sen (10.98)
2 F 2
obtenemos:

r 
 E(k) − (1 − k 2 )K(k) , k < 1
8 F
I= (10.99)
π G 1 kE(k −1 ) , k>1
2
y,

F (η, k) /K(k) , k<1
π 
ϕ= (10.100)
2 
2F (η/2, k −1) /K(k −1 ) , k > 1
siendo F (η, k) y E(η, k) las integrales elı́pticas incompletas de primera y segunda especie
respectivamente, en tanto que K(k) = F (π/2, k) y E(k) = E(π/2, k) son las integrales
elı́pticas completas de primera y segunda especie (véase sección 8.4).
Z η
dξ
F (η, k) = p = sen−1 (sen η)
2 2
1 − k sen ξ
0
(10.101)
Z ηp
E(η, k) = 1 − k 2 sen2 ξ dξ
0
k está dada por:
E
2k 2 = 1 + (10.102)
F
y es una medida de la energı́a normalizada del oscilador.
k = 1 cuando E = 1 (la energı́a de la separatriz) y k < 1 para libración y k > 1
para rotación. De (10.95) obtenemos para la frecuencia normalizada:

1/K(k) , k<1
ω(k) π 
= (10.103)
ω0 2 
2k/K(k −1 ) , k > 1
√
donde ω0 = F G es la frecuencia angular para el movimiento linealizado alrededor del
punto singular elı́ptico. El valor asintótico de K cerca a k = 1 nos da una frecuencia
normalizada cerca a la separatriz:

 (π/2)/ln 4(1 − k 2 )−1/2 , k < 1
ω
lı́m = (10.104)
k→1 ω0 
π/2 ln 4(k 2 − 1)−1/2 , k>1
que tiende a cero cuando k tiende a 1.
Ejercicio 10.3.1 Mostrar que para la trayectoria separatriz se cumple:
2ω0 θ
p=± cos ; θ = 4tan−1 (eω0 t ) − π (10.105)
G 2
Variables acción ángulo para l grados de libertad. En el caso unidimen-
sional, donde el toroide invariante se reduce a una lı́nea, la integral de lı́nea en (10.86)
coincide con la trayectoria. En el caso l-dimensional esta coincidencia no es necesaria.
Sean γ1 , γ2 , ...γl , l lı́neas cerradas sobre el toroide Mc , topológicamente equivalen-
tes a circunferencias. Sobre cada lı́nea especificamos un punto mediante una coordenada
ϕν que en un circuito cerrado se aumenta por el valor 2π. Los γν no coinciden necesa-
riamente con trayectorias, que según veremos en general no son cerradas; es decir, en
el caso general ninguna de las lı́neas γν coincide con la proyección de la trayectoria de
fases del sistema sobre el plano qν − pν . Entonces definimos la Iν por:
Z l Z
1 1 X
Iν = p~ · d~q = pν dqµ (10.106)
2π γν 2π µ=1 γµ
Consideramos sobre Mc un “tubo de caracterı́sticas” que pasan por los puntos

de γν en un tiempo dado (véase figura 10.5). En un tiempo posterior t′ los puntos del
tubo de caracterı́sticas que en t estaban sobre γν pasarán a formar un contorno cerrado
diferente γν′ . En la sección 9.4 se demostró que la integral de Poincaré I1 no cambia de
valor al ser evaluada sobre contornos que envuelven el mismo tubo de caracterı́sticas y
tales que los puntos de dichos contornos representen estados simultáneos.
γν
γ′ν
Figura 10.5 Tubo de caracterı́sticas sobre el toroide
Se sigue entonces en virtud de la invariancia de la integral de Poincaré que:

Z Z
p~ · d~q = ~p · d~q (10.107)
γν γν′
Se sigue de (10.106) que el valor de la variable de acción Iν no varı́a al deformar la

curva cerrada γν . De la topologı́a de un toroide se sigue que no es posible por deformación
hacer coincidir una curva γµ con otra γν independiente, o sea que la topologı́a del toroide
determina de manera única los l números I1 , I2 , ...Il definidos por (10.106).
Como (Φ,~ ϕ ~ ) son las coordenadas de los puntos de la vecindad de Mc , entonces si

las Iν son independientes, o sea si

I1 , I2 , ...Il
J 6= 0 (10.108)
C1 , C2 , ...Cl
entonces en la vecindad del toroide se pueden tomar como coordenadas las variables
~ ϕ).
(I,
De acuerdo con el método de Hamilton-Jacobi, la siguiente es la función generatriz
de la transformación canónica (~
q, p ~ ϕ
~) → (I, ~) 5
Z q
~
~ ~
Σ(I, q) = ~ ~
p~(I, q ) · d~q (10.109)
q
~0
de acuerdo con las fórmulas:

∂Σ ∂Σ
p~ = ; ϕ
~= (10.110)
∂~q ∂ I~
~ ~q), la cual en principio
Como sabemos, (10.109) no permite evaluar la función Σ(I,
se obtiene resolviendo la ecuación de Hamilton-Jacobi independiente del tiempo:

∂Σ ~
H ,~
q = h(I) (10.111)
∂~q
Queda claro que el sistema es integrable si es posible encontrar l contornos ce-
rrados independientes tales que existen las l cantidades I1 , I2 , ...Il , lo cual es posible
independientemente de poder resolver la ecuación (10.111) por separación de variables.
La función Σ es multivaluada sobre Mc . El cambio experimentado al realizarse un
circuito sobre una lı́nea γν es igual a:
I
∆ν Σ = dΣ = 2πIν (10.112)
γν
Sin embargo en la vecindad de un punto ~q0 siempre es posible definir una función
unı́voca que especifica la transformación canónica. Como en el caso unidimensional, la no
uniformidad de Σ se traduce en la no uniformidad de las variables angulares. En efecto
el cambio en la variable angular ϕν al realizarse un circuito sobre la lı́nea γµ está dado
por:
∂Σ ∂
∆µ ϕν = ∆µ = ∆µ Σ = 2πδµν (10.113)
∂Iν ∂Iν
Por otra parte, las variables de acción están indeterminadas por una constante que
no depende de las Iν , como se puede ver en (10.85), pero es una constante que no trae
problemas como los provenientes de la no uniformidad de Σ.
5 La integral (10.109) es una integral de lı́nea que no depende de la trayectoria seguida para llegar
de ~
q0 a q~.
Sistemas separables. Hay casos en los cuales mediante una adecuada elección
de las coordenadas resulta que la función Σ puede escribirse en la forma:
l
X
~ ~
Σ(I, q) = ~ qν )
Σν (I, (10.114)
ν=1
se dice entonces que el sistema es completamente separable. Para un sistema de este tipo
las ecuaciones (10.110) toman la forma:
Xl
∂ ~ qν ) ; ∂ ~ qµ )
pν = Σν (I, ϕν = Σµ (I,
∂qν ∂I ν
µ=1 (10.115)
ν = 1, 2, ...l
En este sistema es posible escoger los ciclos de base γ1 , γ2 , ...γl en los planos de
fase (q1 , p1 ), (q2 , p2 ), ...(ql , pl ) de modo que las variables de acción pueden definirse por
las integrales:
I
1 1
Iν = ∆ν Σν = pν dqν (10.116)
2π 2π
donde cada integral es tomada sobre un ciclo de la coordenada qν . Ver la sección 9.4.
Sistemas multiplemente periódicos degenerados. Cuando el sistema es se-

parable, las variables angulares describen la proyección del punto representativo del
sistema sobre el plano de fases correspondiente (pν , qν ) y ων es la frecuencia angular
correspondiente al movimiento de tal proyección sobre la trayectoria cerrada. Entonces
tanto qν como pν son funciones periódicas del tiempo. Puede ocurrir que todas las fre-
cuencias sean conmensurables entre sı́; entonces existen nuḿeros enteros m1 , m2 , ...ml
tales que, si T1 , T2 , ...Tl son los perı́odos sobre las proyecciones en los planos de fases se
cumple:
m1 T1 = m2 T2 = ... ml Tl = T (10.117)
en este caso la trayectoria de fases es cerrada y el sistema como un todo es periódico.

Se dice entonces que el sistema es completamente degenerado.
Si el sistema es no degenerado o parcialmente degenerado, entonces (10.117) no
se cumple y nunca retorna a su estado inicial, pero cuando T es suficientemente grande
entonces pasa arbitrariamente cerca al estado inicial y se dice que el movimiento es cuasi-
periódico sobre el toroide invariante. En este caso la trayectoria, independientemente de
las condiciones iniciales, es uniformemente distribuida sobre el toroide. Este enunciado
constituye el teorema ergódico.
Podemos decir que si el sistema es no degenerado es ergódico. Si hay degeneración
esto no se cumple.
En las coordenadas en que el sistema es separable, qν y pν son funciones periódicas
del tiempo con frecuencia angular ων . Entonces cualquier función uniforme F (~q, p~ ) del
estado del sistema es periódica respecto a las variables angulares y su perı́odo respecto
a cada una de ellas es 2π. Su expansión de Fourier es de la forma:
∞
X ∞
X
F (~
q , p~) = ...
n1 =−∞ n2 =−∞
(10.118)
∞
X
∂E ∂E ∂E
An1 , n2 , ...nl exp i n1 + n2 + ... nl t
n =−∞
∂I1 ∂I2 ∂Il
l
Cada término de esta suma es periódico respecto al tiempo con frecuencia angular:
∂E ∂E ∂E
n1 + n2 + ... nl (10.119)
∂I1 ∂I2 ∂Il
pero como estas frecuencias no son conmensurables en general, la suma no es periódica.
En particular, no serán periódicas las coordenadas y momentos (~q, p~) en las cuales el
sistema no sea separable.
En algunos casos particulares, dos o más de las frecuencias ων = ∂E/∂Iν son
conmensurables para todos los valores de las Iµ . La existencia de degeneración conlleva
una reducción del nuḿero de variables de acción independientes de las cuales depende
de la energı́a. En efecto si ω1 y ω2 son tales que:
∂E ∂E
n1 = n2 (10.120)
∂I1 ∂I2
donde n1 y n2 son enteros, se deduce entonces que E depende de I1 y I2 sólo en la
combinación n2 I1 + n1 I2 :
E(I~ ) = E(n2 I1 + n1 I2 , I3 , ...Il ) (10.121)
Cuando hay degeneración, el número de integrales de movimiento uniformes es
mayor que l.
En efecto, la siguiente cantidad es constante de movimiento:
A = n1 ϕ1 − n2 ϕ2 (10.122)
la constancia de la cual es evidente de (10.120). Además está constante de movimiento
no depende de las Iν , que son las variables canónicamente conjugadas de las ϕν .
Al realizarse un circuito sobre la lı́nea γν , el cambio en A está dado, en virtud de
(10.113), por:
∆ν A = (n1 δ1ν − n2 δ2ν ) 2π (10.123)
o sea que A no es uniforme, pero su no uniformidad consiste en la adición de un múltiplo
entero de 2π. Por tanto, tomando una función trigonométrica arbitraria de A se obtiene
una nueva integral de movimiento uniforme.
Ejemplo 10.3.3 Mostrar que las constantes (10.53) y (10.54) en el caso del oscilador
armónico bidimensiohal son funciones respectivamente de ϕ1 − ϕ2 y de 2ϕ1 − ϕ2 .
Es simple mostrar que A(I1 , I2 , ϕ1 , ϕ2 ) en (10.53) vale:

2p
A= I1 I2 sen(ϕ1 − ϕ2 ) (10.124)
m
y en (10.54) vale:
p
A = 2I1 mI2 ω1 sen(2ϕ1 − ϕ2 ) (10.125)
De (10.123) se sigue que estas constantes de movimiento son uniformes. En el cálcu-
lo hemos usado la fórmula (10.92) para cada uno de los grados libertad, en coordenadas
cartesianas.
Ejemplo 10.3.4 En la sección 5.2 mostramos que el oscilador armónico bidimensional
cuando ω1 = ω2 es separable en coordenadas cartesianas y en coordenadas polares.
Resolver este problema en coordenadas polares usando las variables acción ángulo.
La ecuación de Hamilton-Jacobi para el problema es:
" 2 2 #
1 ∂Σ 1 ∂Σ 1
+ 2 + mω02 r2 = E (10.126)
2m ∂r r ∂ϕ 2
Resolviendo a (10.126) por separación de variables obtendremos las dos ecuaciones

diferenciales ordinarias siguientes:
2
dΣϕ dΣr l2
= l; + 2 + m2 ω02 r2 = 2mE (10.127)
dϕ dr r
donde l2 es la constante de separación. Salvo constantes de integración, las soluciones
son:
Z r
l2
Σϕ = lϕ ; Σr = 2mE − 2 − m2 ω02 r2 dr (10.128)
r
Entonces las cuatro ecuaciones (10.115) toman la forma:
r
l2
pϕ = l ; pr = 2mE − 2 − m2 ω02 r2 (10.129)
r
∂E 1 ∂l2
Z 2m − 2
∂l ∂Ir r ∂Ir
ϕr = ϕ + r dr (10.130)
∂Ir l 2
2 2 2
2 2mE − 2 − m ω0 r
r
∂E 1 ∂l2
Z 2m − 2
∂l ∂Iϕ r ∂Iϕ
ϕϕ = ϕ + r dr (10.131)
∂Iϕ l2
2 2mE − 2 − m2 ω02 r2
r
La variable de acción Iϕ vale:
Iϕ = l (10.132)
y la variable de acción Ir vale:

Z rmax r
1 l2
Ir = ·2 2mE − 2 − m2 ω02 r2 dr (10.133)
2π rmı́n r
donde rmı́n y rmax están dados por la fórmula (5.76). Mediante la sustitución x = r2 ,
(10.133) toma la forma:
I q
1 1
Ir = −m2 ω02 x2 + 2mEx − l2 dx (10.134)
2π x
La integral se hace fácilmente usando la técnica de los residuos teniendo en cuenta
que en el plano complejo el integrando es una función biforme (positivo en el intervalo
(xmı́n , xmax ) y negativo entre (xmax , xmı́n )), presentándose entonces una lı́nea de rami-
ficación entre xmı́n y xmax . Por otra parte el integrando tiene singularidades en x = 0
y x = ∞, presentándose polos en dichos puntos. El residuo en x = 0 vale −l/(2π) y
el residuo en x = ∞ (que se obtiene con la sustitución y = 1/x) vale E/(2πω0 ). En
consecuencia, usando (10.132):
E = ω0 (Ir + Iϕ ) (10.135)
La técnica para evaluar este tipo de integrales puede verse en el apéndice II del
libro de Born, The mechanics of the atom o en la sección 9-7 del libro de Goldstein. Esto
nos permite escribir entonces (10.130) y (10.131) como:
Z
dr
ϕr = mω0 r (10.136)
l2 2 2 2
2mE − 2 − m ω0 r
r
Z
mω0 − l/r2
ϕϕ = ϕ + r dr (10.137)
l2 2 2 2
2mE − 2 − m ω0 r
r
Estas integrales coinciden con las evaluadas en el capı́tulo 5, que aparecieron en
las fórmulas (5.67) y (5.75):
El resultado para r en función de ϕr se obtiene directamente de (5.81):
r !
2 E ω02 l2
r = 1 + 1 − 2 sen 2ϕr = r02 (1 + e sen 2ϕr ) (10.138)
mω02 E
La ecuación de la órbita r(ϕ) depende de la diferencia ϕϕ − ϕr y de una constante

de integración que se puede absorber por ϕϕ . Como según (10.135) el movimiento es
degenerado (ωr = ωϕ = ω0 ), resulta que ϕϕ − ϕr es una constante.
La integral en (10.131) es idéntica a (5.67). El resultado para ϕ en términos de las
variables acción ángulo es:

1 e + sen 2ϕr
ϕ = ϕϕ − ϕr + sen−1 (10.139)
2 e sen 2ϕr + 1
La constante (10.122) que aparece cuando hay frecuencias degeneradas es:

A = ϕr − ϕϕ (10.140)
Los cambios en A al realizarse circuitos sobre las lı́neas γr y γϕ respectivamente
son ∆r A = 2π y ∆ϕ A = −2π. O sea que ϕ no es una función uniforme, lo cual introduce
dificultades para tomar a (r, ϕ, pr , pϕ ) como variables de estado. Cuando Iϕ = 0, ϕ =
π/4 − A y cuando Iϕ = Ir + Iϕ , ϕ = ϕϕ = ϕr − A. Sólo una función que contenga
funciones trigonométricas de A es uniforme.
El toroide invariante en coordenadas polares está definido por las ecuaciones H = E
y pϕ = l. En este caso degenerado queda reducido a una curva cerrada:
l2
p2r + + m2 ω02 r2 = 2mE ; pϕ = l (10.141)
r2
El potencial efectivo presenta dos puntos de retorno en r, en tanto que en ϕ no hay
puntos de retorno. Las figuras 10.6 y 10.7 muestran las envolventes de las trayectorias
en el plano de la órbita y algunas órbitas, para l = 0 y para l 6= 0.
Las ecuaciones paramétricas de la curva en el plano r − Pr son:
cos2 2ϕr
r2 = r02 (1 + e sen 2ϕr ) ; p2r = m2 ω02 r02 e2 (10.142)
1 + esen 2ϕr
l≠0
Figura 10.6 Envolventes de las trayectorias en el plano de la órbita para l 6= 0
La figura 10.8 muestra las curvas de fases representadas por (10.142) para diferentes
valores de e. Cuando e → 1, las trayectorias cerca a rmı́n son muy “planas”, de modo
que cuando e = 1, los puntos con pmax y pmı́n están unidos por una lı́nea recta vertical
levantada en rmı́n = 0.
l=0
Figura 10.7 Envolventes de las trayectorias en el plano de la órbita para l = 0
pr (mω0r0)
1 e=1
e = 0,8
e = 0,6
0,5
e = 0,4
e = 0,2
r/r 0
e=0
0 0,5 1 1,5
–0,5
–1
Figura 10.8 Curvas de fases para diferentes valores de e
Como r es positivo, la trayectoria para e = 1 es un arco de elipse con los extremos

unidos por una lı́nea recta vertical, o sea que en r = 0, pr cambia abruptamente de
signo.
e = 1 corresponde a un movimiento pendular. En este caso el “toroide” se convierte
en un segmento de lı́nea, pues en cualquier movimiento real los puntos de la lı́nea recta
vertical son recorridos a velocidad infinita.
En coordenadas polares son constantes de movimiento E y l. Como consecuencia
de la degeneración hay otra constante que es una función trigonométrica de A. Tal
constante coincide con E1 o con E2 . En efecto, podemos tomarla como E1 .
px puede expresarse en función de pr y pϕ mediante la fórmula:
1
px = pr cos ϕ − pϕ sen ϕ (10.143)
r
pϕ es una constante igual a l, cuyo valor tiene la siguiente expresión en función de e:
p
l = mω0 r02 1 − e2 (10.144)
remplazando pr de (10.142) en (10.143) obtenemos:
mω0 r0 p
px = √ e cos ϕ cos 2ϕr − 1 − e2 sen ϕ (10.145)
1 + e sen 2ϕr
con lo cual E1 puede llevarse a la forma:
1 mω02 r02
E1 = [e (1 + cos 2ϕ)(e + sen 2ϕr )
2 1 + e sen 2ϕr (10.146)
√
+1 − e2 − e 1 − e2 sen 2ϕ sen 2ϕr ]
De (10.139) obtenemos las siguientes expresiones para cos 2ϕ y sen 2ϕ:
√
(e + sen 2ϕr ) sen 2A + 1 − e2 cos 2ϕr cos 2A
cos 2ϕ =
1 + e sen 2ϕr
√ (10.147)
(e + sen 2ϕr ) cos 2A − 1 − e2 cos 2ϕr sen 2A
sen 2ϕ =
1 + e sen 2ϕr
La sustitución de (10.147) en (10.146) nos conduce finalmente a:
1
E1 = mω02 r02 (1 + e sen 2A) (10.148)
2
y en consecuencia:
1
E2 = mω02 r02 (1 − e sen 2A) (10.149)
2
Sistemas no separables. Como una consecuencia del teorema de Liouville sobre
los sistemas integrables, todo sistema de l grados de libertad que posea l constantes de
movimiento uniformes admite un sistema de variables acción ángulo, siendo las variables
de acción l constantes de movimiento uniformes y las variables agulares l funciones
lineales del tiempo de la forma ϕν = ων t+ϕν0 siendo las ϕν0 l constantes de movimiento
no uniformes. En un sistema no integrable, el número de constantes de movimiento
uniformes es menor que l y por tanto la trayectoria de fases cubrirá regiones de más de
l dimensiones.
Cuando hay un número de constantes de movimiento uniformes superior a l, se

tiene un sistema integrable degenerado.
Sistemas separables degenerados. En este caso es posible construir más de l

constantes de movimiento uniformes en involución. Entonces hay diferentes maneras de
escoger el conjunto de l variables de acción y por tanto hay diferentes transformaciones
canónicas a variables acción ángulo.
Sean (q, p) → (I, ϕ) y (q, p), (I ′ , ϕ′ ) dos de tales transformaciones, entonces las
variables (q, p) en los dos casos deben ser diferentes. Llegamos a otra propiedad funda-
mental de los sistemas degenerados consistente en que las ecuaciones de movimiento son
separables en diferentes sistemas de coordenadas.
Ejemplo 10.3.5 Mostrar que en un oscilador armónico bidimensional cuando ωx = 2ωy
(o ωy = 2ωx ) es posible la separación de variables en coordenadas parabólicas.
En el ejemplo 10.2.1 hallamos que cuando ωy = 2ωx existen tres constantes de
movimiento uniformes independientes, E1 , E2 y A (10.54), cuando la separación de
variables se hace en coordenadas cartesianas.
En términos de las coordenadas parabólicas ξ y η las coordenadas cartesianas x, y
están dadas por:
p
x = ξ−η; y = ±2 ξη ; 0 ≤ (ξ, η) < ∞ (10.150)
En este sistema de coordenadas curvilı́neas, las curvas de ξ constante son parábolas
confocales con ejes a lo largo de x y abiertas hacia la izquierda. Las curvas de η constante
son parábolas confocales con ejes a lo largo del eje x pero abiertas hacia la derecha y
ortogonales a la familia ξ = constante. En ambos casos el foco está en el origen.
Las ecuaciones cartesianas de esas familias de curvas son:
y 2 − 4ηx = 4η 2 (η = Constante) y y 2 + 4ξx = 4ξ 2 (ξ = Constante) (10.151)
La sustitución de (10.150) en (10.151) hace triviales a estas últimas identidades,
como debe ser.
El lagrangiano en coordenadas cartesianas es:
m 2 m
L= ẋ + ẏ 2 − ωy2 (4x2 + y 2 ) (10.152)
2 2
cuando ωx = 2ωy . En coordenadas parabólicas es:
!
1 ξ˙2 η̇ 2
L = m(ξ + η) + − 2mωy2 (ξ 2 + η 2 − ξη) (10.153)
2 ξ η
Por tanto el hamiltoniano en coordenadas parabólicas es:
1 ξp2ξ + ηp2η
H= + 2mωy2 (ξ 2 + η 2 − ξη) (10.154)
2m ξ + η
La ecuación de Hamilton-Jacobi es:
" 2 2 #
1 1 ∂Σ ∂Σ
ξ +η + 2mωy2 (ξ 2 + η 2 − ξη) = E (10.155)
2m ξ + η ∂ξ ∂η
Haciendo
Σ = Σξ (ξ) + Ση (η) (10.156)
obtenemos las ecuaciones:
2
dΣξ
2ξ + 8mωy2 ξ 3 − 4mEξ = β (10.157)
dξ
2
dΣη
2η + 2mωy2 η 3 − 4mEη = −β (10.158)
dη
donde β es la constante de separación. Integrando estas ecuaciones hallamos:
Z s Z s
β 2 2 2
β
Σ= 2mE + − 4m ωy ξ dξ + 2mE − − 4m2 ωy2 η 2 dη (10.159)
2ξ 2η
La constante β tiene la siguiente expresión en términos de las variables de estado:

p2ξ − p2η
β = 2ξη + 8m2 ωy2 ξη(ξ − η) (10.160)
ξ+η
y cumple un papel análogo al de la constante l cuando ωx = ωy . En efecto, cuando
β 6= 0 los potenciales efectivos en los movimientos unidimensionales equivalentes tienen
las siguientes expresiones:
ξ 1 β η 1 β
Vef (ξ) = 4mωy2 ξ 2 − ; Vef (η) = 4mωy2 η 2 + (10.161)
2 4mξ 2 4mη
De las gráficas de energı́a potencial efectiva se deducen los valores de retorno en
ξ y η y por tanto las parábolas que envuelven las trayectorias en el plano x − y. Tales
curvas envolventes se denominan “cáusticas”. La figura 10.9 muestra las cáusticas para
diferentes signos de β y algunas de las trayectorias.
La solución analı́tica en variables acción ángulo requiere evaluar las variables de
acción y por medio de las ecuaciones (10.115) hallar las ecuaciones de la trayectoria. Al
conocer la función E(Iξ , Iη ) se hallan las frecuencias ωξ , ωη que contendrán alguna rela-
ción racional de la forma (10.120) y luego se puede obtener una constante de movimiento
adicional, de la forma (10.122).
Es interesante notar que al separar el movimiento en coordenadas cartesianas hay
una constante ligada a la degeneración que es (10.55). Tal constante es precisamente
β. Para mostrar esto, notemos que las fórmulas de la transformación inversa a (10.150)
son:
p p
x + x2 + y 2 −x + x2 + y 2
ξ= ; η= (10.162)
2 2
dado que los momentos están conectados por las fórmulas:
    
pξ ∂x/∂ξ ∂y/∂ξ px
 =   (10.163)
pη ∂x/∂η ∂y/∂η py
y y ξ2 y
η2
ξ1
η1
ξ2 η2
x x x
ξ2 η2
β>0 β=0 β<0
Figura 10.9 Curvas envolventes o “cáusticas” para distintos valores de β
se sigue que:
s p
−x + x2 + y 2
pξ = px + p py
x + x2 + y 2
s (10.164)
p
x + x2 + y 2
pη = −px + p py
−x + x2 + y 2
Reemplazando a (10.164) y (10.162) en (10.160) se sigue que:
β = 2[ypx py + x(m2 ωy2 y 2 − p2y )] (10.165)
Similarmente, la constante ligada a la degeneración en coordenadas parabólicas
puede tomarse como E1 :
!
1 ξp2ξ − ηp2η
E1 = + 2mωy2 (ξ − η)2 (10.166)
2m ξ+η
10.4. Problema de Kepler (coordenadas esféricas)

El hamiltoniano para una partı́cula de masa m sometida al efecto de un centro de
fuerzas inmóvil que crea un potencial −k/r es:
!
1 2 p2θ p2ϕ k
H(r, θ, pr , pθ , pϕ ) = pr + 2 + 2 − (10.167)
2m r r sen2 θ r
Este problema admite la separación completa de variables en la ecuación de Hamilton-
Jacobi, en la forma:
Σ(r, θ, ϕ) = Σϕ (ϕ) + Σθ (θ) + Σr (r) (10.168)
obteniéndose las siguientes ecuaciones diferenciales:

2
dΣϕ
= lz2 (10.169)
dϕ
2
2 dΣr
r − 2mkr − 2mEr2 = −l2 (10.170)
dr
2
dΣθ lz2
+ = l2 (10.171)
dθ sen2 θ
donde l y lz son las constantes de separación.
Los puntos de retorno en θ y r, donde pθ = 0 y pr = 0, están dados por:
r !
k 2El2
rmax, min = − 1± 1+ ;
2E mk 2
(10.172)
lz
sen θmax, min = ±
l
La variable de acción Iθ está dada por:
Z θmax r I r
lz2 l2
2πIθ = 2 2
l − 2
dθ = l2 − z2 dθ (10.173)
θmı́n sen θ sen θ
donde se ha notado que pθ es positivo cuando θ se incrementa de θmı́n = sen−1 (lz /l) a
θmax = π − θmı́n y es negativo cuando θ decrece de θmax a θmı́n , y que el integrando es
una función par de θ.
Con la sustitución η = sen2 θ, Iθ toma la forma:
Z l s
1 l2 η − lz2
2πIθ = 2 dη (10.174)
lz /l2 η 1−η
y con la sustitución
r
−lz2 + l2 u
x= (10.175)
1−u
llegamos a:
Z ∞
x2 dx
2πIθ = 4 l2 − lz2 (10.176)
0 (x2 + lz2 )(x2 + l2 )
Descomponemos el integrando en fracciones parciales:
Z ∞ Z ∞
2 dx 2 dx
2πIθ = 4 l − lz (10.177)
0 x2 + l2 0 x2 + lz2
para llegar finalmente a:
Iθ = l − lz (10.178)
Por otra parte, de (10.169) se sigue directamente:
Iϕ = lz (10.179)
Obteniendo las siguientes expresiones para las constantes l y lz en términos de las

variables de acción:
l = Iθ + Iϕ ; lz = lϕ (10.180)
Ir está dado por:

Z rmax Z rmı́n Z rmax
2πIr = pr dr − pr dr = 2 pr dr (10.181)
rmı́n rmax rmı́n
Llamando a y b a:
k l
a=− ; b= √ (10.182)
2E −2mE
Podemos escribir a p2r como:
" 2 2 #
2 a b a
pr = −2mE −1 + 2 − (10.183)
r a r
De tablas de integrales estándar como la de Schaum’s hallamos:

Z √ 2
Ar + Br + C √
dr = Ar2 + Br + C
r
B −2Ar − B
+ √ sen−1 √ (10.184)
2 −A B 2 − 4AC
√ Br + 2C
− −Csen−1 √
r B 2 − 4AC
Por tanto:
Z
√ √ r−a
pr dr = −2mE −r2 + 2ar − b2 + a sen−1 √
a2 − b 2
(10.185)
−1 √ar − b2
−b sen
r a2 − b 2
y teniendo en cuenta que:
p
rmin, max = a ± a2 − b2 (10.186)
llegamos a:
Z rmax
√
pr dr = −2mE (a − b)π (10.187)
rmı́n
De donde se tiene la siguiente expresión para E en función de Ir , Iθ , Iϕ :

mk 2
E=− (10.188)
2(Ir + Iθ + Iϕ )2
Entonces a y b en términos de las variables de acción toman la forma:
(Ir + Iθ + Iϕ )2 (Iθ + Iϕ )(Iθ + Iϕ + Ir )
a= ; b= (10.189)
mk mk
Σr y Σθ pueden escribirse como:
Z p
1 1
Σr = (Ir + Iθ + Iϕ ) −r2 + 2ar − b2 dr (10.190)
a r
Z s
Iϕ2 1
Σθ = (Iθ + Iϕ ) 1− dθ (10.191)
(Iθ + Iϕ ) sen2 θ
2
Solución para el movimiento radial. Según la ecuación (10.115), la variable

angular ϕr es:
∂Σ ∂Σr
ϕr = = (10.192)
∂Ir ∂Ir
Al derivar la integral (10.190) usamos las expresiones auxiliares:
∂a 2a
= ; I = Ir + Iθ + Iϕ (10.193)
∂I I
" 2 #
∂ Iθ + Iϕ 2(1 − ǫ2 )a2
a2 =
∂I I I
(10.194)
2
Iθ + Iϕ
ǫ2 = 1 −
I

∂ I 1
=− (10.195)
∂I a a
Por tanto:
Z p
1 1
ϕr = − −r2 + 2ar − (1 − ǫ2 )a2 dr
a r
Z
dr
+2 p (10.196)
−r + 2ar − (1 − ǫ2 )a2
2
Z
2 dr
−(1 − ǫ )a p
r −r2 + 2ar − (1 − ǫ2 ) a2
Cada una de estas integrales es elemental y puede hallarse en el manual citado.
El resultado, luego de simplificaciones, es:

1p 2 r−a
ϕr = − −r + 2ar − (1 − ǫ2 )a2 + sen−1 (10.197)
a ǫa
A este resultado se puede llegar derivando respecto a I la expresión integrada Σr
que se obtiene de (10.185).
Definamos ahora una cantidad auxiliar y ası́:
1 − r/a
y= ⇒ r = a(1 − ǫy) (10.198)
ǫ
Con lo cual:
p
ϕr = −ǫ 1 − y 2 − sen−1 y (10.199)
Como Σ es indeterminada bajo la adición de una constante arbitraria, ϕr es-

tará igualmente indeterminada bajo la adición de una constante, que llamaremos a.
Introduciendo una nueva variable ψ, definida como:
y = cos ψ (10.200)
y usando la circunstancia mencionada, obtenemos:

π
ϕr = −ǫ sen ψ − −ψ +α (10.201)
2
Podemos escoger a α igual a π/2 con lo cual:
ϕr = ψ − ǫ sen ψ (10.202)
r = a(1 − ǫ cos ψ) (10.203)
La ecuación (10.202) es la ecuación de Kepler, hallada en el capı́tulo 5. Vemos

además que la variable angular ϕr coincide con la anomalı́a media M , en tanto que ψ
es la anomalı́a excéntrica que, como sabemos, sirve para especificar la posición de la
partı́cula en el plano de la órbita.
En el ejemplo 5.3.1 se halló la solución analı́tica de la ecuación de Kepler en serie
de Fourier.
ϕr puede escribirse, de acuerdo con (10.77) en la forma:
ϕr = ωr (t − t0 ) (10.204)
Vemos que cuando ϕr = 0, ψ = 0 y r = rmı́n ; cuando ϕr = π, ψ = π y r = rmax ;

cuando ϕr = 2π, ψ = 2π y r = rmı́n y ası́ sucesivamente. ωr es la frecuencia angular del
movimiento radial que es periódico.
Ejemplo 10.4.1 Expresar a r, x, y en términos de ϕr por medio de series de Fourier,

donde x, y son unos ejes cartesianos en el plano de la órbita, con x a lo largo del eje
mayor de la órbita y el origen es el centro de fuerzas. De la figura 5.14 se sigue que:
x = r cos ϕv y y = r sen ϕv donde ϕv es la anomalı́a verdadera (ángulo entre r y x).
Por otra parte, la ecuación de la órbita en el plano de la misma cuando se toma a

x en la dirección del perihelio es:
a(1 − ǫ2 )
r= (10.205)
1 + ǫ cos ϕv
Por tanto, combinando (10.205) y (10.203):
a(1 − ǫ2 ) − r
x= = a(cos ψ − ǫ) (10.206)
ǫ
p p
y = r2 − x2 = a 1 − ǫ2 sen ψ (10.207)
Vemos que x y r son funciones pares de ψ en tanto que y es una función impar.
Entonces podemos escribir:
X∞
r 1
= B0 + Bn cos(nϕr ) (10.208)
a 2 n=1
X∞
x 1
= C0 + Cn cos(nϕr ) (10.209)
a 2 n=1
∞
y p X
= 1 − ǫ2 Dn sen (nϕr ) (10.210)
a n=1
Los coeficientes de Fourier son:

Z Z r
2 πr −2 π
Bn = cos(nϕr ) dϕr = sen (nϕr ) d (10.211)
π 0 a nπ 0 a
Z Z
2 πx −2 π x
Cn = cos(nϕr ) dϕr = sen (nϕr ) d (10.212)
π 0 a nπ 0 a
Z π
2 y
Dn = √ sen (nϕr ) dϕr
π 0 a 1 − ǫ2
Z π (10.213)
2 y
= cos nϕr d √
nπ 0 a 1 − ǫ2
donde se han realizado integraciones por partes.
Usando (10.206), (10.207) y (10.203) llegamos a las siguientes expresiones con
integrales sobre ψ.
Z
2ǫ π
Bn = − sen [n(ψ − ǫ sen ψ)] sen ψ dψ (10.214)
nπ 0
Z π
2
Cn = sen [n(ψ − ǫ sen ψ)] sen ψ dψ (10.215)
nπ 0
Z π
2
Dn = cos[n(ψ − ǫ sen ψ)] cos ψ dψ (10.216)
nπ 0
Procediendo como en el ejemplo 5.3.1, usando la definición integral de las funciones

de Bessel enteras, llegamos a:
ǫ 2ǫ
Bn = [Jn+1 (ǫn) − Jn−1 (ǫn)] = − Jn′ (ǫn) (10.217)
n n
1 2
Cn = [Jn−1 (ǫn) − Jn+1 (ǫn)] = Jn′ (ǫn) (10.218)
n n
2
Dn = Jn (ǫn) (10.219)
ǫn
B0 y C0 deben calcularse por separado. El resultado es:
B0 = 2 + ǫ 2 ; C0 = −3ǫ (10.220)
Entonces, finalmente:
X∞
r ǫ2 1
=1+ +ǫ [Jn+1 (ǫn) − Jn−1 (ǫn)] cos(nϕr ) (10.221)
a 2 n=1
n
X∞
x 3 1
=− ǫ+ [Jn−1 (ǫn) − Jn+1 (ǫn)] cos(nϕr ) (10.222)
a 2 n=1
n
∞
y 2p X 1
= 1 − ǫ2 Jn (ǫn) sen (nϕr ) (10.223)
a ǫ n=1
n
Es interesante notar que el sistema formado por dos partı́culas cargadas, ligado,
emite radiación electromagnética. El momento de dipolo del sistema, d~ = Z1 e~r1 + Z2 e~r2 ,
donde Z1 y Z2 tienen signos opuestos, se puede escribir, usando las fórmulas (5.1), como:

~ Z1 Z2
d = µe − ~r (10.224)
m1 m2
donde µ es la masa reducida. Las ecuaciones (10.221) a (10.223) muestran que el momen-
to de dipolo se puede expandir en serie de Fourier y la intensidad radiada de frecuencia
nω0 , donde ω0 = ϕ̇r está dada por la fórmula:
ω04 n4 ~ 2
In = dn (10.225)
3c3
Como d~n es un vector en el plano de la órbita, se han de considerar las contribu-
ciones de x y y a la radiacion de frecuencia nω0 . El resultado es:
2
64n2 E 4 Z1 Z2 1 − ǫ2 2
In = 3 2 2 − Jn′2 (ǫn) + J n (ǫn) (10.226)
3c Z1 Z2 m1 m2 ǫ2
ver Landau, Teorı́a de campos, sección 70.
Solución para el movimiento en θ. La variable angular ϕθ es:

∂Σ ∂Σr ∂Σθ
ϕθ = = + (10.227)
∂Iθ ∂Iθ ∂Iθ
Notando que:
∂ 2a2 p p
[(1 − ǫ2 ) a2 ] = 1 − ǫ2 1 + 1 − ǫ2 (10.228)
∂Iθ I
y mediante un cálculo similar al que conduce a (10.196) obtenemos:
∂Σr r − (1 − ǫ2 )a
= ϕr − sen−1 (10.229)
∂Iθ ǫr
Por otra parte, de (10.191) se sigue:
Z
∂Σθ sen θ dθ
= s 2 (10.230)
∂Iθ Iϕ
2
sen θ −
Iθ + Iϕ
y con el cambio de variable u = sen2 θ:

Z
∂Σθ 1 du
= q (10.231)
∂Iθ 2 [u − Iϕ /(Iθ + Iϕ )2 ] (1 − u)
2
La fórmula (14.120) del manual citado nos conduce finalmente a:

∂Σθ cos θ
= sen−1 q (10.232)
∂Iθ 1 − Iϕ2 /(Iθ + Iϕ )2
si llamamos γ a:
s
Iϕ2
γ= 1− (10.233)
(Iθ + Iϕ )2
obtenemos de (10.231), (10.229) y (10.227):

" r
cos θ [r − (1 − ǫ2 ) a ]2
ϕθ − ϕr = sen−1 1−
γ ǫ2 r 2
s  (10.234)
2 2
r − (1 − ǫ ) a cos θ 
− 1−
ǫr γ2
Donde hemos usado la fórmula:

p p
sen−1 A − sen−1 B = sen−1 A 1 − B 2 − B 1 − A2 (10.235)
Definamos las cantidades auxiliares siguientes:

r − (1 − ǫ2 ) a L
L= ; M= ; S = sen (ϕθ − ϕr ) (10.236)
ǫr γ
r
1 p
S = cos θ 2
− M 2 − M γ 2 − cos2 θ (10.237)
γ
y despejando a cos θ obtenemos:
p p
cos θ = γS 1 − M 2 γ 2 ± γ 2 M 1 − S 2 (10.238)
Para hallar la dependencia de cos θ, notamos que L tiene la siguiente expresión en

términos de ψ:
ǫ − cos ψ
L= (10.239)
1 − ǫ cos ψ
Entonces:
√
sen (ϕθ − ϕr ) 1 − ǫ2 sen ψ − cos(ϕθ − ϕr )(ǫ − cos ψ)
cos θ = γ (10.240)
(1 − ǫ cos ψ)
donde hemos tomado el signo negativo en (10.238) para hacer la expresión compatible
con el caso en que la órbita está colocada completamente en el plano x − z.
Despejando a M en términos de cos θ obtenemos:
Sp 2 1 p
M =− γ − cos θ ± cos θ 1 − S2 (10.241)
γ2 γ2
y usando las definiciones (10.236), llegamos a la siguiente expresión para la ecuación de
la órbita en términos de las variables acción-ángulo:
r
( (Iθ + Iϕ )2
1 I2 1 1−
= 1+ s I2
r 2
(Iθ + Iϕ ) a Iϕ2
1−
(Iθ + Iϕ )2 (10.242)
" s #)
Iϕ2
× sen (ϕθ − ϕr ) sen2 θ − ± cos(ϕθ − ϕr ) cos θ
(Iθ + Iϕ )2
Si la partı́cula se mueve sobre un plano que contiene al eje z, no tendrá componente

del momento angular en ese eje, o sea Iϕ = 0. En ese caso, según (10.172), θmı́n = 0 y
θmax = π, y según (10.233), γ = 1. Entonces (10.242) toma la forma:
( r )
1 I2 1 Iθ2
= 2 1 ± 1 − 2 cos[θ ∓ (ϕθ − ϕr )] (10.243)
r Iθ a I
Si tomamos el signo positivo y definimos a θ0 como:

θ0 = ϕθ − ϕr (10.244)
llegamos a la fórmula conocida:
1 1 + ǫ cos(θ − θ0 )
= (10.245)
r a(1 − ǫ2 )
Entonces θ0 es la dirección del vector absidal del perihelio respecto al eje z, o sea
la orientación de la elipse.
Las frecuencias asociadas a los movimientos en r, ϕ y θ son iguales, pues (10.188)
conduce a:
∂E mK 2
ωr = ωθ = ωϕ = = (10.246)
∂I I3
Según (10.120) y (10.122), habrán dos constantes de movimiento asociadas a la
degeneración:
ϕr − ϕθ y ϕϕ − ϕθ (10.247)
Cuando Iϕ = 0, la órbita está colocada en el plano z − x′ , donde x′ hace un ángulo
cualquiera con el eje x.
θ0 es el ángulo entre los ejes x y z, como se muestra en la figura 10.10.
z x-
y-
θ0
x′
θ
Figura 10.10 Órbita en el plano z − x′
Cuando Iϕ = 0 y θ0 = 0, la ecuación (10.240) da la siguiente relación entre θ y ψ:

r
θ 1−ǫ ψ
cot = cot (10.248)
2 1+ǫ 2
En general, para una órbita con orientación arbitraria y con el plano de la órbita
fuera del plano zx′ tenemos:
θ0 = ϕθ − ϕr ; cos θmin = γ ; cos θmax = π − θmin (10.249)
En términos de estos ángulos la ecuación general de la órbita es:

1 1 ǫ
= 1+
r (1 − ǫ2 ) a cos θmı́n
(10.250)
√
cos θ0 cos θ + sen θ0 sen2 θ − sen2 θmı́n
Solución para el movimiento en ϕ. ϕϕ está dada por:

∂Σ ∂Σr ∂Σθ ∂Σϕ
ϕϕ = = + + (10.251)
∂Iϕ ∂Iϕ ∂Iϕ ∂Iϕ
De (10.229) vemos que:
∂Σr r − (1 − ǫ2 ) a
= ϕr − sen−1 (10.252)
∂Iϕ ǫr
De (10.191) se sigue:
Iϕ 1
Z 1−
∂Σθ Iθ + Iϕ sen2 θ
= s dθ (10.253)
∂Iϕ Iϕ2 1
1−
(Iθ + Iϕ )2 sen2 θ
El cambio de variable:
s
cos2 θ
v= (10.254)
sen θ − (1 − γ 2 )
2
nos lleva a:
Z Z
dθ dv
p =−
sen4 θ − (1 − γ 2 ) sen2 θ 1 + v 2 (1 − γ 2 )
(10.255)
1 p
−1
=− tan [v 1 − γ2]
1 − γ2
Entonces (10.252), (10.253), (10.255) junto con (10.230) nos conducen a:
p
ϕϕ = ϕθ + tan−1 [v 1 − γ 2 ] + ϕ (10.256)
Resolviendo para v hallamos:
1
v=p tan(ϕϕ − ϕθ − ϕ) (10.257)
1 − γ2
que equivale a la siguiente ecuación cuadrática en cos θ:
(1 − γ 2 ) cos2 θ + tan2 (ϕϕ − ϕθ − ϕ) cos2 θ
(10.258)
−γ 2 tan2 (ϕϕ − ϕθ − ϕ) = 0
por tanto:
cos θmı́n tan(ϕϕ − ϕθ − ϕ)
cos θ = p (10.259)
sen2 θmı́n + tan2 (ϕϕ − ϕθ − ϕ)
o si se quiere:
sen θmı́n cos θ
tan(ϕϕ − ϕθ − ϕ) = √ 2 (10.260)
cos θmı́n − cos2 θ
Usando (10.238) obtenemos esta expresión para la dependencia temporal de ϕ:
tan(ϕϕ − ϕθ − ϕ) =
√ (10.261)
− cos θ0 (ǫ − cos ψ) + sen θ0 1 − ǫ2 sen ψ
sen θmı́n √
sen θ0 (ǫ − cos ψ) + cos θ0 1 − ǫ2 sen ψ
Cuando la órbita está en el plano x − y, Iθ = 0, o sea γ = 0. Entonces θmı́n =
θmax = π/2 = θ. En consecuencia, si tomamos θ0 = 0,
−ǫ + cos ψ
tan(ϕϕ − ϕθ − ϕ) = √ (10.262)
1 − ǫ2 sen ψ
de donde:
√ r
1 − ǫ2 sen ψ 1 − ǫ2 p 2 2
cos(ϕϕ − ϕθ − ϕ) = = a ǫ − (a − r)2 (10.263)
1 − ǫ cos ψ ǫr
que nos conduce a una ecuación similar a la (10.245), pero esta vez para la órbita en el
plano x − y. Entonces el ángulo que hace el vector absidal del perihelio respecto al eje
x, cuando θ0 = 0, es:
π
ϕ0 + donde ϕ0 = ϕϕ − ϕθ (10.264)
2
Cuando la órbita está en el plano z − x′ , Iϕ = 0 y sen θmı́n = 0 entonces tan(ϕϕ −
ϕθ − ϕ) = 0. Por tanto en este caso el ángulo ϕ es constante y vale ϕ0 , que es el ángulo
que hace la lı́nea de intersección entre el plano vertical de la órbita y el plano x − y.
En general, para Iϕ y Iθ arbitrarios, el plano de la órbita y el plano x − y se cortan
en la lı́nea Ox′ , llamada lı́nea de nodos. La curva cruza el plano xy cuando θ = π/2 y
cuando θ = 3π/2. En esos puntos, según (10.260), ϕ vale ϕ0 . En conclusión, ϕ0 es el
ángulo de la lı́nea de nodos respecto al eje x. ϕ0 es el acimut de la partı́cula cuando
θ = π/2 y π + ϕ0 es el acimut cuando θ = 3π/2.
Como ϕ es una variable cı́clica, pϕ es constante de movimiento, cuyo valor es igual al
de Iϕ cuya variable canónica conjugada es ϕϕ . Por medio de una transformación canónica
es posible hacer que las variables acción-ángulo sean (Ir + Iθ + Iϕ , ϕr ), (Iθ + Iϕ , ϕθ − ϕr )
y (Iϕ , ϕϕ − ϕθ ), con lo cual vemos que l y θ0 son variables canónicas conjugadas, lo
mismo que lz y ϕ0 .
Como sabemos, θ0 y ϕ0 en tanto que variables angulares son no uniformes pues al
completar un ciclo sobre las lı́neas γθ0 y γϕ0 del toroide no regresan a su valor original
sino que aumentan en 2π, pero esto no tiene efecto sobre las fórmulas ya que aparecen
en funciones trigonométricas.
Los ejes x, y, z fijos a la órbita, se pueden ubicar respecto a los ejes x, y, z mediante
los ángulos de Euler que denotaremos ϕ′ , θ′ , ψ ′ definidos en la sección 7.6. ϕ′ es el ángulo
entre x′ y x, θ′ el ángulo entre z y z y el ψ ′ ángulo entre x y x′ , donde el eje x′ coincide
con la lı́nea de nodos.
(Véase figura 10.11). ϕ′ , θ′ , ψ ′ están relacionados con θ0 , ϕ0 mediante:
π π
ϕ′ = ϕ0 ; θ′ = − θmı́n ; ψ′ = − θ0 (10.265)
2 2
z z
θ′ θmin
y′
y
α
θ0
x
ψ′
y
ϕ′
x′
Figura 10.11 Los ejes x, y y z están fijos a la órbita y ubicados respecto a x, y y z mediante
los ángulos de Euler. x, y están sobre el plano de la órbita.
El ángulo entre el vector absidal del perihelio, eje x, y el eje z, es α, cuyo coseno
es el elemento 1 − 3 de la matriz que conecta los ejes x, y, z con los ejes x, y, z:
cos α = sen ψ ′ sen θ′ = cos θmin cos θ0 (10.266)
Puede mostrarse que el vector de Runge-Lenz tiene la expresión A ~ = ǫ~ex , por tanto
Az = ǫ cos α.
I determina la longitud del semieje mayor de la órbita a, en tanto que I y Iθ + Iϕ
determinan la excentricidad.
Concluimos que las variables acción-ángulo determinan la forma y tamaño de la
órbita, lo mismo que su orientación en el espacio. I además determina la frecuencia y
ϕr determina la posición de la partı́cula sobre la órbita. ϕ0 , θ0 , ϕr , Iϕ , Iθ + Iϕ , I son
conocidas como los elementos de Delaunay de la órbita en astronomı́a.
Ejemplo 10.4.2 Hallar las expansiones de Fourier para z y x ± iy.

De la matriz de rotación en términos de los ángulos de Euler se sigue:

z = sen θ′ sen ψ ′ x + sen θ′ cos ψ ′ y (10.267)
Entonces, usando (10.265):
z = cos θmı́n (cos θ0 x + sen θ0 y) (10.268)
x y y están dados por (10.222) y (10.223). En consecuencia:
( ∞ −iϕr
3 X e
z = aγ − ǫ−iϕr + Jn′ (nǫ) cos nϕr
4 n=1
n
√ )
1 − ǫ2
−i Jn (nǫ) sen nϕr eiϕθ
ǫ
( (10.269)
∞ iϕr
X
3 e
+aγ − ǫeiϕr + Jn′ (nǫ) cos nϕr
4 n=1
n
√ )
1 − ǫ2
+i Jn (nǫ) sen nϕr e−iϕθ
ǫ
Igualmente de la matriz de rotación obtenemos:

x + iy = [(cos ψ ′ cos ϕ′ − cos θ′ sen ϕ′ sen ψ ′ )
+i(cos ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ sen ψ ′ )] x

(10.270)
+ [(−sen ψ ′ cos ϕ′ − cos θ′ sen ϕ′ cos ψ ′ )
+i(−sen ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ cos ψ ′ )] y

Usando nuevamente (10.265), (10.206) y (10.209) llegamos a:
h p
x + iy = a sen θ0 + i 1 − γ 2 cos θ0 (cos ψ − ǫ)
√ i (10.271)
p
+ − cos θ0 + i 1 − γ 2 sen θ0 1 − ǫ2 sen ψ ǫiϕ0
Finalmente, usando (10.222) y (10.223) llegamos a:

" !
p 3ǫ X∞ −iϕr
e
x + iy = i −1 + 1 − γ 2 − e−iϕr + Jn′ (nǫ) cos nϕr
4 n=1
n
#
p √1 − ǫ2 X∞ −iϕr
e
− −1 − i 1 − γ 2 Jn (nǫ) sen nϕr eiϕϕ
ǫ n=1
n
" !
p 3ǫ X∞ −iϕr
e
+ i 1 + 1 − γ2 − e−iϕr + Jn′ (nǫ) cos nϕr
4 n=1
n
√ ! ∞ #
p 1 − ǫ2 X e−iϕr
− 1 + i 1 − γ2 Jn (nǫ) sen nϕr ei(ϕϕ −2ϕθ )
ǫ n=1
n
(10.272)
Vemos que se anulan todos los coeficientes de Fourier para los cuales nϕ y nθ son
diferentes de:
nϕ = 0, 1, −1 ; nθ = 0, ±2 (10.273)
En cuanto a n no hay ninguna restricción.
Según la fórmula (10.225), para este caso se tiene:
ω4 4 h i
In, nθ , nϕ = 03 τn, nθ , nϕ
An, n , nϕ 2 + Bn, n , nϕ 2 (10.274)
θ θ
3c
donde τn, nθ , nϕ es un número que describe el orden del armónico de ω0 radiado, y A y
B son los coeficientes de Fourier de z y de x + iy respectivamente. Vemos que solamente
es posible la radiación asociada a los nθ y nϕ dados por (10.273).
Las fórmulas (10.269) y (10.272) pudieron también obtenerse directamente de
(10.240) y de (10.256).
Ejemplo 10.4.3 Mostrar que el vector de Runge-Lenz (o de Laplace) es una constante

de movimiento asociada a la degeneración del movimiento en el problema de Kepler.
~ es constante:
Es simple mostrar que el vector A
~ = p~ × ~l − mk ~r
A (10.275)
r
Como A~ · ~l = 0, se sigue que A~ es un vector fijo en el plano de la órbita. Tomando
el producto escalar de A ~ con ~r obtenemos:
Ar cos ϕv = l2 − mkr (10.276)

Comparando con la ecuación de la órbita vemos que la magnitud de A es esencial-
mente ǫ:
A = mkǫ (10.277)
Se sigue entonces que sólo una de las componentes de A ~ es independiente de las

~
constantes de movimiento E y l. De (10.276) se sigue también que A~ está en la dirección
del perihelio, de donde se concluye que salvo el factor mk:
~ = ǫ~ex ;
A Az = ǫ cos α (10.278)
Como cos α tiene la expresión (10.266), se sigue que Az depende esencialmente
de la constante θ0 = ϕθ − ϕr , que sabemos es constante debido a la degeneración del
movimiento y además es independiente de ~l y E. También sabemos que la existencia de
este tipo de constantes está asociada a la posibilidad de separar las variables en otro
sistema de coordenadas. En efecto, según veremos, A es precisamente la constante que
aparece al separar variables en coordenadas parabólicas.
Ejemplo 10.4.4 Mostrar que las constantes de movimiento lx , ly están asociadas a la

degeneración del movimiento angular en un problema de fuerzas centrales.
De las fórmulas (5.23) en la sección 5.1 sabemos que:
lx = −pθ sen ϕ − pϕ cot θ cos ϕ ;

(10.279)
ly = pθ cos ϕ − pϕ cot θ sen ϕ
Que pθ y pϕ tienen las siguientes expresiones es válido en cualquier problema de

fuerzas centrales:
r
l2
pθ = l2 − z2 ; pϕ = lz (10.280)
sen θ
donde l y lz son las constantes de separación en coordenadas esféricas. Para precisar,
adoptemos los resultados en el movimiento kepleriano. Según (10.258) se cumple:
p
1 − γ2
sen θ = p
1 − γ cos2 (ϕ − ϕ0 )
2
(10.281)
−r sen (ϕ − ϕ0 )
cos θ = p
1 − γ 2 cos2 (ϕ − ϕ0 )
lx puede escribirse en la forma siguiente usando (10.260):

p sen ϕ
lx = −l γ 2 − cos2 θ − lz cot θ cos ϕ
sen θ
p ! (10.282)
l 1 − γ 2 sen ϕ
= − lz cos ϕ cot θ
tan (ϕ − ϕ0 )
Entonces, usando (10.281) llegamos a:
lx = l cos θmı́n sen ϕ0 (10.283)
similarmente,
ly = −l cos θmı́n cos ϕ0 (10.284)
Estos resultados son válidos para fuerzas centrales en general y no sólo en el caso
kepleriano, ya que independientemente de la forma del potencial la energı́a depende de
Iθ y Iϕ en la combinación Iθ + Iϕ , lo cual da lugar a que:
ωθ = ωϕ (10.285)
en cualquier problema de fuerzas centrales y por tanto ϕ0 = ϕϕ − ϕθ es una constante

de movimiento, lo que a su vez implica que lx y ly sean constantes. l, lz y lx2 + ly2 =
l2 cos2 θmin = l2 −lz2 son constantes de movimiento especiales de las coordenadas esféricas
y por lo tanto sólo dependen de las variables de acción. lx y ly son constantes que
dependen de las variables angulares 6 ϕθ y ϕϕ a través de ϕ0 y están asociadas a la

posibilidad de separar el movimiento angular del radial en coordenadas esféricas donde
el eje polar es reemplazado por x o por y.
Que lx y ly dependan de las variables angulares es resultado de la propiedad general
del vector momento angular consistente en que no existe una transformación canónica
en que lx , ly , lz sean simultáneamente momentos generalizados. En efecto, en el ejemplo
9.8.4 se muestra que las componentes de ~l no están en involución entre sı́:
[li , lj ] = ǫijk lk ; i, j, k = x, y, z (10.286)
Notemos que (10.286) es una propiedad de los li que sabemos son los generadores
infinitesimales del grupo de rotaciones.
Se dice que ~l tiene un álgebra de Lie cuyas constantes de estructura son ǫijk .
Ejemplo 10.4.5 Mostrar la invariancia bajo el grupo O(4).
~ y ~l podemos formar los vectores J~ y K

Con los vectores A ~ definidos como:

1 ~ 1 ~ = 1 ~l − √ 1
J~ = l+ √ ~ ;
A K (10.287)
2 −2mE 2 −2mE A ~
Estos vectores están en involución entre sı́, mas no sus componentes:
[Ji , Jj ] = ǫijk Jk , [Ki , Kj ] = ǫijk Kk , [Ji , Kj ] = 0 (10.288)
Por tanto J~ y K ~ tienen cada uno un álgebra de Lie como la del grupo de rota-
ciones. Concluimos que el hamiltoniano de una partı́cula ligada en un potencial −k/r
es invariante bajo dos grupos de rotaciones independientes. Estos grupos son subgrupos
de un grupo más general, el de las rotaciones ortogonales O(6). La representación O(6)
es reducible siendo una de sus representaciones irreducibles O(4). Como, según vimos
en la sección 7.8, existe un homomorfismo entre O(3) y SU (2), entonces podemos ver
que hay un homomorfismo entre las representaciones O(4) y SU (2) ⊗ SU (2). Vemos
que la degeneración del sistema que consideramos resulta del hecho de ser invariante el
hamiltoniano bajo un grupo de simetrı́a más amplio que el grupo de rotaciones.
Entre las siete constantes de movimiento J, ~ K
~ y H sólo existen 5 constantes in-
2 2
dependientes, que podemos tomar como J , K , Jz , Kz , H pues existen dos relaciones
entre ellas, provenientes de:
2
J~ − K
~ · ~l = 0 ; J~ − K
~ = mkaǫ2 (10.289)
De (10.288) puede verse que estas cinco constantes no están en involución. Por tanto
si se halla un sistema de coordenadas en que J 2 y K 2 sean constantes de separación,
necesariamente Jz y Kz dependerán de variables angulares.
6 Puede verse que los “buenos números cuánticos” están asociados precisamente con las variables
dinámicas que no dependen de variables angulares.
10.5. Problema de Kepler (coordenadas parabólicas)
Las coordenadas parabólicas en tres dimensiones son una generalización de las

definidas en el ejemplo 10.3.5.
p p
x = 2 ξn cos ϕ ; y = 2 ξn sen ϕ ; z =ξ−n (10.290)
donde ϕ es el ángulo acimutal. Las fórmuIas inversas son:
1 θ
ξ= (z + r) = r cos2
2 2
1 θ (10.291)
η= (−z + r) = r sen2
2 2
y
ϕ = tan−1
x
Con un procedimiento análogo al del ejemplo 10.3.5 llegamos a:
s
Z
2mK1 p2ϕ
Σ(ξ, η, ϕ; E, K, pϕ ) = 2mE + − 2 dξ
ξ 4ξ
(10.292)
s
Z
2mK2 p2ϕ
+ 2mE + − dη + ϕpϕ (10.293)
η 4η 2
Las constantes de separación K1 y K2 satisfacen:
K1 + K2 = K ; 0 ≤ K1 ≤ K (10.294)
Las variables de acción son definidas por:
s
I
p2ϕ 2mK1
2πIξ = 2mE − 2 + dξ (10.295)
4ξ ξ
s
I
p2ϕ 2mK2
2πIη = 2mE − 2 + dη (10.296)
4η η
2πIϕ = 2πpϕ (10.297)

De la siguiente ecuación, dada en Goldstein, que se deduce similarmente a la inte-
gral de (10.134) en el ejemplo 10.3.4,
I r
2B C √ B
A+ − 2 dr = 2πi −C + √ (10.298)
r r A
obtenemos:

pϕ mK1,2
Iξ , η = i i +√ (10.299)
2 2mE
que junto con (10.297) nos conduce a la siguiente expresión para la energı́a en términos
de las variables de acción parabólicas:
mk 2
E=− (10.300)
2(Iξ + Iη + Iϕ )2
Si definimos a I como:
I = Iξ + Iη + Iϕ (10.301)
llegamos a la siguiente expresión para las constantes K1 y K2 en términos de las variables

de acción:
2Iξ,η + Iϕ
K1,2 = K (10.302)
2I
Es conveniente definir una sola constante, pues K1 y K2 están relacionadas por
(10.294):
K1 − K2 Iξ − Iη
β= = ; −1 ≤ β ≤ 1 (10.303)
K I
Veremos que β coincide con la componente z del vector de Runge-Lenz (véase en
Mecánica cuántica de Laudau, sección 37).
Entonces K1 y K2 tienen la siguiente expresión en términos de β:
1+β 1−β
K1 = K; K2 = K (10.304)
2 2
Ejercicio 10.5.1 Expresar a K1 y K2 en coordenadas parabólicas. Luego, usando las
fórmulas de transformación expresar a β en coordenadas cartesianas y mostrar que
coincide con la componente z del vector de Laplace.
Variables angulares ϕξ y ϕη . De (10.293) se sigue que:
∂E m ∂K1
Z m +
∂Iξ ξ ∂Iξ
ϕξ = s dξ
2mK1 p2ϕ
2mE + − 2
ξ 4ξ
(10.305)
∂E m ∂K2
Z m +
∂Iξ η ∂Iξ
+ s dη
2mK2 p2ϕ
2mE + − 2
η 4η
De (10.300) y (10.302) se siguen:
∂E mk 2 2E
ωξ = ωη = ωϕ = = 3 =− (10.306)
∂I I I
y,
∂K1,2 K2 ∂K1,2 K1 ∂K1,2 K1 − K2
=± ; =∓ ; =∓ (10.307)
∂Iξ I ∂Iη I ∂Iϕ I
Por tanto:
2mE mK1
Z − +
I ξI
ϕξ = s dξ
2mK1 p2ϕ
2mE + − 2
ξ 4ξ
(10.308)
2mE mK 2
Z − −
I ηI
+ s dη
2mK2 p2ϕ
2mE + − 2
η 4η
ϕη tiene una expresión análoga, colocando η, en lugar de ξ y K1 en lugar de K2 .

Definimos a y γ ası́:
I2 Iϕ
a= ; γ= (10.309)
mk I
los puntos de retorno en ξ y ϕ están dados por:
s !
1+β γ2
ξmax,min = a 1± 1− ;
2 (1 + β)2
s (10.310)
!
2
1−β γ
ηmax,min = a 1± 1−
2 (1 − β)2
Las fórmulas 14.281 y 14.280 del Manual de fórmulas y tablas matemáticas de

Spiegel nos dan para ϕξ :
s
2
ξ ξ γ2
ϕξ = − − + (1 + β) −
a a 4
r
η 2 η γ2
− − + (1 − β) − +
a a 4 (10.311)
2 ξ
1−
1+β a
−sen−1 s
γ2
1−
(1 + β)2
ϕη tiene una expresión análoga intercambiando ξ con η y 1 + β con 1 − β.

7
Si definimos a θ1 , Lξ y Lη ası́:
2ξ
1−
(1 + β) a
θ1 = ϕξ − ϕn ; Lξ = s ;
γ2
1−
(1 + β)2
2η (10.312)
1−
(1 − β) a
Lη = s
γ2
1−
(1 + β)2
obtenemos:
s !
2ξ 2η γ2
, = 1− 1− Lξ , η (1 ± β) (10.313)
a a (1 ± β)2
y,
θ1 = −sen−1 Lξ + sen−1 Lη (10.314)
Además,
1p q
ϕξ,η = − (1 + β)2 − γ 2 1 − L2ξ
2
(10.315)
1p q
− (1 − β)2 − γ 2 1 − L2η − sen2 Lξ,η
2
Ahora definamos dos nuevas variables (anomalı́as excéntricas):
Lη = sen αη ; Lξ = sen αξ (10.316)
Entonces (10.314) y (10.315) se convierten en:
θ1 = −αξ + αη (10.317)
1p
ϕξ = − (1 + β)2 − γ 2 cos αξ
2
(10.318)
1p
− (1 + β)2 − γ 2 cos(θ1 + αξ ) − αξ
2
1p
ϕη = − (1 + β)2 − γ 2 cos(αη − θ1 )
2
(10.319)
1p
− (1 + β)2 − γ 2 cos αη − αη
2
7 Como se cumple (10.306), se sigue que θ1 es una constante de movimiento asociada a la degeneración.
Las fórmulas (10.318) y (10.319) son ecuaciones trascendentales que permiten en

principio expresar a αξ y αη en función de las variables angulares y en consecuencia de
(10.313) expresar a ξ y η en función del tiempo, en efecto:
1 p
ξ= a 1 + β − (1 + β)2 − γ 2 sen αξ (10.320)
2
1 p
η= a 1 − β − (1 − β)2 − γ 2 sen αη (10.321)
2
De (10.314) se obtiene una ecuación que relaciona a ξ con η y que constituye la

ecuación de la órbita en coordenadas parabólicas. El resultado es:
( s
a (1 + β)2 − γ 2 2η
ξ= 1+β− 1 − β − cos θ1
2 (1 − β)2 − γ 2 a
#) (10.322)
r
2
4η 4η
+ −γ 2 + (1 − β) − 2 sen θ1
a a
Relación con la solución en coordenadas esféricas. Empecemos por expresar

a ǫ en términos de γ, β y θ1 . Para ello basta hallar una expresión para r = ξ + η usando
(10.320) y (10.321):
r
r 1 + β2 − γ2 1p
=1− + (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1
a 2 2 (10.323)
(1)
× cos(αξ − αξ )
Donde:
p p
(1) (1 + β)2 + γ 2 + (1 − β)2 + γ 2 cos θ1
tan αξ = p (10.324)
(1 − β)2 − γ 2 sen θ1
8
Comparando (10.323) con (10.203) cuando r = rmax , obtenemos:
r
1 + β2 − γ2 1p
ǫ= + (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1 (10.325)
2 2
Por otra parte, z, en coordenadas parabólicas y en esféricas es:
z 1p 1p
=β− (1 + β 2 ) − γ 2 sen αξ + (1 − β)2 − γ 2 sen αη (10.326)
a 2 2
r
z 1 − ǫ2 − γ 2 h p 2 sen ψ sen θ − (ǫ − cos ψ) cos θ
i
= − 1 − ǫ 0 0 (10.327)
a 1 − ǫ2
8 Estafórmula nos muestra que los valores de β y γ no son arbitrarios: si β > 0, 0 ≤ |γ| ≤ 1 − β y si
β < 0, 0 ≤ |γ| ≤ 1 + β.
Estas expresiones equivalen a:

" r #
1+β 2 −γ 2 1 p 2 2 2 2 4 (2)
z = a β+ − (1−β ) −2γ (1+β )+γ cos θ1 cos(αξ −αξ ) (10.328)
2 2
r
1 − ǫ2 − γ 2 h p
2 sen2 θ cos(ψ − ψ (1) )
i
z=a −ǫ cos θ 0 − 1 − ǫ 0 (10.329)
1 − ǫ2
(2)
donde αξ y ψ (1) se definen ası́:
p p
(2) − (1 + β)2 − γ 2 + (1 − β)2 − γ 2 cos θ1
tan αξ = p (10.330)
(1 − β)2 − γ 2 sen θ1
√
1 − ǫ2 sen θ0
tan ψ (1) = (10.331)
cos θ0
máx 2
zmı́n 2
−β = 1 + β 2 − γ 2 − ǫ2 = β 2 + (1 − ǫ2 ) cos2 θmı́n (10.332)
a
En tanto que de (10.329):
p
máx
zmı́n = a cos θmı́n −ǫ cos θ0 ± 1 − ǫ2 sen2 θ0 (10.333)
máx
De (10.332) y (10.333) obtenemos para β en términos de zmı́n :
mı́n
2
zmáx /a + (ǫ2 − 1) cos2 θmı́n
β= mı́n /a
2zmáx (10.334)
= −ǫ cos θ0 cos θmı́n
Esto nos muestra que β es esencialmente la componente z del vector de Runge-Lenz:
en coordenadas parabólicas depende sólo de variables de acción, pero en coordenadas
esféricas depende además de variables angulares.
Por otra parte, de (10.325) y (10.334) se tiene la siguiente expresión para cos θ1 en
términos de γ, ǫ y cos θ0 , donde se ha llamado C a cos2 θmin :
−C + ǫ2 (1 + C sen2 θ0 )
p (10.335)
C 2 − 2ǫ2 C(1 − 2 sen2 θ0 + C sen2 θ0 ) + ǫ4 (1 − C sen2 θ0 )2
Cuando la órbita toca el eje z, sen θmı́n = 0. Entonces:
−1 + 2ǫ2 − ǫ2 cos2 θ0
cos θ1 = (10.336)
1 − ǫ2 cos2 θ0
esto nos permite llegar de (10.322), cuando γ = 0, al expresar a β, θ1 , ξ, η en función
de las cantidades esféricas, a la fórmula (10.245). (10.322) es, pues, la ecuación de una
elipse en el espacio expresada en coordenadas parabólicas (véase figura 10.12).
También de (10.334) y (10.325) se llega a una expresión para cos θ0 en términos de

γ, β y cos θ1 .
Las coordenadas ξ y η oscilan entre los lı́mites señalados por la ecuación (10.310).
Cuando γ = 0, ξmı́n = ηmı́n = 0. Cuando β = 0, ξmáx = ηmáx y ξmı́n = ηmı́n . Cuando
β = γ − 1, ξmı́n = ξmáx y cuando β = 1 − γ, ηmı́n = ηmáx . En general, la trayectoria
está confinada a una región en forma de anillo, definida por las paraboloides ξ = ξmı́n ,
ξ = ξmáx , η = ηmı́n , η = ηmáx .
z η = ηmín
η = ηmáx
ξ = ξmáx
ξ = ξmín
Figura 10.12 Lı́mites del movimiento en coordenadas parabólicas
En el caso β = 0, γ = 1, resulta que ηmı́n = ηmax = ξmı́n = ξmax = a/2 y por tanto
el anillo queda reducido a una circunferencia de radio a colocada en el plano x − y. En
este caso según (10.325) ǫ = 0, como debe ser.
Cuando β = γ − 1 o β = −γ + 1, el movimiento sólo es posible a lo largo de curvas
colocadas sobre la superficie de un casquete lateral.
Las órbitas compatibles con valores dados de E, β, γ se caracterizan por tener un
vector de Runge-Lenz con componente z definida, por tener un momento angular con
componente z definida y por tener un semieje mayor de longitud definida. El ensamble
de órbitas con valores de E, β, γ definidos no tienen una excentricidad definida, aunque
la ecuación (10.325) fija el rango de excentricidades posibles.
Puede mostrarse que Iβ /2 y θ1 son variables canónicamente conjugadas, en tanto
que [Iϕ , θ1 ] = 0.
Como de (10.287) se puede hallar que:
1 1
Jz = (Iϕ − Iβ ) = I(γ − β) (10.337)
2 2
se sigue que esencialmente Jz y θ1 son variables canónicamente conjugadas y que Jz es el
generador infinitesimal de z, las rotaciones que dejan invariante la proyección del vector
de Laplace en el eje z. En una de estas rotaciones el valor de θ1 cambia y por ende el

valor de ǫ. Por tanto las rotaciones generadas por Jz en el espacio de representación de
O(4), no dejan rı́gida la órbita; θ1 no es un ángulo que especifique una orientación de
una órbita rı́gida, pues al variarse cambia necesariamente, o sea cambia el valor de l.
Para precisar, asumamos que γ = 0. Entonces de (10.310) se sigue que ξmı́n =
ηmin = 0, o sea que el anillo se convierte en una región llena, limitada por los paraboloides
ξmax = a(1 + β) y ηmax = a(1 − β). Según la ecuación de la órbita (10.322) cuando
η = ηmı́n , ξ vale:
1
ξ = (1 + β)(1 − cos θ1 ) (10.338)
2
cuando ξ = ξmı́n , η vale:
1
η = (1 − β)(1 − cos θ1 ) (10.339)
2
El punto de la órbita (0, ξ) es x = 0, y = 0, r = z = ξ. El punto de la órbita (η, 0)
es x = 0; y = 0, r = −z = η. En coordenadas esféricas estos puntos corresponden a las
intersecciones de la órbita vertical con el eje z, para los cuales:
a(1 − ǫ2 )
r= (10.340)
1 ± ǫ cos θ0
expresión que se puede obtener de (10.338) y (10.339). ǫ y θ0 están dados por:
r
1 + β 2 + (1 − β 2 ) cos θ1
ǫ= (10.341)
2
s
2
cos θ0 = −β (10.342)
1 + β + (1 − β 2 ) cos θ1
2
Cuando θ1 = 0, ǫ = 1 y cos θ0 = −β. Cuando β = 1, ǫ = 1 y cos θ0 = −1. Son dos

casos de trayectoria rectilı́nea en un plano que pasa por el eje z.
De (10.328) y (10.329) junto con (10.334) y (10.335) se siguen las relaciones entre
las variables angulares y las anomalı́as excéntricas:
(2)
αξ = αξ + ψ − ψ (1) − π (10.343)
(1)
ϕr = −ϕξ − αξ (10.344)
(2) (1)
αξ = αξ + ψ (1) + π (10.345)
La variable angular ϕϕ , está dada por:
∂E m ∂K1 pϕ ∂pϕ
Z m + − 2
∂Σ ∂Iϕ ξ ∂Iϕ 4ξ ∂Iϕ
ϕϕ = = ϕ+ q dξ
∂Iϕ 2 2
2mE − pϕ /(4ξ ) + 2mK1 /ξ
(10.346)
∂E m ∂K2 pϕ ∂pϕ
Z m + − 2
∂Iϕ η ∂Iϕ 4η ∂Iϕ
+ q dη
2 2
2mE − pϕ /(4η ) + 2mK2 /η
usando (10.305), (10.306) y (10.307) obtenemos:

1
ϕϕ = ϕ + (ϕξ + ϕη )
2
Z
1 dξ
− pϕ q
4 ξ 2mEξ 2 + 2mK1 ξ − p2ϕ /4 (10.347)
Z
1 dη
− pϕ q
4 η 2mEη + 2mK2 η − p2ϕ /4
2
calculando las integrales con la fórmula 14.283 del manual de Spiegel y expresando todas
las constantes de movimiento en función de a, β y γ, hallamos:
2ξ γ2
−
1 1 a 1+β
ϕϕ = ϕ + (ϕξ + ϕη ) − sen−1 s
2 2 2ξ γ2
1−
a (1 + β)2
(10.348)
2η γ2
−
1 a 1−β
− sen−1 s
2 2η γ2
1−
a (1 − β)2
debido a la degeneración se cumple que:

1
(ϕξ + ϕη ) = ωt + Constante (10.349)
2
Por tanto podemos definir una nueva constante de movimiento que depende de las
variables angulares y que debe su carácter de constante a la degeneración:
1
ϕ1 = ϕϕ − (ϕξ + ϕη ) (10.350)
2
Cuando γ = 0, el plano de la órbita se corta perpendicularmente con el plano x − y
en la lı́nea de nodos. En este caso ϕ vale ϕ1 ; luego ϕ1 es el ángulo que hace la lı́nea de
intersección del plano de la órbita con el plano ecuatorial 9 .
Cuando z = 0, ξ = η, y además ξ = ξmax , se cumple que ϕ = ϕ1 . Entonces ϕ1 es
el ángulo de la lı́nea de nodos de aquella elipse que pasa por ξmax en el plano ecuatorial,
para otros valores de ξ esto no se cumple.
Ejemplo 10.5.1 Hallar la expansión de Fourier para z y x + iy, en coordenadas parabóli-

cas. Véase en Max Born The mechanics of the atom, sección 36.
9 Nótese
que (10.347) y (10.348) no son idénticas, pues las integrales indefinidas contienen constantes
que se han omitido en (10.348)
De (10.326) y (10.317) se sigue que z depende de las variables angulares ϕξ y ϕη .

De (10.317) vemos que αξ no es función par ni impar de ϕξ y que αη no es función par
ni impar de ϕη . Por tanto la expansión de fourier de z contiene la forma sen nξ ϕξ y
cos nξ ϕξ y similarmente para la dependencia respecto a ϕη . Por esto es más conveniente
la siguiente expansión:
∞
X ∞
X
z= Anξ nη ei(nξ ϕξ +nη ϕη ) (10.351)
nξ =−∞ nη =−∞
como z = ξ − η, los coeficientes de Fourier son:

Z 2π Z 2π
1
Anξ nη = (ξ − η)e−i(nξ ϕξ +nη ϕη ) dϕξ dϕη (10.352)
4π 2 0 0
De (10.318), (10.319) se sigue que:

1h p
dϕξ dϕη = 2 − (1 + β)2 − γ 2 sen αξ
2
i (10.353)
p
− (1 − β)2 − γ 2 sen αη dαξ dαη
Reemplazando a (10.326) en (10.352), obtenemos:

Z Z h
1 2π 2π
1p
A00 = a β− (1 + β)2 − γ 2 sen αξ
4π 2 0 0 2
1p i
+ (1 − β)2 − γ 2 sen αη
2
(10.354)
1h p
× 2 − (1 + β)2 − γ 2 sen αξ
2
p i 3
− (1 − β)2 − γ 2 sen αη dαξ dαη = βa
2
En los coeficientes donde nξ y nη no son ambos cero, el término constante β
en z se puede omitir, pues desaparece al efectuar la integral, según se ve en (10.352)
directamente. Entonces, usando una notación obvia y una propiedad de los lı́mites de
integración en (10.352):
Z 3π/2 Z 3π/2
a
Anξ nη = (−S sen αξ + R sen αη )
4π 2 −π/2 −π/2
(1 − S sen αξ − R sen αη ) (10.355)

×einξ (αξ +S cos αξ +R cos αη )
e+inη (αη +S cos αξ +R cos αη )

dαξ dαη
si llamamos n = nξ +nη , y expresamos las funciones sen αξ y sen αη en forma exponencial,

obtenemos:
Z 3π/2 Z 3π/2
−a
Anξ nη = (2R2 − 2S 2 − 2iSeiαξ + 2iSe−iαξ
16π 2 −π/2 −π/2
+2iReiαη − 2iRe−iαη + S 2 ei2αξ (10.356)

−R2 ei2αη + S 2 e−i2αξ − R2 e−i2αη )
×einξ αξ +inS cos αξ +inη αη +inR cos αη

dαξ dαη
Al sustituir αξ → 3π/2 − αξ y αη → 3π/2 − αη , cada una de las integrales resulta

proporcional a una integral de la forma:
Z 3π/2 Z 2π
1 ei3k/2
eikα+ix cos α dα = e−ikα−ix sen α dα
2π −π/2 2π 0
= eikπ/2 Jk (x) (10.357)
donde Jk (x) es la función de Bessel entera de orden k.

Expresando a (10.356) en términos de Jk y haciendo uso de las siguientes propie-
dades de las funciones Bessel:
2k
Jk−1 (x) + Jk+1 (x) = Jk (x) (10.358)
x
Jk−1 (x) − Jk+1 (x) = 2Jk′ (x) (10.359)
obtenemos:
ah i
Anξ nη = ei nπ/2 RJnξ (nR)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS) (10.360)
n
Por tanto, la expansión de Fouurier para z es:
3
z= βa
2
∞
X ∞
X i nπ/2 h i
′ e
+a RJnξ (nS)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS)
nξ =−∞ n =−∞
n
η
(nξ ϕξ +nη ϕη )
×e (10.361)
donde la prima en la sumatoria indica que se excluye el término nξ = nη = 0.

Cuando nξ + nη = 0 no hay inconveniente porque Anξ nξ se anula.
Para hacer la expansión de x + iy, notemos que según (10.290):
p
x + iy = 2 ξηeiϕ (10.362)
Reemplazando a (10.320) y (10.321) en (10.348) obtenemos:

1
ϕϕ = ϕ + (ϕξ + ϕη )
2 p
1 (1 + β 2 ) − γ 2 − (1 + β) sen αξ
− sen−1 p
2 1 + β − (1 + β)2 − γ 2 sen αξ
p
1 −1 (1 − β)2 − γ 2 − (1 − β) sen αη
− sen p (10.363)
2 1 − β − (1 − β)2 − γ 2 sen αη
√
Luego usamos la fórmula sen−1 x = i ln(−ix + 1 − x2 ) y notamos que en el
numerador del argumento se puede formar un cuadrado perfecto para llegar a:
1
ϕϕ = ϕ + (ϕξ + ϕη )
2
h αξ p α i2
(1 + β) sen − (1 + β 2 ) − γ 2 + iγ cos ξ
1
− i ln 2 p 2
2 C 1 + β − (1 + β)2 − γ 2 sen αξ
h αη p αη i2
(1 − β) sen − (1 − β)2 − γ 2 + iγ cos
× 2 p 2 (10.364)
1 − β − (1 − β)2 − γ 2 sen αη
C es una constante que depende de β y γ.

Notemos que:
p p
(x + iy)ei(ϕη −ϕϕ ) = 2 ξη ei(ϕ+ϕη −ϕϕ ) = 2 ξηei(ϕη −ϕϕ )/2
h αξ p αξ i
× (1 + β) sen − (1 + β 2 ) − γ 2 + iγ cos
h 2 2
αη p αη i
× (1 − β) sen − (1 − β)2 − γ 2 + iγ cos (10.365)
2 2
y según (10.364),
a
(x + iy)ei(ϕη −ϕϕ ) = √ ei(ϕη −ϕξ )/2
C
h αξ p αξ i
× (1 + β) sen − (1 + β)2 − γ 2 + iγ cos
h 2 2
αη p 2 2
αη i
× (1 − β) sen − (1 − β) − γ + iγ cos (10.366)
2 2
Cuando αξ = αη = 0 entonces r = ξ + η = a. Por tanto, salvo un factor de fase
constante, el valor de C es 1 − β 2 .
Born presenta en lugar de (10.366) una expresión que se origina en sus fórmulas (17) de
la sección 36. 10 Esto da lugar a una expansión de Fourier con valores erróneos para los
coeficientes.
10 Comparar dichas fórmulas con las fórmulas 15.45 y 14.360 del manual de Spiegel.
La expansión de Fourier de (10.366) la escribimos como:

∞
X ∞
X
(x + iy)ei(ϕη −ϕϕ ) = Bnξ nη einξ ϕξ +(nη +1)ϕη (10.367)
nξ =−∞ nη =−∞
El coeficiente Bnξ nη está dado por:

Z 3π/2 Z 3π/2
a
Bnξ nη = p (1 − S sen αξ − R sen αη )
4π 2 1 − β 2 −π/2 −π/2
h αξ αξ i
× (1 + β) sen − (2S + iγ) cos
2 2 (10.368)
h αη αη i
(1 − β) sen − (2R + iγ) cos
2 2
×ei(nξ +1/2)αξ +i(nη +1/2)αη +inS cos αξ +inR cos αη

dαξ dαη
donde n = nξ + nη + 1. Al expresar las funciones trigonométricas en forma exponencial,

las integrales que aparecen son del tipo de (10.357). En las simplificaciones debe usarse
(10.358).
El resultado para n 6= 0 es:

Bnξ nη = AJnξ +1 (nS) Jnη +1 (nR) + BJnξ (nS) Jnη (nR)
ei(n+1)π/2
× (10.369)
n
donde A y B están dados por:
a
A= p (1 + β + γ − 2iS)(1 − β + γ − 2iR) (10.370)
4 1 − β2
a
B= p (−1 − β + γ − 2iS)(−1 + β + γ − 2iR) (10.371)
4 1 − β2
Para n = 0, las integrales en (10.368) son de tipo exponencial y son diferentes de

cero solamente cuando nξ = −1 y nη = 0 o nξ = 0 y nη = −1
ai
B−1,0 = p (2ixy ′ − Syy ′ + Rxx′ ) (10.372)
8 1 − β2
ai
B0,−1 = p (2iyx′ − Ryy ′ + Sxx′ ) (10.373)
8 1 − β2
donde:
x = 1 + β + γ − 2iS ; y = −1 + β + γ − 2iS (10.374)
y x′ y y ′ se obtienen de éstas reemplazando a β por −β.

En definitiva:
x + iy = B−1,0 e−iϕξ +iϕϕ + B0,−1 e−iϕη +iϕϕ
∞
X ∞
X (10.375)
′
+ Bnξ nη einξ ϕξ +inη ϕη +iϕϕ
nξ =−∞nη =−∞
donde la prima en la sumatoria indica que n no es cero.

Este cálculo fue usado en el contexto de la vieja mecánica cuántica para hallar las
intensidades de las lı́neas espectrales del hidrógeno en presencia de un campo eléctrico
(efecto Stark). En presencia de un campo eléctrico el problema del átomo de hidrógeno
clásico es soluble en coordenadas parabólicas, y cuando el campo eléctrico es muy débil
la solución que hemos hallado en este numeral constituye la aproximación cero a este
sistema. Para hallar las intensidades se aplica la fórmula (10.225), del ejemplo 10.4.1.
Notamos que habrán dos contribuciones diferentes; una proveniente de z 2 , fórmula
(10.361) y otra proveniente de x2 +y 2 , fórmula (10.375). Para las componentes de Fourier
de z, nϕ = 0 y nξ + nη = n. Las amplitudes de las componentes z corresponden a la
radiación polarizada paralelamente al campo eléctrico homogéneo. Para las componentes
de Fourier de x ± iy, nϕ = ±1 y nξ + nη + 1 = n. Las amplitudes de las componentes
x + iy corresponden a la radiación polarizada perpendicularmente al campo eléctrico
homogéneo.
Born presenta el análisis que hace Kramers del desdoblamiento de Stark de la
lı́nea Hα del hidrógeno, o sea de las transiciones entre los niveles de números cuánticos
principales 2 y 3.
Ejemplo 10.5.2 Analizar las reglas de selección que se deducen de las expansiones de
Fourier (10.269), (10.272), (10.359) y (10.368).
En la vieja teorı́a cuántica y en el lı́mite clásico de la moderna teorı́a cuántica las
variables de acción están cuantizadas. Ası́, para el átomo de hidrógeno tenemos: 11

1 1
Ir = nr + h̄ ; Iθ = l − m + h̄ ; Iϕ = mh̄
2 2

|m| − m 1
Iξ = n1 + + h̄ ; (10.376)
2 2

|m| − m 1
Iη = n2 + + h̄ ; I = mh̄
2 2
El número cuántico principal está asociado a I = Ir + Iθ + Iϕ = Iξ + Iη + Iϕ y vale
nr + l + 1 = n1 + n2 + |m| + 1.
Ası́ por ejemplo, los estados esféricos y parabólicos para cuando el número cuántico
principal vale 2 son:
n, l, m = 2, 0, 0; 2, 1, −1; 2, 1, 0; 2, 1, 1
(10.377)
n1 , n2 , m = 0, 0, 1; 0, 1, 0; 1, 0, 0; 0, 0, −1
11 Esta versión de las reglas de cuantización es consistente con la moderna teorı́a cuántica.
Los números enteros que aparecen en las expansiones de Fourier (10.361) y (10.375)
del problema anterior corresponden a las transiciones entre estados (véase Mecánica
cuántica de Laudau, sección 48). Ası́, en (10.361), nϕ = ∆m = 0 y en (10.375), nϕ =
∆m = 1 y en la compleja conjugada de (10.375), nϕ = ∆m = −1. En esta forma el
desarrollo de Fourier del momento de dipolo eléctrico da las reglas de selección clásicas:
respecto a n1 y n2 la regla de selección es ∆n1 + ∆n2 + 1 = nξ + nη + 1 6= 0, (∆n1 =
0, ∆n2 = −1), o (∆n1 = −1, ∆n2 = 0).
Respecto a l y m, de (10.269) y (10.271) se sigue que nθ + nϕ = ±1. Por otra parte,
de (10.351) se sigue:
∆l − ∆m = nθ (10.378)
Entonces vemos que cuando nϕ = ∆m = ±1, nθ = ∆l ∓ 1 y cuando nϕ = ∆m = 0,
nθ = ∆l. Cuando, de acuerdo con (10.273), nθ = ∓2 y nϕ = ±1, nθ + nϕ = ∓1. Se sigue
entonces que ∆l = ±1 cuando nθ = ±2, nϕ = ∓1, y ∆l = 0 cuando nθ = 0, nϕ = 0, o
cuando nθ = ∓1, nϕ = ±1.
En conclusión, del desarrollo de Fourier de ~r en coordenadas esféricas se sigue que:
∆l = 0, ±1 y ∆m = 0, ±1 (10.379)
lo cual es consistente con la mecánica cuántica.
En todas las expansiones de Fourier que hemos hallado, ejemplos 10.4.1, 10.4.2 y
10.5.1, se cumple que los coeficientes de Fourier se corresponden con elementos de matriz
cuánticos en el lı́mite clásico (véase, Landau, Mecánica cuántica, sección 48).
Para detalles acerca de las reglas de cuantización semiclásicas véase el artı́culo de
I.C. Percival y las referencias allı́ contenidas.12 , y la sección 13.4 del capı́tulo 13 del
presente texto.
El toroide invariante. En coordenadas esféricas es tridimensional y consiste en

el lugar geométrico de los puntos del espacio fásico tales que Ir , Iθ , Iϕ tienen valores
bien definidos.
A partir de la figura 10.11 podemos hallar fácilmente algunas proyecciones del
toroide invariante sobre planos del espacio de configuración. La proyección del toroide
sobre el plano de la órbita a lo largo de la lı́nea ϕ0 = Constante y θ0 = Constante es una
elipse. ϕ0 = Constante define sobre el toroide una superficie bidimensional, cuya proyec-
ción sobre el plano de la órbita es una región circular que se obtiene rotando la elipse
alrededor del eje z. θ0 = Constante define sobre el toroide una superficie bidimensional
cuya proyección sobre el plano ecuatorial es una región circular que se obtiene rotando
la proyección de la elipse sobre el plano x − y alrededor del eje z; esta proyección es
un cı́rculo de radio rmax . La proyección del toroide sobre el espacio tridimensional es el
volumen obtenido al rotar el cı́rculo del plano x − y, de radio rmax , alrededor del eje z,
y es un elipsoide de revolución con ejes de longitudes rmax y rmax cos θmı́n es claro que
ambas dimensiones de este elipsoide dependen de las constantes de movimiento E, l, lz .
En coordenadas parabólicas el toroide invariante es completamente diferente (véase
figura 10.13).
La excentricidad de la órbita depende de las variables angulares a través de θ1 .
12 Semiclassical theory of Bound States. I.C. Percival. Adv. Chem. Phys. Vol. 36, 1977.
Según (10.325), en el toroide en coordenadas parabólicas son posibles elipses de

excentricidades diferentes dentro de un rango definido, que para γ = 0 varı́an entre β y
1. También para γ = 0, cos θ0 varı́a entre −1 y −β. Entonces, para θ1 = 0 la trayectoria
es rectilı́nea que hace un ángulo cos−1 (β) con respecto al eje z y para θ1 = π es una
elipse de excentricidad β cuyo perihelio está en π. Al barrer θ1 entre 0 y π genera un
ensamble de órbitas elı́pticas con perihelio en el tercer cuadrante y envueltas por las
parábolas ξmax y ηmax . La rotación de esta región alrededor de z genera la proyección
del toroide invariante sobre el espacio tridimensional, que es diferente de la proyección
en coordenadas esféricas.
z
θ1 = π
η = (1 – β) a
θ1 = 0
ξ = (1 – β) a
Figura 10.13 Toroide invariante en coordenadas parabólicas

11
Teorı́a de perturbaciones
Son muy pocos los problemas mecánicos que poseen soluciones analı́ticas exactas.
Por eso son necesarios diferentes métodos de aproximación para afrontar la mayor parte
de los problemas realistas.
En astronomı́a, donde se consideran sistemas de muchos cuerpos interactuando
gravitacionalmente, son indispensables los métodos numéricos y los aproximados, para
obtener los cambios en los parámetros de una órbita kepleriana o en los perı́odos, cau-
sados por pequeños efectos debidos a la presencia de los otros planetas. En el siglo XIX
hubo gran interés en el problema de la estabilidad del sistema solar, que llevó al estudio
del movimiento de muchos cuerpos interactuando entre sı́ mediante fuerzas gravitacio-
nales, siendo el más simple el famoso problema de los tres cuerpos, tema que aún es
objeto de investigaciones. Los avances han sido notables, en parte como consecuencia
de los trabajos matemáticos de Kolmogorov, Arnold y Moser, quienes han obtenido las
condiciones de estabilidad de un sistema múltiplemente periódico.
Antes del surgimiento de la moderna teorı́a cuántica, la teorı́a clásica de pertur-
baciones fue muy aplicada a sistemas atómicos, especialmente para el cálculo de efectos
debidos a la interacción con campos electromagnéticos. Es notable el trabajo de Max
Born (noviembre de 1924).1 Esos esfuerzos no fueron estériles ni inútiles, pues dieron
lugar a la teorı́a de perturbaciones de la mecánica cuántica. Hoy esos estudios se aplican
con pocas variaciones a cálculos sobre la estructura vibracional en sistemas moleculares,
y al análisis de los átomos en estados altamente excitados.
La teorı́a clásica de perturbaciones con sus modernos desarrollos se aplica en cam-
pos tan disı́miles como la fı́sica de las altas energı́as (estabilidad de haces en un ciclotrón,
estabilidad del plasma en una máquina Tokamak, etc.), y la óptica (estabilidad de una
cavidad láser, propagación de la radiación láser en una fibra óptica, comportamientos
multiestables y caóticos en óptica cuántica, etc.), por ejemplo.
1 Véase el texto The mechanics of the atom de Max Born.
479
11.1. Teorı́a de perturbaciones dependiente del tiem-

po
En los problemas perturbativos el punto de partida es un sistema para el cual es
conocida la solución analı́tica exacta, que se denomina no perturbado, descrito por un
hamiltoniano H0 (p, q). El sistema de interés difiere del no perturbado por una pequeña
perturbación. Puede asumirse que la magnitud de la perturbación está determinada por
cierto parámetro que cuando vale cero hace que el hamiltoniano sea igual a H0 . Entonces
el hamiltoniano exacto admite la siguiente expansión en serie de potencias de λ:
H(q, p, t; λ) = H0 (q, p, t) + λH1 (q, p, t) + λ2 H2 (q, p, t) + ... (11.1)
Por simplicidad denotaremos todos los términos de perturbación con H ′ , H =
H0 + H ′ .
La teorı́a dependiente del tiempo se caracteriza por encontrar mediante aproxima-
ciones la función generatriz de la transformación canónica de evolución temporal que
satisface la ecuación de Hamilton-Jacobi dependiente del tiempo. La transformación se
realiza en dos pasos:
F (q, q0 , t) = F0 (q, q ′ , t) + F ′ (q ′ , q0 , t) (11.2)
donde F0 conecta las variables (q, p) con las (q ′ , p′ ) y es una solución completa de la
ecuación de Hamilton-Jacobi dependiente del tiempo del problema no perturbado, o sea
que en ausencia de perturbación las (q ′ , p′ ) son constantes. Al aplicar la perturbación,
las (q ′ , p′ ) no serán constantes sino funciones que varı́an lentamente con el tiempo, si
λ es pequeña. F ′ conecta las variables (q ′ , p′ ) con las constantes (q0 , p0 ) del problema
perturbado. Al realizar la transformación (q, p) → (q ′ , p′ ), el hamiltoniano será H +
∂F0 /∂t = H0 + H ′ + ∂F0 /∂t = H ′ , pues por hipótesis H0 + ∂F0 /∂t = 0, y las ecuaciones
de movimiento serán:
∂H ′ ∂H ′
q̇ν′ = ; ṗ′ν = − (11.3)
∂p′ν ∂qν′
Estas ecuaciones son rigurosas pues aún no se ha hecho ninguna aproximación,
pero usando la pequeñez de H ′ podemos adoptar un esquema de aproximaciones suce-
sivas. Cuando λ = 0, (q ′ , p′ ) son ciertas constantes que llamaremos (q0′ , p′0 ). Entonces al
reemplazar (q ′ , p′ ) en (11.3) al lado derecho por sus valores no perturbados obtenemos:
∂H ′ (q0′ , p′0 ) ∂H ′ (q0′ , p′0 )
q̇ν′ 1 = ; ṗ′ν1 = − (11.4)
∂p′ν0 ∂qν′ 0
donde (q1′ , p′1 ) son las soluciones de (11.3) al primer orden en λ. Las ecuaciones (11.4)
pueden ahora integrarse explı́citamente para darnos a (q1′ , p′1 ) en función del tiempo,
al primer orden en la perturbación. La corrección de segundo orden se halla usando la
solución de primer orden en el lado derecho de (11.3), y ası́ sucesivamente.
Podemos encontrar sistemáticamente las correcciones a cualquier orden de aproxi-
mación escribiendo en vez de (11.2) una expansión de F en potencias de λ:
F (q, q, t) = F (0) (q, q, t) + λF (1) (q, q, t) + λ2 F (2) (q, q, t) + ... (11.5)
Teorı́a de perturbaciones / 481
Las funciones F (n) no pueden considerarse como funciones generatrices de una serie
de transformaciones canónicas, como F0 y F ′ , por la disposición de los argumentos.
Se cumple que H(q, p, t) = H(q, p, t) + ∂F/∂t. Entonces:
H(q, −∂F/∂q, t) = H(q, ∂F/∂q, t) + ∂F/∂t (11.6)
Ahora expandimos los dos lados de (11.6) en potencias de λ usando (11.5) y,
H = H0 + λH1 + λ2 H2 + ... (11.7)
La expansión de H0 es:

∂F ∂F (0) ∂H0 ∂F (1)
H0 q, , t = H0 q, ,t + λ ·
∂q ∂q ∂~p ∂~q
(2) (1)

2 ∂H0 ∂F 1 ∂F ∂ H0 ∂F (1)
2
+λ · + · · + ... (11.8)
∂~
p ∂~q 2 ∂~q ∂~p∂~q ∂~q
La expansión de H1 es:

∂F ∂F (0) ∂H1 ∂F (1)
λH1 q, , t = λH1 q, , t + λ2 · + ... (11.9)
∂q ∂q ∂~p ∂~q
Esto nos conduce a:
h i
∂F (0) ∂F (1)
H = H0 + + λ F (1) , H0 + H1 +
∂t ∂t
(11.10)
+λ2 F (2) , H0 + F (1) , H1
!
1h h ii ∂F (2)
+ F (1) , F (1) , H0 + H2 + + ...
2 ∂t
Si H = 0, entonces F es la solución de la ecuación de Hamilton-Jacobi del problema

exacto. Podemos hallar las aproximaciones sucesivas igualando a cero los coeficientes de
cada λn :
∂F (0)
H0 + =0 (11.11)
∂t
h i ∂F (1)
F (1) , H0 + = −H1 (11.12)
∂t
h i ∂F (2) h i 1h h ii
F (2) , H0 + = − F (1) , H1 − F (1) , F (1) , H0 − H2 (11.13)
∂t 2
Las ecuaciones (11.11) y (11.12) forman un conjunto de ecuaciones diferenciales
para las F (n) , que se caracteriza porque en cada ecuación el lado derecho depende sólo
de cantidades que se han evaluado en una aproximación anterior.
11.2. Teorı́a de perturbaciones independiente del tiem-

po
Esta teorı́a se aplica fundamentalmente a sistemas conservativos y ligados que
poseen soluciones múltiplemente periódicas. El punto de partida es la descripción del
sistema no perturbado en términos de las variables acción-ángulo. Luego se adopta un
esquema de aproximaciones sucesivas a las variables acción-ángulo del sistema perturba-
do. Está implı́cita la suposición de convergencia del procedimiento, o sea la existencia de
toroides invariantes del sistema perturbado; en general lo anterior no es cierto. El méto-
do se basa en hallar una expansión en potencias de λ para la función generatriz de la
transformación canónica que lleva a las variables acción-ángulo del sistema perturbado.
Se supone conocida la solución para el sistema no perturbado y que éste es no
degenerado. Es decir, que no existen números enteros n1 , n2 , ...nl tales que:
n1 ω10 + n2 ω20 + ...nl ωl0 = 0 (11.14)
donde las ων0 son las frecuencias del sistema no perturbado, y que esta condición se
cumple para cualquier conjunto de valores de las variables acción-ángulo no perturbadas.
Las variables canónicas (I 0 , ϕ0 ) son variables acción-ángulo sólo para el sistema no
perturbado; al aplicar la perturbación siguen siendo canónicas pero dejan de ser variables
acción-ángulo. Esto se sigue de las ecuaciones de movimiento:
∂H ∂H
I˙ν0 = − 0 ; ϕ̇0ν = (11.15)
∂ϕν ∂Iν0
Las Iν0 dependen del tiempo y las ϕ0ν no son funciones lineales del tiempo. Para
λ = 0, H = H0 y en ese caso se cumple que H0 sólo es función de las Iν0 . H, sin embargo,
tiene la expresión:
H(I 0 , ϕ0 , t) = H0 (I 0 ) + λH1 (I 0 , ϕ0 , t) + λ2 H2 (I 0 , ϕ0 , t) + ... (11.16)
Mediante una transformación canónica es posible, si el sistema perturbado es in-

tegrable, pasar a unas variables canónicas (I, ϕ) tales que H sea función sólo de las Iν .2
Llamaremos F (ϕ0 , I) a la función generatriz de esa transformación, del tipo F2 . Las
siguientes son las fórmulas de transformación:
∂F ∂F
Iν0 = ; ϕν = (11.17)
∂ϕ0ν ∂Iν
Las nuevas variables deben satisfacer las siguientes condiciones: (a) Las coordena-
das del sistema (q, p) deben ser funciones periódicas de las ϕν con perı́odo 2π. (b) H
debe transformarse en una función que depende sólo de las Iν . (c) Las variables (ϕ0 , I 0 )
han de ser funciones periódicas de las ϕν con perı́odo 2π.
Las coordenadas (q, p) son funciones periódicas tanto de las ϕ0ν como de las ϕν .
Esto implica que una celdilla fundamental en el espacio ϕ0ν se transforma en otra del
espacio ϕν . Entonces debe cumplirse que ϕν es igual a ϕ0ν más una función periódica de
las ϕ0ν con perı́odo 2π.
2 Esta teorı́a fue desarrollada por H. Poincaré (1892) y H. von Zeipel (1916).
La función F (ϕ0 , I) puede expandirse en una serie de potencias de λ. Cuando

λ = 0, F se convierte en la función generatriz de la transformación canónica identidad,
de ahı́ que deba ser del tipo F2 :
l
X
F (ϕ0 , I) = ϕ0ν Iν + λF (1) (ϕ0 , I) + λ2 F (2) (ϕ0 , I) + ... (11.18)
ν=1
Entonces (11.16) y (11.18) nos conducen a:
∂F (1) 2 ∂F
(2)
Iν0 = Iν + λ + λ + ... (11.19)
∂ϕ0ν ∂ϕ0ν
∂F (1) ∂F (2)
ϕν = ϕ0ν + λ + λ2 + ... (11.20)
∂Iν ∂Iν
F (1) , F (2) , ... deben ser funciones periódicas de las ϕ0ν con perı́odo 2π.
La ecuación de Hamilton-Jacobi del problema perturbado es:

∂F 0 ∂F 2 0 ∂F
H0 + λH1 ϕ , + λ H2 ϕ , + ... = H(I) (11.21)
∂ϕ0 ∂ϕ0 ∂ϕ0
Ahora reemplazamos (11.19) en (11.21) y expandimos cada término de (11.21) en

potencias de λ. Llamamos λn H (n) (I) al n-ésimo término de la expansión de H(I). En
seguida igualamos los coeficientes de cada λn y obtenemos una secuencia de ecuaciones
diferenciales, ası́:
H0 (I) = H (0) (I) (11.22)
X ∂H0 ∂F (1)
· + H1 (ϕ0 , I) = H (1) (I) (11.23)
ν
∂Iν ∂ϕ0ν
1 X X ∂ 2 H0 ∂F (1) ∂F (1) X ∂H0 ∂F (2)

· · + ·
2 µ ν ∂Iν ∂Iµ ∂ϕ0ν ∂ϕ0µ ν
∂Iν ∂ϕ0ν
X ∂H1 ∂F (1) (11.24)

+ · 0
+ H2 (ϕ0 , I) = H (2) (I)
ν
∂Iν ∂ϕν
....................................
n−1
X n−s
X l
X X 1 ∂ k Hs ∂F (i1 )
·
s=0 k=1 ν1 ,ν2 ,...νk =1 i1 +i2 +...ik =s
k! ∂Iν1 ∂Iν2 ...∂Iνk ∂ϕ0ν1
(11.25)
(i2 ) (ik )
∂F ∂F
· ... + Hn (ϕ0 , I) = H (n) (I) ; n = 0, 1, 2, ...
∂ϕ0ν2 ∂ϕ0νk
Todas estas ecuaciones son de la forma:

Xl
∂H0 ∂F (n)
· 0
+ Φn (ϕ0 , I) = H (n) (I) (11.26)
ν=1
∂Iν ∂ϕν
donde Φn es una función que depende sólo de F (1) , F (2) , ...F (n−1) .
La ecuación (11.23) permite determinar a la vez a H (1) (I) y a F (1) . Como F (1) es
función periódica de las ϕ0ν , el valor medio de (11.23) sobre una celdilla fundamental en
el espacio de las ϕ0ν , o sea sobre el toroide invariante del movimiento no perturbado, es
cero. Por tanto:
H (1) (I) = hH1 (ϕ0 , I)i (11.27)
donde h(...)i denota:

Z 2π Z 2π Z 2π
1
h(...)i = dϕ01 dϕ02 ... dϕ0l (...) (11.28)
(2π)l 0 0 0
La energı́a del movimiento perturbado es, en la primera aproximación, igual a la

energı́a del movimiento no perturbado más una corrección dada por el promedio de la
función de perturbación sobre el toroide invariante del movimiento no perturbado. Este
promedio, cuando se cumpla la hipótesis ergódica, también es igual al promedio temporal
de H1 sobre el movimiento no perturbado. Para calcular a F (1) , es necesario resolver la
ecuación diferencial:
Xl
∂H0 ∂F (1)
. 0
= − H1 (ϕ0 , I) (11.29)
ν=1
∂Iν ∂ϕν
donde el signo {H1 } denota la parte oscilante de H1 , o sea la diferencia H1 − hH1 i, que
puede representarse por una serie de Fourier de la forma:
XX X 0 0 0
′
{H} = ... An1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl ) (11.30)
n1 n2 nl
donde la tilde en la sumatoria denota la omisión del término con n1 = n2 = ...nl = 0.

F (1) tiene una expansión similar:
XX X 0 0 0
F (1) = ... ′
Bn1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl ) (11.31)
n1 n2 nl
Los coeficientes de Fourier de F (1) se obtienen directamente de los de {H1 } al

reemplazar a (11.30) y (11.31) en (11.29):
−A~n (I)
B~n (I) = (11.32)
ω 0 (I)
i~n · ~
En la aproximación de primer orden se sigue de (11.20):
∂F (1) (ϕ0 , I)
ϕν = ϕ0ν + λ (11.33)
∂Iν
lo cual nos dice que las variables angulares perturbadas presentan pequeñas oscilaciones
con amplitud del orden de λ.
El cambio en las frecuencias se obtiene de:
∂H(I) ∂H (1) (I)
ων0 (I) = = ων0 (I) + λ (11.34)
∂Iν ∂Iν
y resulta ser pequeño.
De (11.19) se obtiene para las Iν0 :
∂F (1) (ϕ0 , I)
Iν = Iν + λ (11.35)
∂ϕ0ν
lo cual muestra que las Iν0 que en el movimiento no perturbado son constantes, ahora
están sometidas a oscilaciones de amplitud del orden de λ.
Que no haya degeneración es una exigencia necesaria para que (11.32) tenga senti-
do. Ası́ no haya degeneración pueden presentarse los llamados pequeños divisores, o sea
valores de n1 , n2 , ...nl tales que ~n · ~ω 0 toma valores pequeños.
De (11.24) se sigue que la parte oscilante en el lado izquierdo debe anularse, lo cual
nos da una ecuación diferencial para F (2) :

1 X X ∂ 2 H0 ∂F (1) ∂F (1)
· ·
2 µ ν ∂Iν ∂Iµ ∂ϕ0ν ∂ϕµ
(11.36)
X ∂H0 ∂F (2) X ∂H1 ∂F (1)
+ · 0
+ 0
+ H2 (ϕ0 , I) = 0
ν
∂I ν ∂ϕ ν ν
∂I ν ∂ϕ ν
En tanto que la corrección de segundo orden a la energı́a viene dada por:

X ∂H1 ∂F (1)
0
H2 (I) = hH2 (ϕ , I)i + ·
ν
∂Iν ∂ϕ0ν
(11.37)
1 X X ∂ 2 H0 ∂F (1) ∂F (1)
+ ·
2 µ ν ∂Iµ ∂Iν ∂ϕ0µ ∂ϕ0ν
Podemos ahora usar (11.31) y (11.32) en (11.37) para obtener:
Xl X
′ ∂A~n nν A−~ n
H (2) = hH2 i − 0
ν=1
∂Iν ~n · ω
~
~
n
l l
1 X X ∂ωµ0 X ′ A~n A−~n
+ nν nµ (11.38)
2 µ=1 ν=1 ∂Iν (~n · ~ω 0 )2
~
n
donde se ha usado la fórmula:
hei(~n+m)
~
· ϕi = δ~n,−m
~ (11.39)
H (2) puede también escribirse en la forma:

l
1 X′ X ∂ |A~n |2
H (2) = hH2 i − nν (11.40)
2 ν=1
~0
∂Iν ~n · ω
~
n
que equivale también a:

l
X X
(2) ∂ |A~n |2
H = hH2 i − nν (11.41)
ν=1
∂Iν ~n · ~ω 0
~ ω 0 >0
n·~
Para la corrección de orden n, se sigue de (11.26) que:
H (n) (I) = hΦn (ϕ0 , I)i (11.42)
en tanto que F (n) es solución de la ecuación:

l
X ∂F (n)
ων0 = − {Φn } (11.43)
ν=1
∂ϕ0ν
Podemos expresar a {Φn } como una serie de Fourier:

X (n)
′ im·
~ ϕ~0
{Φn } = Am
~ (I) e (11.44)
m
~
de donde se sigue que los coeficientes de Fourier de F (n) son:

(n)
−Am~
Bm
~ (n) = (11.45)
im ~0
~ ·ω
Esto nos dice que a cada orden es necesaria la condición de no degeneración del
movimiento no perturbado. Poincaré mostró que las series de Fourier para las F (n)
son convergentes en sentido asintótico. Por esto pueden truncarse a partir de valores
razonables de los nν y obtenerse resultados precisos, independientemente de la presencia
de los “pequeños divisores” que necesariamente aparecen para nν grandes al tomar la
serie completa.
Ejemplo 11.2.1 Encontrar las correcciones de primero y segundo orden para un oscilador
armónico con perturbación anarmónica.
El oscilador anarmónico con correcciones cúbicas y cuárticas es soluble exactamente

por cuadraturas. Pero es ilustrativa la manera de aplicar la teorı́a de perturbaciones para
obtener las variables acción-ángulo del problema perturbado.
El hamiltoniano no perturbado es:
p2 1
H0 = + m(ω 0 )2 q 2 (11.46)
2m 2
y la perturbación:
H1 = aq 3 ; H2 = bq 4 (11.47)
De acuerdo con el ejemplo 9.5.5, las variables acción-ángulo del problema no per-
turbado se hallan mediante la transformación canónica con función generatriz F1 , dada
por:
1
F (q, ϕ0 ) = mω02 cot ϕ0 (11.48)
2
que da lugar a la transformación:
0 1/2
2I
q= sen ϕ0 ; p = (2mI 0 ω 0 )1/2 cos ϕ0 (11.49)
mω 0
Expresando a H0 , H1 y H2 en términos de I 0 y ϕ0 , obtenemos:
H0 = I 0 ω 0 (11.50)
3/2
2I 0
H1 = a sen3 ϕ0 (11.51)
mω 0
2
2I 0
H2 = b sen4 ϕ0 (11.52)
mω 0
De (11.27) obtenemos directamente:
H (1) = hH1 i = 0 (11.53)
Como ∂H0 /∂I 0 = ω 0 , se sigue de (11.29) que F (1) obedece la ecuación:

3/2
∂F (1) a 2I
=− 0 sen3 ϕ0 (11.54)
∂ϕ0 ω mω 0
Es decir, el término cúbico en la perturbación no da lugar a cambio en la energı́a
del oscilador. Pero como F (1) es diferente de cero, las expresiones (11.49) para p y q
sı́ resultan modificadas al primer orden. Al introducir la perturbación, I 0 deja de ser
constante, pues de (11.35) y (11.54) se sigue que presenta oscilaciones de frecuencias w0
y 3w0 .
Ahora, usemos (11.24) para hallar a H (2) :

(2) 0 ∂H1 ∂F (1)
H (I) = hH2 (ϕ , I)i + · (11.55)
∂I ∂ϕ0
El cálculo nos da:
15a2 I2 3b I2
H (2) = − 3 0 4
+ (11.56)
4 m (ω ) 2 m (ω 0 )2
2
De (11.54) se sigue la siguiente expresión para F (1) :

3/2
a 2I
F (1) = sen2 ϕ0 cos ϕ0 + 2 cos ϕ0 (11.57)
3ω 0 mω 0
0por tanto:
3/2
∂F λa 2I
ϕ= = ϕ0 + sen2 ϕ0 cos ϕ0 + 2 cos ϕ0 (11.58)
∂I 2Iω 0 mω 0
Ahora resolvemos esta ecuación para ϕ0 en términos de ϕ, al primer orden en λ:
3/2
0 λa 2I
ϕ =ϕ− sen2 ϕ cos ϕ + 2 cos ϕ (11.59)
2Iω 0 mω 0
A este mismo orden, I 0 en función de (I, ϕ) es:
3/2
0 λa 2I
I =I− 0 sen3 ϕ (11.60)
ω mω 0
Al reemplazar (11.59) y (11.60) en la expresión (11.49) para q, que sigue siendo
válida en el sistema perturbado, obtenemos:
1/2
2I λaI
q= sen ϕ − 2 0 3 (3 + cos 4ϕ) (11.61)
mω 0 m (ω )
Ejercicio 11.2.1 Aplicar la teorı́a de perturbaciones al péndulo simple, tomando como
parámetro pequeño la relación entre la energı́a de libración y la energı́a de la separatriz
(pequeñas oscilaciones). Mostrar que:
2
λGI
H(I) = ω 0 I −
16
(11.62)
GI 2
F (1) =− (8 sen ϕ − sen 4ϕ)
192ω 0
ver el ejemplo 10.3.2.
11.3. Multiplicidad de conjuntos de variables acción-

ángulo en los sistemas degenerados
Los ejemplos 10.3.5 y 10.4.4 ilustran la propiedad general de los sistemas degene-
rados consistente en que la separación de variables de la ecuación de Hamilton-Jacobi es
posible en diferentes sistemas de coordenadas, lo que a su vez conlleva a la posibilidad
de definir diferentes conjuntos de variables acción-ángulo.
Entonces un sistema múltiplemente periódico con degeneración se caracteriza por
poseer diferentes conjuntos de perı́odos, correspondientes a los diferentes conjuntos de
variables acción-ángulo. Si f denota alguna coordenada o momento generalizado, cuan-
do el sistema es degenerado existen varios conjuntos de variables acción-ángulo (I,ϕ),
(I ′ ,ϕ′ ), ..., con lo cual f posee la propiedad:
f (I1 , I2 , ...Il ; ϕ1 + 2π, ϕ2 + 2π, ...ϕl + 2π) =
(11.63)
f (I1 , I2 , ...Il ; ϕ1 , ϕ2 , ...ϕl )
f (I1′ , I2′ , ...Il′ ; ϕ′1 + 2π, ϕ′2 + π, ...ϕ′l + 2π) =

(11.64)
f (I1′ , I2′ , ...Il′ ; ϕ′1 , ϕ′2 , ...ϕ′l , ), etc.
Es decir, las diferentes expresiones de f en variables acción-ángulo poseen propie-

dades de periodicidad similares.
Como ilustración, ver las fórmulas (10.269) ejemplo 10.4.2, y (10.361) ejemplo
10.5.1, mediante las cuales se expresa a z en términos de las variables acción-ángulo
esféricas y parabólicas en el caso de una partı́cula en un potencial 1/r. Se ve que la
relación entre los diferentes conjuntos de variables no es trivial y que las variables de
acción esféricas dependen no sólo de las variables de acción parabólicas sino también de
las variables angulares parabólicas.
La ecuación (10.344) nos da la relación entre ϕr y las variables acción-ángulo
parabólicas:

−1 A + B cos(αη − αξ )
ϕr = −ϕξ − tan (11.65)
B sen (αη − αξ )
que nos muestra que ϕr es igual a una función lineal de las variables angulares parabólicas
más una función periódica de esas variables.
Teorema 11.3.1 Todos los sistemas de variables angulares en que una función f (I, ϕ)
tiene perı́odo fundamental 2π, están conectados entre sı́ por las fórmulas:
l
X
ϕν = nνµ ϕ′µ + ψν (ϕ′1 , ϕ′2 , ...ϕ′l , I1′ , I2′ , ...Il′ )
µ=1 (11.66)
ν = 1, 2, ...l
donde las nνµ forman una matriz de elementos enteros y determinante ±1 y las ψν
son funciones periódicas de las ϕ′ν con perı́odo 2π. Según el teorema, buscamos una
transformación:
ϕν = fν (ϕ′ , I ′ ) (11.67)
para la cual es preservada la periodicidad de cualquier variable dinámica F (como la z

citada anteriormente):
F (ϕ, I) = F ′ (ϕ′ , I ′ ) (11.68)
Ahora llamemos ϕν a:
ϕν = fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) (11.69)
Entonces:
F (I; ϕ1 , ϕ2 , ...ϕl ) = F ′ (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) =
(11.70)
F ′ (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) = F (I; ϕ1 , ϕ2 , ...ϕl )
Lo cual significa que ϕν y ϕν difieren por un múltiplo de 2π entero que llamaremos

2πnν1 :
fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) = fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnν1 (11.71)
De manera similar se cumple:

fν I ′ ; ϕ′1 , ϕ′2 , ...ϕ′µ + 2π, ...ϕ′l =
(11.72)
fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnνµ ; ν, µ = 1, 2, ...l
esto sólo es posible si fν es de la forma:
l
X
fν (I ′ , ϕ′ ) = nνµ ϕ′µ + ψν (ϕ′ , I ′ ) (11.73)
µ=1
donde ψν es función periódica de las ϕ′µ con perı́odo 2π.

Claramente vemos que (11.65) es una realización de la fórmula (11.66). Evidente-
mente la expresión para ϕ′ν en términos de (ϕ) es de la forma (11.66). Esto requiere que
la matriz inversa de (nνµ ) tenga igualmente elementos enteros. La condición necesaria
para esto es que det (nνµ ) = ±1.
Función generatriz de la transformación (ϕ, I)→ (ϕ′ , I ′ ). La transformación

(11.66) se puede escribir como:
l
X
ϕν = nνµ ϕ′µ + ψν (ϕ′ , I) ; ν = 1, 2, ...l (11.74)
µ=1
Lo cual indica que la transformación canónica se puede obtener mediante una

función generatriz de la forma G(ϕ′ , I), del tipo F3 :
∂G ∂G
ϕν = − ; Iν′ = − ; ν = 1, 2, ...l (11.75)
∂Iν ∂ϕ′ν
Con lo cual G es de la forma:
l
X
G(ϕ′ , I) = − nνµ Iν ϕ′µ + ψ (ϕ′ , I) (11.76)
ν,µ=1
lo cual implica que las ψν deben ser derivadas parciales de ψ y por tanto se debe cumplir:
∂ψν ∂ψµ
= (11.77)
∂Iµ ∂Iν
Las fórmulas de transformación para las Iν′ son:
l
X ∂ψ
Iν′ = nνµ Iν − (11.78)
µ=1
∂ϕ′ν
La función ψ debe ser periódica en las ϕν y en las ϕ′ν . Por tanto:

X
ψ= C~n (I)ei~n·ϕ~ (11.79)
~
n
Entonces (11.74) y (11.78) toman la forma:

l
X X ∂C~n (I) ′
ϕν = nνµ ϕ′µ − ei~n·ϕ~ (11.80)
µ=1
∂Iν
~
n
l
X X ′
Iν′ = nνµ Iν − i C~n (I)nν ei~n·ϕ~ (11.81)
µ=1 ~
n
Como tanto las (I, ϕ) como las (I ′ , ϕ′ ) son variables acción-ángulo, las (I, I ′ ) deben
ser constantes y las (ϕ, ϕ′ ) deben ser funciones lineales del tiempo. Esto implica una de
las dos condiciones siguientes:
C~n (I) = 0 para ~n 6= 0 (11.82)
o que en el exponente de la serie de Fourier sólo aparecen combinaciones de las ϕ′ν tales
que:
n1 ϕ′1 + n2 ϕ′2 + ...nl ϕ′l = (n1 ω1′ + n2 ω2′ + ...nl ωl′ ) t
(11.83)
+n1 δ1′ + n2 δ2′ + ... + nl δl′ = constante
~ ′ = 0.
Claramente la condición (11.83) requiere que el sistema sea degenerado, ~n · ω
En conclusión, para un sistema no degenerado, hay varios conjuntos de variables
acción-ángulo, conectados entre sı́ mediante las fórmulas:
l
X l
X
∂ψ
ϕν = nνµ ϕ′µ − ; Iν′ = nνµ Iν (11.84)
µ=1
∂Iν µ=1
con función generatriz:

l X
X l
G(ϕ′ , I) = − nνµ Iν ϕ′µ + ψ(I) (11.85)
ν=1 µ=1
donde nνµ es una matriz de elementos enteros y determinante ±1.

En el caso degenerado, asumimos que entre las ων′′ existen l − s relaciones de con-
mensurabilidad:
l
X
nν ων′′ = 0 (11.86)
ν=1
Es posible realizar una transformación canónica auxiliar a nuevas variables acción-

ángulo (I ′ , ϕ′ ) tal que l − s de las frecuencias ων′ sean idénticamente cero y las s restantes
sean no nulas e independientes entre sı́:
ωα′ ; α = 1, 2, ...s (Inconmensurables)
(11.87)
ωρ′ = 0 ; ρ = s + 1, s + 2, ...l
La función generatriz de tal transformación es de la forma:

l
X
F =− Cνµ Iν′′ ϕ′µ (11.88)
ν,µ=1
De donde:
l
X l
X
ϕ′′ν = Cνµ ϕ′µ ; Iν′ = Cνµ Iµ′′ (11.89)
µ=1 µ=1
donde las ων′′ satisfacen las relaciones (11.86). Claramente:

l
X
ϕ′ν = Cνµ ϕ′′µ (11.90)
µ=1
lo cual implica que para satisfacerse (11.87) es necesario:

l
X
Cµρ ϕ′′µ = 0 para ρ = s + 1, s + 2, ...l (11.91)
µ=1
Es decir, las Cµρ se obtienen de los nµ que aparecen en las l − s relaciones de

conmensurabilidad (11.86).
Ejemplo 11.3.1 Considerar el movimiento de una partı́cula en un potencial 1/r. Este

problema es degenerado. Realizar una transformación a variables acción-ángulo tales
que las frecuencias satisfagan las condiciones (11.87).
En coordenadas esféricas las dos condiciones de degeneración pueden escribirse

como:
ωr − ωθ = 0 ; ωϕ − ωθ = 0 (11.92)
De la función generatriz F = (ϕϕ − ϕθ )I1 + (ϕr − ϕθ )I2 + ϕr I3 se sigue que las
variables acción-ángulo buscadas son:
ϕ1 = ϕϕ − ϕθ ; ϕ2 = ϕr − ϕθ ; ϕ3 = ϕr (11.93)
y,
I1 = Iϕ ; I2 = Iθ + Iϕ ; I3 = Ir + Iθ + Iϕ (11.94)
Las nuevas frecuencias son:
mk 2
ω1 = 0 ; ω2 = 0 ; ω3 = (11.95)
I33
En coordenadas parabólicas la transformación buscada puede obtenerse con la
función generatriz:

ϕξ + ϕη
F = − ϕ I1 + (ϕξ − ϕη )I2 − ϕξ I3 (11.96)
2
que da lugar a la transformación:

Iϕ
I1 = Iϕ ; I2 = Iη + ; I3 = Iξ + Iη + Iϕ (11.97)
2
ϕξ + ϕη
ϕ1 = ϕϕ − ; ϕ2 = ϕη − ϕξ ; ϕ3 = ϕξ (11.98)
2
En tanto que ω1 , ω2 y ω3 están dadas por las fórmulas (11.95). Con esta trans-
formación, los resultados del capı́tulo 10 referentes a las constantes de movimiento que
resultan de la degeneración se expresan como:
θ1 = −ϕ2 ; φ1 = ϕ1 (11.99)
La clasificación dada en (11.87) nos permite llamar a las ϕ′α y Iα′ variables acción-
ángulo propias, y a las ϕ′ρ , Iρ′ , variables impropias o degeneradas; las ϕ′ρ permanecen
constantes en el curso del movimiento. El número s de frecuencias ωα′ no nulas e inde-
pendientes se llama el grado de periodicidad del sistema y el número l − s se llama el
grado de degeneración.
Consideraremos ahora las fórmulas de transformación (11.80) y (11.81) en el caso
degenerado. Con el fin de que la división entre variables degeneradas y no degeneradas
persista, requerimos que las ϕρ no dependan de las ϕ′α y que las ϕ′ρ no dependan de
las ϕα . Esto implica que los elementos nρα se anulen. Las fórmulas de transformación
que toman en cuenta lo anterior y además que las ϕα y las ϕ′α son funciones lineales del
tiempo, y que las ϕρ , ϕ′ρ , Iν , Iν′ , son constantes, son:
l
X
ϕα = nαµ ϕ′µ + ψα (ϕ′σ , I) (11.100)
µ=1
l
X
ϕρ = nρσ ϕ′σ + ψρ (ϕ′σ , I) (11.101)
σ=s+1
s
X
Iα′ = nβα Iβ (11.102)
β=1
l
X X
Iρ′ = nνρ Iρ − i C~nσ (I)nρ ei~nσ ·ϕ~ σ (11.103)
ν=1 ~
nσ
donde el subı́ndice σ se coloca a los vectores para indicar que solamente tienen compo-
nentes degeneradas. Como los nνµ son enteros y los nρα son nulos, entonces se cumple
que:
det nνµ = ±1 y det nαβ = ±1 (11.104)
En conclusión, las variables de acción no degeneradas están determinadas unı́voca-

mente, aparte de una transformación lineal entera homogénea de determinante ±1. Por
su parte, las variables de acción degeneradas no necesitan transformarse integralmente

y pueden depender de variables angulares degeneradas; los nνρ no necesitan ser enteros.
Esto podemos ilustrarlo con el ejemplo 11.3.1 y las fórmulas de la sección 10.5,
referentes al problema de Kepler. Las variables angulares no degeneradas son ϕ′3 = ϕξ y
ϕ3 = ϕr , las variables angulares degeneradas son ϕ′2 = ϕη − ϕξ , ϕ′1 = ϕϕ − (ϕξ + ϕη )/2,
ϕ2 = ϕr − ϕθ y ϕ1 = ϕϕ − ϕθ . Vemos la correspondencia entre las fórmulas (11.65) y
(11.100). Por otra parte, I3′ = Iξ + Iη + Iϕ y I3 = Ir + Iθ + Iϕ , o sea que I3′ = I3 , que
corresponde a (11.102). Una fórmula del tipo (11.103) es la que expresa a I2 = Iθ + Iϕ
en términos de I3′ , I2′ , I1′ , ϕ′2 , que se obtiene fácilmente de la fórmula (10.325), sección
10.5.
h p i
I22 = 12 I3′2 1 − β 2 + γ 2 − (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos ϕ′2 (11.105)
11.4. Teorı́a de perturbaciones de sistemas degenera-

dos
En la sección 11.2 obtuvimos las fórmulas para las correcciones a la energı́a y a
la función generatriz cuando un sistema no degenerado se somete a una perturbación.
Ya en la fórmula (11.45) encontramos un resultado que no se puede aplicar cuando
hay degeneraciones. En la fórmula (11.42), para las correcciones a la energı́a, aparece
un promedio sobre todas las variables angulares, pero hemos visto que en un sistema
degenerado hay l − s nuevas constantes de movimiento, las l − s variables angulares
que permanecen constantes, con valores dependientes sólo de las condiciones iniciales.
Por esto la trayectoria de fases no ocupa una región l-dimensional sino una de sólo s
dimensiones. Un promedio sobre las variables angulares degeneradas es más bien un
promedio sobre todos los movimientos que resultan de cambiar las condiciones iniciales,
o sea un promedio sobre un ensamble, lo cual es inadmisible cuando se considera un solo
sistema. En conclusión, en (11.42) no tiene sentido promediar sobre las ϕ0ρ , quedando
H (n) dependiente de las variables angulares ϕ0ρ :

H (n) Iα ; ϕ0ρ , Iρ (11.106)
Esto tiene una razón fı́sica más profunda: las variables (ϕ0 , I 0 ) que se obtienen de
las variables del problema perturbado (ϕ, I) al hacer λ = 0 no están determinadas por
el movimiento no perturbado sino por la perturbación. Es decir, no podemos partir de
cualquier conjunto de variables acción-ángulo del sistema no perturbado sino que antes
debemos encontrar un conjunto de variables acción-ángulo “exactas en la aproximación
cero”.
Este comportamiento se refleja en la teorı́a cuántica de perturbaciones de sistemas
degenerados, donde se deben formar combinaciones lineales de las funciones de onda
degeneradas para obtener las funciones de onda exactas en la aproximación cero, que
son las funciones que se obtienen de las perturbadas al hacer λ = 0. Esto en mecánica
cuántica equivale a buscar una combinación lineal de las funciones degeneradas que
diagonalice la perturbación, en teorı́a de perturbaciones degeneradas de primer orden.3
3 Véase la sección 12.5, capı́tulo 12.
Debido a su carácter degenerado, otras variables de acción degeneradas, conec-

tadas con las Iρ0 por relaciones de la forma (11.103), deben introducirse en lugar de
las Iρ0 mediante una adecuada elección de las coordenadas. Tal elección, obviamente,
está determinada por la perturbación (o más exactamente, por las simetrı́as que tenga
la perturbación).
Debemos realizar una transformación canónica preliminar, escogida de tal manera
que, al primer orden, H1 dependa sólo de variables de acción. La transformación es
(I 0 , ϕ0 ) → (I 0 ′ , ϕ0 ′ ), con función generatriz:
l
X
G(ϕ0 , I 0 ′ ) = Iν0 ′ ϕ0ν + V (ϕ0ρ , I 0 ′ ) (11.107)
ν=1
La fórmulas de transformación son:

∂G ∂G ∂V
Iα0 = = Iα0 ′ ; Iρ0 = = Iρ0 ′ + (11.108)
∂ϕ0α ∂ϕ0ρ ∂ϕ0ρ ′
∂G ∂V ∂G ∂V
ϕ′α = = ϕ0α + 0 ′ ; ϕ0ρ ′ = = ϕ0ρ + 0 ′ (11.109)
∂Iα0 ′ ∂Iα ∂Iρ0 ′ ∂Iρ
G en (11.107) tiene una parte que depende solamente de las variables ϕ0ρ e Iρ0 ′ , la
cual se halla resolviendo la ecuación de Hamilton-Jacobi siguiente:

0 0 ∂G
H1 Iα , ϕρ , = H (1) (I 0 ′ ) (11.110)
∂ϕ0ρ
En este punto está garantizando que la perturbación no dependerá de variables
angulares al promediar sobre las variables angulares no degeneradas y que se cumple
siempre la condición m ω 0 6= 0. Ahora expresamos a H en términos de (I ′ , ϕ′ ):
~ ·~
H = H0 (Iα′ ) + λH1 (ϕ0 ′ , I 0 ′ ) + λ2 H2 (ϕ0 ′ , I 0 ′ ) + ... (11.111)
y, como en la sección 11.2, buscamos una transformación canónica (I ′ , ϕ′ ) → (I, ϕ), lo
cual dará lugar nuevamente a las fórmulas (11.22), ... (11.25), escribiendo (ϕ0 , I 0 ) en
lugar de (ϕ0 ′ , I 0 ′ ).
Como H no depende de Iρ′ , ahora en lugar de (11.26) se tiene:
Xs
∂H0 ∂F (n)
· 0
= H (n) (I) − Φn (ϕ0 , I) (11.112)
α=1
∂Iα ∂ϕα
Al primer orden, en vez de (11.29) tenemos:

Xs
∂H0 ∂F (1)
· 0
= − H1 (ϕ0 , I) (11.113)
α=1
∂Iα ∂ϕα
donde {H1 } = H1 − hH1 i y h...i denota un promedio sobre las variables angulares ϕ0α .4
Es claro que la ecuación (11.113) no permite determinar completamente a F (1) , pues
4 La solución de la forma (11.32) aún existe, siendo bien definida salvo posibles divergencias debidas
a la presencia de pequeños denominadores en los armónicos altos, ~ nα · ~
ωα0 ≈ 0.
cualquier solución de (11.113) está indeterminada por la adición de una función de Iν y

ϕ0ρ . Llamaremos G(1) a la parte de F (1) determinada por (11.113), de modo que:
F (1) = G(1) + R(1) (11.114)

donde R(1) deberá quedar determinada en la siguiente aproximación.
Ahora, la ecuación (11.24) puede escribirse como:
s s
1 X X ∂ 2 H0 ∂G(1) ∂G(1)
·
2 α=1 ∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β
β=1
(11.115)
l
X l
X
∂H 0 ∂F (2)
∂H1 ∂F (1)
+ · + · + H2 (ϕ0 , I) = H (2) (I)
α=1
∂Iα ∂ϕ0α ν=1
∂Iν ∂ϕ0
ν
De esta ecuación podemos determinar a H (2) (I), a R(1) y a una parte G(2) de F (2) .
Indicaremos con h...i los promedios sobre las ϕ0α y los promedios sobre las ϕ0ν
completas por hh...ii. Entonces:
H (2) (I) = hhΦ2 ii (11.116)
donde Φ2 es completamente conocida:
s s
1 X X ∂ 2 H0 ∂G(1) ∂G(1)
Φ2 = · ·
2 α=1 ∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β
β=1
(11.117)
s
X ∂H1 ∂G(1)
+ · + H2 (ϕ0 , I)
α=1
∂Iα ∂ϕ0α
R(1) es solución a la ecuación:

Xl
∂H1 ∂R(1)
. = −{hΦ2 i} (11.118)
ρ=s+1
∂Iρ ∂ϕ0ρ
donde:
{hΦ2 i} = hΦ2 i − hhΦ2 ii (11.119)
F (2) es solución a:
Xs
∂H0 ∂F (2)
· = −{Φ2 } (11.120)
α=1
∂Iα ∂ϕ0α
pero (11.120) determina sólo una parte G(2) , quedando por determinar una función R(2)
que depende de ϕ0ρ y Iν , en la aproximación siguiente.
La ecuación secular. Consideremos primero el cambio en los coeficientes de

Fourier de una variable dinámica al pasar de un sistema de variables acción-ángulo a
otro, (I, ϕ) → (I, ϕ). Asumamos que la transformación canónica es del tipo G(I, ϕ),
de modo que (I, ϕ) pueden tomarse independientes, y con funciones de (I, ϕ). Sean las
expansiones de Fourier de f (I, ϕ) = f (I, ϕ):
X X
f (I, ϕ) = f~n (I)ei~n·ϕ~ = f (I, ϕ) = fm
~ (I)e
im·
~ ϕ~
(11.121)
~
n m
~
Entonces, claramente f m
~ (I) pueden expresarse en función de f~
n (I), ası́:
I I I X
1 ~
fm~ (I) = ... f~n (I)ei~n·ϕ~ e−i~n·ϕ~ dl ϕ (11.122)
(2π)l
~
n
Llamaremos gα~⋆ α~ ′ (I) a los coeficientes de la expansión de Fourier de ei~α·ϕ~ respecto

α ·~
′
i~
a e ϕ:
~′ ~
ei~αϕ~ = gα~⋆ α~ ′ (I) eiα ·ϕ (11.123)
donde se supone que ϕ puede expresarse en términos de (I, ϕ). Ahora en (11.122) sea
~n = α
~ −α~′ y m~ = β~ − β~ ′ . Entonces (11.122) y (11.123) nos conducen fácilmente a:
XX
f β−
~ β~ ′ (I) = gα~⋆ β~ (I) fα~ −~α′ (I) gα~ ′ β~′ (I)
α
~ α
~
XX (11.124)
= g+
~ (I) fα α′ (I) gα
~ −~ ~ ′ (I)
~ ′β
β~
α
α
~ α
~′
donde g +
~ α = gα
⋆
~β~ . Si formamos matrices con los coeficientes de Fourier, entonces (11.124)
β~
nos dice que f~n y fm ~ están conectados por medio de una transformación unitaria.
Ahora examinemos las expansiones de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las varia-
bles canónicas (Iρ0 , ϕ0ρ ) y (Iρ0 ′ , ϕ0ρ ′ ) conectadas por las fórmulas (11.108) y (11.109). La
transformación canónica buscada, por definición, conduce a una expresión que no depen-
de de las ϕ′ρ . Si llamamos f (Iρ0 , ϕ0ρ ) a hH1 (Iρ0 , ϕ0ρ , Iα )i y f ′ a la correspondiente expresión
en términos de (Iρ0 ′ , ϕ0ρ ′ ), podemos hacer corresponder la ecuación de Hamilton-Jacobi
(11.110) con la (11.124). La transformación canónica buscada debe dar lugar a coefi-
cientes de Fourier de la forma:
′ 0′ (1) 0 ′
fβ−
~ β~ ′ (I ) = H (I )δβ,
~β ~′ (11.125)
Por tanto (11.124) para este caso puede escribirse ası́:

XX h i
g+ 0
~ (I ) fα
0
α′ (I ) − H
~ −~ (I )δα~ α~ ′ gα~ ′ β~ ′ (I 0 ) = 0
(1) 0
(11.126)
β~
α
α
~ α
~′
donde hemos usado la fórmula

X
+
gβ~
~ α gα
~β~ ′ = δβ,
~β ~′ (11.127)
α
~
En otras palabras, la transformación canónica es tal que diagonaliza la matriz

fα~ −~α′ (I 0 ) formada con los coeficientes de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las variables
angulares degeneradas. H (1) (I 0 ′ ) se obtienen resolviendo la ecuación secular:
h i
det fα~ −~α′ (I 0 ) − H (1) (I 0 ′ )δα~ α~ ′ = 0 (11.128)
en tanto que la transformación canónica se obtiene a partir de los vectores propios de la

matriz fα~ −~α′ (I 0 ), suministrando la conexión entre las variables angulares ϕ0ρ y ϕ0ρ ′ . Debe
notarse que las matrices que aparecen en este desarrollo son de dimensión infinita; por
tanto (11.128) debe entenderse como el paso al lı́mite de una secuencia de determinantes.
Vemos que encontrar las variables acción-ángulo exactas en la aproximación cero
equivale a diagonalizar la matriz formada con los coeficientes de Fourier de la perturba-
ción.
También encontramos que resolver la ecuación de Hamilton-Jacobi independiente
del tiempo, equivale, siempre, a diagonalizar la matriz de los coeficientes de Fourier del
respectivo hamiltoniano.
Ejemplo 11.4.1 Encontrar las variables de acción perturbadas en el efecto Stark del
átomo de hidrógeno clásico, en coordenadas esféricas.
El hamiltoniano para este problema es de la forma H = H0 + λH1 , donde:
m(Ze2 )2
H0 = − (11.129)
2(I30 )2
es la energı́a del movimiento kepleriano en ausencia del campo y:
λH1 = eEz (11.130)
es la perturbación. z está dada por la fórmula (10.268),
" 0 2 #1/2
I1
z = 1− (x0 cos ϕ02 − y 0 sen ϕ02 ) (11.131)
I20
x0 y y0 son las coordenadas cartesianas del electrón en el plano de la órbita, y el eje

menor es x.
La única variable angular no degenerada es ϕ03 , de la cual dependen x0 y y 0 , según
las fórmulas (10.222) y (10.223). Por tanto:
3
hx0 i = − ǫ0 a0 ; hy 0 i = 0 (11.132)
2
En consecuencia, tomando a E como λ:
hH1 (I30 , ϕ02 , I10 , I20 )i =
" 0 2 #1/2 " 0 2 #1/2
3 0 I1 I2
− ea 1 − 0 . 1− cos ϕ02 (11.133)
2 I2 I30
a0 es igual a:
(I30 )2
a0 = (11.134)
mZe2
En esta expresión no aparecen ni ϕ01 ni ϕ03 . Por tanto I10 y I30 son constantes
durante el movimiento perturbado y aparecen como parámetros. Las únicas variables
son entonces ϕ02 y I20 , indicando que en el movimiento perturbado la órbita no permanece
rı́gida sino que presenta oscilaciones de la excentricidad y del perihelio en el plano de la

órbita, el cual a su vez gira uniformemente alrededor del eje z y oscila alrededor de la
lı́nea de nodos (Véase la figura 10.11).
La ecuación de Hamilton-Jacobi (11.110) que nos determina la variable de acción
I20 exacta en la aproximación cero para este caso es:
" 0 2 0 2 0 2 #1/2
0
3ea E I2 I1 I1
− cos ϕ02 1− − + = H (1) (I 0 ′ ) (11.135)
2 I30 I20 I30
la cual nos da explı́citamente a I20 = ∂G/∂ϕ02 y entonces a G. Las integrales resultan

bastante difı́ciles.
Si sólo queremos hallar a H (1) (I 0 ′ ), notemos que (11.108) al ser integrada sobre
un perı́odo de ϕ02 , nos da:
I I
0′ 1 0′ 0 1 ∂V1
I2 = I2 dϕ2 − dϕ02 (11.136)
2π 2π ∂ϕ02
y que según (11.109) V1 es una función periódica de ϕ02 , con lo cual:
I
1
I20 ′ = I20 ′ dϕ02 (11.137)
2π
lo cual nos suministra la expresión para H (1) que buscamos.
Llamemos (I30 )2 = A, (I10 )2 = B, [2H (1) /(3ea0 E)]2 = C y (I20 )2 = x. Por tanto
2I2 dI20 = dx, o sea:
0
√
2 x dI20 = dx (11.138)
lo cual nos permite escribir:
I I
1 ∂ϕ0 1 √ dϕ02
I20 ′ = I20 02 dI20 = x dx (11.139)
2π dI2 2π dx
C
cos2 ϕ02 = (11.140)
x B B
1− − +
A x A
Por tanto:

2 1 1 B
d(sec ϕ02 ) = − + 2 dx (11.141)
C A x
En consecuencia:
√
dϕ02 (x2 − AB) AC
= √ (11.142)
dx 2 x(A − x)(x − B)[(A − x)(x − B) − ACx]1/2
Entonces (11.139) nos da:
√ I
AC (x2 − AB) dx
I20 ′ = (11.143)
4π (A − x)(x − B)[(A − x)(x − B) − ACx]1/2
La integral se hace usando el método de los residuos, teniendo en cuenta que en

el plano complejo el integrando es una función biforme (positivo entre xmı́n y xmáx y
negativo entre xmáx y xmı́n ), presentando una lı́nea de ramificación. Por otra parte el
integrando posee singularidades en x = A, x = B y x = ∞, con polos en esos puntos. El
residuo en x = A vale −2π/C 1/2 , el residuo en x = B vale 2π[B/(AC)]1/2 y el residuo
en x = ∞ vale 2π (el cual se obtiene con la sustitución y = 1/x). En consecuencia:
1 √ √ √
I20 ′ = A − B − CA (11.144)
2
que es lo mismo que:
" (1) #

0′ 1 0′ 0′ 0 ′ 22 H
I2 = I2 − I3 − (I2 ) 0
(11.145)
2 3ea
Por tanto H (1) vale:

3eEa0 ′ 0 ′
H (1) (I 0 ′ ) = ± (I1 − I30 ′ − 2I20 ′ ) (11.146)
2I10 ′
Este ejemplo ilustra el método de las perturbaciones seculares, que hacen que las
variables angulares degeneradas, que en el problema no perturbado son constantes, pasen
a ser funciones lineales del tiempo dando lugar a oscilaciones en los parámetros de la
órbita que aumentan con la intensidad de la perturbación.
En efecto, las frecuencias perturbadas son:
∂hH1 i
ω30 ′ = ω30 + λ (11.147)
∂I30 ′
∂hH1 i ∂hH1 i
ω20 ′ = λ ; ω10 ′ = λ (11.148)
∂I20 ′ ∂I10 ′
Las frecuencias que en el movimiento no perturbado son nulas, en el perturba-
do pasan a ser “frecuencias lentas”, en tanto que las frecuencias no degeneradas son
“frecuencias rápidas”.
Ejemplo 11.4.2 Calcular las correcciones de segundo orden en el átomo de Hidrógeno
clásico en un campo eléctrico uniforme (efecto Stark cuadrático).
Si trabajamos con coordenadas parabólicas, H (0) y las frecuencias están dadas por
(10.300) y (10.306). Entonces la ecuación (11.37) para la corrección de segundo orden
de la energı́a toma la forma:
H (2) (I) =
* 2 +
1 ∂ 2 H0 ∂F (1) ∂ω ∂F (1) ∂ω ∂F (1)
+ . + . (11.149)
2 ∂I32 ∂ϕ03 ∂I2 ∂ϕ02 ∂I3 ∂ϕ03
y F (1) es solución a la ecuación:

∂F (1)
ω0 + W (I, ϕ0 ) = 0 (11.150)
∂ϕ03
siendo W igual a:
3
W = H1 − hH1 i = eEz − eEaβ (11.151)
2
Podrı́amos partir de la expresión para W en coordenadas parabólicas para calcular
a F (1) y luego a H (2) . Sin embargo usaremos el siguiente procedimiento equivalente: como
en coordenadas parabólicas el promedio de eEz sobre las variables angulares es igual
al promedio temporal, debido a que heEzit no contendrá variables angulares, podemos
realizar inicialmeste los promedios temporales en coordenadas esféricas. Luego, antes de
promediar sobre la otra variable angular pasamos de coordenadas esféricas a coordenadas
parabólicas usando las ecuaciones (10.326) y (10.327). El resultado será el mismo que si se
calculan los promedios temporales en coordenadas parabólicas. Finalmente, promediando
sobre θ1 obtenemos a H (2) en coordenadas parabólicas.
heEzit y eEz están dados por:
3
heEzit = eEaǫ cos θmı́n cos θ0
2
eEz = eF a cos θmı́n (11.152)

−(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ
Por tanto W en coordenadas esféricas es:
W = eF a cos θmı́n

1
× −(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ (11.153)
2
La ecuación (11.150) toma la forma:
∂F (1) eF a
0 = cos θmı́n
∂ϕ3 2ω 0
h i
× 2(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 + 2 cos θ0 cos ψ (11.154)
Usando la ecuación de Kepler se cumple:

∂F (1) ∂F (1) ∂ψ ∂F (1) 2π
0 = · 0 = · (11.155)
∂ϕ3 ∂ψ ∂ϕ3 ∂ψ 1 − ǫ cos ψ
por tanto tenemos que:
∂F (1) eF a h
= cos θ mı́n 2(1 − ǫ2 )1/2 sen θ0 sen ψ
∂ψ 4πω 0
+ǫ cos θ0 + 2 cos θ0 cos ψ

(11.156)
−2ǫ(1 − ǫ2 )1/2 sen θ0 sen ψ cos ψ
i
−ǫ2 cos θ0 cos ψ − 2ǫ cos θ0 cos2 ψ
Integrando respecto a ψ hallamos la siguiente expresión para F (1) , luego de omitir

una constante de integración que no contribuirá a H (2) ya que W tiene media cero:
eF a h
F (1) = cos θ mı́n − 2(1 − ǫ2 )1/2 sen θ0 cos ψ
4πω 0
+ cos θ0 sen ψ − ǫ(1 − ǫ2 )1/2 sen θ0 sen2 ψ (11.157)

i
−ǫ2 cos θ0 sen ψ − ǫ cos θ0 sen ψ cos ψ
Esta función satisface el requisito de la teorı́a canónica de perturbaciones de ser

una función periódica de θ1 y ϕξ , como puede verse fácilmente usando (10.328), (10.329),
(10.341) a (10.345). Si quisiéramos aplicar la fórmula (11.149) directamente en coorde-
nadas esféricas, deberı́amos haber tomado hH1 i = 0 lo cual darı́a lugar a la aparición en
F (1) y ∂F (1) /∂ϕ02 de un término proporcional a ψ, que se incrementa linealmente con
el tiempo (llamado secular); esto evidencia que la fórmula (11.36) sólo puede aplicarse
en coordenadas en las cuales la perturbación sea “diagonal”, es decir, que no contenga
variables angulares.
Usando la propiedad:
∂F (1) ∂F (1)
= − (11.158)
∂ϕ02 ∂θ0
Llegamos a la siguiente expresión para ∂F (1) /∂20 :
∂F (1) eF a h
= cos θmı́n 2(1 − ǫ2 )1/2 cos θ0 cos ψ
∂ϕ02 2ω 0
+(2 − ǫ2 )sen θ0 sen ψ

(11.159)
2 1/2 2
+ǫ(1 − ǫ ) cos θ0 sen ψ
i
−ǫ sen θ0 sen ψ cos ψ
Por otra parte, usando las siguientes relaciones:
∂ cos θmı́n γ2
=
∂I2 I3 (1 − ǫ2 )3/2 cos θmı́n
∂ǫ −(1 − ǫ2 − γ 2 )
= (11.160)
∂I2 I3 (1 − ǫ2 )1/2 ǫ cos2 θmı́n
∂ψ I2 sen ψ
= −
∂I2 I32 ǫ (1 − ǫ cos ψ)
donde γ = I1 /I3 , obtenemos al hacer todos los cálculos:

∂W −eEa n h
= 2 3/2
γ 2 ǫ cos θ0
∂I2 2I3 (1 − ǫ ) cos θmı́n
i
+2(1 − ǫ2 )1/2 sen θ0 sen ψ + 2 cos θ0 cos ψ
h
+(1 − ǫ2 )(1 − ǫ2 − γ 2 ) − ǫ−1 cos θ0 + 2(1 − ǫ2 )−1/2 (11.161)
2(1 − ǫ2 )1/2 ǫ−1 sen θ0 cos ψ sen ψ

×sen θ0 sen ψ −
1 − ǫ cos ψ
2ǫ−1 cos θ0 sen2 ψ io

+
1 − ǫ cos ψ
Usando la siguiente relación:
Z 2π
∂W ∂F (1) 1 ∂W ∂F (1)
· 0 = · (1 − ǫ cos ψ) dψ (11.162)
∂I2 ∂ϕ2 t 2π 0 ∂I2 ∂ϕ02
obtenemos usando (11.159), (11.161) y (11.162) después de un cálculo largo pero directo:
h
∂W ∂F (1) (eEa)2
. = − (9 − 13ǫ2 − γ 2 + 4ǫ4 + ǫ2 γ 2 )
∂I2 ∂ϕ02 t 16ω 0 I3 (1 − ǫ2 )
(11.163)
i
+(−4 + 3ǫ2 + 4γ 2 + ǫ4 + ǫ2 γ 2 ) cos2 θ0
Por otra parte podemos escribir los otros dos términos de la ecuación (11.149) ası́:
* 2 +
1 ∂ 2 H0 ∂F (1) ∂W ∂F (1)
·
2 ∂I32 ∂ϕ03 ∂I3 ∂ϕ03 t
t
* 2 +
3ω 0 W ∂W −W (11.164)
=− + ·
2I3 ω0 ∂I3 ω0 t
t

1 3 ∂
=− + hW 2 it
2ω 0 I3 ∂I3
1
hW 2 it = (eE)2 a cos2 θmı́n (1 − ǫ2 + 5ǫ2 cos2 θ0 ) (11.165)
2
Con este resultado (11.164) puede escribirse como:
(eEa)2 [20(1 − ǫ2 ) + (4 + 10ǫ2 ) cos2 θ0 ] (1 − ǫ2 − γ 2 )

− · (11.166)
16I3 ω 0 1 − ǫ2
Resumiendo los resultados dados por las ecuaciones (11.163) y (11.166) llegamos
a:
* 2 +
∂W ∂F (1) ∂W ∂F (1) 1 ∂ 2 H0 ∂F (1)
· + · +
∂I2 ∂ϕ02 t ∂I3 ∂ϕ03 t 2 ∂I32 ∂ϕ03
t
(11.167)
2
(eEa)
=− [(29 − 24ǫ2 − 21γ 2 ) + 9ǫ2 cos2 θmı́n cos2 θ0 ]
16I3 ω 0
Si ahora pasamos a coordenadas parabólicas mediante las ecuaciones (10.325),
(10.341) a (10.345), llegamos a la siguiente expresión para el lado derecho de (11.167):
(eEa)2 h
− · 17 − 3β 2 − 9γ 2
16I3 ω 0
p i
− 12 [(1 + β 2 ) − γ 2 ][(1 − β 2 ) − γ 2 ] cos θ1 (11.168)
El promedio sobre la variable angular ϕ2 (θ1 = −ϕ2 ) nos conduce a la expresión

final para H (2) :
(eEa)2
H (2) (I) = − (17 − 3β 2 − 9γ 2 ) (11.169)
16I3 ω 0
que expresada en términos de las Iν es:
(eE)2 I 4
H (2) (I) = − [17I 2 − 3(Iξ − Iη )2 − 9Iϕ2 )] (11.170)
16m3 (Ze2 )4
Este es el mismo resultado de Epstein en (1916) usando un método de aproxima-
ciones sucesivas, expuesto por Born (Op. cit., p. 591).
El método de aproximaciones descrito en la sección 11.2 puede también fallar
cuando el sistema no perturbado no posee degeneración intrı́nseca pero ocurre que las
frecuencias se tornan conmensurables para ciertas condiciones iniciales. Cuando esto
ocurre se habla de degeneración accidental. En este sentido es incorrecta la distinción
que algunos textos de mecánica cuántica hacen al referirse a la degeneración presente
en los niveles de energı́a del átomo de hidrógeno respecto al número cuántico orbital l
como “accidental”.
En astronomı́a se presenta este tipo de degeneración, como en el caso del movimien-
to de algunos planetas menores (Aquiles, Patroclo, Héctor y Néstor) que tienen casi el
mismo perı́odo de revolución que Júpiter. En la mayorı́a de los sistemas la degeneración
accidental es más frecuente que la degeneración intrı́nseca.
11.5. Perturbaciones adiabáticas

Perturbaciones pequeñas y perturbaciones lentas. Veamos la diferencia en
una expansión de perturbaciones para perturbaciones pequeñas y para perturbaciones
adiabáticas. En el primer caso hay un parámetro pequeño en el sistema determinado
por la intensidad de la perturbación. El parámetro pequeño de una perturbación len-
ta está dado por la relación entre la frecuencia de la perturbación y las frecuencias
rápidas del sistema. Cuando el parámetro toma el valor cero, el sistema posee solamen-
te oscilaciones rápidas, y a medida que aumenta el valor del parámetro, aparecen las
contribuciones de las frecuencias lentas.
Asumamos que el sistema posee sólo una frecuencia rápida y que el hamiltoniano
se puede separar en la forma:
H = H0 (I, λ~y , λt) + λH1 (I, ϕ, λ~y , λt) (11.171)
donde I y ϕ son las variables acción-ángulo del movimiento no perturbado (λ = 0) del
grado de libertad rápido, y ~
y = (q, p) son las variables canónicas de los restantes gra-
dos de libertad, no necesariamente expresadas en variables acción-ángulo. Debido a que
cuando λ = 0 el sistema es de un grado de libertad, entonces es integrable.
Construcción de invariantes adiabáticos canónicos. Para calcular el efecto

de la perturbación buscamos una transformación canónica de (I, ϕ, ~y ) a (I, ϕ, ~y) tal que
el nuevo hamiltoniano no dependa de la variable angular rápida ϕ. La función generatriz
es de la forma:

F = Iϕ + ~p~q + λF (1) I, ϕ, ~p, ~q, t + ... (11.172)
y las fórmulas de transformación de primer orden son:
∂F (1) ∂F (1)
I =I +λ ; ϕ=ϕ−λ (11.173)
∂ϕ ∂I
(1) (1)
∂F ∂F
p~ = ~p + λ ; ~q = ~q − λ (11.174)
∂~q ∂~p
Ahora reemplazamos a (11.173) y (11.174) en (11.171) y expandimos al primer
orden en λ para obtener:
∂F (1)
H0 (I, λ~y , λt) = H0 I, λ~y, λt + λω (11.175)
∂ϕ
siendo ω = ∂H0 /∂I la frecuencia rápida.
Con la transformación canónica el nuevo hamiltoniano total será:

∂F (1) I, ϕ, λ~y, λt
H I, ϕ, λ~y, λt = H(I, ϕ, λ~y , λt) + λ (11.176)
∂(λt)
En esta expresión ahora retenemos sólo los términos de primer orden en λ:
∂F (1)
H I, ϕ, λ~y , λt = H0 (I, λ~y , λt) + λω + λH1 I, ϕ, λ~y , λt (11.177)
∂ϕ
Al orden cero (11.177) nos da:

H 0 I, λ~y , λt = H0 (I, λ~y , λt) (11.178)
y al primer orden:
∂F (1)
H 1 I, ϕ, λ~y , λt = ω + H1 I, ϕ, λ~y , λt (11.179)
∂ϕ
Como por definición la transformación canónica elimina en H la dependencia de

ϕ, se debe cumplir que F (1) satisfaga la ecuación diferencial:
∂F (1)
ω = −{H1 } (11.180)
∂ϕ
En tanto que la energı́a al primer orden satisface la expresión:

H I, λ~y, λt = H0 I, λ~y, λt + λhH1 i (11.181)
donde {...} y h...i denotan aquı́ la parte oscilante y el promedio respectivamente, respecto
a la variable angular ϕ.
En (11.180) vemos que no hay complicaciones, como en (11.29) y (11.32), debidas a
posibles resonancias entre ω y armónicos superiores de las frecuencias lentas. La ecuación
(11.173) nos da los invariantes adiabáticos a orden cero en λ e I, y a primer orden en λ
e I:
∂F (1)
I (I, ϕ, λ~y , λt) = I − λ (11.182)
∂ϕ
o equivalentemente:
λ
I =I+ {H1 } (11.183)
ω
Realmente cualquier función de I puede escogerse como un invariante adiabático.
Mediante la construcción de un invariante adiabático, si existe, se reduce el sistema
de l grados de libertad a l − 1 grados de libertad. Esto se logra al encontrar la trans-
formación canónica que elimina en H la dependencia respecto a ϕ, con lo cual I queda
como un parámetro constante. Si uno de los restantes l − 1 grados de libertad sufre una
oscilación rápida en comparación a los demás grados de libertad, podemos introducir
un segundo parámetro pequeño, transformar a variables acción-ángulo el grado de li-
bertad rápido y hallar un segundo invariante adiabático. El proceso puede continuarse
para obtener una secuencia de invariantes adiabáticos, hasta que el sistema es reducido
a un grado de libertad, que puede integrarse para obtener el invariante final. Esto sig-
nifica que todo sistema posee l invariantes adiabáticos aproximados obtenidos mediante
promedios, ası́ no sea integrable (es decir que no posea l constantes de movimiento en
involución).
Ejemplo 11.5.1 Este ejemplo se refiere a un sistema hamiltoniano no autónomo de un
grado de libertad, que por tanto posee un comportamiento análogo al de un sistema de
dos grados de libertad. Se trata de un oscilador lineal sometido a una variación adiabática
de sus parámetros:
1 1
Ho.l. = G(λt) p2 + F (λt) q 2 (11.184)
2 2
Podemos hallar las variables acción ángulo mediante la función generatriz:
1/2
1 F
F1 = − q 2 tan ϕ (11.185)
2 G
Entonces el hamiltoniano transformado toma la forma siguiente:

λR′
H = ω0 I − I sen 2ϕ (11.186)
2R
p √
donde R(λt) = F/G, ω0 (λt) = F G y la prima denota derivada respecto a λt.
La ecuación (11.186) tiene ahora la forma (11.171) y podemos aplicar los resultados
de la teorı́a de los adiabáticos canónicos.
Al orden cero el invariante adiabático es:
H0
I= = constante (11.187)
ω0
La ecuación (11.183) nos da el invariante de primer orden:
I = I (1 + λP sen 2ϕ) (11.188)
donde P (λt) = −R′ /(2ω0 R). O sea que al primer orden I tiene una pequeña componente
que oscila con una frecuencia el doble de la frecuencia rápida ω0 .
I˙ = λṖ I sen 2ϕ + 0(λ2 ) (11.189)
Como Ṗ = λP ′ , vemos que efectivamente I˙ es del orden de λ2 , siendo I un inva-

riante al primer orden.
Veamos las posibles resonancias entre ω0 y los armónicos de las frecuencias asocia-
das a los cambios adiabáticos de los parámetros. Para ello expandamos a Ṗ en una serie
de Fourier:
X
′
Ṗ = λ an einω1 λt (11.190)
n
siendo ω1 λ la frecuencia de la oscilación lenta y ω1 /ω2 del orden de la unidad.

Entonces, según (11.189) y (11.190), I˙ tendrá la siguiente expansión de Fourier:
I X′ h i(nω1 λt+2ϕ) i
I˙ = λ2 an e − ei(nω1 λt−2ϕ) (11.191)
2i n
Ahora, integremos a I˙ sobre un perı́odo de la oscilación lenta. Esto nos dará:

"
∆I λ2 X′ e2i(2πω0 /(λω1 )+ϕ0 ) − e2iϕ0
= an
I 2i n i(nω1 λ + 2ω0 )
#
e−2i(2πω0 /(λω1 )+ϕ0 ) − e−2iϕ0
− (11.192)
i(nω1 λ − 2ω0 )
Vemos que ∆I/I será del orden de λ2 , a no ser que haya una conmensurabilidad
entre las oscilaciones en t y en ϕ:
ω0 s
= (11.193)
λω1 2
donde s es un entero del orden de 1/λ. En este caso los términos con n = ±s en (11.192)
serán constantes en t, y ∆I/I será del orden de λ:
∆I 2π
≈ λ|as | (11.194)
I ω1
O sea que si la resonancia es mantenida por tiempos del orden de un perı́odo de la
oscilación lenta, 2π/(λω1 ), el invariante de primer orden es destruido.
11.6. Sistema de osciladores lineales con acoplamien-

to no lineal
Consideremos l osciladores lineales con frecuencias propias ω10 , ω20 , ...ωl0 acoplados
anarmónicamente. El hamiltoniano es de la forma H = H0 + λH1 + λ2 H2 + ..., donde:
X p2 1

ν
H0 = + m(ων0 )2 qν2 (11.195)
ν
2m 2
X XX XXX
H1 = aν qν3 + ′
aµν qµ2 qν + ′
aµνλ qµ qν qλ (11.196)
ν µ ν µ ν λ
X XX
H2 = bν qν4 + ′
(bµν qµ2 qν2 + b′µν qµ3 qν )
ν µ ν
XXX XXXX (11.197)

′
+ bµνλ qµ2 qν qλ + ′
bµνλρ qµ qν qλ qρ
µ ν λ µ ν λ ρ
donde µ, ν, λ y ρ varı́an entre 1 y l. Los coeficientes a y b presentan en sus ı́ndices las

mismas propiedades de simetrı́a que los productos de los qν que multiplican. La prima
en la sumatoria significa que se omiten los términos con ı́ndices iguales.
Caso no degenerado. Cuando las ων0 son inconmensurables se dice que son no
degeneradas. En las variables acción-ángulo (ϕ0 , I 0 ), H0 es:
l
X
H0 = ων0 Iν0 (11.198)
ν=1
H1 y H2 en función de (ω 0 , I 0 ) se obtienen sustituyendo:

1/2
2Iν0
qν = Qν sen ϕν ; Qν = ; ϕν = ϕ0ν (11.199)
mων0
Como en H1 sólo entran productos de sen ϕν un número impar de veces, se sigue
que:
H (1) = hH1 i = 0 (11.200)

Para hallar a H (2) aplicamos la fórmula (11.40), lo cual requiere hallar los coefi-
cientes de Fourier A~n de H1 . Para escribir a H1 como una serie de Fourier usamos la
identidad trigonométrica:
4 sen α sen β sen γ = −sen (α + β + γ) + sen (−α + β + γ)
(11.201)
+sen (α − β + γ) + sen (α + β − γ)
la cual nos da:
1X
H1 = aν Q3ν [−sen (3ϕν ) + 3sen ϕν ]
4 ν
1X
+ aµν Q2µ Qν [−sen (2ϕµ + ϕν )
4 µν
(11.202)
+2 sen ϕν + sen (2ϕµ − ϕν )]
1X
+ aµνλ Qµ Qν Qλ [−sen (ϕµ + ϕν + ϕλ )
4
µνλ
+3 sen (ϕµ + ϕν − ϕλ )]
La ecuación (11.202) tiene la forma de una serie de Fourier seno:
X
H1 = B~n sen (~n · ϕ
~) (11.203)
~
n
donde todos los coeficientes de Fourier B (ν) (nν ) son cero excepto:
3 1X
B1ν = aν Q3ν + aµν Q2µ Qν (11.204)
4 2 µ
1
B3ν = − aν Q3ν (11.205)
4
νµ 1
B21 = − aνµ Q2ν Qµ (11.206)
4
µν 1
B2−1 = aνµ Q2ν Qµ (11.207)
4
νµλ 3
B111 = − aνµλ Qν Qµ Qλ (11.208)
2
νµλ 3
B11−1 = aνµλ Qν Qµ Qλ (11.209)
2
En (11.40) aparecen |A~n |2 = A~n A−~n , donde A~n están relacionadas con los B~n por:
B~n − B−~n
A~n = (11.210)
2i
entonces:
1
|A~n |2 = (B~n − B−~n )2 (11.211)
4
con lo cual los |A~n |2 diferentes de cero son:
!
1 X
|Aν1 |2 = Cν = 3aν Q3ν + 2 aµν Q2µ Qν (11.212)
64 µ
1 2 6
|Aν3 |2 = Cν′ = a Q (11.213)
64 ν ν
1 2 4 2
|Aνµ 2
21 | = Cνµ = a Q Q (11.214)
64 νµ ν µ
9 2
|Aνµλ 2
111 | = Cνµλ = a Q2 Q2 Q2 (11.215)
16 νµλ ν µ λ
luego (11.40) toma la forma:
3X 1XX
H (2) = bν Q4ν + bνµ Q2ν Q2µ
8 ν 4 ν µ
X 1 ∂
− 0 ∂I
(Cν + Cν′ )
ν
ω ν ν
XX
2 0 ∂Cνµ 0 ∂Cνµ
− 4ω ν − ω µ (11.216)
ν µ
4(ων0 )2 − (ωµ0 )2 ∂Iν ∂Iµ
XXX 1 ∂Cνµλ
−
ν µ
ων0 + ωµ0 + ωλ0 ∂Iν
λ

1 ∂Cνµλ ∂Cνµλ ∂Cνµλ
+ 0 + −
ων + ωµ0 − ωλ0 ∂Iµ ∂Iµ ∂Iλ
Según (11.199) y (11.212) a (11.215) las cantidades C son de tercer grado en las
Iν , de modo que todos los términos de H (2) son cuadráticos en las Iν . La energı́a total
tiene entonces la siguiente dependencia de las variables de acción:
X 1 XX 0
H(I) = ων0 Iν + ω Iν Iµ (11.217)
ν
2 ν µ νµ
Es claro que la condición de inconmensurabilidad de las frecuencias queda reducida

a excluir los casos:
2ων0 = ωµ0 ; ων0 + ωµ0 = ωλ0 (11.218)
para todos los valores de ν, µ, λ.
Ejemplo 11.6.1 Aplicar la teorı́a de perturbaciones de estados degenerados al sistema

construido por dos osciladores lineales con frecuencias conmensurables, sometidos a una
perturbación anarmónica del tipo (11.196).
Las trayectorias en el espacio de configuración para el movimiento no perturbado

son las figuras de Lissajous. H0 es:
1 2
H0 = px + p2y + m(ωx0 )2 x2 + m(ωy0 )2 y 2 (11.219)
2m
donde rωx0 = sωy0 , siendo r y s enteros.
La perturbación es de la forma:
H1 = ax x3 + ay y 3 + axy x2 y + ayx y 2 x (11.220)
La solución al movimiento no perturbado en variables acción-ángulo está dada por

(11.198) y (11.199).
Para tratar la degeneración es conveniente separar la frecuencia no degenerada
mediante una transformación canónica de la forma (11.89), que para este caso es:
ϕ01 = ϕ′x ; ϕ02 = −rϕ′x + sϕ′y (11.221)
Ix′ = I10 − rI20 ; Iy′ = sI20 (11.222)
donde las primas denotan las variables de acción originales.

H0 en términos de las I 0 es:
H0 (I 0 ) = ω10 I10 (11.223)
donde las frecuencias están dadas por:
ω10 = ωx0 ; ω20 = 0 (11.224)
La solución al movimiento no perturbado es:

1/2
2(I10 − rI20 )
x= sen ϕ01
mω10
(11.225)
1/2
2s2 I20 (rϕ01 + ϕ02 )
y= sen
rmω10 s
El promedio de H1 sobre un ciclo de la variable angular ϕ01 es:

1/2
s I10 − rI20 2I20 ϕ0
hH1 (I10 , I20 , ϕ02 )i
= − axy 0 0 sen 2 δr,2s
2 mω1 rmω1 s
1/2
1 2s2 I20 I10 − rI20 ϕ0
+ ayx 0 0 sen 2 2 δs,2r (11.226)
2 rmω1 mω1 s
Si r 6= 2s o s 6= 2r el procedimiento falla porque hH1 i = 0, pero el resultado

(11.218) es válido en ese caso, mostrando que sólo hay correcciones de orden superior al
primero. Para precisar asumamos que 2ωx0 = ωy0 . Entonces:
−axy q 0
hH1 (I10 , I20 , ϕ02 )i = I1
0
− 2I2
0
I2 sen ϕ02 (11.227)
2(mω10 )3/2
La ecuación de Hamilton-Jacobi para este problema es:
q
x A
x3 − I10 + C = 0 ; x = I20 ; C=− (11.228)
2 sen ϕ02
Las raı́ces dependen del signo del discriminante:
0 3 2 0 3
I1 C I A2
D= − + =− 1 + (11.229)
6 2 6 4 sen2 ϕ02
que depende esencialmente de la magnitud de H (1) , o sea de la energı́a. Si D > 0, una
raı́z es real y dos son complejo conjugadas. Si D = 0, todas las raı́ces son reales, siendo
dos de ellas iguales entre sı́; esto ocurre para valores de H (1) (I) y ϕ02 bien determinados.
Si D < 0, todas las raı́ces son reales y diferentes entre sı́.
Para D > 0, la raı́z real es:
3/2 2/3
0 I10 C √ C √
I2 = + − + D + + D (11.230)
3 2 2
Cuando D = 0 las raı́ces son:
I0 I10 I10
I20 = 2 1 ; ; (11.231)
3 6 6
Cuando D < 0 las raı́ces son:

0 I10 2θ I10 2θ 2π
I2 = 1 + cos ; 1 + cos +
3 3 3 3 3
(11.232)
I10 2θ 4π
1 + cos +
3 3 3
donde cos θ = (6/I10 )3/2 C/2.
La figura 11.1 muestra el comportamiento de las raı́ces reales en función de C −1 .
CT es el valor de C para el cual D = 0, que ocurre cuando:
0 3/2
0 3/2
(1) ′ (mω1 ) I
−C = H (I ) =2 1 (11.233)
axy sen ϕ02 6
√
Para A muy grande tenemos que D ≈ C/2. En ese caso se cumple que:
I20 ≈ C 2/3 = A2/3 (sen ϕ02 )−2/3 ; A2 ≫ (I10 )3 (11.234)
De (11.108) vemos que I20 ′ es igual al valor medio de I20 sobre un perı́odo de ϕ02 .
Entonces:
axy (I20 ′ )3/2
H (1) (I ′ ) = (11.235)
(mω1 ) h(sen ϕ02 )−2/3 i3/2
0 3/2
I 20/ 3
2 I 10 / 3
I 10/ 3
1/CT 1/C
Figura 11.1 Raı́ces reales en función de C −1
11.7. Movimiento cerca de una resonancia aislada

Para precisar, sea un sistema de dos grados de libertad sometido a una perturbación
pequeña. Si se presenta una resonancia entre las frecuencias no perturbadas:
ω2 r
= (11.236)
ω1 s
entonces debemos usar la teorı́a de perturbaciones de sistemas degenerados.
Primero realizamos una transformación canónica del tipo (11.88) para aislar una
de las frecuencias. Una función generatriz adecuada es:
F2 = (rϕ1 − sϕ2 )I 1 + ϕ2 I 2 (11.237)
que da lugar a las fórmulas de transformación:
I1 = rI 1 ; I2 = I 2 − sI 1 (11.238)
ϕ1 = rϕ1 − sϕ2 ; ϕ2 = ϕ2 (11.239)
Cuando se aplica la perturbación, como vimos en el efecto Stark lineal, ϕ̇1 pasa a
ser una frecuencia lenta y ϕ̇2 es una frecuencia rápida. Si en la expansión de Fourier de
H1 en las variables acción-ángulo iniciales, (I, ϕ), efectuamos la transformación (11.238)
y (11.239), obtenemos:
XX
H1 = Hl,m (I)ei[lϕ1 +(ls+mr)ϕ2 ]/r (11.240)
l m
Ahora, en vez de “diagonalizar” a H1 como en la sección 11.4, podemos usar la

teorı́a de las perturbaciones adiabáticas teniendo en cuenta que en resonancia, ϕ̇2 ≫ ϕ̇1 .
La fórmula (11.181) nos da para este caso:
H = H 0 (I) + λhH 1 i (11.241)
donde hH 1 i es el promedio sobre ϕ2 . Como el promedio da lugar al factor δm,−sp :

X
hH 1 i = H−pr,ps (I)e−ipϕ1 (11.242)
p
Como H no depende de ϕ2 , se cumple que I 2 = constante = I 20 . Notemos que

I 2 = I2 + (s/r)I1 ; por tanto la resonancia modifica sustancialmente las constantes de
movimiento. Si s ≫ r, I 2 es simplemente un múltiplo de I1 , o sea que la modificación
más importante ocurre para las resonancias con s pequeños.
Con I 2 constante, el movimiento en el plano I 1 − ϕ1 es el de un sistema de un
grado de libertad, que es integrable. Chirikov5 ha mostrado que para cualquier sistema
ese movimiento es aproximadamente como el de un péndulo o como el de un oscilador
armónico, según la degeneración sea accidental o intrı́nseca.
Como el movimiento no perturbado es degenerado, en la superficie de sección I 1 −ϕ1 , con
ϕ2 = constante, habrán s puntos formando una circunferencia de radio I 1 (ver sección
10.2). Para λ 6= 0 la perturbación altera el toroide y las intersecciones de la trayectoria
con la superficie de sección modificando por tanto las soluciones periódicas. Si existen,
los puntos fijos sobre la superficie de sección, que llamaremos P0 (I 10 , ϕ10 ), son solución
al sistema de ecuaciones:

∂H ∂H
= 0 ; =0 (11.243)
∂I 1 P0 ∂ϕ1 P0
que representan las soluciones periódicas para el hamiltoniano perturbado. Cuando

λ = 0, todas las soluciones son periódicas, pero para λ 6= 0 sólo quedan las solucio-
nes periódicas dadas por (11.243). Las amplitudes de Fourier en (11.242) generalmente
decaen cuando p aumenta. Entonces podemos describir el movimiento en las variables
integrables (I 1 − ϕ1 ) usando solamente los términos con p = 0, ±1:
H = H 0 (I) + λH00 (I) + 2λHr,−s (I) cos ϕ1 (11.244)
notando que los coeficientes con p = 1 y p = −1 sólo difieren en la fase, de modo que
puede hacerse H−r,s = Hr,−s con la simple adición a ϕ1 de una constante.
Las fórmulas (11.243) y (11.244) nos dan las siguientes ecuaciones para la locali-
zación de los puntos fijos:
∂H 0 (I) ∂H00 (I) Hr,−s (I)

+λ + 2λ cos ϕ10 = 0
∂I 10 ∂I 10 ∂I 10 (11.245)
2λHr,−s (I) sen ϕ10 = 0
5 Chirikov, B.V., 1979, en Physics Reports, pp. 265-379.
Entonces los puntos fijos están localizados en ϕ10 = 0, nπ. Como ∂I1 /∂I 1 = r y
∂I2 /∂I 1 = −s, vemos que ∂H 0 /∂I 1 = sω1 − rω2 = 0. Por tanto I 10 está determinado
por:
∂H00 Hr,−s
±2 =0 (11.246)
∂I 10 ∂I 10
Para puntos de la superficie de sección diferentes a los puntos fijos, se cumple que:
I˙ 1 = −2λHr,−s sen ϕ1 (11.247)
∂H 0 ∂H00 ∂Hr,−s
ϕ̇1 = +λ + 2λ cos ϕ1 (11.248)
∂I 1 ∂I 1 ∂I 1
O sea que los desplazamientos de I 1 respecto a un punto fijo son del orden de
λ. En cuanto a ϕ1 , el comportamiento es diferente según la degeneración sea acciden-
tal o intrı́nseca. Si la degeneración es accidental, entonces H 0 = H 0 (I 1 , I 2 ) y por esto
la amplitud de las oscilaciones de ϕ1 es del orden de la unidad. Si la degeneración es
intrı́nseca, entonces H 0 (I 1 , I 2 ) = H0 (sI1 + rI2 ) = H 0 (I 2 ) y, entonces, ∂H 0 /∂I 1 = 0 y
las oscilaciones de ϕ1 son del orden de λ.
Degeneración accidental. En este caso I 1 permanece en las cercanı́as del punto

fijo, pero ϕ1 puede alejarse del mismo. Entonces podemos escribir:
I 1 = I 10 + ∆I 1 (11.249)
Esto nos permite expandir a H(I) en las cercanı́as de I 10 . Para ello usamos en
(11.244) las expresiones:
∂H 0 1 ∂2H 0
H 0 (I) = H 0 (I 0 ) + ∆I 1 + (∆I 1 )2 + ... (11.250)
∂I 10 2 ∂I 2
10
∂H00 1 ∂ 2 H00
H00 (I) = H00 (I 0 ) + ∆I 1 + (∆I 1 )2 + ... (11.251)
∂I 10 2 ∂I 2
10
∂Hrs 1 ∂ 2 Hrs
Hrs (I) = Hrs (I 0 ) + ∆I 1 + (∆I 1 )2 + ... (11.252)
∂I 10 2 ∂I 2
10
Reteniendo los términos de orden más bajo en λ y ∆I 1 obtenemos:
1 ∂2H 0
∆H = H − H 0 (I 0 ) − λH00 (I 0 ) = (∆I 1 )2 + 2λHr,−s cos ϕ1 (11.253)
2 ∂I 2
10
∆H describe el movimiento en las cercanı́as de la resonancia, y puede escribirse

como:
1
∆H = G(∆I 1 )2 − F cos ϕ1 (11.254)
2
donde:
∂ 2H 0
G(I 0 ) = 2 ; F (I 0 ) = −2λHr,−s (I 0 ) (11.255)
∂I 10
Este resultado nos muestra que el movimiento cerca a cualquier resonancia, para
cualquier sistema, es aproximadamente similar al de un péndulo (el diagrama de fases
presenta rotación, separatriz y vibración, ver ejemplo 10.3.2).
Si GF > 0, el punto fijo estable está en ϕ1 = 0 y el punto fijo inestable en ϕ1 = ±π.
La frecuencia del movimiento en I 1 − ϕ1 para la libración cerca al punto estable es baja:
!1/2
√ ∂ 2
H 0
ω1 = F G = λ1/2 −2Hr,−s · 2 (11.256)
∂I 10
y, según la fórmula (10.104), se hace cero en la separatriz. El máximo desplazamiento
en ∆I 1 está dado en la mitad de la separatriz y vale:
 1/2
r  −2H 
F  r,−s 
máx ∆I 1 = 2 = λ1/2  2  (11.257)
G  ∂ H0 
2
∂I 10
Degeneración intrı́nseca. En este caso, de (11.247) y (11.248), se sigue que tanto
I 1 como ϕ1 permanecen cerca del punto fijo porque ∂H 0 /∂I 1 = 0.
En las proximidades del punto elı́ptico ϕ10 escribimos ϕ1 = ∆ϕ1 , y por tanto:
1
cos ϕ1 = 1 − (∆ϕ1 )2 + ... ; ϕ1 ≈ 0 (11.258)
2
En las proximidades del punto hiperbólico ϕ10 = π (o ϕ10 = −π) escribimos
ϕ1 = ±π + ∆ϕ1 y por lo tanto:
1
cos ϕ1 = −1 + (∆ϕ1 )2 + ... ; ϕ1 ≈ ±π (11.259)
2
En este caso ∆H en vez de (11.254) toma la forma:
1 1
∆H = G(∆I 1 )2 + F (∆ϕ1 )2 (11.260)
2 2
donde:
∂2H 0 ∂ 2 H00 ∂ 2 Hr,−s
G= 2 +λ 2 +λ 2 (11.261)
∂I 10 ∂I 10 ∂I 10
F = ∓2λHr,−s (11.262)
2
Como para degeneración intrı́nseca ∂ 2 H 0 /∂I 10 = 0, se sigue que F y G son del
orden de λ. Cerca del punto fijo elı́ptico la frecuencia de oscilación es:
" !#1/2
√ ∂ 2 H00 ∂ 2 Hr,−s
ω1 = F G = λ −2Hr,−s 2 + 2 (11.263)
∂I 10 ∂I 10
y la relación de semiejes de la elipse es:

 1/2
r  
∆I F  −2Hr,−s 
= = 2  (11.264)
∆ϕ1 G  ∂ (H00 + Hr,−s ) 
2
∂I 10
Cerca del punto fijo hiperbólico no hay oscilaciones. Las órbitas no son elı́pticas
sino hiperbólicas, siendo el ángulo entre las ası́ntotas:
r
F
tan χ = (11.265)
G
Vemos que no hay gran diferencia cualitativa entre las trayectorias de fase en los
casos con degeneración intrı́nseca y accidental, sólo que en el segundo caso las oscila-
ciones en ∆I 1 tienen amplitud muy pequeña en comparación con las de ϕ1 . Lo anterior
suponiendo que G 6= 0.
Ejemplo 11.7.1 Analizar el movimiento cerca a la resonancia del sistema de dos oscila-
dores con acoplamiento no lineal del ejemplo 11.6.1.
En este caso la degeneración es intrı́nseca, con r = 2, s = 1. H1 está dado por

(11.227), de modo que, reemplazando sen ϕ02 por cos ϕ02 y haciendo λ = axy :
−1
hH1 i = (I 0 − 2I20 )(I20 )1/2 cos ϕ02 (11.266)
2(mω10 )3/2 1
Entonces:
−1
2H2,−1 = (I 0 − 2I20 )(I20 )1/2 (11.267)
2(mω10 )3/2 1
en tanto que H0 (I0 ) = ω10 I10 . Por tanto:
∂ 2 H2,−1 1 h i
−3/2 −1/2
2 2 = I 10 (I 20 ) + 6(I 20 ) (11.268)
∂I 20 2(mω10 )3/2
En cercanı́as del punto elı́ptico F y G serán:

λ
F = (I 10 − 2I 20 )(I 20 )1/2 (11.269)
(mω10 )3/2
λ h i
−3/2 −1/2
G= I 10 (I 20 ) + 6(I 20 ) (11.270)
4(mω10 )3/2
ω1 será:
1/2
λ (I 10 − 2I 20 )(I 10 + 6I 20 )
ω1 = (11.271)
2(mω10 )3/2 I 20
Rotación Libración
Resonancia:
I20 = I20 Separatriz
ϕ02 = ϕ20
I20
ϕ20
λ=0
Punto
hiperbólico Punto
elíptico
a b
Figura 11.2 Movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento
no lineal. Superficie de sección I20 − ϕ02 .
La relación entre las oscilaciones máximas en I20 y ϕ02 está dada por:
∆I20 1/2
0 = 2I 20 (I 10 − 2I 20 )(I 10 + 6I 20 ) (11.272)
∆ϕ2
La figura 11.2 muestra la superficie de sección I20 − ϕ02 , en coordenadas polares,
con y sin perturbación.
Resonancias de orden superior. Si λ no es demasiado pequeña, el hamiltoniano

(11.240) puede dar lugar a contribuciones seculares que modifiquen o destruyan el in-
variante adiabático I 2 . Tales resonancias son entre armónicos de la oscilación pendular
I 1 − ϕ1 , de frecuencia ω1 , y la frecuencia fundamental ω2 . En el lı́mite adiabático esas
resonancias dan lugar a cadenas de “islas”, o sea, a movimientos pendulares alrededor
de los puntos fijos en el plano J1 − χ1 de las variables acción-ángulo del movimien-
to pendular I 1 − ϕ1 [ver ecuaciones (10.99) y (10.100)]. Nuevamente se debe efectuar
una transformación canónica que elimine la frecuencia degenerada, o sea, pasar a las
variables angulares χ1 y χ2 dadas por χ1 = pχ1 − qϕ2 ; χ2 = ϕ2 , donde p y q son los
números enteros de la resonancia de segundo orden. El paso siguiente consiste en encon-
trar los parámetros que describen el movimiento pendular alrededor de los puntos fijos
de J1 − χ1 .
El hamiltoniano que describe la resonancia primaria es de la forma (11.254) o
(11.260), que en las cercanı́as del punto elı́ptico se comportan similarmente, y para
pequeñas libraciones puede expandirse, de acuerdo con la ecuación (10.105), en la forma:
1
λGJ12 + ...
K0 (J1 , J2 ) = H 0 (I 10 , J2 ) + ω1 J1 − (11.273)
16
donde J1 y χ1 son las variables acción-ángulo del movimiento pendular en el plano
∆I 1 − ϕ1 alrededor de un punto elı́ptico, dadas en el ejemplo 10.3.2. Si el movimiento
es “exactamente” pendular, J1 es constante. Cuando hay resonancias secundarias, el

movimiento en el plano ∆I 1 − ϕ1 no es exactamente pendular, sino como el mostrado en
la figura 11.3, que muestra la cadena de islas asociada a la resonancia cuando 5ω1 = ω2 ,
donde ω1 = χ̇1 . A la resonancia secundaria le corresponden cinco puntos fijos elı́pticos,
en cada uno de los cuales es generado un movimiento pendular secundario.
∆I1 cos ϕ1 J1 sen χ1
∆I1 cos ϕ1
a b
Figura 11.3 Cadena de islas asociada a la resonancia: a. Aparecen las separatrices y las curvas
de libración; b. Cadena de islas formadas en la resonancia secundaria.
En la figura 11.3a, aparecen las separatrices y las curvas de libración. Las lı́neas
punteadas corresponden a la resonancia primaria y las lı́neas continuas corresponden a
las “islas” formadas en la resonancia secundaria. En la figura 11.3b, se han llevado las
“islas” de la resonancia secundaria a variables acción-ángulo. En un paso siguiente, uno
podrı́a transformar las variables (J, χ) a unas nuevas variables (J, χ) donde sea removida
la resonancia 5ω1 = ω2 , dando lugar nuevamente a curvas de tipo pendular como las de
la figura 11.2b.
Para tener en cuenta la forma como una resonancia secundaria modifica la solución,
′
reintroducimos los términos de H 1 ignorados al promediar sobre ϕ2 , al ir de (11.240) a
(11.242):
′
H 1 (I, ϕ) = H 1 (I, ϕ) − hH 1 (I, ϕ1 )i (11.274)
que tiene la expansión de Fourier:

′ XX
′
H 1 (I, ϕ) = H lm (I)eilϕ1 /r+i(ls+mr)ϕ2 /r (11.275)
l m
donde la prima indica que se suprimen los términos d.c. en ϕ2 , ls + mr = 0. En las

cercanı́as del punto elı́ptico ϕ10 = 0:
′ XX
′
H1 = H lm (I 10 + ∆I 1 , I 2 )eil∆ϕ1 /r+i(ls+mr)ϕ2 /r (11.276)
l m
Ahora transformemos esta expresión a variables acción-ángulo, mediante la fórmu-

la:
1/2 1/2
2J1 F
∆ϕ1 = sen χ1 ; R= (11.277)
R R
Si estamos en las cercanı́as de punto elı́ptico, con movimiento de libración, ∆I 1 y
∆ϕ1 son pequeñas, por lo que J1 /R ha de ser pequeño. Entonces (11.276) al orden más
bajo en ∆I 1 y ∆ϕ1 nos da para el nuevo hamiltoniano, tomando χ2 = ϕ2 y J2 = I 2 :
XX √
′ i(l/r) 2J1 /R sen χ1 +i(ls/r+m)χ2
K1 = H lm (I 10 , J2 )e (11.278)
l m
Usando la fórmula:
∞
X
eix sen θ = Jn (x) einθ (11.279)
n=−∞
donde Jn son las funciones Bessel enteras de orden n, podemos escribir a K1 como:
XXX
′
K1 = Γlmn (I 10 , J2 )einχ1 +i(ls/r+m)χ2 (11.280)
l m n
donde:
" 1/2 #
l 2J1
Γlmn (I 10 , J2 ) = H lm (I 10 , J2 )Jn (11.281)
r R
En (11.280) resulta claro que pueden existir resonancias entre χ1 y χ2 cuando:

ls
nχ̇1 = − χ̇2 (11.282)
r+m
√ √
o sea, cuando ω 1 = χ̇1 = F G = 0( λ) y ω 2 = 0(1) son conmensurables,
ω2 p
= ; p, q : enteros (11.283)
ω1 q
Resulta ahora que la frecuencia χ̇1 = pχ̇1 − q χ̇2 es mucho menor que χ̇2 . Entonces
χ̇2 puede ser eliminada con una transformación canónica mediante:
F2 = (pχ1 − qχ2 )J 1 + χ2 J 2 (11.284)
lo cual nos da para para K 1 :
XXX
′
K1 = Γlmn ei[nχ1 +p(nq+p(ls/r+m))χ2 ]/p (11.285)
l m n
Ahora la variable angular χ2 puede ser eliminada mediante una transformación

canónica adecuada, que equivale a promediar sobre χ2 . Introduciendo un nuevo paráme-
tro pequeño λ1 , (11.273) y (11.285) nos conducen a:
K = K 0 (J 1 , J 2 ) + λ1 K 1 (J 1 , J 2 , χ1 ) (11.286)
en K 1 sólo aparecen los términos con n dados por:

ls
nq + p +m =0 (11.287)
r
siendo nq, ls/r y mp enteros. Esto equivale a dejar en (11.280) sólo los términos con:
ls + mr
nχ1 + χ2 = −jpχ1 + (ks + jq − ks)χ2 = j(qχ2 − pχ1 ) (11.288)
r
o sea, con:
l
n = −jp ; = k ; m = jq − ks ; j, k : enteros (11.289)
r
Entonces la expansión (11.280) toma la forma:
X
K1 = K−jp,jq e−ijχ1 (11.290)
j
donde:
X
K−jp,jq = Γkr,jq−ks,−jp (11.291)
k
Ahora, como K no depende de χ2 , J 2 es constante:

q
J 2 = J2 + J1 = constante (11.292)
p
que es el invariante adiabático para las oscilaciones que dan lugar a las “islas”. El
movimiento en J 1 − χ1 es integrable, siendo las oscilaciones de ∆J 1 y χ1 alrededor
del punto fijo elı́ptico, como en (11.254), de forma pendular y por tanto aplicables los
resultados para este tipo de movimiento. Como K 1 proviene de la parte oscilante de H 1 ,
el armónico más bajo en (11.290) se obtiene para j = ±1. Asumamos que q = 1, que
corresponde a la resonancia con el fundamental de la oscilación χ2 = ϕ2 . Entonces el
coeficiente de Fourier del término dominante en (11.290) es:
r !
X l 2J1
K−p,±1 = H kr,±1−ks J−p (11.293)
r R
k
p
o sea, proporcional a Jp [(l/r) 2J1 /R]. De (11.256) se sigue que ω1 = 0(λ)1/2 y de
(11.283) que ω2 = pω1 . Como ω2 = O(1), se cumple que p espun entero del orden de
λ−1/2 . De (11.257) se sigue que máx ∆I 1 = 2R, por lo tanto 2J1 /R es del orden de
la unidad.
El desarrollo asintótico de Jn (x) para n grande es:
x n
Jn (x) ≈ (2πn)1/2 en (11.294)
2n
como λ es pequeño, p es grande y podemos escribir:
r ! r !p
l 2J1 −1/2 p l 2J1
Jp ≈ (2πp) e
r R 2rp R
h √ √ i
= O (e λ)1/ λ (11.295)
lo cual nos muestra la pequeñez del término dominante en K 1 . F , el término de inter-

acción en el movimiento pendular secundario es, de acuerdo con (11.255), proporcional
a Kp,±1 , o sea a Jp . De (11.256) se sigue que las oscilaciones pendulares en las “islas”
es muy baja, en tanto que de (11.257) se concluye que la amplitud de las oscilaciones
√ √ 1/(2√λ) 1/(4√λ)
“islas” es proporcional a λ1 (e λ) J1 , que son muy pequeñas y además
decrecen rápidamente cuando J1 decrece. Para λ pequeño, las oscilaciones “islas” son
despreciables, pero para λ relativamente grande, se sigue de (11.295) que pueden llegar
a ser importantes, incluso comparables a las de la resonancia primaria. La rápida re-
ducción del tamaño de las cadenas de “islas” de orden superior cerca a los puntos fijos
nos indica que dichos puntos son relativamente estables cuando las perturbaciones no
son muy grandes. Pero para perturbaciones grandes aparecerán muchos nuevos puntos
fijos elı́pticos y cadenas de “islas” de orden superior de tamaño apreciable, ası́ como
frecuencias de libración, que alteran drásticamente los invariantes adiabáticos o sea los
toroides invariantes.
11.8. Movimientos regulares e irregulares

Se denomina irregular, caótico o estocástico al movimiento de un sistema de varios
grados de libertad en que por aumento de una perturbación desaparecen constantes de
movimiento uniformes, alterando la topologı́a de los toroides invariantes. El teorema
de Kolmogorov, Arnold y Moser establece que para perturbaciones suficientemente pe-
queñas existen aún toroides invariantes (movimientos regulares), si el sistema satisface
ciertas condiciones. La existencia de toroides invariantes usualmente se cuantifica por
medio de la medida de la región del espacio fásico ocupada por toroides invariantes. La
estocasticidad global se presenta cuando la región ocupada por toroides invariantes tiene
una medida suficientemente pequeña, o sea que el movimiento esencialmente es caótico,
y se puede caracterizar por el valor del parámetro de perturbación.
Aplicaciones de una superficie de sección en sı́ misma. Sobre el toroide in-

variante de un sistema de dos grados de libertad, el movimiento puede ser parametrizado
por las variables angulares ϕ1 , ϕ2 , o por el tiempo, ası́:
ϕ1 = ω1 t + ϕ10 ; ϕ2 = ω2 t + ϕ20 (11.296)
Como ω1 y ω2 son funciones de las variables de acción I1 , I2 , que para un sistema

integrable son constantes de movimiento uniformes, se sigue entonces que la razón entre
ω1 y ω2 es igualmente una constante:
~
ω1 (I)
~ =
α(I) (11.297)
~
ω2 (I)
Para α = r/s, con r y s números enteros, ω1 y ω2 son conmensurables y el movi-
miento degenera en una curva bidimensional, que se repite después de r giros en ϕ1 y s
giros en ϕ2 . Como r y s pueden ser grandes, y entre cualquier par de números racionales
siempre hay muchos racionales, se sigue que las órbitas periódicas son arbitrariamente
próximas entre sı́ en el espacio fásico.
El concepto de movimiento sobre un toro puede generalizarse a más de dos grados

de libertad.
Si se toma t = 0 cuando la trayectoria cruza la superficie de sección en el punto x0 ,
en t = 2π/ω2 cruzará en el punto x1 , en t = 4π/ω2 cruzará en x2 y ası́ sucesivamente.
Entre dos intersecciones consecutivas ϕ1 avanza por ω1 ∆t = 2πα, donde α es el número
r/s. Como la energı́a E es función de I1 e I2 , para E fija, α puede asumirse función de
I1 solamente.
Los puntos de las sucesivas intersecciones con la superficie de sección están relacio-
nados entre sı́ mediante cierto mapeo o aplicación discreta, llamada aplicación canónica.
Llamando x al conjunto (I, ϕ):
xn+1 = C(xn ) (11.298)
o explı́citamente:
x1,n+1 = I1,n ; ϕ1,n+1 = ϕ1,n + 2πα(I1,n+1 ) (11.299)
donde escribimos a α como una función de I1,n+1 . La anterior es la aplicación “twist”,

que aplica cı́rculos en cı́rculos, pero con un número de rotación α que en general depende
del radio. La figura 11.4 muestra la aplicación para α irracional (lı́neas continuas) y para
α racional (lı́neas a trazos) con s = 6.
Trayectoria de fases
Puntos fijos
con r entero y s = 6
I1
x0
x1
ϕ1 I2
x2
ϕ2
α irracional
ϕ2 = constante
a b
Figura 11.4 Toroide invariante de un sistema de dos grados de libertad ϕ1 y ϕ2 . A la izquierda,

curva bidimensional que se repite después de r giros en ϕ1 y s giros en ϕ2 . Al lado derecho,
mapa de Poincaré formado por puntos xi donde la trayectoria cruza la superficie de sección.
Directamente de (11.299) se sigue que:

I1,n+1 , ϕ1,n+1
J =1 (11.300)
I1,n , ϕ1,n
o sea que la aplicación transforma una región arbitraria de la superficie de sección en

otra conservando el área.
Lo anterior es válido para sistemas integrables. Si este sistema es perturbado lige-

ramente, el hamiltoniano será ahora función de los ángulos:
~ ϕ
H(I, ~ + λH1 (I,
~ ) = H0 (I) ~ ϕ~) (11.301)
En la superficie de sección I1 − ϕ1 definida por ϕ2 = constante (módulo 2π),
esperamos que la aplicación “twist” cambie en una aplicación “twist” perturbada:
In+1 = In + λf (In+1 , ϕn )
(11.302)
ϕn+1 = ϕn + 2πα(In+1 ) + λg(In+1 , ϕn )
donde se ha omitido el subı́ndice 1. f y g son funciones periódicas de ϕn . Como la
transformación de n a n + 1 es generada por las ecuaciones de Hamilton, la aplicación
(11.302) debe conservar el área. Esta aplicación puede tomarse como una transformación
canónica con función generatriz:
F2 (In+1 , ϕn ) = In+1 ϕn + 2πA(In+1 ) + λB(In+1 , ϕn ) (11.303)
donde:
∂A ∂B ∂B
α= ; f =− ; g= (11.304)
∂In+1 ∂ϕn ∂In+1
La condición de conservación del área (11.300) implica ahora que:
∂f ∂g
+ =0 (11.305)
∂In+1 ∂ϕn
Cuando f no depende de I y g = 0, entonces de (11.302) se obtiene la aplicación
“twist” radial perturbada:
In+1 = In + λf (ϕn )
(11.306)
ϕn+1 = ϕn + 2πα(In+1 )
Cuando f = sen ϕn esta aplicación se llama la aplicación estándar (o aplicación
de Chirikov). Una involución C = i es una aplicación canónica tal que al repetirse dos
veces reproduce las condiciones iniciales. Entonces:
xn+2 = i(xn−1 ) = i2 (xn ) = xn (11.307)
La aplicación “twist” radial es un producto de involuciones si f (−ϕ) = −f (ϕ). Las
dos involuciones que dan lugar a la aplicación “twist” radial son:
I = In + f (ϕ)n ; ϕ = −ϕn (11.308)
y,
In+1 = I ; ϕn+1 = −ϕ + 2πα(I) (11.309)
La factorización en involuciones ayuda a determinar los puntos fijos, pues los puntos
fijos de las involuciones son de perı́odo 1. Por ejemplo, (11.308) tiene los puntos fijos
dados por ϕ1 = 0, π para todo I1 , y (11.309) tiene puntos fijos dados por 2ϕ2 = 2πα(I2 )−
2πm con m entero.
A partir de las ecuaciones de Hamilton podemos hallar la correspondiente apli-
cación sobre una superficie de sección. Las ecuaciones de Hamilton del hamiltoniano
(11.301) son:
dIi ∂H1 dϕi ∂H0 ∂H1
= −λ ; = +λ (11.310)
dt ∂ϕi dt ∂Ii ∂Ii
La ecuación para I1 sobre la superficie de sección ϕ2 = constante = ϕ20 , entre la
n y la n + 1-ésima iteración, es:
dI1 ∂H1
= −λ (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) (11.311)
dt ∂ϕ1
donde I2 , ω1 y ω2 son funciones de In+1 . En la n-ésima iteración en (11.311) t = 0 y en
la n + 1-ésima iteración t = T2 . Luego el salto en la acción I1 en una iteración es:
Z T
∂H1
∆I1 = −λ dt (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) (11.312)
0 ∂ϕ1
Entonces de (11.302) se sigue que:
λf (In+1 , ϕn ) = ∆I1 (In+1 , ϕn+1 ) (11.313)
La función g que define el cambio en ϕn se obtiene de la condición de conservación

del área, (11.305):
Z ϕ
∂f
g(I, ϕ) = − dϕ (11.314)
∂I
El problema inverso consiste en hallar el hamiltoniano asociado a la aplicación
canónica. Para la aplicación (11.306), podemos asumir que el ı́ndice n hace las veces del
parámetro “tiempo”.
La función delta periódica permite seleccionar los tiempos de cruce de la trayectoria
con la superficie de sección:
∞
X
δ1 (n) = δ(n − m) (11.315)
m=−∞

dI dϕ
= λf (ϕ)δ1 (n) ; = 2πα(I) (11.316)
dn dn
donde In y ϕn son I(n − ǫ) y ϕ(n − ǫ). Estas ecuaciones son de forma hamiltoniana con:
Z I Z θ
H(I, ϕ, n) = 2π α(I ′ )dI ′ − λδ1 (n) f (ϕ′ )dϕ′ (11.317)
que es un hamiltoniano no autónomo de un grado de libertad.

Ejemplo 11.8.1 Construir un hamiltoniano para la aplicación estándar (11.306).
Dicha aplicación es:
In+1 = In + K sen ϕn
(11.318)
ϕn+1 = ϕn + In+1
Las ecuaciones de movimiento según (11.316) son:
dI dϕ
= K sen ϕ δ1 (n) ; =I (11.319)
dn dn
y el hamiltoniano según (11.317) es:
1 2
H= I + Kδ1 (n) cos ϕ (11.320)
2
Es conveniente usar la expansión de Fourier de la función delta periódica, (11.315):
∞
X
δ1 (n) = 1 + 2 cos 2πqn (11.321)
q=1
entonces:
∞
X
1 2
H= I + K cos ϕ ei2πnm (11.322)
2 m=−∞
donde el número de iteración n es una variable temporal, resultando H no autónomo.

H puede también escribirse en la forma:
H = H 0 + H1 (11.323)
donde:
1 2
H0 = I + K cos ϕ (11.324)
2
y,
∞
X
H1 = 2K cos ϕ cos 2πqm (11.325)
q=1
Como se ve, H0 es el hamiltoniano de un péndulo y H1 es una perturbación con-

sistente en una serie de impactos periódicos en el tiempo.
Ejemplo 11.8.2 Construir la aplicación correspondiente al movimiento en las cercanı́as

de la separatriz, en una superficie de sección, para un sistema de dos grados de libertad.
Por aplicar la teorı́a de las perturbaciones seculares a una resonancia dada en un

sistema cuasi-integrable y promediando sobre las variables angulares rápidas, el hamil-
toniano que describe el movimiento cerca a la resonancia toma la forma (11.254):
1
H = H0 (I) + Gp2 − λF cos q (11.326)
2
Como este hamiltoniano describe un movimiento cuasiperiódico, con una parte
rápida:
I = constante ; ϕ = ωϕ (I)t + ϕ0 (11.327)
y una parte lenta correspondiente al movimiento integrable de un péndulo, la aplicación
en cualquier superficie de sección, ϕ = constante o q = constante, es la aplicación canóni-
ca (11.299). Para hallar la aplicación perturbada, correspondiente a (11.302), debemos
considerar los términos resonantes que fueron despreciados al promediar la resonancia
ω2 /ω1 = r/s sobre la variable angular rápida ϕ como en (11.242). Entonces, de (11.240),
el hamiltoniano completo, que contiene resonancias entre ϕ y el movimiento lento q, y
movimiento caótico en cercanı́as de la separatriz, es:
1
H = H0 (I) + Gp2
2
X lϕ mq
− λF cos q + λ Hlm cos − + ∆lm (11.328)
r r
l>1,m6=0
donde G, F , Hlm y ∆lm dependen sólo de I.

Ahora podemos aplicar la fórmula (11.312) para hallar a f de la aplicación pertur-
bada en una superficie de sección, que depende sólo de los términos reintroducidos en
(11.328).
La figura 11.5 muestra el movimiento en las superficies de sección p − q y I − ϕ,
donde la parte rayada representa el movimiento en la separatriz junto con la compo-
nente estocástica. Ver más adelante. Por conveniencia, buscamos la aplicación sobre la
superficie de sección I − ϕ con q ≈ ±π.
Como los coeficientes de Fourier decaen al aumentar l y m, retendremos sólo el
término dominante con l = m = 1. Entonces (11.328) y (11.312) nos dan:
Z ∞
∂ h ϕ q i
f (In+1 , ϕn ) = − dt H11 cos − + ∆11 (11.329)
−∞ ∂ϕ r r
Según la ecuación (10.105), para la trayectoria separatriz se cumple:
q = 4 tan−1 (eω0 t ) − π (11.330)
donde ω02 = λF G. f toma la forma:
Z
A(In+1 ) +∞ q ωϕ (In+1 )t ϕn
f (In+1 , ϕn ) = sen − − dt (11.331)
r −∞ r r r
donde A es H11 y ∆11 ha sido incluido en ϕn que mide a ϕ en el n-ésimo cruce por
la superficie de sección colocada en la separatriz, q ≈ ±π. Teniendo en cuenta que
q
ωq
–π +π
Superficie
de sección ϕ = constante
a
Iy
ϕ
Ix
ωϕ
Superficie
de sección q = constante
Figura 11.5 Movimiento en las superficies de sección para un sistema de dos grados de
libertad: a. Sección p − q; b. Sección I − ϕ.
q(−ω0 t) = −q(ω0 t), expandiendo la función seno y notando que sólo la parte simétrica
contribuye a la integral, obtenemos:
A −ϕn
f (In+1 , ϕn ) = α2 (Q0 ) sen (11.332)
ω0 r r
donde:
Z ∞
mq(s)
αm (Q0 ) = cos − Q0 s ds (11.333)
−∞ 2r
es la integral de Arnold-Melnikov, y:
ωϕ
Q0 = (11.334)
rω0
La integral (11.333) es impropia pero consta de una parte oscilante que promedia
a cero durante el movimiento sobre la separatriz y una parte constante que viene de la
región con s ≤ 1/Q0 . Melnikov la evaluó, siendo para Q0 ≫ m:6
4π
αm (Q0 ) = (2Q0 )m−1 e−πQ0 /2 (11.335)
(m − 1)!
Como ω02 = λF G, entonces Q0 ≈ λ1/2 y vale la expansión asintótica (11.335).

Entonces podemos escribir:
8πA 2 −πQ0 /2
f = f0 sen ϕn ; f0 = Q e (11.336)
ωϕ 0
De acuerdo con el ejemplo 10.3.1, para las oscilaciones de un péndulo en las cer-
canı́as de la separatriz se cumple que el perı́odo vale:
 
 32 
T = ω0−1 ln  (11.337)
ωϕ I 
1+
λF
El cambio en ϕ durante este tiempo es ωϕ T , lo cual conduce al número de rotación
de la aplicación “twist”:
ωϕ 32
2πα = ln (11.338)
ω0 |W |
donde:
ωϕ I
W = −F − (11.339)
λF
Si escogemos a ωϕ independiente de I, con lo cual el problema no se altera esen-
cialmente, resulta que f no depende de I, y según (11.314) podemos tomar g ≡ 0.
Es conveniente cambiar de variables de I a W . En las variables W , ϕ, la aplicación
separatriz es:
Wn+1 = Wn − W0 sen ϕn
32 (11.340)
ϕn+1 = ϕn + Q0 r ln
|Wn+1 |
donde:
ωϕ I0 8πA 2 −πQ0 /2
W0 = = Q0 e (11.341)
F F
No degeneración y no degeneración isoenergética. Tratemos de explorar las
consecuencias debidas a la dependencia lineal de las frecuencias sobre los movimientos
en una superficie de sección.7
6 Véase el apéndice A, en Chirikov, Op. cit.
7 Véase el texto de V. Arnold, Les méthodes mathématiques de la mécanique classique, Mir, Moscú,
1976.
Asumamos que hay una relación entre las frecuencias, para dos grados de libertad,
de la forma:
f (ω1 , ω2 ) = 0 (11.342)
Diferenciando hallamos de df = 0:
  
∂ω1 ∂ω2 ∂f
 ∂I1 ∂I1   ∂ω1 
  
ω̃I f~ω =   =0 (11.343)
 ∂ω ∂ω2   ∂f 
1
∂I2 ∂I2 ∂ω2
Si f es de la forma:
f = m1 ω 1 + m2 ω 2 = 0 (11.344)
con m1 y m2 enteros, f~ω es un vector con componentes m1 y m2 . Entonces (11.343) se

satisface solamente si se cumple la condición necesaria:
det ω̃I = 0 (11.345)

det ω˜I 6= 0 es la condición necesaria de no degeneración de las frecuencias (o de no
dependencia lineal de las frecuencias). En el caso no degenerado los movimientos son
cuasiperiódicos con un número de frecuencias igual al número de grados de libertad, con
lo cual existen toroides invariantes l-dimensionales. Las curvas de fase son hélices sobre
los toroides y las frecuencias de revolución cambian de un toroide a otro.
En el caso general no sólo las dos frecuencias sino su relación α varı́a de un toroide a
otro. Si la derivada de α respecto a la variable de acción que numera los toros es diferente
de cero para un valor dado de la energı́a, diremos que el sistema es isoenergéticamente
no degenerado. La condición de no degeneración isoenergética se escribe como:
 
∂ω1 ∂ω2
ω1
 ∂I1 ∂I1 
 
 
 ∂ω ∂ω2 
det  6= 0 (11.346)
ω2 
1
 
 ∂I2 ∂I2 
 
ω1 ω2 0
la cual se deduce fácilmente de las expresiones dα(I1 , I2 ) 6= 0 y dE = ω1 dI1 +ω2 dI2 = 0.

Las condiciones de no degeneración y de no degeneración isoenergética son independien-
tes, es decir, la una no implica la otra.
Consideremos la aplicación “twist” sobre el punto de intersección de una curva de
fases con la superficie de sección. Esa aplicación deja invariantes los cı́rculos meridianos
concéntricos de intersección de los toros invariantes con la superficie de sección. Cada
cı́rculo gira un ángulo igual a 2πα. Si el sistema no es isoenergéticamente degenerado, el
ángulo de rotación de los cı́rculos invariantes sobre la superficie de sección cambiará de
un cı́rculo a otro, es decir, α necesariamente cambia al pasar de un cı́rculo a otro. Como
α es una función continua de I1 , con E constante, al ir variando I1 , α tomará tanto
valores racionales como irracionales, de modo que en ciertos cı́rculos habrá puntos fijos
discretos y en otros no. Una y otra clase de cı́rculos forman un conjunto denso, pero
en casi todos los cı́rculos el ángulo de rotación no será un múltiplo racional de 2π. Si
ahora la aplicación es perturbada, como en (11.306), la propiedad de un cı́rculo con α
racional de tener puntos fijos debe desaparecer. La trayectoria sobre un toro resonante
no perturbado es cerrada y no llega sino a muy pocos puntos del mismo, pero al aplicar
una pequeña perturbación llenará todos los puntos del toro. En tanto que si el toro es no
resonante, una perturbación pequeña no ocasiona un cambio grande en las trayectorias
de fase y en la topologı́a misma del toro.
En una resonancia particular, ω1 /ω2 = r/s, la condición de no degeneración iso-
energética (11.346) se convierte en:
∂ 2 H0 ∂ 2 H0 ∂ 2 H0
r2 2 + s2 2 − 2rs 6= 0 (11.347)
∂I1 ∂I2 ∂I1 ∂I2
Esta condición a la vez es una condición de no linealidad del movimiento alrededor
de un punto fijo. Al analizar el movimiento cerca a una resonancia aislada encontramos
que es descrito por un hamiltoniano de la forma (11.253):
∂2H 0
∆H = 2 (∆I 1 )2 + 2λHr,s cos ϕ1 (11.348)
∂I 1
2
tomando a Hrs real. Si ∂ 2 H 0 /∂I = 0, entonces la no linealidad aparece solamente al
orden λ2 y el ancho de la separatriz no estará restringido a ser del orden de λ1/2 , según
(11.256). Entonces la condición de no linealidad es, de (11.255):
∂2H 0
G= 2 6= 0 (11.349)
∂I 1
2
Esta condición separa los sistemas con degeneración accidental (∂ 2 H 0 /∂I 6= 0) o
2
fuertemente no lineales, de los sistemas con degeneración intrı́nseca (∂ 2 H 0 /∂I = 0) o
débilmente no lineales. Para ver la equivalencia de (11.349) y (11.347), pasamos de las
variables (I 1 , I 2 ) a las (I1 , I2 ) mediante la transformación canónica (11.238) y (11.239):

∂2H 0 ∂ ∂H0 ∂I1 ∂H0 ∂I2
= . + . 6= 0 (11.350)
∂I12 ∂I 1 ∂I1 ∂I 1 ∂I2 ∂I 1
y como según (11.238), ∂I1 /∂I 1 = r y ∂I2 /∂I 1 = s, obtenemos inmediatamente a
(11.347). O sea que la condición de no degeneración isoenergética es a la vez una condi-
ción de no linealidad del movimiento en proximidades de una resonancia aislada.
El teorema de K. A. M. Si un sistema integrable es perturbado, hemos visto en

(11.45) que las resonancias entre los grados de libertad pueden destruir la convergencia
de las expansiones en series de potencias alrededor del sistema no perturbado. Sin em-
bargo el teorema de K. A. M. dice que “si un sistema hamiltoniano es no degenerado,
entonces la mayor parte de los toroides invariantes no resonantes no desaparecen bajo
una perturbación hamiltoniana lo suficientemente pequeña, sino que se deforman lige-
ramente de modo que en el espacio de fases del sistema perturbado existen igualmente
toroides invariantes, o sea adherencias de las curvas de fase que son hélices cuasiperiódi-
cas con un número de frecuencias igual al número de grados de libertad. Tales toroides
son la mayorı́a en el sentido que la medida del complemento de su unión es del orden de
λ”. Las condiciones a ser satisfechas son:
(i) No linealidad suficiente. O sea que en cierto rango de valores de I~ las frecuencias
son independientes:
m.~ ~ 6= 0
~ ω(I) (11.351)
donde ω ~ = ∂H0 /∂ I~ y m
~ es un vector de componentes enteras.
(ii) La perturbación es función de clase C M , o sea que posee derivadas continuas
hasta de orden M .
(iii) El estado del sistema es lo suficientemente alejado de una resonancia para
satisfacer que:
|m
~ ·~ ~ −τ
ω| ≥ C|m| (11.352)
para todo m,~ donde τ depende de l y M , y C depende de λ, de la magnitud del ha-

miltoniano de perturbación H1 , y de la no linealidad G del hamiltoniano no perturbado
H0 .
Como (11.352) no puede satisfacerse para C muy grande y C se incrementa con
λ, |H1 | y 1/G, hay una condición de “perturbación suficientemente pequeña” para que
existan toros de K. A. M. (i) y (iii) también implican una condición de no linealidad
moderada.
Este teorema fue probado por Arnold (1961) para H1 analı́tica y por Moser (1962)
para cuando H1 es de clase C M , basados en una conjetura de Kolmogorov (1954). La
dificultad de la prueba del teorema radica en los pequeños denominadores que apare-
cen en todo el procedimiento de expansión en series de potencias. Las pruebas utilizan
los métodos de convergencia rápida (superconvergentes), análogos al método de New-
ton para resolver numéricamente una ecuación algebraica, que permite neutralizar el
efecto de los pequeños divisores que aparecen en cada aproximación. Para ilustrar es-
to, consideremos la aplicación “twist” perturbada con dos grados de libertad, (11.302),
correspondiente a las intersecciones de la trayectoria con la superficie de sección:
I1 (ϕ1 + 2πα) = I1 (ϕ1 ) + λf (ϕ1 ) (11.353)
Usemos expansiones de Fourier respecto a ϕ1 :

X X
I1 (ϕ1 ) = ak eikϕ1 ; λf (ϕ1 ) = bk eikϕ1 (11.354)
Entonces:
X
I1 (ϕ1 + 2πα) − I1 (ϕ1 ) = ak eik2πα − 1 eikϕ1 (11.355)
con lo cual se obtiene la siguiente relación entre los coeficientes:

bk
ak = ik2πα
(11.356)
e −1
Los módulos de estos coeficientes se relacionan por:

|bk |
|ak | = (11.357)
2 sen πkα
Vemos que ak no tiende a cero tan rápido como bk y que son indefinidos cuan-
do α es racional. El anterior es el problema de los denominadores nulos que impide la
convergencia de las series de perturbaciones. Pero como α es función de I1 , el valor de
I1 puede escogerse de modo que el denominador nunca sea resonante. Básicamente el
método de cálculo consiste en variar las condiciones iniciales en cada paso del procedi-
miento de expansión para asegurarse de estar lo suficientemente lejos de las resonancias
y poder proseguir la expansión al paso siguiente. En una expansión superconvergente la
aproximación n + 1-ésima se realiza alrededor de los valores de las variables obtenidos
de la n-ésima aproximación y no alrededor de los valores no perturbados, como se hace
en una expansión ordinaria.
Como hemos visto, si hay una resonancia entre los dos grados de libertad del
sistema no perturbado, la perturbación induce un cambio en las trayectorias del espacio
de fases, lo mismo que en las frecuencias. Si la acción perturbada I1 es próxima a la
no perturbada I0 , pueden existir curvas invariantes de K. A. M. “cercanas” a las curvas
invariantes no perturbadas. El anterior es el significado de la condición de independencia
lineal m
~ ·~ω 6= 0, que garantiza que I1 → I0 cuando λ → 0.
Para un valor fijo de λ, la no linealidad necesaria en G puede estimarse de la
condición ∆I1 ≪ I0 , siendo I0 la acción no perturbada y ∆I1 el máximo valor de la
diferencia I1 − I0 . De (11.238) se sigue que:
∆I1 = r∆I 1 (11.358)
Para un sistema con degeneración accidental, (11.257) nos dice que:
1/2
2λHrs
∆I 1 = 4 (11.359)
G
Por tanto ∆I1 ≪ I0 impone la condición:
32r2 λHrs
G≫ (11.360)
I02
La condición de suavidad de la perturbación, (ii), puede asociarse con la propie-
dad de las curvas de K. A. M. de existir solamente separadas de todas las “islas” de
perturbaciones. Si las “islas” entre dos resonancias de orden bajo llenan todo el espacio
de fases entre ellas, podemos razonablemente esperar que no haya una curva de K. A.
M. ¿Cómo relacionar esto con la condición (ii) del teorema?.
Asumamos que ω1 /ω2 = s y que H0 depende linealmente de I2 , de modo que ω2
es una constante independiente de I1 e I2 . En la siguiente resonancia, ω1 /ω2 = s + 1, de
modo que la diferencia en ω1 entre dos resonancias sucesivas es δω1 = ω2 , como puede
verse en la figura 11.6. Entre dos resonancias primarias hay una serie de resonancias
secundarias en ω1 /ω2 = s+p/q (p, q enteros y p < q). El hamiltoniano tiene la expresión:
X
H = H0 + λ Hlm ei(lϕ1 −mϕ2 ) (11.361)
l,m
Tomemos en la sumatoria los valores de l que dan lugar a resonancias secundarias,

l = q, 8
ω 1 /ω 2 = s
ω 1 /ω 2 = s + 1
4 2λG′H 1m 4 2λG′H 1m 4 2λG′H 1m
0 1/4 1/3 1/2 2/3 3/4 1 G′∆I 1

ω2
b
Figura 11.6 Intervalos que muestran resonancias.
m(p, q) = p + sq (11.362)
y analicemos el movimiento en las cercanı́as de una resonancia secundaria. De (11.359)

el ancho de la separatriz en cada resonancia es:
1/2
2λHqm
∆I 1 = 4 (11.363)
G
8 Condiciones de validez del teorema de K. A. M.: (i) Las curvas perturbadas son cercanas a las
curvas no perturbadas no resonantes. (ii) Las resonancias son lo suficientemente separadas, de acuerdo
con la condición de suavidad de la perturbación. (iii) En la figura 11.6b los intervalos rayados muestran
resonancias secundarias. La suavidad de la perturbación exige que las resonancias secundarias sean
aisladas.
y de las expresiones ∆I1 = q∆I 1 y g = q 2 ∂ 2 H0 /∂I12 = q 2 G′ , obtenemos para la contri-

bución de todas las resonancias secundarias sobre el valor de ∆I1 :
X 1/2 X
2λ 1/2
∆I1 = 4 Hqm (11.364)
G′ p,q
y para el ensanchamiento de las frecuencias:

X ∂ω1 X X
∆ω1 = ∆I1 = G′ ∆I1
∂I1
1/2 X
2λ 1/2
= 4 Hqm (11.365)
G′ p,q
La relación entre la suma de los anchos de las islas secundarias y la separación

entre las resonancias primarias es:
P X
∆ω1
= 4(2λG′ )1/2 ω2−1 1/2
Hqm (11.366)
δω1 p,q
Si H1 tiene M derivadas continuas respecto a ϕ1 y ϕ2 , las derivadas altas tienen

la forma:
X
Hqm (iq)k1 (−im)M−k1 ei(qϕ1 −mϕ2 ) (11.367)
p,q
Las cuales serán continuas a condición de que Hqm sean lo suficientemente pequeñas
para q y m grandes.
Para que la serie converja, es necesario que para q y m grandes los términos se
comporten como 1/q 2 por lo menos, ya que m es lineal en q de acuerdo con (11.362).
Entonces las amplitudes de Fourier para q grandes han de comportarse como:
A
Hqm ≈ (11.368)
q M+2
con el fin de que λH1 sea de clase C M . Según (11.362) y la desigualdad p < q, hay q
coeficientes de Hqm con el mismo valor de q y diferentes valores de p. Estos coeficientes
corresponden a resonancias y son todos grandes y de magnitud comparable. Por tanto:
X 1/2
1/2
Hqm ≈ qHqm′ (11.369)
donde m′ es un valor de m convenientemente escogido. De (11.366), (11.368) y (11.369)

se sigue entonces que:
P ∞ √
∆ω1 X 4 2ω1 σ
≈ 4(2λG′ A)1/2 ω2−1 q −M/2 = (11.370)
δω1 q=1
ω2
donde:

M
σ=ζ , ω1 = (λAG′ )1/2 (11.371)
2
y ζ es la función zeta de Riemann. ζ(1) = ∞, ζ(2) = 1, 64493, ζ(3) = 1, 20205 y ζ(x) → 1

para x → ∞. Entonces (11.370) existe si M > 2. De modo que independientemente
del valor del coeficiente de la sumatoria, obtenemos la importante condición para la
existencia de una superficie de K. A. M.: que el número de derivadas continuas de la
perturbación satisfaga que
M >2 (11.372)
Podemos comparar este resultado con la condición (iii) de K. A. M., (11.352),
escrita para dos dimensiones como:

ω1 r
′ τ −1
ω2 − s > C s (11.373)
El lado izquierdo es el ancho de una resonancia secundaria aislada. Tomando el

ancho total a ser examinado como la distancia entre dos resonancias de orden inferior,
o sea el intervalo unidad, hay a lo sumo s valores de r en tal intervalo que deben
ser excluidos según la condición (i) del teorema. La medida de Lebesgue M de las
resonancias excluidas se obtiene multiplicando a (11.373) por s y sumando sobre s:
∞
X
M = C′ s−τ = C ′ ζ(τ ) (11.374)
s=1
Comparando a (11.374) con (11.370) vemos que:

ω1 √ M
C′ ≈ ; ω1 = λAG′ ; τ= (11.375)
ω2 2
Entonces τ > 1 es suficiente para que exista una superficie de K. A. M.
Chirikov ha determinado la condición necesaria correspondiente a (11.372) para l
grados de libertad:
M ≥ 2l − 2 (11.376)
y Moser la condición suficiente:
M ≥ 2l + 2 (11.377)
suponiendo que C tiende a cero con λ y es tomada suficientemente pequeña.
Asumiendo que la suma en (11.370) converge a σ, vemos que las superficies de K. A.
M. no existen si α = ω1 /ω2 cae dentro de una de las regiones rayadas en la figura 11.6b.
Como el ancho de esas regiones es proporcional a (λG)1/2 y decrece con el incremento
de q, α debe estar lo suficientemente lejos de un número racional p/q. Para λ pequeño
es fácil cumplir esto, pero cuando λ se incrementa, solamente aquellos irracionales que
son más difı́ciles de aproximar por racionales pueden dar lugar a √
superficies de K. A. M.
El número “más irracional” en este sentido es la media dorada ( 5 − 1)/2.
La condición sobre el valor de λ se obtiene de (11.370) haciendo el lado izquierdo
igual a uno:
ω22
λG′ ≤ (11.378)
32Aσ 2
Por otra parte (11.360) y (11.378) dan la condición de λ no linealidad moderada:

32λA ω22
2 < G′ < (11.379)
I0 32Aσ 2 λ
usando r2 Hrs /q 2 ≈ A.
El teorema de Poincaré-Birkhoff. Cualquier punto del cı́rculo con α(I) = r/s

es un punto fijo de la aplicación “twist” no perturbada (11.299) con perı́odo s. El teorema
dice que para algún múltiplo par de s, 2ks con k = 1, 2, ..., permanecen 2ks puntos fijos
al colocarse una perturbación, siendo ks de ellos elı́pticos y ks hiperbólicos. Asumamos
que α(I) aumenta al aumentar I. Entonces hay una curva de K. A. M. por fuera de la
curva racional, que se mueve en sentido contrario a las agujas del reloj (flechas externas),
α > r/s, y una curva de K. A. M. dentro de la curva racional que se mueve en sentido de
las agujas reloj, para s iteraciones de la aplicación “twist” perturbada (11.302). Por tanto
entre estas dos debe haber una curva cuya coordenada angular ϕ no cambia después de
s iteraciones de la aplicación (curva sólida, que no es una curva de K. A. M).
Iy Circunferencia
K.A.M.
Curva estacionaria α > r/s
Circunferencia
α = r/s
Ix
Circunferencia
K.A.M.
α < r/s
s = 3, k = 1
Figura 11.7 La figura muestra una curva de K. A. M. (por fuera de la curva racional) que
se mueve en sentido contrario al del reloj, una curva racional que se mueve en sentido del
reloj y una curva sólida que no es de K. A. M.
Ahora mediante una aplicación que preserve el área llevamos los puntos de la curva
sólida radialmente a alguna curva rayada como lo muestra la figura 11.7. Las curvas con-
tinua y rayada deben encerrar la misma área. Esto es posible sólo si las curvas se cruzan
entre sı́ un número par de veces. Cada intersección cuando es iterada s veces retorna a
su posición inicial, es un punto fijo. De modo que para un número par de intersecciones,
debe haber 2ks de tales puntos, que son los puntos fijos de Poincaré-Birkhoff. El teorema
no da el valor de k, que en la figura se ha tomado k = 1. Los puntos son alternativamente
de naturaleza elı́ptica e hiperbólica. Los puntos con α 6= r/s cercanos a un punto elı́ptico
tienden a girar alrededor de él, en tanto que los puntos cercanos a un punto hiperbólico
mediante repetidas aplicaciones tienden a alejarse indefinidamente del punto fijo.
En la sección 11.7 mediante transformación a un sistema de coordenadas fijo en un
punto elı́ptico estudiamos el comportamiento de los puntos cercanos a él y encontramos
que tienen un movimiento pendular. Luego encontramos que las resonancias de orden
superior dan lugar a la aparición de nuevos puntos fijos en las cercanı́as del punto elı́pti-
co, alrededor de los cuales nuevamente se presentan oscilaciones pendulares de amplitud
mucho más pequeña, según (11.295) proporcional a (1/s)s+1/2 . Hasta aquı́ vemos un
cuadro lleno de curvas de K. A. M. de gran complejidad. Sin embargo, veremos que el
comportamiento estocástico no resulta de las resonancias de orden superior, sino que
puede ocurrir en resonancias de orden bajo como resultado de la bifurcación de las sepa-
ratrices. Hablando a grosso modo podemos decir que los punto elı́pticos están asociados
a la estructura de islas del espacio fásico y los puntos hiperbólicos al comportamiento
estocástico de la región entre toroides de K. A. M. En el apéndice 9 del libro de Arnold
hay una serie de proposiciones referentes a los puntos fijos de las aplicaciones canónicas.9
Bifurcación de las separatrices. Sabemos que un péndulo tiene una separatriz

que une suavemente las órbitas hiperbólicas que pasan por los puntos de equilibrio ines-
table en π y −π. El teorema de Poincaré-Birkhoff nos dice que hay ks puntos hiperbólicos
en un sistema integrable. Hay una separatriz suave que une un punto hiperbólico a sus
vecinos próximos para tales sistemas. En un sistema cuasi-integrable con dos o más gra-
dos de libertad la situación es más compleja. Basta recordar que en los hamiltonianos
usados para obtener la estructura de islas, (11.244) o (11.286), hay una serie de términos
que han sido despreciados al construir los correspondientes invariantes. La estructura de
islas corresponde pues a un sistema truncado.
En cualquier singularidad hiperbólica convergen cuatro curvas, correspondientes a
las dos trayectorias separatrices incidentes Γ+ y a las dos trayectorias separatrices sa-
lientes Γ− . Un punto x pertenece a Γ+ si la transformación repetida T n x cuando n → ∞
trae a x a la singularidad, y pertenece a Γ− si la transformación inversa T −n x cuando
n → ∞ trae a x a la singularidad. Como el perı́odo sobre la separatriz del sistema
truncado es infinito, lo mismo será sobre la separatriz del sistema verdadero, y el movi-
miento de x hacia la singularidad resulta más y más lento mientras x esté más cerca del
punto fijo hiperbólico. Ahora consideremos la separatriz Γ− que sale del punto singular
hiperbólico adyacente. En vez de llegar suavemente coincidiendo con Γ+ , como sucede
con el péndulo o con cualquier separatriz de un sistema integrable, la curva Γ− que sale
de un punto hiperbólico se cruza con la curva Γ− que sale de un punto hiperbólico vecino
desplazado 2π/(ks). Esta intersección se llama un punto homoclı́nico. Las intersecciones
entre trayectorias de resonancia vecinas diferentes se llaman puntos heteroclı́nicos. En
esto consiste la bifurcación de las separatrices, en que una curva Γ+ no coincide con
una curva Γ− . Esto establece una diferencia fundamental entre el comportamiento de
9 Véase V. Arnold, Op. cit.
Curva
K.A.M.
x′′′
x′′
x′
Curva K.A.M.
Punto x Γ+
elíptico Γ–
Γ+
Γ–
Curva
K.A.M.
Curva
K.A.M.
Figura 11.8 Bifurcación de las separatrices Γ. Las lı́neas punteadas indican la separatriz del
sistema truncado integrable. Las lı́neas continuas indican la separatriz del sistema completo
no integrable.
las trayectorias del sistema truncado y del sistema completo integrable.

Si hay una intersección, entonces hay un número infinito de intersecciones, todas
puntos homoclı́nicos. La intersección en el punto homoclı́nico x implica el cruce en x′
y luego en x′′ , con x′′ más próximo a x′ que x′ a x. Como las áreas encerradas por las
intersecciones (áreas sombreadas en la figura 11.8) son aplicaciones unas de otras, son
conservadas, de modo que Γ− oscila más y más, siendo las intersecciones sucesivas más
próximas entre sı́ y las oscilaciones de amplitud mayor en virtud de la conservación de
las áreas. En la figura 11.8 se muestran sólo las primeras intersecciones.
Los puntos homoclı́nicos por sı́ solos no describen completamente el comportamien-
to de la región próxima a las separatrices. Como el número α(I) local en las cercanı́as de
los puntos singulares elı́pticos tiende a infinito en la separatriz debido a que el perı́odo
del movimiento sobre ésta es infinito, entonces en las cercanı́as de la separatriz hay
un número infinito de resonancias secundarias correspondientes a valores grandes de
α. Cada uno tiene su propio conjunto de puntos singulares hiperbólicos y elı́pticos que
alternan, con la correspondiente bifurcación de separatrices y con múltiples puntos he-
teroclı́nicos. Todas esas trayectorias llenan densamente el espacio accesible a ellas, para
dos grados de libertad limitado por dos superficies de K. A. M. La intersección de las
trayectorias en puntos homoclı́nicos demuestra que un toroide de K. A. M. no puede
existir en tales puntos puesto que hay un drástico cambio de topologı́a. Cuando la per-
turbación aumenta, según el teorema de K. A. M., la medida de la región de toroides
disminuye y aumenta la de la región estocástica.
La magnitud de la bifurcación de las separatrices para λ pequeño es exponencial-
mente pequeña, razón por la cual pasa desapercibida en las diferentes formas de la teorı́a
de perturbaciones. Su sola existencia genera las divergencias que ocurren en las series
de perturbaciones. Si esas series fueran convergentes, el sistema no tendrı́a bifurcación
de las separatrices ni estados de movimiento irregular.
Aplicación completa sobre una superficie de sección para un sistema no

integrable de dos grados de libertad. Asumamos que en la superficie de sección
al aumentar I1 disminuye la frecuencia ω1 y que en I1 = 0 el número de rotación es
irracional, por ejemplo α(0) = 1/π. Al aumentar I1 , ω1 decrece hasta alcanzar la primera
resonancia de orden bajo en ω1 = ω2 /4, dando lugar como en la figura 11.3, a una
cadena de islas; es decir hay cuatro puntos fijos que como resultado de la perturbación
y según el teorema de Poincaré-Birkhoff pasan a ser ocho, alternándose los elı́pticos e
hiperbólicos, con una isla alrededor de cada punto elı́ptico. Cerca de los cuatro puntos
fijos hiperbólicos la presencia de puntos homoclı́nicos y heteroclı́nicos está asociada a una
región de movimiento caótico limitada por dos superficies de K. A. M. “rotacionales”.
Al aumentar I1 , la siguiente resonancia de orden bajo aparece en ω1 = ω2 /5, que da
lugar a cinco puntos elı́pticos y a una cadena de cinco islas. Al aumentar I1 aparecen
nuevas resonancias. Hay además infinidad de resonancias intermedias cuya amplitud es
pequeña. Por ejemplo, entre ω1 = ω2 /4 y ω1 = ω2 /5 hay una resonancia en ω1 = 2ω2 /9.
De acuerdo con (11.257) la amplitud de una resonancia es del orden de:
 1/2
 λH 
 r,−s 
∆I1 ≈  2  (11.380)
 ∂ H0 
2
∂I 1
Según (11.293) el coeficiente de Fourier dominante en el hamiltoniano que describe
el movimiento en las islas es aproximadamente:
máx Hr,−s ≈ Js (π) (11.381)
de modo que la relación de amplitudes en s = 5 y s = 9 es aproximadamente:

∆I1 (s/r = 9/2) J9 (π)
≈ ≈ 0, 1 (11.382)
∆I1 (s/r = 5) J5 (π)
Además, en cada punto hiperbólico de las resonancias secundarias se genera una
región de movimiento caótico.
La figura 11.9 muestra esquemáticamente la apariencia de la superficie de sección.
Las lı́neas sólidas son superficies de K. A. M. Las que rodean el origen, I1 = 0, son dis-
torsión de los cı́rculos no perturbados y corresponden al nuevo invariante I1 = constante,
el cual es calculado aplicando el teorema de la media, descrito en la sección 11.5. Las

lı́neas sólidas que rodean los puntos singulares elı́pticos no se pueden calcular con este
método sino con el de las perturbaciones seculares (sección 11.7).
Para las trayectorias cercanas a las separatrices no hay un invariante y las tra-
yectorias llenan toda el área comprendida entre dos lı́neas de K. A. M. “rotacionales”.
Figura 11.9 Superficie de sección de resonancias secundarias
En cada una de las “islas” alrededor de un punto elı́ptico podemos transformar de

las variables I 1 , ϕ1 a unas variables acción-ángulo J1 , χ1 . Esto transforma la cadena de
islas en un conjunto de cı́rculos concéntricos como en la figura 11.3b. Las resonancias
entre la frecuencia del movimiento alrededor del punto fijo y las frecuencias fundamen-
tales crean cadenas de islas de segundo orden, similares a las de primer orden.
Análisis de la estabilidad. En los sistemas hamiltonianos no integrables la es-

tabilidad lineal parece ser una condición necesaria y suficiente para la estabilidad no
lineal, en el sentido que la estabilidad lineal garantiza la existencia de superficies de K.
A. M. cerca a un punto fijo. El análisis de la estabilidad de un estado de movimiento
en un sistema hamiltoniano se reduce al análisis de la estabilidad de la correspondiente
aplicación canónica en una superficie de sección de Poincaré. Un punto fijo x0 de una
aplicación que preserve el área T se dice que es estable si para cada vecindad U de x0
existe una subvecindad V ⊆ U tal que para todo k siempre se cumple que T k (V ) ⊆ U .
Poniendo el orı́gen de coordenadas en x0 y linealizando T alrededor de ese punto, halla-
mos que su parte lineal es una matriz 2 × 2 de coeficientes reales, Ã, que es simplicial.
Debido a esto, si λ es un autovalor de Ã, entonces 1/λ también lo es, y por ser real, λ y
λ⋆ son autovalores. De modo que los autovalores λ, λ⋆ , 1/λ, 1/λ⋆ , están determinados
por la ecuación λ2 − λ tr Ã + 1 = 0 donde tr es la traza de Ã. Si los autovalores son
complejo conjugados, λ1,2 = e±iσ , representan soluciones estables con tr Ã = 2 cos σ y
|trÃ| < 2. Si son reales y recı́procos, por ejemplo λ1,2 = e±σ , con |tr Ã| = |2 cosh σ| > 2,
se tienen soluciones creciente y decreciente. El caso inestable puede dividirse en dos po-
sibilidades, tr Ã > 2 (λ1 > 1) y tr Ã < −2 (λ1 < −1). Las raı́ces pueden ser iguales con
λ1 = λ2 = ±1, y corresponden a la transición exacta entre los casos estable e inestable.

El movimiento linealizado presenta entonces tres clases de órbitas: elı́pticas, hi-
perbólicas y rectilı́neas. Un punto fijo hiperbólico es inestable y las órbitas cercanas a él
se separan exponencialmente. Un punto fijo elı́ptico es estable y las órbitas cercanas a él
se separan linealmente. Si en un punto elı́ptico hay resonancias de orden bajo, sabemos,
el análisis de estabilidad lineal no es suficiente pues pueden presentarse nuevos puntos
fijos hiperbólicos, de acuerdo con el teorema de Poincaré-Birkhoff.
Ejemplo 11.8.3 Hacer el análisis de estabilidad de la aplicación separatriz (11.340):
Wn+1 = Wn − W0 sen ϕn
32 (11.383)
ϕn+1 = ϕn + Q0 r ln
|Wn+1 |
Los puntos fijos de perı́odo 1, o sea de una sola iteración, están en:
32
Q0 r ln = 2πm (11.384)
|W1 |
o sea:
W1 = ±32e−2πm/(Q0r) , m : entero
(11.385)
ϕ1 = 0, π
Si llamamos x1 = (W1 , ϕ1 ) y T la aplicación, estos puntos satisfacen x1 = T x1 .
Linealizando alrededor de x1 obtenemos xn = x1 + ∆xn :
∆xn+1 = Ã ∆xn (11.386)
siendo Ã la matriz jacobiana de la aplicación:
 ∂W ∂W 
n+1 n+1
 ∂Wn ∂ϕn 
 
Ã =   (11.387)
 ∂ϕn+1 ∂ϕn+1 
∂Wn ∂ϕn
Para evaluar la estabilidad se requiere la traza de Ã:
W0
tr Ã = 2 + Q0 r cos ϕ (11.388)
W1
Para estabilidad se requiere que tr Ã < 2, de modo que para W1 > 0 los puntos
fijos con ϕ1 = 0 son todos inestables. Para ϕ1 = π hay estabilidad cuando:
Q0 r
W1 > Ws = W0 (11.389)
4
o sea:
2πrA 3 −πQ0 /2
W1 > Q0 e (11.390)
F
Es de esperarse que el valor de Ws que marca el lı́mite entre los puntos con ϕ1 = π
estables e inestables represente un importante parámetro indicativo de estocasticidad
cuando W < Ws . La aplicación separatriz es de importancia para comprender el com-
portamiento caótico de los sistemas cuasi-integrables, pues las separatrices siempre ro-
dean las resonancias de esos sistemas. La aplicación separatriz, que describe el compor-
tamiento en las cercanı́as de la separatriz, claramente exhibe comportamiento caótico
para W → 0.
Ejercicio 11.8.1 Hallar los puntos fijos de perı́odo 1 y analizar la estabilidad de la apli-
cación de Fermi:
Un+1 = |Un + sen ϕn |
2πM (177) (11.391)

ϕn+1 = ϕn +
Un+1
donde M es una constante.
Ejercicio 11.8.2 Hallar los puntos fijos de perı́odo 1 y analizar la estabilidad de la apli-
cación estándar (11.318).
Ejercicio 11.8.3 Mostrar que la aplicación estándar es una aproximación a la aplicación

de Fermi y a la aplicación separatriz linealizadas.
Irregularidad global. La existencia de regiones caóticas está asociada con las

resonancias y se da aun para valores pequeños del parámetro λ. No hay una transición
brusca entre los regı́menes regular e irregular en algún valor crı́tico de λ. Sin embargo es
útil poder cuantificar el grado de “estocasticidad” y decir cuando el movimiento es domi-
nantemente estocástico. Chirikov (1979) ha observado que al aumentar la perturbación
ocurre en algún valor más o menos definido que las superficies de K. A. M. rotacionales
que encierran una región estocástica de un sistema de dos grados de libertad se “rom-
pen”, permitiendo que las trayectorias estocásticas ocupen una región más grande del
espacio fásico. Con esta idea elaboró el concepto de sobreposición de las separatrices y
definió un parámetro de estocasticidad. Hay muchos otros criterios pero este es de los
más usados, al menos como un indicador del orden de magnitud de la perturbación para
el cual el sistema se comporta de modo esencialmente irregular. Si (∆Imáx )1 y (∆Imáx )2
son los anchos de las separatrices vecinas separadas por una lı́nea de K. A. M. rotacional,
y δI12 es la distancia entre las resonancias correspondientes, o sea entre los puntos fijos
centrales de las “islas”, el criterio de estocasticidad global puede formularse como:
(∆Imáx )1 + (∆Imáx )2 2
≥ (11.392)
δI12 3
Cuando existen las superficies de K. A. M. que limitan las regiones estocásticas se
habla de estocasticidad local o aislada y cuando tales superficies desaparecen se habla
de estocasticidad global o conectada. En el ejemplo 11.8.3 hallamos un parámetro crı́tico
para el cual se pierde la estabilidad lineal de las principales resonancias en la aplicación
separatriz; este parámetro también da una burda estimación de la estocasticidad, pero
por no ser una condición necesaria para la estocasticidad conectada resulta ser un criterio
demasiado fuerte. Greene (1979)10 halló que aunque la pérdida de estabilidad lineal de
las islas de perı́odo 1 es una condición muy fuerte, tal criterio aplicado a islas de perı́odo
alto cercanas a una superficie de K. A. M. puede dar una mejor descripción. Este es un
criterio alterno al de Chirikov y más exacto en muchos casos.
Ejemplo 11.8.4 Analizar diferentes criterios de irregularidad global para la aplicación
estándar (11.318).
(a) Pérdida de estabilidad de los puntos fijos elı́pticos de perı́odo 1. Tales puntos
están en:
I1 = 2πm , m : entero ; ϕ1 = 0, 1 (11.393)
La matriz Ã es:
 
1 ±K
Ã =   (11.394)
1 1±K
donde el signo más corresponde a ϕ1 = 0 y el menos a ϕ1 = π. La condición de estabi-
lidad:
|2 ± K| < 2 (11.395)
nos dice que el punto ϕ = 0 es siempre inestable. No hay puntos fijos elı́pticos de perı́odo
1 si:
K>4 (11.396)
(b) Sobreposición de separatrices de resonancias primarias. Es conveniente consi-
derar el hamiltoniano de la aplicación, obtenido en el ejemplo 11.8.1. Si asumimos que ϕ
varı́a lentamente con el tiempo, dϕ/dn ≪ 2π, entonces esperamos que en H1 , ecuación
(11.325), contribuirá sólo el término de variación más lenta, de modo que:
1 2
H= I + K cos ϕ + 2K cos ϕ cos 2πn (11.397)
2
La parte correspondiente a H0 , ecuación (11.324), describe un movimiento pendu-
lar, siendo la frecuencia de libración alrededor del punto elı́ptico ϕ = π:
√
ω0 = K (11.398)
El máximo desplazamiento de I es hallado de H0 tomando cos ϕ = 1 en I = 0, o
sea H0 = K. Entonces el valor máximo de I está en cos ϕ = −1:
√
∆Imáx = 2 K (11.399)
De acuerdo con (11.393), la distancia entre las resonancias primarias δI es igual a
2π, y por tanto la relación entre el ancho total de la separatriz y la distancia entre dos
resonancias consecutivas es:
2∆Imáx 4ω0
= (11.400)
δI 2π
10 Véaseel texto de Lichtenberg A. J. y M. A. Lieberman, Regular and stochastic motion, Springer-
Verlag, Nueva York, 1983.
La frecuencia de H1 es 2π, de modo que el número de rotación local cerca al punto

elı́ptico de libración α0 = ω0 /2π. Entonces:
2∆Imáx
= 4α0 (11.401)
δI
La observación numérica dice que la transición a la estocasticidad global ocurre
aproximadamente cuando aparecen las islas de sexto orden, con α ≈ 1/6, entonces
(11.401) nos conduce a la “regla de los dos tercios”, 2∆Imáx /δI ≈ 2/3. Sin embar-
go, un estimado de K puede obtenerse directamente de (11.400) tomando simplemente
2∆Imáx /δI ≈ 1 como un indicativo de la sobreposición de las separatrices:
√
4 K = 2π , K ≈ 2, 47 (11.402)
Con la regla de los dos tercios se obtiene:
K ≈ 1, 46 (11.403)
(c) Sobreposición del primero y del segundo armónicos. Definimos la condición de
sobreposición del primero y del segundo armónicos como:
∆I1 máx + ∆I2 máx = δI12 = π (11.404)
donde los subı́ndices indican resonancias de perı́odos 1 y 2 respectivamente.
Para calcular el ancho ∆I2 necesitamos el segundo armónico de Fourier en la
expansión de H en potencias de K ya que en (11.397) K cos ϕ contiene sólo el primer
armónico. El hamiltoniano describe un sistema no autónomo de un grado de libertad,
que equivale a uno de dos grados de libertad según la sección 9.2.
Como la región del espacio fásico en que aparece el segundo armónico está alejada
de las resonancias primarias, la teorı́a de perturbaciones ordinaria puede usarse para
hacer la expansión de H hasta el segundo orden en K donde esperamos que aparezca el
segundo armónico.
El hamiltoniano (11.323) puede escribirse como:
+∞
X
1 2
H= I + λK cos(ϕ − 2πmn) (11.405)
2 m=−∞
El término de orden cero I 2 /2, describe un movimiento en I − ϕ cuya solución es

ϕ = In + ϕ0 , I = constante, siendo ϕ0 una constante. Según (11.393) los puntos fijos
de la aplicación estándar están en I = 2pπ para las resonancias primarias. Entonces la
perturbación dará lugar a puntos fijos de las resonancias secundarias en:
I = (1p + 1)π ; p : entero (11.406)
que se encuentran entre dos resonancias primarias. La frecuencia del movimiento de or-
den cero es (2p + 1)π y la frecuencia de la fuerza impulsora externa es 2πm, presentando
resonancias de la forma r/s = (2p + 1)/m. Los punto fijos en 0 y π de (11.393) corres-
ponden a m = 0, o sea al movimiento pendular, con lo cual las resonancias secundarias
vienen de r = 2p + 1 y s = 1 y basta tomar a H como (11.397), escrito en la forma:
1
H = Iχ + Iϕ2 + K cos ϕ + 2K cos ϕ cos χ (11.407)
2
Realicemos una transformación canónica para obtener una variable angular rápida
y una lenta:
Iχ = rI χ ; Iϕ = I ϕ − sI χ
(11.408)
ϕ = rχ − sϕ ; χ=χ
Entonces:
1 2
H
+ = rI χ + I ϕ − sI χ
2
rχ − ϕ rχ − ϕ
+ K cos + 2K cos cos χ (11.409)
s s
Ahora ϕ es una variable angular lenta y podemos aplicar la teorı́a de perturbaciones
adiabáticas, sección 11.5, válida aquı́ por no haber divisores nulos.
Para buscar una expansión en potencias de K, al orden cero aplicamos (11.178):
1 2
H 0 = rI χ + I ϕ − sI χ (11.410)
2
Al primer orden promediamos la perturbación sobre la variable angular rápida χ:
H1 = 0 (11.411)
Entonces, según (11.180):
∂F (1)
2π = − cos(rχ − ϕ) − 2 cos(rχ − ϕ) cos χ (11.412)
∂χ
y por tanto:
1 1
−2πF (1) = sen (rχ − ϕ) + sen [(r − 1)χ − ϕ]
r r−1
(11.413)
1
+ sen [(r + 1)χ − ϕ]
r+1
y,
∂F (1) 1 1
2π = cos(rχ − ϕ) + cos[(r − 1)χ − ϕ]
∂χ r r−1
(11.414)
1
+ cos[(r + 1)χ − ϕ]
r+1
Para hallar a H 2 , aplicamos la fórmula (11.37) con los promedios tomados sobre
χ:
2 2 (1)
1 X X ∂ 2 H0 ∂F ∂F (1)
H2 = (11.415)
2 µ=1 ν=1 ∂I ν ∂I µ ∂ϕν ∂ϕµ
Con el resultado, al segundo orden:

2
1 2 K
H= I − cos 2ϕ (11.416)
2 4
donde se ha omitido una constante y regresado a la notación inicial. ϕ es la variable
angular lenta, dada por (11.408):
ϕ = −ϕ + (2p + 1)πn (11.417)
y describe el movimiento alrededor de las islas de resonancias secundarias. Según la
ecuación (11.416) la máxima oscilación de I es ∆I2 máx = K/2, con lo cual y con (11.399)
y (11.404) toma la forma:
√ K
2 K+ = π K ≈ 1, 46 (11.418)
2
que es el resultado obtenido por Chirikov, y que además justifica la regla de los “dos
tercios”.
Experimentalmente, o sea resolviendo numéricamente la aplicación (11.318), se
obtiene que la transición a la estocasticidad global según Chirikov ocurre cuando K ≈
0, 99. Chirikov mejoró el resultado (11.418) tomando el espesor de la capa estocástica
en cercanı́as de la separatriz.
Ejemplo 11.8.5 Calcular el efecto del espesor de la separatriz sobre el valor de K a partir
del cual ocurre la transición a la estocasticidad global. El cálculo se basa en el ejemplo
11.8.2.
La función W en (11.339) proviene de 1 − κ2 del ejemplo 10.3.2, que se puede
escribir como:
E − Es
1 − κ2 = − (11.419)
2Es
notando que la energı́a de la separatriz es precisamente F . Entonces W es:
E − Es
W = (11.420)
Es
o sea la desviación de la energı́a respecto a la separatriz dividida por la energı́a de la
separatriz.
Según el ejemplo 11.8.1, la aplicación separatriz (11.340) linealizada toma la forma
de la aplicación estándar si:
Q0 ∆Wn Q0 W0
In = − y K= (11.421)
W1 W1
siendo según (11.334) Q0 igual a:
2π
Q0 = √ (11.422)
K
Hemos tomado r = 1 (resonancia de orden 1) y √ tomado las frecuencias impulsora
y de la aplicación según (11.398) y (11.393) iguales a K y 2π respectivamente.
Como en (11.341) A es H11 que para nuestro caso podemos tomar igual a F . De (11.421)
y (11.341) podemos obtener el parámetro de estocasticidad K en función de Q0 y W1 :
8πQ30 −πQ0 /2
K= e (11.423)
W1
donde K está asociado al ancho de las separatrices de las “islas” de segundo orden. Tal
ancho, según (11.420), está descrito por W , o sea por W1 en (11.423), que según (11.422)
puede expresarse en función de K:
2
√
W1 = 4(2π)4 K −5/2 e−π / K
(11.424)
√
De (11.399) se sigue que el valor de I en la separatriz es I0 = 2 K. La energı́a del
lı́mite exterior de la capa estocástica cercana a la separatriz es igual a la energı́a de la
separatriz, K, más el ancho de la capa, dado según (11.420) por ∆E = W F , o sea que:
K + ∆E = K(1 + W1 ) (11.425)
es la energı́a del lı́mite exterior de la capa estocástica. Como E = I 2 /2 + K cos ϕ para
el péndulo, en ϕ = π es igual a I 2 /2 − K, encontramos que:
1 2
I − K = K(1 + W1 ) , I 2 = 2K(2 + W1 ) (11.426)
2
y como W ≪ 1:

√ W1
I =2 K 1+ (11.427)
4
De modo que el ancho de la separatriz respecto a la acción es:
1 √
∆Is = I − I0 = W1 K (11.428)
2
Si sumamos este ancho en (11.418) obtenemos un criterio de sobreposición mejo-
rado:
h 2
√ i √ K
1 + (2π)4 K −5/2 e−π / K 2 K + =π (11.429)
2
del cual se obtiene el valor:
K ≈ 1, 2 (11.430)
que coincide un poco más con el valor experimental K ≈ 0, 99.
12
Correspondencia con la mecánica cuántica

de Heisenberg
En este capı́tulo presentaremos la mecánica clásica con una notación similar a la

usada en la mecánica cuántica de Heisenberg, conocida también como mecánica ma-
tricial. Las fórmulas no tendrán suposiciones cuánticas y serán válidas clásicamente.
Con esto podremos hacer énfasis en las diferencias y correspondencias que existen entre
los formalismos clásico y cuántico, y a la vez retomar las ideas originales de Werner
Heisenberg expuestas en su trabajo famoso de julio de 1925.1
Veremos que la representación de las variables dinámicas por medio de matrices y
la asignación de valores propios a las variables dinámicas son posibles dentro de un for-
malismo puramente clásico. Veremos también el punto exacto donde la mecánica clásica
admite el reemplazo de los corchetes de Poisson por conmutadores y la no conmutati-
vidad de las matrices. Finalmente señalaremos dónde están las verdaderas diferencias
entre las mecánicas clásica y cuántica.
Para ilustrar la correspondencia entre la mecánica cuántica y la mecánica clásica
mostraremos cómo el procedimiento de diagonalización de la matriz hamiltoniana corres-
ponde con el de resolver la ecuación de Hamilton-Jacobi, y presentaremos las fórmulas
de la teorı́a clásica de perturbaciones con la notación matricial.
Se corrobora ası́ la idea expresada por Dirac en su artı́culo de noviembre de 1925:
“En un reciente artı́culo Heisenberg planteó una nueva teorı́a donde sugiere que no son
erróneas las ecuaciones de la mecánica clásica, sino más bien que son las operaciones
matemáticas mediante las cuales se extraen resultados fı́sicos a partir de ellas las que
requieren modificación. Toda la información sumunistrada por la teorı́a clásica puede
ser usada en la nueva teorı́a”.2
1 Traducido al inglés por B. L. van der Waerden en Sources of quantum mechanics, Dover, Nueva
York, 1968.
2 Reproducido por van der Waerden, Op. cit.
549
12.1. Representación matricial de variables dinámi-

cas
Consideraremos un sistema acotado l-dimensional en un estado de movimiento
regular, es decir, integrable y que por tanto se puede describir mediante variables ac-
ción-ángulo. Tal sistema es múltiplemente periódico y cualquier variable dinámica puede
expresarse como una serie de Fourier. El formalismo podrı́a extenderse a estados no aco-
tados mediante la sutitución de las series por integrales de Fourier.
Representación de variables dinámicas por matrices hermı́ticas infinitas.

Sea f una variable dinámica y (I, ϕ) un conjunto de variables acción-ángulo del sistema,
entonces:
X
f (I, ϕ) = f~n (I) ei~n·ϕ~ (12.1)
~
n
donde ~n son vectores l-dimensionales de componentes enteras. Es conveniente escribir a

~n como la diferencia entre dos vectores de componentes enteras, ~n = α ~ −α ~ ′ . El vector
α ~
~ puede escribirse de modo que I = α ~ ∆I, donde ∆I es un número lo suficientemente
pequeño con las dimensiones de acción;3 por tanto las componentes de α ~ son números
enteros muy grandes, si I~ es grande.
Sumar en (12.1) sobre todos los valores de las I~ (que varı́an entre cero e infinito)
equivale a sumar sobre α~ , o sea:
X XX ′
f (~
α ∆I, ϕ
~) = α ∆I)ei(~α−~α )·ϕ~
fα~ −~α′ (~ (12.2)
α
~ α
~ α
~′
Por ser f real, se cumple que fα~⋆−~α′ (I) = fα~ ′ −~α (I). La suma sobre α
~ en (12.2)
puede ser divergente, lo cual ha de tenerse en cuenta en los desarrollos que siguen. Esto
corresponde con las dificultades de normalización de las ondas planas en la mecánica
cuántica.
Si formamos el producto de dos variables dinámicas, sus coeficientes de Fourier
dependen de los coeficientes de Fourier de cada variable, ası́:
X
(f g)β−
~ β~ ′ (I) = fβ−~
~ α (I)gα ~ ′ (I)
~ −β (12.3)
α
~
La convergencia de la expansión (12.1) exige que los coeficientes para ~n altos sean
pequeños, por tanto sólo son de interés los ~n bajos. Por otra parte, si ∆I es pequeño,
~ en I~ = α
siempre los α ~ ∆I serán grandes, es decir que |~n| es del orden de la unidad y:
|~n| ≪ |~
α| (12.4)
Entonces se cumple para toda función de I~ que:

∂F
F (~ α′ ∆I) + (~
α ∆I) = F (~ ~ ′) ·
α−α ∆I (12.5)
∂ I~
3 Puede considerarse a ∆I como la resolución en las medidas de las Iν .
Corespondencia con la mecánica cuántica de Heisenberg / 551
Esto nos permite definir matrices clásicas aproximadamente hermı́ticas, ası́:
fα~ ,~α′ ≡ fα~ −~α′ (~

α ∆I) (12.6)
entonces es claro que:
∂fα~ −~α′
fα~⋆′ ,~α = fα~⋆′ −~α (~
α′ ∆I) = fα~ ,~α′ + (~
α′ − α
~) · ∆I (12.7)
∂ I~
es aproximadamente autoadjunta. Como α ~ ′ pueden recorrer todos los vectores de
~ y α
componentes enteras resulta que las fα~ ,~α son matrices infinitas.
′
Correspondencia con las matrices cuánticas. En mecánica cuántica I~ y ϕ ~ son

operadores cuyos vectores propios los denotaremos respectivamente por |~ αi y |~
ϕi. En el
conjunto de estados |~αi deben incluirse, si existen, los estados del continuo para tener
un conjunto completo. La transformación de la representación I~ a la representación ϕ ~
es:
X X ′
|~
ϕi = α′ ih~
|~ α′ |~
ϕi = α′ i e−i~α ·ϕ~
|~ (12.8)
α
~′ α
~′
El valor esperado de una variable dinámica f en el estado |~

ϕi está dado por:
XX ′
h~
ϕ|f |~
ϕi = h~ α′ i ei(~α−~α )·ϕ~
α|f |~ (12.9)
α
~ α
~′
Comparando (12.2) con (12.9) resulta clara la correspondencia de los coeficientes

de Fourier fα~ −~α′ y las matrices clásicas fα~ ,~α′ , con las matrices cuánticas h~ α′ i.
α|f |~
e−i~α·ϕ~ son las funciones de onda de la representación ϕ ~ con valores definidos de α~,
o sea funciones propias del operador hermı́tico asociado a I, ~ i∂/∂ ϕ~:
1 ∂ −i~α·ϕ~
− e ~ e−i~α·ϕ~
=α (12.10)
i ∂ϕ
~
Ciertamente hay algunas dificultades en la definición de las variables acción-ángulo
en mecánica cuántica, analizadas en el artı́culo de Augustı́n y Rabitz (1979).4
En la sección §48 del libro de mecánica cuántica de Landau-Lifshitz (ver biblio-
grafı́a) está demostrada la correspondencia entre los elementos de matriz de un operador
cuántico y los coeficientes de Fourier de la correspondiente variable dinámica clásica.
No tenemos hasta ahora ninguna justificación para relacionar la matriz clásica
fα~ ,~α′ con transiciones entre estados cuantizados descritos por α ~ yα~ ′ . El ejemplo 10.5.2
sobre radiación dipolar da una evidencia de la asociación entre emisión de radiación y
transiciones en mecánica clásica.
Cambio de representación. Si por medio de una transformación canónica pa-

samos de un conjunto de variables acción-ángulo (I, ϕ) a otro (I, ϕ), por medio de una
4 Action-angle variables in quantum mechanics, Journal of Chemical Physics, 71 (12), 4956, (1979).
función generatriz G3 (I, ~ϕ), las variables angulares y de acción se deben transformar
como ϕ ~ = −∂G3 (I, ϕ)/∂ I, ~ I~ = −∂G3 (I, ϕ)/∂ ϕ,
~ las funciones e−i~α·ϕ~ como:
X ′ ~
e−i~α·ϕ~ = gα~ ,~α′ (I)e−i~α ·ϕ (12.11)
α
~′
y las amplitudes de Fourier de las variables dinámicas como:

XX
fβ−
~ β~ ′ (I) = g+
~ (I) fα α′ (I) gα
~ −~ ~ (I)
~ ′ ,β (12.12)
β,~
α
α
~ α
~′
donde g + ⋆
~ α (I) = gα ~ (I).
~ ,β
β,~
Podemos tomar los resultados de la sección 11.3, referentes a los cambios de sis-
temas de variables acción-ángulo. Para sistemas no degenerados, las fórmulas (11.84) y
(11.85) de tal sección establecen que:
l
X l
X
∂
ϕν = nνµ ϕµ − ψ(I) ; Iν = nµν Iµ (12.13)
µ=1
∂I ν µ=1
donde nνµ es una matriz ñ de elementos enteros y determinante ±1 y ψ depende sólo

de las variables de acción. Entonces:
~ ~
e−i~α·ϕ~ = e−i~α·(ñϕ)−i~α·δ (12.14)
~ ·~δ una fase que sólo depende de I~ y de α

siendo α ~ . Por tanto para sistemas no degenerados:
~
gα~ ·~α′ = e−i~α·δ δα~ ′ ,~αñ (12.15)
Para sistemas degenerados rigen las fórmulas (11.100) a (11.103):

l
X s
X
ϕβ = nβν ϕν + ψβ (ϕσ , I) ; Iβ = nγβ Iγ
ν=1 γ=1
l
X
ϕτ = nτ σ ϕσ + ψτ (ϕσ , I) (12.16)
ν=s+1
l
X X σ σ
Iτ = nντ Iτ − i C~nσ (I) nτ ei~n ·ϕ~
ν=1 nσ
~
Las variables no degeneradas tienen subı́ndices β = 1, 2, ...s, y las degeneradas

σ = s + 1, s + 2, ...l. El superı́ndice σ indica vectores de l − s componentes.
Las variables angulares ϕστ son constantes y los números nτ σ no necesitan ser ente-
ros. ψν (ϕσ , I) son funciones periódicas de las variables angulares degeneradas. Entonces,
usando el convenio de la suma:
α ~ = αβ nβν ϕν + ατ nτ σ ϕσ + αν ψν (ϕσ , I)
~ ·ϕ (12.17)
ei~α·ϕ~ puede escribirse en la forma:

eα~ ·ϕ~ = eiαβ nβτ ϕτ h(ϕσ , I) (12.18)
donde las ϕτ son no degeneradas y h es una función periódica de las ϕστ . En consecuencia:
gα~ ,~α′ = hα~ σ ,~ασ′ δα~ τ ′ ,~ατ ñτ (12.19)
siendo α ασ , α
~ = (~ ~ τ ).
Notemos que:
X
g+~ gα ~ ′ = δβ,
~ ,β ~β ~′ (12.20)
β,~
α
α
~
y por tanto:
X
h+
~σ hα~ σ ,β~ ′ σ = δβ~σ ,β~ ′ σ (12.21)
ασ
β ,~
~σ
α
o sea que g y h son matrices unitarias de dimensión infinita.

Las matrices unitarias de cambio de representación son no conmutativas. Si se
realizan dos transformaciones sucesivas, descritas por las matrices g̃ y k̃, se cumple:
~ ~
gα~ ,~α′ kα~ ′ ,β~ = e−i~α·(δg +ñg δk ) δβ,~
~ αñg ñk
~ ~ (12.22)
kα~ ,~α′ gα~ ′ ,β~ = e−i~α·(δk +ñk δg ) δβ,~
~ αñk ñg
Como puede verse, las matrices unitarias que describen las transformaciones canóni-
cas satisfacen una álgebra no conmutativa.
Aquı́ estamos considerando solamente transformaciones canónicas entre diferentes
conjuntos de variables acción-ángulo, que cambian expansiones de Fourier en expansio-
nes de Fourier. Es claro que al pasar a variables canónicas que no sean de acción-ángulo
una expansión de Fourier se cambia por una expansión en otro conjunto de funciones
ortogonales igualmente válida; en la formulación de la mecánica cuántica este trabajo
fue hecho por Born, Jordan y Heisenberg entre septiembre y noviembre de 1925.
Valores propios y vectores propios de una variable dinámica. Dada una

variable dinámica f , ¿existe algún conjunto de variables acción-ángulo para el cual la
función dependa sólo de las variables de acción?. Si existe, en tales variables se debe
cumplir:

f I(I, ϕ), ϕ(I, ϕ) = f (I) (12.23)
Esto significa que en la expansión de Fourier de f sólo aparece la componente
constante o d.c.:
f β−
~ β~ ′ = f 0 (I) δβ,
~β ~′ (12.24)
o en términos de las matrices clásicas (12.6):
f β,
~β
~
~ ′ = f 0 (β ∆I) δβ,
~β ~′ (12.25)
Los números f 0 son los valores propios de la matriz f.

De (12.12) y (12.20) se sigue que:
XX
+
~ α fα
gβ,~ α′ (I) − f 0 (I)δα
~ ,~ α′ gα
~ ,~ α =0
~ ′ ,~ (12.26)
α
~ α
~′
Esta expansión se satisface sólo si f 0 (I) son las raı́ces de la ecuación secular:

det fα~ ,~α′ − f 0 (~
α ∆I) δα~ ,~α′ = 0 (12.27)
En conclusión, encontrar las variables acción-ángulo en las cuales una variable
dinámica no dependa de las variables angulares equivale a diagonalizar la matriz clásica
formada con los coeficientes de Fourier. Los vectores propios de la matriz son a su
vez los elementos de la matriz de la transformación unitaria g que conecta las dos
representaciones:
X
fα~ ,~α′ gα~ ′ ,β~ (I) = f 0 (I) gα~ ,β~ (I) (12.28)
α
~′
De lo anterior resulta que si el hamiltoniano es diagonal, entonces toda constante

de movimiento, cuando no hay degeneración, es igualmente diagonal.
Por ser matemáticamente válida la correspondencia entre matrices infinitas y ope-
radores lineales, concluimos que en mecánica clásica es posible hacer corresponder a cada
variable dinámica un operador lineal.
Ejemplo 12.1.1 Hallar las matrices clásicas para q, p y H de un oscilador armónico
lineal.
Las expresiones de q y p en variables acción-ángulo dadas en el ejemplo 10.3.1,
permiten obtener fácilmente los coeficientes de Fourier:
1/2
I
qα−β (I) = i (−δα,β+1 + δα,β−1 )
2mω
(12.29)
1/2
Imω
pα−β (I) = (δα,β+1 + δα,β−1 )
2
Usando la definición (12.6) se sigue que:
1/2
α ∆I
qα,β = i (−δα,β+1 + δα,β−1 )
2mω
(12.30)
1/2
α ∆Imω
pα,β = (δα,β+1 + δα,β−1 )
2
Las matrices adjuntas correspondientes son:
1/2 1/2
⋆ (α + 1) ∆I (α − 1) ∆I
qβ,α = i δα,β−1 − i δα,β+1
2mω 2mω
(12.31)
1/2 1/2
(α + 1) ∆Imω (α − 1) ∆Imω
p⋆β,α = δα,β−1 + δα,β+1
2 2
Vemos claramente que si α ≫ 1 las matrices de q y p son autoadjuntas. La matriz

hamiltoniana es:
Hα,β = α ∆I ωδα,β (12.32)
Esta matriz es autoadjunta sin aproximaciones. Los valores propios son los dife-
rentes valores de la energı́a del oscilador armónico. Por ser H positivo, resulta que:
Hα,β = 0 para α<0 (12.33)
Además por ser ∆I pequeño, los valores propios de H son muy próximos entre sı́,
formando un continuo en el lı́mite ∆I → 0.
12.2. Corchetes de Poisson y conmutadores de matri-

ces clásicas
En contradicción con lo corrientemente aceptado, la mecánica clásica admite la
representación de las variables dinámicas mediante matrices no conmutativas aproxi-
madamente hermı́ticas. Esta representación permite asociar conmutadores de matrices
clásicas con los corchetes de Poisson. Los resultados cuánticos se obtienen formalmente
colocando ∆I = h̄.
Conmutadores clásicos. El conmutador de las matrices de dos variables dinámi-

cas f y g es:
X
(fβ,~
~ α gα ~ ′ − gβ,~
~ ,β ~ α fα ~′ )
~ ,β (12.34)
α
~
En términos de las amplitudes de Fourier de f y g, (12.34) toma la forma:

Xh i
fβ−~ ~
~ α (β ∆I) gα ~ (~
α ∆I) − g ~ (β~ ∆I) f ~ ′ (~
α ∆I) (12.35)
~ −β ′ β−~
α α
~ −β
α
~
Notemos que la siguiente expresión vale cero:

Xh i
fβ−~
~ α (β~ ∆I) g ~′ (β~ ∆I) − g ~ α (β~ ∆I) f ~′ (β~ ∆I) =0 (12.36)
α
~ −β β−~ α
~ −β
α
~
En efecto, cada αν toma valores entre −∞ y +∞. Si cambiamos en los términos

negativos de (12.36) a α~ por ~δ mediante la fórmula β~ − α
~ = ~δ − β
~ ′ , entonces cada δν
′ ′
tomará valores entre βν + βν − ∞ y βν + βν + ∞, o sea entre −∞ y +∞. Entonces por
cada término en (12.36) con signo + hay uno con signo −.
Matrices de corchetes de Poisson. El corchete de Poisson de dos variables

dinámicas es:
∂f ∂g ∂f ∂g
[f, g] = · − · (12.37)
~ ∂ I~ ∂ I~ ∂ ϕ
∂ϕ ~
La serie de Fourier del corchete de Poisson es:

X X ∂gm ~ ∂fm~

[f, g] = i ~n · f~n − g ei(~n+m)·
~ ϕ ~
(12.38)
∂ ~
I ∂ ~ ~n
I
m
~ ~
n
Las componentes de Fourier de [f, g] pueden escribirse en términos de las de f y g

ası́:
X
∂g~l−~n ∂f~l−~n
[f, g]~l = i ~n · f~n − g~n (12.39)
~
n
∂ I~ ∂ I~
Cambiando a ~l por β
~−β ~ ′ y a ~n por β~ − α ~ , se sigue:
X
∂gα~ −β~ ′ ∂fα~ −β~ ′
[f, g]β−
~ β~′ = i(β~ − α
~ ) · f ~ α − g ~ α (12.40)
β−~ β−~
α
~
∂ I~ ∂ I~
En esta expresión el corchete de Poisson depende de I~ = β~ ∆I; por tanto las

~
componentes de Fourier de f y g serán también funciones de β∆I. Si se realiza un
cambio infinitesimal en I~ dado por (~ ~ ∆I, se sigue que:
α − β)
gα~ −β~ ′
· (~ ~ ∆I = g ~ ′ (~
α − β) ~
~ −β α ∆I) − gα
α ~ ′ (β ∆I)
~ −β (12.41)
∂ I~
debido a que |~ ~ ≪ |~
α − β| ~
α|, |β|.
Entonces el corchete de Poisson puede escribirse en la forma:
[f, g]β−
~ β~′ =
−i X h ~ ~
i
fβ−~
~ α (β ∆I)gα
~ − ~ ′ (~
β α ∆I) − gβ−~
~ α (β ∆I)fα
~ − ~ ′ (~
β α ∆I) (12.42)
∆I
α
~
aquı́ hemos usado la identidad (12.36).

Notemos que en el lado derecho de (12.42) I~ = β ~ ∆I, siendo por tanto [f, g] ~ ~ ′
β−β
~ ∆I. Entonces la definición (12.6) nos permite identificar el lado izquierdo
función de β
de (12.42) con [f, g]β,
~β ~ ′ . Comparando a (12.35) con (12.42) obtenemos el resultado:
−i ˜
[f, g]β,
~β ~′ = (f g̃ − g̃f˜)β−
~ β~′ (12.43)
∆I
Vemos que la matriz del corchete de Poisson de dos variables dinámicas puede
expresarse como el conmutador de las correspondientes matrices clásicas, multiplicado
por −i/∆I:
gg] = −i ˜
[f, (f g̃ − g̃ f˜) (12.44)
∆I
En conclusión, en la mecánica clásica es posible asociar a las variables dinámicas
un álgebra no conmutativa que coincide con el álgebra de los corchetes de Poisson.
Ejemplo 12.2.1 Evaluar directamente el conmutador de q y p, y el corchete de Poisson,
para un oscilador armónico.
X i ∆I p
qβ,α pα,β ′ = β (12.45)
α
2
h p p p p i
× − β ′ + 1 δβ,β ′ +2 + β ′ + 1 − β ′ − 1 δβ,β ′ + β ′ − 1 δβ,β ′ −2
con una expresión análoga al permutar a p con q. El valor del conmutador es:
X
(qβ,α pα,β ′ − pβ,α qα,β ′ ) =
α
p p p
i ∆I β β + 1 − β − 1 δβ,β ′ ≈ i ∆I δβ,β ′ (12.46)
donde la segunda relación resulta de la suposición β ≫ 1.

Según (12.43) y (12.46) la matriz de los corchetes de Poisson debe ser:
[q, p]β,β ′ = δβ,β ′ (12.47)
Si se aplica directamente (12.40) y se usa el siguiente resultado:
X X 1/2
∂pα−β ′ I
i(β − α) qβα = i(β − α) i
α
∂I α
2mω

1 mω 1/2
×(−δβ,α+1 + δβ,α−1 ) (δα,β ′ +1 + δα,β ′ −1 ) (12.48)
2 2I
y la expresión análoga con q y p intercambiados, se obtiene igualmente (12.47).
Obviamente, la matriz de [q, p] = 1 tiene sólo unos en la diagonal siendo ceros los
demás elementos.
Ejemplo 12.2.2 Evaluar la matriz del corchete de Poisson de H con q para un oscilador
armónico.
La matriz hamiltoniana está dada por (12.32). En consecuencia:
X 1/2
β ∆I
Hβ,α qα,β = β ∆I ωi
′ (−δβ,β ′ +1 + δβ,β ′ −1 ) (12.49)
α
2mω
y,
X 1/2
β ∆I
qβ,α Hα,β ′ = i β ′ ∆I ω(−δβ,β ′ +1 + δβ,β ′ −1 ) (12.50)
α
2mω
El conmutador es entonces:
X 1/2
βω ∆I
(Hβ,α qα,β ′ − qβ,α Hα,β ′ ) = i ∆I (−δβ,β ′ +1 − δβ,β1′ ) (12.51)
α
2m
Según (12.43) y (12.51), el corchete de Poisson es:
1/2
Iω
[H, q]β−β ′ = − (δβ,β ′ +1 + δβ,β ′ −1 ) (12.52)
2m
que, como debe ser, coincide con la matriz de q̇.
12.3. Problemas mecánicos a la manera de Heisen-

berg
En su trabajo de julio de 1925 Heisenberg señala que la dinámica de un problema
en la vieja mecánica cuántica comprende dos aspectos:
(i) La integración de las ecuaciones de movimiento, ÿ + f (y) = 0.
(ii) La determinación
H de las constantes de movimiento a través de la cuantización
de la variable de acción, p dq = 2παh̄ = 2πI.
La condición (ii) se puede expresar en la forma:
I X
mẋ dx = 2πm xn (I) x−n (I) n2 ω(I) = 2πI (12.53)
n
siendo xn los coeficientes de Fourier de x. Como x es real, x−n = x⋆n .

Una forma más compacta de la condición (ii) es entonces:
X ∂
m n nω(I) |xn (I)|2 = 1 (12.54)
n
∂I
llamada en la vieja mecánica cuántica regla de suma de Kuhn-Thomas. La generalización

a varios grados de libertad es inmediata:
X ∂
m ~n · ~n · ~ω (I) |x~n (I)|2 = 1 (12.55)
~
n
∂ I~
La matriz de la forma (12.6) asociada con x es:

xα~ ,~α′ = xα~ −~α′ (~
α ∆I) (12.56)
X ∂ h i
m (~
α−α ~ ′) · α − α~′ ) · ω
(~ ~ (I) |xα~ ,~α′ (I)|2 = 1 (12.57)
′ α
~
∂ I~
Usando una expresión análoga a (12.41) podemos escribir también:

X
2m (~
α−α ~ ′ ).~ω (~
α ∆I) |xα~ ,~α′ |2 = ∆I (12.58)
α
~′
Notemos que la regla de suma de Thomas-Kuhn no es otra cosa que el corchete

de Poisson de x y p. De la relación general (12.43), y del hecho de ser x y p variables
canónicamente conjugadas, se sigue que:
X
(xβ,~
~ α pα ~ ′ − pβ,~
~ ,β ~ α xα ~ ′ ) = i ∆I δβ,
~ ,β ~β ~′ (12.59)
α
~
Teniendo en cuenta que:

pα~ β~ = mi(~ ~ ·ω
α − β) ~ α~ xα~ ,β~ ′ (12.60)
Las ecuaciones (12.59) y (12.60) nos dan, para β~ = β~ ′ , la relación (12.58).

Entonces según Heisenberg, la ecuación de movimiento ÿ + f (y) = 0 y la condición

sobre el conmutador de x y p dan lugar a un sistema de ecuaciones que determina
unı́vocamente las componentes de la matriz de x y los valores de energı́a del sistema.
Las fórmulas que hemos obtenido son idénticas a las de Heisenberg, reemplazando a ∆I
por h̄.
¿En dónde están entonces las diferencias de fondo entre las mecánicas cuántica y
clásica?:
(i) En la identificación de las matrices fα~ ,β~ con transiciones entre los estados cuánticos
caracterizados por α ~
~ y β.
(ii) En señalar que ∆I no puede ser arbitrariamente pequeño sino que toma el valor h̄,
o sea que I~ está necesariamente cuantizada.
(iii) En reemplazar a (~ α−α ~ ′) · ~
ω (~
α ∆I) ≈ (~ α−α ~ ′ ) · ~ω (~
α′ ∆I) por la frecuencia de Bohr
ωα~ ,~α′ = (Eα~ − Eα~ ′ )/h̄ asociada a la transición entre los estados cuantizados caracteriza-
dos por α ~ yα ~ ′ . Esto equivaldrı́a a asociar al “estado clásico α ~ ” la energı́a Eα~ = ∆I α
~ ·ω
~
de modo que (Eα~ − Eα~ ′ )/∆I = (~ α−α ~ ′ ) · ~ω serı́a un armónico. Esta asociación es acorde
con la regla de combinación de frecuencias de Bohr, pero no predice las energı́as correc-
tas, pues, por ejemplo, para un oscilador armónico deberı́an ser Eα = ∆I (α + 1/2)ω;
por esto Heisenberg propuso no asumir a priori una expresión para las ωα~ ,~α′ , sino más
bien obtenerlas como un resultado.
(iv) En señalar que debe existir un estado base del cual no puede salir el sistema emi-
tiendo radiación; xα0 ,α0 −1 = 0 si α0 caracteriza el estado base. Con sólo estas cuatro
condiciones el formalismo clásico desarrollado en este capı́tulo da lugar al formalismo de
la mecánica cuántica según Heisenberg. Las reflexiones acerca del álgebra de operadores
no conmutativos caben perfectamente dentro del esquema clásico.
Ejemplo 12.3.1 Resolver el oscilador armónico lineal en la mecánica cuántica de Heisen-

berg.5
La ecuación de movimiento ẍ + ω02 x = 0 conduce a una solución para los elementos

de la matriz de x de la forma:
xα,β cos(ωα,β t) (12.61)
donde los elementos de la matriz x̃ y las frecuencias ωα,β son cantidades a determinar.
La condición adicional (12.58) nos da:
X
2m ωα,α′ |xα,α′ |2 = h̄ (12.62)
α′
La ecuación de movimiento nos da:

2
(ωα,β − ω02 ) xα,β = 0 (12.63)
ωα,β están asociadas a las transiciones α → β:
h̄ωα,β = Eα − Eβ (12.64)
5 Véase, van der Waerden, Op. cit.
siendo Eα y Eβ las energı́as de los estados α y β. Esta ecuación nos dice que para cada
α debe existir al menos un β ′ para el cual xα,β ′ 6=0 . Para este β ′ , (12.63) nos dice que
necesariamente:
(Eα − Eβ ′ )2 = h̄2 ω02 (12.65)
Esta es una ecuación cuadrática en Eβ ′ , con las soluciones:
Eβ ′ = Eα ± h̄ω0 (12.66)
lo cual nos indica que hay dos β ′ para los cuales xα,β ′ 6= 0, que llamaremos β ′ y β ′′ .
Para éstos dos β ′ las frecuencias satisfacen la relación:
ωα,β ′ = −ωα,β ′′ (12.67)
Entonces (12.62) nos dice que:

2mωα,β ′ |xα,β ′ |2 − |xα,β ′′ |2 = h̄ (12.68)
Los elementos de la matriz energı́a son:

(p2 )α,β mω02 (x2 )α,β
Hα,β = +
2m 2
X pα,β ′ pβ,β ′ ω02 mxα,β ′ xβ ′ ,β

= + (12.69)
2m 2
β ′

X xα,β ′ xβ ′ ,β
Hα,β = m ω02 − ωα,β ′ ωβ ′ ,β (12.70)
2
′β
En particular para α = β tenemos:

Hα,α = mω02 |xα,β ′ |2 + |xα,β ′′ |2 (12.71)
Hay dos posibilidades, que β ′′ exista o que no exista. Si β ′′ no existe y ωβ ′ ,α = ω0 ,

2mω0 |xα,β ′ |2 = h̄ (12.72)
y de (12.71) se sigue que:

h̄ω0
Eα = Hα,α = mω02 |xα,β ′ |2 = (12.73)
2
Como Eα 6= Eβ si α 6= β, se sigue que hay a lo sumo un ı́ndice α = α0 para
el cual se cumple (12.73). Si tal α0 existe, podemos formar la secuencia de números
α0 , α1 , α2 , ...αk , αk+1 , ... tales que α′k = αk+1 y α′′k = αk−1 . Estos números describen
los estados para los cuales Ek+1 > Ek . Claramente, α′0 = α1 y α′′0 no existe. De (12.30)
podemos adelantar que αk+1 = αk + 1. Para k > 0, (12.71) y (12.68) nos dan:

Hαk ,αk = mω02 |xαk ,αk+1 |2 + |xαk ,αk−1 |2 (12.74)

h̄ = 2mω0 |xαk ,αk+1 |2 − |xαk ,αk−1 |2 (12.75)
La ecuación (12.75) es una fórmula de recurrencia que permite a partir de |xα0 ,α1 |2
obtener cualquier |xαk ,αk+1 |2 . Ası́ que, al usar |xα0 ,α1 |2 = h̄/(2mω0 ) y |xα0 ,α−1 |2 = 0:
h̄(k + 1)
|xαk ,αk+1 |2 = (12.76)
2mω0
También esto nos permite identificar la secuencia α0 , α1 , α2 , ... con los números
enteros 0, 1, 2, ... Entonces la relación de recurrencia nos dice que:
h̄(k + 1) h̄k
|xk,k+1 |2 = ; |xk,k−1 |2 = (12.77)
2mω0 2mω0
Por tanto (12.74) nos da, en vez del resultado clásico (12.32):

1
Ek = h̄ω0 k + (12.78)
2
Como puede verse, lo especı́fico del tratamiento cuántico de este problema estriba
en: (i) Tomar a ∆I como h̄. (ii) Tomar en vez de (α − α′ )ω0 a ωα,α′ = (Eα − Eα′ )/h̄.
(iii) Suponer la existencia de un estado base.
12.4. Ecuación de Hamilton-Jacobi y diagonalización

de la matriz hamiltoniana
Para un sistema múltiplemente periódico la matriz hamiltoniana clásica puede ob-
tenerse de los coeficientes de Fourier de la función hamiltoniana H(q, p). La ecuación de
Hamilton-Jacobi (sección 9.6), se caracteriza por definir la función de Hamilton carac-
terı́stica mediante la cual se realiza la transformación canónica que lleva a unas nuevas
veriables, donde todas las coordenadas son cı́clicas, esto es:
H(q, p) = H(I) ⇒ H α~ ,β~ = H(~
α ∆I) δα~ ,β~ (12.79)
como en la ecuación (12.32).
Entonces la transformación canónica buscada diagonaliza la matriz hamiltoniana,
cuyos elementos son Hα~ −β~ (~ α ∆I) = Hα~ ,β~ . Las cantidades H(~ α ∆I), donde α ~ recorre
todos los vectores l-dimensionales de componentes enteras, son los valores propios de la
matriz infinita Hα~ ,β~ , que se obtiene resolviendo la ecuación secular (12.27). Los vectores
propios de la matriz hamiltoniana son las cantidades gα~ ,~α′ , que según (12.11) realizan
la transformación de las variables angulares ϕν a las ϕν . O sea que las gα~ ,~α′ definen la
función de Hamilton caracterı́stica de la transformación canónica, para el tipo F3 , dada
por:
∂ ~I = − ∂ Σ(I, ϕ)
ϕ
~ =− Σ(I, ϕ) ; (12.80)
∂ I~ ∂ ~ϕ
Como gα~ ,~α′ (I) es:
I
1 ′ ~
~ α ·ϕ l ~
gα~ ,~α′ (I) = e−i~α.ϕ+i~ dϕ (12.81)
(2π)l

I
1 ∂ ′ ~
gα~ ,~α′ (I) = ei~α· ∂ I~ Σ(I,ϕ)+i~α ·ϕ dl ~ϕ (12.82)
(2π)l
Además, la fórmula inversa es:
" #
∂Σ X
α′ ·~
−i~ ϕ
i~
α· = ln gα~ ,~α′ e (12.83)
∂ I~ α
~′
Estas fórmulas muestran la conexión entre las transformaciones canónicas y las

matrices unitarias que realizan los cambios de representación de las matrices clásicas,
con clara correspondencia con la mecánica cuántica.
Ejemplo 12.4.1 Estudiar la diagonalización de la matriz hamiltoniana de un oscilador

armónico sometido a una fuerza constante.
Fı́sicamente el problema es muy simple porque el único efecto de la fuerza constante

es cambiar la posición de equilibrio y desplazar el valor de la energı́a sin alterar la
frecuencia de las oscilaciones. Sin embargo es ilustrativo de la conexión entre la solución
de la ecuación de Hamilton-Jacobi y la diagonalización de la matriz hamiltoniana.
Si H0 es el hamiltoniano del oscilador no perturbado, el hamiltoniano de este
problema será:
H = H0 + λx (12.84)
y en las variables acción-ángulo de H0 toma la forma:
1/2
2I
H = Iω + λ sen ϕ (12.85)
mω
Queremos pasar a las variables acción-ángulo I − ϕ del hamiltoniano H mediante
una transformación canónica. La ecuación de Hamilton-Jacobi del problema es, según
las fórmulas (9.286):
1/2
2I ∂Σ
Iω − λ sen −E (12.86)
mω ∂I
Entonces:

∂Σ mω 1/2 −1
ϕ=− = sen−1 λ (E − Iω) (12.87)
∂I 2I
Si llamamos A = λ21/2 /(mω)1/2 , y notamos que:
2 2
A ∂Σ A
E(I) = Iω − = −ω − (12.88)
2ω ∂ϕ 2ω
entonces la ecuación de Hamilton-Jacobi para Σ es:
2
∂Σ ωI 1/2 ∂Σ A
sen = + ωI −1/2 + I −1/2 (12.89)
∂I A ∂ϕ 2ω
Esta ecuación resulta complicada, razón por la cual desistiremos de la función

generatriz del tipo F3 .
Notemos que la función generatriz del tipo F3 para la transformación inversa se
obtiene cambiando en −F3 las variables I, ϕ por I, ϕ (ver sección 9.5). Entonces las
fórmulas para la transformación inversa son:
∂F3 (I, ϕ) ∂F3
ϕ= ; I= (12.90)
∂I ∂ϕ
que coinciden con las fórmulas de la transformación original mediante una función ge-
neratriz del tipo F2 .
F2 es solución a la ecuación:
1/2
∂F2 ∂F2
ω +A sen ϕ − E(I) = 0 (12.91)
∂ϕ ∂ϕ
o sea:
2 1/2
∂F2 A2 2 E A 2 Eω
I= = sen ϕ + − sen ϕ sen ϕ + 4 (12.92)
∂ϕ 2ω 2 ω ω A2
Notemos que:
∂ ∂Σ 1 1 sen ϕ
· = − (12.93)
∂ϕ ∂E ω ω (1 + 2mEω 2 λ−2 − cos2 ϕ)1/2
y en consecuencia:
" −1/2 #
∂Σ2 ϕ 1 −1 2mEω 2
= + sen cos ϕ 1 + (12.94)
∂E ω ω λ2
H
De la expresión para I, 2πI = I dϕ se deduce que:
λ2
E = Iω − (12.95)
2mω 2
de donde ω −1 dE/dI = 1, y, según (12.82) y (12.94), la matriz asociada a esta transfor-
mación, que es la inversa de gα,β , es:
I
1 ′ −1
Γα,α′ = ei(α−α )ϕ−iα sen (cos ϕ/C) dϕ (12.96)
2π
donde C = (1 + 2mEω 2 /λ2 )1/2 .
Notemos que:
−1
e−iα sen x
= e−iαπ/2 [−iUα (x) + Tα (x)] (12.97)
donde T y U son polinomios de Chevishev de primera y segunda clase respectivamente.
En consecuencia:
I cos ϕ
1 ′
Γα,α′ = ei(α −α) ϕ−i απ/2 Tα dϕ
2π C
I (12.98)
1 ′
cos ϕ
+ ei(α −α) ϕ−i(α+1)π/2 Uα dϕ
2π C
No es simple hallar una expresión general para la transformada de Fourier de

Tα (cos ϕ/C) y de Uα (cos ϕ/C). Aun conociendo la forma analı́tica de Γα,β , resulta difı́cil
obtener una expresión cerrada para las sumatorias infinitas en (12.12). Por esto lo más
cómodo es realizar los cálculos en forma numérica. En este caso es necesario truncar
las matrices para hacerlas finitas y proceder a realizar las integraciones mediante un
algoritmo como el de Gauss. Una vez obtenida la matriz Γ el proceso de diagonalización
es simple.
Como puede verse, el método para obtener la matriz gα~ ,β~ a partir de la ecuación de
Hamilton-Jacobi puede ser útil en problemas cuánticos realistas en que sea especialmente
difı́cil diagonalizar directamente la matriz hamiltoniana.
12.5. Teorı́a de perturbaciones con matrices clásicas

Veremos que las fórmulas de la teorı́a clásica de perturbaciones, de primero y se-
gundo orden, pueden escribirse en forma análoga a las correspondientes fórmulas de la
mecánica cuántica para las correcciones a la energı́a.
Perturbaciones de primer orden. Para el caso no degenerado la corrección de

primer orden a la energı́a está dada por la fórmula (11.27):
H (1) (I) = hH1 (ϕ0 , I)i (12.99)
Si la función H1 se expresa como una serie de Fourier, la corrección de primer
orden está determinada por los elementos diagonales de la matriz correspondiente:
H (1) (~
α ∆I) = H1 α~ ,~α (12.100)
que corresponde en mecánica cuántica con h~ α|H1 |~
αi.
Para el caso degenerado, antes de hallar la corrección de primer orden, es necesario
encontrar las variables acción-ángulo “correctas” o “estabilizadas” en la aproximación
cero. Para ello es necesario buscar entre los posibles conjuntos de variables acción-ángu-
lo degeneradas Iσ0 − ϕ0σ de orden cero, aquel con el cual la perturbación no depende de
las variables angulares. A su vez esto se consigue resolviendo la ecuación de Hamilton-
Jacobi (11.110). En términos de matrices esto se logra diagonalizando la matriz formada
con los coeficientes de Fourier de la perturbación respecto a las variables degeneradas.
Simultáneamente se hallan los valores propios perturbados al primer orden y la transfor-
mación canónica que lleva a las variables “correctas” de orden cero, mediante la fórmula:
h i
(1)
det H1 ~σ,σ~′ − H~σ δ~σ ,~σ′ = 0 (12.101)
donde ~σ y ~σ ′ son vectores de l − s componentes enteras, y:

XX (1)
g~σ+,~σ′ H~σ′ ,~σ′′ g~σ′′ ,~τ = H~σ δ~σ ,~τ (12.102)
~
σ′ ~
σ′′
En mecánica cuántica, la matriz que diagonaliza la perturbación proporciona los

coeficientes con los cuales se forman las funciones de onda exactas de la aproximación
cero como combinaciones lineales de las funciones de onda degeneradas. Ver la sección
§39 del libro de mecánica cuántica de Landau-Lifshitz, Op. cit.
Perturbaciones de segundo orden. Según la fórmula (11.40), la corrección de

segundo orden a la energı́a está dada por:
1X |Aα~ ,β~ |2
H (2) (~
α ∆I) = − (~ ~ · ∂
α − β) (12.103)
2
~
∂ I~ (~
α − β)~ · ~ω
β6=α
~
donde Aα~ ,β~ está dada por el coeficiente de Fourier de la expansión de H1 en las variables
acción-ángulo no perturbadas. Tanto ω ~ como A ~ tienen como argumento a I~ = α
α
~ ,β ~ ∆I.
Como en (12.41), podemos escribir:
∆I |Aα~ ,β~ |2
(~ ~ · ∂
α − β) =
2 ∂ I~ (~
α − β)~ ·ω ~

|Aα~ ,β~ |2 |Aα~ ,β~ |2
− (12.104)
(~α − β) ~ · ~ω (~
α − ~ · ~ω
β)
α
~ ∆I (~ ~ ∆I/2
α+β)
El primer término de (12.104) cambia de signo al cambiar a α~ − β~ por β ~−α ~ . Por

tanto en la sumatoria (12.103) las contribuciones provenientes del primer término de
(12.104) se cancelan. En el denominador del segundo término de (12.104), ~ω está evaluada
en (~ ~ ∆I/2. Si reemplazamos al denominador de la siguiente manera:
α + β)
" #
(~
α + ~ ∆I
β)
(~ ~ ·~
α − β) ω →α ~ · ~ω(~ ~ · ~ω (β
α ∆I) − β ~ ∆I) (12.105)
2
cometemos un error del orden de |(~ ~ ∆I|2 en la expresión para H (2) , con lo cual
α − β)
llegamos a la fórmula:
X |Aα~ ,β~ |2
H (2) (~
α ∆I) = (12.106)
~ =α ∆I α
~ ·ω α ∆I) − ∆I β~ · ~ω(β
~ (~ ~ ∆I)
β6 ~
Si llamamos:
α
~ ∆I · ~
ω (~
α ∆I) = Eα~ ′ (12.107)
La ecuación (12.103) puede escribirse con un error del orden de |(~ ~ ∆I|2 como:
α − β)
X |Aα~ ,β~ |2
H (2) (~
α ∆I) = ′
(12.108)
Eα~ − Eβ~
~
β
que coincide formalmente con la fórmula cuántica de la teorı́a de perturbaciones de

segundo orden.
13
Correspondencia con la mecánica cuántica
de Schrödinger
Este capı́tulo trata de mostrar la conexión de los trabajos de Hamilton y Jacobi

con la formulación de Schrödinger de la mecánica cuántica. Se hará énfasis en la relación
existente entre la acción principal de Hamilton y la fase de la función de onda, y entre
las soluciones de la ecuación de Liouville y la amplitud de la función de onda.
Al pasar de la mecánica clásica a la formulación de Schrödinger son necesarios
cambios conceptuales más drásticos respecto a la formulación de Heisenberg, pues se
requiere postular la existencia de comportamientos ondulatorios.
También presentaremos algunos desarrollos modernos de las ideas de Einstein,
Bohr y Sommerfeld acerca de la cuantización de un sistema clásico, debidos a Brillouin,
Maslov y Keller. Finalmente obtendremos las fórmulas de la aproximación de W.K.B.
13.1. Ideas de Hamilton acerca de las transformacio-

nes canónicas
Hamilton presentó en 1824 un trabajo a la Academia Irlandesa de Ciencias acerca
de la conexión entre la dinámica y la óptica. Desde el punto de vista moderno, tal
formalismo presenta una conexión entre la dinámica y el lı́mite clásico de la mecánica
ondulatoria, y no es aplicable a la óptica por las dificultades resultantes de ser cero la
masa del fotón.
Según el principio de Fermat las ecuaciones paramétricas de la trayectoria de un
rayo de luz, x(l), y(l), z(l), son tales que la siguiente integral es una extremal:
Z
n(~r(l)) dl (13.1)
siendo n el ı́ndice de refracción del medio en el punto ~r. El principio de mı́nima acción
aplicado a una partı́cula sometida a un potencial V , ecuación (9.49), expresa que:
Z
[E − V (~r)]1/2 dl (13.2)
567
tiene un valor estacionario para la trayectoria real. En los dos casos se deben tomar va-
riaciones “∆”. La trayectoria de una partı́cula y la de un rayo de luz coinciden haciendo:
n(~r) = A [E − V (~r)]1/2 (13.3)
En un medio inhomogéneo y anisotrópico n depende no sólo de la posición sino de
la dirección de los rayos, esto es, de ~r y ~r˙ .
Lo anterior permitirı́a asociar propiedades corpusculares a la luz. Hamilton se pro-
puso elaborar esta conexión dentro de un modelo ondulatorio de la luz teniendo en cuenta
que la relación (13.3) es válida independientemente del modelo usado. Es natural partir
del concepto de “frente de ondas”, introducido por Huygens en 1690. Cada punto ~r de
un frente de ondas en el tiempo t genera una onda secundaria que alcanzará otro punto
~r ′ del frente de ondas en un tiempo posterior t′ . El tiempo empleado por la luz en ir de
~r a ~r ′ dependerá solamente de ~r y ~r ′ . El lugar geométrico de los puntos alcanzados por
la luz en el tiempo t′ es una superficie de ondas secundarias, definida por una función
Σ(~r, ~r ′ ), donde ~r hace de parámetro, mediante la fórmula:
Σ(~r, ~r ′ ) = t − t′ (13.4)
Σ describe el camino óptico entre ~r y ~r ′ y fue llamada por Hamilton función carac-
terı́stica del medio. Según el principio de Huygens, la envolvente de las ondas secundarias
en el tiempo t′ es el frente S ′ que se ha propagado en el espacio, como se ilustra en la
figura 13.1.
N
α′′
α′ r″ T
α r′
Σ′
r
Σ
S″
S′
S
Figura 13.1 Propagación en el espacio de la envolvente S
Denotemos por α ~ = (α1 , α2 , α3 ) a los cosenos directores de la normal a S en el

punto ~r y por α ~ ′ a los cosenos directores de la normal a S ′ en el punto ~r ′ . Decimos que
~r ′ corresponde con ~r si la onda secundaria que emerge de ~r toca a la envolvente S ′ en
~r ′ . La lı́nea descrita por los vectores α ~ ′, α
~, α ~ ′′ , ..., que llamamos N , es ortogonal a los
Corespondencia con la mecánica cuántica de Schrödinger / 569
frentes de onda. Como S ′ es la envolvente de las superficies Σ correspondientes a los

puntos de S, las superficies Σ también son ortogonales a la lı́nea N en los puntos ~r, ~r ′ ,
~r ′′ , ...
Si denotamos por d~r ′ a un vector tangente a la superficie S ′ en ~r ′ , se cumple que:
∂Σ(~r, ~r ′ )
· d~r ′ = 0 (13.5)
∂~r ′
Como α ~ ′ son los cosenos directores de N en el punto ~r ′ , también serán ortogonales
′
a d~r . Se sigue entonces que:

∂Σ(~r, ~r ′ ) ′ ′
− λ α
~ · d~r ′ = 0 (13.6)
∂~r ′
donde λ′ es cierta función de ~r ′ . La ecuación (13.6) implica que:
1 ∂Σ 1 ∂Σ 1 ∂Σ
= ′ = ′ (13.7)
α′1 ∂x′ α2 ∂y ′ α3 ∂z ′
Similarmente, en el punto ~r se debe cumplir:
1 ∂Σ 1 ∂Σ 1 ∂Σ
= = (13.8)
α1 ∂x α2 ∂y α3 ∂z
Además:
α′1 2 + α′2 2 + α′3 2 = 1 (13.9)
Las ecuaciones (13.4) y (13.7) a (13.9) permiten expresar las seis cantidades (x′ ,
y , z , α′1 , α′2 , α′3 ) en términos de (x, y, z, α1 , α2 , α3 ).
′ ′
Entonces, dada una función caracterı́stica del medio Σ, las seis ecuaciones (13.4)
y (13.7) a (13.9) describen unı́vocamente la lı́nea de las normales N en el medio óptico
anisotrópico. Es necesario aclarar que la lı́nea N no necesariamente coincide con la lı́nea
T de un rayo luminoso que pasa por ~r; esta coincidencia ocurre solamente en un medio
óptico isotrópico, en el cual los vectores ~r˙ , ~r˙ ′ , ~r˙ ′′ , ... son respectivamente paralelos a los
vectores α ~, α~ ′, α~ ′′ , ...
La función Σ determina una transformación en el espacio que cambia cualquier
superficie S en una nueva S ′ . Si dos superficies Σ y S ′ se tocan en un punto ~r ′ , entonces
las correspondientes superficies transformadas Σ′ y S ′′ se tocan en un punto ~r ′′ corres-
pondiente a ~r ′ . Sophus Lie por esta razón llama a las transformaciones (~r, α ~ ) → (~r ′ , α
~ ′)
1
transformaciones de contacto. Entonces cada función Σ define una transformación de
contacto, que transforma un frente de ondas S en el frente de ondas S ′ envolvente de
todas las ondas secundarias emergentes de S, en el intervalo de tiempo t′ − t. De (13.7)
y (13.8) se sigue que:
∂Σ(~r, ~r ′ ) ∂Σ(~r, ~r ′ )
= λ~
α; = λ′ α
~′ (13.10)
∂~r ∂~r ′
1 En
dinámica hamiltoniana se usa el nombre de transformaciones canónicas para designar a estas
transformaciones.
Entonces bajo desplazamientos arbitrarios d~r y d~r ′ , Σ cambia de valor en:

α · d~r + λ′ α
dΣ = λ~ ~ ′ · d~r ′ (13.11)
De acuerdo con (13.4), dΣ = dt′ − dt. Si tomamos el punto ~r fijo y consideramos
dos frentes de onda próximos, en los puntos ~r ′ y ~r ′ + d~r ′ , entonces dt′ será la diferencia
de tiempo entre esos frentes de onda, dada por:
dl′ ′
dt′ = n (13.12)
c
donde c es la velocidad de la luz en el vacı́o, dl′ la distancia normal entre los dos frentes
de onda finales y n′ es el ı́ndice de refracción del medio en el punto ~r ′ en la dirección α′
normal a S ′ .
De (13.11) y (13.12) se sigue entonces:
dl′ ′
n = λ′ α
~ ′ · d~r ′ (13.13)
c
Como para el desplazamiento de ~r ′ que consideramos se cumple que d~r ′ = α
~ ′ dl′ ,
′ ′ ′
podemos escribir dl = α
~ .d~r . Obtenemos entonces el resultado:
n′ n
λ′ = ; λ=− (13.14)
c c
donde la segunda expresión se sigue de argumentos similares, tomando a ~r ′ fijo y variando
el punto inicial ~r. En conclusión:
n′ ′ n
dΣ = ~ · d~r ′ − α
α ~ · d~r (13.15)
c c
donde n′ y n son funciones respectivamente de (~r ′ , α ~ ′ ) y (~r, α
~ ), o equivalentemente de
(~r ′ , ~r˙ ′ ) y (~r, ~r˙ ), porque debe existir una relación definida entre α ~ y ~r˙ , y α
~ ′ y ~r˙ ′ .
También dΣ puede escribirse como:
p ′ · d~r ′ − p~ · d~r
dΣ = ~ (13.16)
p y p~ ′ tienen dimensiones de T L−1 y su magnitud es menor en los puntos
los vectores ~
donde la velocidad de la luz es mayor y viceversa.
Si tomamos ahora los tiempos t y t′ infinitesimalmente próximos, también lo serán
los puntos ~r y ~r ′ , lo mismo que α ~ ′ , y n y n′ . Decimos en este caso que la transfor-
~ yα
mación de contacto es infinitesimal:
~r ′ = ~r + ~r˙ ∆t ; ~ ′ = p~ + ~p˙ ∆t
p (13.17)
Como Σ(~r, ~r) = 0, también se cumple que, al orden más bajo en ∆t:

∂Σ(~r, ~r ′ )
′
Σ(~r, ~r ) = · ~r˙ ∆t (13.18)
∂~r ′ ~r ′ =~r
Definimos la función M (~r, ~r ′ ) como:

∂Σ(~r, ~r ′ ) ˙
M (~r, ~r˙ ) = · ~
r ˙
′ = ~p · ~r (13.19)
∂~r ′ ~r =~
r

∂M (~r, ~r˙ ) ∂Σ(~r, ~r ′ )
= = ~p (13.20)
∂~r˙ ∂~r ′ ~r ′ =~r
Según (13.18) y (13.19), cuando ~r y ~r ′ son infinitesimalmente cercanos:
Σ(~r, ~r ′ ) = M (~r, ~r˙ ) ∆t (13.21)

Por tanto, para una separación finita entre ~r y ~r ′ se cumple:
Z t′ Z ~r ′
′
Σ(~r, ~r ) = ˙
M (~r, ~r) dt = ~p · d~r (13.22)
t ~
r
La longitud del camino óptico entre ~r y ~r ′ también puede escribirse, usando (13.15)
y (13.16), como:
Z ~r ′ Z ′
′ n 1 ~r
Σ(~r, ~r ) = α
~ · d~r = n dl (13.23)
~
r c c ~r
Entonces, el principio de Fermat, (13.1), equivale a la condición de que Σ sea una
extremal. La condición ∆Σ = 0 determina la forma de la lı́nea de los rayos T de la figura
13.1.
Comparando a (13.23) con (13.2) vemos que M es proporcional a la energı́a cinética
del problema mecánico equivalente.
La transformación de contacto (13.10), cuya función generatriz es Σ, puede expre-
sarse como una transformación canónica libre de primera clase:
∂Σ(~r, ~r ′ ) ∂Σ(~r, ~r ′ )
p~ = − ; ~′ =
p (13.24)
∂~r ∂~r ′
donde (~r ′ , p~ ′ ) son las “viejas” variables canónicas y (~r, p~) las “nuevas”.
Comparando con los resultados de la sección 9.3, fórmula (9.44), encontramos que
Σ coincide formalmente con la acción de Lagrange y M con ~p · ~q. Sin embargo hay una
discrepancia dimensional a través de un factor constante B con dimensiones de energı́a.
O sea que BΣ es la acción de Lagrange y B~ p es el momento mecánico.
La acción de Lagrange BΣ obedece la ecuación de Hamilton-Jacobi independiente
del tiempo, que para una partı́cula de masa m en un potencial V es:
2
1 ∂Σ V E
+ 2 = 2 (13.25)
2m ∂~r B B
Usando la conexión dada por (13.3), podemos escribir a (13.25) como:
2
∂Σ 2m 1
= 2 2 n2 = 2 n2 (13.26)
∂~r A B c
donde c es una constante con dimensiones de velocidad:
AB
c= (13.27)
(2m)1/2
Formalmente (13.26) es la ecuación de la eiconal de la óptica,2 que permite encon-

trar a Σ si se conocen las propiedades ópticas del medio expresadas a través de n.
Nótese que la relación (13.27) aparentemente no permite el concepto de fotón enten-
dido como una partı́cula de masa cero. Sin embargo el formalismo resulta perfectamente
adaptado a la descripción de propiedades ondulatorias de partı́culas de masa diferente
de cero.
Podemos concluir que a la acción de Lagrange de un sistema mecánico se le puede
asociar la onda secundaria emergente de un punto en cierto movimiento de propagación
de ondas. Este resultado sirvió a Schrödinger para hallar la conexión entre la mecánica
y la óptica clásicas por una parte, y la mecánica ondulatoria (mecánica cuántica) por
otra. Sin embargo, la ecuación de la eiconal (13.26) no coincide con la ecuación de ondas
más que en el lı́mite asintótico de pequeñas longitudes de onda, en el cual la óptica
ondulatoria coincide con la óptica geométrica.
Frecuencia y vector de propagación. Para una onda plana monocromática la

amplitud tiene la forma:
~
C = aei(k·~r−ωt+α) (13.28)
y para una onda arbitraria:
C = aeiϕ (13.29)
donde ϕ es la eiconal que obedece la ecuación (13.26) sólo en el lı́mite de ondas cortas.
Desarrollando a ϕ en potencias de ~r y t, para ~r y t pequeños se obtiene:
∂ϕ ∂ϕ
ϕ=α+t + ~r · (13.30)
∂t ∂~r
Como es de esperarse, el frente de ondas emergente de un punto es en las cercanı́as
del mismo casi plano, con:
~k = ∂ϕ ; ω=−
∂ϕ
(13.31)
∂~r ∂t
Por otra parte, expandiendo a S cerca a ~r = 0 obtenemos:
∂Σ
S = −Et + BΣ ≈ −Et + B~r · = −Et + B~r · p~ (13.32)
∂~r
Si admitimos que S = Dϕ, donde D es otra constante, encontramos que p~ es
proporcional a ~k y E proporcional a ω:
D~
E = Dω ; p
~= k (13.33)
B
La función M , según (13.19) puede escribirse como:
n(~r, α
~)
M (~r, ~r˙ ) = ~ · ~r˙
α (13.34)
c
2 Eiconal viene del griego, icono = imagen. La función eiconal permite localizar imágenes.
y se denomina la indicatriz del medio óptico en el punto ~r. La velocidad del frente de
ondas en el punto ~r en la dirección α
~ tiene magnitud v(~r, α
~ ) = c/n(~r, α
~ ). Por tanto:
~ · ~r˙
α α
~ ~v (~r, α
~)
M (~r, ~r˙ ) = ; p~ = = (13.35)
v(~r, α
~) v(~r, α
~) v(~r, α~ )2
Por esto el vector p~, que es proporcional a ~k cuando la onda es plana monocromáti-
ca, se llama el vector de lentitud normal del frente de ondas en el punto ~r en la dirección
α
~.
Los vectores ~r˙ y ~p. Exploremos la relación entre los vectores ~r y α ~ en un punto
dado ~r. Para ello usamos la noción matemática de homotecia, o sea la transformación de
cambio de escala. Si realizamos a la superficie M (~r, ~r˙ ) una transformación de homotecia
con parámetro ǫ respecto a ~r˙ , en un punto ~r, obtenemos:
M (~r, ǫ~r˙ ) = ǫ~
p · ~r˙ (13.36)
al notar que p~ depende de la dirección de ~r pero no de su magnitud.

Por otra parte, consideremos el desplazamiento del frente de ondas S durante un
tiempo infinitesimal ǫ (véase figura 13.2). La onda secundaria que emerge del punto ~r,
en el tiempo ǫ, será, según (13.18):
Σ(~r, ~r ′ ) = p~ · ~r˙ ǫ (13.37)
Comparando a (13.36) y (13.37) se sigue que Σ y M son iguales al orden de ǫ2 .

Cuando el tiempo entre S(t) y S(t + ǫ) es infinitesimal, la onda secundaria emergente
de ~r que toca a S(t + ǫ) y la indicatriz del medio óptico en ~r son homotéticas. Si ahora
hacemos tender ǫ a cero, obtenemos que en cada punto ~r los vectores α ~ y ~r tienen una
relación bien definida.
La dirección del plano tangente a la indicatriz en ~r˙ se llama conjugada de la
dirección de ~r˙ . O sea que ~r˙ y ~
p son dos vectores conjugados en cada punto ~r. En general
~r˙ no es perpendicular al plano tangente a la indicatriz en ~r˙ . Si el medio es isotrópico, en
cada punto ~r la indicatriz será una superficie esférica; en el caso contrario n dependerá de
~r y ~r˙ , con lo cual Σ y p~ dependerán igualmente de ~r˙ , dando lugar a que M no sea esférica
(véase figura 13.2).
13.2. Función de distribución de probabilidades

Para una partı́cula, la contraparte cuántica de la proyección de un toroide invarian-
te sobre el espacio tridimensional es |ψ|2 , siendo ψ una función propia de tres operadores
que conmutan (para un problema de fuerzas centrales, por ejemplo, tales operadores pue-
den ser H, l2 y lz ). La densidad que describe el ensamble de trayectorias sobre el toroide
invariante es ρ, que satisface la ecuación de Liouville (sección 4.8):
∂ρ
+ [ρ, H] = 0 (13.38)
∂t
Punto
de tangencia
p
r
Σ(r, r ′) Plano tangente
a la indicatriz en r
M(r, r ′)
S(t) S(t + ε)
Figura 13.2 Desplazamiento del frente de ondas S durante un tiempo infinitesimal ǫ.
Como H no depende de las variables angulares, esta ecuación toma la forma,

∂ρ ∂ρ ∂ρ ∂ρ
+ ω1 + ω2 + ω3 =0 (13.39)
∂t ∂ϕ1 ∂ϕ2 ∂ϕ3
Como las ων son las “velocidades” sobre el toroide, esta ecuación tiene la forma de
una ecuación de continuidad para la densidad ρ:
3
∂ρ X ∂
+ (ων ρ) = 0 (13.40)
∂t ν=1 ∂ϕν
Cuando el sistema es estacionario, t no aparece en ρ explı́citamente y por tanto:

X3
∂
(ων ρ) = 0 (13.41)
ν=1
∂ϕ ν
Según esta expresión, el flujo de probabilidad sobre el toroide no tiene divergencia.

Por tanto, al aplicar el teorema de Gauss a un tubo de trayectorias:
Z
(~
ω ρ) · d~σ = 0 (13.42)
Como consecuencia, conociendo a ρ en un punto se puede calcular a ρ en cualquier

otro punto de la misma trayectoria:
dσ0
ρω = ρ0 ω (13.43)
dσ
donde ω = |~ ω |, y dσ0 es el área de cruce normal al tubo de caracterı́sticas en el punto
(~
p0 , ~r0 ). Realmente (13.43) vale en el lı́mite cuando dσ0 tiende a cero, en cuyo caso
dσ/dσ0 denota el jacobiano de la aplicación de los puntos de una sección de cruce en

otra por medio de las trayectorias:

p~0 , ~r0
ρ(~
p, ~r) = ρ(~
p0 , ~r0 ) J (13.44)
p~, ~r
Una posible solución de (13.41) es una función arbitraria de las variables de acción.
Sin embargo no es la más interesante.
Función de distribución en el espacio de configuración. Si por algún proce-

dimiento se obtiene una ρ particular, entonces la densidad en el espacio de configuración
x − y − z será:
Z
Q(~r) = ρ(~ p, ~r) d3 p~ (13.45)
En el espacio de configuración hay igualmente un flujo de probabilidad, descrito

por la ecuación de continuidad para Q:
∂Q ∂
+ · (~r˙ Q) = 0 (13.46)
∂t ∂~r
donde ~r˙ = ∂H/∂~p. Cuando Q no depende explı́citamente del tiempo, obedece ecuaciones
análogas a (13.41) y (13.42). La ecuación análoga a (13.43) es:
dA0
Qv = Q0 v0 (13.47)
dA
siendo dA un elemento de área en el espacio ordinario, y v = |~r˙ |. Si se conoce a Q sobre
una superficie dA0 que corta un tubo de trayectorias caracterı́sticas en el espacio de
configuración, (13.47) permite hallar a Q en cualquier otra superficie que corte el mismo
tubo de trayectorias. El formalismo de las variables acción-ángulo permite encontrar la
densidad de probabilidad Q(~r), en una forma alterna a (13.47) que hace más transparente
la conexión con Σ y con la proyección del ensamble de trayectorias en el espacio de fases
sobre el espacio de configuración.
Como en ~r(I,~ ϕ
~ ) las I~ son constantes, se sigue que las posibles posiciones de la
partı́cula en el espacio de configuración, ~r, están determinadas por las ϕ~.
Entonces el promedio de una función de ~r sobre el toroide invariante puede expre-
sarse como un promedio sobre el espacio de configuración. En efecto:
I
1 ~ ϕ
hf (~r)i = f (~r(I, ~ )) d3 ϕ
~ (13.48)
(2π)3
~ ϕ
La función ~r(I, ~ ), con I~ = constante, puede interpretarse como un cambio de
coordenadas de ϕ ~ a ~r. Por tanto (13.48) puede escribirse como:
Z
1 ϕ~
hf (~r)i = 3
f (~
r ) J d3~r (13.49)
(2π) ~r
En términos de Q este mismo promedio es:

Z
hf (~r)i = Q(~r) f (~r) d3~r (13.50)
de donde concluimos que Q es esencialmente el jacobiano de la transformación de ϕ

~ a ~r
con I~ fijo:
−1
3 ϕ~ ~r
(2π) Q(~r) = J =J (13.51)
~r ϕ~
Podemos igualmente hallar la función de distribución en el espacio de los momentos:

ϕ~
(2π)3 Qp (~
p) = J (13.52)
p~
El lugar geométrico de los puntos para los cuales Q = ∞ se denomina “superficie
cáustica”. Para esos puntos, o bien v = 0, o bien las trayectorias se cruzan haciendo
que dA = 0. Si la sección de cruce se convierte un una lı́nea, diremos que m1 = 1 y si
se convierte en un punto, que m1 = 2. El número de veces que un momento canónico
cambie de signo en alguna cáustica lo notaremos m2 . El número m = m1 +m2 determina
la fase de la función de onda semiclásica construida con Q y Σ. La fórmula (13.51)
permite también interpretar las cáusticas como el lugar geométrico de las singularidades
de la aplicación del espacio de fases sobre el espacio de configuración ϕ ~ → ~r. Tales
singularidades se denominan lagrangianas.
Ejemplo 13.2.1 Hallar la función Q para el problema de Kepler en coordenadas esféricas.
En este caso Ir , Iθ e Iϕ son constantes. De las fórmulas que expresan a r, θ y ϕ en
términos de las variables angulares ϕr , ϕθ y ϕϕ , dadas en la sección 10.4, se sigue que:
1 ∂ϕr ∂ϕθ ∂ϕϕ
(2π)3 Q(~r) = (13.53)
r2 sen θ ∂r ∂θ ∂ϕ
De la ecuación (10.192) se sigue:
∂ϕr I 1
= 2 (13.54)
∂r a pr
La separación de variables en la ecuación de Hamilton-Jacobi para el problema
conduce a:
~ r, θ, ϕ) = Σr (Ir , Iθ , Iϕ , r) + Σθ (Iθ , Iϕ , θ) + Σϕ (Iϕ , ϕ)
Σ(I, (13.55)
de donde se sigue:
∂ϕθ ∂pθ ∂ϕϕ ∂pϕ
= ; = (13.56)
∂θ ∂Iθ ∂ϕ ∂Iϕ
Como pθ y pϕ están dados por:
lz2
p2θ = l2 − ; pϕ = lz (13.57)
sen2 θ
obtenemos:
∂ϕθ l ∂ϕϕ
= ; =1 (13.58)
∂θ pθ ∂ϕ
De donde obtenemos finalmente:
mk 1
Q(~r) = (1 − ǫ2 )1/2 2 (13.59)
(2π)3 a r sen θ pr pθ
Esta es la densidad de probabilidad para un ensamble de sistemas con los mismos
valores de E, l, lz , donde cada sistema posee un valor distinto de las ϕν . La región
descrita por Q(~r) se obtiene también a partir de una órbita individual mediante estas tres
operaciones: primero, dejando la órbita fija se toma el conjunto de todas las posiciones
de la partı́cula sobre la misma; segundo, dejando fijo el plano de la órbita, se toma el
conjunto de puntos del plano obtenido al rotar el anterior conjunto alrededor del foco,
obteniéndose ası́ una corona sobre el plano de la órbita; finalmente, se toma el conjunto de
puntos del espacio obtenido al rotar la corona alrededor del eje z. La región ası́ obtenida
resulta ser un elipsoide de revolución con ejes de longitudes rmáx y rmáx cos θmı́n , colocado
con el eje menor sobre el eje z, y que además posee en el centro un agujero elipsoidal con
ejes de longitudes rmı́n y rmı́n cos θmı́n . Q(~r) vale cero fuera del elipsoide y dentro del
agujero, es infinita sobre las superficies de los elipsoides, y en los demás puntos está dada
por (13.59). Nótese que los elipsoides interior y exterior son las superficies cáusticas. La
región que hemos descrito es, para el caso del átomo de hidrógeno, el lı́mite clásico de la
densidad de probabilidad cuántica |ψnlm |2 . Vemos que no presenta los nodos angulares
caracterı́sticos de |Ylm |2 , ni los nodos de la densidad de probabilidad radial Rnl 2
(r).
Además, la densidad de probabilidad cuántica no es cero para r mayor que rmáx ni para
r menor que rmı́n , aunque decae exponencialmente en estas regiones, y tampoco presenta
superficies cáusticas.
Ejemplo 13.2.2 Estudiar la función de distribución en el caso lz = l = 0. Comparar con

la correspondiente densidad cuántica para el átomo de hidrógeno.
En este caso rmı́n = 0, las órbitas son rectilı́neas y la intersección del toroide
invariante con el espacio de configuración es una esfera. Q(r) es cero para r > 2a,
infinito en r = 0 y r = 2a, y en los demás puntos está dada por:
1
Q(r) = (13.60)
(2π)2 ar(2ar − r2 )1/2
Esta expresión no se obtiene directamente de (13.59) porque para l = 0, pθ no
está definido. En (13.53), ∂ϕθ /∂θ es indeterminada pero hemos asumido que es una
constante que se halla por normalización.
Q(r) es isotrópica y corresponde a los estados s de la mecánica cuántica. Q(r)
diverge en r = 0 y r = 2a, que son los puntos de retorno, y tiene un mı́nimo en
r = 3a/2. El valor medio de r calculado con esta Q es 3a/2 y coincide exactamente con
el valor medio cuántico. Si bien en este caso no se cumplen las condiciones de validez de la
aproximación clásica,3 el problema ilustra la correspondencia entre las dos descripciones.
3 Véase la sección 49 del libro de Mecánica cuántica de Landau-Lifshitz, Op. cit.
1 2πϕ21s
2πQr
1 2
2
Figura 13.3 Función de distribución 2πQ(r) en el caso lz = l = 0 y densidad cuántica 2πψ1s
para el átomo de hidrógeno
En la figura 13.3, la curva discontinua corresponde a la distribución en mecánica

cuántica para el estado 1s del átomo de hidrógeno, que es exponencial. Las unidades
son atómicas. Como puede verse, la mayor discrepancia se presenta cerca al punto de
retorno r = 0 y a la superficie cáustica r = 2, donde la partı́cula tiene energı́a cinética
muy pequeña, estando por tanto allı́ más expuesta a los efectos de tipo cuántico.
La distribución clásica tiene la forma de una esfera con densidad que varı́a radial-
mente, de radio 2a, en tanto que la distribución en mecánica cuántica decae exponen-
cialmente y existe para r entre 0 y 2a, ası́ como entre 2a e ∞.
La densidad en el espacio de momentos se halla fácilmente de la relación Qr r2 dr
= Qp p2 dp. En unidades atómicas el resultado es:
1 1
Qp (p) = (13.61)
2π 2 p2 (1 + p2 )2
El resultado cuántico es:4

8 1
ϕ21s (p) = (13.62)
π 2 (1 + p2 )4
Ejemplo 13.2.3 Demostrar que la función de distribución Q(r) definida por (13.51) sa-
tisface la ecuación de continuidad (13.46).
En este caso Q no depende explı́citamente del tiempo. El jacobiano está dado por:

ϕ~ ∂ϕλ ∂ϕσ ∂ϕρ
J = ǫλσρ (13.63)
~r ∂x ∂y ∂z
4 Véase la sección 36 del libro de Landau-Lifshitz, Op. cit.
donde ǫλσρ es el tensor de Levi-Civita. Por otra parte la velocidad tiene la expresión:
X ∂~r
~r˙ = ωµ (13.64)
µ
∂ϕµ
Entonces (convenio de suma):

∂ ∂ ∂xi ∂ϕλ ∂ϕµ ∂ϕρ
(ẋi J) = ωµ ǫλσρ (13.65)
∂xi ∂xi ∂ϕµ ∂x ∂y ∂z
ésta expresión es nula porque:
∂ 2 xi ∂ ∂xi
= =0 (13.66)
∂xi ∂ϕµ ∂ϕµ ∂xi
y,
∂xi ∂ 2 ϕρ ∂ ∂ϕρ ∂
= = δµρ = 0 (13.67)
∂ϕµ ∂xi ∂xi ∂ϕµ ∂xj ∂xi
Ejemplo 13.2.4 Expresar la función de distribución Q(~r) en términos de la acción de
Lagrange Σ.
Recordando que:
~ ~r)
∂Σ(I,
ϕν = (13.68)
∂Iν
se sigue de (13.63) que:
∂2Σ ∂2Σ ∂2Σ
(2π)3 Q(~r) = ǫλσρ (13.69)
∂x∂Iλ ∂y∂Iσ ∂z∂Iρ
~ ~r),
Se sigue entonces que a cada solución de la ecuación de Hamilton-Jacobi, Σ(I,
le corresponde una función de distribución. No es necesario resolver por separado la
ecuación de continuidad en el espacio de configuración. En otras palabras, los campos
~ ~r) y Q(I,
Σ(I, ~ ~r) no son independientes. En mecánica cuántica esto implicarı́a que la
función de onda compleja queda determinada simplemente por una función real.
Relación con la teorı́a ergódica y con el teorema K.A.M. Si el sistema

es no degenerado y asumimos que los efectos cuánticos son una perturbación pequeña,
sabemos que los toroides invariantes han de resultar ligeramente distorsionados. Enton-
ces el problema cuántico no difiere esencialmente del clásico. Como las frecuencias son
inconmensurables la trayectoria clásica, cuando t → ∞, llena completamente el toroide
y se cumple que el promedio temporal de una variable dinámica coincide con el promedio
tomado sobre las coordenadas del toroide:
Z I
1 T 1
lı́m f (q, p)dt = f (q, p) dl ϕ
~ (13.70)
T →∞ T 0 (2π)l
Si el sistema es degenerado, las frecuencias son conmensurables. Entonces las tra-
yectorias son periódicas y cubren una región de dimensión menor a la del toroide. El
teorema K.A.M. dice que en este caso, aun si la perturbación es muy pequeña, los toroi-
des invariantes pueden cambiar drásticamente en su topologı́a; para la mayor parte de las
condiciones iniciales las trayectorias son estocásticas o sea que no están colocadas sobre
regiones de geometrı́a definida en el espacio fásico. Para el problema de fuerzas centrales
en coordenadas esféricas, además de Ir , Iθ e Iϕ hay una constante de movimiento adicio-
nal ϕθ − ϕϕ (y en el problema de Kepler además ϕr − ϕθ es constante). Cuando se aplica
una perturbación las constantes que dependen sólo de variables angulares pasan a ser
veriables angulares de frecuencia lenta dando lugar a que la trayectoria no sea cerrada
sino que ocupe toda la región definida por las variables de acción constantes. Entonces
es de esperarse que a causa de los efectos cuánticos, en un sistema degenerado se cumpla
también la igualdad (13.70).
13.3. La mecánica ondulatoria

Es posible, en la óptica geométrica, describir la propagación de los rayos por medio
del principio de Fermat, ∆Σ = 0, y la propagación de los frentes de ondas por medio de
la ecuación de la eiconal. En óptica fı́sica la luz es una onda electromagnética, y la ópti-
ca geométrica es una primera aproximación que describe correctamente la propagación
cuando la longitud de onda es pequeña en comparación con las dimensiones caracterı́sti-
cas de la geometrı́a del problema. Schrödinger encontró que para un sistema mecánico
hay un comportamiento similar. La trayectoria de las partı́culas está determinada por el
principio de mı́nima acción y las soluciones de la ecuación de Hamilton-Jacobi describen
el movimiento de unas superficies de acción constante. La mecánica clásica resulta ser la
aproximación de ondas cortas de una teorı́a más general, llamada mecánica ondulatoria.
Las ondas de materia están determinadas por dos campos en el espacio ordinario, la
distribución de probabilidades Q(~r) y las superficies de acción constante Σ(I, ~ ~r), que
5
corresponden a la amplitud y la fase de la onda. Según el ejemplo 13.2.4, Σ determina
a Q. Schrödinger encontró la ecuación diferencial que obedecen las ondas de materia.
Propagación de las superficies de acción constante. Las funciones de Ha-

milton S y Σ están relacionadas por:
~ t) = Σ(~r, C)
S(~r, C, ~ − Et (13.71)
~ es un conjunto de constantes de movimiento. Las superficies Σ = constante per-

donde C
manecen fijas en el espacio de configuración, en tanto que las superficies S = constante
se mueven. Si en t = 0, S = Σ = σ, entonces en un tiempo posterior dt, la superficie
S = σ ya no coincidirá con la superficie Σ = σ sino con la superficie Σ = σ + E dt.
La velocidad del movimiento de un punto fijo sobre S la llamaremos u:
dl
u= (13.72)
dt
5 Esta correspondencia tiene implicaciones en las teorı́as gauge de la fı́sica de partı́cu-
las elementales. Véase L.A. Sánchez, J. Mahecha, Rev. Mex. Fis. 49(2003)364. También
http://xxx.lanl.gov/abs/hep-th/0308160
donde dl es el desplazamiento del punto durante el tiempo dt. La condición S(0) =

S(dt) = σ nos determina el valor de u. En efecto:
∂S ~ ∂S
S(dt) − S(0) = · dl + dt = 0 (13.73)
∂~r ∂t
Como por su definición d~l está en la dirección normal a S, se sigue que:
E
u =
(13.74)
∂Σ
∂~r
Σ obedece la ecuación de Hamilton-Jacobi independiente del tiempo, de donde:

∂Σ
1/2
= (2mT )1/2
∂~r = [2m(E − V )] (13.75)
Por tanto la velocidad de los puntos del frente S para una partı́cula es:
E E
u= 1/2
= (13.76)
(2mT ) p
La relación E = pu, donde p es el momento lineal de la partı́cula y u la velocidad
del frente S, es análoga a E = pc en el caso de los fotones. u = E/mv es pequeña
cuando v es grande y viceversa, y resulta ser proporcional a la magnitud del vector de
lentitud normal análogo al de la óptica geométrica. u es llamada la velocidad de fase y
v = p/m es la velocidad de la partı́cula (llamada en mecánica ondulatoria la velocidad
de grupo). Cuando la velocidad de las partı́culas es pequeña, las superficies S se mueven
rápidamente y cuando las partı́culas se mueven rápidamente, la velocidad de los frentes
~ t) puede considerarse como un campo o fluido, definido en toda
es pequeña. S(~r, C,
la región del espacio de configuración accesible a la partı́cula. Cuando el potencial no
depende de la velocidad, las curvas caracterı́sticas en el espacio de configuración son
ortogonales a las superficies S. Al moverse las partı́culas el campo S se propaga con
velocidad u(~r) en cada punto. A su vez las partı́culas mismas caracterizan otro campo,
~ con un flujo de velocidad en cada punto dado por ~r˙ .
el de las densidades Q(~r, C),
Ejemplo 13.3.1 Hallar las velocidades u y v para un oscilador armónico lineal y analizar
los campos Q y S.
Las velocidades de los frentes S y de las partı́culas son respectivamente:
1 ωA 1 ωA
u=± = (13.77)
2 x2
1/2 2 cos(ωt)
1− 2
A
1/2
x2
v = ±Aω 1 − 2 = ωA cos(ωt) (13.78)
A
Vemos que v varı́a entre −Aω y +Aω, en tanto que u varı́a entre −∞ y −ωA/2 y
entre ωA/2 e ∞.
y µ
ωA
1 ωA
2
t
0
T/4 T/2 3T/4 T
Figura 13.4 Velocidades u y v para un oscilador armónico lineal
Vemos que en los puntos de retorno x = ±A los frentes S “rebotan” con velocidad
muy grande; además la densidad de los frentes S es mayor donde u es baja y es cero
donde u es infinita. O sea, los frentes son densos donde la densidad de las partı́culas es
pequeña y viceversa (véase figura 13.4).
Para este problema, de (13.51) se sigue que Q vale:
1 1 ω
Q= = (13.79)
2πA x

2 1/2 2π|v|
1− 2
A
O sea que Q tiene un comportamiento similar a |u|.

La expresión para Σ es:
1/2 " #
2 1/2
1 mE x x
Σ= A sen−1 + x 1 − 2 (13.80)
2 2 A A
Notemos que Σ determina a Q. En efecto:

" #
2 1/2
∂ ∂Σ ∂ 1/2 2x
2πQ = = (2mIω) 1 − mω (13.81)
∂I ∂x ∂I 2I
Cuando x = 0, Σ es cero y Q = 1/(2πA) y cuando x = A, Σ = πA(mE/2)1/2 en

tanto que Q es infinita.
Es interesante notar que Σ no es una función univaluada de x, pues para x = 0,
Σ = 0 si t = 0 y Σ = 2πI si t = T . Igualmente ∂Σ/∂x = ±(2mE − m2ω 2 x2 )1/2 posee dos
ramas, una para los tiempos anteriores a la llegada a los puntos de retorno y otra para
los tiempos posteriores. En consecuencia, si no se toma valor absoluto, Q es también en

sentido estricto una función multivaluada. Finalmente, como:
∂Σ x
= sen−1 (13.82)
∂I A
se sigue que:
I
Q dx = 1 (13.83)
como debe ser.
Ondas materiales. Las partı́culas microscópicas tienen un comportamiento on-

dulatorio evidenciado por: (i) La densidad en un haz de partı́culas tiene oscilaciones o
variaciones espaciales definidas, es decir, las trayectorias no se pueden distribuir arbi-
trariamente. (ii) La región accesible a un sistema ligado de partı́culas va más allá de
los puntos de retorno clásicos, aunque la probabilidad de encontrar las partı́culas fuera
de la región clásica decrece exponencialmente. (iii) Hay fenómenos de interferencia y
difracción.
Para hablar de frentes de acción constante no son necesarias las nociones de “ondas”
o “longitud” de onda. Al evaluar la distribución Q se encuentra que no presenta ninguna
oscilación sino variaciones suaves con la posición. Esto es consecuente con la concepción
de la mecánica clásica como el comportamiento lı́mite de un movimiento ondulatorio
cuando la longitud de onda es pequeña.
Vimos cómo de la formulación de la mecánica clásica con matrices conmutativas
emerge de manera natural la mecánica cuántica de Heisenberg al introducir algunas
hipótesis motivadas en la espectroscopı́a atómica. Desafortunadamente no hay una ma-
nera suave de obtener la mecánica cuántica de Schrödinger a partir de la ecuación de
Hamilton-Jacobi y la función de distribución clásica, pues estos elementos clásicos son
ajenos a conceptos tales como “función de onda”, “ecuación de onda”, “principio de su-
perposición”. Es necesario un drástico cambio conceptual para introducir en la mecánica
las nociones ondulatorias.
La ecuación de Schrödinger. Schrödinger admitió la descripción de sistemas

microscópicos mediante una amplitud de ondas análoga a la que describe otros fenómenos
ondulatorios:
ψ(~r, t) = A(~r)eiϕ(~r,t) (13.84)
Quien inició este tipo de teorı́as fue Louis de Broglie, cuando en 1923 estudió la
posible conexión entre las propiedades ondulatorias y corpusculares de la materia. Par-
tió de la idea siguiente. Si tratándose de partı́culas se está describiendo el mismo fenóneno
mediante los principios de Fermat y de mı́nima acción, en el lı́mite de ondas cortas se
cumple la siguiente implicación:
Z 2 Z 2
dl
∆ = 0 (v = constante) y ∆ p(~r, E) dl = 0
1 u(~r , v) 1
(13.85)
1
(E = constante) → p ∝
u
que es el mismo resultado (13.76).

Para la velocidad de fase de una partı́cula se cumple:
c
u(~r, ν) = = λ(~r, ν) ν (13.86)
n(~r, ν)
siendo n el ı́ndice de refracción, c una constante y ν la frecuencia de las ondas.
Entonces de (13.76) o (13.85) se sigue que:
E E h
p= = = (13.87)
u λ(~r, ν)ν λ(~r, ν)
siendo h = E/ν una constante. Como en (13.32) y (13.33), puede decirse que la fase de
la onda, ϕ, es proporcional a la acción S:
2π Σ(~r, E) Et
ϕ(~r, t) = S(~r, t) = − (13.88)
h h̄ h̄
Entonces:
ψ(~r, t) = A(~r)eiΣ(~r,E)/h̄−iEt/h̄ (13.89)
ha de ser la forma de la función de onda en el lı́mite de ondas cortas.
Schrödinger asumió que en general ϕ satisface una ecuación de ondas ordinaria
donde la velocidad de la onda es la velocidad de fase u, y además exigió que debe ser
consistente con los resultados ya conocidos referentes al lı́mite asintótico de ondas cortas
caracterizado por la ecuación (13.89). Esto es:
1 ∂2ψ
∇2 ψ − =0 (13.90)
u2 ∂t2
Como para el lı́mite de ondas cortas u está dada por (13.76), para ese caso (13.90)
toma la forma:
2m(E − V ) ∂ 2 ψ
= ∇2 ψ (13.91)
E2 ∂t2
La función de onda de un fenómeno estacionario es de la forma:
Ψ(~r, t) = ψ(~r)e−iEt/h̄ (13.92)
por lo cual ψ debe obedecer la ecuación:
h̄2 2
− ∇ ψ(~r) + V (~r)ψ(~r) = Eψ(~r) (13.93)
2m
que es la ecuación de Schrödinger independiente del tiempo. El comportamiento ondu-
latorio aparece sólo al hacer la identificación (13.88), o sea que está ligado directamente
al hecho de no ser cero la constante de Planck (ϕ no es infinita ni λ es cero). Esto de
alguna manera ha de estar relacionado con el hecho de no poderse medir las variables
de acción I con precisión ∆I = 0, del cual surge la mecánica cuántica de Heisenberg. Si
en (13.93) reemplazamos a ψ por:
ψ(~r) = eiΣ(~r,E)/h̄ A(~r) (13.94)
obtenemos una ecuación diferencial para Σ que en el lı́mite h̄ → 0 es precisamente la

ecuación de Hamilton-Jacobi.
Además Schrödinger postuló que |ψ|2 es la densidad de probabilidad en el espacio
de configuración. Para un estado estacionario se debe cumplir:
Q(~r) = |ψ(~r)|2 (13.95)
Resulta de (13.94) y (13.95) que para el lı́mite asintótico de ondas cortas:
Q(~r) = A(~r)2 (13.96)
Por tanto el lı́mite clásico de la función de onda puede expresarse en términos de
las funciones clásicas Q(~r), (13.69), y Σ:
ψ(~r, t) = [Q(~r)]1/2 eiΣ(~r,E)/h̄−iEt/h̄ (13.97)
o, en términos de Σ:
1/2
∂2Σ ∂2Σ ∂2Σ
ψ(r, t) = ǫλσρ eiΣ(~r,E)/h̄−iEt/h̄ (13.98)
∂x∂Iλ ∂y∂Iσ ∂z∂Iρ
J.H. van Vleck (1928) mostró que:
1/2
∂ 2 S
hq|ψi = C det eiS/h̄ (13.99)
∂q∂p
obedece a la ecuación de Schrödinger si h̄ → 0. Nótese la similitud entre (13.98) y la
ecuación de van Vleck.6
13.4. La función de onda semiclásica según Keller y

Maslov
Para un sistema acotado los valores de las variables de acción, y por tanto de
la energı́a y otras constantes de movimiento, están cuantizados. En la sección 12.1, se
señaló que las variables de acción satisfacen las condiciones Iν = αν h̄, donde las αν son
enteras. Al imponer ciertas condiciones sobre las frecuencias vimos en el ejemplo 12.3.1
que para un oscilador armónico la acción está cuantizada según I = (k + 1/2)h̄, siendo k
un entero. Veremos ahora cómo tales reglas de cuantización se pueden obtener a partir
de la función de onda semiclásica.
Bohr y Sommerfeld postularon las reglas de cuantización para un sistema separable
en la forma Iν = αν h̄. Einstein en 1917 las generalizó para sistemas no separables pero
integrables, para los cuales existe un conjunto de variables de acción definidas por los
contornos cerrados independientes que haya sobre un toroide invariante, en la forma:
I
1
Iν = p~ · d~q = αν h̄ (13.100)
2π γν
6 M.C. Gutzwiller, Chaos in classical and quantum mechanics, Springer, New York, 1990 deduce la
fórmula de van Vleck a partir de una aproximación de fase estacionaria al propagador de Feynman.
donde los γν son los diferentes contornos. Brillouin en 1926 esbozó una teorı́a de las fun-
ciones de onda semiclásicas que conduce a reglas de cuantización como la del oscilador
armónico, I = (k + 1/2)h̄, basada en consideraciones sobre los puntos de retorno del
movimiento clásico. Keller en 1958 y Maslov en 1972 elaboraron una teorı́a completa
acerca de las funciones de onda semiclásicas y las reglas de cuantización que genera-
liza los trabajos de Bohr, Sommerfeld, Einstein y Brillouin. En la actualidad muchos
problemas especı́ficos en fı́sica atómica y molecular son adecuadamente estudiados me-
diante estas teorı́as semiclásicas, denominadas genéricamente “la aproximación W.K.B”.
Acción de Lagrange con dos puntos de retorno. Consideremos una partı́cula

en movimiento unidimensional acotado con dos puntos de retorno. La trayectoria de
fases es cerrada y el toroide invariante es una circunferencia.
La figura 13.5 muestra una trayectoria tı́pica. La solución a la ecuación de Hamilton-
Jacobi para este problema es:
Z
Σ(x) = ± [2m(E − V )]1/2 dx (13.101)
p2
x
x1 x2
p1
Figura 13.5 Trayectoria de fases cerrada
En la trayectoria hay dos puntos en los cuales p se anula y cambia de signo que
son x1 y x2 .
Tanto p como Σ son funciones bivaluadas de x. Los dos valores de p o Σ para cada
valor de x están sobre diferentes “hojas”, análogas a las hojas de Riemann de la teorı́a
de las funciones de variable compleja, definidas por la lı́nea de ramificación x1 x2 . Para
p las dos hojas son x1 p2 x2 y x1 p1 x2 . En x1 y x2 , p es singular por ser dp/dx infinita.
Similarmente, en la representación de momentos p1 p2 definen una lı́nea de ramificación
que separa el plano xp en las hojas p1 x1 p2 y p1 x2 p2 . La correspondiente acción reducida
es Σ(p), conectada con Σ(x) mediante la fórmula (9.217):
Σ(p) = Σ(x) − xp (13.102)
Para un valor dado de E, Σ(x) define parte de la trayectoria de fases, formada por
los puntos (x, dΣ/dx). Pero Σ puede usarse sólo para la trayectoria sobre una hoja, ya
que la ecuación de Hamilton-Jacobi no determina a Σ en x1 y x2 . Para pasar a la otra
hoja es necesario continuar la función. En efecto, Σ(p) está bien definida en los puntos x1
y x2 sobre dos hojas, p1 x1 p2 y p1 x2 p2 . Esto permite la extensión analı́tica de Σ(x) de una
hoja a la otra usando la ecuación (13.102). La continuación a lo largo de la trayectoria
puede lograrse, pues, por transformaciones sucesivas entre las representaciones x y p.
Podemos definir las funciones multivaluadas Σ y Σ en términos de funciones univaluadas
ası́:

 Σ1 (x) en x1 p2 x2
Σ(x) =

Σ2 (x) en x1 p1 x2
 (13.103)
 Σ1 (p) en p1 x1 p2
Σ(p) =

Σ2 (p) en p1 x2 p2
La variable de acción es un número cuya magnitud es igual al cambio experimen-

tado por Σ al completar un circuito, dividido por 2π (sección 10.3):
1
I= [Σ2 (x2 ) − Σ1 (x2 )] (13.104)
2π
Efecto de la multiformidad de Σ sobre la función de onda semiclásica.
Podemos concluir de (13.69) que Q no es univaluada por no serlo Σ. Entonces se deduce
de (13.97) que la función de onda semiclásica resulta ser multivaluada a no ser que se
imponga una condición adicional.
Escribamos a ψ en la forma:

Σ Et 1
ψ = exp i − − i ln Q (13.105)
h̄ h̄ 2
Al hacer un circuito completo sobre la trayectoria de fases la función de onda debe

tomar el mismo valor. Esto se consigue solamente haciendo que el cambio del argumento
del exponencial en (13.105) al completar un circuito sea un múltiplo entero de 2πi, o
sea:
∆Σ i
− ∆ ln Q = 2πn (13.106)
h̄ 2
donde n es un número entero. Esto da lugar a la siguiente expresión para la cuantización
de I = ∆Σ/2π:

i
I = h̄ n + ∆ ln Q (13.107)
4π
Para el caso descrito por (13.101), sobre las dos ramas Q difiere sólo en el signo
[véase por ejemplo la expresión (13.81)].
Las funciones univaluadas Σ1 y Σ2 , definidas en (13.103), permiten encontrar las

funciones univaluadas correspondientes Q1 y Q2 . En efecto:
m 1/2 1
2πQ1,2 = ±ω (13.108)
2 [E − V (x)]1/2
implica que:
ln Q2 (x2 ) − ln Q1 (x2 ) = ln Q2 (x1 ) − ln Q1 (x1 ) = −πi (13.109)
El cambio completo en ln Q, partiendo de un punto sobre la rama superior próximo
a x2 y regresando al mismo punto luego de pasar por dos discontinuidades es:
∆ ln Q = −2πi (13.110)
En consecuencia, (13.109) es:

1
I = h̄ n + (13.111)
2
En conclusión, las condiciones de cuantización correctas se obtienen al definir la
función de onda semiclásica en términos de la función Q no tomada como intrı́nseca-
mente positiva.
La función ı́ndice de Maslov. La función “signo” aplicada a la derivada dp/dx

es útil para contabilizar el número de singularidades de las funciones Σ(x) y Σ(p) al
pasar de una hoja a la otra. Se define como:

 dp
 
 +1 si >0
dp dx
SGN = (13.112)
dx 
 dp

 −1 si <0
dx
para todos los valores de dp/dx 6= 0.
Maslov define la función “ı́ndice” para asociar un número entero a todos los puntos
colocados sobre la misma hoja, ası́:
σ(x) = Número entero sobre cada hoja x1 p2 x2 − x1 p1 x2
(13.113)
σ(p) = Número entero sobre cada hoja p1 x1 p2 − p1 x2 p2
σ(p) y σ(x) están conectados en cada punto que no sea de retorno en p o en x por la
relación:

dp
σ(p) = σ(x) + SGN (13.114)
dx
Si se toma en un punto x0 a Σ(x0 ) = 0, entonces se define el valor inicial de
σ(x) por la condición σ(x0 ) = 0. Sea x0 = x2 + ǫ, entonces σ(x) = 0 para toda la
hoja x1 p2 x2 . Para un punto entre p2 y x1 , SGN(dp/dx) = +1; entonces por (13.114),
σ(p) = +1 en toda la hoja p1 x1 p2 . Ahora tomemos un punto entre x1 y p1 ; entonces
SGN(dp/dx) = +1, y por (13.114), σ(x) = 2 en la hoja x1 p1 x2 . Para un punto entre

p1 y x2 , SGN(dp/dx) = +1; entonces por (13.114), σ(p) = 3 para toda la hoja p1 x1 p2 .
Finalmente, sea el punto de partida x0 , donde SGN(dp/dx) = +1; entonces por (13.114)
se cumple que σ(x) = 4. Concluimos que σ(x) es una función multivaluada entera que se
incrementa en 4 al completar un circuito. Denotemos por la letra m el cambio en σ(x)
al completar un circuito dividido por dos:
∆σ
m= (13.115)
2
Para el caso que estamos considerando, m = 2 que coincide con el número de
singularidades en Σ al completar un circuito. Ver el comentario que sigue a la ecuación
(13.52).
Maslov generaliza el resultado (13.110) en la forma:
∆ ln Q = −imπ (13.116)
para un sistema con un número cualquiera de puntos de retorno en x y en p.
La función ı́ndice permite incluir en la fase de la función de onda semiclásica los
efectos provenientes de la no uniformidad de Q, en la forma:
ψ(~r) = |Q(~r)|1/2 eiΣ(~r,E)/h̄−iπσ(~r)/4 (13.117)
con esto se está diciendo que la fase es fija sobre cada hoja.
Las condiciones de cuantización resultan de exigir que ψ sea univaluada.
Ası́, para el caso ilustrado en la figura 13.5,
ψ1 (x2 ) = ψ2 (x2 ) (13.118)
Esto exige que, al completar un circuito:
∆Σ π ∆σ
− = 2πn (13.119)
h̄ 4
Por tanto:
m
I = n+ h̄ (13.120)
4
Para el movimiento de un electrón en el átomo de hidrógeno, las coordenadas esféri-
cas r, θ y las parabólicas ξ, η son del tipo considerado en la figura 13.5, siendo entonces
m = 2. Esto justifica las fórmulas de cuantización semiclásica dadas en el ejemplo 10.5.2.
La coordenada ϕ se comporta de manera diferente por estar asociada a una rotación, o
sea que la trayectoria de fases no tiene puntos de retorno ni en ϕ ni en pϕ (la proyección
de la trayectoria de fases sobre el plano pϕ − ϕ es una lı́nea recta). En consecuencia
∆σ = 0 para el grado de libertad ϕ.
Fórmulas de conexión de W.K.B. Para una dimensión la función de onda de

W.K.B., según se sigue de (13.117) y (13.108) es:
1/2
mω
ψ(~r, t) = eiΣ(~r,E)/h̄−iEt/h̄−iπσ(~r)/4 (13.121)
π|p|
A pesar de ser construida a partir de las cantidades clásicas Q, Σ y σ, esta función

es válida para valores de x entre x = −∞ y x = +∞ diferentes a los puntos de retorno.
Fuera de los puntos de retorno Σ es imaginaria, lo cual nos permite afirmar que en
general:
mω −2ImΣ(~r,E)/h̄
|ψ(r, t)|2 = e (13.122)
π|p|
y la probabilidad resulta exponencialmente amortiguada en las regiones donde ImΣ > 0

y tiende a cero cuando h̄ → 0, en correspondencia con el hecho de ser tales regiones
clásicamente prohibidas. La cola exponencial que exhibe ψ corresponde al efecto “túnel”
de la mecánica cuántica.
Las fórmulas de conexión permiten pasar a través de los puntos de retorno, para
obtener una función definida entre x = −∞ y x = +∞ (excluyendo a x = x1 y x = x2 y
los alrededores de los mismos donde los efectos cuánticos no permiten la aproximación
semiclásica).
En la región clásicamente inaccesible p y Σ son imaginarios puros, con signos +i o
−i dependiendo de la hoja. Cuando el signo es −i resulta que |ψ|2 no se amortigua sino
que crece exponencialmente en la región clásicamente prohibida, lo cual no es aceptable.
Por tanto a la región clásicamente prohibida sólo puede pasarse desde la hoja con p > 0.
Llamemos 3 a la región −∞ < x < x1 y 4 a la región x2 < x < +∞. Para llegar
a la región 4 la partı́cula necesariamente provino de la región 1 (p > 0), o sea que no
realizó cambio de hoja; entonces, estando en la misma hoja, σ4 = σ1 = 0. Para llegar
a la región 3, la partı́cula necesariamente provino de la región 2 (p < 0), o sea que
debió cambiar de hoja a fin de que ImΣ > 0. Como en cada cambio de hoja σ cambia en
2, se sigue que σ2 = 2 y σ3 = 0. En resumen, σ1 = 0, σ2 = 2, σ3 = 0, σ4 = 0. Por tanto:
1/2 Z x0
mω [2m(E − V )]1/2 dx
ψ1 (x) = exp i (13.123)
2π|p| x2 h̄
1/2 Z x0
mω [2m(E − V )]1/2 dx π
ψ2 (x) = exp −i −i (13.124)
2π|p| x2 h̄ 2
1/2 Z x1
mω [2m(V − E)]1/2 dx
ψ3 (x) = exp − (13.125)
2π|p| x h̄
1/2 Z x
mω [2m(V − E)]1/2 dx
ψ4 (x) = exp − (13.126)
2π|p| x2 h̄
√
Se han introducido los factores 1/ 2 pues al ampliar el rango de x desde −∞ hasta
+∞ se cambia la normalización.
Cuando la función de onda en un intervalo dado es multiforme, debe tomarse
la suma aritmética de las funciones de onda asociadas a las diferentes hojas. En el
presente caso, la región x1 < x < x2 tiene dos hojas y la función correcta es ψ1 + ψ2 . Si
multiplicamos las cuatro funciones (13.123) a (13.126) por eiπ/4 , las fases relativas no
cambian. Entonces:
 1/2 Z x

 mω [2m(E −V )]1/2 dx π

 cos + ; x1 < x < x2

 π|p| x2 h̄ 4





 1/2 Z x1
mω [2m(V −E)]1/2 dx iπ
ψ(x) = exp − + ; −∞ < x < x1 (13.127)

 2π|p| h̄ 4

 x



 1/2 Z x

 mω [2m(V −E)]1/2 dx iπ

 exp − + ; x2 < x < ∞
2π|p| x2 h̄ 4
este es el resultado usual de la aproximación W.K.B.
Bibliografı́a
Textos generales de mecánica clásica
1. Arnold V. I. Méthodes mathématiques de la mécanique classique. Editions Mir, Mos-

cou, 1976.
2. Corben H. C. y Stehle P. Classical mechanics. 2nd ed. J. Wiley, New York, 1960.
3. Gantmacher F. Lectures in analytical mechanics. Mir publishers, Moscow, 1970.
4. Goldstein H. Mecánica clásica. Aguilar, Madrid, 1963.
5. Goldstein H. Classical mechanics. 2nd ed. Addison Wesley, Reading, 1980.
6. Hauser W. Introducción a los principios de la mecánica. Uthea, México, 1969.
7. Landau L. y Lifshitz E. M. Mecánica. Reverté, Barcelona, 1965.
8. Marion J. Classical dynamics of particles and systems. Academic Press, New York,
1970.
9. Pars, L.A. A treatise on analytical dynamics. John Wiley, New York, 1968.
10. Scheck F. Mechanics: from Newton’s laws to deterministics chaos. Springer, Ber-
lin, 1995.
11. Ter Haar D. Elements of hamiltonian mechanics. North-Holland, Amsterdam, 1965.
12. Whittaker E. T. A treatise on the analytical dynamics of particles and rigid bo-
dies. 4th ed. Cambridge University. Press, Cambridge, 1960.
593
Colecciones de problemas
13. Kotkin G. L. y Serbo V. G. Problemas de mecánica clásica. Editorial Mir, Moscú,

1980.
14. Spiegel M. R. Teorı́a y problemas de mecánica teórica. McGraw-Hill, México, 1976.
Textos especializados de mecánica clásica
15. Abraham R. y Marsden J. E. Foundations of mechanics. Benjamin, New York, 1967.
16. Born M. The mechanics of the atom. 2nd printing. Ungar, New York, 1967.
17. Lichtenberg A. J. y Lieberman M. A. Regular and stochastic motion. Springer-Verlag,

New York, 1983.
18. Percival I. and Richards D. Introduction to dynamics. Cambridge University Press,

Cambridge, 1982.
19. Thirring W. Classical dynamical systems. Springer-Verlag, New York, 1978.
20. Yourgrau W. y Mandelstam S. Variational principles in dynamics and quantum

theory. 3d ed. Saunders, Philadelphia, 1968.
Textos de matemáticas
21. Abramowitz M. y Stegun I. A. Handbook of mathematical functions. Dover, New

York, 1965.
22. Ahlfors L. V. Análisis de variable compleja. Aguilar, Madrid, 1966.
23. Arnold V. I. Equazioni differenziali ordinarie. Edizioni Mir, Mosca, 1979.
24. Arnold V. I. Geometrical methods in the theory of ordinary differential equations.

Springer-Verlag, New York, 1983.
25. Elsgoltz L. Ecuaciones diferenciales y cálculo variacional. Editorial Mir, Moscú,

Bibliografı́a / 595
1969.
26. Korn G. A. y Korn T. M. Mathematical handbook for scientists and engineers.

McGraw-Hill, New York, 1961.
27. Spiegel M. R. Manual de fórmulas y tablas matemáticas. McGraw-Hill, México, 1970.
28. Whittaker E. T. y Watson G. N. A course of modern analysis. 4th ed. Cambrid-

ge University Press, Cambridge, 1927.
Textos de otras áreas
29. Galindo A. y Pascual P. Mecánica cuántica. Alhambra, Madrid, 1978.
30. Gutzwiller M.C. Chaos in classical and quantum mechanics. Springer, New York,
1990.
31. Landau L. D. y Lifshitz E. Théorie du champ. Editions Mir, Moscou, 1966.
32. Landau L. D. y Lifshitz E. Mécanique cuantique: théorie non relativiste. Editions

Mir, Moscou, 1967.
33. Van der Waerden B. L. (ed). Sources of quantum mechanics. Dover, New York,
1968.
Monografı́as especializadas
34. Augustin S. D. y Rabitz H. “Action-angle variables in quantum mechanics”. Journal

of chemical physics, vol. 71, No 12, p 4956, 1979.
35. Chirikov B. V. “A universal instability of many-dimensional oscillator systems”.

Physics reports, vol. 52, No 5, p 263, 1979.
36. Keller J. B. “Corrected Bohr-Sommerfeld quantum conditions for nonseparable sys-

tems”. Annals of physics, vol. 4, p 180, 1958.
37. Percival I. C. “Semiclassical theory of bound states”. Advances in chemical phy-

sics. vol. 36, p 61, 1977.
597
Índice alfabético
Abramowitz, 282, 294, 298 Fermi, de, 543

Absidales, distancias, 132, 140 Moser, de, 429
Acción(es) Poincaré, de, 427
adiabáticos, invariantes, 415 separatriz, 526, 542
discontinuidad en la,, 430, 588 Aproximación
Hamilton, de,, 328 clásica, 475, 583, 590
Lagrange, de, 328 WKB, de, 589, 591
perturbaciones adiabáticas , 505 Areolar, velocidad, 130
principal, 330 Arnold, V., 422, 529, 538
reducida, 330 integral de, 528
variables de, 429 teorema de, 522, 531
Adiabáticas, perturbaciones,, 504 Astronomı́a, 149
Adiabáticos, invariantes,, 415, 430 Augustı́n, S.D., 551
Ahlfors, L. V., 241 Autónomo, hamiltoniano, 525
Álgebra de Lie Autoadjunta, matriz, 551
grupo de rotaciones, del, 244, 395,
Barrera centrı́fuga, 131, 135
461
Bernoulli, regla de oro, 19, 35
y corchetes de Poisson, 397
Bifurcación de las superficies, 538
Angulares, variables
Bohr, átomo de, 144, 155
degeneradas, 488
Born, M., 153, 470, 473, 479
lentas, 500, 505, 513
Boyle, ley de, 81
oscilador armónico, en el, 438
Brillouin
problema de Kepler, en el, 445, 462
aproximación de, 589, 591
rápidas, 500, 504, 513 reglas de cuantización, 586
y de acción, 429 Brújula de Foucault, 314
Ángulo(s)
órbita Kepleriana, en una, 457 Cálculo de variaciones, 59
como coordenadas generalizadas, 222 Cambio de la forma funcional, 379
condiciones sobre los, 226 Campo electromagnético, 65
dispersión, de, 159, 162 Canónicas, transformaciones, 104, 107,
Euler, de, 222 319, 343, 400
rotación, de, 227, 245 dependientes del tiempo, 105
Antisimétrica matriz, 249 ejemplos de, 110, 347, 358
Aplicación grupo de, 355
“twist”, 429, 523, 524 infinitesimales, 374
estándar, 544 libres, 109, 346
598
Índice alfabético / 599
oscilador armónico, del, 104 Corchetes

Caóticos, movimientos regulares, 522 Lagrange, de, 402, 409
Caratheodory, lema de, 362 Poisson, de, 378, 380, 555
Cascarón esférico, 21 Coriolis, fuerza de, 94, 252
Cáusticas, superficies, 444, 576 Cosenos directores, 210, 568
Cayley-Klein, parámetros de, 236 Covarianza
para el trompo, 301 de las ecuaciones de Hamilton, 103
Centrı́fuga, aceleración, 94 de las ecuaciones de Lagrange, 42
Centrı́fugo, potencial, 131 Cuerda
Centro masas discretas, con, 195
fuerzas, de, 125 oscilaciones de la, 202
masas, de, 125, 161 uniforme, 202
Chirikov, B. V., 529, 543, 547 Cuerpo rı́gido, 205
criterio de, 543 asimétrico, 287
Clase dinámica del, 253
integral elı́ptica de primera, 284 libre, 277
transformación canónica libre de pri- momento angular del, 256
mera, 109, 348 simétrico con un punto fijo, 295
Completidad, relación de, 215 sistema de coordenadas del, 206
Condiciones Curvas de fase, 100, 121, 323, 423
ligadura, de, 9
ortogonalidad, de, 174, 180, 208 D’Alambert, principio de, 35
Cónicas, secciones, 140 Degeneración
Conjunto accidental, 504, 515
coordenadas generalizadas, de, 13 figura de Lissajous, en una, 443
variables de acción-ángulo, de, 434 frecuencias, en las, 181
Conmutador, 397, 555 intrı́nseca, 516
Conservación, teoremas de, 68, 380 para el problema de Kepler, 492
Constante(s) isoenergética, 530
e integrabilidad de las ecuaciones movimiento bajo fuerzas centrales,
de movimiento, 421 en el, 445
generadores de transformaciones canóni- oscilador isotrópico, en el, 442
cas como, 381 Delaunay, elementos de, 457
integración, de, 70 Densidad
movimiento, de, 70, 421, 437 función de, 573, 576, 585
Planck, de, 123, 414, 584 probabilidad, de, 573, 576, 585
propiedades de simetrı́a, y, 381 Derivada
Construcción de Pionsot, 277 parcial, 41, 94
Contacto, transformación de, 569 total respecto al tiempo, 67, 73, 95
Coordenadas Desplazamiento virtual, 16, 18
cı́clicas, 76 Determinante
esféricas, 129, 445 jacobiano, 350, 404, 523
generalizadas, 12 matriz de rotación, de la, 216, 220
independientes, 46 secular, 171, 186
parabólicas, 443, 462 Diádicos
Corben, H., 201, 273 Pauli, de, 232
traza cero, de, 232 Whitaker, de, 325

Diada, 212 Efecto Stark
Diagonalización cuadrático, 500
frecuencias propias y modos con el lineal, 498
método de, 191 Einstein, reglas de cuantización, 585
matrices de masa y de constantes Eje(s)
de resorte, de las, 191 instantáneo de rotación, 279
matriz de rotación, de la, 225 principales, 261
matriz de una perturbación, de la, rotación, de, 244
497 simetrı́a, de, 79
tensor de inercia, del, 260 Elementos de matriz, 223
Dinámica Elipsoide de inercia, 264, 277
hamiltoniana, 88 Energı́a
ecuación general de la, 35, 55 cinética, 42, 72, 255
lagrangiana, 42 conservación de la, 70, 89
variable, 69, 378 función de Jacobi, 71, 74
Dipolar potencial, 42, 296
radiación, 451, 459 total, 73
reglas de selección para radiación, Ensamble, 18
475 Equilibrio
Dispersión bajo fuerzas centrales, 156 estático, 19
estable, 30
Ecuación(es) Espacio
Hamilton-Jacobi, de, 107, 112, 364, configuración, de, 14
368, 371, 435, 445 fases, de, 98, 104
canónicas, 88 momentos, de, 98
continuidad, de, 573 no euclidiano, 29, 179
dinámica en coordenadas generali- Estática
zadas, de la, 40 coordenadas generalizadas, con, 29
estática en coordenadas generaliza- ecuación general de la, 19
das, de la, 28 Estabilidad de los puntos fijos, 541
estado de un gas real, de, 82 Estado de un sistema mecánico, 3
Euler en un sistema de referencia Euler
rotante, de, 271 ángulos de, 222, 226, 247
Euler, de, 270, 281, 287 ecuaciones, 270, 287
Euler-Lagrange, de, 97 parámetros de, 229
general de la dinámica, 35 teorema sobre
general de la estática, 19 desplazamiento de un cuerpo rı́gi-
Kepler, de, 148, 449 do, 217
ligadura, de, 9 funciones homogéneas, 71
movimiento, de, 6, 38, 42, 88 Evolución temporal, transformación canóni-
Newton, de, 5 ca de, 113, 374
onda, de, 204, 584 Extremal, 59
secular, 171, 186, 262, 496
transformación canónica, de una, 363 Fase, 572
valores propios, de, 179 Fermat, principio de, 330, 567
Fermi, aplicación de, 543 estática, de la, 19

Figuras de Lissajous, 132 Generatriz
Fijos, puntos elı́pticos e hiperbólicos, 516 función de una transformación canóni-
Fourier, expansión de, 149, 437, 450, 470, ca, 343
497, 550 transformación canónica, de una, 108
Frecuencias transformación de Legendre, de una,
degeneradas, 186, 491, 493 86
lentas, 505 Goldstein, H, 66, 167, 259
multiplemente periódicas, 436 Grados de libertad
nulas, 171 cuerpo rı́gido, de un, 205
rápidas, 505 sistema dinámico, de un, 12
resonantes, 513 vibracionales, 182
Frente Grupo
ondas, de, 572, 580 SU (2), 236
superficies de acción constante, de, puntual, 264
580 rotaciones, de, 221, 230
Fuerza(s) simplicial, 403
aplicada, 19 transformaciones canónicas, de, 355
centrales, 125
disipación de Rayleigh, de, 66 Hamilton
disipativa(s), 66, 67 óptica geométrica, 567
electromagnéticas, 65 ecuaciones, 88
generalizada, 29 función de, 568, 580
inercial de D’Alambert, 35 principio de, 58, 100, 329
ligadura, de, 17 Hamilton-Jacobi
no centrales, 132 diagonalización de la matriz Hamil-
Función(es) toniana, y, 561
Hamilton principal, de, 366, 367 ecuación de la eiconal, y, 572
Hamilton, principal, de, 580 ecuación dependiente del tiempo, 366
hamiltoniana, 86 ecuación independiente del tiempo,
hamiltoniana caracterı́stica, 568 371
distribución, de, 117, 573, 576, 585 fuerzas centrales, para, 438
elı́pticas de Jacobi, 282, 288 mecánica cuántica, y, 580
generatriz, 343, 362 perturbaciones degeneradas, y, 495
transformación canónica, de una, variables de acción-ángulo, con, 435
108 Hamiltoniano
transformación de Legendre, de constante de movimiento, como, 89
una, 86 corchetes de Poisson, y, 380
lagrangiana, 42 generador infinitesimal, como, 376
onda, de, 583 momento canónico, como, 393
theta, 286 transformaciones canónicas infinite-
simales, y, 374
Gantmacher, F., 30, 167, 250, 336, 415 variable dinámica, como, 378
Generador infinitesimal, 243 Hauser, W., 167
General, ecuación Heisenberg, W., 549, 558
dinámica, de la, 35 desigualdad de, 123
mecánica cuántica de, 397 problema de, 445, 462

Heteroclı́nicos, 538 variables de acción-ángulo, 445
Hidrógeno, átomo de, 577 esféricas, 492
Homocı́clicos, puntos, 538 parabólicas, 462, 492
Huygens, principio de, 568 Klein, parámetros de Cayley y, 236, 301
Kolmogorov, teorema de, 522, 531
Identidad de Jacobi, 384 Kovalevski, trompo de, 270
Impacto, parámetro, 157
Indicatriz, función, 573 Laboratorio, coordenadas de, 161
Índice Lagrange
función de Maslov, 588 acción de, 328
refracción, de, 567 corchetes de, 402
Integral(es) multiplicadores de, 21, 38, 62
acción, de, 58, 321, 329 Lagrangiana
Arnold-Melnikov, de, 528 formulación, 44
elı́ptica, 284, 433 función, 42
movimiento, de, 421 singularidad, 576
Poincaré-Cartán, de, 323 Landau, L. D., 463, 551, 565, 577
polos, por, 439 Legendre, transformación de, 86, 355
primeras, 421 Lema de Caratheodory, 362
Intrı́nseca, degeneración, 516 Lentidud normal de un frente de onda,
Invariantes 573
adiabáticos, 415, 430 Li Hua Chung, teorema de, 332, 337
integrales de Poincaré, 333, 336 Libración, 433
-Cartán, 323, 334 Libres, transformaciones canónicas, 110,
Inversiones, 220 346
Involución Lichtenberg, A, 544
aplicación, 524 Lie, álgebra de, 244, 395, 461
variables dinámicas en, 422 Lieberman, M. A., 544
Irregular(es), movimiento(s), 522, 543 Lifshitz, E., 463, 551, 565, 577
Islas Ligadura(s)
resonancia, en una, 518, 522 holonómicas, 10
resonancias de orden superior, en, cuerpo rı́gido, de, 205
518, 541 esclerónomas, 10
fuerza(s) de, 11, 17, 21
Jacobi, identidad de, 384 ideales, 18
Jacobiano, determinante, 350, 404, 523, no holónomas, 10
575, 576 no integrables, 10
reónomas, 10
KAM trabajo virtual de las fuerzas de, 18
superficie, 537, 540 Lı́nea de nodos, 223
teorema de, 522, 531 Lineal
Keller, reglas de cuantización, 585 estabilidad, 541
Kepler molécula, 182
ecuación de, 147, 449 momento, 76
leyes de, 130, 145 transformación, 175
Linealizado, movimiento, 542 Modos normales de oscilación, 167, 181

Lı́neas caracterı́sticas, tubo de, 323 Molécula de CO2 , 181
Liouville Momento
ecuación de, 573 angular, 78, 256
teorema sobre la función de distri- espacio de, 98
bución, 114, 406 inercia, de, 256
Teorema sobre sistemas integrables, lineal, 77
422 Momentos
Lissajous, figuras de, 132 generalizados, 85
Longitud óptica de un camino, 568, 571 representación de, 91
Moser, teorema de, 522, 531
Magnético Movimiento
campo, 73 acotado, 80, 432
número cuántico, 475 bajo fuerzas centrales, 125
Marion, J., 148, 165, 167 caótico singular, 522
Masa multiplemente periódico, 436
centro de, 125 no acotado, 432
matriz de, 169, 184 planetario, 130
reducida, 126 regular, 522
Maslov separatriz, 432
ı́ndice de, 588
función de, 588 Número
Matriz(ces) cuántico, 139, 144, 461, 475, 585,
Hamiltoniana clásica, 561 587
constantes de resorte, de, 168 grados de libertad, de, 10
derivadas de las funciones de liga- puntos de retorno, de, 589
dura, 23 Nutación, 303
masa, de, 169, 184
mecánica clásica con, 550 O(4), 461
Pauli, de, 232 O(6), 461
rotación, de, 33, 207, 210, 224, 229, Onda
236 ecuación de, 584
simplicial, 403, 405 frente(s) de, 572, 580
transformación, de, 497 función de, 583
Maupertuis, principio de minima acción longitud de, 572, 583
de, 331 materia, de, 580
Mecánica plana, 572
cuántica, 580 Operador, 397
estadı́stica, 114 Óptica geométrica, 330, 567
Schrödinger, 580, 585 Órbita(s)
Media espacial, 575 cerrada, 132
Melnikov, integral de, 528 circulares, 139, 144
Mersenne, fórmula de, 202 ecuación diferencial de las, 131
Método espacio de fase, en el, 100
perturbaciones, de, 479 precesión de las, 132, 133
variacional, 152 Ortogonal(es)
matriz, 208, 222 Poinsot, construcción de, 277

transformaciones, 208 Poisson
Ortogonalidad corchetes de, 378, 380, 555
condiciones de, 208 ecuaciones de, 382
vectores propios, de, 180, 261 Potencial
Ortonormales, vectores propios, 180 centrı́fugo, 131
Oscilaciones longitudinales y transver- dependiente de la velocidad, 66
sales, 182, 189 energı́a, 66
Oscilador(es) escalar, 65
acoplados, 508 generalizado, 66
armónico, 61, 101, 104, 106, 136, vectorial, 65
368, 559, 581 Precesión
bidimensional, 423, 438 órbitas, de las, 132, 149
no lineales, 508, 511, 517 eje de rotación, del, 302
perturbado, 486, 506 nutación, con, 303
pseudoregular, 304
Parámetro de impacto, 157
rápida y lenta, 302
Partı́cula de masa reducida, 126
trompo, 304
Pauli
rápido, de un, 302
diádicos de, 232
Principio
matrices de, 232
Hamilton, de, 97, 100
Péndulo
D’Alambert, de, 35
de Foucault, 311
simple, 419, 431 Fermat, de, 567, 571
Pequeñas oscilaciones mı́nima acción, de, 328, 331
cuerda, de una, 195 trabajos virtuales, de los, 19
modos normales de, 167 Problema
molécula triatómica lineal, de, 167 Kepler, de, 140, 445, 462
sistemas de varios grados de liber- valores y vectores propios, de, 179
tad, 167 variables de acción-ángulo, con, 445,
Perı́odo(s) 462, 492
órbitas elı́pticas, de, 146 Producto(s)
funciones elı́pticas, de, 282 escalar de matrices, 214
péndulo, del, 432 masa, de, 256
puntos fijos de una aplicación, de, Propagación
542 ondas, de, 580
Percival, I. C., 476 superficies de acción constante, de,
Perihelio, 499 580
Pionsot, representación de, 280 Propiedades de simetrı́a
Planck, constante de, 414, 584 hamiltoniana y teoremas de conser-
Plano invariante, 279 vación, de la, 381
Plodia, 279 hamiltoniana, de la, 95
Poincaré lagrangiana, de la, 67, 68
integral de, 333, 336 teoremas de conservación, y, 68
superficie de sección, 427 Punto de retorno, 132, 446, 464
teorı́a de perturbaciones, 482 Puntuales, transformaciones, 42, 101, 357
Rabitz, H., 551 ejes pricipales, de, 261

Raices múltiples integrable, 421
diagonalización del tensor de iner- referencia, de, 3, 161, 310
cia, en la, 261 separable, 442
ecuación secular, de la, 182 variables de acción-ángulo, de, 429,
Rayos, 568 434, 488
Reglas de cuantización, 475, 585 Smirnov, V. I., 257
Regla de suma, 558 Spiegel, M. R., 198, 464, 473
Rı́gido, cuerpo, 205, 253 Stark
Rodadura, ligadura de, 8 efecto cuadrático, 500
Rotaciones efecto lineal, 498
grupo de, 221 Stegun, I., 282, 294, 298
infinitesimales, 241, 376 Stehle, P., 201, 273
Rutherford, E., 160 SU(2), 461
dispersión de, 159 Superficie(s)
acción constante, de, 580
Schrödinger cáustica, 444, 576
ecuación de, 584 KAM rotacional, de, 540
mecánica cuántica de, 585 sección de Poincaré, de, 427, 522
Sección
eficaz, 157
diferencial, 158, 165 Temporal, evolución, 113, 374
total, 158 Tensor
superficie de, 522 inercia, de, 253, 256
Separación de variables métrico, 180
ecuación de Hamilton-Jacobi, en la, Teorı́a
436 Hamilton-Jacobi, de, 364
metodo de, 436 canónica de perturbaciones, 482
Separatriz cuántica
bifurcación de, 538 Heisenberg, de, 397
sobreposición, 543, 544 Schrödinger, de, 585
Simetrı́a perturbaciones
hamiltoniano, propiedades de, 95, adiabáticas, 504
380 degeneradas, 494
cambio de escala, de, 95 dependiente del tiempo, 480
rotación, de, 69, 74 independiente del tiempo, 482
teoremas de conservación, y, 68, 94, matrices, con, 564
380 Teorema(s)
Simplicial Huygens, de, 568
grupo, 403 conservación
matriz, 403 energı́a, de la, 70, 95
transformación, 404 momento angular, del, 78, 95
Sistema momento, del, 76, 95
coordenadas generalizadas, de, 13 propiedades de simetrı́a, y, 68, 94,
ecuaciones de la dinámica, de, 38 380
ecuaciones de la estática, de, 20 Euler sobre
desplazamiento de un cuerpo rı́gi- fases, de, 97

do, el, 217 real, 55
funciones homogéneas, de, 71 variada, 55, 319
Jacobi, de, 366, 389 Traza
KAM, 522, 531 matriz
Li Hua Chung, de, 332, 337 aplicación, de una, 542
Liouville, de, 114, 406 rotación, de, 220
Poincaré-Birkhoff, de, 537 Trompo
sistemas integrables, sobre los, 422 dormido, 306
virial, del, 80 Foucault, de, 314
Thomas-Kuhn, regla de suma de, 558 rápido, 302
Tiempo simétrico con un punto fijo, 295
condición inicial, como, 70 Tubo de trayectorias, 323, 434, 575
variable dinámica, como, 390, 392
Toroide(s) Unidad diádico, 214
invariante, 420, 422, 423, 476 Universal, integral invariante, 334
no resonantes, 531
resonantes, 531
Valores propios
Trabajo
degenerados, 188, 190
fuerzas aplicadas, de las, 57
ecuación de, 171, 179
virtual, 19
matriz
Transformación(es)
homográfica y parámetros de Cayley- hamiltoniana, de la, 561
Klein, 240 hermı́tica, de una, 554
homotética, 573 tensor de inercia, del, 261, 267
cambio de escala, de, 96, 107 Van der Waerden, B. L., 549
canónica, 107, 319, 343, 400 Van Vleck, J.H.,, 585
libre, 109, 346 Variables
canónicas infinitesimales, 374 acción, de, 436
contacto, de, 107, 569 acción-ángulo, 429
coordenadas dinámicas, 6, 378
normales, a, 175 Variación que incluye el tiempo, 320
relativas y de centro de masa, a, Variacional, método, 152
125 Vector(es)
rotantes, 92 Laplace, de, 459, 463
Galileo, de, 68 propagación, 572
identidad, 347, 374 propios
Legendre, de, 86, 355 ortogonales, 180
lineal, 360 ortogonalidad de los, 180
ortogonales, 208 pequeñas oscilaciones, en, 179
puntuales, 42, 101, 357 tensor de inercia, del, 261, 267
simplicial, 404 Velocidad
unitarias, 562 angular, 244, 246, 254
variables acción-ángulo, a, 429, 435 areolar, 130
Trayectoria generalizada, 14
circuitosa, 55 precesión, de, 133, 152
superficies de acción constante, de

las, 581
Vibraciones
cuerda, de una, 195
molecula triatómica lineal, de la, 182
Virtual
desplazamiento, 15
trabajo, 19
Volumen en el espacio de fases, 116, 121,
406
Watson, G. N., 282, 299

Whitaker, E. T., 282, 299, 326
ecuaciones de, 325
WKB, aproximación de, 591
Se terminó de imprimir
en la Imprenta Universidad de Antoquia
en febrero de 2006

Jorge Mahecha-Mecanica Clasica Avanzada-Editorial Universidad de Antioquia (2006) PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Jorge Mahecha-Mecanica Clasica Avanzada-Editorial Universidad de Antioquia (2006) PDF

Cargado por

Copyright:

Formatos disponibles

Jorge Mahecha Gómez Mecánica clásica avanzada

Mahecha Gómez, Jorge

CEP-Banco de la República-Biblioteca Luis-Ángel Arango

Primera edición: enero de 2006

Impreso y hecho en Colombia / Printed and made in Colombia

Editorial Universidad de Antioquia

Imprenta Universidad de Antioquia

1. Fundamentos de la mecánica newtoniana 1

2. Ecuaciones generales de la estática y la dinámica 7

3. El principio de Hamilton y las ecuaciones de Lagrange 55

4.6. La función generatriz

5. Movimiento de dos partı́culas

6. Pequeñas oscilaciones de sistemas

7. Cinemática del cuerpo rı́gido 205

8. Dinámica del cuerpo rı́gido 253

9. Las transformaciones canónicas 319

10.La ecuación de Hamilton-Jacobi con variables de acción-ángulo 415

11.Teorı́a de perturbaciones 479

12.Correspondencia con la mecánica cuántica de Heisenberg 549

13.Correspondencia con la mecánica cuántica de Schrödinger 567

cuántica, y muchos otros temas que yo no soy el llamado a valorar.

JORGE MAHECHA GÓMEZ

1.1. Conceptos preliminares

Importancia. El mundo percibido por el hombre directamente a través de sus sen-

Rango de validez. La mecánica clásica no relativı́stica es aplicable cuando las

Modelos fundamentales en la mecánica. En las teorı́as mecánicas los cuerpos

Partes de la mecánica. Tradicionalmente se divide en estática, cinemática y

dinámica. En el curso se tratan dos clases de temas:

1.2. Sistema de referencia. Estado de un sistema me-

Estado de un sistema mecánico. Es necesario distinguir los conceptos de estado

También es posible una descripción en términos de las coordenadas en dos tiempos

se dice que el sistema es libre. Si lo anterior no es posible, es porque hay restriccio-

Ecuaciones de movimiento para un sistema de partı́culas. Supondremos

F~i (~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t) =

Las ecuaciones de movimiento serán:

Este último es un sistema de N ecuaciones diferenciales, en general no lineales, de

Problemas separables. Son aquellos en los cuales el sistema de ecuaciones de

2.1. Las ligaduras

(x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 = constante (2.1)

|r~2 − r~3 | = b (2.2)

x2i + yi2 + zi2 − a2 = 0 ; i = 1, 2, ... N (2.4)

donde R~ CM y R~˙ CM son la posición y velocidad del centro de masa y φ̇ es la velocidad

Figura 2.1 Disco rodando sobre un plano

de libertad. Las condiciones de ligadura para un sistema de partı́culas pueden siempre

Ligaduras no holonómicas. También se llaman no integrables, diferenciales o

fα (R, ~˙ θ, φ, ψ, θ̇, φ̇, ψ̇; t) = 0 ;

donde ~lα , mα , nα , σα , Pα , son funciones de R,

donde ~lαi y Dα son funciones de ~r1 , ~r2 , ... ~rN , t.

Las ligaduras consideradas como fuerzas. La noción de ligadura es puramente

|~r1 − ~r2 | = l (2.17)

Pero podemos, si queremos, modelar dicha fuerza, digamos que considerándola

donde k ′ serı́a la constante de resorte, l la separación de las partı́culas en la posición

k ′ . Por lo tanto las fuerzas de ligadura F~ ′ 1 y F~ ′ 2 son indeterminadas; su valor depende

2.2. Las coordenadas generalizadas

Clasificación de los grados de libertad. Sea un sistema de partı́culas sin liga-

Las coordenadas generalizadas. Sea un sistema de N partı́culas con h condicio-

xi = xi (q1 , q2 , ... q3N −h , t)

yi = yi (q1 , q2 , ... q3N −h , t) (2.21)

zi = zi (q1 , q2 , ... q3N −h , t) ; i = 1, 2, ... N

donde q1 , q2 , ... q3N −h son las coordenadas generalizadas y la transformación depen-

f~α (q1 , q2 , ... q3N −h , t) ≡

Usaremos la siguiente notación: los subı́ndices latinos se refieren a cantidades que

Si k = h, o sea si n = 0, entonces q será un conjunto de coordenadas generalizadas