Está en la página 1de 620

Jorge Mahecha Gómez Mecánica clásica avanzada

Mahecha Gómez, Jorge


Mecánica clásica avanzada / Jorge Mahecha Gómez. –
Medellı́n : Editorial Universidad de Antioquia, 2006.
xiv, 608 p. : il., diagrs. ; 24 cm.
Incluye bibliografı́a e ı́ndice.
ISBN: 958-655-847-9
1. Mecánica 2. Estática 3. Cinemática 4. Dinámica
I. Tı́t.
531 cd 19 ed.
A1072576

CEP-Banco de la República-Biblioteca Luis-Ángel Arango


Mecánica clásica avanzada
Jorge Mahecha Gómez

Ciencia y Tecnologı́a
Editorial Universidad de Antioquia
Colección Ciencia y Tecnologı́a
c Jorge Mahecha Gómez
c Editorial Universidad de Antioquia
ISBN: 958-655-847-9

Primera edición: enero de 2006


Diseño de cubierta: Erledy Arana Grajales, Imprenta Universidad de Antioquia
Diagramación: Patricia Arredondo
Corrección de textos: Arley Cárdenas
Coordinación editorial: Gonzalo Montoya Velásquez
Impresión y terminación: Imprenta Universidad de Antioquia

Impreso y hecho en Colombia / Printed and made in Colombia


Prohibida la reproducción total o parcial, por cualquier medio o con cualquier
propósito, sin autorización escrita de la Editorial Universidad de Antioquia

Editorial Universidad de Antioquia


Teléfono: (574) 210 50 10. Telefax: (574) 263 82 82
E-mail: mercadeo@editorialudea.com
Página web: www.editorialudea.com
Apartado 1226. Medellı́n. Colombia

Imprenta Universidad de Antioquia


Teléfono: (574) 210 53 30. Telefax: (574) 210 53 32
E-mail: imprenta@quimbaya.udea.edu.co
Índice general

1. Fundamentos de la mecánica newtoniana 1


1.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Sistema de referencia. Estado de un sistema mecánico. Ligaduras. Ecua-
ciones de movimiento para un sistema de partı́culas. Variables dinámicas.
Problemas separables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2. Ecuaciones generales de la estática y la dinámica 7


2.1. Las ligaduras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Las coordenadas generalizadas . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3. Los desplazamientos virtuales . . . . . . . . . . . . . . . . . . . . . . . . 15
2.4. La ecuación general de la estática . . . . . . . . . . . . . . . . . . . . . . . 19
2.5. Las ecuaciones de la estática en coordenadas generalizadas . . . . . . . . . 28
2.6. La ecuación general de la dinámica . . . . . . . . . . . . . . . . . . . . . . 35
2.7. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas
holónomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.8. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas
no holónomos. Uso de coordenadas no independientes . . . . . . . . . . . 46

3. El principio de Hamilton y las ecuaciones de Lagrange 55


3.1. Forma integral de la ecuación general de la dinámica para un sistema
holónomo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2. El principio de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3. Algunas propiedades de la función lagrangiana . . . . . . . . . . . . . . . 67
3.4. Simetrı́as de la lagrangiana y teoremas de conservación . . . . . . . . . . 68
3.5. El teorema del virial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

4. La formulación hamiltoniana 85
4.1. Las variables hamiltonianas de estado . . . . . . . . . . . . . . . . . . . . 85
4.2. Simetrı́as y el teorema de conservación . . . . . . . . . . . . . . . . . . . . 94
4.3. La segunda forma del principio de Hamilton . . . . . . . . . . . . . . . . 97
4.4. Las transformaciones puntuales. Las transformaciones en el espacio de fases101
4.5. Las transformaciones canónicas
o de contacto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

v
vi

4.6. La función generatriz


de una transformación canónica . . . . . . . . . . . . . . . . . . . . . . . . 108
4.7. La evolución temporal de un sistema
considerada como una transformación
canónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.8. El teorema de Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5. Movimiento de dos partı́culas


que interactúan por medio de una fuerza central 125
5.1. Coordenadas de centro de masa
y coordenadas relativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5.2. El oscilador armónico tridimensional . . . . . . . . . . . . . . . . . . . . . 136
5.3. El potencial 1/r . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
5.4. El problema de la dispersión bajo fuerzas centrales . . . . . . . . . . . . . 156

6. Pequeñas oscilaciones de sistemas


de varios grados de libertad 167
6.1. Modos normales de oscilación. Caso
no degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.2. Modos normales de oscilación. Caso
degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
6.3. Un campo mecánico unidimensional:
la cuerda uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

7. Cinemática del cuerpo rı́gido 205


7.1. Definición de cuerpo rı́gido . . . . . . . . . . . . . . . . . . . . . . . . . . 205
7.2. Sistemas de coordenadas espacial
y del cuerpo rı́gido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
7.3. Los cosenos directores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
7.4. El teorema de Euler acerca del movimiento de un cuerpo rı́gido . . . . . . 217
7.5. El rotador rı́gido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
7.6. Los ángulos de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
7.7. Descripción de las rotaciones en términos de n̂ y Φ. Parámetros de Euler . 226
7.8. Representación del grupo de rotaciones
por medio de matrices 2 × 2. Los parámetros
de Cayley-Klein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
7.9. Las rotaciones infinitesimales. Cinemática de las rotaciones . . . . . . . . 241

8. Dinámica del cuerpo rı́gido 253


8.1. El tensor de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
8.2. Diagonalización del tensor de inercia . . . . . . . . . . . . . . . . . . . . . 260
8.3. Las ecuaciones de movimiento de Euler . . . . . . . . . . . . . . . . . . . 268
8.4. El movimiento de un cuerpo rı́gido libre . . . . . . . . . . . . . . . . . . . 277
8.5. El trompo con el punto inferior fijo en un campo gravitacional homogéneo 295
8.6. Movimiento en un sistema de referencia no inercial . . . . . . . . . . . . . 310
vii

9. Las transformaciones canónicas 319


9.1. La acción en función de las variables de estado . . . . . . . . . . . . . . . 319
9.2. La integral invariante de Poincaré-Cartán . . . . . . . . . . . . . . . . . . 323
9.3. El principio de mı́nima acción y expresiones equivalentes . . . . . . . . . . 328
9.4. El teorema de Li Hua Chung . . . . . . . . . . . . . . . . . . . . . . . . . 332
9.5. Las transformaciones canónicas . . . . . . . . . . . . . . . . . . . . . . . . 343
9.6. La ecuación de Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . . . . . . 364
9.7. Las transformaciones canónicas infinitesimales . . . . . . . . . . . . . . . . 374
9.8. Los corchetes de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378
9.9. Pruebas del carácter canónico de una transformación . . . . . . . . . . . . 400

10.La ecuación de Hamilton-Jacobi con variables de acción-ángulo 415


10.1. Los invariantes adiabáticos . . . . . . . . . . . . . . . . . . . . . . . . . . 415
10.2. Los toroides invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
10.3. Las variables acción-ángulo . . . . . . . . . . . . . . . . . . . . . . . . . . 429
10.4. Problema de Kepler (coordenadas esféricas) . . . . . . . . . . . . . . . . . 445
10.5. Problema de Kepler (coordenadas parabólicas) . . . . . . . . . . . . . . . 462

11.Teorı́a de perturbaciones 479


11.1. Teorı́a de perturbaciones dependiente del tiempo . . . . . . . . . . . . . . 480
11.2. Teorı́a de perturbaciones independiente del tiempo . . . . . . . . . . . . . 482
11.3. Multiplicidad de conjuntos de variables acción-ángulo en los sistemas de-
generados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488
11.4. Teorı́a de perturbaciones de sistemas degenerados . . . . . . . . . . . . . 494
11.5. Perturbaciones adiabáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . 504
11.6. Sistema de osciladores lineales con acoplamiento no lineal . . . . . . . . . 508
11.7. Movimiento cerca de una resonancia aislada . . . . . . . . . . . . . . . . 513
11.8. Movimientos regulares e irregulares . . . . . . . . . . . . . . . . . . . . . . 522

12.Correspondencia con la mecánica cuántica de Heisenberg 549


12.1. Representación matricial de variables dinámicas . . . . . . . . . . . . . . . 550
12.2. Corchetes de Poisson y conmutadores de matrices clásicas . . . . . . . . . 555
12.3. Problemas mecánicos a la manera de Heisenberg . . . . . . . . . . . . . . 558
12.4. Ecuación de Hamilton-Jacobi y diagonalización de la matriz hamiltoniana 561
12.5. Teorı́a de perturbaciones con matrices clásicas . . . . . . . . . . . . . . . 564

13.Correspondencia con la mecánica cuántica de Schrödinger 567


13.1. Ideas de Hamilton acerca de las transformaciones canónicas . . . . . . . . 567
13.2. Función de distribución de probabilidades . . . . . . . . . . . . . . . . . . 573
13.3. La mecánica ondulatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 580
13.4. La función de onda semiclásica según Keller y Maslov . . . . . . . . . . . 585
A Isabel.
A Clara.
A Eduardo y Andrés.
Prefacio
No trataré de exponer razones para la aparición de un nuevo texto de mecánica
clásica. La acogida que reciba mi trabajo en la comunidad universitaria indicará si en
su concepción y realización satisface una necesidad existente en este campo.
Hay bellas canciones tradicionales, pero ello no impide que aparezcan nuevas compo-
siciones. Tampoco se pide a un compositor que diga las necesidades del público que
pretende complacer. Tal vez en toda obra que se realice sin interés de lucro, la principal
motivación esté en el placer experimentado por el autor al superar paulatinamente el
reto que voluntariamente se ha impuesto. Considero que estas reflexiones son válidas
respecto al presente trabajo.
Aunque la redacción del manuscrito y el trabajo mecanográfico se realizaron fuera de
la Universidad, es justo reconocer que el origen y la finalidad del texto, ası́ como su
reprodución, están dentro de ella. He dictado el curso de Mecánica Clásica Avanzada
en varias ocasiones y el presente trabajo tiene como núcleo los manuscritos de las clases
distribuidos a los alumnos. Con sus discusiones muchos estudiantes colaboraron positi-
vamente. Algunos colegas me contribuyeron con sugerencias y discusiones útiles, como
los señores Fernando Medina, Alberto Sánchez, Augusto Montes, Román Castañeda y
Roberto Martı́nez. Debo reconocer que la idea de escribir un libro de mecánica clásica
la recibı́ del profesor Fabio Machado.
He tratado de hacer una presentación de los temas en forma muy clara, lo cual des-
afortunadamente ha resultado en contra de la concisión. Especialmente en los ejemplos,
no aconsejo una lectura sino un desarrollo de los problemas por parte del lector. Por
tratarse de un texto de estudio y no de una obra divulgativa, no he considerado nece-
sario esforzarme por suprimir algunas fórmulas y frases redundantes. He tratado más
bien de evitar los errores en el contenido. De antemano pido excusas a los lectores por
las deficiencias estilı́sticas de mi trabajo, y especialmente por los errores que puedan
encontrar.
El plan de la obra consiste en desarrolar los temas tradicionales (formulaciones dalamber-
tiana, lagrangiana y hamiltoniana, fuerzas centrales, cuerpo rı́gido, pequeãs oscilaciones,
transformaciones canónicas, el método de Hamilton-Jacobi y la teorı́a clásica de pertur-
baciones), con la elaboración de ciertos puntos en los que no se profundiza en los textos
usuales, y especialmente en buscar ilustraciones concretas. He tratado también algunos
problemas de la mecánica clásica que son objeto de investigación en la actualidad. El
lector encontrará una presentación más completa que en los textos tradicionales de mu-
chas cuestiones como: el tratamiento de sistemas holónomos, el uso de las coordenadas
generalizadas, las transformaciones canónicas, el oscilador isotrópico, el método varia-
cional, la cuerda uniforme, los parámetros de Euler y los parámetros de Cayley-Klein,
las funciones elı́pticas de Jacobi, las ecuaciones de Euler en sistemas de referencia ro-
tantes, la brújula de Foucault, la formulación de la mecánica según Poincaré, el teorema
de Liouville sobre los sistemas integrables, un tratamiento exhaustivo del problema de
Kepler con variables acción-ángulo, la teorı́a canónica de perturbaciones, el teorema
de K.A.M, los movimientos caóticos en sistemas hamiltonianos, una formulación de la
mecánica clásica con matrices, dos presentaciones de los fundamentos de la mecánica
x

cuántica, y muchos otros temas que yo no soy el llamado a valorar.


El tratamiento de la mecánica basado en la teorı́a matemática de las variedades dife-
renciales y en el cálculo diferencial e integral de Cartan ha sido excluido por obvias
razones. Esto no implica que le reste valor al uso de las matemáticas contemporáneas.
El matemático A. N. Kolmogorov decı́a que es mucho más importante obtener resulta-
dos correctos que rigurosos. Para un fı́sico lo anterior es profundamente válido: no hay
nada menos riguroso desde el punto de vista teórico que un resultado experimental, pero
tampoco nada que sea más cierto ni bello.
La aplicación de la teorı́a de grupos a las vibraciones moleculares, los campos mecáni-
cos, los sistemas con vı́nculos, los fractales y el caos en sistemas disipativos, son algunos
temas importantes de la mecánica clásica contemporánea que no han sido incluidos. Tal
vez si es posible una segunda edición?
Mis obras de consulta son excelentes textos (ver bibliografı́a) como los de Whittaker,
Landau-Lifshitz, Arnold, Gantmacher, Goldstein, Born, Corben-Stehle, Marion, Lan-
czos, etc., ası́ como numerosas monografı́as y artı́culos especializados. Mi trabajo se
alimenta en gran parte de estas obras aunque me he esforzado por evitar el plagio. Dejo
a los lectores la determinación del grado de originalidad del libro que tienen en sus ma-
nos.
Esta es una obra de referencia para profesores y estudiantes de cursos de pregrado y
posgrado en fı́sica, y puede servir como texto guı́a mediante una adecuada selección de
los temas, complementado con ejercicios. Con los capı́tulos I, II, III, IV, V y VI, y un
resumen del VII, puede cubrirse el curso de pregrado. Con un resumen de unas quince
horas del curso de pregrado, los capı́tulos VIII y IX, y una selección de temas de los
capı́tulos X, XI, XII y XIII puede cubrirse el curso de postgrado. La comprensión de
este material facilita la solución de problemas de investigación y escuchar sin grandes
dificultades conferencias en el campo de la dinámica clásica.

JORGE MAHECHA GÓMEZ


Medellı́n, Junio de 1987.
1
Fundamentos de la mecánica newtoniana

1.1. Conceptos preliminares


Mecánica. Es la ciencia que estudia el comportamiento de la materia a partir
del movimiento de las partı́culas constituyentes. En la mecánica la máxima información
acerca de un sistema de partı́culas consiste en obtener las posiciones y velocidades de
cada una de ellas en cada instante de tiempo, respecto a un sistema de referencia dado.
Para la solución de cualquier problema mecánico es necesario: definir un sistema de re-
ferencia, hallar las coordenadas más adecuadas para describir el sistema y plantear las
ecuaciones de movimiento de cuya solución se obtendrán las coordenadas y velocidades
en función del tiempo.

Importancia. El mundo percibido por el hombre directamente a través de sus sen-


tidos se denomina macroscópico. La mecánica clásica brinda la formulación más completa
del comportamiento de la mayorı́a de fenómenos macroscópicos, por ello es el instrumen-
to teórico por excelencia en ramas como: arquitectura e ingenierı́a de construcciones,
ingenierı́a mecánica que está en la base de la moderna industria de la maquinaria, la ae-
ronáutica y la astronáutica, la geofı́sica, etc. Podemos decir que la ciencia de la mecánica
ha sido estimulada por el desarrollo de la gran industria y a la vez le ha contribuido a
ésta de manera importante.
La mecánica clásica no es una ciencia acabada. En primer lugar, hay muchos pro-
blemas fundamentales que son estudiados en la actualidad (Arnold, Abraham, Maslov,
etc. son nombres asociados a desarrollos contemporáneos de la mecánica). En segundo
lugar, hay problemas fundamentales de la fı́sica (entendida como la ciencia o conjunto de
ciencias que estudian las propiedades elementales de la materia) que utilizan la mecánica
clásica como teorı́a básica en el grado de validez de la misma (metrologı́a, fı́sica de los
plasmas, estado sólido, astrofı́sica, sistemas atómicos, sistemas nucleares y de partı́cu-
las elementales en estados altamente excitados, etc.). Una revisión de los temas en que
trabaja una inmensa mayorı́a de los fı́sicos contemporáneos nos muestra que sus objetos
de investigación no son las teorı́as fundamentales sino problemas especı́ficos referentes a
las propiedades de sistemas fı́sicos reales (núcleos, sólidos, átomos, gases, lı́quidos, luz,

1
2 / Mecánica clásica avanzada

etc.). Una visión histórica nos muestra que los virajes en el desarrollo de la fı́sica se
han producido a partir de las investigaciones en problemas especı́ficos que se salen del
rango de validez de las teorı́as existentes. O sea que las modernas teorı́as fı́sicas no han
invalidado la mecánica clásica sino que simplemente han restringido su rango de validez.
Por último, en la mecánica clásica está el germen de las teorı́as más completas como
la mecánica cuántica o la relatividad general. Tales teorı́as utilizan los conceptos de la
mecánica clásica y los introducen en sus formalismos cambiándoles el contenido. Las no-
ciones de energı́a, momentum, velocidad, posición, etc., tienen su origen en la mecánica
clásica, pero mantienen una importancia relevante dentro de las nuevas teorı́as. Podemos
concluir que un conocimiento riguroso de la mecánica clásica es indispensable para el
estudio cabal de la mecánica cuántica y demás teorı́as contemporáneas.

Rango de validez. La mecánica clásica no relativı́stica es aplicable cuando las


velocidades involucradas son mucho menores que la velocidad de la luz.1 La aplicabilidad
de la mecánica cuántica a sistemas microscópicos como átomos y moléculas está restrin-
gida a los estados en los cuales el producto del momento lineal de las partı́culas por la
dimensión caracterı́stica de la región que ocupan sea del orden Hde la constante de Planck
(o más exactamente, la mecánica clásica es aplicable cuando pdq ≫ h). No es exacto
afirmar que la mecánica clásica es aplicable sólo en el mundo macroscópico. Hay proble-
mas de microfı́sica como: átomos en estados excitados, la dispersión de electrones por
una radiación LASER, el movimiento de electrones en algunas moléculas, el movimiento
de electrones en campos eléctricos y magnéticos, etc., en los cuales se puede utilizar la
mecánica clásica. En fin, sólo un análisis del problema especı́fico que se tenga permite
decidir si la mecánica clásica es aplicable, si se puede usar como una aproximación o si
es completamente inadecuada.

Modelos fundamentales en la mecánica. En las teorı́as mecánicas los cuerpos


reales son representados por medio de nociones abstractas como las de ”punto mate-
rial”(partı́cula), ”sólido rı́gido”, etc. Un punto material es un cuerpo cuyas dimensiones,
forma y estructura interna carecen de importancia para la resolución de un determinado
problema; esto ocurre cuando las dimensiones que aparecen en el problema son mucho
más grandes que las de los cuerpos involucrados y cuando la estructura interna dé lugar
a efectos secundarios en el contexto en que se trabaja. Un sólido rı́gido es un cuerpo
que se considera formado por gran cantidad de partı́culas, de tal modo que la distancia
entre dos cualesquiera es constante y que la forma y dimensiones del cuerpo no cambian
cuando éste se mueve. Usualmente un sólido rı́gido se considera formado de un núme-
ro muy grande de partı́culas, que con muy buena aproximación se pueden considerar
formando una distribución continua de masa. En la interacción de dos cuerpos rı́gidos
por contacto se asumen dos modelos: el contacto perfectamente liso y el perfectamente
rugoso. Lo anterior es importante en el análisis de las fuerzas internas llamadas de liga-
dura. Otro modelo es el de cuerpo deformable, básico en las teorı́as de campos mecánicos.

Partes de la mecánica. Tradicionalmente se divide en estática, cinemática y


1 Estamos adoptando el punto de vista que consiste en considerar como clásica a toda teorı́a fı́sica
que no dé cuenta de los efectos indeterministas de tipo cuántico y permite una descripción causal en
sentido clásico. En particular, consideramos clásicas las teorı́as especial y general de la relatividad.
Fundamentos de mecánica newtoniana / 3

dinámica. En el curso se tratan dos clases de temas:


1) Generales. Leyes generales de la estática y la dinámica (formalismos lagrangiano,
hamiltoniano, poissoniano y de Hamilton-Jacobi), cinemática y dinámica del movimiento
de rotación.
2) Espaciales. Problema de los dos cuerpos, movimiento del sólido rı́gido y vibra-
ciones mecánicas.
Las teorı́as, incluyendo la mecánica clásica, adquieren su verdadera relevancia cuan-
do se las aplica a situaciones reales. Las teorı́as tratan de las leyes generales pero el desa-
rrollo de la fı́sica se halla impulsado por el estudio de problemas especı́ficos. Por esto,
hacemos especial énfasis en los ejemplos y en la presentación de cálculos detallados.

1.2. Sistema de referencia. Estado de un sistema me-


cánico. Ligaduras. Ecuaciones de movimiento pa-
ra un sistema de partı́culas. Variables dinámicas.
Problemas separables.
Sistema de referencia. Se entiende por tal a un cuerpo rı́gido real o ficticio que
sirve de referencia para estudiar el movimiento del sistema mecánico considerado. Se
supone que tal sistema de referencia está rı́gidamente unido con un sistema de coorde-
nadas; esto permite ubicar la posición de cada partı́cula del sistema mecánico respecto
del sistema de referencia.
Además en el sistema de referencia hay un “cronómetro” que permite determinar
los instantes en que cada partı́cula del sistema ocupa una posición dada del espacio. El
sistema de referencia no tiene ninguna propiedad que pueda afectar al sistema mecánico,
aunque sı́ es de esperarse que la descripción obtenida dependa del estado del movimiento
del sistema de referencia.
Ası́ como para especificar la longitud de un objeto se requiere un patrón de longi-
tud con una unidad de medida asociada, la descripción del movimiento de un sistema
mecánico requiere de un “patrón”mecánico que no es más que el sistema de referencia.
La unidad de medida es análoga al sistema de coordenadas. La elección del sistema de
coordenadas en un sistema de referencia es cuestión de comodidad. Hay un número in-
finito de sistemas de coordenadas posible. Con una elección de sistema de coordenadas
se busca que las ecuaciones de movimiento sean fácilmente solubles y que la solución
sea lo más simple posible. En cualquier sistema de coordenadas es posible escribir las
ecuaciones de movimiento, pero puede ocurrir que no sean solubles. Encontrar el ade-
cuado sistema de coordenadas que permita resolver las ecuaciones de movimiento es un
importante problema matemático que llega a involucrar la teorı́a de grupos, la geometrı́a
diferencial y otras ramas de las matemáticas.

Estado de un sistema mecánico. Es necesario distinguir los conceptos de estado


y de descripción de estado. La noción de estado es intuitiva (análoga a las nociones de
longitud, duración, etc.), involucra sólo aspectos cualitativos, de carácter objetivo. La
descripción del estado implica nociones geométricas a través del sistema de referencia
4 / Mecánica clásica avanzada

y el sistema de coordenadas que es necesario elegir (hay analogı́a con las nociones de
distancia, intervalo de tiempo, etc., que implican aspectos cuantitativos). Clásicamen-
te para la especificación o descripción completa del estado de un sistema mecánico se
requiere, por ejemplo, conocer la posición y velocidad de cada una de las partı́culas en
un tiempo dado. Es imposible obtener la descripción del estado sin tener un sistema
de referencia y un sistema de coordenadas. En cualquier rama de la fı́sica, y en general
cualquier ciencia cuantitativa, se requiere de la noción de estado. El tipo de descripción
depende del sistema que se trate: el estado de un sistema de partı́culas en mecánica
clásica se describe mediante posiciones y velocidades; en mecánica cuántica se descri-
be mediante la función de onda del sistema. El estado termodinámico de un sistema
macroscópico se describe mediante un conjunto de variables termodinámicas como P ,
V , T , etc. En economı́a, el estado finanaciero de una empresa, por ejemplo, se describe
mediante una serie de parámetros que evolucionan con el tiempo; qué parámetros son
relevantes, depende del modelo, ası́ como de la ecuación de evolución.
El sistema de referencia se denomina a veces espacio fı́sico de representación. El
sistema de coordenadas permite representar cada estado del sistema por un punto. La
representación de los estados ya forma parte de la teorı́a fı́sica, pero siempre existe el
supuesto de que hay una correspondencia que permite asociar a cada estado de movi-
miento del sistema un punto del espacio de representación, o, para ser más exactos, una
trayectoria en dicho espacio. A un sistema de N partı́culas se le asocian 3N coordenadas
y 3N velocidades. Los estados del sistema se pueden representar por puntos del espacio
de representación, llamado espacio de configuración, y sus vectores tangente y veloci-
dades. También los estados se pueden representar por puntos del espacio de fases 6N
dimensional. Una descripción puede ser por medio de las 6N cantidades:

{ x1 (t), y1 (t), z1 (t); x2 (t), y2 (t), z2 (t); ...xN (t), yN (t), zN (t);
(1.1)
ẋ1 (t), ẏ1 (t), ż1 (t); ẋ2 (t), ẏ2 (t), ż2 (t); ...ẋN (t), ẏN (t), żN (t) }

También es posible una descripción en términos de las coordenadas en dos tiempos


diferentes, t y t′ . No basta, pues, conocer los valores iniciales de las coordenadas ya
que además se requiere información acerca de cómo cambian con el tiempo para poder
predecir cuál será la configuración del sistema en otro tiempo. Para lo anterior desde el
punto de vista meramente matemático, se requerirı́a conocer todas las derivadas tempo-
rales de las coordenadas y velocidades que en un tiempo determinan los valores de las
mismas en cualquier otro instante. En conclusión, el espacio de representación para un
sistema de N partı́culas tiene 6N dimensiones. Los distintos formalismos de la mecánica
se caracterizan, entre otras cosas, por el tipo de espacio de representación que emplean.
La formulación newtoniana utiliza las posiciones y velocidades de las partı́culas. La for-
mulación lagrangiana, las coordenadas y velocidades generalizadas. Las formulaciones
de Hamilton y Poisson, las coordenadas y momentos generalizados. La formulación de
Hamilton-Jacobi utiliza constantes de movimiento. La mecánica cuántica utiliza otro
tipo de descrición del estado: los vectores de estado del espacio de Hilbert del sistema.

Ligaduras. Si con sólo cambiar las fuerzas y las condiciones iniciales las partı́cu-
las del sistema pueden ocupar cualquier posición en el espacio o cualquier velocidad,
Fundamentos de mecánica newtoniana / 5

se dice que el sistema es libre. Si lo anterior no es posible, es porque hay restriccio-


nes, llamadas ligaduras mecánicas. Las ligaduras disminuyen el número de cantidades
independientes necesarias para especificar completamente el estado del sistema. Si hay
k condiciones de ligadura independientes, el número de cantidades independientes ne-
cesarias para especificar la configuración del sistema (llamado el número de grados de
libertad) será 3N − k = 1. En lo que sigue supondremos conocidos los conceptos refe-
rentes a: trayectoria, primera ley de Newton, sistemas de referencia inerciales, segunda
y tercera ley de Newton, trabajo y energı́a, y teoremas de conservación del momento
lineal, la energı́a y el momento angular.

Ecuaciones de movimiento para un sistema de partı́culas. Supondremos


que las fuerzas que actúan sobre una partı́cula son función de las coordenadas y velo-
cidades de todas las partı́culas del sistema, y que se pueden descomponer a una parte
debida a efectos exteriores al sistema y a otra debida a las demás partı́culas del sistema.
La fuerza neta sobre la partı́cula i (i = 1, 2, ...N ) será:

F~i (~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t) =


 
F~ei ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t (1.2)
N
X  
+ ′~
Fij ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t
j=1

Se supone que las partı́culas del sistema sólo interactúan entre pares; la prima
en la sumatoria indica que excluye j = i. En el caso más general F~ei y F~ij dependen
de las coordenadas y de las velocidades de todo el sistema. Usualmente se cumple lo
siguiente: (a) Las fuerzas entre las partı́culas i y j dependen sólo de las coordenadas y
de las velocidades de éstas; (b) La fuerza externa sobre la partı́cula i sólo depende de
sus coordenadas y velocidades:
 
F~i ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t =
N
X
F~ei (~ri , ~r˙ i ; t) + ′~
Fij (~ri , ~rj , ~r˙ i , ~r˙ j ) (1.3)
j=1

Las ecuaciones de movimiento serán:


N
X    
′~
Fij ~ri , ~rj , ~r˙ i , ~r˙ j + F~ei ~ri , ~r˙ i ; t = mi~¨r i i = 1, 2, ...N (1.4)
j=1

Este último es un sistema de N ecuaciones diferenciales, en general no lineales, de


segundo orden, acopladas, con N incógnitas (~r1 , ~r2 , ...~rN ), o si se quiere, de 3N ecuacio-
nes diferenciales escalares con 3N incógnitas. La solución de estas ecuaciones contiene
6N constantes de integración, que pueden tomarse como las 3N coordenadas y las 3N
velocidades en el tiempo t = t0 , y proporciona directamente la especificación completa
del estado del sistema.
6 / Mecánica clásica avanzada

Variables dinámicas. Cualquier función del estado del sistema y del tiempo se
denomina una variable dinámica. Las coordenadas o las velocidades mismas son varia-
bles dinámicas. También lo son el momento angular, la energı́a, el momento lineal, las
coordenadas del centro de masa, etc. Un conjunto de 6N funciones (independientes entre
sı́) de las coordenadas y las velocidades constituye un conjunto completo de variables
dinámicas y sirve para especificar completamente el estado del sistema. Una clase espe-
cial de variables dinámicas es constituida por las constantes de movimiento. Un conjunto
máximo de constantes de movimiento, 6N , permite describir completamente el estado
del sistema. En mecánica cuántica pueden haber a lo sumo 3N constantes de movimiento
independientes, exactamente definidas; entonces las otras 3N constantes serán comple-
tamente indefinidas. La mecánica newtoniana en su forma original es adecuada para el
estudio de sistemas libres. Para sistemas con ligaduras es más conveniente el formalis-
mo lagrangiano. Desde el punto de vista teórico es deseable un formalismo en el cual
las ecuaciones del movimiento sean covariantes y en el cual la mecánica se deduzca de
principios más generales (variacionales); en este sentido también es más útil la mecánica
lagrangiana.

Problemas separables. Son aquellos en los cuales el sistema de ecuaciones de


movimiento acopladas, es posible mediante algún cambio de variables reducirlo a un
sistema de 3N ecuaciones diferenciales desacopladas, o sea, 3N ecuaciones donde en
cada ecuación hay sólo una incógnita. En principio algunos problemas mecánicos son
separables, pero en la mayorı́a de los casos esto es un problema muy difı́cil (o imposible)
de resolver matemáticamente.
Algunos problemas que han sido resueltos matemáticamente son: el de N partı́culas
en un campo externo pero no interactuantes entre sı́; N partı́culas en un campo externo
interactuando entre sı́ con fuerzas restauradoras lineales (cadena de osciladores acopla-
dos, molécula lineal poliatómica, etc.); dos partı́culas interactuando entre sı́ a través de
un potencial central (problema de dos cuerpos, por ejemplo); sólido rı́gido con un punto
fijo en un campo gravitacional homogéneo. Pero la mayor parte de los problemas mecáni-
cos no se han podido resolver analı́ticamente, por ejemplo, el problema de tres partı́culas
interactuando entre sı́ a traves de un potencial central de tipo gravitacional (problema
de los tres cuerpos), o el problema de una partı́cula cargada en presencia del campo
electrostático de una carga fija y un campo magnético homogéneo. Los problemas solu-
bles clásicamente lo son también cuánticamente; en cuanto a la búsqueda de soluciones
analı́ticas exactas, la mecánica cuántica no aporta mucho en relación con la mecánica
clásica, sin embargo, la mecánica cuántica ha alcanzado una mayor flexibilidad en la
búsqueda de soluciones aproximadas al problema de muchas partı́culas interactuantes
entre sı́.
2
Ecuaciones generales de la estática y la
dinámica

2.1. Las ligaduras


Esta noción aparece en fı́sica macroscópica con frecuencia y raras veces en fı́sica
microscópica. Es de interés en las aplicaciones técnicas, como el diseño de maquinaria.
Por ejemplo, en la definición de sólido rı́gido aparece el concepto de ligadura. Este sistema
se define por la condición que la distancia entre cualquier par de partı́culas permanece
fija. Para N = 2, el cuerpo rı́gido consiste de dos partı́culas a una distancia fija entre sı́;
la condición de ligadura es:

(x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 = constante (2.1)

El sistema posee seis coordenadas, pero la ligadura permite expresar una de ellas
en términos de las otras, quedando sólo 6 − 1 = 5 coordenadas independientes. Por tales
coordenadas pueden tomarse las tres del centro de masa y dos ángulos que especifican
la orientación respecto al centro de masa.
Para N = 3 hay nueve coordenadas y tres condiciones de ligadura que pueden
expresarse en forma vectorial como:

|r~1 − r~2 | = a

|r~2 − r~3 | = b (2.2)

|r~3 − r~1 | = c

Hay sólo 9 − 3 = 6 coordenadas independientes que pueden tomarse ası́: tres para
especificar la posición del centro de masa del sistema total y tres ángulos que especifican
la orientación del plano de las partı́culas con el centro de masa fijo.
Para un sólido rı́gido en general se requieren 3N coordenadas pero habrá cierto número
de condiciones de ligadura independientes. El número total de coordenadas indepen-
dientes requeridas para especificar la posición de un sólido rı́gido son seis, que pueden

7
8 / Mecánica clásica avanzada

tomarse ası́: las tres coordenadas del centro de masa y tres ángulos que especifican la
orientación del cuerpo con el centro de masa fijo.
Se dice que un sólido rı́gido de N partı́culas tiene seis grados de libertad y 3N − 6
condiciones de ligadura. Otros tipos de ligaduras son las siguientes:
(a) Hay alguna condición que obliga a las partı́culas a moverse sobre una superficie o
en una lı́nea. En una superficie cada partı́cula posee sólo dos coordenadas independientes,
o sea que el sistema tendrá N condiciones de ligadura y 2N grados de libertad. Para un
sistema de partı́culas sobre un plano las condiciones de ligadura son las siguientes, si se
toma en el plano x − y:

zi = 0 ; i = 1, 2, ... N (2.3)

Para una esfera de radio a y tomando el centro de la esfera como origen de coor-
denadas las ligaduras son:

x2i + yi2 + zi2 − a2 = 0 ; i = 1, 2, ... N (2.4)

(b) Si hay cuerpos rı́gidos en contacto que ruedan sin deslizarse sobre un plano.
Sea un cilindro de radio a que rueda sin deslizar sobre el plano z = 0. El cilindro requiere
de seis coordenadas para especificar su posición, pero hay dos condiciones de ligadura.
zCM = a
(2.5)
ẋ2CM + ẏCM
2
= a2 φ̇2

donde R~ CM y R~˙ CM son la posición y velocidad del centro de masa y φ̇ es la velocidad


angular de rotación alrededor del eje del cilindro. Si se escoge el sistema de coordenadas
de modo que el eje del cilindro sea paralelo al eje x, la ecuación (2.5) puede integrarse
para dar:

yCM = aφ (2.6)

La ecuación (2.5) puede también integrarse directamente para obtener una relación
entre el ángulo de giro del cilindro y el desplazamiento del centro de masa. En (2.6) se
ha escogido a φ de modo que yCM = 0 cuando φ = 0.
Las ligaduras de “rodar” relacionan las velocidades entre sı́ y con las coordenadas,
y en general son no holónomas, o sea no integrables. Son los casos de un disco o una
esfera rodando sobre un plano.
Para un disco rodando sobre un plano se requieren dos coordenadas para especificar
la posición del centro de masa, una para especificar el giro alrededor del eje y dos para
especificar la posición del plano del disco. Hay dos ligaduras de “rodar” que relacionan
las componentes de la velocidad del centro de masa con la velocidad angular de rotación
al rededor del eje (véase la figura 2.1).

Una de las coordenadas necesarias para especificar el plano del disco puede tomarse
como el ángulo que hace el eje del disco con la dirección x. La otra coordenada la
especificamos exigiendo que el plano del disco sea siempre perpendicular al plano x − y.
Una condición de ligadura es zCM = a. Las otras dos coordenadas del centro de masa
Ecuaciones generales de la estática y la dinámica / 9

a
ϕ

α x

Figura 2.1 Disco rodando sobre un plano

son las mismas del punto de contacto del disco con el plano. Las condiciones de ligadura
de rodar son: que la magnitud de la velocidad del centro de masa sea proporcional a φ̇,
v = aφ̇ (2.7)
y que la dirección de la velocidad del centro de masa siempre esté en el plano de rotación
del disco,
ẋ = v senα ẏ = −v cos α (2.8)
De estas tres condiciones de ligadura sólo hay dos independientes:
dx − a senα dφ =0
(2.9)
dy + a cos α dφ =0
Las ecuaciones (2.9) no se pueden integrar para obtener relaciones que involucren
sólo cantidades finitas. Para poder hacer esto serı́a necesario hallar ciertas funciones
f (x, α; φ) y g(y, α; φ) tales que al multiplicar por ellas las ecuaciones (2.9) se obtengan
diferenciales exactos. Lo anterior no es posible, o sea que las relaciones (2.9) no pueden
usarse para expresar una coordenada en términos de las demás; esto implica que las
condiciones de ligadura deben considerarse simultáneamente con la solución del problema
mecánico, que contendrá sólo tres coordenadas independientes.
Los anteriores ejemplos nos muestran que un sistema de N partı́culas y k condicio-
nes de ligadura tendrá 3N − k grados de libertad. Un cuerpo rı́gido tendrá 6 − k grados
10 / Mecánica clásica avanzada

de libertad. Las condiciones de ligadura para un sistema de partı́culas pueden siempre


expresarse en la forma:
fα (~r1 , ~r2 , ... ~rN ; ~r˙ 1 , ~r˙ 2 , ... ~r˙ N ; t) = 0; α = 1, 2, ... k (2.10)
Ligaduras holonómicas. También se llaman integrables, finitas o geométricas. Su
nombre se deriva de las raı́ces griegas nomos (ley) y holo (entero, todo). Estas ligaduras
sólo restringen las posiciones posibles del sistema, o sea que se pueden expresar por
medio de igualdades que no involucran las velocidades. Para un sistema de N partı́culas
son de la forma:
fα (~r1 , ~r2 , ... ~rN ; t) = 0 α = 1, 2, ... h (2.11)
Para un cuerpo rı́gido son:
~ θ, φ, ψ; t) = 0
fα (R, α = 1, 2, ... h (2.12)

donde R ~ denota la posición del centro de masa, φ, θ, ψ son tres ángulos que especifican
la orientación del cuerpo con el centro de masa fijo y h es el número de condiciones de
ligadura holónomas. Un sistema se dice que es holónomo si no tiene ligaduras diferen-
ciales no integrables.

Ligaduras no holonómicas. También se llaman no integrables, diferenciales o


cinemáticas. Son aquellas que no pueden integrarse. Para un cuerpo rı́gido son de la
forma:

fα (R, ~˙ θ, φ, ψ, θ̇, φ̇, ψ̇; t) = 0 ;


~ R, α = 1, 2, ... n (2.13)
donde n es el número de ligaduras no holónomas. En la mayorı́a de los casos (por ejemplo
el de la figura 2.1), se pueden expresar en la forma:

~˙ + mα θ̇ + nα φ̇ + σα ψ̇ + Pα = 0 ;
~lα · R α = 1, 2, ... n (2.14)

donde ~lα , mα , nα , σα , Pα , son funciones de R,


~ θ, φ, ψ, t. La generalización de (2.12),
(2.13) y (2.14) para sistemas de cuerpos rı́gidos es inmediata. Para un sistema de N
partı́culas usualmente son de la forma:
N
X
~lα · r~˙i + Dα = 0 ; α = 1, 2, ... n (2.15)
i
i=1

donde ~lαi y Dα son funciones de ~r1 , ~r2 , ... ~rN , t.

Ligaduras reonómicas. Del griego reo (flujo). Son las ligaduras, holonómicas o
no holonómicas, que dependen del tiempo. Serı́a el caso de dos partı́culas unidas entre
sı́ por una varilla cuya longitud varı́a con el tiempo de manera conocida:
|~r1 − ~r2 | = l(t) (2.16)
Ligaduras escleronómicas. Del griego esclero (duro). Son las ligaduras rı́gidas
o que no cambian con el tiempo. Es el caso de dos partı́culas unidas entre sı́ por una
Ecuaciones generales de la estática y la dinámica / 11

varilla rı́gida. La noción de ligadura involucra dos aspectos. Por una parte, indica que el
número de variables independientes necesarias para especificar el estado del sistema es
menor. En segundo lugar aparecen las llamadas fuerzas de ligadura, que no se pueden
conocer a priori porque dependen del problema especı́fico, es decir de las fuerzas aplica-
das y de las condiciones iniciales. Vemos que las ligaduras introducen nuevas incógnitas
en el problema.

Las ligaduras consideradas como fuerzas. La noción de ligadura es puramente


macroscópica. Viendo las cosas en detalle en los ejemplos, notamos que las ligaduras son
el resultado de interacciones. Ası́, en el caso de la partı́cula que se mueve sobre la esfera,
deben existir fuerzas que impiden que la partı́cula salga de la superficie, bien sea hacia
afuera o hacia adentro (por esto se dice que esta ligadura es bilateral. En el caso en que
la partı́cula pudiera ocupar sólo cualquier posición dentro de la esfera se dice que la
ligadura es unilateral). En el caso del disco que rueda sin deslizar, debe haber algún tipo
de interacción entre la superficie del disco y la del plano en la zona de contacto. En todos
estos casos sucede que es imposible conocer las fuerzas a priori, independientemente de
las fuerzas aplicadas y de las condiciones iniciales.
Por ejemplo, en el caso de las dos partı́culas unidas por una varilla, no sabemos
cuál es la fuerza que ejerce la varilla sobre ellas. Obviamos esta dificultad diciendo
simplemente que hay una “ligadura”:

|~r1 − ~r2 | = l (2.17)

Pero podemos, si queremos, modelar dicha fuerza, digamos que considerándola


como un caso lı́mite de una interacción del tipo restauradora lineal. Ası́, las fuerzas de
la varilla sobre las partı́culas serı́an de la forma:

F~1′ = −k ′ (r − l)û
(2.18)
F~2′ = k ′ (r − l)û

donde k ′ serı́a la constante de resorte, l la separación de las partı́culas en la posición


de equilibrio y û un vector unitario en la dirección del vector ~r2 − ~r1 = ~r. En el caso
de dos partı́culas interactuando a través de una fuerza central es posible separar el
movimiento en dos partes: el movimiento del centro de masa, y el movimiento de una
partı́cula de masa reducida µ respecto al centro de masa bajo una interacción idéntica
a la interacción entre las dos partı́culas originales. Entonces, el movimiento relativo
descrito como el movimiento de la partı́cula ficticia de masa µ obedece la ecuación:
r s
2E k′
r−l = sen (t − t0 ) (2.19)
k′ µ

donde E es la energı́a del movimiento, que consideraremos tiene un valor finito dado.
Cuando k ′ → ∞, la frecuencia de las oscilaciones aumenta, en tanto que r − l tiende
a cero, obteniéndose la relación cinemática r = l. Por otra parte, como la energı́a E
depende de otras condiciones –fuerzas externas y condiciones de ligadura–, es realmente
indeterminada a priori. Sólo un modelo microscópico nos permitirı́a estimar el valor de
12 / Mecánica clásica avanzada

k ′ . Por lo tanto las fuerzas de ligadura F~ ′ 1 y F~ ′ 2 son indeterminadas; su valor depende


de la solución al problema mecánico completo. Es claro que la indeterminación en las
fuerzas de ligadura no proviene de la omisión de los detalles microscópicos, pues aun a
escala microscópica las interacciones dependerı́an del movimiento completo del sistema.

2.2. Las coordenadas generalizadas


Grados de libertad. El número de grados de libertad de un sistema mecánico
es igual al número de coordenadas independientes necesarias para especificar comple-
tamente cada configuración del sistema. Entendemos por configuración la posición que
ocupa cada una de las partı́culas del sistema. Si hay h condiciones de ligadura holónomas
y n condiciones de ligadura no holónomas (o sea si hay k = n + h condiciones de ligadura
independientes), el número l de grados de libertad será:

l = 3N − h − n (2.20)

Clasificación de los grados de libertad. Sea un sistema de partı́culas sin liga-


duras, k = 0. Sus 3N coordenadas se pueden clasificar en traslacionales y rotacionales
(cuando describen el movimiento del centro de masa y las rotaciones del sistema respecto
al centro de masa), y en vibracionales (cuando describen los movimientos relativos de
las partı́culas que no trasladan el centro de masa y no rotan el sistema). Por ejemplo,
sea un sistema de dos partı́culas –molécula diatómica–, las seis coordenadas se pueden
clasificar en tres grados de libertad traslacionales, dos grados de libertad rotacionales y
un grado de libertad vibracional; en el caso de tratarse de una molécula de H2 , además
hay grados de libertad internos a las dos partı́culas: seis grados de libertad correspon-
dientes a los dos electrones, un grado de libertad interno, el espı́n para cada núcleo y
para cada electrón. Las modernas teorı́as de las partı́culas elementales consideran que a
su vez el protón y el electrón poseen otros grados de libertad internos.
Gran parte de los modelos que se construyen en la fı́sica consisten en hallar cuáles
son los grados de libertad que tienen más relevancia para una situación dada. Ası́ por
ejemplo, en la mecánica se omiten los grados de libertad microscópicos.

Las coordenadas generalizadas. Sea un sistema de N partı́culas con h condicio-


nes de ligadura holónomas, dadas por las ecuaciones (2.11). Estas ecuaciones permiten
expresar a h coordenadas en términos de 3N − h coordenadas, que sólo serán indepen-
dientes en el caso en que no haya ligaduras no holónomas. Es conveniente realizar una
transformación de coordenadas de modo que se eliminen del problema las h coordenadas
superfluas; para ello basta exigir que la transformación anule idénticamente las funciones
fα en las ecuaciones (2.11) y (2.12). Es decir, si:

xi = xi (q1 , q2 , ... q3N −h , t)

yi = yi (q1 , q2 , ... q3N −h , t) (2.21)

zi = zi (q1 , q2 , ... q3N −h , t) ; i = 1, 2, ... N


Ecuaciones generales de la estática y la dinámica / 13

donde q1 , q2 , ... q3N −h son las coordenadas generalizadas y la transformación depen-


derá del tiempo si las ligaduras holónomas son además reónomas. La transformación
además debe cumplir que se anulen idénticamente las funciones:

f~α (q1 , q2 , ... q3N −h , t) ≡


fα [~r1 (q1 , q2 , ... q3N −h , t), ~r2 (q1 , q2 , ... q3N −h , t), ... t] (2.22)
para α = 1, 2, ... h

Usaremos la siguiente notación: los subı́ndices latinos se refieren a cantidades que


se pueden asociar a las partı́culas. Para nombrar las coordenadas generalizadas reserva-
mos los subı́ndices griegos: qν (ν = 1, 2, ... 3N − h). Para nombrar el conjunto de todas
las coordenadas generalizadas usamos la notación (q). Más adelante usaremos también
la notación ~q.

Si k = h, o sea si n = 0, entonces q será un conjunto de coordenadas generalizadas


independientes. Por ejemplo, para una partı́cula que se puede mover sólo sobre una
esfera de radio a la condición de ligadura está dada por la ecuación (2.4); o sea que, por
ejemplo, si el radio de la esfera cambia con el tiempo de manera conocida,

f (x, y, z, t) ≡ x2 + y 2 + z 2 − a2 (t) (2.23)

el sistema tiene una coordenada superflua que se puede eliminar introduciendo unas
coordenadas en la superficie de la esfera. Si tomamos como coordenadas generalizadas
los ángulos θ y φ definidos por:
x(θ, φ, t) = a(t) senθ cos φ

y(θ, φ, t) = a(t) senθ senφ (2.24)

z(θ, φ, t) = a(t) cos θ

Vemos que f (θ, φ, t) se anula idénticamente, o sea que la condición de ligadura


(2.4), se reduce a 0 = 0. Veamos otro ejemplo, sea el sistema formado por dos bolas
pegadas entre sı́ por varillas rı́gidas sin masa y una de ellas unida por una varilla rı́gida
sin masa a un punto fijo. Este sistema se denomina péndulo doble (véase figura 2.2).
El sistema posee seis coordenadas que no son independientes. Supongamos que sólo hay
movimientos permitidos en un plano. Entonces las condiciones de ligadura serán,
z1 = 0

z2 = 0
(2.25)
x22 + y22 − l22 = 0

(x1 − x2 )2 + (y1 − y2 )2 + l12 = 0


donde tomamos el plano x − y como el plano de movimiento, y el origen de coordenadas
en el extremo fijo de la varilla l2 . El sistema tendrá dos grados de libertad que son las
14 / Mecánica clásica avanzada

θ2 l2

m2

θ1 l1

m1

Figura 2.2 Péndulo doble

coordenadas θ1 , θ2 definidas por:


x1 − x2 = l1 cos θ1 , x2 = l2 cos θ2 , z1 ≡ 0
(2.26)
y1 − y2 = l1 sen θ1 , y2 = l2 sen θ2 , z2 ≡ 0
son unas coordenadas generalizadas, ya que reducen las ecuaciones (2.25) a la identidad
0 = 0.
Las coordenadas generalizadas se refieren al sistema como un todo y no a las
partı́culas individuales. Además, no necesitan tener dimensiones de longitud. En gene-
ral, cualquier conjunto de 3N − h variables dinámicas independientes del sistema puede
servir de sistema de coordenadas generalizadas.

Velocidades generalizadas. Son las derivadas totales de las coordenadas gene-


ralizadas respecto al tiempo:
(q̇) = (q˙1 , q˙2 , ... q̇3N −h ) (2.27)
En coordenadas cartesianas se cumple que el momento está relacionado con la velo-
cidad mediante la relación ~p = m~v. En coordenadas generalizadas no existe una relación
de este tipo en general.

Espacio de configuración. Es un espacio definido por las l coordenadas indepen-


dientes del sistema, donde l = 3N −k. Al describir un sistema con ligaduras por medio del
espacio 3N dimensional, estamos usando un espacio euclidiano (en ausencia de fuerzas,
una partı́cula se mueve en lı́nea recta); entonces las trayectorias no rectilı́neas inmedia-
tamente se atribuyen a la presencia de fuerzas de ligadura. Al describir un sistema con
Ecuaciones generales de la estática y la dinámica / 15

ligaduras por medio del espacio de configuración l-dimensional, usamos un espacio no


euclidiano; entonces las trayectorias no rectilı́neas se atribuyen no a fuerzas, sino a la
curvatura del espacio, como en relatividad general.

2.3. Los desplazamientos virtuales


Sea un sistema sujeto a k condiciones de ligadura, h holónomas, dadas por las
ecuaciones (2.11) y n no holónomas dadas por las ecuaciones (2.15), o por (2.12) y
(2.14) respectivamente si se trata de un cuerpo rı́gido, o sus generalizaciones para un
sistema de cuerpos rı́gidos.
Para una configuración dada del sistema en un tiempo t, sólo hay ciertas veloci-
dades compatibles con las n condiciones de ligadura no holónomas. O sea que hay n
componentes de las velocidades que se pueden expresar en función de las 3N − n com-
ponentes restantes.

Velocidades posibles. Son las velocidades que para una configuración dada (~r1 ,
~r2 , ... ~rN ) del sistema en el tiempo t son compatibles con las k condiciones de ligadura.
Sólo hay entre las velocidades posibles un conjunto de velocidades (~r˙ 1 , ~r˙ 2 , ... ~r˙ N ) que
efectivamente toma el sistema. Las velocidades reales se hallan solamente al resolver el
problema mecánico completo.

Desplazamientos posibles. Son los ~r˙ i = ~r˙ i dt, i = 1, 2, ... N , cuando las ~r˙ i son
las velocidades posibles. Cuando las ~r˙ i son las velocidades reales para una configuración
dada, d~ri = ~r˙ i dt son los desplazamientos reales.
Tanto los desplazamientos reales como los posibles deben ser compatibles con las
h condiciones de ligadura holónomas; es decir, estas deben satisfacerse tanto en la con-
figuración (~r1 , ~r2 , ... ~rN ) como en la configuración (~r1 + d~r1 , ~r2 + d~r2 , ... ~rN + d~rN ),
siendo los d~ri desplazamientos posibles.
Se sigue entonces que los desplazamientos posibles deben satisfacer simultánea-
mente las k = h + n condiciones,
N
X
~lα · d~ri + Dα dt = 0 α = 1, 2, ... n (2.28)
i
i=1

N
X ∂fα ∂fα
· d~ri + dt = 0 α = 1, 2, ... h (2.29)
i=1
∂~ri ∂t

que se siguen de (2.11) y (2.15). ∂/∂~ri denota el gradiente respecto a las coordenadas
de la partı́cula i.

Desplazamientos virtuales. Son los desplazamientos posibles cuando se dejan


fijas las ligaduras durante el desplazamiento. Por ejemplo, si en la situación representada
por la figura 2.1 se permite que el plano x−y se mueva de manera conocida, las ligaduras
serán reónomas; supongamos que se trate sólo de un movimiento del plano en la dirección
z. En un desplazamiento virtual del disco se deja el plano x − y fijo mientras se efectúa
16 / Mecánica clásica avanzada

el desplazamiento. En un desplazamiento posible, el centro de masa del disco tiene


movimiento en la dirección z y en el plano x − y; en un desplazamiento virtual el centro
de masa sólo se mueve en el plano x − y.
Para hallar la condición para que los desplazamientos virtuales sean compatibles
con las ligaduras, consideremos dos conjuntos de desplazamientos posibles durante un
tiempo dt, d~ri = ~vi dt y d′~ri = ~vi′ dt, donde ~vi y ~vi′ son dos conjuntos de velocidades
posibles. Los d~ri satisfacen las ecuaciones (2.28) y (2.29) y d′~ri satisface,
N
X
~lα · d′~ri + Dα dt = 0 ; α = 1, 2, ... n (2.30)
i
i=1

N
X ∂fα ∂fα
· d′~ri + dt = 0 ; α = 1, 2, ... h (2.31)
i=1
∂~ri ∂t

En las ecuaciones (2.30) y (2.31), ~lαi y Dα están evaluadas en ~r1 , ~r2 , ... ~rN , t y
análogamente ∂fα /∂~ri y ∂fα /∂t.
Definimos los desplazamientos virtuales δ~ri como:
δ~ri = d′~ri − d~ri (2.32)
y las condiciones de su compatibilidad con las ligaduras son:
N
X
~lα · δ~ri = 0 ; α = 1, 2, ... n (2.33)
i
i=1

N
X ∂fα
· δ~ri = 0 ; α = 1, 2, ... h (2.34)
i=1
∂~ri

Ejemplo 2.3.1 Sea una partı́cula sometida a una fuerza externa F~ (x, y, t) y constreñida
a moverse solamente sobre una superficie descrita por la ecuación

Φ(x, y, z) = 0 (2.35)

Como la ligadura es holónoma, vemos que cualquier velocidad es posible si es


tangente a la superficie. La única condición sobre los desplazamientos virtuales es que
sean compatibles con la ligadura. En este caso es que satisfagan la ecuación (2.34), donde
Φ hace las veces de fα , es decir,
∂Φ ∂Φ ∂Φ
δx + δy + δz = 0 (2.36)
∂x ∂y ∂z
O sea que δx, δy, δz no pueden ser arbitrarios; sólo dos de ellos pueden serlo. En
otras palabras, hay dos grados de libertad. La ecuación de movimiento, F~ = m ~¨r, y la
ecuación de ligadura (2.35), deben ser compatibles. En efecto, (2.35) impone condiciones
a las velocidades posibles y a las aceleraciones posibles:
∂Φ ˙
· ~r = 0 (2.37)
∂~r
Ecuaciones generales de la estática y la dinámica / 17

d ∂Φ ¨ ∂Φ
~r˙ · + ~r · =0 (2.38)
dt ∂~r ∂~r

la ecuación de movimiento será compatible con (2.38) sólo si:

d ∂Φ F~ ∂Φ
~r˙ · + · =0 (2.39)
dt ∂~r m ∂~r

Como F~ puede darse arbitrariamente, vemos que sólo por accidente se cumplirı́a
(2.39).
Por tanto concluimos que la superficie debe reaccionar sobre la partı́cula con una
fuerza suplementaria R ~ que dependerá de las condiciones iniciales, de la fuerza aplicada
~ se llama fuerza de reacción de la ligadura y ha de
y de la ecuación de la superficie. R
ser tal que:

m~¨r = F~ + R
~ (2.40)

Ahora tenemos seis incógnitas para el problema: x, y, z, Rx , Ry , Rz , en tanto hay


sólo las cuatro ecuaciones siguientes:

mẍ = Fx + Rx

mÿ = Fy + Ry
(2.41)
mz̈ = Fz + Rz

Φ(x, y, z) = 0

Faltan pues, dos ecuaciones adicionales. Para obtenerlas basta imponer la condición
de que la ligadura sea ideal. Esto quiere decir que R~ no realiza trabajo al efectuarse un
desplazamiento virtual. Es claro que si la superficie no tiene rozamiento (idealmente
~ será siempre normal a la superficie y como δ~r debe estar sobre la superficie se
suave), R
sigue que R~ y ~r son perpendiculares,

~ · δ~r = 0
R (2.42)

o también,

Rx δx + Ry δy + Rz δz = 0 (2.43)

~ no realiza trabajo en desplazamientos virtuales. Según la ecuación


Es decir, R
(2.36), δx, δy y δz no son independientes. Podemos expresar a δz en términos de δx y
δy.
Entonces la ecuación (2.33) puede escribirse en la forma:
   
∂Φ/∂x ∂Φ/∂y
Rx − Rz δx + Ry − Rz δy = 0 (2.44)
∂Φ/∂z ∂Φ/∂z
18 / Mecánica clásica avanzada

~ ha de satisfacer
Como δx, δy son diferentes de cero y arbitrarios, se sigue que R
además las ecuaciones:
∂Φ/∂x
Rx = Rz
∂Φ/∂z
(2.45)
∂Φ/∂y
Ry = Rz
∂Φ/∂z
completándose ası́ las seis ecuaciones requeridas.

Las ligaduras ideales. Se dice que las condiciones de ligadura sobre un sistema
mecánico son ideales si se cumple que el trabajo realizado por las fuerzas de reacción de
las ligaduras al efectuar desplazamientos virtuales de todas las partı́culas es cero:
N
X
~ i · δ~ri = 0
R (2.46)
i=1

Las fuerzas de fricción dependen del tipo de ligadura, sin embargo para este tipo de
fuerzas deben emplearse métodos que no impliquen la noción de “ligadura ideal”.

“Ensambles” y desplazamientos virtuales. Entenderemos por “ensamble” a


un conjunto de réplicas iguales de un sistema dinámico, donde la única diferencia entre
las réplicas es la configuración, que debe ser compatible con las condiciones de ligadura,
además, en estas réplicas las ligaduras están en idéntica condición; es decir, entre un
sistema y otro, para un tiempo dado, las ligaduras son idénticas. Podemos imaginar las
configuraciones de estos sistemas formando una red o matriz bidimensional: los elementos
de las “filas” constituyen un “ensamble” y las “columnas” dan los distintos estados de
un sistema cuando evoluciona el tiempo; cada fila está caracterizada por un valor del
tiempo y cada columna por una configuración. Al cambiar t a un valor vecino t + dt
los sistemas del ensamble experimentan desplazamientos reales (de una fila a otra). Al
realizarse un desplazamiento virtual, un sistema se convierte en otro vecino (de una
columna pasa a otra).

Ejemplo 2.3.2 Sean dos partı́culas de masas m1 y m2 que interactúan entre sı́ a través
de una varilla rı́gida sin masa. Están sometidas a una fuerza externa y en un estado de
movimiento arbitrario. Se trata de mostrar que la ligadura es ideal.

Todos los desplazamientos infinitesimales que no cambian la longitud de la varilla


son virtuales.
Las fuerzas ejercidas por la varilla sobre las partı́culas son de ligadura y dependerán
del estado de movimiento y de las fuerzas aplicadas sobre las partı́culas. Por ejemplo, si
rotan al rededor del centro de masa, las fuerzas de ligadura dependerán de la velocidad
angular de rotación.
Sean R~1 y R ~ 2 las fuerzas ejercidas por la varilla sobre las partı́culas, y G~1 y G
~2
las fuerzas ejercidas por las partı́culas sobre la varilla, por la tercera ley de Newton se
cumple que G ~ 1 = −R ~1 y G~ 2 = −R
~ 2.
Ecuaciones generales de la estática y la dinámica / 19

~1 y G
G ~ 2 podrı́an producir aceleración del centro de masa de la varilla y aceleración
angular, pero como la masa de la varilla es cero, lo mismo que el momento de inercia,
se sigue que G~1 + G~ 2 = 0, lo mismo que el torque. Por lo tanto también se cumple que
~ ~
R1 = −R2 y como no hay torques, estos vectores estarán a lo largo de la varilla. El
trabajo virtual de las fuerzas de ligadura será:
~ 1 · δ~r1 + R
R ~ 2 · δ~r2 = R
~ 2 · (δ~r2 − δ~r1 ) (2.47)

Si llamamos ~r = ~r2 − ~r1 , δ~r = δ~r2 − δ~r1 , entonces un desplazamiento virtual δ~r
puede descomponerse en uno perpendicular a la varilla y en uno paralelo a la misma,

δ~r = δ~r⊥ + δ~rk (2.48)

Como la varilla es rı́gida, δ~rk → 0, luego:

~ 1 · δ~r1 + R
R ~ 2 · δ~r2 = R
~ 2 · δ~r = R
~ 2 · δ~r⊥ (2.49)

pero R~ 2 está a lo largo de la varilla, luego R ~ 1 · δ~r2 = 0 concluyéndose por tanto que la
ligadura es ideal. R ~ 1 · δ~r1 y R
~ 2 · δ~r2 no son cero por separado, pero sı́ su suma.

2.4. La ecuación general de la estática


Sea un sistema de N partı́culas. La fuerza sobre la partı́cula i se puede descomponer
(a)
en una fuerza aplicada (F~i ) y en una fuerza de reacción de las ligaduras (R ~ i ). Si el
sistema está en equilibrio se debe cumplir que:
(a)
F~i = F~i + R~ i = ~0 ; i = 1, 2, ...N (2.50)

El trabajo virtual de las F~i también será cero,


N
X N
X N
X
(a)
F~i · δ~ri = F~i · δ~ri + ~ i · δ~ri = 0
R (2.51)
i=1 i=1 i=1

Si suponemos que las ligaduras son ideales, ası́ las R ~ i no sean nulas, será nulo el
(a)
trabajo virtual realizado por ellas, ecuación (2.46). Aun en el equilibrio las F~i no serán
nulas, pero de (2.46) y (2.51) se sigue que el trabajo virtual de las fuerzas aplicadas debe
ser cero:
N
X (a)
F~i · δ~ri = 0 (2.52)
i=1

La ecuación (2.52) se llama la ecuación general de la estática o también el principio


de los trabajos virtuales. El contenido de la ecuación (2.52) es el siguiente: “para que
alguna configuración del sistema, compatible con las ligaduras, sea una posición de
equilibrio, es necesario y suficiente que en esa posición la suma de los trabajos virtuales
de las fuerzas efectivas sea cero”. Este enunciado se llama la “regla de oro de la mecánica”
y fue formulado por J. Bernoulli en 1717.
20 / Mecánica clásica avanzada

La compatibilidad de los desplazamientos virtuales con las ligaduras se expresa


a través de las ecuaciones (2.34). Por lo tanto los desplazamientos virtuales δ~ri en la
ecuación (2.52) no serán independientes, por lo que se pueden expresar k de ellos en
términos de los 3N − k restantes.
Las coordenadas generalizadas independientes permiten hallar una expresión a
partir de (2.52) que contenga los desplazamientos independientes e igualar a cero los
coeficientes. Este procedimiento hace posible hallar la configuración de equilibrio pero
no las fuerzas de ligadura.

Sistema de ecuaciones de la estática. La solución de un problema de estática


consiste en hallar la configuración de equilibrio (xi , zi , yi para i = 1, 2, ... N ), y las
fuerzas de reacción de las ligaduras (Rxi , Ryi , Rzi para i = 1, 2, ... N ). Son seis incógnitas
que se obtienen resolviendo simultáneamente las siguientes ecuaciones algebraicas:
(a)
F~i + R~i = 0 ; i = 1, 2, ... N (2.53)
N
X
~ i · δ~ri = 0
R (2.54)
i=1

fα (~r1 , ~r2 , ... ~rN ) = 0 ; α = 1, 2, ... k (2.55)


(a)
Como las F~i son funciones conocidas de las coordenadas, las R ~ i en la posición
de equilibrio se hallan con sólo conocer dicha posición, o sea que en (2.53) son 3N
~ i . Para hallar la configuración de equilibrio basta resolver
ecuaciones que determinan las R
las ecuaciones:
N
X (a)
F~i · δ~ri = 0 y fα (~r1 , ~r2 , ... ~rN ) = 0 ; α = 1, 2, ... k (2.56)
i=1

Como (2.55) debe cumplirse en las configuraciones ~r1 , ~r2 , ... ~rN y ~r1 + δ~r1 , ~r2 +
δ~r2 , ... ~rN + δ~rN , es cierto que:
N
X ∂fα
· δ~ri = 0 ; α = 1, 2, ... k (2.57)
i=1
∂~ri

Con lo cual es posible expresar k desplazamientos en términos de 3N − k. Escri-


bamos el conjunto de 3N coordenadas x1 , y1 , z1 , x2 , y2 , z2 , ...xN , yN , zN , en la forma
u1 , u2 , ... u3N de modo que tomamos a u1 , u2 , ... uk como k coordenadas que se pue-
den expresar en términos de las coordenadas uk+1 , uk+2 , ... u3N que tomaremos como
(a)
3N − k coordenadas independientes. Llamaremos análogamente Fs a las componentes
(a)
Fus . Con estas modificaciones las ecuaciones de la estática pueden escribirse como:
3N
X
Fs(a) δus = 0 (2.58)
s=1

3N
X ∂fα
fα (u1 , u2 , ... u3N ) = 0 ; δus = 0 ; α = 1, 2, ... k (2.59)
s=1
∂us
Ecuaciones generales de la estática y la dinámica / 21

Introducimos las k cantidades λ1 , λ2 , ... λk , llamadas multiplicadores indetermi-


nados de Lagrange, de la siguiente manera: multiplicamos las ecuaciones (2.59) que
relacionan los δus por λα y sumamos sobre α para obtener:
3N X
X k
∂fα
λα δus = 0 (2.60)
s=1 α=1
∂us

Ahora sumamos (2.58) y (2.60):


3N k
!
X X ∂f α
Fs(a) + λα δus = 0 (2.61)
s=1 α=1
∂us

Tenemos k cantidades indeterminadas, λα , que podemos escoger de tal manera que


en (2.61) se anulen los coeficientes de los k desplazamientos dependientes δu1 , δu2 , ... δuk ,
es decir,
k
X ∂fα
Fs(a) + λα = 0; s = 1, 2, ... k (2.62)
α=1
∂us

Ahora, con (2.62), quedará (2.61) convertida en una combinación lineal igualada a
cero de las cantidades linealmente independientes δuk+1 , δuk+2 , ... δu3N . Lo anterior es
posible sólo si se anulan los coefientes, lo cual, junto con (2.62) conduce a:
k
X ∂fα
Fs(a) + λα = 0; s = 1, 2, ... 3N (2.63)
α=1
∂us

La ecuación general de la estática (2.58) queda convertida en las 3N ecuaciones


(2.63). Ahora hay k incógnitas adicionales, o sea 3N + k en total. Pero hay 3N + k
ecuaciones que son las (2.55) y las (2.63). La solución nos dará la posición de equilibrio
del sistema. Las fuerzas de ligadura se hallan de cualquiera de las expresiones:
Rs = −Fs(a) (u1 , u2 , ... u3N ) ; s = 1, 2, ... 3N (2.64)
k
X ∂
Rs = λα fα (u1 , u2 , ... u3N ) ; s = 1, 2, ...k (2.65)
α=1
∂us

Ejemplo 2.4.1 Sean dos partı́culas de masas m1 y m2 , unidas por una varilla rı́gida sin
masa y colocadas dentro de un cascarón esférico, en presencia de la gravedad (véase
figura la 2.3). Hallar la posición de equilibrio y las fuerzas de reacción de las ligaduras.

Las ecuaciones de ligadura, cuando se toma el origen de coordenadas en el centro


de la esfera, son:
(x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − l2 = 0

x21 + y12 + z12 − a2 = 0 (2.66)

x22 + y22 + z22 − a2 = 0


22 / Mecánica clásica avanzada

Donde a es el radio de la esfera y l ≤ 2a la longitud de la varilla. Tomando el eje


z en la dirección vertical, las fuerzas aplicadas son:
(a) (a)
F~1 = −m1 g k̂ ; F~2 = −m2 g k̂ (2.67)

Ecuación de equilibrio (2.58):

−m1 g δz1 − m2 g δz2 = 0 (2.68)

a
m
1
0

l
m
2

Figura 2.3 Masas m1 y m2 unidas por una varilla rı́gida sin masa y colocadas dentro de un
cascarón esférico

Compatibilidad de los desplazamientos virtuales con las ligaduras:

(x1 − x2 )δx1 + (x2 − x1 )δx2 + (y1 − y2 )δy1 +

(y2 − y1 )δy2 + (z1 − z2 )δz1 + (z2 − z1 )δz2 = 0


(2.69)
x1 δx1 + y1 δy1 + z1 δz1 = 0

x2 δx2 + y2 δy2 + z2 δz2 = 0

Las ecuaciones (2.69) indican que sólo tres desplazamientos virtuales pueden dar-
se independientemente. Escogeremos independientes a δy1 , δy2 , δz2 y dependientes a
δx1 , δx2 , δz1 . Las seis ecuaciones correspondientes a las dadas por la expresión (2.63)
se obtienen usando la matriz de tres filas y seis columnas ∂fα /∂us donde α = 1, 2, 3 y
Ecuaciones generales de la estática y la dinámica / 23

s = 1, 2, ... 6. α = 1, 2, 3 corresponden a las ecuaciones (2.66) respectivamente y las us co-


rresponden a x1 , x2 , z1 , y1 , y2 , z2 respectivamente. Los elementos de la matriz ∂fα /∂us
son:
 
a −a b c −c −b
   
∂fα  
=  x 1 0 z 1 y 1 0 0 
 (2.70)
∂us  
0 x2 0 0 y2 z2
donde a = x1 − x2 , b = z1 − z2 y c = y1 − y2 .
Las ecuaciones (2.63) serán:
0 + λ1 (x1 − x2 ) + λ2 x1 + 0 = 0 (2.71)

0 + λ1 (x2 − x1 ) + 0 + λ3 x2 = 0 (2.72)

−m1 g + λ1 (z1 − z2 ) + λ2 z1 + 0 = 0 (2.73)

0 + λ1 (y1 − y2 ) + λ2 y1 + 0 = 0 (2.74)

0 + λ1 (y2 − y1 ) + 0 + λ3 y2 = 0 (2.75)

−m2 g + λ1 (z2 − z1 ) + 0 + λ3 z2 = 0 (2.76)

De (2.71), (2.72) y (2.73) obtenemos para λ1 , λ2 , λ3 :


x1 x2 − x1
λ1 = m1 g ; λ2 = m1 g
x2 z1 − x1 z2 x2 z1 − x1 z2
(2.77)
x1 x1 − x2
λ3 = m1 g
x2 x2 z1 − x1 z2
Reemplazando a (2.77) en (2.74), (2.75) y (2.76), obtenemos:
x2 y1 − x1 y2 x1 x2 y1 − x1 y2
= 0; =0
x2 z1 − x1 z2 x2 x2 z1 − x1 z2
(2.78)
m2 x1 x2 z1 − x1 z2
+ =0
m1 x2 x2 z1 − x1 z2
Si se cumple que x2 z1 − x1 z2 = 0, las ecuaciones (2.78) se convierten en:
x2 y1 − x1 y2 = 0; x2 z1 − x1 z2 = 0 (2.79)
La otra posibilidad es que x2 z1 − x1 z2 no sea cero. En este caso, de (2.78) salen
las dos relaciones diferentes:
x1 m2
x1 y2 = x2 y1 ; =− (2.80)
x2 m1
La solución (2.79) no tiene sentido pues implica:

~r1 × r~2 = (y1 z2 − z1 y2 )î − (x1 z2 − z1 x2 )ĵ + (x1 y2 − x2 y1 )k̂ = 0 (2.81)


24 / Mecánica clásica avanzada

O sea que los vectores de posición de las partı́culas son paralelos, independiente-
mente de las masas y la longitud de la varilla. Esta solución podrı́a ser aceptable en los
casos lı́mites en que l = 0 o l = 2a. La solución (2.80) da:1
y1 m2 x1 m2
=− ; =− (2.82)
y2 m1 x2 m1
Las relaciones (2.82) implican que el centro de masa se encuentra siempre sobre el
eje z. Las ecuaciones de ligadura se pueden escribir como:

2a2 − 2x1 x2 − 2y1 y2 − 2z1 z2 − l2 = 0 (2.83)

x21 + y12 + z12 − a2 = 0 (2.84)

x22 + y22 + z22 − a2 = 0 (2.85)

De reemplazar (2.82) en (2.83) obtenemos:


m2 2 m2 2
2a2 + 2 x +2 y − 2z1 z2 − l2 = 0 (2.86)
m1 2 m1 2
Usando (2.84) y (2.85) podemos escribir a (2.86) como:
s  2
2 m 2 2 2
 m2
2a + 2 a − z2 − 2z2 a − 2 (a2 − z22 ) − l2 = 0 (2.87)
m1 m1

Despejando en (2.87) a (a2 − z2 2 ) obtenemos luego para z22 :


  2
m2 2 l2
1+ a −
m1 2
z22 =  2 (2.88)
m2 m2 2
1+ a2 − l
m1 m1
z1 se obtiene de (2.74), (2.84) y (2.85):
 2
2 2 m2 
a − z1 = a2 − z22 (2.89)
m1
Lo cual conduce a:
  2
m2 2 m2 l 2
1+ a −
m1 m1 2
z22 =  2 (2.90)
m1 m1 2
1+ a2 − l
m1 m1
Se ve fácilmente que al intercambiar las partı́culas, o sea en (2.88) al reemplazar
m2 por m1 y viceversa se obtiene (2.90).

1 En (2.77) resulta entonces que las λ son infinitas, o sea que las fuerzas de ligadura son infinitas.
Ecuaciones generales de la estática y la dinámica / 25

Las ecuaciones (2.82) nos indican que:


y1 y2
= (2.91)
x1 x2
Observando la proyección de las partı́culas sobre el plano xy, vemos que la varilla
debe cortar el eje z, lo cual está de acuerdo con el hecho de que el centro de masa
está sobre el eje z en la posición de equilibrio. Lo anterior nos dice que la proyección de
la varilla sobre el plano xy es una lı́nea recta que pasa por el origen.
Debido a que de las tres ecuaciones (2.78) sólo se obtienen dos relaciones indepen-
dientes, vemos que habrá una indeterminación en los valores de x1 y y1 (y correspon-
dientemente de x2 , y2 ), lo cual es debido a la simetrı́a del problema bajo rotaciones en
el eje z. Podemos determinar solamente a ax21 + y12 y ax22 + y22 :

m
1

ϕ2
ϕ1

m x
2

Figura 2.4 Proyección de las partı́culas m1 y m2 sobre el plano xy

 
l2
l 2 a2 −
4
x22 + y22 =  2
m2 m2 2
a2 1 + − l (2.92)
m1 m1
 2
m2
x21 + y12 = (x22 + y22 )
m1

De (2.86) y (2.68) obtenemos la siguiente expresión que nos permite analizar los
signos de z1 y z2 :
  2
l2 m2 m1 l4
a2 a2 − 1+ +
2 m1 m2 4
z1 z2 =  2 (2.93)
m2 m1
a2 1 + − l2
m1 m2
26 / Mecánica clásica avanzada

Supongamos que l = 2a, con m1 6= m2 . Entonces,


z1 z2 = −a2 (2.94)
De tal forma que (2.88), (2.90) y (2.83) a (2.85) dan z12 = z22 = a2 . Hay para este
caso, pues, dos soluciones posibles: z1 = a, z2 = −a o z1 = −a, z2 = a, que corresponden
a la varilla vertical. Si además m1 = m2 , (2.88), (2.89) y (2.90) conducen a valores
indeterminados de z1 y z2 : cualquier posición es de equilibrio, lo cual está de acuerdo
con que el centro de masa está en O para todas las posiciones de la varilla. Para m1 = m2 ,
con l arbitrario, se obtiene de (2.88), (2.89) y (2.90):
l2
z12 = z22 = a2 − (2.95)
4
y de (2.93) se obtiene:
l2
z 1 z 2 = a2 − (2.96)
4
que indica que z1 y z2 deben tener el mismo signo. Las condiciones de ligadura no
contienen información acerca de si las partı́culas están dentro del cascarón o pegadas a él
(pudiendo moverse sin fricción); por esto (2.96) admite dos soluciones: z1 = z2 = a2 − l2 /4
o z1 = z2 = −(a2 − l2 /4). Es claro que la segunda solución es la única aceptable cuando
las partı́culas están colocadas simplemente dentro del cascarón. La posición del centro
de masa en un caso general es:
m1 z 1 + m2 z 2
zCM = =
m1 + m2
     
m2 2 m2 l 2 m2 2 l2
±m1 1 + a − ± m2 1 + a − (2.97)
m1 m 2 m1 2
s1 2
m2 m2 2
(m1 + m2 ) 1+ a2 − l
m1 m1
Es claro que cuando las partı́culas están dentro del cascarón debe excluirse la
solución en que z1 y z2 tienen ambas signos positivos. Las otras soluciones son:
Para z1 > 0 , z2 < 0:
 
m2
1− a2
m1
zCM = s 2 (2.98)
m2 m 2 2
1+ a2 − l
m1 m1
Para z1 < 0 , z2 > 0:
 
m2
− 1 a2
m1
zCM = s 2 (2.99)
m2 m2 2
1+ a2 − l
m1 m1
Ecuaciones generales de la estática y la dinámica / 27

Para z1 < 0 , z2 > 0:


s 2
m1 m2 m2 2
zCM =− 1+ a2 − l (2.100)
m1 + m2 m1 m1

Las ecuaciones (2.98), (2.99) y (2.100) serán la expresión correcta para zCM de-
pendiendo del signo de z1 z2 en la ecuación (2.93). Estas ecuaciones pueden también
escribirse como:
m1 − m2 a2
zCM = r (2.101)
m1 + m2 1 m1 m2 2
a2 − l
m1 + m2 m1 + m2

m2 − m1 a2
zCM = r (2.102)
m1 + m2 1 m1 m2 2
a2 − l
m1 + m2 m1 + m2
r
1 m1 m2 2
zCM = − a2 − l (2.103)
m1 + m2 m1 + m2

Cuandop m1 = m2 sólo es válida (2.103). En ese caso, como es de esperarse zCM =


z1 = z2 = − a2 − l2 /4. En general (2.101) y (2.102) sólo serán válidas cuando se cumple
una de las desigualdades siguientes:
   
m2 m1
l2 > 2 1 + a2 o l 2 > 2 1 + a2 (2.104)
m1 m2
Para el cálculo de las fuerzas de reacción de las ligaduras se requiere evaluar los
λα . Los denominadores en las ecuaciones (2.77) se calculan usando las ecuaciones (2.80):
 
x2 m1
−z2 + z1 = −zCM 1 + (2.105)
x1 m2
Con lo cual las ecuaciones (2.77) nos dan:
m1 m2 g g g
λ1 = − ; λ2 = m2 ; λ3 = m2 (2.106)
m1 + m2 zCM zCM zCM
De acuerdo con (2.65), (2.71) a (2.76), se puede hallar la contribución de cada
ligadura a las fuerzas de reacción de las ligaduras. λ1 está asociada a la fuerza ejercida
por la varilla sobre las partı́culas, λ2 a la fuerza ejercida por el cascarón sobre la partı́cula
de masa m1 y λ3 a la fuerza ejercida por el cascarón sobre la partı́cula de masa m2 .
Estas fuerzas, en forma vectorial, son respectivamente:

λ1 (~r1 − ~r2 ); λ1 (~r2 − ~r1 ); λ2~r1 ; λ3~r2 (2.107)

La fuerza total, de la varilla y el cascarón, sobre la partı́cula de masa m1 y sobre


la de masa m2 respectivamente es:

(λ1 + λ2 )~r1 − λ1~r; (λ1 + λ3 )~r2 − λ1~r1 (2.108)


28 / Mecánica clásica avanzada

Utilizando las expresiones para los λα , las fuerzas ejercidas separadamente por la
varilla y el cascarón sobre las partı́culas de masas m1 y m2 respectivamente, son:
m1 m2 g ~r1 − ~r2 m1 m2 g ~r1 − ~r2 ~r1 ~r2
; ; m1 g ; m2 g (2.109)
m1 + m2 zCM m1 + m2 zCM zCM zCM
Por ejemplo, tomemos la solución de equilibrio estable cuando l = 2a y m1 > m2 :
x1 = x2 = y1 = y2 = 0, z1 = −a, z2 = a. En este caso r~1 = −ak̂, r~2 = ak̂, ~r1 − ~r2 = −2ak̂ y
zCM será:
m1 − m2
zCM = − a (2.110)
m1 + m2
Las fuerzas ejercidas sobre m1 por la varilla y el cascarón respectivamente son:
2m1 m2 g m1 (m1 + m2 )
−2aλ1 k̂ = − k̂ y − aλ2 k̂ = g k̂ (2.111)
m1 − m2 m1 − m2
Las fuerzas sobre la partı́cula de masa m2 son:
2m1 m2 g m2 (m1 + m2 )
2aλ1 k̂ = k̂ y aλ3 k̂ = g k̂ (2.112)
m1 − m2 m1 − m2
Las ecuaciones (2.111) y (2.112) nos dicen que la fuerza ejercida por el cascarón
sobre m2 no es cero y que la fuerza ejercida por el cascarón sobre m2 es diferente
de (m1 + m2 )g, lo cual contradice nuestra idea intuitiva de que las partı́culas están
“colocadas” dentro del cascarón (véase figura 2.3). El resultado que acabamos de obtener
nos dice que las partı́culas están “agarradas” del cascarón de alguna manera. Esto nos
ilustra una propiedad de las ecuaciones de ligadura del tipo (2.88), (2.89), (2.90), o sea
de las ligaduras holónomas bilaterales: las fuerzas de ligadura asociadas a las ligaduras
bilaterales se pueden ejercer en dos direcciones. Por esto en la parte más alta del cascarón,
ecuación (2.112), éste ejerce sobre la partı́cula de masa m2 una fuerza en la dirección
z negativa. La fuerza total sobre m1 y la fuerza total sobre m2 , usando las ecuaciones
(2.100) y (2.106), son respectivamente:
~ CM
R ~ CM
R
m1 g ; m2 g (2.113)
zCM zCM
Cuando l = 2a, la fuerza neta ejercida por las ligaduras sobre m1 es m1 g k̂ y sobre m2
es m2 g k̂. Es decir, las ligaduras ejercen sobre cada partı́cula una fuerza que contrarresta
su peso, como debe ser cuando las partı́culas están “agarradas” al cascarón.
El estudio del caso en que las partı́culas están simplemente “colocadas” en el
cascarón requiere reemplazar (2.66) por dos condiciones de ligadura unilaterales: r1 ≤ a,
r2 ≤ a. La solución se obtiene fácilmente a partir de la hallada cuando las ligaduras son
bilaterales.

2.5. Las ecuaciones de la estática en coordenadas ge-


neralizadas
Las ligaduras hacen que los desplazamientos virtuales de las partı́culas (δx1 , δy1 ,
δz1 ; ... δxn , δyn , δzn ) no sean todos independientes. Por esto en la ecuación general de
Ecuaciones generales de la estática y la dinámica / 29

la estática, ecuaciones (2.52) y (2.58), no se tienen combinaciones lineales de cantidades


linealmente independientes y los coeficientes de los desplazamientos no se anulan. Si
introducimos las coordenadas generalizadas independientes (q), para lo cual es necesario
que el sistema sea holónomo, mediante las ecuaciones de transformación (2.21), podemos
expresar los δ~ri en términos de los δqν :
Xl
∂~ri
δ~ri = δqν (2.114)
ν=1
∂q ν

donde l es el número de grados de libertad; l = 3N − k, con k = h, puesto que en estática


no hay ligaduras no holónomas.
Entonces la ecuación (2.52) toma la forma:
N l l N
!
X (a)
X ∂~
ri
X X (a) ∂~
ri
F~i · δqν = F~i · δqν = 0 (2.115)
i=1 ν=1
∂qν ν=1 i=1
∂qν

En la ecuación (2.115) se tiene una combinación lineal de los desplazamientos


virtuales independientes δqν igualada a cero. Por esto se debe cumplir que:
N
X (a) ∂~
ri
Q(a)
ν ≡ F~i · = 0; ν = 1, 2, ... l (2.116)
i=1
∂qν

(a)
Qν se denomina la fuerza generalizada asociada al grado de libertad qν . En coor-
(a)
denadas generalizadas las condiciones de equilibrio son Qν = 0 para ν = 1, 2, ... l, que
proporciona un sistema de l ecuaciones algebraicas simultáneas con las l incógnitas
q1 , q2 , ... ql que son las coordenadas generalizadas en la posición de equilibrio. En cuan-
to a las fuerzas de ligadura, de la ecuación (2.50) se sigue que la fuerza de reacción de
las ligaduras asociada al grado de libertad qν también es cero:
N
X XN
Eν = ~ i . ∂~ri = −
R F~i (a) ·
∂~ri
ν = 1, 2, ... l (2.117)
i=1
∂qν i=1
∂qν

Se sigue de (2.117) que sólo serán diferentes de cero las fuerzas asociadas a las
3N − l = k coordenadas “superfluas”. Como en coordenadas generalizadas desaparecen
las ecuaciones de ligadura, se sigue que las fuerzas de ligadura también se anulan, de
acuerdo con la idea de que en el espacio de configuración no euclidiano, definido por
las coordenadas generalizadas, el efecto de las ligaduras es asociado con la propiedad
geométrica de “curvatura del espacio”.

Fuerzas derivables de un potencial. Si las fuerzas aplicadas se pueden obtener


a partir de una función V (~
rl , r~2 , ... ~rN , t) en la forma:
(a) ∂V
F~i = − ; i = 1, 2, ... N (2.118)
∂~ri
Las condiciones de equilibrio en coordenadas generalizadas son, para este caso:
N
X ∂V ∂~ri ∂V
Q(a)
ν =− · =− ; i = 1, 2, ... l (2.119)
i=1
∂~ri ∂qν ∂qν
30 / Mecánica clásica avanzada

Las ecuaciones (2.119) dicen que la posición de equilibrio estática es aquella para
la cual la función de energı́a potencial tiene un mı́nimo o un máximo respecto a todas
las coordenadas generalizadas. Sin definir estrictamente la estabilidad de un sistema,
podemos decir que un mı́nimo en V corresponde a equilibrio estable, y un máximo a
equilibrio inestable; las condiciones rigurosas de estabilidad están dadas por el teorema
de Lagrange y los teoremas de Liapunov y Chetayev (véase el capı́tulo 5 del libro Lectures
in analytical mechanics de Gantmacher).
A manera de ilustración, consideraremos una partı́cula colocada sobre una esfera de
radio a que puede variar con el tiempo. Las coordenadas generalizadas pueden tomarse
como θ, φ, de acuerdo con la ecuación (2.24). A las fuerzas aplicadas se les pueden
asociar las fuerzas generalizadas Qθ , Qφ . La condición de equilibrio es Qθ = Qφ = 0, o sea
que no haya torques externos en las direcciones de θ y φ. En el equilibrio, la partı́cula se
moverá sobre la superficie de la esfera sin aceleración o permanecerá en reposo respecto
a la misma. Con coordenadas generalizadas no es posible obtener la fuerza de ligadura
en la dirección radial.
Ejemplo 2.5.1 Hallar la configuración de equilibrio para el problema del ejemplo 2.4.1
en coordenadas generalizadas.
La figura 2.5 muestra una configuración general del sistema. Se requiere hallar
tres parámetros independientes compatibles con las ligaduras y expresar en términos de
ellos las coordenadas de las partı́culas. Luego, hallar las fuerzas generalizadas asociadas
a esos parámetros. La configuración de equilibrio estará dada por los valores de los
parámetros que anulan las fuerzas generalizadas. Las coordenadas generalizadas serán
tres parámetros que ubican la posición del triángulo rı́gido: 012. Como el vector de
posición del centro de masa ~rCM es fijo respecto al triángulo 012, dos parámetros podrı́an
ser φCM , θCM y el tercer parámetro serı́a un ángulo de rotación del triángulo alrededor de
~rCM . Sin embargo, resultan más convenientes los tres ángulos de Euler que determinan
la ubicación de un sistema de coordenadas cartesianas x′ , y ′ , z ′ , fijo al triángulo, respecto
al sistema de coordenadas espacial x, y, z.
Los ángulos de Euler permiten mediante tres rotaciones sucesivas obtener los ejes
x′ , y ′ , z ′ a partir de los ejes x, y, z: primero se rota alrededor del eje z por un ángulo
φ, con lo cual el eje x pasa a ser cierto eje ξ; luego se rota alrededor del eje ξ por un
ángulo θ, con lo cual z pasará a ser cierto eje ξ ′ ; luego se rota alrededor del eje ξ ′ por
un ángulo ψ, con lo cual se obtendrá la posición final de los ejes x′ , y ′ , z ′ . La figura 2.6
muestra estas tres rotaciones.
La figura 2.7 muestra la ubicación del triángulo mediante los ángulos de Euler
φ, θ, ψ. Se escoge el eje z ′ a lo largo de la lı́nea que une a O con el centro de masa,
y ′ perpendicular a 0−CM en el plano del triángulo, y x′ perpendicular al plano del
triángulo.
Las coordenadas de las partı́culas respecto a los ejes x′ , y ′ , z ′ son:
x′1 = 0   x′2 = 0  
β β
y1′ = −a sen −α y2′ = a sen +α
2 2
(2.120)
   
β β
z1′ = a cos −α z2′ = a cos +α
2 2
Ecuaciones generales de la estática y la dinámica / 31

2
l
1

r2
r1 θ1 θ2

ϕ2
ϕ1

Figura 2.5 Configuración de equilibrio del sistema de dos masas unidas por una varilla rı́gida
(del ejemplo 2.4.1)

z,ζ ζ′ z zi ′ z

θ
θ yi′
η′
η
y
y y

x x ϕ
ϕ x ϕ
ψ xi′
ζ ζ′

Figura 2.6 Los ángulos de Euler φ, θ y ψ

Llamando ~rm la posición del punto medio de la varilla, obtenemos la siguiente


expresión que relaciona a cos α con cos β:

a2
~rCM · ~rm = (1 + cos β) = rCM rm cos α (2.121)
2
32 / Mecánica clásica avanzada

z
zi ′ 2 1 z i′

y i′ × CM
1 × CM 2

θ α

a a
y β
0
xi′ y i′
ϕ ψ
0

Figura 2.7 Ubicación del triángulo mediante los ángulos de Euler

De la definición de ~rCM y de la geometrı́a se sigue que:


s
m1 m2 l2
rCM = a 1 − (2.122)
(m1 + m2 ) a2
2

r
l2
rm = a 1− (2.123)
4a2
r
l2 β l β l2
cos β = 1 − 2 ; sen = ; cos = 1− (2.124)
2a 2 2a 2 4a2

Usando (2.122), (2.123) y (2.124) se obtienen de (2.121) las siguientes expresiones


para senα y cos α:

l m1 − m2 1
sen α = s
2a m1 + m2 m1 m2 l2
1−
(m1 + m2 )2 a2
v (2.125)
u
u l2
u 1− 2
cos α = u
u
4a
t m1 m2 l2
1−
(m1 + m2 ) a2
2

De (2.120), (2.124) y (2.125) se deducen las siguientes expresiones para las coor-
denadas de las partı́culas respecto a los ejes x′ , y ′ y z ′ :

x′1 = x′2 = 0 (2.126)


Ecuaciones generales de la estática y la dinámica / 33
v
u
u l2
′ m2 u u
1−
4a2
y1 = −l u (2.127)
m1 + m2 t m1 m2 l2
1−
(m1 + m2 ) a2
2

l2 m2
1− 2
′ 2a m1 + m2
z1 = a s (2.128)
m1 m2 l2
1−
(m1 + m2 )2 a2
v
u
u l2
m u 1− 2
1 u 4a
y2′ = l u (2.129)
m1 + m2 t m1 m2 l2
1−
(m1 + m2 ) a2
2

l2 m1
1− 2
′ 4a m1 + m2
z2 = a s (2.130)
m1 m2 l2
1−
(m1 + m2 )2 a2
Definamos las variables c = cos ψ, c′ = cosφ, c′′ = cos θ, s = senψ, s′ = senφ y
s = senθ. Las ecuaciones de transformación del sistema de coordenadas x′ , y ′ , z ′ al
′′

sistema de coordenadas x, y, z son las siguientes [ver (2.118)]:


 
x
 
 
 y =
 
 
z
  ′  (2.131)
c c′ − s s′ c′′ −s c′ − c′′ s′ c s′′ s′ x
  
  
 c s′ + c′′ c′ s −s s′ + c′′ c′ c −s′′ c′   y ′ 
  
  
s′′ s s′′ c c′′ z′
Como las componentes del vector de posición del centro de masa en los ejes x′ , y ′ ,

z son:

x′CM = yCM = 0; ′
zCM = rCM , (2.132)
se deduce de (2.131) que respecto a los ejes x, y, z las coordenadas del centro de masa
son:
xCM = rCM senθ senφ

yCM = −rCM senθ cos φ (2.133)

zCN = rCM cos θ


34 / Mecánica clásica avanzada

Las fuerzas generalizadas se obtienen usando las ecuaciones (2.67) y (2.116):


∂z1 ∂z2 ∂zCM
Qν = −m1 g − m2 g = −g(m1 + m2 ) (2.134)
∂qν ∂qν ∂qν
donde en este caso tomanos q1 = φ, q2 = θ, q3 = ψ. De (2.133) y (2.134) se sigue
inmediatamente que:
Qφ ≡0

Qψ ≡0 (2.135)

Qθ = (m1 + m2 )grCM senθ


Las condiciones de equilibrio son Qν = 0, lo cual da las siguientes ecuaciones:
0 = 0, 0 = 0, senθ = 0 (2.136)
Se sigue de (2.136) que las configuraciones de equilibrio son aquellas para las cuales
θ = 0 o θ = π, donde φ y ψ pueden tomar cualquier valor. Como para θ = 0 y θ = π,
φ y ψ están en el mismo plano, realmente sólo hay un ángulo arbitrario: todas las
configuraciones que se obtienen por rotar alrededor del vector de posición del centro de
masa son de equilibrio, donde el centro de masa está sobre el eje z.
Las configuraciones de equilibrio respecto a los ejes x, y, z se obtienen de (2.131)
con ψ y φ arbitrarios:
    ′ 
x cos(ψ ± φ) −sen(ψ ± φ) 0 x
    
    ′ 
 y  =  sen(φ ± ψ) cos(φ ± ψ) 0  y 
  (2.137)
   
    
z 0 0 ±1 z′
Donde el signo superior se refiere al caso en que θ = 0 y el inferior a φ = π.
Explı́citamente (2.137) da:
x = x′ cos(ψ ± φ) − y ′ sen(ψ ± φ)

y = x′ sen(φ ± ψ) + y ′ cos(φ ± ψ) (2.138)

z = ±z ′
en concordancia con lo dicho anteriormente. En la configuración de equilibrio estable,
θ = π, las coordenadas de las partı́culas, de acuerdo con (2.138) y (2.126) a (2.130), son:
l2 m2 l2 m1
1− 2 1− 2
2a m1 + m2 2a m1 + m2
z1 = −a s ; z2 = −a s (2.139)
m1 m2 l2 m1 m2 l2
1− 1−
(m1 + m2 )2 a2 (m1 + m2 )2 a2

de acuerdo con los resultados obtenidos anteriormente [ecuaciones (2.88) y (2.90)]. Los
resultados (2.80) también se obtienen directamente de (2.138).
Ecuaciones generales de la estática y la dinámica / 35

2.6. La ecuación general de la dinámica


Si un sistema no está en equilibrio, la fuerza neta sobre cada una de las partı́culas
no es cero sino, de acuerdo con la segunda ley de Newton, es igual al producto de su
masa por su aceleración:
(a) ~ i = mi~¨ri ;
F~i = F~i + R i = 1, 2, ...N (2.140)

Debido a que consideramos ligaduras ideales, que no realizan trabajo sobre el


sistema como un todo al desplazar virtualmente todas las partı́culas, se sigue que:
n 
X 
(a)
F~i − mi~¨r i · δ~ri = 0 (2.141)
i=1
 
(a)
La cantidad F~i − mi~¨r i ·δ~ri no es cero, pero su suma sı́ lo es. La fórmula (2.141)
se llama la ecuación general de la dinámica o también el principio de D’alembert. Esta
ecuación establece lo siguiente: “en todo instante en un sistema dinámico la suma de
(a)
las fuerzas efectivas F~i y de las fuerzas de inercia −mi~r¨i no realiza trabajo al efectuar
desplazamientos virtuales del sistema”, o más en general establece que: “la ecuación
general de la dinámica expresa una condición necesaria y suficiente para que un movi-
miento compatible con las ligaduras sea a la vez compatible con las fuerzas aplicadas”.
Esta ecuación es aplicable a cualquier sistema ideal, holónomo o no holónomo.
Como hay 3N − k desplazamientos virtuales independientes, la ecuación general
de la dinámica proporciona 3N − k ecuaciones, al igualar a cero los coeficientes de los
desplazamientos virtuales independientes, que junto con las k ecuaciones de ligadura
constituye un sistema de 3N ecuaciones con 3N incógnitas. Esta vez, a diferencia del
caso estático, las ecuaciones no serán algebraicas sino diferenciales.
(a+f ) (a)
Si llamamos F~i = F~i − mi~r¨i la ecuación (2.141) queda ası́:
N
X (a+f )
F~i · δ~ri = 0 (2.142)
i=1

o sea que la ecuación general de la dinámica toma la misma forma de la ecuación general
de la estática. Esta ecuación puede interpretarse como una ecuación para caracterizar
en cada instante del tiempo la posición de equilibrio del sistema donde a las fuerzas
(a)
efectivas F~i se les adicionan las fuerzas ficticias o inerciales −mi~¨r i . Más precisamente,
el principio de D’alembert (1760) dice: “cualquier posición de un sistema dinámico puede
considerarse como una posición de equilibrio instantáneo si a las fuerzas aplicadas que
actúan sobre el sistema se agregan las fuerzas ficticias o de inercia”. La regla de oro de
J. Bernoulli queda aplicable también en la dinámica. A −mi~¨r i se llama fuerza inercial
de D’alembert. En el problema estático asociado, las fuerzas de reacción de las ligaduras
coinciden con las del problema original, dinámico.

Ejemplo 2.6.1 Sea un recipiente lleno de agua que se mueve con una aceleración ~a per-
pendicular a la fuerza de gravedad (véase figura 2.8). Hallar la forma y la posición de la
superficie del agua.
36 / Mecánica clásica avanzada

Cuando ~a = 0, la única fuerza aplicada sobre cada elemento de volumen es la de


gravedad; las fuerzas ejercidas por el resto del lı́quido pueden asumirse como de reacción.
La forma de la superficie en el caso estático es plana y horizontal, perpendicular a la
fuerza aplicada.

dm

–dma a

F ( a) = –dmgk

Figura 2.8 Diagrama de fuerzas ejercidas sobre el elemento de masa dm

En el caso dinámico, a cada elemento de masa dm se le aplica adicionalmente una


fuerza ficticia −dm ~a. La superficie del agua será ahora un plano perpendicular a la
fuerza F~ (a+f ) . La inclinación de la superficie estará dada por:
a
tan φ = (2.143)
g

Ejemplo 2.6.2 Sean dos partı́culas en un doble plano inclinado, unidas por una cuerda
inextensible sin masa (véase figura 2.9). Hallar la condición de equilibrio. Resolver el
problema dinámico.

Las ligaduras son:

z1 = 0 z2 = 0

y1 = x1 tan α1
(2.144)
y2 = −x2 tan α2
p p
x21 + y12 + x22 + y22 = l
Ecuaciones generales de la estática y la dinámica / 37

y
α2 α1 z

m
m1 2
α1 α2

Figura 2.9 Dos partı́culas en un doble plano inclinado, unidas por una cuerda inextensible
sin masa.

Hay sólo un grado de libertad. Los desplazamientos virtuales son a lo largo de


los planos, como los desplazamientos reales. El principio de los trabajos virtuales nos
conduce a:

−m1 g ĵ · δ~r1 − m2 g ĵ · δ~r2 = 0 (2.145)

es decir:

−m1 tan α δx1 + m2 tan α2 δx2 = 0 (2.146)

De la condición de ligadura impuesta por la cuerda se obtiene:


cos α1
δx1 = δx2 (2.147)
cos α2
Con lo cual la ecuación de equilibrio queda ası́:
 
cos α1
−m1 tan α1 + tan α2 δx2 = 0 (2.148)
cos α2
Como δx2 es arbitrario, se obtiene que:

m1 senα1 = m2 senα2 (2.149)

O sea que cuando los ángulos y las masas sean tales que se cumple la anterior
condición, el sistema estará en equilibrio en cualquier posición.
Para el caso dinámico, o sea cuando m1 senα1 6= m2 senα1 , aplicamos la ecuación
general de la dinámica:

(m1~g − m1~a1 ) · δ~r1 + (m2~g − m2~a2 ) · δ~r2 = 0 (2.150)

Las aceleraciones deben ser compatibles con las ligaduras, con lo cual se obtienen
las siguientes relaciones:
cos α1
a1x = a2x ; a1y = a1x tan α1 ; a2y = −a2x tan α2 (2.151)
cos α2
38 / Mecánica clásica avanzada

Además, entre los desplazamientos virtuales hay estas tres relaciones:


cos α2 senα2
δy1 = δx1 tan α1 ; δx2 = δx1 ; δy2 = −δx1 (2.152)
cos α1 cos α1
Al expresar en la ecuación general de la dinámica todas las componentes de las
aceleraciones en términos de a1x y todos los desplazamientos virtuales en términos de
δx1 , obtenemos:
"
senα2
− m1 g tan α1 + m2 g
senα1
# (2.153)

−(m1 sec2 α1 + m2 sec2 α1 ) a1 x δx1 = 0

Con lo cual se obtiene a a1x y por consiguiente a a1y . La magnitud de ~a1 será:
|m1 g senα1 − m2 g senα2 |
a1 = (2.154)
m1 + m2
La aceleración a2 tiene igual magnitud. Las componentes x de las aceleraciones
son iguales y de signos contrarios.

Sistema de ecuaciones de la dinámica. Para sistemas holónomos, el principio


de D’alembert permite usar los resultados obtenidos en el caso estático. Las ecuaciones
(a)
(2.63) nos permiten obtener las ecuaciones de movimiento con sólo reemplazar a F~i
(a)
por F~i − mi~¨r i :
N
X
(a) ∂fα
F~i − mi~¨r i + λα =0 (2.155)
α=1
∂~ri

Para un sistema no holónomo, además de lo anterior, los desplazamientos virtuales


deben satisfacer las relaciones (2.33):
N
X
~lα · δ~ri = 0 ; α = 1, 2, ... n (2.156)
i
i=1

Debemos entonces introducir los multiplicadores de Lagrange adicionales µ1 , µ2 ,


...µn , que escogeremos de modo que se anulen los coeficientes de los n desplazamientos
dependientes adicionales. Para ello, multiplicamos (2.33) por µα y sumamos sobre α:
N X
X n
µα ~lαi · δ~ri = 0 (2.157)
i=1 α=1

Claramente se ve que en este caso las ecuaciones de movimiento tomarán la si-


guiente expresión:
h
X n
(a) ∂fα X ~
mi~r¨i = F~i + λα + µα lαi ; i = 1, 2, ... N (2.158)
α=1
∂~ri α=1
Ecuaciones generales de la estática y la dinámica / 39

Estas 3N ecuaciones contienen las 3N + n + h incógnitas ~r1 , ~r2 , ... ~rN , λ1 , λ2 ,


...λh , µ1 , µ2 , ...µn que junto con las n + h condiciones de ligadura (2.11) y (2.15) nos
dan 3N + n + h ecuaciones con 3N + n + h incógnitas. Esta vez las ecuaciones serán
diferenciales acopladas. Las fuerzas de ligadura estarán dadas por:
h
X n
~i = ∂fα X ~
R λα + µα lαi ; i = 1, 2, ... N (2.159)
α=1
∂~ri α=1

Las ecuaciones (2.158) se llaman ecuaciones de Lagrange de la primera clase y


fueron dadas por Lagrange en el año de 1788. La ecuación (2.159) nos permite obtener la
contribución de cada ligadura a las fuerzas de reacción de las ligaduras. Este formalismo
es aplicable a cualquier sistema mecánico con ligaduras ideales, holónomo o no holónomo,
sometido a fuerzas conservativas o no conservativas.
Ejemplo 2.6.3 Sea un alambre largo, rı́gido, que gira uniformemente alrededor de un
eje perpendicular a él. Una bolita se desliza en el alambre sin fricción. No hay fuerzas
aplicadas (véase figura 2.10). Hallar la trayectoria de la partı́cula y las fuerzas de reacción
de la ligadura.
Elegimos las coordenadas de modo que el alambre permanece en el plano x − y. La
ecuación de ligadura es:
tan ωt x − y = 0 (2.160)

ωt

0 x

Figura 2.10 Alambre largo y rı́gido que gira uniformemente alrededor de un eje perpendicular
a él. La masa m se desliza sobre él sin fricción.

Las ecuaciones (2.158) y (2.159) para este caso son:


mẍ = λ tan ωt (2.161)

mÿ = −λ (2.162)

Rx = λ tan ωt ; R − y = −λ (2.163)
40 / Mecánica clásica avanzada

La ecuación de ligadura nos proporciona la siguiente ecuación diferencial, que junto


con (2.161) y (2.162) nos permite obtener a x, y, λ:

ÿ = ẍ tan ωt + 2ẋω sec2 ωt + 2ω 2 x sec2 ωt tan ωt (2.164)


La ecuación diferencial para x es:
ẍ + 2ω ẋ tan ωt + 2ω 2 x tan2 ωt = 0 (2.165)

Haciendo la sustitución x = u cos ωt obtenemos la siguiente ecuación diferencial


para u:

ü − ω 2 u = 0 (2.166)
Con lo cual la solución para x, y, λ es:

x = A cosh ωt cos ωt (2.167)

y = A cosh ωt senωt (2.168)

λ = −2Amω 2 senhωt cos ωt (2.169)

Las componentes de la fuerza de reacción de la ligadura son:

Rx = −2Amω 2 senhωt senωt ; Ry = 2Amω 2 senhωt cos ωt (2.170)


~ con el eje x está dado por:
El ángulo de R
Ry
= cot ωt (2.171)
Rx
~ es siempre perpendicular al alambre y su magnitud es R = 2Amω 2 senhωt.
o sea que R

2.7. Las ecuaciones de la dinámica en coordenadas


generalizadas para sistemas holónomos
Al introducir las coordenadas generalizadas independientes las ecuaciones de liga-
dura se satisfacen idénticamente. El paso a coordenadas generalizadas de la ecuación
general de la dinámica se puede realizar en forma análoga al caso de la estática en vir-
tud del principio de D’alembert. De acuerdo con las ecuaciones (2.142) y (2.116) las
ecuaciones de movimiento en coordenadas generalizadas son:
N
X (a+f ) ∂~ri
Q(a+f
ν
)
= F~i · = 0; ν = 1, 2, ... l (2.172)
i=1
∂qν

o, más explı́citamente,
XN   ∂~r
(a) i
F~i − mi~¨r i · = 0; ν = 1, 2, ... l (2.173)
i=1
∂qν
Ecuaciones generales de la estática y la dinámica / 41

Definimos la fuerza generalizada aplicada asociada al grado de libertad ν por:


N
X (a) ∂~
ri
Q(a)
ν = F~i · (2.174)
i=1
∂qν

La fuerza generalizada asociada correspondiente a la fuerza de inercia se puede


relacionar con la energı́a cinética de la siguiente manera:
N
X d~r˙i ∂~ri
Q(f
ν
)
= − mi ·
i=1
dt ∂qν
XN    
d ˙ ∂~ri ˙ d ∂~ri
= − mi ~ri · − mi~ri · (2.175)
dt ∂qν dt ∂qν
i=1

Podemos expresar en (2.175) a ∂~ri /∂qν y su derivada temporal en términos de


derivadas respecto a ~r˙ i . Para ello partimos de la siguiente expresión para ~r˙ i :
Xl
∂~ri ∂~ri
~r˙ i = q̇µ + (2.176)
µ=1
∂q µ ∂t

mediante la cual obtenemos:


l
∂~r˙i ∂~ri d ∂~ri X ∂ 2~ri ∂ 2~ri
= ; = q̇µ + (2.177)
∂ q̇ν ∂qν dt ∂qν µ=1
∂qµ ∂qν ∂t∂qν

Por otra parte tenemos que:


l
∂~r˙ i ∂ d~ri X ∂ 2~ri ∂ 2~ri
= = q̇µ + (2.178)
∂qν ∂qν dt µ=1
∂qν ∂qµ ∂qν ∂t

De (2.177) y (2.178) se sigue entonces que:

∂~r˙i ∂~ri d ∂~ri ∂~r˙i


= ; = (2.179)
∂ q̇ν ∂qν dt ∂qν ∂qν
Mediante (2.179) el lado derecho de (2.175) se transforma en:
N
" ! #
X d ˙ ∂~r˙ i ∂ ˙i
~
r
− mi ~ri · − mi~r˙ i · =
i=1
dt ∂qν ∂qν
(2.180)
N N
d X1 ∂ ˙2 X 1 ∂ ˙2
− mi ~ri + mi ~r
dt i=1 2 ∂ q̇ν i=1
2 ∂qν i

Las ecuaciones (2.174) y (2.180) nos permiten escribir a (2.173) en la forma:


d ∂T ∂T
Q(a)
ν − + = 0; ν = 1, 2, ... l (2.181)
dt ∂ q̇ν ∂qν
42 / Mecánica clásica avanzada

Igual que en el caso estático las fuerzas generalizadas de ligadura se anulan, según
una ecuación análoga a la (2.117).
Las ecuaciones (2.181) se denominan las ecuaciones de Lagrange de la segunda
clase. En esas ecuaciones T es la energı́a cinética del sistema. Una vez resueltas las ecua-
ciones (2.181) mediante las fórmulas de transformación (2.21) y (2.23) se hallan los ~ri (t)
(a)
con los cuales se pueden hallar F~i (t) y ~¨ri que permiten obtener de (2.140) las fuerzas
de reacción de las ligaduras.

Fuerzas derivables de un potencial. Si todas las fuerzas aplicadas se pue-


den obtener de una función V mediante las fórmulas (2.118), las fuerzas generalizadas
tomarán la forma:

Q(a)
ν =− V (q, t) ; ν = 1, 2, ... l (2.182)
∂qν

Como ∂V /∂ q̇ν = 0, (2.181) se pueden escribir:


 
d ∂(T − V ) ∂
− (T − V ) = 0 ν = 1, 2, ... l (2.183)
dt ∂ q̇ν ∂qν

T en coordenadas generalizadas depende de (q), (q̇) y de t en el caso en que las li-


gaduras sean reónomas. Se define la función lagrangiana, o simplemente “el lagrangiano”
L ası́:

L(q, q̇, t) ≡ T (q, q̇, t) − V (q, t) (2.184)

Entonces las ecuaciones de movimiento para un sistema holónomo con fuerzas


derivables de un potencial que no depende de las velocidades son:

d ∂L ∂L
− = 0; ν = 1, 2, ... l (2.185)
dt ∂ q̇ν ∂qν

Las ecuaciones (2.185) se denominan usualmente “ecuaciones de Lagrange” y hay


una por cada grado de libertad del sistema.

Covariancia de las ecuaciones de Lagrange. Sean dos conjuntos diferentes de


coordenadas generalizadas (q) y (q) relacionadas mediante la transformación:

qν = qν (q, t) ; q ν = q ν (q, t) ; ν = 1, 2, ... l (2.186)

Esta transformación que no mezcla coordenadas con velocidades se denomina pun-


tual. Queremos hallar si en las coordenadas (q) las ecuaciones de Lagrange toman la
forma de (2.185) en las coordenadas (q). Mediante la transformación (2.186) tenemos
que:

Xl Xl
∂L ∂L ∂ q̇α ∂L ∂qα
= = (2.187)
∂ q̇ν α=1
∂ q̇α ∂ q̇ ν α=1
∂ q̇α ∂qν
Ecuaciones generales de la estática y la dinámica / 43

donde L es la función de (q), (q̇) y t, que se obtiene de L(q, q̇, t) al realizar la transfor-
mación: L(q, q,˙ t) ≡ L q(q, t), q̇(q, q̇, t), t . Por otra parte:
l
"  
d ∂L X d ∂L ∂qα
=
dt ∂ q̇ν α=1
dt ∂ q̇α ∂qα
l
!#
∂L X ∂ 2 qα ∂ 2 qα
+ + (2.188)
∂ q̇α µ=1 ∂qµ ∂q ν ∂t∂q ν

Xl  
∂L ∂L ∂qα ∂L ∂ q̇α
= + (2.189)
∂q µ α=1
∂qα ∂q ν ∂ q̇α ∂qν

Entonces se sigue de (2.188), (2.189) y (2.185) que:

Xl  
d ∂L ∂L d ∂L ∂L ∂ q̇α
− = − =0 (2.190)
dt ∂ q̇ν ∂q ν α=1
dt ∂ q̇α ∂qα ∂q ν

Es decir, la forma de las ecuaciones de Lagrange es la misma en cualquier sis-


tema de coordenadas generalizadas. Es interesante la siguiente relación que se obtiene
directamente usando la transformación puntual (2.186):

Xl Xl
∂L ∂L
q̇ν = q̇ ν (2.191)
α=1
∂ q̇ν ν=1
∂ q̇ν

Sistema sin ligaduras. Si no hay ligaduras las fórmulas (2.185) siguen siendo
válidas, donde l = 3N . Se sigue de (2.190) que cuando el sistema no tiene ligaduras las
ecuaciones de Lagrange (2.185) constituyen la forma de las ecuaciones de movimiento
en cualquier sistema de coordenadas, propiedad que no cumplen las ecuaciones de la
segunda ley de Newton, que son de naturaleza vectorial: las ecuaciones de Lagrange
contienen la misma información que la segunda ley de Newton con la ventaja adicional
de ser ecuaciones completamente covariantes.
En coordenadas cartesianas las fuerzas generalizadas son de la forma Qxi , Qyi ,
Qzi .
N
X X (a) N
(a) ∂~
ri (a)
Qxj = F~i · = F~i · µ̂x δij = Fix (2.192)
i=1
∂xj i=1

N
X 1 
T = mi ẋ2i + ẏi2 + żi2 (2.193)
i=1
2

Con lo cual las ecuaciones (2.181) nos dan:


(a)
mi ẍi = Fix (2.194)
es decir, las ecuaciones de Lagrange conducen a la segunda ley de Newton.
44 / Mecánica clásica avanzada

Comparación de los formalismos newtoniano y lagrangiano. Llamaremos


newtoniano al formalismo basado en la ecuación general de la dinámica directamente.
Este formalismo tiene la ventaja de su generalidad. Sin embargo, para sistemas holóno-
mos con fuerzas derivables de un potencial, el formalismo basado en las ecuaciones de
Lagrange presenta algunas ventajas: las ecuaciones de movimiento se obtienen a partir
de una sola función escalar, la lagrangiana L, en tanto que en el formalismo newtoniano
se trabaja con las fuerzas que actúan sobre las partı́culas. El uso de coordenadas ge-
neralizadas permite en el formalismo lagrangiano eliminar del problema las fuerzas de
ligadura y las coordenadas superfluas. En el formalismo lagrangiano se trabaja con l pa-
rametros independientes que no se refieren a las partı́culas sino al sistema como un todo,
en cambio en el formalismo newtoniano se trabaja necesariamente con coordenadas de
las partı́culas. Finalmente, la covariancia de las ecuaciones de Lagrange es claramente
una ventaja del formalismo lagrangiano.

Ejemplo 2.7.1 Sea un alambre largo y rı́gido que rota uniformemente alrededor de un
punto O como se muestra en la figura 2.11. Una partı́cula de masa m está sometida
a la ligadura de permanecer sobre el alambre. No hay fricción y actúa la fuerza de
gravedad en el plano de rotación del alambre. Resolver el problema usando coordenadas
generalizadas y las ecuaciones de Lagrange.

c
h ωt
m
ωt β
O B x
–mgj

Figura 2.11 Alambre largo y rı́gido que gira uniformemente alrededor de un punto O

Suponer que en t = 0 la partı́cula parte del punto C con velocidad cero a lo largo
del alambre. La ligadura es holónoma y reónoma, dada por la ecuación de la linea del
alambre:

y = x tan β + OA (2.195)
Ecuaciones generales de la estática y la dinámica / 45

De la geometrı́a se sigue que sen ωt = h/OA y tan β = − cot α, con lo cual la ecuación
de ligadura toma la forma:

x cos ωt + y senωt − h = 0 (2.196)

Es una ligadura dependiente explı́citamente del tiempo. El sistema tiene sólo un


grado de libertad. Podemos tomar como coordenada generalizada el desplazamiento de
partı́cula sobre el alambre respecto el punto C. Las ecuaciones de transformación son:

x(q, t) = q senωt + h cos ωt


(2.197)
y(q, t) = −q cos ωt + h senωt

Al reemplazar (2.197) en (2.196) se obtiene la identidad 0 = 0. El lagrangiano del


problema es:
1
L= m(ẋ2 + ẏ 2 ) − mgy (2.198)
2
L expresado en términos de la coordenada generalizada q y la velocidad generali-
zada q̇ es:

L(q, q̇, t) = 21 m(q̇ 2 + q 2 ω 2 + h2 ω 2 − 2q̇hω)


(2.199)
−mg(h senωt − q cos ωt)

Para escribir la ecuación de Lagrange se requiere conocer:


∂L ∂L
= mqω 2 + mg cos α ; = m(q̇ − hω) (2.200)
∂q ∂ q̇
Con lo cual la ecuación de movimiento para la coordenada generalizada q (ecuación
de Lagrange) es:

q̈ − qω 2 = g cos ωt (2.201)

Claramente la solución de (2.201) es de la forma:

q = Aeωt + Be−ωt + C cos ωt (2.202)

que satisface las condiciones iniciales q(0) = 0, q̇(0) = 0 sólo si A = B = −(1/2)C. C se


determina reemplazando (2.202) en (2.201), obteniéndose finalmente para q(t):
g
q(t) = (cosh ωt − cos ωt) (2.203)
2ω 2
Las fuerzas de reacción de las ligaduras se determinan a partir de la ecuación
(2.140):

Rx = mẍ
(2.204)
Ry = mg + mÿ
46 / Mecánica clásica avanzada

Las ecuaciones (2.197) y (2.203) permiten calcular a ẍ y ÿ:

ẍ = q̈ senωt + 2q̇ω cos ωt − qω 2 senωt − hω 2 cos ωt


(2.205)
ÿ = −q cos ωt + 2q̇ω senωt + qω 2 cos ωt − hω 2 senωt

Con lo cual se obtiene para Rx y Ry:

Rx = mg(senhωt + 2senωt) cos ωt − mhω 2 cos ωt


(2.206)
Ry = mg(senhωt + 2senωt)senωt − mhω 2 senωt

El vector ~l está dirigido a lo largo del alambre:


~l = îsenωt − ĵ cos ωt (2.207)

El producto escalar de ~l con R


~ es cero: ~l· R
~ = 0 o sea que R
~ es siempre perpendicular
al alambre. Su magnitud es:

R = mg(senhωt + 2senωt) − mhω 2 (2.208)

2.8. Las ecuaciones de la dinámica en coordenadas


generalizadas para sistemas no holónomos. Uso
de coordenadas no independientes
Con sistemas no holónomos no es posible, mediante la introducción de coordena-
das generalizadas independientes, eliminar las condiciones de ligadura. Por alguna razón
serı́a deseable trabajar con un conjunto de 3N coordenadas no cartesianas q1 , q2 , ... q3N ,
que no serán independientes. Incluso serı́a posible trabajar con un conjunto de 3N − h
coordenadas generalizadas no independientes definido de tal manera que se eliminen
del problema las ligaduras holónomas. En cualquiera de estos dos casos debemos traba-
jar con coordenadas generalizadas no independientes. Se trata de hallar las ecuaciones
de movimiento usando estas coordenadas. Para ello basta partir de las ecuaciones de
Lagrange de la segunda clase, ecuaciones (2.181), considerando esta vez las Qν como
formadas de las fuerzas aplicadas y de las fuerzas de ligadura (2.159):
N h n
!
X (a)
X ∂f α
X ∂~ri
Qν = F~i + λα + µα~lαi ·
i=1 α=1
∂~
r i α=1
∂q ν

ν = 1, 2, ... 3N (2.209)

definimos las cantidades dα y aαν de la siguiente manera:


N
X
∂fα ∂fα ∂~ri ∂fα
dα = ; aαν = · = para α = 1, 2, ... h (2.210)
∂t i=1
∂~ri ∂qν ∂qν
Ecuaciones generales de la estática y la dinámica / 47

N
X
dα = Dα ; aαν = ~lα · ∂~r1
i=1
∂qν
para α = h + 1, h + 2, ... h + n = k (2.211)

Con lo cual podemos escribir a (2.209) como:

k
X
Qν = Q(a)
ν + λα aαν (2.212)
α=1

donde esta vez λα representan los k multiplicadores de Lagrange λ1 , λ2 , ... λh , µ1 , µ2 ,


... µn . Las ecuaciones de Lagrange de la segunda clase se pueden escribir entonces en la
forma:

Xk
d ∂T ∂T
− = Qν(a) + λα aαν ; ν = 1, 2, ... 3N (2.213)
dt ∂ q̇ν ∂qν α=1

En resumen, con las coordenadas generalizadas q1 , q2 , ... q3N las ecuaciones de


ligadura se pueden escribir en la forma:
3N
X
aαν q̇α + dα = 0 ; α = 1, 2, ... h, h + 1, h + 2, ... h + n = k (2.214)
α=1

que junto con las 3N ecuaciones de Lagrange nos proporcionan 3N + k ecuaciones con
las 3N + k incógnitas siguientes: q1 , q2 , ... q3N , λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las fuerzas
de
Pkreacción de las ligaduras en estas coordenadas no independientes estarán dadas por
α=1 λα aαν , o más explı́citamente:

h
X n
∂fα X
Rν = λα + µα aαν (2.215)
α=1
∂qα α=1

Ejemplo 2.8.1 Resolver el problema del ejemplo 2.7.1 usando multiplicadores de Lagran-
ge y coordenadas no independientes.

Tomaremos a q y h como coordenadas generalizadas no independientes. En la


ecuación de ligadura escribiremos a la distancia OC como h0 :

f (x, y, t) = x cos ωt + y senωt − h0 (2.216)

Haciendo la transformación de las coordenadas x, y a las coordenadas q, h, ecuación


(2.197), obtenemos para ~r y f :

f (q, h, t) = h − h0 (2.217)

~r(q, h, t) = q(î senωt − ĵ cos ωt) + h(î cos ωt + ĵ senωt) (2.218)


48 / Mecánica clásica avanzada

con lo cual se obtienen las siquientes expresiones para los coeficientes aq , ah , d, según
(2.210):
∂f
aq = =0
∂q

∂f (2.219)
ah = =1
∂h
∂f
d= =0
∂t
Las fuerzas aplicadas generalizadas serán:
∂~r
Qν = −mg î · (2.220)
∂qν
con lo cual:
Qh = −mg senωt ; Qq = mg cos ωt (2.221)
La energı́a cinética será:
1
T (q, q̇, h, ḣ, t) = m(q̇ 2 + q 2 ω 2 + h2 ω 2 − 2q̇hω + 2q ḣω + ḣ2 ) (2.222)
2
Entonces las ecuaciones (2.213) serán:
m(q̈ − ḣω) − m(qω 2 + ḣω) = mg cos ωt
(2.223)
m(ḧ + q̇ω) − m(hω 2 − q̇ω) = −mg sen ωt + λ
La ecuación (2.214) será:
ḣ = 0 ⇒ h = h0 (2.224)
Reemplazando (2.224) en (2.223) obtenemos:
q̈ − qω 2 = g cos ωt
(2.225)
λ
= 2q̇ω − hω 2 + g senωt
m
La solución de las ecuaciones (2.225) de acuerdo con (2.224) será:
g
q = (cosh ωt − cos ωt)
2ω 2
(2.226)
2
λ = mg(senhωt + 2senωt) − mhω
Las fuerzas generalizadas de ligadura serán, de (2.226) y (2.215):
Rh = mg(senhωt + 2senωt) − mhω 2 ; Rq = 0 (2.227)
en completo acuerdo con los resultados de (2.208).
Ecuaciones generales de la estática y la dinámica / 49

Ejemplo 2.8.2 Sea un disco de radio R que rueda sobre un plano inclinado con el plano
del disco perpendicular al plano inclinado (podrı́a ser una de las ruedas de un carro).
Hallar y resolver las ecuaciones de movimiento.

Tomaremos el plano xy en el plano inclinado, con lo cual se tendrá una confi-


guración como en la figura 2.1. Las coordenadas del sistema serán: xCM , yCM , α, φ,
que tomamos como coordenadas genaralizadas no independientes. De las ecuaciones de
ligadura, no holónomas dadas por las ecuaciones (2.9):
ẋ − R senα φ̇ = 0
(2.228)
ẏ + R cos α φ̇ = 0
obtenemos las siquientes expresiones para los coeficientes aαν que aparecen en (2.214):
a1x = 1 a1y = 0 a1α = 0 a1φ = −R senα
(2.229)
a2x = 0 a2y = 1 a2α = 0 a2φ = R cos α
Los momentos de inercia de un disco alrededor de su eje y alrededor de un diámetro
son respectivamente:
1 1
Iφ = mR2 ; Iα = mR2 (2.230)
2 4
La energı́a cinética contendrá una parte debida al movimiento del centro de masa
y otra debida al movimiento respecto al centro de masa:2
1 1 1
T = m(ẋ2 + ẏ 2 ) + mR2 φ̇2 + mR2 α̇2 (2.231)
2 4 8
Tomaremos los ejes xy de modo que el eje x esté horizontal y el eje y haciendo un
ángulo β con la horizontal. Las fuerzas generalizadas serán entonces:
(a)
Q(a)
α = Qφ = 0 ; Q(a)
x = 0; Q(a)
y = mg senβ (2.232)
Usando las ecuaciones (2.229), (2.231) y (2.232), las ecuaciones (2.213) se trans-
forman en:
mẍ = µ1

mÿ = mg senβ + µ2

1 2 (2.233)
R mα̈ = 0
4
1 2
R mφ̈ = −µ1 R senα + µ2 R cos α
2
La tercera de las ecuaciones (2.233) nos da:
α = ωα t + α0 (2.234)
2 Para una justificación rigurosa de (2.231) ver sección 8.3.
50 / Mecánica clásica avanzada

Las dos primeras ecuaciones (2.233) junto con las (2.228) nos dan las siguientes
expresiones para µ1 y µ2 en términos de φ:
µ1 = mRωα cos(ωα t + α0 ) φ̇ + mR cos(ωα t + α0 ) φ̈
(2.235)
µ2 = mRωα sen(ωα t + α0 ) φ̇ − mR cos(ωα t + α0 )φ̈ − mg sen β
Ahora, reemplazando a µ1 y µ2 en la última de las (2.233) obtenemos:
2 g
φ̈ = − senβ cos(ωα t + α0 ) (2.236)
3 R
que al ser integrada nos da:
2g
φ= senβ cos(ωα t + α0 ) + At + B (2.237)
3Rωα2
Tomando la condición inicial φ(0) = 0 y φ̇(0) = 0, (2.237) será:
2g
φ= senβ[cos(ωα t + α0 ) − cosα0 + ωt senα0 ] (2.238)
3Rωα2
Tomando además a α0 = 0, lo que equivale a tomar en t=0 a α = 0, obtenemos:
α = ωα t

2gsenβ ωt
φ =− sen2
3Rωα2 2

2
µ1 = − mg senβsen2ωα t
3
  (2.239)
2
µ2 = −mgβ 1 − cos 2ωα t
3
 
g senβ 1
x =− ωα t − sen2ωα t
3ωα2 2

gsenβ
y = sen2 ωα t
3ωα2
Donde hemos tomado que x = 0, y = 0, ẋ = 0, ẏ = 0 en t = 0.
Las fuerzas de reacción de las ligaduras serán, usando (2.215):
Rx = µ1

Ry = µ2

Rα = 0 (2.240)
Rφ = −µ1 R senωα t + µ2 R cos ωα t

1
= − mgR senβ cos ωα t
3
Ecuaciones generales de la estática y la dinámica / 51

Si se deja la rueda inicialmente alineada en el eje y, se tiene que ωα = 0, con lo


cual:

α= 0 Rx = 0

g senβ 2 1
φ= − t Ry = − mg senβ
3R 3
(2.241)
x= 0 Rα = 0

1 1
y= gsenβ t2 R= − mgR senβ
3 3
Si en vez de un disco se tuviera una masa que baja sin rozamiento a lo largo del eje
y, la fuerza a lo largo del plano serı́a mg senβ. En este caso se tiene que el plano ejerce
sobre la rueda una fuerza en y dada por (−1/3)mg senβ y que la hace rodar hacia abajo
en la dirección de y positiva. Rφ es el torque que produce la rotación. La aceleración del
centro de masa será (2/3)g senβ con lo cual y = (1/3) senβ t2 y φ = (1/3)g senβ t2 /R.

Ejemplo 2.8.3 Sean dos partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida
de longitud l, sin masa. El sistema de alguna manera está constreñido a moverse en un
plano vertical, de modo que la velocidad del centro de masa siempre está en la dirección
de la varilla (véase figura 2.12). Hallar y resolver las ecuaciones de movimiento.

r1

1
r ·

r2 α

2
y

Figura 2.12 Partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida y constreñidas a
moverse en un plano vertical
52 / Mecánica clásica avanzada

La ligadura holónoma es:


|~r1 − ~r2 | = l (2.242)
La ligadura no holónoma es:

= tan α (2.243)

Escogemos como coordenadas generalizadas no independientes a x, y y α. Defini-
mos el vector ~l como:
~l = ~r1 − ~r2 (2.244)
con magnitud l y dirección α. Las ecuaciones de transformación de coordenadas son:
~l
~r1 = ~r +
2
(2.245)
~l
~r2 = ~r −
2
La energı́a cinética se puede escribir como:
1
T = ẋ2 + ẏ 2 + l2 α̇2 (2.246)
4
Los coeficientes en la ecuación de ligadura no holónoma son:
ax = − tan α ; ay = 1 ; aα = 0 (2.247)
La fuerza aplicada generalizada es:
Qx = 0 ; Qy = 2g ; Qα = 0 (2.248)
Las ecuaciones de Lagrange, (2.213), serán:
2ẍ = −µ tan α

2ÿ − 2g = µ (2.249)
1 2
l α̈ = 0
2
Para α se halla:
α = ωt + δ (2.250)
x, y y µ se hallan de las ecuaciones:
2ẍ = −µ tan(ωt + δ)

2ÿ = 2g + µ (2.251)

ẏ − ẋ tan(ωt + δ) = 0
Ecuaciones generales de la estática y la dinámica / 53

ẋ obedece la ecuación diferencial:


2ẍ + 2ẋω tan α = g sen2α (2.252)
Esta es una ecuación diferencial lineal de primer orden en ẋ cuya solución general
está dada por una fórmula estándar. La solución para ẋ es:
g
ẋ = − (1 + cos 2α) + A cos α (2.253)

Su integral nos da directamente:
g A
x=− (2ωt + sen2α) + senα + B (2.254)
Aω 2 ω
donde A y B son constantes de integración. Para y y µ se halla:
g A
y= 2
cos 2α − cos α + C (2.255)
4ω ω
µ = −2g(1 + cos 2α) + 2Aω cos α (2.256)

Las fuerzas de reacción de las ligaduras serán:


Rx = 2g sen2α − 2Aω senα

Ry = −4g cos 2α + 2Aω cos α (2.257)

Rα = 0

Se sigue que si al sistema se aplica una fuerza dada por (2.257), se moverá con
la condición de ligadura (2.243). ω, δ, A, B, y C son constantes de integración que
dependen de las condiciones iniciales.
54 / Mecánica clásica avanzada
3
El principio de Hamilton y las ecuaciones de
Lagrange

3.1. Forma integral de la ecuación general de la dinámi-


ca para un sistema holónomo
Trayectorias variadas. La ecuación general de la dinámica, ecuación (2.141), es
válida en cada instante t, ya que por definición los δ~ri se realizan instantáneamente
alrededor de la posición real del sistema. La ecuación general de la dinámica es un
“principio diferencial” que expresa la anulación del trabajo virtual de las fuerzas de
ligadura en cada instante t, o equivalentemente en cada configuración del sistema.
Tomemos fijos t1 y t2 . Si en cada instante t, entre t1 y t2 , se realiza un despla-
zamiento virtual en las coordenadas de cada partı́cula, δ~ri (t), y se impone la condición
δ~ri (t1 ) = δ~ri (t2 ) = 0 se obtendrá que la secuencia de desplazamientos virtuales define
una trayectoria diferente entre t1 y t2 . A esta trayectoria se le denomina “trayectoria va-
riada” y la trayectoria seguida por el sistema se denomina “trayectoria real” (véase figura
3.1 ). La función del tiempo ~ri (t) determina la trayectoria real y la función ~ri (t) + δ~ri (t)
determina la trayectoria variada. A la función δ~ri (t) se le denomina la “variación” de
la función ~ri (t). También se suele llamar “trayectoria recta” a la real y “trayectoria
circuitosa” a la variada (véase figura 3.1). ~ri (t) es una representación paramétrica de la
trayectoria con parámetro t. De acuerdo con los comentarios de la sección 2.3, el conjun-
to de desplazamientos virtuales en un tiempo t puede asociarse a un “ensamble” muy
grande de sistemas.
Las trayectorias se forman uniendo un elemento de una “fila”, t, a un elemento
de la “fila” t + dt, en forma de “zig-zag” en la matriz bidimensional mencionada en la
sección 2.3; una trayectoria será “recta”; todas las demás serán “circuitosas”.
Si el trabajo virtual de las fuerzas de ligadura es cero en cada instante t:
N
X
~ i (t) · δ~ri (t) = 0,
R (3.1)
i=1

también será cero el promedio de los trabajos virtuales realizados por las fuerzas de

55
56 / Mecánica clásica avanzada

z
2
Trayectoria variada

δri

mi

1
Trayectoria real
ri

y
x

Figura 3.1 Representación de trayectorias en desplazamientos virtuales

ligadura entre t1 y t2 :
Z N
t2 X
1 ~ i (t) · δ~ri (t)dt = 0
R (3.2)
t2 − t1 t1 i=1

Como consecuencia de lo anterior, la ecuación general de la dinámica toma la


forma:
Z N h
t2 X i
(a)
F~i (t) − mi~¨r i (t) · δ~ri (t)dt = 0 (3.3)
t1 i=1

Esta es una expresión integral, en términos ya no de desplazamientos virtuales sino


de variaciones globales de las trayectorias de las partı́culas. Transformando la ecuación
(3.3) llegaremos a una expresión completamente equivalente a la ecuación general de la
dinámica y por lo tanto a las ecuaciones de Lagrange de la primera y de la segunda
clase, para sistema holónomos.
Cada punto de la trayectoria variada se puede obtener de un punto de la trayectoria
real, para cada una de las partı́culas, por medio de un desplazamiento virtual. Como
consecuencia de esto, tanto la trayectoria real como la variada han de ser compatibles
con las condiciones de ligadura.
En cada instante t podemos escribir los δ~ri como:

δ~ri (t) = ~ri v (t) − ~ri r (t) (3.4)

donde v denota “variada” y r “real”. Se impone la condición de que las variaciones se


anulen en t1 y en t2 para cada partı́cula. Es decir que ~riv (t) = ~rir (t) en t = t1 y t = t2
para i = 1, 2, ...N .
El principio de Hamilton y las ecuaciones de Lagrange / 57

La integral de acción. Es la integral (3.3) haciendo algunas transformaciones.


En la ecuación (3.3) hacemos la siguiente transformación:
d  ˙  d
mi~¨r i · δ~ri = mi~ri · δ~ri − mi~r˙ i · (δ~ri ) (3.5)
dt dt
Notando que las operaciones δ y d/dt conmutan:
d d
(δ~ri ) = [~ri v (t) − ~ri r (t)] = ~r˙ i v − ~r˙ i r = δ~r˙ i (3.6)
dt dt
podemos escribir a (3.5) en la forma:
d  ˙  1 2
mi~¨r i · δ~ri = mi~ri · δ~ri − mi δ~r˙ i (3.7)
dt 2
Con lo cual se tiene que:
N N
! N
X d X X 1 2
mi~¨r i · δ~ri = mi~r˙ i · δ~ri −δ mi~r˙ i (3.8)
i=1
dt i=1 i=1
2

Por tanto la ecuación (3.3) tomará la forma:


Z t2 "XN N
! N
#
~ (a) d X ˙ X
˙ 2
Fi · δ~ri − mi~ri · δ~ri + δ mi~ri dt = 0 (3.9)
t1 i=1
dt i=1 i=1

Notamos que en (3.9) aparecen el trabajo virtual de las fuerzas aplicadas, δA, y la
energı́a cinética:1
N
X N
(a) 1 X ˙2
δA = F~i · δ~ri ; T = mi~ri (3.10)
i=1
2 i=1

O sea que (3.9) se puede escribir como:


Z t2 t2
N
X
˙
(δA + δT )dt − mi~ri · δ r~i = 0 (3.11)
t1
i=1 t1

En virtud de la condición impuesta a los desplazamientos virtuales en t = t1 y


t = t2 , el término integrado se anula con lo cual (3.11) queda finalmente:
Z t2
(δA + δT )dt = 0 (3.12)
t1

Podrı́a pensarse que la presencia de condiciones de ligadura harı́a que δ~ri (t1 ) =
δ~ri (t2 ) = 0 no es posible imponerla para todas las coordenadas sino sólo para las indepen-
dientes, quedando la posibilidad de que no se cumpla para las coordenadas dependientes.
1 Como para pasar de r a r +δ~ ri se requiere realizar un trabajo, la energı́a en cada trayectoria variada
i i
es diferente. Esto caracteriza al principio de Hamilton, a diferencia de otros principios variacionales como
el de “mı́nima acción” (véase sección 9.3).
58 / Mecánica clásica avanzada

Sin embargo este no es el caso, pues de una transformación a coordenadas generalizadas


independientes q1 , q2 , ...ql se sigue que:
Xl
∂~ri
δ~ri = δqν (3.13)
ν=1
∂qν

Basta pues que se imponga la condición siguiente sobre los desplazamientos vir-
tuales de las coordenadas generalizadas:
δqν (t1 ) = δqν (t2 ) = 0 ; ν = 1, 2, ...l (3.14)
para que se satisfaga la condición requerida para los desplazamientos virtuales δ~ri .
En el caso particular en que las fuerzas aplicadas se pueden obtener como el gra-
diente de una función de las coordenadas y del tiempo, V (~r, t) vemos que:
N
X N
X
∂V (a)
δV (~r, t) = .δ~ri = − F~i .δ~ri = −δA (3.15)
i=1
∂~ri i=1

Para este caso la ecuación (3.12) toma la forma:


Z t2 Z t2 Z t2
δ(T − V )dt = δL dt = δ L dt = 0 (3.16)
t1 t1 t1

donde el segundo signo igual en (3.16) está justificado por lo siguiente:


Z t2 Z t2 Z t2 Z t2 Z t2
v r v r
δL dt = (L − L )dt = L dt − L dt = δ L dt (3.17)
t1 t1 t1 t1 t1

Por medio de las transformaciones a coordenadas independientes se ve que T es


función de (q), (q̇), t, y V es función de (q) y t, con lo cual (3.16) se puede escribir como:
Z t2
δS = δ L(q, q̇, t)dt = 0 (3.18)
t1

Esta ecuación es equivalente a la ecuación general de la dinámica y de ella se


pueden obtener también las ecuaciones de Lagrange usando el cálculo variacional. A la
integral S se la denomina integral de acción

3.2. El principio de Hamilton


Es posible el desarrollo formal de la mecánica tomando la ecuación (3.12) como pos-
tulado fundamental en vez de partir del principio de D’Alembert, ecuación (2.141). En
este formalismo se denomina al contenido de la ecuación (3.18), el principio de Hamilton.

El principio de Hamilton para sistemas con fuerzas aplicadas derivables


de un potencial. El movimiento del sistema, descrito por las coordenadas generalizadas
qν (t), es tal que entre dos instantes t1 y t2 se satisface:
Z t2
δ L(q1 , q2 , ...ql ; q̇1 , q̇2 , ...q̇l ; t)dt = 0 (3.19)
t1
El principio de Hamilton y las ecuaciones de Lagrange / 59

Este es un principio variacional, formulado por W. Hamilton en 1835. Matemáticamente


(3.19) es la condición para que la acción S sea una extremal. S es una funcional de la
trayectoria q(t).
En análisis de funciones, se tiene que si F (x1 , x2 , ...xn ) es una función de muchas
variables, F tendrá un valor extremal, máximo o mı́nimo, si al realizar un cambio infini-
tesimal en las variables F no cambia al primer orden en dichos cambios infinitesimales.
Es decir si:
F (x1 + δx1 , x2 + δx2 , ...xn + δxn ) − F (x1 , x2 , ...xn )
(3.20)
= δF (x1 , x2 , ...xn )
entonces:
XN
∂F
δF (x1 , x2 , ...xn ) = δxi + 0(δx2i ) = 0 (3.21)
i=1
∂xi

Se sigue que F (x1 , x2 , ...xn ) será extremal para aquellos valores de x1 , x2 , ...xn que
hacen que se anulen todas las derivadas parciales de primer orden de F :
∂F
=0 i = 1, 2, ...n (3.22)
∂xi
En el análisis de funciones F (x1 , x2 , ...xn ) es un número que se asocia al conjunto
de números x1 , x2 , ...xn . Al cambiar los números x1 , x2 , ...xn cambia el número F . Se
dice que F es extremal si no cambia al primer orden en δxi cuando los xi se cambian
por xi + δxi . 2
En el análisis funcional I [f1 (x), f2 (x), ...fn (x)] es un número que se asocia al conjunto
de funciones f1 (x), f2 (x), ...fn (x). Al cambiar las funciones f1 (x), f2 (x), ...fn (x) cambia
el número I. Se dice que I es extremal si no cambia al primer orden en δfi (x) cuando
las funciones fi (x) se cambian por las funciones fi (x) + δfi (x). A δfi (x) se le denomina
variación de la función fi (x). Toda función continua en un punto x0 puede expandirse
en serie de Taylor alrededor de x0 :

X 1 (k)
fi (x) = f (x0 )(x − x0 )k (3.23)
k! i
k=0

(k)
donde fi (x0 ) denota el valor de la derivada k-ésima de la función fi (x) en x = x0 y
(0) (n)
fi (x0 ) ≡ fi (x0 ). Variando los parámetros fi (x0 ) para k = 0, 1, 2, ...∞ se obtiene una
función diferente.
S es una funcional de qν (t), pues a cada posible solución q1 (t), q2 (t), ...ql (t) le
corresponde un valor definido a la integral de acción S. El principio de Hamilton dice
que al variar las funciones qν (t) se obtiene el conjunto de funciones verdaderas que
describen la evolución del sistema por hallar qué conjunto es el que hace que S sea una
extremal. Para la mayorı́a de las situaciones fı́sicas se encuentra que S es mı́nima para
2 El máximo o mı́nimo de una función se halla resolviendo el sistema de ecuaciones algebraicas (3.22),

como en la estática. Los extremales de una funcional se hallan resolviendo un sistema de ecuaciones
diferenciales, como en la dinámica.
60 / Mecánica clásica avanzada

la solución correcta. En otras palabras, S tiene un valor mı́nimo cuando las funciones
qν (t) describen las trayectorias reales.3 El número S asignado a cualquier trayectoria
variada es mayor que el número S asociado a la trayectoria real.
Ejemplo 3.2.1 Ilustrar el principio de Hamilton con el problema del tiro parabólico en
presencia del campo gravitacional (véase figura 3.2).
Sabemos que la trayectoria real está descrita por:
1 2
x(t) = Vx t ; y(t) =
gt (3.24)
2
Eliminando el parámetro t se obtiene que la trayectoria es parabólica:
g 2
y= x (3.25)
2Vx2
Esta trayectoria pasa por el punto (x = 0, y = 0) en t = 0 y por el punto (x2 , y2 =
gx22 /(2Vx2 )) en t = t2 (véase figura 3.2).
La siguiente trayectoria variada pasa por los mismos puntos que la trayectoria real
en t = t1 = 0 y t = t2 :
x = Vx t
(3.26)
ex/x2 − 1
y = y2
e−1
Se trata de mostrar que la integral de acción tiene menor valor para la trayectoria
real que para esta trayectoria variada.
El lagrangiano del problema es:
1
L= m(ẋ2 + ẏ 2 ) + mgy (3.27)
2
Sobre la trayectoria real L es:
1 1 1
L= m(Vx2 + g 2 t2 ) + mg 2 t2 = mVx2 + mg 2 t2 (3.28)
2 2 2
La integral de acción es:
Z t2
1 1 1 x2y2
L dt = mVx2 t2 + mg 2 t32 = mVx x2 + 0, 666 mg (3.29)
0 2 3 2 Vx
Sobre la trayectoria variada:
y2 Vx
ẋ = Vx ; ẏ eVx t/x (3.30)
x2 (e − 1)
Con lo cual L es:
 
1 y22 Vx2 mgy2 Vx t/x2
L = m Vx2 + 2 2 e 2Vx t/x2
+ (e − 1) (3.31)
2 (e − 1) x2 e−1
3 De acuerdo con el principio de D’Alembert esto equivale a decir que las posiciones verdaderas son
de “equilibrio” estable.
El principio de Hamilton y las ecuaciones de Lagrange / 61

P1 x

P2 (x2,y2)

Figura 3.2 Trayectoria parabólica en presencia de un campo gravitacional. Trayectoria variada.

La integral de acción es:


Z t2
1 81e − 60 mgx2 y2
L dt = mVx x2 +
0 2 72(e − 1) Vx
(3.32)
1 mgx2 y2
= mVx x2 + 0,689
2 Vx

Vemos que la acción en la trayectoria real es menor que la acción en la trayectoria


variada.
Cuando no se conoce la trayectoria, es decir cuando no se ha resuelto el problema,
el principio de Hamilton directamente no proporciona un método práctico: se requiere
un método de ensayo y error; suponer una solución y evaluar S; obtener una “tabla”
de soluciones posibles en función de la acción. La solución correcta serı́a aquella para la
cual S es mı́nima.

Ejemplo 3.2.2 Resolver el problema del oscilador armónico lineal usando directamente
el principio de Hamilton, con las siguientes condiciones en t = 0 y t = t1 :

x(0) = 0 , x(t1 ) = x1 , ẋ(0) = v0 (3.33)


62 / Mecánica clásica avanzada

Las posibles funciones de t las asumiremos de la forma:


X∞
x(t) = a n tn (3.34)
n=0
O sea que a cada conjunto de parámetros a0 , a1 , a2 , ...a∞ le corresponderá una
solución.4 El conjunto de parámetros que determina la solución real es aquel para el cual
δS = 0. De la condición x(0) = 0 se sigue que a0 = 0, con lo cual:
X∞
x(t) = a n tn (3.35)
n=1
El lagrangiano para el oscilador armónico unidimensional es:
1 1
L = µẋ2 − kx2 (3.36)
2 2
Reemplazando (3.35) en (3.36) obtenemos:
∞ ∞ ∞ ∞
1 XX 1 XX
L= µ nman am tn+m−2 − k an am tn+m (3.37)
2 n=1 m=1 2 n=1 m=1
Con lo cual la integral de acción será:
Z t1
S= L dt =
0

  (3.38)
∞ ∞
1XX nm n+m−1 1 n+m+1
an am µ t −k t
2 n=1 m=1 n+m−1 1 n+m+1 1
La condición δS = 0 nos da:
"∞
∞ X  #
X nm 1
am µ tn+m−1 − k tn+m+1 δan = 0 (3.39)
n=1 m=1
n+m−1 1 n+m+1 1
En la ecuación (3.39) los δan son los cambios de los coeficientes an que darán lugar
a la variación δx(t). Los δan no son independientes, pues se debe además cumplir la
condición δx(t1 ) = 0:
Xn
δx(t1 ) = δan tn1 = 0 (3.40)
n=1
En virtud de (3.40) un δan puede expresarse en términos de los demás. Vamos a
introducir un multiplicador indeterminado λ multiplicando la ecuación (3.40) por λ y el
resultado lo sumamos a la ecuación (3.39) para obtener:

" ∞ 
X X mn
µ t1n+m−1
n=1 m=1
n + m − 1
(3.41)
 
1
−k tn+m+1 am + λtn1 δan = 0
n+m+1 1
4 La ecuación (3.34) constituye una representación multiparamétrica de la trayectoria en el espacio
de configuración.
El principio de Hamilton y las ecuaciones de Lagrange / 63

Ahora escogemos a λ de modo que se anule el coeficiente de δa1 :


X∞  
1 m+2
µtm
1 − k t am + λt1 = 0 (3.42)
m=1
m+2 1

En la ecuación (3.41) quedará una combinación lineal de los δa2 , δa3 , ...δa∞ , igua-
lada a cero. Como estas cantidades son ahora independientes, se debe cumplir que sus
coeficientes se anulen. Igualando a cero los coeficientes de δa2 , δa3 , ...δa∞ y reempla-
zando el valor de λ que se obtiene de (3.42), llegamos a:
X∞  
m−1 m 1 m+2
µ t +k t am = 0 (3.43)
m=1
m+n−1 1 (m + 2)(m + n + 1) 1

De (3.43) se obtiene la siguiente relación de recurrencia para coeficientes, por igua-


lar a cero los coeficientes de las tm
1 :

k 1
am = − am−2 ; m = 2, 4, ... (3.44)
µ m(m − 1)
Como a0 = 0, se sigue que:

a0 = a2 = a4 = ... = 0 (3.45)

Los coeficientes impares se pueden expresar en términos de a1 , que se determina


de la condición ẋ(0) = v0 :

a1 = v0 (3.46)

Con lo cual se obtiene que:


 (m−1)/2
(m−1)/2 1 k
am = (−1) v0 ; m = 1, 3, ... (3.47)
m! µ
o también en la forma:
 n
k 1
a2n+1 = (−1)n v0 ; n = 0, 1, 2, ... (3.48)
µ (2n + 1)!
Con lo cual x(t) será:
r s !2n+1

µX 1 k
x(t) = v0 (−1)n (3.49)
k n=0 (2n + 1)! µ
p
Llamando ω = k/m llegamos a:
v0
x(t) = sen(ωt) (3.50)
ω
Claramente el método es engorroso en problemas más complicados.
64 / Mecánica clásica avanzada

Deducción de las ecuaciones de Lagrange a partir del principio de Ha-


milton generalizado. La ecuación (3.12) se denomina el principio de Hamilton genera-
lizado. Es aplicable a cualquier sistema holónomo independientemente de la naturaleza
de las fuerzas aplicadas. Como T es una función de (q), (q̇), t,
l 
X 
∂T ∂T
δT (q, q̇, t) = δqν + δ q̇ν (3.51)
ν=1
∂qν ∂ q̇

En tanto que δA puede escribirse en términos de las fuerzas generalizadas Qν :


N
X l
X
(a)
δA = F~i · δ~ri = Qν δqν (3.52)
i=1 ν=1

En δT podemos hacer la transformación siguiente:


   
∂T ∂T d d ∂T d ∂T
δ q̇ν = δqν = δqν − δqν (3.53)
∂ q̇ν ∂ q̇ dt dt ∂ q̇ν dt ∂ q̇ν
Reemplazando (3.51), (3.52) y (3.53) en la ecuación (3.12):
Z t2
(δA + δT )dt =
t1

Z l 
t1 X    
∂T d ∂T
Qν δqν + − δqν dt (3.54)
t1 ν=1 ∂qν dt ∂ q̇ν

t2
l
X ∂T

+ δqν = 0
∂ q̇ν
ν=1 t1

La parte integrada en (3.54) es nula debido a que las δqν se anulan en t = tl y


t = t2 , con lo cual se llega a:
Z t1 (X l    )
∂T d ∂T
Qν + − δqν dt = 0 (3.55)
t1 ν=1
∂qν dt ∂ q̇ν

Como las δqν son arbitrarias, el integrando es una función arbitraria del tiempo;
si la integral es cero, es necesario entonces que el integrando sea cero. Ahora queda una
combinación lineal de las cantidades independientes δqν igualada a cero,
l 
X  
∂T d ∂T
Qν + − δqν = 0 (3.56)
ν=1
∂qν dt ∂ q̇ν

Como las δqν son independientes, se debe cumplir también que:


 
∂T d ∂T
Qν + − = 0 ; ν = 1, 2, ...l (3.57)
∂qν dt ∂ q̇ν
El principio de Hamilton y las ecuaciones de Lagrange / 65

A estas ecuaciones no podrı́amos haber llegado cuando el sistema es no holónomo.


Estas ecuaciones son las correspondientes ecuaciones en cálculo funcional a las ecuaciones
(3.22) del cálculo de funciones, a las cuales se reducen en el caso estático cuando las
fuerzas son derivables de un potencial. Hemos llegado a las ecuaciones de Lagrange de
la segunda clase a partir del principio de Hamilton.
Supongamos que las fuerzas aplicadas se pueden descomponer en una parte deri-
vable de un potencial monogénico y otra no derivable de tal potencial. Se entiende por
potencial monogénico o potencial generalizado a una función de las coordenadas, las ve-
locidades y el tiempo, a partir de la cual se pueden derivar todas las fuerzas monogénicas
del sistema, mediante las fórmulas:
(a) ∂V d ∂V
F~i = − + + F~i′ ; i = 1, 2, ...N (3.58)
∂~ri dt ∂~r˙ i
Las fuerzas generalizadas correspondientes serán:
∂V d ∂V
Qν = − + + fν ; ν = 1, 2, ...l (3.59)
∂qν dt ∂ q̇ν

donde fν es la fuerza generalizada correspondiente a las fuerzas F~i′ . Es posible con este
tipo de fuerzas definir una función lagrangiana asociada a las fuerzas derivables del
potencial generalizado. fν contiene las fuerzas no incluidas en L.
Las ecuaciones de Lagrange toman la forma:
∂L d ∂L
− + fν = 0 ; ν = 1, 2, ...l (3.60)
∂qν dt ∂ q̇ν
donde L está definido como:

L(q, q̇, t) = T (q, q̇, t) − V (q, q̇, t) (3.61)

El lagrangiano para N partı́culas en un campo electromagnético. Sea un


sistema de partı́culas cargadas en presencia de un campo electromagnético descrito por
~ r , t) y B(~
los campos E(~ ~ r , t). La fuerza de interacción con la partı́cula i es:
 
~ ri , t) + qi ~ri × B(~
F~i ~ri , ~r˙ i , t = qi E(~ ~ ri , t) (3.62)
c
Los campos eléctrico y magnético se pueden derivar de los potenciales escalar y
~
vectorial φ, A:
~ r , t)
∂φ(~r, t) 1 ∂ A(~
~ r , t) =
E(~ − −
∂~r c ∂t
(3.63)
~ r , t) = ∂ ~ r , t)
B(~ × A(~
∂~r
Entonces F~i se puede escribir como:
 
∂φ(~ri , t) 1 ∂A(ri~, t) 1 ∂
F~i (~ri , ~r˙ i , t) = qi − − + r~i × ~ ri , t)
× A(~ (3.64)
∂~ri c ∂t c ∂~ri
66 / Mecánica clásica avanzada

Algunas manipulaciones con el rotacional nos llevan a:5


∂   ~ ~
~r˙ i × × A(~ ~ i − dAi + ∂ Ai
~ ri , t) = ∂ ~r˙ i · A (3.65)
∂~ri ∂~ri dt ∂t
Con lo cual (3.63) se puede escribir como:
 
F~i ~ri , ~r˙ i , t =
     (3.66)
∂ 1 ~ ri , t) − 1 d ∂ ˙ ~
qi − φ(~ri , t) − ~r˙ i · A(~ ~ri · A(~ri , t)
∂~ri c c dt ∂~r˙ i

Como φ no depende de ~r˙ i :


 
F~i ~ri , ~r˙ i , t =
     (3.67)
∂ 1˙ ~ 1 d ∂ 1˙
qi − φi − ~ri · Ai + φi − ~ri · Ai
∂~ri c c dt ∂~r˙ i c
Si se define la función V :
" #
  X N ˙i
~
r
V ~r1 , ~r2 , ...~rN , ~r˙ 1 , ~r˙ 2 , ...~r˙ N , t = ~ ri , t) ,
qi φ(~ri , t) − · A(~ (3.68)
i=1
c

las fuerzas de interacción con el campo electromagnético se pueden derivar del


potencial monogenico V :
∂V d ∂V
F~i = − + (3.69)
∂~ri dt ∂~r˙ i
Entonces el lagrangiano de un sistema de partı́culas en un campo electromagnético
puede escribirse como:
N
" !#
˙ ˙ ˙
X 1 ˙2 ~r˙ i ~
L(~r1 , ~r2 , ...~rN , ~r1 , ~r2 , ...~rN , t) = mi~ri − qi φi − · Ai (3.70)
i=1
2 c

En este lagrangiano no están incluidas las fuerzas de interacción de las partı́culas


entre sı́.

Fuerzas viscosas. Son un tipo de fuerzas que no se pueden derivar de un potencial.


Para muchos casos de interés se pueden escribir en la forma:
F~i′ = −~k.~r˙ i (3.71)
Se define la función de disipación de Rayleigh como:
N
1X 
F= kx ẋ2i + ky ẏi2 + kz żi2 (3.72)
2 i=1
5 Ver el texto Mecánica clásica de Goldstein, 1a ed, sección 1.5.
¯
El principio de Hamilton y las ecuaciones de Lagrange / 67

Las fuerzas viscosas (3.71) se pueden obtener como el gradiente de velocidades de


F:
∂F
F~i = − (3.73)
∂~r˙ i
La fuerza generalizada correspondiente será:
N N
X ∂~ri X ∂F ∂~r˙ i ∂F
Fν = Fi′ · =− · =− (3.74)
∂qν ∂ ˙ i ∂ q̇ν
~
r ∂ q̇ν
i=1 i=1

Para el caso en que las fuerzas no potenciales sean todas viscosas, las ecuaciones
de Lagrange toman la forma:
d ∂L ∂L ∂F
− + = 0; ν = 1, 2, ...l (3.75)
dt ∂ q̇ν ∂qν ∂ q̇ν
de modo que deben darse dos funciones escalares, L y F , para obtener las ecuaciones de
movimiento. Estas serán las ecuaciones a aplicarse en el caso de un sistema de osciladores
amortiguados por ejemplo; L contiene las fuerzas de “resorte” y F las fuerzas disipativas.

3.3. Algunas propiedades de la función lagrangiana


Aditividad de L. Si el sistema consta de dos partes, A y B, que no interactúan,
entonces el lagrangiano del sistema se descompone en dos partes: L = LA + LB . Donde
LA contiene sólo las coordenadas y velocidades de la parte A y similarmente LB . Es el
caso de dos partı́culas que se mueven en presencia de un campo externo sin interactuar
entre sı́. También en el caso de un sistema de partı́culas que interactúan entre sı́ pero
no con un campo externo, L se puede descomponer en una parte que contiene sólo las
coordenadas y velocidades del centro de masa y otra que sólo contiene las coordenadas
y velocidades de las partı́culas respecto al centro de masa: no hay interacción del movi-
miento del centro de masa con el movimiento respecto al centro de masa.

Adición a L de una derivada total respecto al tiempo de una función


arbitraria. Sean dos funciones lagrangianas, que dependen de las mismas coordenadas
y velocidades generalizadas, tales que difieren por una derivada total respecto al tiempo:
d
L′ (q, q̇, t) = L(q, q̇, t) + f (g, t) (3.76)
dt
Las integrales de acción de L y de L′ tienen valores extremales simultáneamente:
S ′ = S + f [q(t2 ), t2 ] − f [q(t1 ), t1 ] (3.77)
Como δq(t2 ) = δq(t1 ) = 0 se sigue que δS ′ = δS = 0. Esto implica que L y L′
dan lugar a las mismas ecuaciones de movimiento; a este resultado se puede llegar de
manera más convincente transformando las ecuaciones de Lagrange mismas.6
que eiS/h̄ es el lı́mite clásico de la función de onda Ψ. Entonces la arbitrariedad de f
6 Veremos

implica una arbitrariedad en la fase de Ψ.


68 / Mecánica clásica avanzada

Ejemplo 3.3.1 Sea una partı́cula libre, descrita en un sistema de referencia inercial O
mediante el lagrangiano.
1 ˙2
L= m~r (3.78)
2
Si se realiza una transformación de Galileo, a un nuevo sistema de referencia inercial
O′ que se mueve respecto a O con velocidad constante V~ :
~
~υ = ~υ ′ + V (3.79)
Entonces el lagrangiano en el nuevo sistema de referencia inercial será:
1 1 2 1  
L′ = m~r˙ ′2 = m~r˙ + m −2~r · V ~ +V ~2 (3.80)
2 2 2
Los dos lagrangianos están relacionados ası́:
d m 
L′ = L + −2~r · V~ + V~ 2t (3.81)
dt 2
A la función:
m ~ +V ~ 2t

f (r, t) = −2~r · V (3.82)
2
por razones que se verán más adelante, se le denomina “función generadora de la trans-
formación de Galileo”. Vemos que:
m ~ − 2~r2 · V~ +V ~ 2 t2 − ~υ 2 t1

S′ = S + 2~r1 · V (3.83)
2
y por tanto δS ′ = δS dado que δ~r = δ~r ′ = 0 en t = t1 y t = t2 .

3.4. Simetrı́as de la lagrangiana y teoremas de con-


servación
Simetrı́a. Se dice que L posee una simetrı́a cuando no cambia bajo una trans-
formación de las coordenadas y del tiempo. Por ejemplo, sea una partı́cula libre, cuyo
lagrangiano esté dado por (3.78). Se le realiza un desplazamiento de la partı́cula por una
cantidad arbitraria ~a,
~r → ~r + ~a (3.84)
como ~a˙ = 0, se sique que L no cambia. Se dice que este lagrangiano es simétrico bajo
translaciones. Veremos que esta simetrı́a está asociada a la conservación del momento
lineal. Si se realiza una rotación arbitraria de la partı́cula, digamos alrededor del eje z
por un ángulo α,
x → x cos α + y senα

y → −x senα + y cos α (3.85)

z → z
El principio de Hamilton y las ecuaciones de Lagrange / 69

y L no cambia, se dice que L es simétrico bajo rotaciones alrededor del eje z arbitrarias.
Veremos que esta simetrı́a está asociada con la conservación del momento angular. Si se
realiza una inversión de las coordenadas,

x, y, z → −x, −y, −z (3.86)

y L no cambia, esto implica la conservación de la paridad: L es siempre par o impar en


el transcurso del movimiento.
Al aplicar un campo externo las simetrı́as de L dependerán de las simetrı́as del
campo. Si el campo tiene menor simetrı́a que el lagrangiano libre, el nuevo lagrangiano
tendrá la simetrı́a del campo. Supongamos que se coloca una fuerza constante y uniforme
en la dirección z. L ahora será:
1 ˙2
L= m~r + Fz z (3.87)
2
Las simetrı́as de L son alteradas. Bajo la transformación de translación espacial,
(3.84):

L → L + Fz az (3.88)

L se altera a no ser que az sea cero. Ya no habrá simetrı́a de translación a lo largo del eje
z. Veremos que esto implica que sólo son constantes las componentes x y y del momento
lineal.
L no cambia bajo rotaciones alrededor del eje z (a lo largo del cual actúa la fuer-
za), pero obviamente no tendrá simetrı́a de rotación alrededor de ningún otro eje. Antes
de aplicar la fuerza, L tenı́a simetrı́a de rotación alrededor de cualquier eje (simetrı́a
esférica), ahora sólo tiene simetrı́a de rotación en el eje z (simetrı́a cilı́ndrica). Esta si-
metrı́a implica que sólo se conserva la componente z del momento angular, en tanto que
en ausencia del campo se conservan las tres componentes. En general, hay una relación
entre las simetrı́as de L y las variables dinámicas que se conservan.

Variables dinámicas. A cualquier función del estado del sistema y del tiempo
se le llama una variable dinámica. Para un sistema con l grados de libertad las va-
riables dinámicas son de la forma Dα (q1 , q2 , ...ql , q̇1 , q̇2 , ...q̇l , t). Ejemplos de variables
dinámicas son:

~ri ; mi~r˙ i ; ~li = mi~ri × ~r˙ i ; (3.89)

N
X N
X N
X 1 2
P~ = mi~r˙ i ; ~ =
L mi~ri × ~r˙ i ; T = mi~r˙ i (3.90)
i=1 i=1 i=1
2

Obviamente es posible definir un número infinito de variables dinámicas para un


sistema dado, pero sólo hay un número de variables dinámicas independientes igual al
doble del número de grados de libertad. En efecto, sólo es posible formar conjuntos de
2l funciones independientes de q1 , q2 , ... ql , q˙1 , q˙2 , ...q̇l , pero pueden definirse muchos
conjuntos diferentes. En general las 2l variables dinámicas independientes de un sistema
no son constantes de movimiento, aunque en principio siempre es posible encontrar un
70 / Mecánica clásica avanzada

conjunto de 2l constantes de movimiento, si el sistema es integrable.

Constantes de movimiento. Las ecuaciones de Lagrange dan lugar a un sistema


de l ecuaciones diferenciales acopladas de segundo orden con 2l incógnitas, q1 , q2 , ...ql ,
q̇1 , q̇2 , ...q̇l , independientes entre sı́. La solución a las ecuaciones de movimiento con-
tendrá 2l constantes de integración arbitrarias que determinan los valores iniciales de
(q) y (q̇). En el capı́tulo 1 se definió la especificación del estado del sistema mecánico en
un tiempo t por medio de los valores de las coordenadas y velocidades en ese instante.
Ahora vemos que las constantes de integración determinan no sólo el estado en el tiem-
po inicial, sino además todos los estados subsiguientes. Con sólo dar valores a t, para
unos valores dados de las constantes de integración, se obtienen los valores correspon-
dientes de las variables de estado. Las constantes de integración suministran una noción
global de estado: se dice que a cada conjunto de valores de las constantes de integra-
ción le corresponde un estado de movimiento del sistema. El tiempo inicial, o comienzo
del movimiento, siempre puede tomarse como una de las constantes de integración. La
integración de las ecuaciones de movimiento dará lugar a 2l funciones de la forma:
qν = qν (c1 , c2 , ...c2l−1 , t + t0 )
(3.91)
q̇ν = q̇ν (c1 , c2 , ...c2l−1 , t + t0 ) ; ν = 1, 2, ...l
Podemos en principio invertir estas ecuaciones para expresar las 2l constantes de
integración en función de (q), (q̇), t:

t0 = −t + θ(q, q̇) ; cα = cα (q, q̇) ; α = 1, 2, ..,2l − 1 (3.92)

Por otra parte, con las 2l constantes de integración se puede obtener cualquier otro
conjunto de 2l constantes independientes. En conclusión, a cualquier sistema dinámico
integrable se le pueden asociar 2l funciones de (q), (q̇) y t cuya derivada total respecto a t
sea cero. Estas cantidades son variables dinámicas, o sea que para cada sistema mecánico
integrable siempre es posible hallar 2l constantes de movimiento independientes, o en
otras palabras 2l variables dinámicas que se conservan, si es integrable.
En mecánica cuántica se pueden encontrar a lo sumo l variables dinámicas que
pueden tomar simultáneamente valores constantes. Se dice que para un sistema cuántico
de l grados de libertad hay sólo l operadores hermı́ticos independientes que conmutan
entre sı́ y que tienen estados propios con valores definidos de las correspondientes varia-
bles dinámicas.

Conservación de la energı́a. Se trata de mostrar que para aquellos sistemas


en que L sea simétrica bajo el cambio del origen del tiempo hay una constante de
movimiento que es la energı́a.7 Sea un sistema que cumple estas tres condiciones: (a)
puede ser descrito completamente a partir de L, es decir, se puede definir una función V
de la cual se obtienen todas las fuerzas; (b) el potencial no depende de las (q̇) ni de t; (c)
el sistema es tal que L no dependerá explı́citamente de t al introducir las coordenadas
generalizadas y además es esclerónomo. Mediante la condición (c) se garantiza que las
7 Veremos que si L no cambia al cambiar E, ∂L/∂E = 0, entonces t0 se conserva. Se dice que t0 y E
son dos cantidades canónicamente conjugadas.
El principio de Hamilton y las ecuaciones de Lagrange / 71

ligaduras no realizan trabajo sobre el sistema, entonces para tal sistema se cumple que
L es simétrica bajo el cambio de origen del tiempo:
∂L ∂L
=0 ⇒ =0 (3.93)
∂t0 ∂t
La derivada total de L respecto al tiempo es:
l  
dL X ∂L ∂L ∂L
= q̇ν + q̈ν + (3.94)
dt i=1
∂qν ∂ q̇ν ∂t

De las ecuaciones de Lagrange se tiene que:


∂L d ∂L
= − fν (3.95)
∂qν dt ∂ q̇ν
Con lo cual (3.94) toma la forma:
l    
dL X d ∂L ∂L
= q̇ν − fν q̇ν + (3.96)
dt ν=1
dt ∂ q̇ν ∂t

O sea que se cumple:


l
! l
dL X ∂L X ∂L
q̇ν − L = fν q̇ν − (3.97)
dt ν=1
∂ q̇ν ν=1
∂t

La cantidad entre paréntesis se llama la función energı́a, denotada h(q, q̇, t) con lo
cual:
l
X ∂L
ḣ(q, q̇, t) = fν q̇ν − (3.98)
ν=1
∂t

De las condiciones (a) y (c) y del hecho de que V no depende de t se sigue que
fν = 0 y ∂L/∂t = 0, con lo cual:
h(q, q̇, t) = constante (3.99)
Esta constante se llama “energı́a” o “constante de Jacobi”. La función h es igual
al hamiltoniano H. La diferencia es que éste se define como una función de (q), (p), t y
aquella es función de (q), (q̇) y t. Veremos que si además se cumple que V no depen-
de de las (q̇), h coincide con la energı́a total T +V . (a) implica que el sistema es holónomo.

Teorema de Euler acerca de las funciones homogéneas. Sea una función f


de n variables: f (x1 , x2 , ...xn ) tal que:
F (λx1 , λx2 , ...λxn ) = λr F (x1 , x2 , ...xn ) (3.100)
Se dice que F es una función homógenea de grado r. El teorema dice que:
N
X ∂F
xi = rF (3.101)
i=1
∂xi
72 / Mecánica clásica avanzada

La prueba es la siguiente: derivando ambos lados en (3.101) respecto a λ,


d
F (λx1 , λx2 , ...λxN ) = rλn−1 F (x1 , x2 , ...xn ) (3.102)

la derivada del lado izquierdo es:
n
X ∂F (λx1 , λx2 , ...λxN ) ∂(λxi )
d
F (λx1 , λx2 , ...λxN ) = (3.103)
dλ i=1
∂(λxi ) ∂λ

Se sigue entonces que:


n
X ∂F (λx1 , λx2 , ...λxN )
xi = λn−1 rF (x1 , x2 , ...xn ) (3.104)
i=1
∂(λxi )

Haciendo ahora λ = 1 se obtiene la igualdad (3.101).

Teorema acerca de la energı́a cinética de un sistema esclerónomo. Si el


sistema es descrito mediante coordenadas generalizadas, en virtud de la ecuación (2.176)
la energı́a cinética puede escribirse como:
N
1 X ˙2
T = mi~ri =
2 i=1
" l l (3.105)
N l  2 #
1X X X ∂~ri ∂~ri X ∂~ri ∂~ri ∂~ri
mi · q˙ν q˙µ + 2 · q̇ν +
2 i=1 ν=1 µ=1
∂qν ∂qµ ν=1
∂qν ∂t ∂t

Como ~ri es función (q) y t, se sigue que T en coordenadas generalizadas toma la


forma:
l X
X l l
X
T (q, q̇, t) = Aνµ (q, t)q̇ν q̇µ + Aν (q, t)q̇ν + A(q, t) (3.106)
ν=1 µ=1 ν=1

O sea que T se puede escribir como la suma de tres funciones homogéneas de las
velocidades generalizadas de grados 2, 1 y 0:

T = T2 + T1 + T0 (3.107)

Se sigue que para un sistema esclerónomo (∂~ri /∂t = 0)


l X
X l
T (q, q̇, t) = T2 (q, q̇, t) = Aνµ (q, t)q̇ν q̇µ (3.108)
ν=1 µ=1

Es decir, que la energı́a cinética es una función homogénea cuadrática en las velo-
cidades. La función Aνµ (q, t) es simétrica:

Aνµ (q, t) = Aµν (q, t) (3.109)


El principio de Hamilton y las ecuaciones de Lagrange / 73

En virtud del teorema de Euler acerca de las funciones homogéneas se sigue que
para un sistema esclerónomo:

Xl
∂T
q̇ν = 2T (3.110)
ν=1
∂ q̇ν

Conservación de la energı́a total T + V. Si se cumple (b), como L = T − V


se sigue que:

∂L ∂T
= (3.111)
∂ q̇ν ∂ q̇ν

Entonces h tomará la forma, en virtud de (3.110) y (3.111):

Xl
∂T
h(q, q̇, t) = q̇ν − T + V = T + V (3.112)
ν=1
∂ q̇ν

En este caso h coincide con la energı́a total.


Las fuerzas que son derivables de un potencial que no depende de las velocidades
ni del tiempo se llaman fuerzas conservativas. Si V depende de las (q̇) cumpliéndose las
otras condiciones, h es una constante de movimiento pero no es la energı́a total. Si se
cumple (c) y que V no dependa de las (q̇), será cierto que h = T + V , pero h no será una
constante de movimiento. En este caso:

X l
dh dE ∂L
= = fν q̇ν − (3.113)
dt dt ν=1
∂t

donde la dependencia que tiene L de t puede provenir sólo de que V dependa del tiempo.
Si las fuerzas fν son viscosas y se pueden obtener de la función de disipación de Rayleigh,
que es una función homogénea cuadrática de las velocidades, en virtud de las ecuaciones
(3.72), (3.74) y (3.101), se sigue que:

l
X Xl
∂F
fν q̇ν = − q̇ν = −2F (3.114)
ν=1 ν=1
∂ q̇ν

En este caso (3.113) será:

dh ∂L ∂E ∂V
= −2F − o = −2F + (3.115)
dt ∂t ∂t ∂t
En (3.115) resulta claro que la rata de cambio de la energı́a total consta de la rata
de disipación de energı́a 2F y de la rata de suministro de energı́a debida a la variación
temporal de V .

Ejemplo 3.4.1 Hallar la constante de Jacobi y la rata de cambio de la energı́a total para
una partı́cula cargada en presencia de un campo electromagnético.
74 / Mecánica clásica avanzada

De acuerdo con la ecuación (3.70):


1 ˙2 q
L= m~r − qφ + ~r˙ · A
~ (3.116)
2 c
La función energı́a será:
∂L ˙ 1 2
h= · ~r − L = m~r˙ + qφ (3.117)
∂~r˙ 2
Se ve que h no es la energı́a total E = T + V , lo cual es consecuencia de que V
dependa de la velocidad, h incluye sólo la energı́a potencial eléctrica. En virtud de (3.98)
h será:
∂L ∂V ∂φ q ˙ ∂ A ~
ḣ = − = =q − ~r · (3.118)
∂t ∂t ∂t c ∂t
O sea que en general h será constante de movimiento sólo si los campos no dependen
del tiempo, además del caso particular en que φ y A ~ tengan una forma tal que h sea
cero, como:
q
E = h − ~r˙ · A
~ (3.119)
c
Se sigue que para un campo electromagnético estático:
d  q ˙ ~
Ė = − ~r · A (3.120)
dt c
Es decir, E no se conserva porque el potencial magnético no es constante. Si se
aplica el campo electromagnético constante de modo que B~ sea uniforme, A ~ se puede
escribir en la forma:
~ = 1B
A ~ × ~r (3.121)
2
~ es uniforme. En este caso el potencial magnético será:
que satisface a (3.63) si B
q ~ = − q ~r˙ · (B ~ · (~r × ~r˙ ) = − q B
~ × ~r) = − q B
− ~r˙ · A ~ · ~l (3.122)
c 2c 2c 2mc
donde ~l es el momento angular de la partı́cula. Entonces (3.120) y (3.122) nos dan:
q ~ ~˙ qB ˙
Ė = − B·l = − lB (3.123)
2mc 2mc
lB se conserva si L es simétrico bajo rotaciones alrededor del eje determinado por B, ~ lo
cual en general no se cumplirá; para ello basta que φ tenga simetrı́a cilı́ndrica alrededor
~
de B.

Ejemplo 3.4.2 Una partı́cula está sometida al efecto de la gravedad y a la condición


de ligadura de moverse siempre sobre un alambre circular de radio a. El alambre rota
uniformemente con velocidad angular ω alrededor de un eje vertical en el plano del
alambre que pasa por el centro. Calcular h y Ė y analizar su significado.
El principio de Hamilton y las ecuaciones de Lagrange / 75

El problema tiene un grado de libertad. Tomemos el eje z en la dirección de la


fuerza de gravedad, coincidiendo con el eje de rotación. Definamos un sistema de ejes
que rotan solidariamente con el alambre ası́: el eje z ′ en la dirección de la fuerza de
gravedad, coincidiendo con el eje de rotación; el eje y ′ en el plano del alambre; y el eje x′
perpendicular al alambre en el centro. Las fórmulas que expresan a x, y y z en términos
de x′ , y ′ y z ′ son:
x = x′ cos ωt − y ′ senωt ; y = x′ senωt + y ′ cos ωt ; z = z′ (3.124)
Tomemos como coordenada generalizada el ángulo que hace el vector de posición
de la partı́cula con el eje z ′ y en términos del cual podemos expresar a x′ , y ′ y z ′ , puesto
que x′ = 0. Entonces, mediante (3.124) obtenemos:
x = −a senq senωt ; y = a senq cos ωt ; z = a cos q (3.125)
El lagrangiano del problema es en consecuencia:
1
L(q, q̇, t) = ma2 (q̇ 2 + ω 2 senq) + mga cos q (3.126)
2
El lector puede verificar fácilmente que si ω 2 < g/a, la posición q = 0 es de
equilibrio estable con frecuencia de pequeñas oscilaciones dada por Ω = ω 2 − g/a. Si
ω 2 > g/a, la posición de equilibrio estable no es q = 0 sino algún valor de q entre 0
y π/2 con frecuencia de pequeñas oscilaciones dada por Ω2 = g/a − ω 2 . Finalmente,
si ω 2 ≫ g/a, la posición de equilibrio estable será q = π/2, siendo ω la frecuencia de
pequeñas oscilaciones.
Sabemos que si se cumplen las condiciones (a) y (b), pero no se cumple (c), es
decir, si las ligaduras son reónomas, lo cual es el caso para este problema, entonces h no
será la energı́a total.
De (3.107) y (3.112) se sigue, usando el teorema de Euler acerca de las funciones
homogéneas, que:
h = 2T2 + T1 − L = T + V − T1 − 2T0 (3.127)
De (3.98) se sigue que cuando fν = 0,
∂L
ḣ = − = Ė − Ṫ1 − 2Ṫ0 (3.128)
∂t
Por tanto, si como en este ejemplo las ligaduras reónomas no dan lugar a que
t aparezca en L, h será constante de movimiento pero E no lo será. En efecto, en
este caso las ligaduras realizan trabajo sobre el sistema ya que los desplazamientos
virtuales son tangentes al alambre (o sea que éste no realiza trabajo virtual), pero como
un desplazamiento real de la partı́cula no coincide con una virtual, la ligadura realiza
trabajo bajo desplazamientos reales. Para este problema, T2 = 12 ma2 q̇ 2 ; T1 = 0 ; T0 =
1 2 2
2 ma ω sen q y V = −mga cos q. De (3.127) se sigue entonces que:

1
h = T2 − T0 + V = ma2 (q̇ 2 − ω 2 senq) − mga cos q (3.129)
2
la cual es una constante de movimiento. Podemos reinterpretar a h diciendo que es
la energı́a total respecto al sistema de ejes rotantes x′ , y ′ y z ′ . La energı́a cinética
76 / Mecánica clásica avanzada

es T ′ = (1/2)ma2 q̇ 2 y la energı́a potencial consta de dos partes, la energı́a potencial


gravitacional y la energı́a potencial centrı́fuga que resulta debido a que el sistema de
referencia x′ , y ′ y z ′ es no inercial, es decir:
1 1
T′ = ma2 q̇ 2 ; V ′ = − ma2 ω 2 senq − mga cos q (3.130)
2 2
En efecto, V ′ puede escribirse como V ′ = −(1/2)maω 2y ′ − mgz ′ y de él se deriva
la fuerza siguiente:
∂V ′ 1
F~ ′ = − ′ = maω 2 î′ + mg k̂ ′ (3.131)
∂~r 2
O sea que (1/2)maω 2 es la fuerza centrı́fuga; es como si existiera un campo gravi-
tacional homogéneo en la dirección x′ .
La energı́a total respecto a los ejes x, y y z será E y constará de dos términos: h
y el trabajo realizado por el alambre. Como ḣ = 0, de (3.128) se sigue que:
Ė = Ṫ1 + 2Ṫ0 = ma2 ω 2 cos q q̇ (3.132)
Para pequeñas oscilaciones alrededor de q = 0, Ė es de la forma Ė= ma2 ω 3 q0 senΩt,
o sea que E = h − (ma2 ω 3 /Ω)q0 cos Ωt, lo cual nos muestra que la energı́a total
tendrá fluctuaciones periódicas.

Conservación del momento lineal. Sea un sistema que cumple las siguientes
condiciones: (a) se describe completamente a partir de un lagrangiano; (b) L no depende
de alguna de las coordenadas generalizadas. Entonces se cumple:
∂L
=0 (3.133)
∂qν0
donde la coordenada qν0 que no aparece en L se llama cı́clica o ignorable. La ecuación
de Lagrange para la coordenada qν0 implica que:
 
d ∂L
= f0 (3.134)
dt ∂ q̇ν0
O sea que si fν0 = 0 la siguiente cantidad se conserva:
∂L
Pν0 ≡ = constante (3.135)
∂ q̇ν0
Se define el momento canónico conjugado a la coordenada qν ası́:8
∂L
Pν = ; ν = 1, 2, ...l (3.136)
∂ q̇ν
luego, el momento canónico conjugado a una coordenada cı́clica es una constante de
movimiento. Si L no depende de qν0 y fν0 = 0 se dice que el sistema es simétrico bajo
cualquier cambio en la coordenada qν0 .
8 La palabra “canónico” viene desde de época de Hamilton; significa “de acuerdo con el canon”. Se

usa ampliamente en fı́sica para designar diversos aspectos del formulismo hamiltoniano, que describe
los sistemas mecánicos mediante las variables (q, p).
El principio de Hamilton y las ecuaciones de Lagrange / 77

Sea un lagrangiano dado por (3.87). Como L no depende de x ni de y, se sigue que


px = mẋ y py = mẏ son constantes de movimiento. Como L depende de z, pz = mż no
se conserva. Si qν0 es una coordenada lineal, pν0 será un momento lineal.

Homogeneidad espacial. Sea un sistema aislado. Es de esperarse que L no cam-


bie cuando se traslada el sistema como un todo. Esto equivale a desplazar todas las
partı́culas por la misma cantidad sin cambiarles su movimiento:
~ri → ~ri + ~ǫ ; ~r˙ i → ~r˙ i (3.137)
Entonces el cambio experimentado por L será:
XN XN
∂L ∂L
δL = · δ~ri = ~ǫ · (3.138)
i=1
∂~
ri i=1
∂~
qi
Por hipótesis no hay ligaduras, con lo cual las ecuaciones de Lagrange nos dan:
XN N
d ∂L d X dP~
δL = ~ǫ · = ~ǫ · p~i = ~ǫ · , (3.139)
i=1
dt ∂~r˙ i dt i=1 dt

donde P~ es el momento total del sistema. Se sigue que si hay homogeneidad espacial,
δL = 0, entonces se sigue que la variable dinámica ~ǫ· P~ se conserva. Como E es arbitrario,
se sigue que P~ es una constante. Si sólo hay simetrı́a de translación en determinada
dirección ~ǫ se sigue que sólo se conserva la componente de P~ en la dirección de ~ǫ. Como
L = T − V y T sólo depende de las velocidades de las partı́culas,
∂L ∂V
=− = F~i (3.140)
∂~ri ∂~ri
Entonces en (3.138) se tiene:
N
X
δL = ~ǫ · F~i (3.141)
i=1

δL será cero si el sistema no está sometido a una fuerza neta externa, es decir si el
sistema está aislado. O también: si el sistema es aislado, no debe haber fuerzas sobre el
centro de masa:
∂V
F~CM = − =0 (3.142)
∂R~ CM
luego V no depende de RCM y ésta será cı́clica. El momento canónico conjugado de
~ CM será el momento lineal total y será una constante de movimiento:
R
XN
∂L ∂L ∂~r˙ i
P~CM = = · (3.143)
~˙ CM
∂R r˙ i ∂ R
i=1 ∂ ~
~ CM

~ CM está dado por


Como R
N
˙
~ CM 1X ˙
R = mi~ri (3.144)
2 i=1
78 / Mecánica clásica avanzada

Se sigue que:
∂~r˙ i ~
= ~1 (3.145)
˙
~
∂ RCM

donde ~~1 es el diádico unidad, que se representa por una matriz unidad de dimensión
3 × 3 (véase sección 7.4). Por tanto:
X ∂LN X N
∂L
= = mi~r˙ i = P~CM (3.146)
˙~ ∂ ˙
~
r
∂ RCM i=1 i i=1

Conservación del momento angular. Sea un sistema que se describe comple-


tamente a partir de un lagrangiano y además tal que no depende de alguna coordenada
angular qν0 , entonces su momento canónico conjugado será un momento angular que se
conserva. Por ejemplo, sea una partı́cula cuyo lagrangiano es:
1 ˙2
L= m~r − V (~r) (3.147)
2
Sea n̂ un eje arbitrario y δφ una rotación alrededor de ese eje (véase figura 3.3).

n
δϕ

δr

r + δr
θ

Figura 3.3 Rotación por ángulo δφ alrededor de n̂

Supongamos que φ es una de las coordenadas generalizadas del sistema. En una


rotación alrededor de n̂ bajo un ángulo δφ, ~r se cambia en ~r + δ~r donde δ~r es un vector
perpendicular a ~r y a n̂ y cuya magnitud es r senθ δφ. Por tanto se cumple que:
δ~r = n̂ × ~rδφ (3.148)
El principio de Hamilton y las ecuaciones de Lagrange / 79

y que:
∂~r
= n̂ × ~r (3.149)
∂φ
El momento canónico conjugado de φ será:
∂L ∂~r˙ ∂~r  
pφ = = m~r˙ · = m~r˙ · = m~r˙ · (n̂ × ~r) = n̂ · m~r × ~r˙ (3.150)
∂ φ̇ ∂ φ̇ ∂φ
Se sigue que pφ es la componente del momento angular a lo largo de n̂. Si L no
depende de φ, pφ es una constante de movimiento.

Isotropı́a espacial. Sea un sistema tal que no cambia L cuando se rota como un
todo alrededor de un eje n̂. Esto es, si para cada partı́cula:
~ri → ~ri + n̂ × ~ri δφ ; ~r˙ i → ~r˙ i + n̂ × ~r˙ i δφ (3.151)
el cambio en L será:
X N   X N  
∂L ∂L ˙
δL = · δ~ri + · δ~ri = p~˙ i · δ~ri + p~i · δ~r˙ i (3.152)
i=1
∂~ri ∂~r˙ i i=1

Usando (3.151) y usando la invariancia del triple producto escalar bajo permutación
cı́clica de los factores:
N
X   XN
d
δL = n̂ · ~ri × p~˙ i + p~i × ~r˙ i δφ = n̂δφ · ~ri × p~i (3.153)
i=1 i=1
dt

Con lo cual

δL = δφn̂ · L (3.154)
~ es el momento angular total. Por otra parte, en virtud de las ecuaciones de
donde L
Lagrange:
N 
X 
δL = F~i · δ~ri + p~i · δ~ri =
i=1
(3.155)
N 
X  N
X
δφn̂ · ~ri × F~i + ~r˙ i × p
~i = δφn̂ · ~ki = δφn̂ · K
~
i=1 i=1

~ es el torque total, por tanto:


donde K
∂L ~˙ = n̂ · K
~
= n̂ · L (3.156)
∂φ
Si no hay torque neto sobre el sistema entonces éste será isótropo y en consecuen-
cia se conserva el momento angular total. Si simplemente se anula el torque en cierta
dirección, L será simétrico bajo rotaciones alrededor de esa dirección y se conservará la
80 / Mecánica clásica avanzada

~ en esa dirección.
componente de L

Integrales de movimiento aditivas. Para un sistema aislado la energı́a total


E, el momento angular L ~ y el momento lineal P~ se conservan: hay siete constantes de
movimiento. Quedan aún otras 6N − 7 constantes de movimiento. Estas siete constantes
de movimiento tienen la caracterı́stica de ser aditivas. Es decir, si el sistema consta de
varias partes que no interactúan, cada parte tendrá valores determinados de la energı́a,
el momento angular y el momento lineal totales. Las correspondientes cantidades del
sistema total se pueden obtener adicionando las respectivas constantes de movimiento
de las partes.

3.5. El teorema del virial


Es un teorema de naturaleza estadı́stica porque se refiere a promedios temporales.
Sea un sistema que: (a) la energı́a potencial es función homogénea de las coordenadas;
(b) el movimiento es tal que en todo momento las coordenadas y las velocidades toman
valores finitos (el sistema es ligado). Se trata de calcular los valores medios de T y
V cuando el tiempo tiende a infinito. Del teorema de Euler acerca de las funciones
homogéneas se sigue:
N
X ∂T ˙
· ~ri = 2T (3.157)
∂~r˙ i
i=1

Entonces se cumple, dado que V no depende de las velocidades:


N
X N N
˙ d X X
2T = pi · ~ri =
~ p~i · ~ri − ~p˙ i · ~ri (3.158)
i=1
dt i=1 i=1

N N
d X X
2T = pi · ~ri −
~ F~i · ~ri (3.159)
dt i=1 i=1

si tomamos en (3.159) la media temporal a ambos lados, ası́:


Z
1 τ
lı́m 2T dt =
τ →∞ τ 0

! τ Z N (3.160)
1
N
X 1 τ X~

lı́m p~i · ~ri − lı́m Fi · ~ri dt
τ →∞ τ τ →∞ τ 0
i=1 0 i=1

La condición (b) conduce a la anulación del primer miembro del lado derecho, con
lo cual llegamos a:
N
X
2T = − F~i · ~ri , (3.161)
i=1
El principio de Hamilton y las ecuaciones de Lagrange / 81

donde la barra indica promedio temporal. La ecuación (3.161) se denomina el teorema


del virial. El lado derecho de (3.161) es el doble del llamado virial de Clausius.
Si V es función homogénea de las coordenadas, se cumple:
N
X N
X ∂V
− F~i · ~ri = · ~ri = kV = 2T (3.162)
i=1 i=1
∂~ri
donde k es el grado de homogeneidad de V . Como T + V = E es una constante, se sigue
que T + V = E. Por lo tanto se cumple que:
2T + 2V = 2E ; kT + kV = kE (3.163)
De (3.162) y (3.163) se sigue que:
2 k k
V = E; T = E; T = V (3.164)
2+k 2+k 2
Para un potencial del tipo r−1 se cumple que 2T = −V = −2E. Para un potencial
del tipo r2 se cumple: T = V = (1/2)E. Se deduce que para un potencial del tipo r−1
hay movimientos acotados solamente si E < 0, dado que T es positiva, y que para un
potencial del tipo r2 sólo hay movimientos acotados para E > 0.

Ley de Boyle. Sea un sistema constituido por un gas de moléculas en un reci-


piente. En este caso N es muy grande. Si la energı́a cinética media por partı́cula es t,
entonces:
T = Nt (3.165)
La energı́a por partı́cula está relacionada con la temperatura θ a través de la
relación:
3
t = kB θ (3.166)
2
donde kB es la constante de Boltzmann. La ecuación (3.166) se obtiene del teorema de
la equipartición de la energı́a, según el cual por cada grado de libertad hay una energı́a
de (1/2)kθ.
La fuerza sobre la partı́cula i depende de la ligadura impuesta por el recipiente:
F~i = F~ig + R
~i (3.167)
donde F~iges la fuerza ejercida por todas las otras partı́culas del gas sobre la partı́cula i
~
y Ri es la fuerza ejercida por las paredes del recipiente sobre la partı́cula i. Si llamamos
I a:
N
X
I= F~ig .~ri (3.168)
i=1

El virial de Clausius se descompone en dos partes:


N
X N
X
F~i .~ri = I + ~ i .~ri
R (3.169)
i=1 i=1
82 / Mecánica clásica avanzada

Las fuerzas R~ i actúan sólo cuando la partı́cula i choca con las paredes del recipiente.
Estas fuerzas representan la reacción del muro a la colisión ejercida por los átomos sobre
la pared. Esto es lo que se denomina la reacción a la presión P que ejerce el gas sobre el
recipiente. PN ~
En un tiempo t dado, en i=1 R i ·~
ri sólo contribuyen los términos correspondientes
a las partı́ulas que en ese instante chocan con las paredes del recipiente. Podemos dividir
el área de las paredes en elementos infinitesimales de área dA. Todas las dN partı́culas
que choquen sobre un dA dado tendrán aproximadamente el mismo radio vector ~ri que
llamaremos ~r. La contribución de las dN partı́culas a la sumatoria será aproximadamente
R~ dN · ~r, donde R~ es la fuerza que ejerce el elemento de área sobre cada una de las dN
partı́culas que inciden sobre ella. Si llamamos R ~ dN = dR,
~ entonces tenemos que:
N
X Z
~ i · ~ri =
R ~
~r · dR (3.170)
i=1

~ en términos de la
Si n̂ es un vector normal a la superficie, podemos escribir a dR
presión de la siguiente manera:
~ = −n̂P dA
dR (3.171)
Como la presión es constante escribimos:
N
X Z
~ i · ~ri = −P
R n̂ · ~r dA (3.172)
i=1

Ahora, en virtud del teorema de la divergencia, podemos pasar de la integral de


superficie a una integral de volumen:
Z Z
~
~r · dS = ∇ · ~rdV = 3V (3.173)
S V

Entonces:
N
X
~ i · ~ri = −3P V
R (3.174)
i=1

Como esta cantidad no depende del tiempo se sigue que:


N
X
F~i · ~ri = I − 3P V (3.175)
i=1

En virtud del teorema del virial, que es válido en este caso porque el movimiento
es acotado, y usando (3.162) y (3.166) se sigue que:
3N KB θ = −I + 3P V (3.176)
Llegándose a la ecuación de estado para un gas real:
1
P V = N KB θ + I (3.177)
3
El principio de Hamilton y las ecuaciones de Lagrange / 83

El término (1/3)I es una medida de la separación de la ecuación de estado del


gas real respecto al ideal en el cual no se consideran los efectos de interacción entre las
moléculas dada por 3.168, en tanto que P V proviene de la ligadura impuesta por el
recipiente.
84 / Mecánica clásica avanzada
4
La formulación hamiltoniana

4.1. Las variables hamiltonianas de estado


En el formalismo lagrangiano el estado de un sistema mecánico holónomo con l
grados de libertad se describe por medio de las qν y q̇ν . Por medio de la función L(q, q̇, t)
se hallan las ecuaciones de movimiento a partir de las ecuaciones de Lagrange. Las va-
riables (q, q̇, t) se llaman variables lagrangianas. Hamilton (1805-1865) propuso describir
el sistema mediante las variables (q, p, t), donde los pν son los momentos generalizados
canónicamente conjugados a las coordenadas generalizadas qν definidos por:
∂L(q, q̇, t)
pν = ; ν = 1, 2, ...l (4.1)
∂ q̇ν
Las variables (q, p, t) se llaman variables hamiltonianas. Las ecuaciones (4.1) cons-
tituyen las fórmulas de transformación de las variables (q, q̇, t) a las variables (q, p, t).
En (4.1) hay l ecuaciones que relacionan las l cantidades pν con las l cantidades q̇ν . En
principio se pueden expresar las (q̇) en términos de las (p) por la transformación inversa:
q̇ν = Φν (q, p, t) ; ν = 1, 2, ...l (4.2)
Es claro que el estado del sistema puede ser descrito indistintamente por las va-
riables lagrangianas o por las hamiltonianas. Decimos que L “genera” la transformación
(q, q̇, t) → (q, p, t). Según (3.106) y (3.107) T se puede escribir como:
T = T2 + T1 + T0 (4.3)
Si V no depende de las (q̇),
Xl
∂L ∂T
pν = = = Aνµ q̇µ + Aν ; ν = 1, 2, ...l (4.4)
∂ q̇ν ∂ q̇ν µ=1

Mediante este sistema de ecuaciones lineales podemos expresar a (q̇) en términos


de (p):
l
X
q̇ν = bνµ pµ + bν ; ν = 1, 2, ...l (4.5)
µ=1

85
86 / Mecánica clásica avanzada

Si V depende de las (q), (q̇) en la forma:


l
X
V (q, q̇, t) = Πν (q, t)q̇ν + Π(q, t) (4.6)
ν=1

que serı́a por ejemplo la forma que tomarı́a el potencial electromagnético (3.68) al ser
expresado en coordenadas generalizadas, entonces pν será:
l
X
pν = Aνµ q̇µ + Aν − Πν ; ν = 1, 2, ...l (4.7)
µ=1

Notación. Usaremos L para denotar a T −V , expresada en función de las variables


lagrangianas. Es claro que al expresarla en términos de las variables hamiltonianas la
función es diferente, aunque a veces, sin mucho rigor, se le escribe también como L. Lo
correcto es:

L(q, q̇, t) = L [q, q̇(q, p, t), t] = L(q, p, t) (4.8)

Ejemplo 4.1.1 Sea el lagrangiano:


1 2
L(~r, ~r˙ , t) = m~r˙ − ~r˙ · Π(~
~ r , t) − Π(~r, t) (4.9)
2
El momento canónico será:
∂L ~
p=
~ ~ ⇒ ~r˙ = p~ + Π
= m~r˙ − Π (4.10)
˙
∂~r m
Con lo cual:
~2
~2 − Π
p
L(~r, p~, t) = −Π (4.11)
2m
La función hamiltoniana. Se definió en (3.97) la función energı́a como:

Xl
∂L(q, q̇, t)
h(q, q̇, t) = q̇ν − L(q, q̇, t) (4.12)
ν=1
∂ q̇ν

A la función energı́a expresada en términos de las variables hamiltonianas se le


llama la función hamiltoniana:
l
X
H(q, p, t) ≡ h(q, p, t) = h[q, q ′ (q, p, t), t] = pν q̇ ν − L(q, p, t) (4.13)
ν=1

Los generadores de la transformación de Legendre. Sea X(x1 , x2 , ...xn ; α1 ,


α2 , ... αm ) una función que “genera” la siguiente transformación de variables (x1 , x2 , ...xn )
→ (y1 , y2 , ...yn ):
∂X
yi = ; i = 1, 2, ...n (4.14)
∂xi
La formulación hamiltoniana / 87

entonces existe una transformación de las variables y1 , y2 , ...yn a las variables x1 , x2 ,


...xn , la transformación inversa, “generada” por cierta función Y (y1 , y2 , ...yn ; α1 , α2 ,
...αm ):
∂Y
xi = ; i = 1, 2, ...n (4.15)
∂yi
Demostremos que las funciones X y Y están relacionadas por la fórmula:
Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) =
n
X (4.16)
xi yi − X(x1 , x2 , ...xn ; α1 , α2 , ...αm )
i=1

En efecto, es posible expresar las variables xi en términos de las yi :

xi = fi (x1 , x2 , ...xn ; α1 , α2 , ...αm ) ; i = 1, 2, ...n (4.17)

Con lo cual escribimos (4.16) como:

Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) =


n
X (4.18)
yk fk − X(f1 , f2 , ...fn , α1 , α2 , ...αm )
k=1

Entonces:
X n   n
X
∂Y ∂fk ∂X ∂fk
= yk + fk δik − =
∂yi ∂yi ∂fk ∂yi
k=1 k=1
(4.19)
n 
X 
∂fk ∂fk
yk − yk + fi = xi
∂yi ∂yi
k=1

Demostremos el siguiente teorema:


∂Y ∂X
=− ; i = 1, 2, ...m (4.20)
∂αi ∂αi
Para evaluar ∂y/∂αi usemos la ecuación (4.18):
n
X ∂fk X ∂X ∂fk n
∂Y ∂X
= yk − − (4.21)
∂αi ∂αi ∂fk ∂αi ∂αi
k=1 k=1

En virtud de (4.14), los términos de la sumatoria se cancelan, con lo cual queda


demostrado el teorema. Una transformación de este tipo es llamada transfomación de
Legendre (1752-1833).
En sı́ntesis, las fórmulas caracterı́sticas de una transformación de Legendre son:

X = X(x1 , x2 , ...xn ; α1 , α2 , ...αm ) (4.22)


88 / Mecánica clásica avanzada

Y = Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) (4.23)

∂X ∂Y
yi = ; xi = ; i = 1, 2, ...n (4.24)
∂xi ∂yi
X ∂Y ∂X
Y = xk yk − X ; =− ; i = 1, 2, ...m (4.25)
∂αi ∂αi
k

Las ecuaciones de movimiento hamiltonianas. La transformación de las


variables lagrangianas a las hamiltonianas es una transformación de Legendre generada
por la función L. Aquı́ las q̇ν hacen el papel de las xi , el conjunto (q), t, hace el papel
de las (α), y las pν hacen el papel de las yi ; L es X. Comparando (4.13) y (4.16) vemos
que H es Y :
l
X
H(q, p, t) = pν q̇ν − L(q, q̇, t) (4.26)
ν=1

Es decir, L genera la transformación (q̇) → (p) y H genera la transformación


inversa (p) → (q̇):
∂H(q, p, t)
q̇ν = (4.27)
∂pν
De las ecuaciones (4.20) se sigue inmediatamente que:
∂H ∂L
=− ; ν = 1, 2, ...l (4.28)
∂qν ∂qν

∂H ∂L
=− (4.29)
∂t ∂t
teniendo en cuenta que el conjunto (q), t, hace el papel de las (α). De las ecuaciones de
Lagrange se sigue que:
∂L d ∂L
= − fν = ṗ − fν ; ν = 1, 2, ...l (4.30)
∂qν dt ∂ q̇ν
Las ecuaciones (4.27) a (4.30) nos dan:
∂H ∂H
q̇ν = ; p˙ν = − + fν ; ν = 1, 2, ...l (4.31)
∂pν ∂qν
Las ecuaciones (4.31) se denominan las ecuaciones canónicas de Hamilton y cons-
tituyen las ecuaciones de movimiento en las variables hamiltonianas. Son 2l ecuaciones
diferenciales que involucran sólo primeras derivadas de (q) y (p), en tanto que las de
Lagrange son l ecuaciones deferenciales de segundo orden en las (q). En esencia sólo el
segundo conjunto de ecuaciones (4.31) constituye las ecuacionnes de movimiento, pues
el primer conjunto sólo proporciona la transformación inversa a pν = ∂L/∂ q̇ν .
La formulación hamiltoniana / 89

La función hamiltoniana. H no sólo permite escribir las ecuaciones de movi-


miento sino que tiene significado fı́sico directo. Veamos qué es Ḣ:
Xl  
∂H ∂H ∂H
Ḣ = q̇ν + ṗν +
ν=1
∂qν ∂p ν ∂t

l
X ∂H
= [(fν − ṗν ) q̇ν + q̇ν ṗν ] + (4.32)
ν=1
∂t

l
X ∂H
= fν q̇ν +
ν=1
∂t
Si las ligaduras reónomas no dan lugar a que t aparezca en H y el potencial no
depende del tiempo, ∂H/∂t = 0, y si además no hay fuerzas no derivables del potencial,
se sigue que Ḣ = 0, o sea que H es una constante de movimiento. Si además las fuerzas
son derivables de un potencial que no depende de las velocidades, sabemos de (3.112)
que H = T + V . O sea que bajo estas condiciones la energı́a total E = T + V se conserva,
de lo contrario se cumple que H es constante pero no es cierto que H = E. Si V no
depende de (q̇) ni de t y las ligaduras reónomas no dan lugar a que t aparezca en H se
cumple que ∂H/∂t = 0 y que H = T + V . En este caso:
l
dE d(T + V ) X
= = fν q̇ν (4.33)
dt dt ν=1

Luego, dE/dt es igual a la rata a la cual las fuerzas no conservativas realizan tra-
bajo sobre el sistema. Si estas son nulas, la energı́a total se conserva.

Por otra parte, si las fν son cero, o bien V depende de t, o las ligaduras reónomas
dan lugar a que t aparezcan en H,
dH ∂H
= (4.34)
dt ∂t
Ejemplo 4.1.2 Usando la transformación de Legendre inversa, derivar las ecuaciones de
movimiento lagrangianas a partir de las ecuaciones de movimiento hamiltonianas.
Supongamos que fν = 0. Las ecuaciones de movimiento serán:
∂H ∂H
q̇ν = ; ṗ = − ; ν = 1, 2, ...l (4.35)
∂pν ∂qν
La transformación de Legendre inversa es (p) → (q̇) y está generada por H:
∂H(q, p, t)
q̇ν = ; ν = 1, 2, ...l (4.36)
∂pν
El generador de la transformación (q̇) → (p) es L:
l
X
L(q, q̇, t) = q̇ν pν − H(q, p, t) (4.37)
ν=1
90 / Mecánica clásica avanzada

En virtud del teorema dado por (4.20):


∂L ∂H ∂L ∂H
=− ; ν = 1, 2, ...l ; =− (4.38)
∂qν ∂qν ∂t ∂t
O sea:
∂L
= ṗν ; ν = 1, 2, ...l (4.39)
∂qν
Como L genera la transformación (q̇) → (p)
∂L
pν = ; ν = 1, 2, ...l (4.40)
∂ q̇ν
Con lo cual llegamos a las ecuaciones de Lagrange:
∂L d ∂L
= ; ν = 1, 2, ...l (4.41)
∂qν dt ∂ q̇ν

Ejemplo 4.1.3 Hallar las ecuaciones de movimiento correspondientes a las variables (p),
(ṗ) y t obtenidas mediante una transformación de Legendre.

El generador de la transformación (q) → (−ṗ) es H:


∂H
−ṗν = ; ν = 1, 2, ...l (4.42)
∂qν
Entonces el generador de la transformación (−ṗ) → (q) será cierta función L′ (p, ṗ, t)
dada por:
l
X
L′ (p, ṗ, t) = (−ṗν )qν − H(q, p, t) (4.43)
ν=1

En virtud del teorema (4.20):


∂L′ ∂H ∂L′ ∂H
=− ; ν = 1, 2, ...l; =− (4.44)
∂pν ∂pν ∂t ∂t
Como en virtud de las ecuaciones de Hamilton:
∂H
= q̇ν ; ν = 1, 2, ...l (4.45)
∂pν
y debido a que L′ genera la transformación (−ṗ) → (q)
∂L′
−qν = ; ν = 1, 2, ...l (4.46)
∂ ṗν
Se sigue de (4.44), (4.45) y (4.46) que:
∂L′ d ∂L′
= −q̇ν = ; ν = 1, 2, ...l (4.47)
∂pν dt ∂ ṗν
La formulación hamiltoniana / 91

Entonces las ecuaciones de movimiento lagrangianas para las variables (p) y (ṗ)
son:
∂L′ (p, ṗ, t) d ∂L′ (p, ṗ, t)
− = 0; ν = 1, 2, ...l (4.48)
∂pν dt ∂ ṗν
Esta es la representación de momentos, que nos dice que mediante las variables
(p), (ṗ) es posible describir completamente el sistema.

Ejemplo 4.1.4 Hallar las ecuaciones de movimiento lagrangianas y hamiltonianas para


una partı́cula de masa m en el potencial V = −k/r (r distancia del origen a la partı́cula).

1 2 k
L=T −V = mṙ + (4.49)
2 r

L es esféricamente simétrico, luego se conserva el momento angular ~l = m~r × ~r˙ :


~l es constante en magnitud y dirección. Entonces ~r y ~r˙ son perpendiculares a ~l y en
consecuencia el movimiento es en un plano. Elegimos un sistema de coordenadas polares
en el plano del movimiento, con lo cual:
1 k
L= m(ṙ2 + r2 φ̇2 ) + (4.50)
2 r

El sistema, para ~l dado, tiene en esencia dos grados de libertad, luego hay dos
ecuaciones de Lagrange:
k
mr̈ − mrφ̇ + =0 y mr2 φ̇ = constante (4.51)
r2

Como ~l vale:
~l = m~r × ~r˙ = mr2 φ̇k̂ (4.52)

donde k̂ es un vector unitario normal al plano del movimiento, se sigue de (4.51) y (4.52)
que:

l2 k
mr̈ − + 2 =0 (4.53)
mr3 r
La anterior es una ecuación que permite hallar a r(t) para l dado. Una vez conocido
r(t), tenemos que φ(t) se determina al integrar:

l
φ̇ = (4.54)
mr2
Para pasar al formalismo hamiltoniano partimos de las fórmulas de transformación:
∂L ∂L
pr = = mṙ ; pφ = = mr2 φ̇ = l = constante (4.55)
∂ ṙ ∂ φ̇
92 / Mecánica clásica avanzada

El hamiltoniano será:
H(r, φ, pr , pφ ) = pr ṙ + pφ φ̇ − L =
! (4.56)
p2r p2φ 1 p2r 2
p2φ k
+ 2 − m + r −
m r 2 m2 m2 r 4 r

Con lo cual:
p2r p2φ k
H= + − =T +V (4.57)
2m 2mr2 r
Las ecuaciones de Hamilton serán:
∂H pr ∂H p2φ k
ṙ = − = ; ṗr = − =− 3 + 2
∂pr m ∂r mr r
(4.58)
∂H pφ ∂H
φ̇ = = ; ṗφ = − =0
∂pφ mr2 ∂φ
Las ecuaciones (4.58) de la izquierda no son más que las ecuaciones de la trans-
formación inversa a (4.55). Al reemplazar éstas en las ecuaciones (4.58) de la derecha,
se obtienen las ecuaciones (4.51), como es de esperarse. Es decir, el formalismo hamil-
toniano no aporta nada nuevo en cuanto a las ecuaciones de movimiento se refiere.
Notamos que φ es cı́clica tanto en L como en H. En consecuencia pφ se conserva.
H presenta las mismas simetrı́as que L y por tanto tiene los mismos teoremas de con-
servación.
Ejemplo 4.1.5 Hallar el hamiltoniano y las ecuaciones de movimiento para una partı́cula
en un sistema de coordenadas que rota uniformemente con velocidad angular ~ω .
En el sistema de ejes espaciales:
  1
L ~r, ~r˙ = m~r˙2 − V (~r) (4.59)
2
Si instantáneamente coinciden los ejes espaciales y los ejes rotantes, se cumple que:
~r = ~r
(4.60)
~r˙ = ~r˙ + ~
ω × ~r

donde ~r es el vector de posición de la partı́cula respecto a los ejes rotantes y ~r˙ su velocidad
en esos ejes. Entonces usando la transformación (4.60), (4.59) tomará la forma:
  1  2  2


~ ˙
~ ˙
~ ~˙ ~
L r, r = m r + 2r · ~ω × r + ~ω × r ~ − V ~r (4.61)
2
Las componentes del momento canónico son:
∂L
px = ... (4.62)
∂ ẋ
La formulación hamiltoniana / 93

O vectorialmente:
 
~p = ∂L = m ~r˙ + ~
ω × ~r (4.63)
∂~r˙
La velocidad expresada en términos del momento es:
~
~r˙ = p − ~
ω × ~r (4.64)
m
El lagrangiano (4.61) en términos de las variables hamiltonianas es:
 1 p2 
L ~r, ~p = − V ~r (4.65)
2m
El hamiltoniano será:
!
 X ~p 1 p2 
H ~r, ~p = pν q̇ ν − L = ~p · − ~ω × ~r − + V ~r (4.66)
ν
m 2m

Con lo cual:
1 p2 ~  
H= ω × ~r + V ~r
−p· ~ (4.67)
2m
˙ H es:
En términos de ~r y ~r,
1 ~˙ 2 1 2 
h= ω × ~r + V ~r
mr − m ~ (4.68)
2 2
Nótese que el hamiltoniano correspondiente a L(~r, ~r˙ ) difiere de h por el término
m(~ω × ~r)2 /2. Comparando las ecuaciones (4.61) y (4.68) vemos que h no es T + V . De
acuerdo con (3.124), h es T + V sólo si T es función cuadrática de las velocidades, en
tanto que en este caso hay en T términos de las formas T1 y T0 .
1 2
T2 = mṙ
2

T1 = m~r˙ · (~
ω × ~r ) (4.69)

1
T0 = ω × ~r)2
m(~
2
h es una constante de movimiento porque L no depende del tiempo y no hay fuerzas
disipativas, pero E = T + V no es constante de movimiento. De acuerdo con (3.126):

Ė = Ṫ1 + 2Ṫ0 (4.70)

Vemos que T1 + 2T0 actúan como un trabajo sobre el sistema que hace que E no
sea constante. Esto es debido a la rotación del sistema de coordenadas. Sucede que en
este caso la transformación ~r → ~r depende del tiempo debido a la rotación, con lo cual
la transformación es de tipo reónomo. T1 + 2T0 es un potencial “ficticio” inercial. T1
94 / Mecánica clásica avanzada

está asociada con la fuerza de Coriolis y T0 con la fuerza centrı́fuga. H puede escribirse
como:
p2  
H= ω · ~r × ~p + V ~r
−~ (4.71)
2m

en términos de ~l = ~r × ~p se escribe como:


p2 
H= ω · ~l + V ~r
−~ (4.72)
2m

como ~r depende explı́citamente del tiempo, es de esperarse que ~l no se conserve.


Las ecuaciones de movimiento son:
~p˙ = ∂H ~ ∂V
− = p × ~ω −
∂~r ∂~r
(4.73)
∂H ~p
~r˙ = = − ~ω × ~r
∂~p m
Como suponemos a ~ω constante,
~˙ ~p × ~ω
~¨r = p − ~
ω × ~r˙ = −
1 ∂V
− ~ω × ~r (4.74)
m m m ∂~r

Expresando en (4.74) a ~p en términos de ~r˙ obtenemos:


 1 ∂V
ω × ~r˙ + ~
~¨r + 2~ ω × ~ω × ~r = − (4.75)
m ∂~r
Vemos que la fuerza en el sistema rotante no es masa por aceleración, sino que tiene
dos términos adicionales, el centrı́fugo y el de Coriolis, que caracterizan el movimiento
de una partı́cula descrito desde un sistema de referencia no inercial.

4.2. Simetrı́as y el teorema de conservación


Una coordenada cı́clica en L también es cı́clica en H. En efecto, de las ecuaciones
de Lagrange y de las ecuaciones de Hamilton se sigue respectivamente que:
∂L
ṗν = fν +
∂qν
(4.76)
∂H
ṗν = fν − ; ν = 1, 2, ...l
∂qν
Con lo cual siempre se cumple:
∂L ∂H
=− ; ν = 1, 2, ...l (4.77)
∂qν ∂qν
La formulación hamiltoniana / 95

que en realidad es una propiedad general de la transformación de Legendre (q̇) → (p)


según (4.28). Se sigue que todos los resultados obtenidos para L en cuanto a la relación
entre simetrı́as y teoremas de conservación se aplican directamente en el formalismo
hamiltoniano.
De (4.32) se sigue que si no hay fuerzas disipativas y H no contiene el tiempo
explı́citamente (o, de (4.29), cuando L no contiene el tiempo explı́citamente):
dH ∂H
=− =0 (4.78)
dt ∂t
Además, si la transformación a coordenadas generalizadas no contiene el tiempo
explı́citamente y V no depende de las velocidades, H = T + V = E, o sea que la energı́a
se conserva. Si H no depende de t pero hay fuerzas disipativas:

X l
dH dA
= fν q̇ν = (4.79)
dt ν=1
dt

Si además H = T + V = E, se sigue:
dE dA
= (4.80)
dt dt
Si la transformación de coordenadas depende del tiempo explı́citamente, V no
depende de (q̇) y fν = 0,

T = T0 + T1 + T2 (4.81)

entonces se sigue que:


l
X
pν = 2 Aµν q̇µ + Aν ; ν = 1, 2, ...l (4.82)
µ=1

con lo cual

H = T2 − T0 + V = E − T1 − 2T0 (4.83)

la H anterior en general no se conserva.

Simetrı́as de cambio de escala. Supongamos que el sistema es conservativo,


de modo que E = T + V . Por simplicidad supondremos que no hay ligaduras, de modo
que las coordenadas cartesianas pueden tomarse como coordenadas generalizadas inde-
pendientes. La simetrı́a de cambio de escala se da en una clase restringida de sistemas:
aquellos en los cuales la energı́a potencial V es una función homogénea de grado k:

V (λ~r1 , λ~r2 , ...λ~rN ) = λk V (~r1 , ~r2 , ...~rN ) (4.84)

En coordenadas cartesianas T no depende de las coordenadas y es una función


homogénea cuadrática de las velocidades:

T (λ~r˙1 , λ~r˙2 , ...λ~rN


˙ ) = λ2 T (~r˙ 1 , ~r˙ 2 , ...~r˙ N ) (4.85)
96 / Mecánica clásica avanzada

Supongamos la siguiente transformación de cambio de escala en las longitudes y


tiempos:
~ri → α~ri ; i = 1, 2, ...N
(4.86)
t → βt
Entonces:
 2
α
V → αk V ; T → T (4.87)
β
El cambio en H será:
 2
α
H→ T + αk V (4.88)
β
H será función homogénea de grado k bajo la transformación (4.86) si:
α2
= αk ; H → αk H (4.89)
β2
Esta transformación no cambia la forma de las ecuaciones de Hamilton:
α2
1 ∂H α 1 β 2 ∂H
~r˙ i = → ~r˙ i = ; i = 1, 2, ...N (4.90)
m ∂~r˙ i β m α ∂~r˙ i
β

α2
∂H α β 2 ∂H
m~¨ri = − → m 2 ~¨r i = (4.91)
∂~ri β α ∂~ri
Esta transformación pertenece a la clase de las transformaciones canónicas, o sea
a las transformaciones que no cambian la forma de las ecuaciones canónicas.
La ecuación (4.86) dice que si las longitudes l se cambian por l′ = αl y los tiempos
t por t′ = βt, el sistema tendrá simetrı́a de cambio de escala si α y β son tales que se
cumple (4.89), β = α1−k/2 , o sea si la transformación en longitudes y tiempos cumple:
 ′ 1−k/2
t′ l
= (4.92)
t l
La ecuación (4.92) permite obtener algunas simples relaciones entre los perı́odos
de oscilación de sistemas periódicos que sólo difieren entre sı́ por sus dimensiones carac-
terı́sticas y para los cuales V sea función homogénea.
Para el péndulo simple, donde el potencial mgz es función homogénea de grado 1:
r
t′ l′
= , (4.93)
t l
como se ve, es general; vale no sólo para pequeñas oscilaciones.
La formulación hamiltoniana / 97

Para el oscilador armónico simple V es función homogénea de grado k = 2. En este


caso:
t′
=1 (4.94)
t
Nos dice que el perı́odo del movimiento no depende de la amplitud.
Para el potencial gravitacional, V = −Gm1 m2 /r, k = −1. Entonces:
 ′ 3/2
t′ l
= (4.95)
t l

En este caso la longitud caracterı́stica es la distancia media al sol. La ecuación


(4.95) expresa la tercera ley de Kepler, que vale para un potencial del tipo 1/r solamente.
Una transformación canónica se refiere sólo a transformaciones de las coordena-
das y momentos, pero no del tiempo. Sin embargo, la transformación (4.86), cuando
las coordenadas cartesianas son a la vez generalizadas, es equivalente a la transforma-
ción canónica ~ri → α~ri ; ~
pi → (α/β)~pi , i = 1, 2, ...N . En rigor (4.86) debe llamarse
transfomación de semejanza mecánica.

4.3. La segunda forma del principio de Hamilton


La segunda forma del principio de Hamilton es simplemente el principio variacional
del cual puede obtenerse la trayectoria del sistema en el espacio de fases. En otras
palabras, se busca hallar qué principio variacional conduce a las ecuaciones de Hamilton
como ecuaciones de Euler-Lagrange, en el espacio de fases:
Z x2
d ∂f ∂f
δ f (y, y ′ , x)dx = 0 implica que ′
− =0 (4.96)
x1 dx ∂y ∂y

Sea la función:
l
X
L̃(q, p, q̇, ṗ, t) = pν q̇ν − H(p, q, t) (4.97)
ν=1

L̃ es función de las variables señaladas tomadas independientemente. En particular


(p) y (q̇) toman todos los valores compatibles con las ligaduras, independientemente de
que se puedan relacionar mediante una transfomación de Legendre. Sea ahora el siguiente
principio variacional en el espacio de fases:
Z t2
δ L̃(q, p, q̇, ṗ, t) dt = 0 (4.98)
t1

Con las condiciones en los extremos:

δpν = 0 , δqν = 0 en t = t1 y t = t2 ; ν = 1, 2, ...l (4.99)


98 / Mecánica clásica avanzada

Las ecuaciones correspondientes de Euler-Lagrange son:


d ∂ L̃ ∂ L̃
− = 0; ν = 1, 2, ...l
dt ∂ q̇ν ∂qν
(4.100)
d ∂ L̃ ∂ L̃
− = 0; ν = 1, 2, ...l
dt ∂ ṗν ∂pν
Las ecuaciones (4.97) y (4.100) conducen a las ecuaciones canónicas de Hamilton.
L̃ y L coinciden solamente sobre las trayectorias verdaderas, para las cuales se debe
cumplir que:
∂L
pν = ν = 1, 2, ...l (4.101)
∂ q̇ν
El espacio de fases. La formulación lagrangiana está definida en el espacio de
configuración l-dimensional constituido por las coordenadas generalizadas q1 , q2 , ...ql .
Matemáticamente, el espacio de configuración puede considerarse como una variedad
diferenciable de l dimensiones. El espacio de los momentos generalizados también es l
dimensional y está constituido por los p1 , p2 , ...pl y se llama espacio de los momentos,
que también es una variedad diferenciable de l dimensiones.
Como sabemos, el estado del sistema puede describirse igualmente por (q, q̇) o por
(p, ṗ), o por dos puntos del espacio de configuración o el de momentos respectivamente.
q1 , q2 , ...ql ; p1 , p2 , ...pl forman el espacio de fases que es una variedad diferenciable
2l-dimensional. Cada punto del espacio de fases representa un estado del sistema y ca-
da trayectoria de fases representa un estado de movimiento del sistema. En efecto, las
variables hamiltonianas (q, p) especifican exhaustivamente el estado del sistema.

Ejemplo 4.3.1 Sea una partı́cula de masa m sometida a la condición de ligadura de


moverse sobre la superficie de un cilindro, y sometida a una fuerza restauradora lineal
dirigida hacia el centro del cilindro, F~ = −k~r, donde se toma el origen de coordenadas
en el centro del cilindro. Hacer un estudio de la trayectoria en el espacio de fases.
Tomando el eje z a lo largo del eje del cilindro, la condición de ligadura se puede
expresar por:
x2 + y 2 = R2 (4.102)
Las coordenadas generalizadas pueden tomarse θ, z, donde θ es un ángulo en el
plano perpendicular al eje del cilindro. Entonces L(θ, θ̇, z, ż) será:
1 1
L=T −V = m(R2 θ̇2 + ż 2 ) − k(R2 + z 2 ) (4.103)
2 2
Los momentos canónicos son:
pθ = mR2 θ̇ ; pz = mż (4.104)
El hamiltoniano será:
p2z p2θ 1
H =T +V = + 2
+ kz 2 (4.105)
2m 2mR 2
La formulación hamiltoniana / 99

donde hemos suprimido una constante aditiva. Planteando las ecuaciones de Hamilton
e integrándolas se llega a la solución:
θ = θ0 + at (4.106)
r !
k
z = z0 sen t+δ (4.107)
m

donde θ0 , a, z0 y δ son constantes de integración. Las ecuaciones (4.106) y (4.107)


permiten hallar la ecuación de la trayectoria en el espacio de configuración:
r !
1 k
z = z0 sen θ+φ , (4.108)
a m
p
gráficamente tomamos θ0 = 0, δ = 0, de modo que φ = 0. Llamando ω = k/m
obtenemos:
ω
θ = at ; z = z0 sen ωt ; z = z0 sen θ (4.109)
a

–R
m

–z0 z
z0

–R
y
w=a

Figura 4.1 Partı́cula constreñida a moverse sobre la superficie de un cilindro

La figura 4.1 representa el caso en que ω = a. La trayectoria en el espacio de


configuración siempre será cerrada cuando ω/a sea un número racional. La proyección
del movimiento sobre el eje z es armónica simple y sobre el plano x − y es circular
uniforme.
Como l = 2, el espacio de fases es 4-dimensional, constituido por θ, pθ , z, pz .
Como pθ es constante, pθ = mR2 a, basta representar la proyección del espacio
4-dimensional sobre el subespacio 3-dimensional θ, z, pz . La proyección de la trayectoria
de fases sobre pθ es un punto.
El movimiento en z es armónico simple. El diagrama de fases ż, z, es una elipse.
Igualmente la proyección de la trayectoria de fases sobre el plano z, pz será una elipse. El
100 / Mecánica clásica avanzada

diagrama de fases θ̇, θ, es una lı́nea recta, como también la proyección de la trayectoria
de fases sobre el plano θ, pθ .
La proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz , es
una hélice elı́ptica. Esto es representado en la figura 4.2.

pz Ez = cte pθ
pθ = cte

z θ

pθ = mR2a
pz2 1
Ez = + kz 2
zm i2 pθ
pz
pθ = cte

z
Superficie Ez = cte

Figura 4.2 Arriba: diagramas de fases sobre los planos z-pz y θ-pθ respectivamente. Abajo:
Proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz .

Para este ejemplo, el principio de Hamilton dice que la trayectoria correcta en el


espacio de configuración es aquella para la cual la integral de acción es extremal:
Z t2 Z t2 "Xl
#
∂L
δ L(q, q̇, t) dt = δ q̇ν − h(q, q̇, t) dt = 0
t1 t1 ν=1
∂ q̇ν (4.110)

{δqν (t1 ) = δqν (t2 ) = 0}

En tanto que el principio de Hamilton en el espacio de fases (segunda forma del


principio de Hamilton) dice que la trayectoria correcta en el espacio de fases es aquella
para la cual es extremal la integral sobre dt de L̃ (véase figura 4.2):
Z t2 Z l
t2 X
δ L̃(q, q̇, p, ṗ, t) dt = δ [pν q̇ν − H(q, p, t)] dt = 0
t1 t1 ν=1

(4.111)
δqν (t1 ) = δqν (t2 ) = 0

δpν (t1 ) = δpν (t2 ) = 0


La formulación hamiltoniana / 101

4.4. Las transformaciones puntuales. Las transforma-


ciones en el espacio de fases
Puntuales son las transformaciones de un sistema de coordenadas generalizadas a
otro:
qν → q ν = q ν (q, t) ; ν = 1, 2, ...l (4.112)
Las velocidades generalizadas se transforman como:
Xl
∂q ν ∂q
q̇ µ = q̇µ + ν = q̇ ν (q, q̇, t) ; ν = 1, 2, ...l (4.113)
ν=1
∂qµ ∂t
Bajo estas transformaciones, tanto las ecuaciones de Lagrange como las de Hamil-
ton son covariantes.

Transformaciones en el espacio de fases. Son transformaciones más generales


que las puntuales. Si para definir el estado del sistema se requiere todo el espacio de
fases, podemos pensar que cualquier conjunto de variables (2l) sirve equivalentemente
para describir el estado. Un cambio de variables en el espacio de fases involucra no sólo
las coordenadas generalizadas sino también los momentos:
qν , pν → q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l (4.114)
Ejemplo 4.4.1 Un oscilador armónico unidimensional. El espacio de fases es bidimen-
sional, definido por las “coordenadas cartesianas” x − px . Definir en el espacio de fases
una transformación a “coordenadas polares”; hallar a H y las ecuaciones de Hamilton
en esas variables (véase figura 4.3). Nota: es irrelevante reemplazar a px por px /mω.
La transformación a coordenadas polares está dada por:
p2x
x+ = r2 (4.115)
m2 ω 2
px
tan φ = (4.116)
mωx
Entonces H se transforma ası́:
 
p2x 1 1 p2 1
H= + mω 2 x2 = mω 2 x2 + 2x 2 = mω 2 r2 (4.117)
2m 2 2 m ω 2
Es decir, el nuevo hamiltoniano es:
1
H= mω 2 r2 (4.118)
2
Las ecuaciones de Hamilton se transforman ası́:
∂H ∂H ∂r ∂H ∂φ
ẋ = = +
∂px ∂r ∂px ∂φ ∂px
(4.119)
∂H px ∂H 1
= +
∂r m2 ω 2 r ∂φ mωx sec2 φ
102 / Mecánica clásica avanzada

px / mω

ϕ
x

Figura 4.3 Espacio de fases para el oscilador armónico unidimensional

 
∂H ∂H ∂r ∂H ∂φ
ṗx = − =− +
∂x ∂r ∂x ∂φ ∂x
  (4.120)
∂H x ∂H −px
=− +
∂r r ∂φ mωx2 sec2 φ
Se obtiene entonces para ∂H/∂px y ∂H/∂x:
∂H ∂H senφ ∂H cos φ
= +
∂px ∂r mω ∂φ mωr
(4.121)
∂H ∂H ∂H sen φ
= cos φ −
∂x ∂r ∂φ r
Por otra parte se tiene para ẋ y ṗx :
∂x ∂x
ẋ = ṙ + φ̇ = cos φ ṙ − r senφ φ̇
∂r ∂φ
(4.122)
∂px ∂px
ṗx = ṙ + φ̇ = mω senφ ṙ + mωr cos φ φ̇
∂r ∂φ
o sea que las ecuaciones de Hamilton se transforman en:
∂H senφ ∂H cos φ
cos φ ṙ − r senφ φ̇ = + (4.123)
∂r mω ∂φ mωr
La formulación hamiltoniana / 103

∂H ∂H senφ
mω senφ ṙ + mωr cos φ φ̇ = − cos φ + (4.124)
∂r ∂φ r

Podemos resolver simultáneamente a (4.123) y (4.124) para ṙ y φ̇. El resultado se


obtiene fácilmente con notación matricial:
  
cos φ −senφ ṙ
  =
senφ cos φ rφ̇
  (4.125)
 ∂H 
senφ cos φ  ∂r 
1   
 
mω  1 ∂H 
− cos φ senφ
r ∂φ
Esto se puede escribir también como:
   
cos φ senφ cos φ −senφ ṙ
   =
−senφ cos φ senφ cos φ rφ̇
  (4.126)
  ∂H 
cos φ +senφ senφ cos φ  ∂r 
1    
 
mω  1 ∂H 
−senφ cos φ − cos φ senφ
r ∂φ
De donde:
   
   ∂H  1 ∂H
ṙ 0 1  
 = 1  
∂r  1  
 r ∂φ 
 =   (4.127)
mω −1 0  1 ∂H  mω  ∂H 
rφ̇
r ∂φ −
∂r
Con lo cual las ecuaciones de movimiento en las nuevas variables son:
1 ∂H 1 ∂H
r= ; φ̇ = − (4.128)
mωr ∂φ mωr ∂r
Vemos que en las variables (r, φ) las ecuaciones de movimiento no toman la misma
forma que las ecuaciones canónicas (no son r = ∂H/∂φ; φ̇ = −∂H/∂r, por ejemplo).
En general, una transformación de variables en el espacio fásico cambia la forma de las
ecuaciones de movimiento. En general, las ecuaciones de Hamilton no son covariantes
bajo transformaciones arbitrarias en el espacio de fases. Notemos sin embargo, que hay
una transformación canónica en términos de (r, φ). Hagamos ahora el nuevo cambio de
variables:

(r, φ) → (r2 , φ) (4.129)


104 / Mecánica clásica avanzada

Si llamamos ρ = r2 , tenemos que:


∂H ∂H
= 2r ; ρ̇ = 2r ṙ (4.130)
∂r ∂ρ
O sea que las ecuaciones de Hamilton para las variables (ρ, φ), que obtenemos de
(4.128) y (4.130), son:
mω ∂H 2 ∂H
ρ̇ = ; φ̇ = − (4.131)
2 ∂φ mω ∂ρ
Notemos finalmente que si llamamos q, p, a:

q = −φ ; p = ρ (4.132)
2
las ecuaciones (4.131) se convierten en:
∂H ∂H
ṗ = − ; q̇ = (4.133)
∂q ∂p
O sea que la transformación en el espacio fásico bidimensional definida por:
r
2p √
x= cos q ; px = − 2ωp senq

  (4.134)
2
mω p p x
p= x2 + 2x 2 ; q = −tan−1
2 m ω mωx
deja covariantes las ecuaciones de Hamilton, donde el nuevo hamiltoniano se obtiene del
anterior simplemente expresando a x y px en función de q y p mediante las fórmulas
(4.134):
H = (q, p) = H [x(q, p), px (q, p)] (4.135)
Se dice entonces que la transformación (4.134) es canónica. La referencia hecha en
el enunciado al oscilador armónico no es importante, pues la covariancia de las ecuacio-
nes de Hamilton bajo la transformación (4.134) no depende de la forma de H, siendo
aplicable a cualquier sistema de un grado de libertad.
En general, a la pregunta acerca de la covariancia de las ecuaciones de Hamilton
bajo una transformación arbitraria en el espacio de fases, (q, p) → (q, p), se responde
que no necesariamente son covariantes. Pero existe una clase de transformaciones para
las cuales esto se cumple; tales transformaciones se llaman canónicas o de contacto.
La transformación empleada en las ecuaciones (4.90), (4.91) y (4.134), son ejemplos de
transformaciones canónicas.

Ejemplo 4.4.2 Efectuar una rotación con velocidad angular constante a en el espacio
de fases bidimensional. Mostrar que tal transformación es canónica sólo si al nuevo
hamiltoniano se le adiciona un término. Mostrar que las fórmulas de transformación y
el nuevo hamiltoniano se pueden obtener a partir de las primeras derivadas de cierta
función F (q, q, t). Mostrar que F satisface una ecuación diferencial parcial si se anula el
nuevo hamiltoniano, lo cual es posible para un oscilador armónico.
La formulación hamiltoniana / 105

Las fórmulas de la transformación y su inversa son:


p
q = q cos at + sen at ; p = −cq sen at + p cos at
c
(4.136)
q
q = q cos at − sen at ; p = cq sen at + p cos at
c
donde a y c son parámetros de la transformación que permanecen constantes.
Es simple probar que:
     q̇ 
q̇ cos at −sen at
    
 =  
ṗ ṗ
sen at cos at
c c
(4.137)
  q 
−sen at − cos at
+a   p 

cos at −sen at
c
y que:
   
∂H   ∂H
 ∂p  cos at −sen at  ∂p 
    
 =   (4.138)
 1 ∂H   1 ∂H 
sen at cos at
− −
c ∂q c ∂q
Igualando los lados derechos de (4.137) y (4.138) obtenemos:
 ∂H 
    q 

 ∂p  0 −1
     
 =  + a  p  (4.139)
 1 ∂H  q̇ 1 0
− c c
c ∂q
Las ecuaciones de movimiento para las variables q y p son:
∂H a ∂H
= q̇ − p ; = −ṗ − acq (4.140)
∂q c ∂q
Estas ecuaciones serán de forma canónica solamente si se cambia el nuevo hamil-
toniano:1
 2 
1 p
H(q, p) = H [q(q, p), p(q, p)] + a + cq 2 (4.141)
2 c
Notemos que las ecuaciones (4.136) permiten expresar a p/c y p/c en términos de
q, q:
p q − q cos at p −q + q cos at
= ; = (4.142)
c sen at c sen at
1 En general una transformación dependiente del tiempo es canónica si H es igual a H más ciertos
términos adicionales.
106 / Mecánica clásica avanzada

Si F es la función de q, q y t siguiente:
2qq − (q 2 + q 2 ) cos at
F (q, q, t) = c (4.143)
2 sen at
Comparando a (4.142) y (4.143) vemos que:
∂F (q, q, t) ∂F (q, q, t)
p= ; p=− (4.144)
∂q ∂q
Como las ecuaciones (4.144) son completamente equivalentes a las ecuaciones de
transformación (4.136), se dice que F es la función generatriz de la transformación, que
será canónica solamente si el nuevo hamiltoniano es:
∂F
H =H+ (4.145)
∂t
puesto que,
 
∂F (q, q, t) −2qq cos at + q 2 + q 2 ca 2 p2
= ca 2
= q + 2 (4.146)
∂t 2 sen at 2 c
Los anteriores resultados valen para cualquier sistema de un grado de libertad.
Para un oscilador armónico encontramos que:
 
p2 k 2 1 c2
H[q(q, p), p(q, p)] = + q + − k q 2 sen2 at
2m 2 2 m
    (4.147)
c k p2 k 1
+ − q p sen at cos at + − sen2 at
m c 2 c2 m
Si escogemos el valor de c tal que:
c2 = km (4.148)
Obtenemos que:
q2 k a p2
H(q, p) = + q 2 + ( + cq 2 ) (4.149)
2m 2 2 c
H será cero solamente si a y c cumplen:
1 a
+ = 0; k + ac = 0 (4.150)
m c
Es decir, si a =√
−c/m = −k/c, valor que es compatible con el valor de c dado por
(4.148). Como c = ± km, a debe valer:
r
k
a=± (4.151)
m
Tomamos negativo
p el valor de c para que a sea positiva y coincida con la frecuencia
del oscilador ω = k/m. Notamos que H = 0 implica que q y p son constantes, o sea
que las fórmulas (4.136) nos dan directamente la solución en términos de q y p que se
La formulación hamiltoniana / 107

determinan por las condiciones iniciales de q y p.2 Es simple verificar que F satisface la
ecuación diferencial llamada de Hamilton-Jacobi para el oscilador armónico:
 2
1 ∂F 1 ∂F
+ kq 2 + =0 (4.152)
2m ∂q 2 ∂t

F es una solución de (4.152) que no posee la propiedad de ser la suma de una


función de t y una función de q. Posteriormente veremos que (4.152) posee otra solución
por el método de separación de variables (llamada solución completa) que genera otra
trasformación canónica que anula el hamiltoniano para un oscilador armónico.

4.5. Las transformaciones canónicas


o de contacto
Estas transformaciones en el espacio de fases son importantes, entre otras cosas,
porque conservan el formalismo canónico y permiten reemplazar el hamiltoniano H por
una H que tenga una forma mucho más simple. Ası́ por ejemplo, es posible mediante
una transformación canónica hacer que todas las coordenadas sean cı́clicas; con ello la
solución de un problema mecánico se reduce a un problema de geometrı́a en el espacio
de fases: hallar la transformación canónica adecuada.

Ejemplo 4.5.1 Mostrar que la transformación de cambio de escala es canónica indepen-


dientemente de las propiedades de homogeneidad del potencial. Tal transformación es:

q ν = αqν ; pν = βpν ; α 6= 0 , β 6= 0 ; ν = 1, 2, ...l (4.153)

Mediante esta transformación se tiene:


∂H ∂H ∂H ∂H
=α ; =β
∂qν ∂q ν ∂pν ∂pν
(4.154)
1 1
q̇ν = q˙ν ; ṗν = ṗν ; ν = 1, 2, ...l
α β
con lo cual las ecuaciones de Hamilton se convierten en:
∂H ∂H
q̇ ν = αβ ; ṗν = −αβ ; ν = 1, 2, ...l (4.155)
∂pν ∂q ν
En las nuevas variables (q, p) las ecuaciones de movimiento serán de la forma
canónica solamente si se cambia el hamiltoniano.

H(q, p, t) = αβH(q, p, t) (4.156)


2 También H = 0 si tomamos C = mω, a = −ω. Como el punto representativo del estado del oscilador

en el espacio fásico (véase figura 4.3), rota en el sentido de las agujas del reloj con velocidad angular ω,
con las coordenadas q y q se verá el punto estacionario. H describe pues, un problema de equilibrio.
108 / Mecánica clásica avanzada

Este ejemplo, al igual que los dos anteriores, ilustra el hecho de que el carácter
canónico de una transformación es algo inherente a la transformación misma, indepen-
dientemente de la forma del hamiltoniano, en particular, independientemente de sus
propiedades de simetrı́a. Por esto cualquier sistema de l grados de libertad posee ecua-
ciones de movimiento covariantes bajo la transformación (4.153), aunque solamente si el
potencial es función homogénea de las coordenadas el sistema posee simetrı́a de seme-
janza mecánica, ecuación (4.92). Ası́ mismo las transformaciones (4.115) y (4.116), no
canónicas, y (4.134), canónica, pueden hacerse sin referencia alguna a la forma del hamil-
toniano. Sin embargo, para un hamiltoniano dado, sólo cierta transformación canónica
permite obtener un nuevo hamiltoniano de forma simple. Ası́, para un oscilador armónico
lineal la transformación canónica (4.134) conduce a que H = ωp, o sea a que φ sea cı́clica
en H. Sin embargo (4.134) es aplicable a cualquier sistema de un grado de libertad. De
forma similar (4.136) conduce a H = 0 para el oscilador.
Ejemplo 4.5.2 Mostrar que es canónica la transformación:
q ν = αpν ; pν = βqν ; α 6= 0 , β 6= 0 ; ν = 1, 2, ...l (4.157)
En este caso:
H = −αβH (4.158)
En particular, la transformación con α = 1, β = −1:
q ν = pν ; pν = −qν ; ν = 1, 2, ...l, (4.159)
es canónica con H = H.
Este ejemplo muestra que las nociones de “coordenada” y “momento” pierden su
sentido inicial, pues mediante una transformación canónica (T.C.) es posible hacer que
los momentos pasen a hacer el papel de coordenadas y viceversa.
Como en general q ν = q ν (q, p, t) y pν = pν (q, p, t), con las fórmulas inversas
qν = qν (q, p, t); pν = pν (q, p, t), se ve que se requieren tanto (q) como (p) para po-
der especificar la posición del sistema en el espacio de configuración. (q) y (p) no son
pues “coordenadas” y “momentos” generalizados, sino simplemente pares de cantidades
canónicamente conjugadas. En conclusión, en el espacio de fases el estado del sistema
se especifica mediante un conjunto completo (de 2l) de cantidades canónicamente con-
jugadas.

4.6. La función generatriz


de una transformación canónica
Las ecuaciones canónicas pueden deducirse de un principio variacional en el espacio
de fases (segunda forma del principio de Hamilton) y viceversa:
Z t2 X l
!
∂H
δ pν q̇ν − H dt = 0 ↔ q̇ν =
t1 ν=1
∂pν
(4.160)
∂H
ṗν = − ; ν = 1, 2, ...l
∂qν
La formulación hamiltoniana / 109

Si la transformación (q, p) ↔ (q, p) es canónica, entonces debe también cumplirse


que:
Z l
!
t2 X ∂H
δ pν q̇ ν − H dt = 0 ↔ q̇ ν = ;
t1 ν=1
∂pν
(4.161)
∂H
ṗν = − ; ν = 1, 2, ...l
∂qν
Las ecuaciones (4.160) y (4.161) indican que hay dos expresiones variacionales de las
cuales pueden deducirse las ecuaciones de Hamilton. De acuerdo con la propiedad enun-
ciada en (3.76), se sigue que los integrandos en las variacionales deben diferir a lo sumo
por la derivada total respecto al tiempo de una función arbitraria de las “coordenadas”
de que depende dicho integrando y del tiempo, o sea de (q, p, t), o de (q, p, t):
l
X l
X d
pν q̇ν − H = pν q̇ ν − H + F (q, p, t) (4.162)
ν=1 ν=1
dt
Debido a que (q, p) y (q, p) están relacionadas mediante la transformación canónica,
F (q, p, t) puede expresarse en función de cualquier subconjunto de 2l cantidades inde-
pendientes extraidos del conjunto de 4l cantidades (q, p, q, p) dependientes. La ecuación
(4.162) puede escribirse como:
l
X l
X 
dF = pν dqν − pν dq ν + H − H dt (4.163)
ν=1 ν=1

En el caso en que las 2l cantidades (q, q) sean independientes, podemos expresar a


F en función de (q, q, t). En ese caso la T.C. se llama “transformación canónica libre de la
primera clase”. Matemáticamente, la independencia de las 2l cantidades (q, q) se expresa
mediante la condición de que el jacobiano de las (q) respecto a las (p) sea diferente de
cero, lo cual garantiza que las (p) se puedan expresar en términos de las (q):
   
q 1 , q 2 , ...q l ∂qµ
J ≡ det 6= 0 (4.164)
p1 , p2 , ...pl ∂pν
Si se cumple (4.164) entonces es posible expresar los pν en función de (q, q, t) y por
lo tanto representar cualquier función de (q, p, t) en términos de (q, q, t). En este caso es
posible escribir:
F (q, p, t) = F1 (q, q, t) (4.165)
Esto permite escribir:
Xl Xl
∂F1 ∂F1 ∂F1
dF = dF1 = dqν + dq ν + dt (4.166)
ν=1
∂qν ν=1
∂qν ∂t
Como las 2l + 1 cantidades (dq, dq, dt) son independientes, vemos que para una
transfomación canónica libre de la primera clase, de (4.163) y (4.166) se sigue que:
∂F1 (q, q, t) ∂F1 (q, q, t)
pν = ; pν = − ; ν = 1, 2, ...l (4.167)
∂qν ∂qν
110 / Mecánica clásica avanzada

Además se sigue que:


∂F1 (q, q, t)
H(q, p, t) − H(q, p, t) = (4.168)
dt
La ecuación (4.167) dice que a cada transformación canónica libre de la primera cla-
se le corresponde una función F1 y viceversa. F1 se llama la función generatriz de la
transformación canónica.3
Ejemplo 4.6.1 Hallar la transformación canónica generada por la función:
l
X
F1 (q, q, t) = − qν q ν (4.169)
ν=1

En (4.169) está implı́cito que (q) y (q) son independientes. Por lo tanto las fórmulas
de la transformación canónica serán:
∂F1
pν = = −q ν ⇒ q ν = −pν ; ν = 1, 2, ...l (4.170)
∂qν
∂F1
pν = − = qν ⇒ pν = qν ; ν = 1, 2, ...l (4.171)
∂qν
Es esencialmente la misma transformación (4.159), que intercambia coordenadas y
momentos. Este ejemplo muestra que cada función de (q, q, t) define una transformación
canónica
Ejemplo 4.6.2 Probar que la transformación canónica (4.134) es libre de la primera clase.
Hallar la correspondiente función F1 .
Sea q = x y p = px . Las fórmulas de transformación serán entonces:
r
2p p
q= cos q ; p = − 2mωp sen q (4.172)

 
1 p2 p
p = mω x2 + 2 2 ; q = −tan−1 (4.173)
2 m ω mωq
El jacobiano (4.164) es trivial y diferente de cero:
 
q ∂q
J = 6= 0 (4.174)
p ∂p
O sea que la transformación es libre de la primera clase y puede ser generada por
cierta función de las variables independientes q y q. La transformación no depende del
tiempo, pues suponemos a m y a ω constantes. Notamos de (4.174) que toda transforma-
ción canónica no puntual es libre de primera clase para sistemas de un grado de libertad.
F1 (q, q, t) ha de ser tal que, de acuerdo con (4.163):
 
1 p2
dF1 = p dq − pdq = p dq − mω q 2 + 2 2 dq (4.175)
2 m ω
3 La función del ejemplo 4.4.2, (4.143), es la función generatriz de la transformación canónica (4.136).
La formulación hamiltoniana / 111

Debemos expresar a p en términos de q y q lo cual se obtiene directamente de


(4.173):

p = −mωq tan q (4.176)

Reemplazando a (4.176) en (4.175) obtenemos:


1
dF1 = −mωq tan q dq − mωq 2 sec2 q dq
2
  (4.177)
1 2
= −mωd q tan q
2
Se sigue entonces que, salvo una constante aditiva:
1
F1 (q, q) = − mωq 2 tan q (4.178)
2
Podemos probar directamente, usando las fórmulas (4.167), que F1 dada por (4.178)
efectivamente genera la transformación dada por (4.172) y (4.173):

∂F1 ∂F1 1
= −mωq tan q ; = − mωq 2 sec2 q (4.179)
∂q ∂q 2
O sea que:
1
p = −mωq tan q ; p= mωq 2 sec2 q (4.180)
2
Al despejar en (4.180) a p y q obtenemos a (4.170), y al despejar a p y q obtenemos
a (4.173). Notemos que −Et − mωq 2 tan q/2 es una solución a la ecuación de Hamilton-
Jacobi (4.152).

Ejemplo 4.6.3 Sea una partı́cula descrita por el hamiltoniano:

p2
H= − aq (4.181)
2m
donde m y a son constantes. Hallar la T.C. que lleva al hamiltoniano:

H=0 (4.182)

En las nuevas variables las ecuaciones de Hamilton con H = 0 conducen a la


solución trivial:

p = constante ; q = constante (4.183)

La transformación ha de ser tal que se cumpla para F1 , según (4.167) y (4.168):

∂F1 ∂F1 ∂F1


= p; = −p ; −H = (4.184)
∂q ∂q ∂t
112 / Mecánica clásica avanzada

Se sigue de (4.181) y (4.184) que F1 debe ser solución a la ecuación diferencial de


Hamilton-Jacobi:
 2
1 ∂ ∂
F1 (q, q, t) − aq = − F (q, q, t) (4.185)
2m ∂q ∂t
La ecuación diferencial es de primer orden e involucra derivadas respecto a q y
respecto a t. La solución debe contener constantes de integración arbitrarias; una de
ellas puede ser aditiva. Podemos tomar a q como la constante no aditiva de integración.
La ecuación (4.185) tiene una solución de la forma:
F1 (q, q, t) = −qt + f (q, q) (4.186)
La ecuación (4.186) equivale a tomar la constante q igual a la energı́a, puesto que
H en (4.181) es constante, H = E:
q=E (4.187)
Con esta solución, (4.184) se reduce a:
 2
1 df (q, q)
− aq = q (4.188)
2m dq
Integrando (4.188) obtenemos:

2 2m
f (q, q) = ± (q + aq)3/2 + constante (4.189)
3 a
Con lo cual, omitiendo la constante aditiva:

2 2m
F1 (q, q, t) = −qt ± (q + aq)3/2 (4.190)
3 a
La ecuación (4.190) genera la siguiente transformación canónica, de acuerdo con las
fórmulas (4.167):

p 2m p
p = ± 2m(q + aq) ; −p = −t ± q + aq (4.191)
a
Explı́citamente la transformación es:
q a
p(q, p, t) = (t − p)a ; q(q, p, t) = − + (t − p)2 (4.192)
a 2m
p p2
p(q, p, t) = t − ; q(q, p, t) = − aq (4.193)
a 2m
Como q y p son constantes, (4.192) proporciona la solución al problema del movi-
miento descrito por (4.181). En particular describe el problema del movimiento de una
partı́cula en presencia de la gravedad (a = −mg , q = z , p = mż).
E 1
z= − g(t − p) ; mż − mg(t − p) (4.194)
mg 2
La formulación hamiltoniana / 113

Las constantes E y p tienen las siguientes expresiones en función de los valores de


z y ż en t = 0:
1 v0
E= mv 2 + mgz0 ; p= (4.195)
2 0 g
Entonces para z(t) y ż(t) obtenemos:
1
z = z0 + v0 t − gt2 ; ż = v0 − gt (4.196)
2
de acuerdo con el resultado obtenido usando métodos elementales.
Es claro que la transformación dada por (4.192) y (4.193) es canónica indepen-
dientemente de la forma de H y aplicable a cualquier sistema de un grado de libertad;
sin embargo, sólo para H dado por (4.181) mediante (4.192) se consigue H = 0 y por
tanto que q y p sean constantes. Este problema ilustra el método de resolver un pro-
blema mecánico mediante una transformación canónica sin integrar las ecuaciones de
Hamilton.

4.7. La evolución temporal de un sistema


considerada como una transformación
canónica
Sean qν0 y p0ν los valores de qν y pν en t = t0 (ν = l, 2, ...l). Estos valores deter-
minarán todos los valores sucesivos de las (q, p), de modo que en un tiempo t podemos
escribir:
qν (t) = qν (q 0 , p0 , t − t0 ) ; ν = 1, 2, ...l
(4.197)
pν (t) = pν (q 0 , p0 , t − t0 )
La ecuación (4.197) puede considerarse como una cierta transformación en el espa-
cio de fases, donde (q 0 , p0 ) son las viejas variables y (q, p) las nuevas. Esta transforma-
ción es canónica pues tanto (q 0 , p0 ) como (q, p) satisfacen las ecuaciones de Hamilton.
La función generatriz de esta transformación satisface:
l
X l
X
dF = p0ν dqν0 − pν dqν + (H 0 − H) dt (4.198)
ν=1 ν=1

Si no hay fuerzas disipativas y las ecuaciones que definen las coordenadas genera-
lizadas no dependen del tiempo, H se conserva, H = H 0 , luego:
t
X l Xl Xl
0 0
dF = pν dqν − pν dqν = − pν dqν (4.199)

ν=1 ν=1 ν=1 t0

Por otra parte, escribamos la integral de acción entre t0 y t:


Z t
S= L dt (4.200)
t0
114 / Mecánica clásica avanzada

Una variación de las (q) nos conduce a:


Z tX l  
∂L ∂L
δS = δqν + δ q̇ν dt
t0 ν=1 ∂qν ∂ q̇ν

Z tX l      
∂L d ∂L d ∂L
= δqν + δqν − δqν dt (4.201)
t0 ν=1 ∂qν dt ∂ q̇ν dt ∂ q̇ν

Xl
t Z t "X
l  #
∂L ∂L d ∂L
= δqν + − δqν dt
ν=1 ∂ q̇ν t0 t0 ν=1 ∂qν dt ∂ q˙ν
Si asumimos que la trayectoria es real, se cumplen sobre ella las ecuaciones de
Lagrange, luego:
t t
X l
∂L l
X

δS = δqν = pν δqν (4.202)
∂ q̇ν t0
ν=1 ν=1 t0

Comparando a (4.199) y (4.202) vemos que:


F = −S (4.203)
En conclusión, la acción es la función generatriz de la transformación canónica
de evolución temporal del sistema. Ésta es una transformación del espacio de fases en
sı́ mismo: cambia el punto del espacio de fases (q 0 , p0 ) por el punto del espacio de fases
(q, p). En el ejemplo del oscilador armónico lineal, la figura 4.3 es una circunferencia.
La evolución temporal consiste simplemente en una rotación del vector de posición del
punto del espacio fásico que representa al sistema, lo cual también puede verse en las
fórmulas (4.172), y más claramente aún mediante el ejemplo 4.4.2.

4.8. El teorema de Liouville


El teorema de Liouville es un teorema básico para la mecánica estadı́stica, o sea la
mecánica de sistemas tales que:
(a) El número de grados de libertad es muy grande.
(b) No se pueden determinar las 2l condiciones iniciales, y por lo tanto tampoco el
estado del sistema en sentido clásico. Solamente se conoce el hamiltoniano del sistema,
las condiciones de ligadura, y a lo sumo siete de las 2l constantes de movimiento (las
aditivas: H, L,~ P~ ).
(c) Respecto a las condiciones iniciales, o sea a las posibles trayectorias del espacio
de fases, sólo se pueden hacer suposiciones estadı́sticas.
En particular se puede asumir que todas las trayectorias de fase compatibles con las
ligaduras y con los valores de las siete constantes de movimiento aditivas son igualmente
probables (distribución uniforme). En general, habrá una región del espacio de fases que
es accesible al sistema y se puede postular alguna distribución de probabilidades de las
distintas trayectorias de fase dentro de la región accesible (las trayectorias externas a la
región accesible tienen probabilidad cero).
La formulación hamiltoniana / 115

Ejemplo 4.8.1 Analizar un oscilador armónico lineal cuando sólo se conoce exactamente
su energı́a.
Mediante la transformación canónica (4.172), la dinámica del oscilador está descrita
por:
r
2p p
q= cos q ; p=− 2mωp senq ; H = ωp = E (4.204)

Las ecuaciones canónicas en las variables (q, p) tienen la solución:
E
q = ωt + δ ; p= = constante (4.205)
ω
donde δ es una constante arbitraria. La otra constante arbitraria es E. O sea que dados
E y δ queda determinado completamente el estado de movimiento:
r
2E
q(E, δ, t) = cos (ωt + δ)
mω 2 (4.206)

p(E, δ, T ) = − 2mE sen(ωt + δ)

p / mω

t>0
r

δ q

(2E / mω 2 ) 1/2
t=0

Figura 4.4 Espacio de fases del oscilador armónico lineal para E conocida

E define el radio de la trayectoria y δ el tiempo inicial de la misma (véase figura 4.4).


p La región accesible la constituyen todos los puntos de una circunferencia de radio
2E/(mω 2 ). Las diferentes trayectorias están definidas por los valores de δ.
Ejemplo 4.8.2 Analizar el oscilador tridimensional sometido a la ligadura de moverse
únicamente sobre la superficie de un cilindro, cuando sólo se conoce exactamente la
energı́a y el momento angular en la dirección z (ver ejemplo 4.3.1).
116 / Mecánica clásica avanzada

La figura 4.2 muestra que cada valor de Ez determina un “cilindro” en el espacio


de fases. La energı́a total es, de acuerdo con la ecuación (4.105):
L2z
E = Ez + (4.207)
2mR2
Parte de la energı́a está asociada al movimiento en z y parte a la rotación, siendo
ambas constantes por separado.
Para Lz arbitrario, la región accesible del espacio fásico está definida por el “cilin-
dro” E = constante. Todos los puntos interiores a este cilindro son accesibles.
Para Lz y Ez dados, habrá un conjunto infinito de trayectorias de fase en “espiral”,
caracterizada cada una por los valores de θ0 y δ [ecuaciones (4.106) y (4.107)], que pueden
estar entre 0 y 2π. En el caso en que se conozcan Lz y Ez , la distribución uniforme para
este sistema es aquella en la cual todos los valores de θ0 y δ tienen igual probabilidad.
En general cuando sólo se conocen exactamente la energı́a total, el momento lineal
total y el momento angular total del sistema, además de las ligaduras, la región del
espacio de fases accesible al sistema está definida por las ecuaciones:
E(q, p) = E0 ; ~ p) = L
L(q, ~0 ; P~ (q, p) = P~0 (4.208)
que definen una variedad de 2l − 7 dimensiones en el espacio de fases.4
Las 2l − 7 constantes de movimiento adicionales no son determinadas; la distri-
bución microcanónica asigna a cada uno de los estados caracterizados por (4.208) y los
valores de las 2l − 7 constantes restantes igual probabilidad.

Conjunto estadı́stico. Es una noción útil en los casos donde hay 2l−7 constantes
de movimiento no determinadas. Consiste en un conjunto de sistemas iguales (el mismo
número de grados de libertad, la misma clase de partı́culas y de interacciones, las mismas
ligaduras y los mismos valores de las constantes de movimiento aditivas).
Es decir, dos sistemas de un conjunto estadı́stico sólo pueden diferir por los valores
de las 2l − 7 constantes no aditivas. Se considera que el número de sistemas es muy
grande, de modo que es una muestra estadı́sticamente representativa de la distribución
de los valores de las 2l − 7 constantes indeterminadas. En cada instante del tiempo, el
estado de cada sistema del conjunto será representado por un punto del espacio fásico,
y su estado de movimiento por una trayectoria de fases. El conjunto estadı́stico de siste-
mas de l grados de libertad estará representado en cada instante por un “enjambre” de
puntos del espacio fásico. Como los sistemas del conjunto estadı́stico no interactúan, ca-
da punto se mueve independientemente de los demás en el espacio fásico 2l-dimensional.5

Teorema de Liouville. En cada elemento de volumen del espacio fásico la densi-


dad de puntos representativos del conjunto estadı́stico permanece constante en el tiempo.
Sea dΓ = dq1 dq2 , ...dql dp1 , dp2 , ...dpl = dΓq dΓp un elemento de volumen infini-
tesimal del espacio de fases. Sea:
dN = ρ(p, q, t)dΓq dΓp (4.209)
4 Estas constantes tienen la propiedad de ser aditivas. La variedad puede reducirse si tomamos en

cuenta que asociadas a la posición del centro de masa de un sistema libre hay tres constantes; quedarı́an
en ese caso 6N − 10 constantes no determinadas.
5 Un conjunto estadı́stico tiene analogı́a con los “ensambles” que mencionamos en la sección 2.3.
La formulación hamiltoniana / 117

el número de sistemas dentro de dΓ. A ρ(q, p, t) se le llama la función de distribución


estadı́stica y hace el papel de función de densidad de probabilidad en el espacio de fases.
ρ satisface la condición de normalización:
Z
ρdΓq dΓp = 1 (4.210)

donde la integral abarca todo el espacio de fases. Matemáticamente el teorema dice que:
l  
dρ X ∂ρ ∂ρ ∂ρ
ρ̇ = 0 o = q̇ν + ṗν + =0 (4.211)
dt ν=1
∂qν ∂ ṗν ∂t

Una forma cualitativa de visualizarlo se da a continuación. Sea un volumen arbi-


trario del espacio de fases en t = t0 . Como el número de sistemas es muy grande, en la
frontera de tal volumen habrá un gran número de puntos representativos de sistemas del
conjunto, de modo que aproximadamente podemos decir que la frontera del elemento
de volumen está definida por un conjunto de puntos representativos del conjunto es-
tadı́stico. Cuando transcurre el tiempo, el volumen se mueve al moverse los puntos de
la frontera. El tamaño del volumen podrá cambiar, pero no el número de puntos que
lo constituyen. En efecto, sea (q, p) un punto arbitrario de la frontera. Todo punto que
entre o salga del elemento de volumen deberá pasar por la frontera, pero al llegar a
la frontera tendrá los mismos (q, p) de un punto de la misma. Ambos puntos tendrán
las mismas condiciones iniciales para el movimiento posterior, en consecuencia deberán
seguir moviéndose juntos. En conclusión, el número de puntos en cualquier región del
espacio fásico es constante. Se puede demostar que:
Z Z
dΓq dΓp = dΓq dΓp (4.212)

donde la transformación (q, p) → (q, p) es canónica. Como la evolución temporal es una


T.C., se sigue que:
Z Z
dΓq0 dΓp0 = dΓq dΓp (4.213)

Como no cambian con el tiempo ni el volumen ni el número de puntos dentro de


él, la densidad será constante.

Demostración del teorema de Liouville. Sea un conjunto estadı́stico de siste-


mas de un grado de libertad, entonces el espacio fásico es bidimensional y dΓ = dq dp.
Además, dN = ρ dq dp es el número de sistemas en dΓ. Consideremos que cada uno de
los sistemas del conjunto tiene energı́a entre E y E + ∆E.
La figura 4.5 muestra la región accesible, definida por las lı́neas E = constante y
E + ∆E =p constante (depser osciladores armónicos, tal región serı́a una corona circular
de radios 2E/mω 2 y 2(E + ∆E)/mω 2 ). Cuando el tiempo transcurre, los puntos
representativos del conjunto se mueven dentro de esta región. Entre t y t + dt entran al
elemento de volumen dΓ todos los puntos que se mueven hacia el frente a las caras de
la izquierda e inferior. El número de los puntos que entran a dΓ durante el tiempo dt
118 / Mecánica clásica avanzada

E + dE

t
t + dt

dp

E pdt
(q,p)
dq
q
qdt

Figura 4.5 Espacio fásico. Región accesible definida por las lı́neas E = constante y E +∆E =
constante.

será igual a:

ρq̇ dt dp + ρṗ dt dq (4.214)

O sea que el número de puntos que entran a dΓ por unidad de tiempo es:

ρq̇ dp + ρṗ dq = ρ(q̇ dp + ṗ dq) (4.215)

Para hallar los puntos que salen, debemos considerar los que se mueven dentro de
dΓ hacia las caras derecha y superior y que las alcanzarán en el tiempo dt. Esto se puede
obtener de (4.215) mediante una expansión de Taylor alrededor de (q, p), para hallar
(4.215) en (q + dq, p + dp):

(ρq̇)|q+dq dp + (ρṗ)|p+dp dq̇ =


    (4.216)
∂ ∂
ρq̇ + (ρq̇) dq dp + ρṗ + (ρṗ) dp dq
∂q ∂p
La variación del número de puntos dentro de dΓ es igual a lo que entra menos lo
que sale por unidad de tiempo, o sea a (4.215) menos (4.216):
 
∂ ∂
− (ρq̇) + (ρṗ) dq dp (4.217)
∂q ∂p

Dentro de dΓ la rata de incremento temporal de la densidad será ∂ρ/∂t y el cambio


del número de puntos en dΓ por unidad de tiempo es (∂ρ/∂t).dq dp y debe ser igual a
(4.217):
 
∂ρ ∂ ∂
dq dp = − (ρq̇) + (ρṗ) dq dp (4.218)
∂t ∂q ∂ρ
La formulación hamiltoniana / 119

Se sigue entonces que:


∂ρ ∂ q̇ ∂ρ ∂ ṗ ∂ρ
+ρ + q̇ + ρ + ṗ = 0 (4.219)
∂t ∂q ∂q ∂p ∂p
Usando las ecuaciones de Halmilton se tiene:
∂ q̇ ∂ ṗ ∂2H ∂2H
+ = − =0 (4.220)
∂q ∂p ∂q∂p ∂p∂q
Con lo cual (4.219) nos da el resultado:
∂ρ ∂ρ ∂ρ dρ
+ q̇ + ṗ = =0 (4.221)
∂t ∂q ∂p dt
La generalización a sistemas de varios grados de libertad es análoga. En ese caso
debemos reemplazar el plano p − q por el plano pν − qν correspondiente al grado de
libertad ν. dΓ → dqν dpν es la proyección del elemento de volumen dΓq dΓp sobre el
plano ν.
Las lı́neas E y E + dE son el corte del plano ν con las hipersuperficies en el espacio
de fases E = constante, E + dE = constante. dΓ será:
dΓ = dΓp dΓq = dq1 dq2 ...dqν−1 dqν+1 ...dql dp1 dp2
(4.222)
...dpν−1 dpν+1 ...dpl dqν dpν = dΓν dqν dpν ; ν = 1, 2, ...l
Debemos reemplazar las ecuaciones (4.215) y (4.216) por:
ρ dΓν (q̇ dpν + ṗν dqν ) y, (4.223)
 
ν ∂ ν
ρ dΓ q̇ν + (ρ dΓ q̇ν ) dqν dpν
∂qν
  (4.224)
ν ∂ ν
+ ρ dΓ ṗν + (ρ dΓ ṗν ) dpν dqν
∂pν
Por tanto la variación del número de puntos en el área dqν dpν será igual a (4.223)-
(4.224):
 
∂ ν ∂ ν
− (ρ dΓ q̇ν ) + (ρ dΓ ṗν ) dqν dpν =
∂qν ∂pν
  (4.225)
∂ ∂
− (ρq̇ν ) + (ρṗν ) dΓ
∂qν ∂pν
La variación del número de puntos en todo el volumen dΓ es igual a la suma de las
variaciones de los números de puntos sobre sus proyecciones q1 − p1 , q2 − p2 , ...ql − pl .
Ésta será:
Xl  
∂ ∂
− (ρq̇ν ) + (ρṗν ) dΓ (4.226)
ν=1
∂qν ∂pν
Usando el resultado (4.220) para cada grado de libertad e igualando (4.226) a
∂ρ/∂t dΓ obtenemos el teorema de Liouville, ecuación (4.211).
120 / Mecánica clásica avanzada

Ejemplo 4.8.3 Sea un conjunto de cuatro partı́culas iguales que se lanzan hacia arriba
en un campo gravitacional uniforme, con las siguientes condiciones iniciales:

z10 = z0 , z20 = z0 + ∆z0

z30 = z0 , z40 = z0 + ∆z0


(4.227)
pz10 = p0 , pz20 = p0

pz30 = p0 + ∆p0 , pz40 = p0 + ∆p0

(a) Hallar la región que inicialmente ocupa el conjunto en el espacio de fases.


(b) Hallar las trayectorias de fase de las partı́culas.
(c) Considerar cómo cambia la región ocupada por el conjunto para t > 0.
El espacio fásico de cada sistema es 6-dimensional, pero sólo hay variaciones en
la proyección bidimensional z − pz . x, px , y y py permanecen constantes, ya que por
definición las partı́culas no interactúan entre sı́. La energı́a de cada partı́cula es constante.
Entonces:
p2zi
Hi = + mgzi = Ei = constante ; i = 1, 2, 3, 4 (4.228)
2m
La ecuación de la trayectoria de cada partı́cula en el espacio de fases será parabólica:
p
pzi = ± 2m(Ei − mgzi ) (4.229)

De acuerdo con (a) y (b) las Ei serán:

p20 p20
E1 = + mgz0 ; E2 = + mg(z0 + ∆z0 )
2m 2m

(p0 + ∆p0 )2
E3 = + mgz0 (4.230)
2m

(p0 + ∆p0 )2
E4 = + mg(z0 + ∆z0 )
2m
Asumiendo positivos a ∆p0 y ∆z0 , vemos que:

E4 > E3 ; E4 > E2 ; E3 > E1 ; E2 > E1 (4.231)

Además, para precisar, asumamos que ∆p0 y ∆z0 son tales que E3 > E2 , de modo
que:

E4 > E3 > E2 > E1 (4.232)

La solución a este problema es:


pzi0 1
pzi = pzi0 − mgt ; zi = zi0 + t − gt2 ; i = 1, 2, 3, 4 (4.233)
m 2
La formulación hamiltoniana / 121

De modo que:

pz 1 = p0 − mgt ; pz2 = p0 − mgt

p0 1 p0 1
z1 = z0 + t − gt2 ; z2 = z0 + ∆z0 + t − gt2
m 2 m 2

pz 3 = p0 + ∆p0 − mgt ; pz4 = p0 + ∆p0 − mgt (4.234)


p0 + ∆p0 1
z3 = z0 + t − gt2
m 2
p0 + ∆p0 1
z4 = z0 + ∆z0 + t − gt2
m 2
Las ecuaciones (4.234) nos dicen que:

∆p0
Pz1 = pz2 = p < p0 ; z3 = z1 + t
m

z2 = z1 + ∆z0 ; Pz3 = pz4 = p + ∆p0


(4.235)
∆p0
z4 = z2 + t; z4 = z3 + ∆Z0
m

z1 = z

La figura 4.6 muestra la región ocupada por el conjunto en el espacio de fases, en


t = 0 y en t > 0. Vemos que el área (volumen) del espacio fásico ocupada por el conjunto
de sistemas permanece constante en el tiempo y es igual a:

∆z0 ∆p0 (4.236)

Dicha región se mueve distorsionándose pero sin cambiar el valor del área. El
resultado es el mismo en el caso en que dentro del área en mención haya un número
arbitrario de puntos: el área de la región limitada por las lı́neas 1 − 2, 2 − 4, 3 − 4 y 1 − 3
permanecerı́a constante y todos los puntos quedarı́an dentro. La densidad de puntos en
el espacio de fases también es una constante; en este caso.
4
= constante (4.237)
∆z0 ∆p0
De haber inicialmente en el centro del rectángulo una quinta partı́cula, esta per-
manecerı́a en el centro del cuadrilátero en t > 0.
La figura 4.7 muestra las trayectorias de fase.

Ejemplo 4.8.4 Sea una partı́cula que se lanza hacia arriba en presencia de un campo
gravitacional uniforme. Sus condiciones iniciales se conocen con cierta indeterminación:
122 / Mecánica clásica avanzada

pz
p0 + ∆p0 3 4
∆p0t / m

p0
1 2
p + ∆p0 3 4

p
1 2

z0 z0 + ∆z0 z z + ∆z0 z

Figura 4.6 Región ocupada por el conjunto de sistemas en el espacio de fases

pz

3 4
p0 + ∆p0
1 2
p0

z0 z0 + ∆z0

2
1

4
1 3
2
3
4

Figura 4.7 Trayectorias de fase. Caso en que dentro del área hay un número arbitrario de
puntos

∆z0 ∆p0
z(0) = z0 ± ; pz (0) = p0 ± (4.238)
2 2
Es decir, se sabe que en t = 0 la partı́cula está en un rectángulo de área ∆z0 ∆p0
en el espacio de fases. Analizar la evolución de la partı́cula.
Basta considerar el movimiento de la partı́cula en los valores extremos de las con-
diciones iniciales (z0 − ∆z0 /2 , p0 − ∆p0 /2 ; z0 − ∆z0 /2 , p0 + ∆p0 /2 ; z0 + ∆z0 /2 , p0 −
La formulación hamiltoniana / 123

∆p0 /2 ; z0 + ∆z0 /2 , p0 + ∆p0 /2), que coinciden con las condiciones iniciales (4.227)
del ejemplo anterior, cambiando z0 por z0 + ∆z0 /2 y p0 por p0 + ∆p0 /2. Se concluye
inmediatamente que para una partı́cula se cumple:
∆z(t) ∆pz (t) = ∆z(0) ∆pz (0) = constante = ∆z0 ∆p0 (4.239)
Para un valor dado de esta constante, si se reduce la indeterminación en z, se
aumenta la indeterminación en ∆pz y viceversa. Clásicamente no hay lı́mite al valor más
pequeño que puede tomar la constante ∆p0 ∆z0 . Cuánticamente no puede ser menor que
h̄/2, donde h̄ es la constante de Planck, luego:

∆z ∆pz ≥ (4.240)
2
La ecuación (4.240) se denomina la desigualdad de Heisenberg.
El resultado (4.239) es válido en general, de acuerdo con el teorema de Liouville.
La proyección del volumen del espacio fásico dentro del cual inicialmente se en-
cuentra la partı́cula, ∆Γ0 = ∆p10 ∆q10 ∆p20 ∆q20 ...∆pl0 ∆ql0 , sobre el plano qν − pν ,
tiene un área ∆pν0 ∆qν0 . Se tiene entonces que:

∆pν (t) ∆qν (t) = ∆pν0 ∆qν0 = constante (4.241)


O sea que, cuánticamente se cumple que para cualquier par de variables canónica-
mente conjugadas:

∆pν ∆qν ≥ (4.242)
2
Clásicamente, para un valor dado de la constante ∆pν0 ∆qν0 , al aumentar la inde-
terminación de pν , se disminuye la indeterminación de qν y viceversa. Lo especı́fico de la
desigualdad de Heisenberg (el “efecto cuántico”) es que la constante no puede ser cero
sino que tiene un mı́nimo valor.
124 / Mecánica clásica avanzada
5
Movimiento de dos partı́culas
que interactúan por medio de una fuerza
central

Éste es un problema que en principio es soluble de manera exacta para cualquier


fuerza central. Pertenece a los pocos problemas de la mecánica clásica en que es posible
la separación de las variables. Como se sabe, no existen soluciones analı́ticas exactas para
el problema general de más de dos partı́culas interactuando mutuamente por fuerzas de
dos partı́culas.

5.1. Coordenadas de centro de masa


y coordenadas relativas
En general las coordenadas de las partı́culas individuales, por ejemplo X1 , Y1 ,
Z1 , X2 , Y2 y Z2 , no permiten desacoplar las ecuaciones de movimiento. Sólo cuando
las fuerzas son lineales ha sido diseñado un formulismo que desacopla las ecuaciones
de movimiento mediante la transformación a coordenadas normales. Afortunadamente,
el problema de dos partı́culas que interactúan a través de una fuerza central admite
la separación de variables mediante la transformación a las coordenadas relativas y de
centro de masa.
R~ = m1~r1 + m2~r2 , ~r = ~r2 − ~r1 ,
m1 + m2
(5.1)
~− m 2 ~+ m 1
~r1 = R ~r , ~r2 = R ~r
M M
Un potencial central es aquel que depende sólo de la distancia entre las partı́culas:
V (~r1 , ~r2 ) = V (|~r2 − ~r1 |) = V (r) (5.2)
Las fórmulas (5.1) permiten escribir la energı́a cinética ası́:
1 2 1 2 1 ~˙ 2 1 ˙ 2
T = m1~r˙ 1 + m2~r˙ 2 = M R + µ~r (5.3)
2 2 2 2

125
126 / Mecánica clásica avanzada

donde M es la masa total y µ la masa reducida:


m1 m2
M = m1 + m2 ; µ= (5.4)
m1 + m2
 
Entonces en vez de L ~r1 , ~r2 , ~r˙ 1 , ~r˙ 2 podemos escribir:
  2
~ ~r˙ , R
L ~r, R; ~˙ + 1 µ~r˙ 2 − V (r)
~˙ = 1 M R (5.5)
2 2
R~ es cı́clica y por lo tanto el momento lineal del centro de masa es una constante de
movimiento. L consta de términos desacoplados, es decir, describe un sistema equivalente
de dos partı́culas, una libre de masa M colocada en el centro de masa y otra de masa µ
colocada por ejemplo en la posición de la partı́cula 2, y sometida al efecto de un centro
de fuerzas inmóvil colocado en la posición de la partı́cula 1, y exactamente sometida a
la misma energı́a potencial de interacción de las dos partı́culas originales:
1 ~˙ 2 1 ˙2
LCM = MR ; Lrel = µ~r − V (r) (5.6)
2 2
Lrel es esféricamente simétrico pues depende sólo de la magnitud de los vectores ~r
y ~r˙ . En consecuencia, el momento angular de la partı́cula de masa reducida µ, ~l = ~r × µ~r˙ ,
es una constante de movimiento.
Para pasar al formalismo hamiltoniano, evaluemos los momentos canónicos conju-
gados de ~r y R: ~

∂L ∂L ~˙
p=
~ = µ~r˙ ; P~ = = MR (5.7)
∂~r˙ ˙
~
∂R
Entonces el hamiltoniano del sistema será:
P~2 p~2
H= + + V (r) (5.8)
2M 2µ
H es una constante de movimiento, ası́ como por separado lo son la energı́a del
centro de masa y la de la partı́cula de masa reducida.

Sistema de coordenadas de centro de masa. Es un sistema de coordenadas


con origen colocado en el centro de masa. Las fórmulas de transformación son (véase la
figura 5.1):
m2 m2
~r1c = (~r1 − ~r2 ) = − ~r
M m1
(5.9)
m1 m1
~r2c = (~r2 − ~r1 ) = ~r
M M
Además se cumple que:
m1~r1c + m2~r2c = 0 ; ~r2c − ~r1c = ~r (5.10)
No existen fórmulas que expresen a ~r1 , ~r2 en función de ~r1c y ~r2c .
Movimiento de dos partı́culas que interactúan ... / 127

La energı́a total de las dos partı́culas en el sistema de referencia del centro de masa
es:
1 2 1 2 1 2
Ec = m1~r˙ 1c + m2~r˙ 2c + V (r) = µ~r˙ + V (r) (5.11)
2 2 2
y el momento angular respecto al centro de masa:
   
~ c = ~r1c × m1~r˙ 1c + ~r2c × m2~r˙ 2c = µ~r × ~r˙
L (5.12)

1
r1c

r2c
r1
2
R

r2

Figura 5.1 Sistema de coordenadas de centro de masa para dos partı́culas

Se ve que la energı́a total en el sistema del centro de masa coincide con la energı́a total
de la partı́cula de masa reducida, y el movimiento angular total coincide con el momento
angular de la partı́cula de masa reducida.
El momento angular total en el sistema de referencia del laboratorio es:
 
~ = ~r1 × m1~r˙ 1 + ~r2 × (m2~r˙ 2 ) = M R
L ~˙ + µ~r × ~r˙
~ ×R (5.13)

vemos que es igual al momento angular del centro de masa más el momento angular
respecto al sistema de referencia del centro de masa. Finalmente podemos afirmar que
los aspectos no triviales del problema están en el movimiento de la partı́cula de masa
reducida.

Ecuaciones de Lagrange para las coordenadas relativas. Tomemos un sis-


tema de coordenadas esféricas para ubicar la partı́cula de masa reducida µ (véase figura
128 / Mecánica clásica avanzada

êϕ êΦ

êr

Θ
y

ϕ
êΦ

Figura 5.2 Posición ~r de la partı́cula µ en coordenadas esféricas

5.2). No hay ninguna razón fı́sica para suponer dónde está el origen de ese sistema de
coordenadas. Si queremos podemos colocarlo en el centro de masa o, como se propuso
antes, en la posición de la partı́cula 1. Las componentes de ~r y ~r˙ es conveniente expre-
sarlas en coordenadas esféricas; esto es simple mediante las fórmulas de transformación
entre vectores unitarios:

êr = senθ cos φ î + senθ senφ ĵ + cos θ k̂

êθ = −senφ î + cos φ ĵ (5.14)

êφ = senθ k̂ − cos θ (cos φ î + senφ ĵ)

y las fórmulas inversas:

î = senθ cos φ êr − senφ êθ − cos θ cos φ êφ

ĵ = senθ senφ êr + cos φ êθ − cos θ senφ êθ (5.15)

k̂ = cos θ êr + senθ êφ

éstos son dos conjuntos ortonormales de vectores de base (véase figura 5.2). Entonces ~r
y ~r˙ tienen las siguientes expresiones:

~r = rêr ; ~r˙ = ṙêr − rθ̇êφ + r senθ φ̇êθ (5.16)


Movimiento de dos partı́culas que interactúan ... / 129

El lagrangiano en coordenadas esféricas es:


1  
L = µ r2 + r2 θ̇2 + r2 sen2 θ φ̇2 − V (r) (5.17)
2
donde hemos suprimido la parte correspondiente al centro de masa. La coordenada φ es
cı́clica y por ello su momento canónico conjugado pφ es una constante de movimiento:
∂L
pφ = = µr2 sen2 θ φ̇ = constante (5.18)
∂ φ̇
Debido a la simetrı́a de rotación del lagrangiano, todas las componentes del mo-
mento angular son constantes de movimiento. Las componentes esféricas, o sea, a lo
largo de los vectores unitarios êr , êθ , êφ , son:
lr = 0 , lθ = µr2 θ̇ , lφ = µr2 senθ φ̇ (5.19)
en tanto que las componentes cartesianas son:
lx = −µr2 (θ̇senφ + φ̇ senθ cos θ cos φ)

ly = µr2 (θ̇ cos φ − φ̇ senθ cos θ senφ) (5.20)

lz = µr2 sen2 θ φ̇
Los otros momentos canónicos conjugados son:
∂L ∂L
pr = = µṙ ; pθ = = µr2 θ̇ (5.21)
∂ ṙ ∂ θ̇
pr y pθ no son constantes de movimiento. Podemos expresar las componentes de ~l,
(5.19) y (5.20), en función de los momentos canónicos:
pφ p2φ
lθ = pθ ; lφ = ; l2 = p2θ + (5.22)
senθ sen2 θ
lx = −pθ senφ − pφ cot θ cos φ

ly = −pθ cos φ − pφ cot θ senφ (5.23)

lz = pφ

Nótese la similitud de (5.23) con las correspondientes expresiones cuántico-mecáni-


cas, y aun con las componentes l± = lx ± ily :
l+ = (ipθ − pφ cot θ)eiφ ; l− = (−ipθ − pφ cot θ)e−iφ (5.24)
En coordenadas esféricas la constante de movimiento pφ , el momento canónico
conjugado a φ, coincide con la componente Z del momento angular. lθ y lφ no son
constantes de movimiento, pero sı́ lx , ly y lz , como también:
p2φ
lr = 0 ; lz = pφ ; l2 = p2θ + = µ2 r4 (θ̇2 + sen2 θφ̇2 ) (5.25)
sen2 θ
130 / Mecánica clásica avanzada

de lo anterior se sigue que existe un valor mı́nimo de θ dado por:



senθmin = ; θmax = π − θmin (5.26)
l
Como ~l es constante, tenemos que los vectores ~r y ~r˙ siempre permanecerán en un
plano perpendicular a ~l, o sea que cuando las fuerzas son centrales la partı́cula de masa
reducida permanece siempre sobre un plano; las órbitas son planas. θmin y θmax son
los ángulos de máximo y mı́nimo acercamiento de la partı́cula al eje Z respectivamente,
donde θ̇ cambia de signo.
Comparando la expresión (5.25) para ~l 2 , con (5.17), obtenemos:
1 l2
L= µṙ + − V (r) (5.27)
2 2µr2
En esta forma se nota la completa simetrı́a esférica del lagrangiano, ya que sólo
depende de r pues ~l es una constante. El hamiltoniano es:
p2r l2
H= + + V (r) (5.28)
2µ 2µr2
En esta expresión para H podemos tomar ventaja del hecho de depender sólo de
la parte radial: H describe el movimiento unidimensional equivalente de una partı́cula
de masa µ en un potencial efectivo:
l2
Vef (r) = + V (r) (5.29)
2µr2
La segunda ley de Kepler. Podemos definir las coordenadas de manera que
desaparezca del problema uno de los ángulos. Si tomamos el eje Z de modo que coincida
con la dirección de ~l, que es constante, entonces el movimiento permanecerá siempre
sobre el plano X − Y : θ = π/2 = constante; θ̇ = 0, con lo cual la magnitud del momento
toma la forma:
l = pφ = µr2 φ̇ = constante (5.30)
En el plano de la órbita, el área barrida por el radio vector en un tiempo dt es
dA = (1/2)r2 dφ, siendo dφ el ángulo que gira el radio vector en el tiempo dt. Entonces,
1 2 l
Ȧ = r φ̇ = = constante (5.31)
2 2µ
Nos dice que la velocidad areolar es constante para cualquier movimiento bajo
fuerzas centrales (segunda ley de Kepler, descubierta empı́ricamente en 1609 en obser-
vaciones planetarias. La primera y la tercera leyes de Kepler valen sólo para potenciales
de la forma 1/r).

El problema unidimensional equivalente. Del lagrangiano (5.27) se sigue la


ecuación de movimiento:
 
d l2 d
µr̈ = − V + = − Vef = fc + f (5.32)
dr 2µr2 dr
Movimiento de dos partı́culas que interactúan ... / 131

donde f es la fuerza derivable de V y fc es la llamada fuerza centrı́fuga, derivada


del potencial centrı́fugo l2 /(µr2 ). La ecuación radial (5.32) supone un observador fijo
respecto a la dirección del radio; como el radio vector gira, para este observador aparece
una fuerza inercial que es precisamente fc . Como el hamiltoniano (5.28) es una constante
de movimiento, la energı́a total en el centro de masa, que llamaremos E, proporciona
una ecuación diferencial para r que puede integrarse por cuadratura:
Z r
dr
t − t0 =  1/2 (5.33)
r0 2 l2
(E − V ) − 2 2
µ µ r
de (5.33) en principio puede obtenerse a r en función del tiempo, para cada conjunto de
valores de t0 , r0 , µ, E y l. Es de interés encontrar a r en función de φ, o sea, hallar la
ecuación de la órbita en coordenadas polares en el plano de la misma. De (5.30) podemos
notar que:
l dr
ṙ = (5.34)
µr2 dφ
de donde:
Z r
l dr
φ − φ0 = (5.35)
r0 r2  
l2
1/2
2µ E − V −
2µr2
De manera similar puede hallarse a φ(t) si se conoce a r(t):
Z r
l dt
φ − φ0 = 2
(5.36)
r0 µ r (t)

Las fórmulas (5.34) y (5.35), recordemos, valen si se eligen las coordenadas de modo
que el eje z coincide con la dirección de ~l. Para una elección general de las coordenadas,
las expresiones para hallar la ecuación de la órbita y la dependencia temporal de θ
y φ resultan más complicadas: estas fórmulas las consideramos más adelante usando
el formalismo de Hamilton-Jacobi. La fórmula (5.33) no depende de la elección de las
coordenadas.
Hallemos ahora la llamada ecuación diferencial de la órbita. Es una ecuación dife-
rencial para r en función de φ. Se halla a partir de (5.34) y de:
l dυ l2 2 d2 υ 1
ṙ = − ; r̈ = − υ ; donde υ = (5.37)
µ dφ µ2 dφ2 r
Con la ayuda de (5.37), la ecuación (5.32) se transforma en la ecuación diferencial
de la órbita:
d2 υ µ F (υ)
=− 2 2 , (5.38)
dφ2 l υ
donde F (υ) = f (1/υ). Esta ecuación permite, dada f (r) hallar a r(φ), y dada r(φ) hallar
a f (r).
132 / Mecánica clásica avanzada

Coordenadas de retorno. Son los valores de las coordenadas en que la respectiva


velocidad se anula, o sea, que cambia de signo. Los puntos de retorno en r son aquellos
para los cuales ṙ = 0, o sea, los que satisfacen la ecuación algebraica:
l2
+ V (r) − E = 0 (5.39)
2µr2
En estos puntos la velocidad no es cero pues θ̇ y φ̇ no se anulan necesariamente. Si
ocurre que ṙ se anula solo cuando r es finito y que el movimiento es acotado o ligado,
habrá un punto de máximo acercamiento y uno de máximo alejamiento de la partı́cula al
centro de fuerza. Si ṙ = 0 en un punto r → ∞, el movimiento es no ligado; éste es el caso
de los procesos de colisiones o de dispersión. Los puntos de retorno en θ son aquellos en
que θ̇ = 0, o sea pθ = 0; en esos puntos θ vale θmax o θmin , ecuación (5.26). La ecuación
(5.26) nos dice que no existen valores de φ en los cuales φ̇ = 0; no hay puntos de retorno
en φ.
Si r tiene dos lı́mites, rmin y rmax , el movimiento es ligado y la órbita está contenida
dentro de una corona limitada por las circunferencias r = rmin y r = rmax . La órbita
puede o no ser cerrada; en general no lo será. Para los potenciales de la forma 1/r o r2
las órbitas son cerradas y pueden ser no circulares (son elı́pticas1 ).
Para precisar, consideremos un oscilador bidimensional armónico en el plano de
la órbita; este se obtiene tomando fuerzas restauradoras lineales perpendiculares de la
forma fx = −kX x y fy = −kY y donde kX y kY son las “constantes de resorte”.2 La
dependencia temporal de x y y es:
x(t) = Ax sen(ωX t + φX ) ; y(t) = Ay sen(ωY t + φY ) (5.40)
Eliminando t obtenemos la ecuación de la órbita en coordenadas cartesianas.
Cuando ωX es un múltiplo racional de ωY la órbita es una figura de Lissajous.
Si ωX = ωY , la figura es una elipse; si ωX y ωY difieren ligeramente, la elipse
aparece como si estuviera sometida a un movimiento de precesión (véase figura 5.3).
∆α es el ángulo que se desplaza el semieje mayor cuando la variación temporal de r
ha completado un perı́odo completo. La trayectoria será cerrada si después de cierto
número de ciclos completos de variación r la trayectoria se repite; o sea si al transcurrir
n perı́odos de variación de r, el radio a partir del cual la órbita se repite ha dado un
número m de vueltas completas, es decir, si:
n∆α = m2π (5.41)
Si la condición (5.41) no se cumple, entonces la trayectoria no es cerrada y cuando
t → ∞ llena toda la corona. Otra forma de obtener este resultado es la siguiente. El
movimiento en r tiene una frecuencia νr y el movimiento angular tiene una frecuencia
να . La órbita será cerrada sólo si νr y να son conmensurables.
~rmax y ~rmin se llaman vectores absidales. La órbita siempre es simétrica por refle-
xión en los vectores absidales, o sea que con sólo conocer la porción de órbita compren-
dida entre dos ~rmax y ~rmin consecutivos es posible por reflexión construir toda la órbita.
Esto se puede obtener fácilmente analizando la ecuación diferencial de la órbita.
1 Para otros potenciales pueden haber órbitas cerradas no circulares pero sólo accidentalmente, es

decir, para valores muy bien determinados de l y E.


2 Cuando k
X 6= kY la fuerza es no central. Esto no es esencial, pues aun con fuerzas centrales puede
presentarse la precesión de las órbitas.
Movimiento de dos partı́culas que interactúan ... / 133

∆α
rmáx

rmín

Figura 5.3 Órbitas de un oscilador armónico bidimensional

Ejemplo 5.1.1 Hallar la velocidad angular de precesión de la órbita de una partı́cula


sometida a fuerzas restauradoras lineales con kX ≈ kY .

Se cumple que ωX ≈ ωY . En (5.40) tomamos φX = φY = 0 y llamamos ∆ω a


ωY − ωX . Para hallar la ecuación de la órbita notemos que, al primer orden en ∆ω t:

y = AY cos ωY t = AY (cos ωX t − ∆ωt senωX t) (5.42)

de este modo la ecuación de la órbita es, al primer orden en ∆ω t:

x2 y2 xy
2
+ 2 +2 ∆ω t = 1 (5.43)
Ax Ay Ax Ay

que es la ecuación de una elipse con el eje mayor rotado. La ecuación (5.43) puede
escribirse como una forma cuadrática no diagonal:
  
A2y Ax Ay ∆ω t x
(x, y)    = A2x A2y (5.44)
2 y
Ax Ay ∆ω t Ax

Para llevar (5.43) a la forma estándar de la ecuación de la elipse, realicemos una


rotación de los ejes coordenados por cierto ángulo δ:
    ′ 
x cos δ −senδ x
 =   (5.45)

y senδ cos δ y
134 / Mecánica clásica avanzada

Luego, la matriz de la forma cuadrática será diagonal si:


2Ax Ay
tan 2δ = ∆ω t (5.46)
A2x − A2y

Si t es el tiempo que tarda r en completar un perı́odo en este problema de fuerza


no central, entonces, al primer orden en ∆ωt, la velocidad angular de precesión de la
órbita es:
Ax Ay
δ̇ ≈ (ωy − ωx ) (5.47)
A2x − A2y

si AX no es del orden de AY (órbitas muy excéntricas).

Ejemplo 5.1.2 Hallar para qué valores del momento angular es posible que sea acotado
el movimiento en presencia del potencial:

A l2
V (r) = − e−αr (5.48)
r 2µr2

La energı́a potencial efectiva es:


A l2
Vef (r) = − e−αr + (5.49)
r 2µr2
Vemos que Vef → +0 para r → ∞, y Vef → +∞ para r → 0. La figura 5.4 muestra
la forma de Vef . Hay posibilidad de movimiento acotado sólo si Vef tiene un mı́nimo, o

sea si la ecuación Vef = 0 tiene solución, esto es:

Aα −αr Ae−αr l2
e + − =0 (5.50)
r r2 µr3
Si llamamos x = αr, entonces (5.50) se puede llevar a la forma:

αl2
(x2 + x)e−x = (5.51)
µA
Hay solución solamente si la curva f (x) = (x2 + x)e−x corta a la recta αl2 /(µA)
(véase figura 5.5), esto es, si:

αl2
f (x0 ) > (5.52)
µA
donde x0 es la posición en la cual f (x) tiene un máximo. f ′ (x) = 0 si:

x2 − x − 1 = 0 (5.53)

La única solución aceptable de (5.53) es:



1+ 5
x0 = ≈ 1,618 (5.54)
2
Movimiento de dos partı́culas que interactúan ... / 135

Vef
l2
2µr2

E
1/α
r

–Ae–αr/r

Figura 5.4 Energı́a potencial efectiva Vef componente de los potenciales centrı́fugo y de
Yukawa

Entonces:
 √  1+√5
f (x0 ) = 2 + 5 e− 2 ≈ 0,84 (5.55)


Hay solución a Vef (r) = 0 sólo si:

αl2
0, 84 > (5.56)
µA

Si (5.48) se usa para describir la interacción nuclear, por ejemplo entre un neutrón
y un protón, habrá resonancias, o sea estados ligados de energı́a positiva, si se cumple la
condición (5.56). El momento angular l = 0 presenta estados ligados pero no resonancias.
Puede haber resonancias sólo si:
µA
0, 84 > h̄2 (5.57)
α
La barrera que se forma en Vef se llama “barrera centrı́fuga”. Se entiende por
resonancia (“de forma”) el efecto túnel que se produce cuando la partı́cula viene desde
r → ∞ y atraviesa la barrera quedando atrapada por el pozo de potencial durante cierto
tiempo. Este proceso no es clásicamente posible.
136 / Mecánica clásica avanzada

αl 2
µA

f(x)

x0

Figura 5.5 Solución f (x) al potencial efectivo

5.2. El oscilador armónico tridimensional


Es el problema del movimiento de la partı́cula de masa reducida en presencia de
la interacción central:
f~(r) = −kr êr (5.58)
Solución en coordenadas cartesianas. Tomando coordenadas cartesianas en el
plano de la órbita, la solución al oscilador armónico bidimensional es (5.40). La ecuación
de la órbita es:
x2 y2 2xy
+ − cos δ = sen2 δ ; δ = φy − φx (5.59)
A2x A2y Ax Ay

La ecuación (5.59) es la forma cuadrática bidimensional de la forma ~r · M̃~r = sen2 δ,


donde M̃ es la matriz:
 
a − cos δ
M̃ = A−1x Ay
−1   ; a = Ay (5.60)
Ax
−cosδ a−1

Realizando una rotación de coordenadas es posible diagonalizar a M̃ . Sea la rota-


ción ~r = R̃~r ′ , entonces:
~r ′ · R̃T M̃ R̃~r ′ = sen2 δ (5.61)
Movimiento de dos partı́culas que interactúan ... / 137

La matriz R̃ es ortogonal, R̃R̃T = I˜ y diagonaliza a M̃ si es de la forma:


 
cos α −senα
2 cos δ
R̃ =  ; tan 2α = −1 (5.62)
senα cos α a −a

R̃T es la transpuesta de R̃.


Por simplicidad tomaremos Ay = Ax (a = 1). Entonces α y M̃ diagonalizada son:
 
1 − cos δ 0
π 1  
α = (cos δ > 0) ; M̃ = 2 (5.63)
4 A
0 1 + cos δ

La ecuación de la órbita (5.60) se torna la estándar de la elipse, con semiejes mayor


a y menor b, y excentricidad ǫ:
r r
δ δ b2 2 cos δ
b = A sen ; a = A cos ; ǫ= 1− 2 = (5.64)
2 2 a 1 + cos δ
δ está relacionado con el momento angular y A con la energı́a total:

E
l=− senδ ; E = µA2 ω 2 (5.65)
ω
Entonces la excentricidad y el semieje mayor tienen la siguiente expresión en térmi-
nos de E y l:
s
kl2  s 
2 1− 2
µE 1E  2
kl 
E2 = s ; a2 = 1+ 1− 2
(5.66)
kl 2 2 k µE
1+
µE

Solución en coordenadas polares. En vez de hacer la transformación de coor-


denadas, usaremos las fórmulas halladas en el numeral anterior, cuando se toma el eje
Z perpendicular al plano de la órbita. De la ecuación (5.35) se sigue:
Z r
l dr
φ − φ0 = √ s (5.67)
2µ r0 1 l2
r2 E − kr2 −
2 2µr2

Haciendo la sustitución ρ = r2 , (5.67) toma la forma:


Z r2
l dρ
φ − φ0 = √ s (5.68)
2 µk r02 2E l2
ρ −ρ2 + ρ−
k µk
138 / Mecánica clásica avanzada

La integral se halla en tablas de integrales. El resultado es:


  r2
2
 2Eρ 2l 
 1 −
l  k µk  

φ − φ0 = √  sen−1 s  (5.69)
2 µk  l 4E 2 4l2 

µk ρ −
k2 µk 2
r0

Entonces llegamos a:
B2
r2 = (5.70)
1 − e sen2(φ − φ0 + β0 )
donde B, e y β0 son:
s s l2
r02 −
l2 kl2 µk
B= ; e= 1− ; 2β0 = arcsen (5.71)
µE µE 2 r02 e
La ecuación de la elipse centrada y no rotada en coordenadas polares es:
b2
r2 = (5.72)
1 − cos2 φ
ǫ2
Si se rota 45◦ toma la forma:
b2 b2 /(1 − ǫ2 /2)
r2 = = (5.73)
φ ǫ2
1 − ǫ2 cos2 (φ − ) 1− sen2φ
4 2 − ǫ2
Las ecuaciones (5.70) y (5.73) coinciden si:
b2 ǫ2
β0 = φ0 ; B2 = 2 ; e= (5.74)
ǫ 2 − ǫ2
1−
2
Las ecuaciones (5.71) y (5.74) conducen a los valores hallados en (5.66) para los paráme-
tros de la elipse en función de las constantes de movimiento. La órbita es una elipse y
el centro de la misma coincide con el centro de fuerza.

Cálculo de la variación temporal del radio. Para hacer este cálculo usamos
la ecuación (5.33):
Z r
dr
t − t0 = s   (5.75)
r0 2 1 2 l2
E − kr − 2 2
µ 2 µ r

Los puntos de retorno se hallan resolviendo la ecuación (5.39):


s !
E kl 2 E
2
rmax, min = 1± 1− = (1 ± e) (5.76)
k µE 2 k
Movimiento de dos partı́culas que interactúan ... / 139

Vemos que:

l l
rmax = a = p ; rmin = b = p (5.77)
µE(1 − e) µE(1 + e)

Esto nos permite escribir la expresión bajo el signo de raı́z cuadrada en (5.75)
como:
r Z r
µ rdr
t − t0 = p (5.78)
k r0 (a − r2 )(r2 − b2 )
2

Haciendo el cambio de variable p = r−2 , llegamos a:


r Z r −2
1 µ dρ
t − t0 = p (5.79)
2 k r0−2 ρ (a ρ − 1)(1 − b2 ρ)
2

La solución a esta integral se encuentra en tablas. El resultado es:

r r−2
1 µ (a2 + b2 )ρ − 2 0
t = t0 = arcsen (5.80)
2 k ρ(a2 − b2 ) r−2

Incluyendo en t0 la parte que depende de r0 llegamos a:

a2 + b 2 a2 − b 2 E
r2 = + sen2ω(t − t0 ) = [1 + e sen2ω(t − t0 )] (5.81)
2 2 k
l no puede ser arbitrario, está restringido al rango:

E
0≤l≤ (5.82)
ω
La ecuación (5.82) corresponde al comportamiento cuántico, haciendo la corres-
pondencia con los números cuánticos l → lh̄ y E = nh̄ω, donde los valores permitidos
del número cuántico orbital l son: 0 ≤ l ≤ n; o sea l = 0, 1, 2, ...n.
Cuando l = E/ω, e =p 0 y ǫ = 0, la órbita es circular pues según (5.81) el radio de
la órbita es constante: r = E/k.
Cuando l = 0, e = 1 y ǫ = 1, la órbita es rectilı́nea. Según (5.81) la variación
temporal del radio será de forma pendular, con frecuencia ω y no 2ω como cuando
e 6= 1:
r
2E π
r= cos ω(t − t0 − ) (5.83)
k 4ω

Para hallar a r(t) a partir de (5.81) se requiere realizar una expansión en serie infi-
nita. Para l 6= 0 y diferente de un máximo valor, r(t) contiene la frecuencia fundamental
2ω y todos sus armónicos.
140 / Mecánica clásica avanzada

5.3. El potencial 1/r


Se trata de estudiar el movimiento de la partı́cula de masa reducida bajo la fuerza:
k
f~(r) = − 2 êr (5.84)
r
Este problema es separable en coordenadas esféricas, en coordenadas parabólicas
y tal vez en otras coordenadas. La solución en coordenadas parabólicas la hallaremos
posteriormente con el formalismo de Hamilton-Jacobi. Aquı́ resolveremos el problema
en coordenadas esféricas.

La ecuación de la órbita. Es cómodo usar la ecuación diferencial de la órbita


(5.38). La solución es simple; el resultado es:
l2 /µk
= 1 + ǫ cos(φ − φ0 ) (5.85)
r
donde ǫ y φ0 son las dos constantes de integración. Vemos que rmin ocurre cuando
φ = φ0 si k es positiva, o sea que en ese caso φ0 determina la dirección del vector rmin .
La órbita será simétrica respecto a la lı́nea φ = φ0 . Relacionemos a ǫ con las constantes
de movimiento E y l. Los puntos de retorno rmin y rmax ocurren cuando ṙ = 0 en:
1 2 l2 k
E= µṙ + − (5.86)
2 2µr2 r
O sea que:
s !
k 2El2
rmin, max =− 1± 1+ (5.87)
2E µk 2

Cuál de los signos corresponde a rmin o rmax depende del signo de k y del signo
de E.3 Si rmax es finito, el movimiento será ligado.
Por otra parte, de (5.85) vemos que:
l2 /µk
rmin, max = (5.88)
1±ǫ
Comparando a (5.88) con (5.87) hallamos que:
s
2El2
ǫ= 1+ (5.89)
µk 2

El signo de ǫ lo hemos tomado positivo. La ecuación (5.85) representa una sección


cónica.

Las secciones cónicas. Son las curvas que definen la intersección de un cono con
un plano. Sobre el plano una curva cónica es el lugar geométrico de los puntos cuya
3 En estos puntos cambia el signo de la velocidad radial. Además, para E ≥ 0, según veremos, sólo
existe un punto de retorno.
Movimiento de dos partı́culas que interactúan ... / 141

distancia a un punto dado llamado foco es proporcional a la distancia a una lı́nea dada,
la directriz. Si tomamos el origen del sistema de coordenadas polares en el foco y S es
la distancia del foco a la directriz (véase figura 5.6), se sigue de la definición, llamando
ǫ a la constante de proporcionalidad:
r = ǫ [S − r cos (φ − φ0 )] (5.90)

• Directriz

φ
φ0

x
Foco

Figura 5.6 Elementos de las secciones cónicas

ǫ debe ser positivo por ser la relación entre dos distancias. Se sigue de (5.90):
ǫS
= 1 + ǫ cos (φ − φ0 ) , ǫ>0 (5.91)
r
La curva es simétrica respecto a la lı́nea φ = φ0 . La longitud ǫS se llama parámetro
de la sección cónica y ǫ se llama excentricidad. Hay distintos tipos de secciones cónicas
dependiendo del valor de ǫ.
Si ǫ = 1, se obtiene la parábola, es decir, el lugar geométrico de los puntos equi-
distantes del foco y de la directriz. El punto de máximo acercamiento al foco se llama
vértice y está situado a una distancia S/2, en tanto que la máxima distancia es infinita:
1
rmin = S; rmax = ∞; ǫ = 1 (5.92)
2
Si ǫ < 1, se obtiene una elipse: curva con dos directrices y dos focos. Hay en este
caso dos distancias absidales finitas:
ǫS ǫS
rmin = ; rmax = ; ǫ<1 (5.93)
1+ǫ 1−ǫ
El promedio entre rmax y rmin lo llamaremos a, de modo que:
1 − ǫ2
S=a ; ǫS = a(1 − ǫ2 ) (5.94)
ǫ
142 / Mecánica clásica avanzada

La ecuación de una elipse en coordenadas polares con foco en el origen es:

a(1 − ǫ2 )
r= (5.95)
1 + ǫ cos (φ − φ0 )

La ecuación de una elipse en coordenadas polares con centro en el origen es (5.72).


Las directrices
√ están a distancias a/ǫ del centro (véase figura 5.8). Los semiejes son a y
b = a 1 − ǫ2 .

ε=1
S/2

S )φ0
F

Figura 5.7 Sección cónica: la parábola

D2
S
ε<1

D1 εS ) φ0

εa F2
S
F1

a /ε

Figura 5.8 Sección cónica: la elipse

Si ǫ > 1, la cónica es una hipérbola: curva de dos ramas con sus correspondientes
focos, directrices y ası́ntotas. De la definición (5.90) se sigue la siguiente ecuación para
la rama 2, respecto al origen de coordenadas mostrado, la cual es consistente con (5.85)
Movimiento de dos partı́culas que interactúan ... / 143

2 ε<1
D2
εS
D1 )φ0
F2
a S

a/ε

1 F1

Figura 5.9 Sección cónica: la hipérbola

cuando k > 0 y φ0 se sustituye por φ0 + π:


ǫ
= −1 − ǫ cos (φ − φ0 ) ; rama 1 (k < 0)
r
(5.96)
ǫ
= 1 − ǫ cos (φ − φ0 ) ; rama 2 (k > 0)
r
Cuando φ − φ0 = π, r toma el valor rmin :
(1) ǫS (2) ǫS (2) (1)
rmin = ; rmin = ; rmin = rmin − 2a (5.97)
ǫ−1 1+ǫ
(2) (1)
cuando cos(φ − φ0 ) = 1/ǫ, r = rmax = ∞ y cuando cos(φ − φ0 ) = −1/ǫ, r = rmax = ∞.
Si llamamos la distancia entre los vértices 2a, también se cumple que rmin = a(ǫ − 1).
Las directrices están a distancias a/ǫ del centro. El parámetro S en función de a vale:
ǫ2 − 1
S= a (5.98)
ǫ
r → ∞ cuando 1 − ǫ cos (φ − φ0 ) = 0, sobre la rama 2. Entonces el ángulo entre las dos
ası́ntotas vale:
2 cos−1 ǫ−1 ; cos−1 ǫ−1 ≤ φ − φ0 ≤ π − cos−1 ǫ−1 (5.99)
Relación entre el signo de k y E, y el tipo de cónica. La excentricidad y el
parámetro están relacionados con la energı́a y el momento angular:
s
l2 2El2
ǫS = ; ǫ= 1+ (5.100)
µ|k| µk 2
Si el potencial es repulsivo, k es negativo. En este caso, sólo es posible que la
energı́a sea positiva, pues de lo contrario rmin serı́a negativo. Entonces ǫ es mayor que
144 / Mecánica clásica avanzada

la unidad y la trayectoria de la partı́cula es hiperbólica, o sea que el movimiento es


no ligado. Esto es consistente con el análisis de la curva de energı́a potencial efectiva
cuando k es negativo: la energı́a potencial no tiene un mı́nimo y el movimiento resulta
no acotado, con sólo un punto de retorno. Es el caso cuando la partı́cula llega desde el
infinito y “rebota” en la barrera de potencial. Este comportamiento incluye también el
caso lı́mite en que la energı́a es cero.
Si el potencial es atractivo, k es positiva. En este caso se presentan tres posibili-
dades. Si E > 0, entonces ǫ > 1 y el movimiento es hiperbólico. No hay lı́mite al valor
máximo que puede tomar l:

0≤l<∞ si E>0 (5.101)

A este caso, y al caso en que k es negativo, corresponden las dos ramas de la


hipérbola: si k es negativo, la partı́cula se mueve sobre la hipérbola correspondiente a
D1 ; si k es positivo y E > 0, se mueve sobre la hipérbola correspondiente a D2 . Si E = 0
entonces ǫ = 1. l se conserva pero no es cero porque el parámetro de impacto es infinito
y en r → ∞ la velocidad es cero:

0≤l<∞ si E=0 (5.102)

El movimiento es no ligado y r → ∞ para dos valores de φ: φ = φ0 ± π.


La trayectoria es parabólica y no tiene ası́ntotas (serı́an las rectas y = ±∞). De
(5.92) se sigue que:

1 l2
rmin = S= ⇒ l 6= 0 (5.103)
2 2µk
Este caso se presenta cuando la partı́cula parte del reposo desde el infinito.
Si E < 0, entonces ǫ < 1. En este caso:
s
2|E|l2
ǫ= 1− <1 (5.104)
µk 2

Es claro que el rango de valores posibles de l es finito:


r
µ
0≤l≤ k (5.105)
2|E|
Esto es análogo al comportamiento del número cuántico orbital en el átomo de
hidrógeno: l = 0, 1, ...n − 1.
ǫ cos (φ − φ0 ) nunca vale uno y por eso r nunca es infinito: el movimiento es ligado.
En este caso:
k k
rmin, max = (1 ∓ ǫ) ; a= (5.106)
2|E| 2|E|
Si ǫ = 0 siendo E < 0 entonces la trayectoria es circular con radio:
l2 k
r= = =a (5.107)
µk 2|E|
Movimiento de dos partı́culas que interactúan ... / 145

Como r es constante, se sigue de (5.31) que φ̇ también es constante.


Si ǫ = 1, entonces l = 0 y la trayectoria es la lı́nea recta φ = φ0 . En este caso:

rmin = 0 ; rmax = a (5.108)

Para ǫ < 1 la trayectoria es una elipse rotada en un ángulo φ0 y con semiejes mayor
y menor dados por:
k p l
a= ; b=a 1 − ǫ2 = p (5.109)
2|E| 2µ|E|
respectivamente. Vemos que b está comprendido, dependiendo de l, entre:

0≤b≤a (5.110)

El hecho de que las trayectorias sean elı́pticas es consecuencia de la primera ley de


Kepler (cuando k = GM m).
Las figuras desde 5.10 hasta 5.13 muestran las curvas de energı́a potencial efectiva para
cada uno de los casos. Del análisis de las mismas se obtiene cualitativamente el compor-
tamiento descrito.

Vef

r mín k<0 r

Figura 5.10 Energı́a potencial efectiva. Trayectoria hiperbólica.

La tercera ley de Kepler. El área de la elipse es:


s
p kl 2 l
2
A = πab = πa 1 − ǫ2 = π = πa2 (5.111)
4|E| µ|E| lmax

Recordando la ecuación (5.31) para la velocidad areolar, obtenemos que:


r
A πk p µ 3/2
τ= = 2
−2µE = 2π a (5.112)
Ȧ 2E k
146 / Mecánica clásica avanzada

Vef

r mín r

k > 0, E > 0

Figura 5.11 Energı́a potencial efectiva. Trayectoria hiperbólica.

Vef

E
rmín r

k > 0, E = 0

Figura 5.12 Energı́a potencial. Trayectoria parabólica.

Vemos que el perı́odo del movimiento no depende del valor de l.


Para la interacción gravitacional entre un planeta (masa m) y el Sol (masa M ),
(5.112) toma la forma:
s
1
τ = 2π a3/2 (5.113)
G(m + M )

Como para los planetas del sistema solar m ≪ M , se sigue que τ ∝ a3/2 , que es el
contenido de la tercera ley de Kepler, la cual como se ve, es un resultado aproximado.
Movimiento de dos partı́culas que interactúan ... / 147

Vef l = l máx l l=0


·

r mín r máx k > 0, E < 0 E

Figura 5.13 Energı́a potencial efectiva. Trayectoria elı́ptica.

La ecuación de Kepler. Encontrar a r(t) es interesante en muchos casos, por


ejemplo para predecir el movimiento de un satélite. Para hallar a r(t) debemos usar
la ecuación (5.33). Por simplicidad, consideraremos sólo el caso k > 0, E < 0. Es
conveniente expresar a E y l en términos de a y ǫ:
k p p
E=− ; l = µka 1 − ǫ2 (5.114)
2a
Entonces (5.33) toma la forma:
r Z
µa r rdr
t − t0 = p (5.115)
k r0 −r + 2ar − (1 − ǫ2 )a2
2

Usando la expresión para τ , ecuación (5.112), obtenemos:


Z r
τ r dr
t − t0 = p (5.116)
2πa r0 −r2 + 2ar − (1 − ǫ2 )a2
La solución a esta integral se encuentra en tablas. El resultado es:
2πa 1p 2 r−a
(t + δ) = − −r + 2ar − (1 − ǫ2 )a2 + arcsen (5.117)
τ a ǫa
donde δ es una constante arbitraria.
Definamos las siguientes variables:
2π a−r
M= (t + δ) ; ψ = cos−1 (5.118)
τ ǫa
Las cantidades M , ψ y φ reciben los siguientes nombres en astronomı́a: M , ano-
malı́a media; ψ, anomalı́a excéntrica y φ, anomalı́a verdadera (véase figura 5.14).
De simples argumentos geométricos se sigue a partir de las fórmulas de la elipse
que ψ y M tienen la siguiente interpretación geométrica:
148 / Mecánica clásica avanzada

y
R

P
M r
ψ φ x

Figura 5.14 Variables de la ecuación de Kepler.

ψ es el ángulo del vector de posición del punto Q, tomando como origen el centro
de la elipse. R es un punto que gira uniformemente sobre una circunferencia de radio a,
con velocidad angular 2π/τ . φ y M sirven para describir la posición del punto p (véase el
texto de Marion, Classical dynamics of particles and systems, segunda edición, sección
8,8). Expresando a (5.117) en función de (5.118) obtenemos:

r = (1 − ǫ cos ψ)a ; M = ψ − ǫsenψ (5.119)

En (5.119) hemos adicionado a M la constante π/2. La ecuación que relaciona a


ψ con M se denomina la ecuación de Kepler, y permite expresar a r en función del
tiempo. ψ es una función trascendental de M . Bessel halló en 1830 la solución exacta de
la ecuación de Kepler en forma de serie de Fourier. El resultado es:

X sen(nM )
ψ =M +2 Jn (nǫ) (5.120)
n=1
n

donde Jn son las funciones de Bessel de orden entero. Entonces la expresión para r(t)
es:
( "
r(t) = a 1 − ǫ cos 2πν(t + δ)+


#)
X sen{2πnν(t + δ)}
2 Jn (nǫ) (5.121)
n=1
n

Ejemplo 5.3.1 Demostrar la solución (5.120) de la ecuación de Kepler.


Movimiento de dos partı́culas que interactúan ... / 149

ψ es una función impar de M , luego su expansión de Fourier contendrá sólo funciones


seno y además contiene una componente no oscilante que será M misma. Entonces
busquemos soluciones de la forma:

X
ψ=M+ Cn sen(nM ) (5.122)
n=1

La expansión de Fourier de la función ǫ senψ = f (M ) tiene coeficientes dados por:


Z
2 π
Cn = f (M ) sen(nM ) dM (5.123)
π 0
Utilizando la ecuación de Kepler, el integrando en (5.123) será:
Z
2ǫ π
Cn = senψ sen[n(ψ − ǫ senψ)](1 − ǫ cos ψ)dψ (5.124)
π 0
Efectuando los productos y expresando los productos de funciones seno como suma
de funciones coseno llegamos a:
Z
ǫ πn
Cn = cos[(n − 1)ψ − nǫsenψ] dψ − cos[(n + 1)ψ
π 0
1 (5.125)
−nǫsenψ] dψ − ǫ cos[(n − 2)ψ
2 o
1
−nǫ senψ]dψ + ǫ cos[(n + 2)ψ − nǫsenψ] dψ
2
La función de Bessel entera tiene la siguiente representación integral:
Z
1 π
Jκ (x) = cos (κθ − xsenθ)dθ ; κ : entero (5.126)
π 0
Con lo cual Cn toma la forma:
h
Cn = ǫ Jn−1 (nǫ) − Jn+1 (nǫ)
ǫ ǫ i
− Jn−2 (nǫ) + Jn+2 (nǫ) (5.127)
2 2
Las funciones Jκ tienen la siguiente relación de recurrencia:

Jκ+1 (x) = Jκ (x) − Jκ−1 (x) (5.128)
x
El uso de (5.128) nos permite llegar finalmente a:
2
Cn = Jn (nǫ) (5.129)
n
Con lo cual queda demostrada la expresión (5.120).

Precesión de las órbitas elı́pticas. Vimos que, bajo fuerzas centrales, las órbitas
son simétricas respecto a cualquier ábside, por lo tanto el ángulo entre cualquier par de
lı́neas absidales consecutivas es el mismo. En el problema de Kepler (k > 0, E < 0),
150 / Mecánica clásica avanzada

las órbitas son cerradas, o sea que el ángulo de precesión de los ábsides es cero. En
el movimiento planetario, por ejemplo, hay efectos “perturbadores”, que hacen que el
potencial no sea exactamente de la forma −k/r, aunque lo sea aproximadamente.
Para el movimiento de la luna alrededor de la tierra, además de la interacción
gravitacional entre estos dos cuerpos tomados como masas puntuales, hay efectos adi-
cionales como una fuerza externa no central debida al campo gravitacional homogéneo
producido por el sol sobre la órbita de la luna; esto se traduce en pequeñas oscilaciones
del plano de la órbita. La tierra y la luna no son masas puntuales y por ello la interacción
del tipo −k/r es sólo el primer término en una expansión multipolar, que dependerá de
la distribución de masa de los cuerpos; la parte central de esta interacción dará lugar
a la precesión de la órbita, o sea al giro del semieje mayor de la elipse, y la parte no
central da lugar a movimientos giroscópicos de la tierra y la luna.
En el caso de Mercurio hay efectos de precesión de su órbita debidos al efecto
combinado de todos los demás cuerpos del sistema solar y efectos residuales que sólo son
explicados por la teorı́a general de la relatividad.

Ejemplo 5.3.2 Analizar la precesión de la órbita de una partı́cula que se mueve en pre-
sencia del potencial:

k C C
V =− + 2; ≪1 (5.130)
r 2r ka

γ =2

Figura 5.15 Trayectoria para γ = 2

Tenemos que la fuerza sobre la partı́cula es central, ası́ que ~l es constante. La


ecuación diferencial de la órbita es:
d2 υ µ 1
+ υ = − 2 2 (−kυ 2 + Cυ 3 ) ; υ= (5.131)
dφ2 l υ r
Movimiento de dos partı́culas que interactúan ... / 151

γ =3

Figura 5.16 Trayectoria para γ = 3

La solución de (5.131) es:


r
α γ 2 l2 µC
= 1 + ǫ cos γ(φ − φ0 ) ; α= ; γ= 1+ (5.132)
r µk l2
donde ǫ y φ0 son constantes de integración. φ0 es la dirección del vector absidal rmin y
ǫ se puede expresar en términos de las constantes de movimiento comparando las dos
expresiones para las distancias de retorno.
s !
k 2El2 2 α
rmax, min = − 1± 1+ γ = (5.133)
2E µk 2 1±ǫ

Se sigue entonces que:


s
rmax − rmin 2El2 2 k
E= = 1+ γ ; a=− (5.134)
rmax + rmin µk 2 2E

El efecto del término adicional es variar ligeramente la excentricidad de la órbita e


introducir el factor de γ a φ − φ0 .
Cuando r = rmin , φ = φ0 y cuando r = rmax , φ = φ0 + φ/γ. Entonces el ángulo
entre los vectores absidades γmin y rmax es:
π
φmax − φmin = (5.135)
γ
152 / Mecánica clásica avanzada

γ=5

Figura 5.17 Trayectoria para γ = 5

y no π como cuando C = 0. De esta forma, al cumplir un perı́odo, el vector rmin sufre


un desplazamiento angular dado por:
 
1
∆φ = 2π 1 − (5.136)
γ
Si la partı́cula tarda un tiempo Tr en ir de un valor de rmin al consecutivo, tar-
dará un tiempo mayor en φ dar una vuelta completa. La trayectoria será cerrada sola-
mente si ∆φ es un submúltiplo racional de 2π, o sea, si γ es un número racional, lo cual
ocurrirá sólo accidentalmente. Si r ≥ 1 la órbita es esencialmente una elipse que precesa;
el semieje menor rmin rota 2π(1 − γ −1) por cada ciclo de variación de r. Ver figuras 5.15
a 5.18.

Un ejemplo de aplicación del método variacional. Muchas veces no es po-


sible resolver exactamente un problema mecánico, pero es deseable obtener información
aproximada sobre el mismo. Supongamos que hay un sistema cuya solución conocemos
exactamente y que tiene aspectos similares al sistema original para el cual no conocemos
la solución; la solución para el sistema aproximado contendrá una serie de parámetros.
El principio variacional de Rayleigh expresa que la energı́a del sistema es menor que el
valor medio del hamiltoniano tomado sobre la trayectoria del sistema aproximado, de
modo que del sistema aproximado se puede obtener una aproximación óptima al proble-
ma original buscando cuáles son los valores de los parámetros que minimizan al valor
medio del hamiltoniano. En otras palabras: el sistema original posee un hamiltoniano
Movimiento de dos partı́culas que interactúan ... / 153

γ = 1,33

Figura 5.18 Trayectoria para γ ≈ 1

que es función de las variables de estado, H(q, p); para cada estado de movimiento (q, p),
H tendrá un valor definido. Si se toman q(t) y p(t) no de la solución exacta sino de una
aproximada, el valor de H siempre será en promedio mayor que el que tendrı́a tomando
para q(t), p(t), sus valores exactos. Este método está relacionado con el método varia-
cional usado en mecánica cuántica para hallar la energı́a del estado base de un sistema
usando funciones de onda de ensayo.
Veamos cómo trabaja por medio de un ejemplo.
Consideremos un átomo de litio y tratemos de hallar las energı́as del electrón ex-
terno usando la vieja mecánica cuántica. De acuerdo con el modelo de capas del átomo,
el Li consta de dos electrones internos y uno externo. E. Schrödinger en 1921 propuso el
siguiente modelo.4 El resto del átomo –los electrones internos– es reemplazado por una
capa esférica de distribución uniforme de carga negativa, externa a la cual hay entonces
un campo de fuerza coulombiano, correspondiente a una carga positiva +e del núcleo
“apantallado” por dos electrones, y en el interior hay un campo coulombiano, corres-
pondiente a una carga positiva +3e, la del núcleo. Llamemos ρ al radio del cascarón.
Entonces la energı́a potencial en este modelo será:

 3e2 2e2
 − + r<ρ
V = r ρ (5.137)
 2
 −e r>ρ
r
4 Véase el texto The mechanics of the atom de Max Born, sección 28.
154 / Mecánica clásica avanzada

donde la constante 2e2 /ρ asegura la continuidad de V en r = ρ. Para el caso en que la


energı́a sea lo suficientemente alta, la órbita permanecerá a distancias del núcleo mayo-
res que ρ, con lo cual la solución será, para el electrón externo, una trayectoria elı́ptica
como en la figura 5.13. Pero cuando el perihelio de la órbita resulta menor que ρ, la
órbita penetra al interior y no será más de forma elı́ptica pues será la correspondiente al
potencial (5.137) que no es coulombiano. Si el electrón externo sólo permanece dentro
de la esfera de radio ρ una fracción pequeña de tiempo es de esperarse que la órbita sea
una elipse que precesa, como en la figura 5.18. Durante un perı́odo la órbita exacta co-
rrespondiente al potencial (5.137) diferirá poco de la órbita correspondiente al potencial
coulombiano. Tomaremos entonces como soluciones de ensayo las órbitas elı́pticas en un
potencial:

ze2
V =− (5.138)
r
donde z será un parámetro variacional que se determina por la condición de que hHi
sea un mı́nimo.
Por simplicidad supondremos que el electrón externo está en un estado s, o sea
que tiene l = 0. Para este caso, según (5.104) la excentricidad será ǫ = 1. Como V es
central, el hamiltoniano es de la forma (5.28), o sea que interviene sólo la coordenada
radial. Usando (5.119) y (5.118) obtenemos, tomando δ = 0:

r = (1 − cos ψ)a ; 2πνt = ψ − senψ (5.139)

La ecuación (5.139) permite escribir a r y ṙ en la forma:

ψ ψ
r = 2a sen2 ; ṙ = 2πνa cot (5.140)
2 2
La ecuación (5.140) permite ahora expresar a H en términos de la solución de
ensayo ası́:

 2 2 2 2 ψ 3e2 2 ψ 2e2

 2π mν a cot − csc + r<ρ
 2 2a 2 ρ
H= (5.141)

 2

 2π 2 mν 2 a2 cot2 ψ − e csc2 ψ r>ρ
2 2a 2
El valor medio de H en un perı́odo será, usando la ecuación de Kepler:
Z 1/(2ν) Z π
2 ψ
hHi = 2ν Hdt = Hsen2 dψ (5.142)
0 π 0 2

Llamando ψ1 al valor de ψ cuando r = ρ obtenemos de (5.140):


r
ψ1 ρ
sen = (5.143)
2 2a
Movimiento de dos partı́culas que interactúan ... / 155

Podemos separar la integral (5.142) en dos, de 0 a ψ1 y de ψ a π, con lo cual


obtenemos después de manipulaciones simples:
Z  
2 ψ1 2 2 2 2 ψ 3e2 2e2 2ψ
hHi = 2π mν a cos − + sen dψ
π 0 2 2a ρ 2
Z   (5.144)
2 π ψ e 2
+ 2π 2 mν 2 a2 cos2 − dψ
π ψ1 2 2a
Efectuando las integraciones llegamos a:
 2 
2 e e2 e2 e2
hHi = − ψ1 + ψ1 − senψ1 + π 3 mν 2 a2 − π (5.145)
π a ρ ρ 2a
Es conveniente expresar a e2 /a en términos del número cuántico principal n, la
energı́a de Rydberg y el parámetro z, ası́:
e2 z z
= e 2 = 2R (5.146)
a n a0 n
donde a0 es el radio de Bohr y R = e2 /a0 . Como a = n2 a0 /z, notamos por analogı́a
que ρ será el radio de la órbita de los electrones internos, que se mueven en presencia
del núcleo que tiene carga 3e, y están en la primera órbita que tiene n = 1; entonces
ρ = a0 /3. De esta forma (5.143) es:
r
ψ1 1 z
sen = (5.147)
2 n 6
Usando (5.112) con k = ze2 obtenemos:
π z2
π 2 mν 2 a2 = R (5.148)
4 n2
de modo que (5.145) tomará la forma:
"   r 
2R 2z 1 z
hHi = 6 − 2 arcsen
π n n 6
r  #
1 z2 π z2
− 6z − 2 + −z (5.149)
n n 2n 2

z es un parámetro que se determina por la condición de que minimice a hHi, es decir,


por la condición:
∂hHi
=0 (5.150)
∂z
Efectuando las manipulaciones algebraicas llegamos a que z satisface la siguiente
ecuación trascendental:
r
1 z π
= sen (z − 1) (5.151)
n 6 4
156 / Mecánica clásica avanzada

de (5.151) se sigue que z debe ser positiva. Una vez hallada z de (5.151) se reemplaza
en (5.149) para obtener la energı́a:
"
R  n
E= 2
2z(z − 1) 1 −
2n 2
r #
4n z2
+zn(1 − 6n) + 6n + 6z − 2 (5.152)
π n

De acuerdo con el principio variacional, la aproximación óptima por medio de órbi-


tas de Kepler al movimiento bajo el potencial (5.137) se halla por medio del potencial
coulombiano −ze2/r, donde z es el número que se obtiene de (5.151) para cada n. Los
resultados que se obtienen al resolver numéricamente a (5.151) son aproximados, dando
errores grandes para n = 2 y errores que van disminuyendo a medida que n aumenta;
las energı́as variacionales siempre serán mayores que las experimentales. Ası́, por ejem-
plo, algunos resultados son: (n, Evar , Eexp )= (2; −0, 29; −0, 58); (8; −0, 06; -0, 12); (15;
−0, 03; −0, 06); (40; -0, 01; −0, 03).

Los resultados no son muy buenos pero ilustran el método variacional que es usa-
do extensivamente en muchas ramas de la fı́sica; las discrepancias se deben en parte al
modelo –suponer que el potencial es central y dado por (5.137)–, en parte al método
variacional en sı́, y en parte al uso de la aproximación clásica.

5.4. El problema de la dispersión bajo fuerzas cen-


trales
Esta sección trata con las soluciones que describen estados no ligados; tales son
los casos k < 0, k > 0 y E > 0 en el movimiento bajo el potencial −k/r. Cuando el
problema es causal, es decir se conocen exactamente las constantes de movimiento y
φ0 , las ecuaciones de la órbita nos dan la evolución de la partı́cula; este problema es
estrictamente mecánico. En fı́sica microscópica, cuando se trabaja con átomos, molécu-
las o electrones, entre otros, una descripción mecánica es muy difı́cil; entonces se acude
a conceptos estadı́sticos. En esta sección en gran parte trabajaremos con los conceptos
estadı́sticos de la sección eficaz, aptos para sistemas microfı́sicos, aunque también se
aplican por ejemplo en cosmologı́a.

La sección eficaz de dispersión. Un experimento tı́pico de dispersión consiste


en estudiar el efecto de un centro dirpersor sobre un haz de partı́culas. Se entiende por
dispersión el proceso de colisión en el cual la dirección del movimiento de las partı́culas
incidentes cambia al azar, como resultado de la interacción con el centro dispersor.
En el estudio estadı́stico se hacen las siguientes suposiciones: todas las partı́culas
del haz incidente son de la misma naturaleza y tienen la misma energı́a y dirección de
la velocidad inicialmente. La interacción es de corto rango, de modo que a partir de
distancias mayores que cierta cantidad α es esencialmente cero. El haz de partı́culas
Movimiento de dos partı́culas que interactúan ... / 157

incidentes tiene una sección transversal A que es mucho mayor que el área efectiva de
interacción σ = πα2 , las partı́culas se distribuyen al azar sobre el área de la sección
transversal del haz. El haz tiene un número muy grande de partı́culas para permitir
un tratamiento estadı́stico, pero no tan grande como para que una partı́cula del haz
interfiera con otra. Toda partı́cula que se acerque al centro dispersor a una distancia
menor que α es dispersada; la probabilidad a priori de una partı́cula ser dispersada es:
σ
p= ; σ = πα2 (5.153)
A
donde σ se llama sección eficaz total de dispersión y es una medida de la dispersión en
cualquier ángulo. Llamaremos θ al ángulo entre la dirección del haz incidente y la del
movimiento final de una partı́cula dispersada.
Las partı́culas que incidan sobre el blanco con un parámetro de impacto s serán
dispersadas en un ángulo θ; las que incidan con un parámetro de impacto s + ds serán
dispersadas en un ángulo θ + dθ donde dθ es negativo. Todas las partı́culas que incidan
sobre una corona circular de radios s y s + ds serán dispersadas dentro del rango angular
θ y θ + dθ. Todas las partı́culas que incidan sobre el área dσ (área rayada en la figura
5.19) se dispersarán con ángulos entre θ y θ + dθ y φ + dφ. Como suponemos que r ≫ α,

rd θ

A
dσ r
dϕ dϕ
θ θ + dθ

ds

Figura 5.19 Sección eficaz de dispersión

entonces hemos notado que no hay diferencia esencial en suponer que las partı́culas
emergen del centro dispersor en vez del centro del área rayada dσ. Estas partı́culas
serán dispersadas dentro de un ángulo sólido dΩ dado por:
dΩ = senθ dθ dφ (5.154)
La probabilidad de dispersión dentro del ángulo dΩ se expresa en función de la
llamada sección eficaz dσ.
dσ s ds dφ
dp = = (5.155)
A A
Supongamos que la intensidad del haz incidente es I:
∆N
I= (5.156)
A ∆t
158 / Mecánica clásica avanzada

donde ∆N es el número de partı́culas incidentes que pasan por el área A durante el


tiempo ∆t. De las ∆N que en ∆t pasan a través de A, solamente dN (θ) incidirán sobre
el área dσ y serán dispersadas dentro de dΩ en el tiempo ∆t.
Entonces la probabilidad de dispersión dentro de dΩ durante el tiempo ∆t será:
dN (θ) dσ
dp = = (5.157)
∆N A
Se sigue entonces de (5.156) y (5.157) que:

dN (θ)
= Idσ (5.158)
∆t

Definimos la sección eficaz diferencial σ(θ), como:



σ(θ) = (5.159)
dΩ
Se sigue entonces que:
I(θ) 1 dN (θ)
σ(θ) = = (5.160)
I I ∆t dΩ
Es decir, σ(θ) es igual al número total de las partı́culas dispersadas dentro de dΩ
por unidad de tiempo y unidad de ángulo sólido, dividido por el número de partı́cu-
las incidentes por unidad de área por unidad de tiempo. Como esta definición de σ(θ)
incluye sólo conceptos macroscópicos, o sea conceptos de cantidades observables experi-
mentalmente, entonces es válido también en mecánica cuántica. La siguiente expresión
mecánica que resulta de (5.159) al reemplazar a dσ y dΩ en función de θ, φ y s sólo es
válida en mecánica clásica,
dσ −s ds
σ(θ) = = (5.161)
dΩ senθ dθ
La ecuación (5.161) está expresada en función de s, que en microfı́sica no es acce-
sible directamente al experimento.
La relación entre las tres definiciones de sección eficaz (sección eficaz, sección eficaz
total y sección eficaz diferencial) es:
Z Z
σ = dσ = σ(θ) dΩ (5.162)

Ejemplo 5.4.1 Sea una esfera dura de radio a y masa infinita. Sobre ella incide un haz de
partı́culas de masa m y radio b también duras, que se dispersan elásticamente al chocar.
Hallar la sección eficaz diferencial (véase figura 5.20).

El parámetro de impacto está dado por:


θ
s = (a + b) senα = (a + b) cos (5.163)
2
Movimiento de dos partı́culas que interactúan ... / 159

a
z

b α
α
θ

Figura 5.20 El haz partı́culas de masa m y radio b incide sobre una esfera de masa infinita
y radio a

Entonces:
1
σ(θ) = (a + b)2 ; σ = π(a + b)2 (5.164)
2
σ(θ) no depende de θ ni de la energı́a. Cuánticamente se halla que σ es cuatro veces
mayor debido a efectos de difracción.

Sección eficaz diferencial de Rutherford. Es la sección eficaz diferencial de


dispersión coulombiana, cuando inciden partı́culas cargadas sobre un blanco de masa
infinita y cargado eléctricamente. Asumamos que las cargas son positivas, ze y z ′ e, de
modo que k es negativo, igual a −zz ′e2 . La figura 5.21 muestra la trayectoria de una
de las partı́culas, que es hiperbólica. Tomamos por simplicidad a φ0 = 0 con lo cual
obtenemos de acuerdo con la figura 5.9, la figura 5.21.
De acuerdo con la definición de sección cónica, la ecuación de la hipérbola (rama
1 en la figura 5.9) es:

QF2 = ǫQD2 (5.165)

donde Q es el punto cuyo vector de posición es ~r, F2 es el foco de la derecha y D2 la


directriz de la derecha. Entonces la ecuación de la trayectoria es:
ǫs ǫs l2 /mk
= −1 − ǫ cos φ ⇒ φ = π → rmin = = (5.166)
r ǫ−1 1−ǫ
Que también se obtiene directamente de (5.85) cuando k < 0 y φ0 se sustituye por
φ0 + π. r → ∞ cuando −1 − ǫ cos φ = 0, o sea cuando φ toma el valor:
 
1
φmin = cos−1 − (5.167)
ǫ
φmin está relacionado con el ángulo de dispersión θ:
φ π θ
+ θ = φmin ; θ + φ = π ⇒ φmin = + (5.168)
2 2 2
160 / Mecánica clásica avanzada

z′e

Q
 r
Θ
θ / 2  ϕ


O •ze x

v∞

•u S

Figura 5.21 Dispersión de Rutherford. La trayectoria de las partı́culas es hiperbólica.

Entonces:
θ 1 θ
cos φmin = −sen = − ⇒ ǫ = csc (5.169)
2 ǫ 2
Por otra parte ǫ está relacionado con E y l, o sea con υ∞ y con s:
1
l = mυ∞ s ; E = mυ∞ 2 (5.170)
2
Como, según (5.89), ǫ2 = 1 + 2El2 /(mk 2 ), vemos que:
k2 2
s2 = (ǫ − 1) (5.171)
4E 2
De (5.169) y (5.171) se sigue que:
k θ
s= cot (5.172)
2E 2
Reemplazando a (5.172) en (5.161) obtenemos para σ(θ):
 2
k θ
σ(θ) = csc4 (5.173)
4E 2
que es la fórmula de Rutherford.5 Como el resultado no depende del signo de k, la
fórmula también es válida cuando el potencial es atractivo.
5 Hallada en 1911. En el tomo I del Berkeley physics course, al final del capı́tulo 15, puede verse el
trabajo original de Rutherford.
Movimiento de dos partı́culas que interactúan ... / 161

La fórmula (5.173) coincide exactamente con la formula cuántica no relativı́stica;


es uno de los varios resultados en que para potenciales del tipo 1/r hay una identidad
con los resultados cuánticos.
La sección eficaz total que se calcula de (5.173) resulta infinita. Como σ es una
medida de la dispersión, el área efectiva para la dispersión de Coulomb es infinita por
ser un potencial de rango largo α = ∞. No importa a que distancia pase el proyectil del
blanco siempre habrá dispersión en alguna dirección.

Sistemas de referencia de centro de masa y de laboratorio. Hasta aquı́ las


consideraciones de las órbitas se han hecho suponiendo que el centro de fuerzas es
inmóvil, lo que equivale a decir que trabajamos en un sistema de referencia donde se
mueve una partı́cula de masa reducida µ, que puede asumirse que está colocada en vez de
la partı́cula 2, en tanto que el centro de fuerzas, inmóvil, está donde estaba la partı́cula
1. El radio vector ~r describe el movimiento de la partı́cula µ, ası́ como el movimiento
relativo de las dos partı́culas originales [ecuaciones (5.9) a (5.13)]. Aquı́ analizaremos
más en detalle la transformación de coordenadas, de manera adecuada a los procesos de
dispersión bajo fuerzas centrales.
Experimentalmente los procesos de dispersión se trabajan en el sistema de referen-
cia de laboratorio. Los cálculos teóricos se hacen en el sistema de centro de masa, donde
la dinámica de los problemas consiste en el movimiento de la partı́cula de masa µ. Es
necesario encontrar la conexión entre los resultados teóricos y los experimentales.
Todas las fórmulas anteriores de (5.153) a (5.173) han sido obtenidas suponiendo
que el centro dispersor es fijo (véase figura 5.22). En el laboratorio usualmente una de las
dos partı́culas, que llamaremos el blanco, está inicialmente en reposo y sobre ella incide
el proyectil con cierta velocidad. La velocidad inicial del proyectil, cuando la separación
de las dos partı́culas es mucho mayor que el rango de la interacción α, es ~υ y la del blanco
~ = 0. En el centro de masa estas dos velocidades son ~υc y V
es V ~c respectivamente. La

v -v m vc M1
m m
x x
c.m. vc
c.m. v=0
Laboratorio: inicial Laboratorio: final

Figura 5.22 Sistemas de referencia de centro de masa y de laboratorio

velocidad del centro de masa respecto al laboratorio es constante, la llamaremos ~υ .


~υ = m
~υ (5.174)
m+M
Los momentos lineales de las partı́culas inicialmente, cuando su separación es muy
grande de modo que no interactúan, son en el laboratorio:
p~P L = m~υ ; pBL = 0 (5.175)
y en el centro de masa son:
p~P C = m(~υ − ~υ) = µ~υ ; ~pBC = M (0 − ~υ) = −µ~υ (5.176)
162 / Mecánica clásica avanzada

Las energı́as cinéticas totales de acuerdo con lo hallado en (5.11) a (5.13) son:
1 1 2
TL = mυ 2 ; TC = µυ (5.177)
2 2
La energı́a cinética del centro de masa, que es constante, es:
1
TC.M = (M + m)υ 2 (5.178)
2
De modo que si p
~ es el momento lineal relativo, las energı́as cinéticas están conec-
tadas por:

P~ 2 p~2
TL = + = TC.M + Tc (5.179)
2(M + m) 2µ
o sea que en la región asintótica (r → ∞):
µ m
TL = EL ; EC.M = TC.M = EL ; EL = EC (5.180)
M µ
El momento lineal total anterior a la colisión (r → ∞), es igual al momento lineal
total después de la colisión (r → ∞). Usaremos primas para denotar las cantidades en
la región asintótica después de la colisión. En el centro de masa el momento lineal total
es cero, de modo que:
~C = 0 ;
m~υC + M V ′
m~υC ~′ =0
+ MV (5.181)
C

La ecuación de la conservación de la energı́a total en el centro de masa es:


1 2 1 ~2 1 ′2 1 ~ ′2
m~υC + MVC = m~
υC + MVC (5.182)
2 2 2 2
La fórmula (5.182) se puede escribir, usando (5.181), en la forma:
 m   m ′
′ ′
~υC · ~υC + ~υC = ~υC · ~υC + ~υ (5.183)
M M C
Se sigue entonces que:
2 ′2
υC = υC ; VC2 = VC′2 ; ′
mυC = mυC = M VC = M VC′ (5.184)

es decir, las magnitudes de los cuatro momentos lineales, incidentes y emergentes, son
iguales, de modo que en el centro de masa cada partı́cula queda después de la colisión
con la misma energı́a inicial.6 En el proceso de colisión no interviene el ángulo φ, porque
con fuerzas centrales el movimiento ocurre en un plano (véase figura 5.23). Analicemos
ahora la relación entre los ángulos de dispersión θL y θC . La relación de las velocidades
de centro de masa y laboratorio es:

~υL ′
= ~υC + ~υ ; V~L′ = V~C′ + ~υ (5.185)
6 Seve que la partı́cula µ no coincide con m cuando se toma el origen de ~
r en el centro de masa.
Como sólo interesa θC , es irrelevante saber dónde está el origen de ~
r.
Movimiento de dos partı́culas que interactúan ... / 163

m v2′
Vc′

r m
Θc
v Θ2 v
vc
C.M.
r
C.M.
v=0 vc
Laboratorio v2′ Centro de mesa M
vc′

Figura 5.23 Sistemas laboratorio y centro de masa

Sabemos que:
~BC
p M~ ~C ′ = p~BC = −~υ
υC =
~ = υ; V (5.186)
m m M

Como υC = υC y VC′ = VC , la ecuación (5.186) nos dice que:

′ M
υC = υ; VC′ = −υ (5.187)
m

O sea que si M > m entonces υC > υ = VC′ y si M < m, entonces υC′
< υ = VC′ .
Podemos distinguir dos casos, M > m y M < m. Si m > M , de acuerdo con las figuras
5.24 y 5.25, θL es máximo cuando ~υC ′ es perpendicular a ~υL ′ , luego:

υC M
senθLmax = = (5.188)
υ m
o sea que hay una región angular en el laboratorio que está prohibida cuando m > M .
Si m < M , todos los valores de θL son posibles. La relación entre θC y θL es común para
los casos m > M y m < M . Dicha relación se obtiene a partir de:

υL senθL = υC senθC ; υL cos θL = υ + υC cos θC (5.189)

Se sigue entonces que:


senθC m
tan θL = ; γ= (5.190)
cos θC + γ M
Vemos que si m ≪ M , entonces θL ≃ θC . Si m ≃ M y γ ≃ 1, entonces θL ≃
(1/2)θC .
Hallemos ahora la relación entre las secciones eficaces diferenciales σL (θL ) y σc (θc ).
La sección eficaz dσ es invariante por ser perpendicular a la dirección del movimiento
del proyectil en los dos sistemas de referencia:

dσC = dσL (5.191)


164 / Mecánica clásica avanzada

v ′L
vi′C

ΘL ΘC

γ>1

Figura 5.24 Relación entre los ángulos de dispersión θC y θL con γ > 1

v ′L vi′C

ΘL ΘC
v

γ<1

Figura 5.25 Relación entre los ángulos de dispersión θC y θL con γ < 1

de (5.159) se sigue entonces que:


d(cos θC )
σC (θC )dΩC = σL (θC )dΩL ; σL (θL ) = σC (θC ) (5.192)
d(cos θL )
Movimiento de dos partı́culas que interactúan ... / 165

Para hallar el factor en (5.192), notemos que de (5.190) se sigue:

senθL
tan θC = γ (5.193)
cos θL −
1+γ
Entonces usamos:
d(cos θC ) d(cos θC ) d(tan θC )
= = (5.194)
d(cos θL ) d(tan θC ) d(cos θL )

Para obtener finalmente:7


p 2
1 − γ 2 sen2 θ + γ cos θ
d(cos θC ) L L
= fγ (θL ) = p (5.195)
d(cos θL ) 1 − γ 2 sen2 θL

La fórmula σL (θL ) = fγ (θL )σC (θC ) da la conexión entre los cálculos teóricos,
centro de masa, y las medidas experimentales, laboratorio. Si γ = 1, vemos que f1 (θL ) =
4 cos θL , y si γ = 0, f0 (θL ) = 1.

Ejemplo 5.4.2 Hallar la sección eficaz diferencial de dispersión en el laboratorio para la


colisión de dos esferas duras de masas m y M , y radios b y a respectivamente.

En el centro de masa la dispersión es como en la figura 5.20, de modo que:

1
σC (θC ) = (a + b)2 (5.196)
4
El resultado se obtiene usando la siguiente consideración: el problema es como si
reemplazáramos la esfera de masa m por una de masa µ, y la esfera de masa M por una
de masa infinita. Como la interacción es la misma, entonces el radio de la esfera de masa
µ debe ser b y el de la esfera de masa infinita debe ser a.
Como la ecuación (5.164) no depende del valor de la masa, se sigue el resultado
(5.196). En el sistema de referencia de laboratorio la sección eficaz diferencial es:

1
σL (θL ) = (a + b)2 fγ (θL ) (5.197)
4
La sección eficaz diferencial en el centro de masa es isotrópica, en tanto que en
el laboratorio sı́ habrá una dependencia angular. En virtud del resultado (5.188), la
función fγ (θL ) debe definirse idénticamente igual a cero para ángulos θL mayores que
θL máximo, cuando γ > 1.

Ejemplo 5.4.3 Hallar la sección eficaz diferencial de Rutherford en el laboratorio cuando


la masa de la carga ze es finita.
7 Ver la demostración en el texto Classical dynamics of particles and systems de Marion, 2a ed.,
¯
sección 9.4.
166 / Mecánica clásica avanzada

En el centro de masa σC (θC ) está dada por (5.173):


 2
k θC
σC (θC ) = csc4 ; k = −zz ′ e2 (5.198)
4E 2
En el laboratorio será:
  2 −2
γ
 2  cos θL − 
k  1+γ 
σL (θL ) = 1 +  fγ (θL ) (5.199)
4E  sen2 θL 

o sea que la dependencia angular en el laboratorio es mucho más complicada que en el


centro de masa. Cuando γ = 1 sin embargo, los resultados son simples debido a que
θC = 2θL y f1 (θL ) = 4 cos θL :
 2
k cos θL
σL (θL ) = ; γ=1 (5.200)
2E sen4 θL
6
Pequeñas oscilaciones de sistemas
de varios grados de libertad

En vez de exponer el formalismo general, resolveremos en detalle algunos problemas


que ilustran los aspectos principales del mismo. Veremos que las fórmulas que se obtienen
en forma de matrices se generalizan fácilmente. Al respecto, el lector puede ver los
correspondientes capı́tulos en los textos de Goldstein, Hauser, Marion, Gantmacher,
entre otros, donde además se explica en qué consiste la “pequeñez” de las oscilaciones.

6.1. Modos normales de oscilación. Caso


no degenerado
La molécula triatómica lineal. Oscilaciones longitudinales. La molécula
triatómica lineal consta de dos átomos de masa m y uno de masa M , ligados entre
sı́ por fuerzas interatómicas de modo que en la configuración de equilibrio la molécula
es lineal, y al oscilar se conserva la forma lineal (véase figura 6.1). Supondremos que las
interacciones más importantes se presentan entre los átomos 1 y 2, y 2 y 3; más adelante
incluiremos una interacción un poco más general. La energı́a potencial de interacción
entre dos átomos puede variar como un pozo de potencial, a grandes distancias es atrac-
tiva y a pequeñas distancias es repulsiva, con un mı́nimo en una distancia dada. Nos
interesaremos en los movimientos que consisten en pequeñas oscilaciones alrededor de la
posición en que la energı́a potencial tiene un mı́nimo, que es una posición de equilibrio
estable.

m M m

x1 x2 x3

Figura 6.1 Molécula triatómica lineal

167
168 / Mecánica clásica avanzada

Para estos movimientos se cumple: (a) La energı́a potencial es del tipo de un “re-
sorte” con pequeñas elongaciones; (b) La energı́a cinética no depende de la posición, o
sea, es función cuadrática homogénea de las velocidades, con coeficientes que no depen-
den de la posición. Ver la discusión detallada de lo anterior, por ejemplo en Gantmacher,
numeral 40.
El número de grados de libertad necesarios para especificar las oscilaciones longitudina-
les es 3 − 1 = 2 descontando la traslación del centro de masa. La longitud del “resorte”
que une los átomos 1 y 2 es x2 − x1 . Supondremos que en la posición de equilibrio la
longitud de este “resorte” es b, o sea que x20 − x10 = b, siendo xi0 la coordenada de la
partı́cula i en la configuración de equilibrio. La elongación del resorte 1−2 será entonces:
(x2 − x1 ) − b = (x2 − x20 ) − (x1 − x10 ) (6.1)
Si llamamos a η1 , η2 y η3 la cantidad en que se separa cada átomo de su posición
de equilibrio:
ηi = xi − xi0 (6.2)
podemos escribir las elongaciones de los resortes 1 − 2 y 2 − 3 como:
η2 − η1 y η3 − η2 (6.3)
de modo que la energı́a potencial para pequeñas oscilaciones será:
1 1
V = k(η2 − η1 )2 + (η3 − η2 )2
2 2
(6.4)
1 2 2 2
k(η1 + 2η2 + η3 − 2η1 η2 − 2η2 η3 )
2
donde k es la “constante de resorte”, cuyo valor depende de factores que no entraremos a
considerar aquı́, pero que supondremos conocido. En (6.4) no se incluye interacción entre
los átomos 1 y 3. Las coordenadas η1 , η2 , η3 , no son todas vibracionales pues sabemos
que las vibraciones longitudinales requieren sólo dos coordenadas. V puede escribirse en
la forma:
3
1 X
V = kij ηi ηj (6.5)
2 i,j=1

donde kij son los elementos de la matriz 3 × 3, k̃:


 
1 −1 0
 
 
k̃ = k 
 −1 2 −1 
 (6.6)
 
0 −1 1
k̃ es una matriz simétrica, kij = kji . La energı́a cinética es:
1 1 1
T = mẋ21 + M ẋ22 + mẋ23
2 2 2
3 (6.7)
1 X
= mij η̇i η̇j
2 i,j=1
Pequeñas oscilaciones de sistemas de varios grados de libertad / 169

donde mij son los elementos de la matriz 3 × 3, m̃, que es diagonal y por lo tanto
simétrica:
 
m 0 0
 
 

m̃ =  0 M 0   (6.8)
 
0 0 m

El lagrangiano del problema es:


3
1 X
L= (mij η̇i η̇j − kij ηi ηj ) (6.9)
2 i,j=1

Para hallar las ecuaciones de Lagrange se requiere conocer las derivadas parciales
de L respecto a ηi y η̇i . Para ello evaluemos a dL:
3
1 X
dL = (mij dη̇i η̇j + mij η̇i dη̇j − kij dηi ηj + kij ηi dηj ) (6.10)
2 i,j=1

usando la simetrı́a de k̃ y m̃, un cambio adecuado de los ı́ndices mudos de la suma


permite escribir,
    
X3 X3 3
X
dL =  mij η̇j  dη̇i −  kij ηj  dηi  (6.11)
i=1 j=1 j=1

con lo cual obtenemos:


X3 X3
∂L ∂L
=− kij ηj ; = mij η̇j ; i = 1, 2, 3 (6.12)
∂ηi j=1
∂ η̇i j=1

Teniendo en cuenta que las mij son constantes, las ecuaciones de Lagrange son:
3
X
(mij η̈j + kij nj ) = 0; i = 1, 2, 3 (6.13)
j=1

Si definimos los vectores en el espacio de configuración del sistema,


     
η1 η̈1 0
     
     
η=  ¨   ~  
~  η2  ; ~η =  η̈2  ; 0 =  0  (6.14)
     
η3 η̈3 0

las ecuaciones de Lagrange (6.13) toman la forma condensada:

η¨ + k̃~η = ~0
m̃~ (6.15)
170 / Mecánica clásica avanzada

Veremos que (6.15) es la forma de la ecuación de movimiento para cualquier sistema


de muchos grados de libertad con pequeñas oscilaciones. El sistema que consideramos
tiene sólo oscilaciones en una dimensión; sin embargo, por tener tres grados de libertad
para los movimientos longitudinales, el espacio de configuración de tales movimientos es
tridimensional. El problema que sigue es buscar las soluciones de (6.15) que describirán
el movimiento del punto del espacio de configuración.
La ecuación para el vector ~η , (6.15), es lineal, luego la solución general puede
expresarse como una combinación lineal de las soluciones linealmente independientes.
Como el vector ~ η es tridimensional, existirán tres soluciones linealmente independientes,
en términos de las cuales puede expandirse a ~η ; tales soluciones las llamaremos ~ηα con
α = 1, 2, 3, de modo que la solución general de (6.15) será de la forma:
~η = C1 ~
η1 + C2 ~η2 + C3 ~η3 (6.16)
Como la ecuación de movimiento es de segundo orden, la solución contendrá dos
constantes de integración arbitrarias por cada grado de libertad. En total hay seis cons-
tantes de integración que son C1 , C2 , C3 , φ1 , φ2 , φ3 . Busquemos soluciones de la forma:
~ηα = ~
µα sen(ωα t + φα ); α = 1, 2, 3 (6.17)
~ α es un vector tridimensional constante y φα es una constante de integración. Las
µ
componentes de ~µα son µα1 , µα2 , µα3 . En términos de las componentes, (6.17) será:
ηαi = µαi sen(ωα t + φα ) ; i, α = 1, 2, 3 (6.18)
En (6.18) el ı́ndice i se refiere a los grados de libertad, en tanto que α numera
las soluciones diferentes. ωα es una constante que no debe depender de las constantes
de integración. Debido a que sen(ωα t + φα ) y sen(ωβ t + φβ ) son linealmente indepen-
dientes cuando ωα 6= ωβ , las ~ηα serán linealmente independientes cuando ωα 6= ωβ . Las
soluciones de la forma (6.17) y (6.18) representan los movimientos en los cuales todas
las partı́culas oscilan con la misma frecuencia y tienen una definida relación entre sus
amplitudes de oscilación.
La pregunta que sigue es: ¿cuánto valen las ωα y cuáles son las relaciones que deben
existir entre las µαi ?. Para responderla, reemplacemos a (6.18) en (6.15):
3
X
µα = ~0 ,
(−ωα2 m̃ + k̃)~ (ωα2 mij + kij )µαj = 0; i, α = 1, 2 , 3 (6.19)
j=1

La ecuación (6.19) es un sistema de tres ecuaciones lineales algebraicas homogéneo,


con las tres incógnitas µα1 , µα2 , µα3 , que tendrá solución para ciertos valores de ωα .
Hallar a ~
µα equivale a realizar la siguiente operación con matrices:
µα = (−ωα2 m̃ + k̃)−1~0
~ (6.20)
Vemos que ~µα será no trivial, es decir, diferente del vector ~0 solamente si la matriz
(−ωα2 m +k) es singular, o sea si su determinante es cero. Esto introduce una condición
que permite determinar las ωα :
det(ωα2 m̃ − k̃) = 0 (6.21)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 171

La ecuación (6.21) se llama ecuación secular o determinante secular. El término


secular proviene del latin seculum, o sea, referente a los siglos; se usa a partir de una
ecuación análoga en astronomı́a que aparece al realizar cálculos perturbativos que pre-
dicen efectos sobre las órbitas apreciables sólo en tiempos muy largos. De acuerdo con
las ecuaciones (6.6) y (6.8) se tiene que:

 
mωα2 − k k 0
 
 
ωα2 m̃ − k̃ = 
 k M ωα2 − 2k k 
 (6.22)
 
0 k mωα2 − k

El determinante de la matriz (6.22) es:

   
det ωα2 m̃ − k̃ = mωα2 − k (M ωα2 − 2k)(mωα2 − k) − k 2
(6.23)
 
−k k(mωα2 − k)

Por tanto la ecuación (6.21) es una ecuación algebraica de tercer grado en ωα2 , que
tendrá tres raı́ces que serán ω12 , ω22 y ω32 :

     
k M + 2m
det ωα2 m̃ − k̃ = m2 M ω 2 − (ω 2 − 0) ω 2 − k
m Mm
(6.24)
= m2 M (ω 2 − ω22 )(ω 2 − ω12 )(ω 2 − ω32 )

En conclusión, las frecuencias con las cuales puede ocurrir la oscilación simultánea
de las tres coordenadas son:

k k  m
ω12 = 0; ω22 = ; ω32 = 1+2 (6.25)
m m M

Si m ≪ M entonces ω2 ≈ ω3 presentándose una cuasidegeneración. Hay una matriz


172 / Mecánica clásica avanzada

de la forma (6.22) por cada una de las frecuencias (6.25):


 
−k k 0
 
 
ω12 m̃ − k̃ =  k −2k k 
 
 
0 k −k
 
0 k 0
 
 
 M − 2m 
ω22 m̃ − k̃ =  k k k 
 m  (6.26)
 
0 k 0
 m 
2 k k 0
 M 
 
 
 M 
ω32 m̃ − k̃ =  k k k 
 m 
 
 
m
0 k 2 k
M
Entonces las ecuaciones (6.19), que nos dan las relaciones entre las componentes
de los vectores ~
µ1 , µ
~ 2 y ~µ3 , son:
 
   0
−k k 0 µ11  
    
    0 
 k −2k k   =  
   µ12   
    
 0 
0 k −k µ13

   
0 k 0  0
µ21  
    
    0 
 M − 2m 
 k k k  µ22 =  
 m 


 
 
(6.27)
   0 
0 k 0 µ23

 m   
2 k k 0   0
 M  µ31  
    
    0 
 M  =  
 k k k   µ32   
 m    
   0 
 
m µ33
0 k 2 k
M
Pequeñas oscilaciones de sistemas de varios grados de libertad / 173

Siendo más explı́citos, respectivamente estas ecuaciones toman la forma:

µ11 = µ12 ; µ11 − 2µ12 + µ13 = 0; µ12 = µ13

µ22 = 0; µ21 + µ23 = 0; µ22 = 0 (6.28)


m M 2m
2 µ31 + µ32 = 0; µ31 + µ32 + µ33 = 0; µ32 + µ33 = 0
M m M
Las relaciones buscadas entre los componentes de los vectores ~µα para los movi-
mientos en que las tres partı́culas oscilan con la misma frecuencia son:

ω1 : µ11 = µ12 = µ13

ω2 : µ21 = −µ23 ; µ22 = 0 (6.29)


2m
ω3 : µ31 = µ33 ; µ32 = − µ31
M
Cada vector µα resulta indeterminado por una constante arbitraria, aunque las
relaciones entre sus componentes están bien definidas:1
     
1 1 1
     
     
     2m 
µ1 = µ11  1  ; ~
~ µ2 = µ21  0  ; ~µ3 = µ31  −  (6.30)
     M 
 
1 −1 1

Notamos que ~ µ1 , ~
µ2 y ~
µ3 no son ortogonales, puesto que: ~µ1 · ~µ2 = 0; ~µ1 · ~µ3 =
2µ11 µ31 (1 − m/M ); ~µ2 · ~
µ3 = 0. Es deseable, sin embargo, trabajar con vectores ortogo-
nales. Los vectores siguientes son ortogonales:
 √   √ 
m m
   
 √   
1/2
m̃ ~ 
µ1 = µ11  M  ; m̃ ~µ2 = µ21  0 
 1/2 

   
√ √
m − m
 √  (6.31)
m
 
 −2m 
 
m̃1/2 µ
~ 3 = µ31  √ 
 M 
 

m
1 Las trayectorias descritas en el espacio de configuración son rectilı́neas. ~
η1 corresponde a una lı́nea
infinita, describe una translación no acotada a lo largo del vector ~ µ1 . ~η2 y ~η3 describen oscilaciones
sobre segmentos rectos finitos a lo largo de los vectores ~µ2 y ~ µ3 respectivamente.
174 / Mecánica clásica avanzada

En vez de trabajar con estos vectores, es cómodo quedarse con los vectores (6.30),
pero cambiando la definición del producto escalar. Definiremos el producto escalar de
dos vectores ~
µ y ~ν ası́:
3
X
µ, ~ν ) = (m̃1/2 ~µ).(m̃1/2 ~ν ) = ~µ.(m̃~ν ) =
(~ mij µi νj (6.32)
i,j=1

Podemos ahora escoger las constantes arbitrarias µ11 , µ21 y µ31 de modo que los
vectores ~
µα formen una trı́ada ortonormal bajo el producto escalar (6.32), es decir,
normalizar los vectores a la unidad: (~µα , ~να ) = 1; α = 1, 2, 3. Este procedimiento nos
conduce inmediatamente a:
   
1 1
   
1   1  
µ1 = √
~  
1 ; ~µ2 = √  0 

2m + M   
2m  

1 −1
  (6.33)
1
 
1 
 −2m 
µ3 = r
~  
m  M 
2m(1 + 2 )  
M
1

La definición (6.32) se hace por comodidad matemática, pero nos aleja un poco
del sentido fı́sico original. La exigencia de ortonormalidad nos conduce a vectores que
no tienen dimensiones de desplazamiento y a soluciones que no dependen de las con-
diciones iniciales: contienen información sobre la relación de amplitudes pero no de su
valor absoluto. Por esto se les llama “modos normales de oscilación”. Se dice que los
movimientos longitudinales de la molécula triatómica lineal son no degenerados porque
las frecuencias de los tres modos normales son diferentes; en otras palabras, no hay dos
modos normales diferentes con la misma frecuencia.
La frecuencia w1 , que es nula, no corresponde a una oscilación. Esto es consistente
con la forma del vector propio correspondiente: las tres partı́culas se desplazan la misma
cantidad en todo momento, o sea que la molécula se traslada. En sentido estricto sólo
µ2,3 son modos normales de oscilación, de acuerdo con lo dicho anteriormente acerca de
~
que sólo hay dos coordenadas vibracionales longitudinales. En el modo ~µ2 la partı́cula 2
se queda quieta y las partı́culas 1 y 3 oscilan en contrafase. En el modo ~µ3 las partı́culas
1 y 3 oscilan en fase, pero la partı́cula 2 se desplaza respecto a 1 − 3 una cantidad que
depende de las masas y es en sentido opuesto. En el modo ~µ2 cada “resorte” actúa p inde-
pendientemente sobre una masa m; por esto la frecuencia correspondiente vale k/m.
Si se quiere indicar la magnitud de las oscilaciones es conveniente definir otras solu-
ciones, llamadas “coordenadas normales”, que, veremos, representan otro conjunto de
coordenadas generalizadas independientes para describir el estado del sistema y contie-
nen información sobre las condiciones iniciales.
Pequeñas oscilaciones de sistemas de varios grados de libertad / 175

Coordenadas normales para la molécula triatómica lineal. Las ecuaciones


de movimiento (6.13) son tres ecuaciones diferenciales de segundo orden acopladas. La
solución (6.18) fue obtenida por “tanteo”. Un método directo de solución consiste en
realizar una transformación de coordenadas donde las nuevas ecuaciones de movimiento
resulten desacopladas.
El lagrangiano (6.9) puede escribirse en forma compacta usando la notación ma-
tricial. Si ~η es un vector columna, ~η T es un vector fila:
1 ˙T ˙ 1 T
L= η − ~η k̃~
η m̃~
~ η (6.34)
2 2
L es una forma cuadrática no diagonal en η̇i y en ηi pues la matriz k̃ es no diagonal.
Esto conduce a que las ecuaciones de movimiento sean acopladas. Si se realiza una trans-
formación lineal de coordenadas que diagonalice a L, las correspondientes ecuaciones de
movimiento serán no acopladas, pues en ese caso L consta de una suma de términos
que dependen de sólo una de las coordenadas. Llamemos ~θ a las nuevas coordenadas
generalizadas y ÃT la matriz de la transformación:

η = ÃT ~
~ θ (6.35)

donde ÃT es la matriz transpuesta de Ã. En las nuevas variables L toma la forma:
1 ~˙ T ˙ 1 ~T
L= θ Ãm̃ÃT θ~ − θ Ãk̃ ÃT ~θ (6.36)
2 2
Ahora exigimos que à sea tal que m̃′ = Ãk̃ÃT y k̃ ′ = Ãm̃ÃT sean ambas diagona-
les, es decir, tales que m′ij = m′i δij y kij

= ki′ δij para i, j = 1, 2, 3 de modo que (6.36)
queda ası́:
3
1X ′ 2
L= (m θ̇ − kα′ θα2 ) (6.37)
2 α=1 α α

La ecuación de movimiento (6.37), será ahora:

m′α θ̇α2 − kα′ θα2 = 0 (6.38)

Las soluciones para las nuevas coordenadas, en función de las constantes de inte-
gración Cα y φα , serán:
s !
kα′
θα = Cα sen t + φα kα′ θα2 = 0; α = 1, 2, 3 (6.39)
m′α

De (6.35) y (6.39) se sigue que:


s !
X 3
kα′
ηi = Aαi Cα sen t + φα ; i = 1, 2, 3 (6.40)
α=1
m′α

Las coordenadas θα con α = 1, 2, 3, se llaman las coordenadas normales del sis-


tema. El problema matemático ahora consiste en hallar las nueve componentes de la
176 / Mecánica clásica avanzada

matriz Ã, que se obtienen resolviendo para las Aαi las ecuaciones que resultan de las
condiciones:
(Ãm̃ÃT )ij = m′i δij ; (Ãk̃ ÃT )ij = ki′ δij (6.41)
A partir de (6.16) y (6.17) vemos que ~ηi toma la forma:
3
X
ηi = Cα µαi sen(ωα + φα ) (6.42)
α=1
Las expresiones (6.40) y (6.42) coinciden si se cumple que:
kα′
Aαi = µαi y ωα2 = ; i, α = 1, 2, 3 (6.43)
m′α
Llegamos a la conclusión de que los vectores propios, o modos normales de oscila-
µα , son las filas de la matriz Ã, o sea las columnas de la matriz ÃT que realiza la
cion ~
transformación de ~η a θ~ según (6.35). Como los vectores ~µα son ortogonales y ortonor-
males según el producto escalar (6.32):
(µα , µβ ) = δαβ ; α, β = 1, 2, 3 (6.44)
Podemos escribir (6.44) también en la forma:
~ Tα m̃~µβ = δαβ ;
µ α, β = 1, 2, 3 (6.45)
Explı́citamente (6.45) es:
3
X
mij µαi µβj = δαβ ; α, β = 1, 2, 3 (6.46)
i,j=1

Notamos la identidad entre las filas de à y los vectores ~µTα , y por lo tanto podemos
escribir a (6.46) como:
Ãm̃ÃT = I˜ (6.47)
donde I˜ es la matriz unidad 3 × 3, o sea que m′i = 1 para i = 1, 2, 3. Entonces las
condiciones que nos definen las frecuencias ωα2 y la matriz à son de (6.41), (6.43) y
(6.47):
(Ãm̃ÃT )ij = δij ; (Ãk̃ ÃT )ij = ωi2 δij ; i, j = 1, 2, 3 (6.48)
T
Las columnas de à son los vectores ~µα y las ωα2
son los elementos diagonales de la
matriz k̃ ′ = Ãk̃ÃT . La ecuación (6.47) es la condición de que la matriz à sea ortogonal,
o sea que preserve el producto escalar (6.32) en una transformación de coordenadas
generalizadas. Explı́citamente la matriz ÃT es:
  −1/2  −1/2 
M 2m
 1 + 2m 1 1+
M 
 
 
  −1/2  −1/2 
1   
M 2m 2m 
ÃT = √  1+ 0 − 1+  (6.49)
2m   2m M 2M 

 
   −1/2   −1/2

 M 2m 
1+ −1 1+
2m M
Pequeñas oscilaciones de sistemas de varios grados de libertad / 177

y la matriz k̃ ′ es:
 
0 0 0
 
 
 k 
′  0 0 
k̃ =  m  (6.50)
 
   
 k 2m 
0 0 1+
m M

No es exacto que la coordenada normal correspondiente a ω1 = 0 sea de la forma


(6.39). En efecto, para esta frecuencia la ecuación de movimiento es:

θ̈1 = 0 (6.51)

cuya solución es:

θ1 = At + B (6.52)

donde A y B son constantes de integración, aunque podrı́a llegarse a (6.52) de (6.39)


mediante una expansión en serie de Maclaurin alrededor de ω1 = 0. Las otras dos
coordenadas normales son:

θα = Cα sen(ωα t + φα ) ; α = 2, 3 (6.53)

donde Cα y φα se determinan de las condiciones iniciales. Las ecuaciones (6.52) y (6.53)


nos permiten expresar los desplazamientos generales de las partı́culas, usando (6.35) y
(6.49):
 
1 
 rAt + B + C2 sen(ω2 t + φ2 ) + C3 sen(ω t + φ3 ) 
η1 = √  r 3 

2m M 2m
1+ 1+
2m M
 
1 
 rAt + B − 2m C3 sen(ω t + φ3 ) 
η2 = √  r 3 
 (6.54)
2m M M 2m
1+ 1+
2m M
 
1 
 rAt + B − C2 sen(ω2 t + φ2 ) + C3 sen(ω t + φ3 ) 
η3 = √  r 3 

2m M 2m
1+ 1+
2m M
Esto nos dice que el movimiento más general de las partı́culas consiste en una
traslación uniforme y en una superposición de oscilaciones de frecuencias ω2 y ω3 . La
oscilación de la partı́cula 2 es de frecuencia ω2 en tanto que las oscilaciones de las
178 / Mecánica clásica avanzada

partı́culas 1 y 3 se caracterizan por una diferencia de fase de π en la componente de


frecuencia ω2 .2
Las constantes A, B, C2 , C3 , φ2 y φ3 se pueden expresar en términos de los valores
en t = 0 de η1 , η2 , η3 , η̇1 , η̇2 y η̇3 a través de las fórmulas:
˙
~ η ; θ~ = Ãm̃~η ; ~θ = Ãm̃~η˙
θ = (AT )−1 ~ (6.55)
La matriz Ãm̃ explı́citamente es:
  −1/2  −1/2 
M M  m −1/2
 m 1+ M 1+ m 1+ 
 2m 2m 2M 
 
1  

Ãm̃ = √  m 0 −m  (6.56)
2m 



  −1/2  −1/2  −1/2 
 2m 2m 2m 
m 1+ −2m 1+ m 1+
M M M
˙
En tanto que θ~ y θ~ en t = 0 son:
   
B A
   
  ˙  
θ~ =   ~ 
 C2 senφ2  θ =  ω2 C2 cos φ2

 (6.57)
   
C3 senφ3 ω3 C3 cos φ3
Los modos normales de oscilación no son entonces más que casos particulares de
la solución general (6.54) en que sólo contribuye una de las componentes normales.
Ası́ por ejemplo, el “modo 1” se obtiene haciendo C1 = C3 = 0. La transformación
a coordenadas normales puede interpretarse como la correspondencia con un sistema
equivalente que consiste en un conjunto de osciladores armónicos lineales no acoplados.
La descomposición en modos normales es muy útil en otras ramas de la fı́sica como
la teorı́a de campos, la cual tendremos ocasión de estudiar con un campo mecánico
unidimensional. Los modos normales para la molécula triatómica lineal en oscilaciones
longitudinales los podemos representar gráficamente (véase figura 6.2).
Generalización del formalismo anterior. Si se tiene un conjunto de osciladores
acoplados con pequeñas oscilaciones, de l grados de libertad oscilatorios, con frecuencias
no degeneradas, podemos fácilmente generalizar el anterior formalismo. No es difı́cil ver
que en general la matriz m̃ es simétrica, aunque no necesariamente diagonal. k̃ también
es simétrica. De esto se deducen importantes propiedades de los vectores propios y
frecuencias propias. Las matrices m̃ y k̃ son de dimensión l × l y los vectores del espacio
de configuración son de l componentes. La ecuación (6.19) puede escribirse en cualquiera
de las formas siguientes:
µα = ωα2 ~µα
(m̃−1 k̃)~ ó (m̃1/2 k̃m̃−1/2 )(m̃1/2 µ
~ α ) = ωα2 (m̃1/2 ~µα ) (6.58)
2 El vector η
~ con componentes (6.54) describe el movimiento de un punto del espacio de configuración.
En el plano formado por µ ~2 y ~µ3 , la proyección del movimiento da una figura de Lissajous. O sea que
la trayectoria de configuración se obtiene al desplazar dicha proyección a lo largo de ~
µ1 . Por ejemplo, si
m ≪ M , la trayectoria será una hélice elı́ptica alrededor de µ1 .
Pequeñas oscilaciones de sistemas de varios grados de libertad / 179

1 2 3
ω1 = 0 x
Traslación: η1 = η2 = η3

ns
√k
ω2 = x
m
Vibración simétrica: η1= –η3 , η2 = 0

√m ( 1 + M (
k 2m
ω3 = x
Vibración asimétrica: η1 = η3 , η2 = –2m/M η1

Figura 6.2 Modos normales para la molécula triatómica lineal en oscilaciones longitudinales

Con la primera forma podemos definir el producto escalar en términos del “tensor
métrico” de cierto espacio Riemanniano, mij :

l
X
~ ~η ) =
(ζ, mij ζi ηj (6.59)
i,j=1

La ecuación (6.58) tiene la forma de una ecuación de valores propios y vectores


propios de una matriz simétrica. En efecto, m̃−1 k̃ es el producto de matrices simétricas
que, según es fácil mostrar, da una matriz simétrica. Entonces se cumplen los siguien-
tes teoremas del algebra lineal: (a) los valores propios, ωα2 , de m̃−1 k̃ son reales y (b)
los vectores propios, ~µα , correspondientes a valores propios diferentes son ortogonales y
linealmente independientes. La ecuación correspondiente a la (6.16) representa la expan-
sión de un estado arbitrario de oscilación en un conjunto completo de vectores propios
de la matriz m̃−1 k̃. La prueba de la ortogonalidad de los vectores propios es simple.
Escribamos las ecuaciones de valores propios para ωα2 y ωβ2 :

µα = ωα2 ~
(m̃−1 k̃)~ µα ; (m̃−1 k̃)~µβ = ωβ2 ~µβ (6.60)

Tomemos el producto escalar de la primera por ~µβ y de la segunda por µ


~ α:

µβ , m−1 k̃~
(~ µα ) = ωα2 (~
µβ , ~µα )
(6.61)
(m−1 k̃~ µα ) = ωβ2 (~
µβ , ~ µβ , ~µα )
180 / Mecánica clásica avanzada

Como m̃−1 k̃ es simétrica, los lados izquierdos en (6.61) son iguales. En efecto:
l
X l
X
µβ , m̃−1 k̃~
(~ µα ) = µβi mij krs µαs (m̃)−1
jr
i,j=1 r,s=1

l
X l
X
= µβr krs µαs = krs µβr µαs
r,s=1 r,s=1
(6.62)
l
X l
X
(m̃−1 k̃~
µβ , ~
µα ) = (m̃)−1
ir krs µβs mij µαj
i,j=r r,s=1

l
X l
X
= krs µβs µαr = ksr µβr µαs
r,s=1 r,s=1

Entonces se sigue que:

(ωα2 − ωβ2 )(~


µβ , ~µα ) = 0 (6.63)

Si ωα2 6= ωβ2 entonces ~µα y ~µβ son ortogonales. Si α = β, (~µα , ~µα ) tiene algún valor
que tomamos igual a 1, entonces,

(~
µα , ~
µβ ) = δα,β α , β = 1, 2, l (6.64)

Ahora, si definimos con las componentes de las µα una matriz à de dimensión l × l:

Aαi = µαi ; α, i = 1, 2, ...l (6.65)

Entonces la ecuación (6.64) no es más que la condición de ortogonalidad de à en


el espacio riemanniano de configuración:

Ãm̃ÃT = I˜ (6.66)

La ortogonalidad ordinaria de una matriz es ÃÃT o Ã−1 = ÃT . La ecuación de


µα = ωα2 m̃~
valores propios k̃~ µα puede escribirse en términos de la matriz diagonal ω̃, con
elementos ωα , ωαβ = ωα2 δαβ de la siguiente forma:
2

Ãk̃ = ω̃Ãm̃ (6.67)

Si multiplicamos por ÃT y usamos la ortogonalidad de Ã, (6.67) toma la forma:

Ãk̃ ÃT = ω̃ (6.68)

vemos que la matriz à realiza sobre k̃ una transformación que la diagonaliza, siendo las
frecuencias propias los elementos diagonales. Las expresiones (6.66) y (6.68) nos dicen
que à diagonaliza simultáneamente a m̃ y a k̃. m̃ es el tensor métrico en el espacio de
configuración. Podemos entonces interpretar a à como la matriz de una transformación
lineal en el espacio de configuración que nos hace pasar de unos ejes oblicuos, ηi , (con m̃
Pequeñas oscilaciones de sistemas de varios grados de libertad / 181

no diagonal; el producto escalar, en particular el lagrangiano, contiene productos cruza-


dos de las componentes de los vectores) a unos ejes cartesianos ortogonales, θα (m̃ = I, ˜
de ahı́ que el lagrangiano en coordenadas normales tenga términos independientes entre
sı́). Estos nuevos ejes son los ejes principales de k̃ porque mediante Ã, k̃ se transforma
en ω̃ que es diagonal.
Las coordenadas normales son un sistema de “ejes principales” en el espacio de
configuración donde m̃ y k̃ son ambas diagonales.3 Esto tiene como consecuencia que las
ecuaciones de movimiento de las coordenadas normales sean desacopladas: θ̈α +ωα2 θα = 0;
α = 1, 2, ...l.

6.2. Modos normales de oscilación. Caso


degenerado
Las oscilaciones transversales de la molécula del tipo “CO2 ” no se pueden conside-
rar con un modelo de “resortes”, pues con tal modelo estas oscilaciones son intrı́nseca-
mente no lineales. La demostración de esto se propone como ejercicio. Como el potencial
tiene un mı́nimo en la posición de equilibrio aun para desplazamientos transversales, es
válida una aproximación por un potencial parabólico, aunque la constante k no será la
misma que en las oscilaciones longitudinales. Otro aspecto de las oscilaciones transver-
sales es la degeneración de los modos normales que a continuación analizamos cualitati-
vamente.
Para especificar completamente la molécula, constituida a partir de tres partı́culas
puntuales, se requieren nueve coordenadas. Hay un grado de libertad correspondiente a
traslaciones a lo largo de la molécula (el modo ~µ1 analizado anteriormente) y dos grados
de libertad traslacionales en direcciones perpendiculares al eje de la molécula. Además,
para una posición dada del centro de masa, hay dos rotaciones alrededor de él, pues
no tiene sentido una rotación alrededor del eje de la molécula. En total, pues, hay tres
grados de libertad traslacionales y dos rotacionales, quedando cuatro grados de libertad
vibracionales (dos longitudinales y dos transversales).
La simetrı́a de rotación alrededor de la molécula implica que la constante k es la
misma para cualquier desplazamiento transversal y como hay dos modos de oscilación
transversales, éstos tendrán la misma frecuencia, es decir, la frecuencia de las oscilaciones
transversales es degenerada. Los dos modos los podemos llamar modo “z” y modo “y”,
como se representan en la figura 6.3.

y y

x x

z Modo y z Modo z

Figura 6.3 Modos de oscilación transversales.

3 En efecto, las filas de à determinan los vectores unitarios de los “ejes principales”, o sea los ~
µα .
182 / Mecánica clásica avanzada

Un movimiento transversal arbitrario será una combinación de los modos “y” y


“z”. Si las dos oscilaciones están en fase, el movimiento será lineal; si no, el movimiento
será elı́ptico. Si la diferencia de fase es de 900 las partı́culas se moverán en trayectorias
circulares, como se ve en la figura 6.4.
Al aplicar el formalismo general al problema completo de la molécula del tipo
“CO2 ”, se encuentra una ecuación secular de grado nueve en ω 2 pero a priori espera-
mos que los cinco grados de libertad no vibracionales den lugar a modos normales con
frecuencia ω 2 = 0, que los dos grados de libertad oscilatorios longitudinales tengan dos
frecuencias diferentes, y que los dos grados de libertad oscilatorios transversales den
lugar a modos normales con frecuencia doble. Es decir, el problema completo tedrá una
frecuencia quı́ntuple nula, dos frecuencias simples y una frecuencia doble; en total cuatro
raı́ces diferentes.
y En fase: oscilaciones lineales y En desfase: rotaciones

x x

z z

Figura 6.4 Modos normales de oscilación: dos frecuencias simples y una frecuancia doble.

La molécula triatómica lineal. Oscilaciones longitudinales y transversa-


les. Consideraremos sólo el problema de hallar los modos normales de oscilación, ya que
los modos traslacionales y rotacionales permiten un tratamiento trivial. Las coordena-
das vibracionales se llaman coordenadas internas. Si imponemos la condición de que el
centro de masa esté fijo y no haya rotaciones netas de la molécula, quedarán solamente
las coordenadas internas. El cálculo lo realizaremos en tres dimensiones. ~ri es el vector
de posición de la partı́cula i = 1, 2, 3 y ~ri0 el de la posición de equilibrio. La separación
de la posición de equilibrio es para la partı́cula i es:
d~i = ~ri − ~ri0 ; i = 1, 2, 3 (6.69)
d~i y ~ri son vectores ordinarios tridimensionales; no son vectores del espacio de configu-
ración. La coordenada del centro de masa es R ~ y la consideraremos fija, es decir:

R ~ 0 = m~r10 + M~r20 + m~r30


~ = m~r1 + M~r2 + m~r3 = R (6.70)
2m + M 2m + M
Se sigue entonces que las componentes de los d~i no son independientes sino que
están sometidos a las condiciones:
md~1 + M d~2 + md~3 = 0 (6.71)
La condición sobre la no rotación de la molécula alrededor del centro de masa es
que el momento angular total sea cero:
~ = m~r1 × ~r˙ 1 + M~r2 × ~r˙ 2 + m~r3 × ~r˙ 3
L
(6.72)
˙ ˙ ˙
= m(~r10 + d~1 ) × d~1 + M (~r20 + d~2 ) × d~2 + m(~r30 + d~3 ) × d~3 = 0
Pequeñas oscilaciones de sistemas de varios grados de libertad / 183

Las coordenadas de la posición de equilibrio son, tomando el origen de coordenadas


en la posición de la partı́cula 2: ~r10 = −bî; ~r20 = 0; ~r30 = bî. Por lo tanto la ecuación
(6.72) es:

~ = mbî × (d~˙ 3 − d~˙ 1 ) + m(d~1 × d~˙ 1 + d~3 × d~˙ 3 ) + M d~2 × d~˙ 2 = 0


L (6.73)

para pequeñas oscilaciones se cumple que di ≪ b, lo cual nos permite escribir en vez de
(6.73):
˙ ˙
î × (d~3 − d~1 ) = 0 (6.74)

o más explı́citamente:

d˙3y = d˙1y ; d˙3z = d˙1z (6.75)

Integrando (6.75) obtenemos: d3y = d1y + Constante; d3z = d1z + Constante; las
constantes deben anularse porque estas ecuaciones se deben cumplir aun en la posición
de equilibrio:

d3y = d1y ; d3z = d1z (6.76)

La condición (6.71) vale también para las velocidades, de donde:


m ˙ m ˙ ˙
d~2 = − (d~1 + d~3 ) ; d~2 = − (d~1 + d~3 ) (6.77)
M M
En conclusión, existen las siguientes cinco relaciones entre los nueve desplazamien-
tos, lo cual nos deja con 9 − 5 = 4 grados de libertad internos:
d1y = d3y ; d1z = d3z

2m 2m
d2y = − d1y ; d2z = − d1z (6.78)
M M
m
d2x = − (d1x + d3x )
M
Existen además cinco relaciones similares a (6.78) para las velocidades de los des-
plazamientos. Tomaremos como coordenadas generalizadas independientes vibracionales
a d1x , d3x , d1y , d1z , y las llamaremos η1 , η2 , η3 y η4 :

η1 = d1x , η2 = d3x , η3 = d1y , η4 = d1z (6.79)

Los otros cinco desplazamientos pueden expresarse en términos de los desplaza-


mientos internos por medio de las relaciones (6.78).
El espacio de configuración del sistema completo es 9-dimensional. El subespa-
cio correspondiente a las oscilaciones puras es 4-dimensional. El vector del espacio de
configuración que describe los movimientos de la molécula en que el centro de masa
permanece fijo y no hay rotación de la misma es ~η . También:

η~T = (η1 , η2 , η3 , η4 ) (6.80)


184 / Mecánica clásica avanzada

Ahora debemos expresar el lagrangiano en función de ~η y ~η˙ . La energı́a cinética es:


 2 
1 ˙ ˙2 1 ˙2
T = ~ ~
m d1 + d3 + M d~2
2 2
(6.81)
1  ˙2  m2  2 
˙2 2 ˙2 ˙
~ ˙2
~ ˙ ~˙
~
= m d1x + d3x + 2ḋ1y + 2d1z + d1 + d3 + 2d1 · d3
2 2M
Si usamos (6.78) y (6.79) para expresar todos los d~i en función de los η̇ν , ν =
1, 2, 3, 4 obtenemos para T (~η˙ ):
 
1  m 2  2m  m2
T = m 1+ η̇1 + η̇22 + m 1 + η̇32 + η̇42 + η̇1 η̇2 (6.82)
2 M M M
puede escribirse ası́ con notación matricial:
1 ˙T ˙
T = η m̃~
~ η (6.83)
2
o usando la notación de producto escalar:
1 ˙ ˙
T = (~
η , ~η ) (6.84)
2
donde m̃ es la matriz simétrica no diagonal siguiente:
  
m m2
 m 1 + 0 0 
 M M 
 
  
 m2 m 
 m 1+ 0 0 
 M M 
 
m̃ =     (6.85)
 2m 
 0 0 2m 1 + 0 
 M 
 
 
   
 2m 
0 0 0 2m 1 +
M
En el cálculo de la energı́a potencial vamos a considerar un modelo más realista.
Llamaremos k la constante de fuerza para los desplazamientos longitudinales rela-
tivos a la partı́cula 2; k ′ la constante de fuerza para los desplazamientos longitudinales
de la partı́cula 1 relativos a la partı́cula 3, y a K a la constante de fuerza para los des-
plazamientos transversales. La constante K no se puede expresar en función de k y k ′
mediante un modelo de resortes. La energı́a potencial de interacción entre las partı́culas
para pequeñas oscilaciones es:
1   1
V = k (d1x − d2x )2 + (d3x − d2x )2 + k ′ (d1x − d3x )2
2 2
1  (6.86)
+ K (d1y − d2y )2 + (d3y − d2y )2
2

+(d1z − d2z )2 + (d3z − d2z )2
Pequeñas oscilaciones de sistemas de varios grados de libertad / 185

Si usamos a (6.78) y (6.79) para expresar todos los d~i en función de los ην , ν =
1, 2, 3, 4 obtenemos para V (~
η ):
   
1 2m2 2m
V = k 1+ + + k (η12 + η22 )

2 M2 M

1h m  m i
+ 4k 1+ − 2k ′ η1 η2 (6.87)
2 M M
"  2 #
1 2m
+ 2K 1 + (η32 + η42 )
2 M

En notación matricial V puede escribirse ası́:


1 T
V = η k̃~η
~ (6.88)
2
o usando la notación de producto escalar:
1
V = η , m̃−1 k̃~η )
(~ (6.89)
2
donde k̃ es la siguiente matriz simétrica no diagonal 4 × 4:
 
2m 2m2 ′ m m
 k(1+ M + M 2 )+k 2k (1+ )−k ′ 0 0 
 M M 
 
 
 m m 2m 2m2 
 2k (1+ )−k ′ k(1+ + 2 )+k ′ 0 0 
 M M M M 

k̃ =   (6.90)

 2m 2 
 0 0 2K(1+ ) 0 
 M 
 
 
 2m 2 
0 0 0 2K(1+ )
M
El lagrangiano será:
1 ˙ ˙ 1
L= (~ η , m̃−1 k̃~
η , ~η ) − (~ η) (6.91)
2 2
La ecuación de movimiento para ~η es:

η¨ + k̃~η¨ = 0
m̃~ (6.92)

Buscamos soluciones propias de la forma:

ηα = ~
~ µα sen(ωα t + φα ); α = 1, 2, 3, 4 (6.93)

Al reemplazar (6.93) en (6.92) obtenemos:

µα = ~0
(m̃ωα2 − k̃)~ (6.94)
186 / Mecánica clásica avanzada

La ecuación (6.94) admite soluciones no triviales para los ~µα sólo si las ωα son
tales que satisfacen la ecuación secular:
det(m̃ωα2 − k̃) = 0 ; α = 1, 2, 3, 4 (6.95)
Si usamos la siguiente notación (Classical mechanics, Corben-Stehle, capı́tulo 8):
 2 
2m m
α = 2K 1 + ; α′ = 2m 1 +
M M
(6.96)
2m m2 m
β= + 2 2; β′ =
M M M
Podemos escribir:
m̃ω 2 − k̃ =
 
m(1+β ′ )ω 2 −k(1+β)−k ′ mβ ′ ω 2 −kβ +k ′ 0 0
 
 
 ′ 2
mβ ω −kβ +k ′ ′ 2
m(1 +β )ω −k(1+β)−k ′
0 0  (6.97)
 
 
 
 0 0 α′ ω 2 − α 0 
 
 
0 0 0 α′ ω 2 −α

Usando la regla para el cálculo del determinante de una matriz M̃ :


n
X
detM̃ = Mij Cij (6.98)
i=1

donde Cij es el determinante de la matriz de los cofactores del elemento Mij :


Cij = (−1)i+j Dij (6.99)
donde Dij es el determinante menor complementario del elemento, entonces la ecuación
secular es:
n 2 2 o
m(1 + β ′ )ω 2 − k(1 + β) − k ′ − mβ ′ ω 2 − kβ + k ′
(α′ ω 2 − α)2 = 0 (6.100)
Entonces el determinante consta de tres factores, dos de ellos lineales en ω 2 y uno
cuadrático en ω 2 . Hay dos raı́ces dobles que son:
 
α K 2m
ω32 = ω42 = ′ = 1+ (6.101)
α m M
Las otras dos raı́ces son:
 
k + 2k ′ k 2m
ω12 = ; ω22 = 1+ (6.102)
m m M
Pequeñas oscilaciones de sistemas de varios grados de libertad / 187

ω1 y ω2 coinciden con las halladas cuando consideramos las oscilaciones longitu-


dinales por separado, cuando k ′ = 0. La ecuación de valores propios (6.94) es de la
forma:
    
Aα Bα 0 0 µα1 0
    
    
 Bα Aα 0 0     
   µα2   0 
  =  (6.103)
    
 0 0 C 0   µα3   0 
 α    
    
0 0 0 Cα µα4 0
Los valores de las Aα , Bα y Cα son:
 
2m  ′ m  m
A1 = 1+ k −k ; A2 = − k ′ − k
M M M
    
m 2m 2m 2m2
A3 = K 1+ 1+ −k 1+ + − k′
M M M M2
   
2m ′ 2m
C1 = 2 1+ k + 2k − K 1 +
M M
(6.104)
 2
2m
C2 = 2 1+ (k − K) ; C3 = 0
M
 
2m  ′ m m
B1 = 1+ k −k ; B2 = −k ′ − k
M M M
 
m 2m m m
B3 = K 1+ − 2k 1+ + k′
M M M M
La ecuación (6.103) da lugar a los cuatro siguientes sistemas de ecuaciones alge-
braicas:
Aα µα1 + Bα µα2 = 0 ; Bα µα1 + Aα µα2 = 0
(6.105)
Cα µα3 = 0 ; Cα µα4 = 0 ; α = 1, 2, 3, 4
Las primeras ecuaciones (6.105), dado que Aα y Bα no son cero, son:
Aα µα2 µα1
=− =− ⇒ µα1 = ±µα2 (6.106)
Bα µα1 µα2
Como se cumple que:
A1 = B1 ; A2 = −B2 y A3 6= ±B3 (6.107)
Entonces µα2 y µα1 deben necesariamente tener las relaciones:
µ11 = −µ12 ; µ21 = µ22 ; µ31 = µ41 = µ32 = µ42 = 0 (6.108)
188 / Mecánica clásica avanzada

Como C1 y C2 no son cero, en tanto que C3 es cero, se cumple:


µ13 = µ23 = µ14 = µ24 = 0
(6.109)
µ33 , µ43 , µ34 , µ44 : Arbitrarias
Tenemos en este problema seis cantidades indeterminadas. O sea que aquı́ no hay
simplemente una indeterminación por un factor arbitrario en los vectores ~µ3 y ~µ4 . Los
vectores propios para este problema son de la forma siguiente:
   
1 1
 −1   1 
µ1 = µ11 
~  
 0  ; ~µ2 = µ21  0 

0 0
    (6.110)
0 0
 0   0 
   
µ3 = µ33 
~ 1 ; µ
~ 4 = µ43  1 
 µ34   µ44 
µ33 µ43
Como en las ecuaciones (6.30), µ11 , µ21 , µ33 y µ43 pueden definirse por la condición
de normalización, sin embargo µ43 y µ44 quedan aún indeterminadas. Hay un número
infinito de vectores propios normalizados correspondientes a la frecuencia propia dege-
nerada ω3 = ω4 . La condición de normalización es:
~ Tα m̃~µα = 1 ; α = 1, 2, 3, 4
µ (6.111)
donde m̃ es la matriz (6.85). Esto nos conduce a los siguientes valores para µ11 , µ21 , µ33
y µ43 :
1 1
µ11 = √ ; µ21 = s  
2m 2m
2m 1 +
M
v (6.112)
u 1
µα3 =u
u   − µ2α4 ; α = 3, 4
t 2m
2m 1 +
M

Debido a que µ34 y µ44 son arbitrarios, µ ~ 3 y ~µ4 son linealmente independientes.
~3 y µ
µ ~ 4 generan entonces un espacio de dimensión dos, siendo cualquier vector de este
espacio un vector propio correspondiente al valor propio ω3 = ω4 . Podemos decir que a la
frecuencia propia doblemente degenerada, ω3 = ω4 , le corresponde un conjunto infinito
de vectores propios normalizados en un espacio bidimensional. Cualquier par de vectores
linealmente independientes genera el espacio; por esto podemos sin perder generalidad
escoger los vectores ~
µ3 y ~µ4 de modo que sean ortogonales entre sı́, bajo el producto
escalar (6.59):
µ33 µ43 + µ34 µ44 = 0 (6.113)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 189

Como definimos a µ33 y µ43 positivos en (6.113), entonces µ34 y µ44 deben tener
signos opuestos; (6.112) y (6.113) conducen a:
1
µ234 + µ244 =   (6.114)
2m
2m 1 +
M
Todavı́a los vectores no están bien definidos pues aún hay infinitos pares de vectores
ortonormales en el mencionado espacio bidimensional. ~µT3 y ~µT4 pueden escribirse en la
forma:
1
~ T3
µ = r (0, 0, cos δ, senδ)
2m
2m(1 + )
M
1
~ T4
µ = r (0, 0, senδ, − cos δ) (6.115)
2m
2m(1 + )
M
donde δ está comprendido entre 0 y π/2 de acuerdo con la elección del signo de µ33 y
µ43 .
Los vectores ~
µ3 y µ
~ 4 generan todas las posibles oscilaciones transversales con la
frecuencia degenerada ω3 = ω4 . Los modos normales de oscilación transversales son:

η~3T = µ
~ T3 sen(ω3 t + φ3 ) → (0, 0, d1y , d1z )
(6.116)
η~4T = η~4T sen(ω3 t + φ4 )

Vemos que δ es esencialmente el ángulo de los vectores de desplazamientos en el


plano y − z donde las oscilaciones normales tienen diferencia de fase arbitraria.

d1
(Modo µ3)
δ
y

d1 (Modo µ4)

Figura 6.5 Modos de oscilación transversales en el espacio de configuración


190 / Mecánica clásica avanzada

Podemos tomar δ = 0, con lo cual ~µ3 corresponde a las oscilaciones en “y” y ~µ4 a
las oscilaciones en “z”. Una oscilación transversal general será de la forma:
~η = C3 ~
η3 + C4 ~η4 (6.117)
Sin perder generalidad η~T puede escribirse en la forma:
~η T = C [0, 0, senγ sen(ω3 t + φ3 ), cos γ sen(ω3 t + φ4 )] (6.118)
φ3 y φ4 son arbitrarias. Si tomamos φ3 = φ4 obtenemos oscilaciones longitudinales en
una dirección que hace un ángulo γ con el eje z. Si tomamos φ3 = 0 y φ4 = π/2, el
movimiento será una circunferencia y en general será una elipse, donde γ será la dirección
del eje mayor de la elipse.
Recordando las fórmulas (6.78),
2m 2m
d2y = − d1y ; d2z = − d1z
M M (6.119)
d3y = d1y ; d3z = d1z
Vemos que el desplazamiento del átomo central es siempre contrario al de los
laterales. En general, el átomo central gira en sentido contrario a los laterales, en una
trayectoria elı́ptica, con una amplitud tal que el momento angular es cero. El movimiento
transversal general es pues una rotación de cada átomo. Véase figuras 6.3 y 6.4. Si
quisiéramos describir las nueve coordenadas del sistema, deberı́amos usar vectores 9-
dimensionales y matrices 9 × 9. Ası́ por ejemplo, en vez de ~µ3 y µ
~ 4 tendrı́amos, usando
las fórmulas (6.78):
1 2m
~eT3 = s   (0, 1, 0; 0, − M , 0; 0, 1, 0)
2m
2m 1 +
M
(6.120)
1 2m
~eT4 = s   (0, 0, 1; 0, 0, − M ; 0, 0, 1)
2m
2m 1 +
M

En el tratamiento completo aparecerán además los cinco vectores propios de fre-


cuencia cero correspondientes a las tres traslaciones y las dos rotaciones. La degeneración
puede ser removida por ejemplo introduciendo algún efecto que rompe la simetrı́a de ro-
tación de la interacción alrededor del eje de la molécula (de la cual se derivó que K no
depende de la dirección del desplazamiento). Si existiera algún efecto direccional (como
una interacción entre espines), ya no habrı́a la simetrı́a rotacional en la interacción y
desaparecerı́a la degeneración.
Este tema es susceptible de un estudio más completo usando la teorı́a de grupos
de simetrı́as. Los vectores propios constituyen representaciones del grupo de simetrı́as.
El subespacio generado por ~µ3 y µ ~ 4 es una representación irreductible bidimensional del
grupo de simetrı́as (rotaciones alrededor del eje de la molécula). En otros sistemas de
osciladores acoplados las ligaduras pueden dar lugar a cambio de frecuencia y a supresión
Pequeñas oscilaciones de sistemas de varios grados de libertad / 191

de la degeneración.

Tratamiento usando el método de diagonalización. Buscaremos una matriz


que diagonalice simultáneamente a m̃ y a k̃, de acuerdo con las fórmulas (6.66) y (6.68).
Tanto m̃ como k̃ son diagonales en bloques de matrices 2 × 2; es razonable suponer que
à sea de la misma forma:
 
D E 0 0
 
 
 F G 0 0 
 
à = 


 (6.121)
 0 0 H K 
 
 
0 0 L J

Llamaremos A, B y C a los elementos de la matriz m̃ o de la matriz k̃. Se requiere


entonces que mediante el siguiente producto se obtenga una matriz diagonal, con unos
en la diagonal si A, B y C son los elementos de m̃, y con las ω 2 si son los elementos de
k̃:
   
D E 0 0 A B 0 0 D F 0 0
   
   
 F G 0 0  B A 0 0  E G 0 0 
   
   
   
 0 0 H K  0 0 C 0  0 0 H L 
   
   
0 0 L J 0 0 0 C 0 0 K J
  (6.122)
d e 0 0
 
 
 f g 0 0 
 
=


 0 0 h l 
 
 
0 0 k j

donde hemos llamado las variables d = A(E 2 +D2 )+2BDE, e = A(AD+EG)+B(DG+


EF ), f = A(F D + EG) + B(EF + GD), g = A(F 2 + G2 ) + 2BF G, h = C(H 2 + K 2 ),
l = C(HL + JK), k = C(HL + JK) y j = C(J 2 + L2 ).
Asumimos que los elementos de à no dependen de las constantes k, k ′ y K en-
tonces, como los elementos de la matriz k̃ son combinaciones de las constantes, Ãk̃ÃT
será diagonal sólo si:

DF + EG = 0 ; DG + EF = 0 ; HL + JK = 0 (6.123)

Esto implica las relaciones siguientes entre los elementos de A:

G = F , D = −E o G = −F , D = E (6.124)
192 / Mecánica clásica avanzada

˜ Por
Cuando A, B y C son los elementos de m̃, entonces (6.122) debe ser igual a I.
tanto se cumple, usando las relaciones de la izquierda en (6.124), que:
2D2 A − 2BD2 = 1 ; 2F 2 A + 2F 2 B = 1
(6.125)
C(H 2 + K 2 ) = C(J 2 + L2 ) = 1
Recordando la expresión para A y B en m̃, ecuación (6.85), obtenemos para D y
F:
1 1
D=√ = −E ; F = s   =G (6.126)
2m 2m
2m 1 +
M

En (6.126) por convención tomamos las raı́ces cuadradas positivas. Por otra parte,
para H, K, L, J, obtenemos las relaciones:
K = L , H = −J o K = −L , H = J (6.127)
Como hay sólo tres ecuaciones para determinar las cuatro incógnitas H, K, J, L,
podemos asignar el valor a una de ellas arbitrariamente. Sea que:
cos δ π
H=s   ; ≤δ≤ 2 (6.128)
2m
2m 1 +
M

Con ello obtenemos las siguientes expresiones para J, K, L:


sen δ
J = −H ; K = s   =L (6.129)
2m
2m 1 +
M

Entonces la matriz à tiene la siguente expresión explı́cita:


 r r 
2m 2m
 1+ M 1+
M
0 0 
 
 
 
1  1 1 0 0 
à = r   (6.130)
2m  


2m(1 + ) 0 0 cos δ senδ 
M  
 
0 0 senδ cosδ

Vemos que las filas de à coinciden con los vectores propios ~µα hallados anterior-
mente. Cuando tomamos como A, B y C los elementos de k̃ de la ecuación (6.96),
encontramos:
A(E 2 + D) + 2BDE = ω12 ; A(F 2 + G2 ) + 2BF G = ω22
(6.131)
C(H 2 + K 2 ) = C(J 2 + L2 ) = ω32
Pequeñas oscilaciones de sistemas de varios grados de libertad / 193

donde ω12 , ω22 y ω32 están dados en las ecuaciones (6.101) y (6.102). En este problema
el procedimiento de diagonalización se simplificó debido a la forma de m̃ y k̃ que nos
permitió partir de la forma (6.121) para la matriz Ã. Para sistemas más complicados no es
tan simple la elección de la forma de Ã. A pesar de esto, muchas veces la ecuación secular
resulta mucho más complicada, por requerir primero la evaluación de un determinante y
luego el cálculo de las raı́ces de una ecuación algebraica de grado l. En estos casos, donde
l es grande y m̃ y k̃ complicadas, es más conveniente el método de la diagonalización,
que se realiza usualmente en forma numérica, por ejemplo mediante el método numérico
de diagonalización de Jacobi.

Ejemplo 6.2.1 Una partı́cula se mueve en presencia de un potencial central de la forma:

A
V (r) = − (6.132)
rn−1
suponiendo que la órbita es circular, hallar los valores de n para los cuales hay pequeñas
oscilaciones estables.
Este es un ejemplo de pequeñas oscilaciones alrededor de un movimiento estable.
Se entiende por estabilidad el hecho de tender al estado de equilibrio al ser sometido el
sistema a una distorsión. En fuerzas centrales la órbita es plana, con lo cual podemos
describir la partı́cula con las coordenadas polares r, θ. El lagrangiano es:
1 A
L= m(ṙ2 + r2 θ̇) + n−1 (6.133)
2 r
Las ecuaciones de movimiento de Lagrange son:

mr̈ − mrθ̇2 + (n − 1)Ar−n = 0


(6.134)
mr2 θ̈ + 2mrṙ θ̇ = 0

El movimiento de “equilibrio” es circular uniforme, o sea que son constantes:

r = r0 y θ̇ = ω0 (6.135)

Si se hacen pequeñas alteraciones a este movimiento estable, ρ al radio y φ̇ a la


velocidad angular, habrá oscilaciones si el movimiento es estable,

r = r0 + ρ y θ̇ = ω0 + φ̇ (6.136)

En el movimiento de equilibrio se cumple que:

mr0 ω02 = (n − 1)Ar0−n (6.137)

Entonces las ecuaciones de movimiento para los pequeños desplazamientos ρ y φ̇,


al primer orden en los mismos, son:

mρ̈ − mω02 ρ − 2mr0 ω0 φ̇ − n(n − 1)Ar0−n−1 ρ = 0


(6.138)
mr02 φ̈ + 2mr0 ω0 ρ̇ = 0
194 / Mecánica clásica avanzada

estas son ecuaciones lineales acopladas para ρ y φ̇. Buscamos ahora los “modos normales
de oscilación” de ρ y φ̇:

ρ = ρ0 sen(ωt + α) ; φ̇ = φ̇0 sen(ωt + α) (6.139)

donde ω es la frecuencia propia del modo normal (esperamos que haya dos frecuencias),
y α la fase, como en la ecuación (6.93). ρ0 y φ̇0 son las componentes de los vectores
propios ~
µ, que satisfacen las ecuaciones algebraicas:
 
−m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 −2mω0 ωr0
 
2mω0 ωr0 mr02 ω
   
ρ0 0
× =  (6.140)
φ̇0 0

El sistema (6.140) tiene soluciones no triviales sólo si:

mωr02 [−m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 + 4mω02 ω] = 0 (6.141)

Las raı́ces de (6.141) son:

ω2 = 0 y ω 2 = (3 − n)ω02 (6.142)

La segunda raı́z si n < 3 conduce a una ω real, y si n > 3 es imaginaria. Si n=3


el movimiento es degenerado con dos raı́ces ω = 0. El movimiento será, pues, estable
solamente si n < 3. Para una órbita de Kepler, por ejemplo n = 2. Entonces:

ω02 = ω 2 (6.143)

ω0 es la frecuencia de rotación de la partı́cula. ω es la frecuencia de las oscilaciones en


el radio de la órbita y en la velocidad angular que coinciden con ω0 .
Para un potencial central armónico, V = Ar2 , n = −1, entonces:

ω = 2ω0 (6.144)

La frecuencia ω 2 = 0 corresponde a un desplazamiento de una órbita circular a


otra, o sea, a otro movimiento estable; no hay oscilaciones sino simplemente un cambio
constante en el radio de la órbita y en la velocidad angular. Hay una forma simple de
calcular directamente la frecuencia de las pequeñas oscilaciones.
La partı́cula se mueve radialmente dentro un “pozo” que consta del potencial
centrı́fugo y el potencial externo:

A 1 A l2
Vef (r) = − + mr2 θ̇2 = − n−1 + (6.145)
rn−1 2 r 2mr2
En el movimiento estable el potencial tiene un mı́nimo. Para pequeños desplaza-
mientos del movimiento estable, el “pozo” de potencial puede aproximarse a un pozo
Pequeñas oscilaciones de sistemas de varios grados de libertad / 195

parábolico. El problema consiste en determinar para qué valores de n es posible la for-


mación del potencial parábolico. Vef (r) puede expandirse alrededor de r0 para pequeños
desplazamientos:

dVef (r) 1 d2 Vef (r)
Vef (r) ≈ Vef (r0 ) + ρ + ρ2 =
dr r=r0 2 dr2 r=r0
(6.146)
1 2
Vef (r0 ) + kρ
2
donde el término lineal en ρ se anula en el equilibrio y k es la “constante de resorte”:

d2 Vef (r)
k= (6.147)
dr2 r=r0
La frecuencia de las pequeñas oscilaciones en r será:

2 1 d2 Vef (r)
ω = (6.148)
m dr2 r=r0

Efectuando las operaciones indicadas en (6.148), usando la relación (6.137) que se


cumple en la posición de equilibrio, y notando que la magnitud del momento angular es
l = mω0 r02 , llegamos finalmente al resultado ω 2 = (3 − n)ω02 , que nos da directamente
la frecuencia de las pequeñas oscilaciones alrededor de la órbita circular estable.

6.3. Un campo mecánico unidimensional:


la cuerda uniforme
Primero estudiaremos el sistema de n partı́culas de masa m unidas entre sı́ por
cuerdas elásticas sin masa. La cuerda uniforme se obtendrá del problema anterior co-
mo un caso lı́mite en que las masas se distribuyen uniformemente formando un continuo.

La cuerda estirada sin masa con un conjunto discreto de masas. Sea


una cuerda de longitud L a la cual se adhieren n masas iguales equidistantemente. La
cuerda está estirada y fija en sus extremos. Estudiaremos las oscilaciones transversales.
La longitud de cada segmento de cuerda en la posición de equilibrio es d = xi − xi−1 ;
i = 1, 2, ...n + 1. Entonces L = (n + 1)d.
Para los desplazamientos longitudinales, la energı́a potencial resulta de la elas-
ticidad de la cuerda k. Para los desplazamientos transversales, la contribución de la
elasticidad de la cuerda es de cuarto orden en la elongación, la demostración se propone
como un ejercicio; ası́ que la contribución cuadrática viene directamente de la tensión
de la cuerda τ . La tensión es independiente de los desplazamientos transversales si estos
son infinitesimales. El trabajo realizado para estirar un segmento es igual a la tensión
(constante) por la elongación. De modo que la energı́a potencial del segmento i cuando
la partı́cula i − 1 se desplaza transversalmente ηi−1 , y la partı́cula i en ηi , es:
hp i
Vi = τ d2 + (ηi − ηi−1 )2 − d (6.149)
196 / Mecánica clásica avanzada

η1 ηi + 1 ηn
η2 ηi – 1 ηi ηi + 1 ηn – 1 x
x1 x2 xi – 1 xi xi + 1 xi + 2 xn – 1 xn xn – 1
x0 = 0 d = L

Figura 6.6 Cuerda estirada sin masa con un conjunto discreto de masas

de modo que para pequeños desplazamientos la energı́a potencial total es:


n+1
1τ X
V = (ηi − ηi−1 )2 (6.150)
2d
i=1

El espacio de configuración es n-dimensional y las matrices m̃ y k̃ son de dimensión


n × n. En notación matricial:
1
V = ~η T k~η (6.151)
2
donde η~T = (η1 , η2 , ...ηn ) y la matriz k̃ es:
 
2 −1 0 0 ··· 0 0
 
 
 −1 2 −1 0 ··· 0 0 
 
 
 
 0 −1 2 −1 · · · 0 0 
 
 
τ 



k̃ =  0 0 −1 2 ··· 0 0  (6.152)
d 
 
 .. .. .. .. .. .. .. 
 . . . . . . . 
 
 
 
 0 0 0 0 ··· 2 −1 
 
 
0 0 0 0 · · · −1 2
La energı́a potencial es:
T
T = ~η˙ m̃~η˙ (6.153)
donde la matriz m̃ es un múltiplo de la matriz unidad:
m̃ = mI˜ (6.154)
La ecuación de valores propios es:
µα = ~0; α = 1, 2, ...n
(−ωα2 m̃ + k̃)~ (6.155)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 197

Explı́citamente las ecuaciones de valores propios son:


τ  τ  τ
− µαi−1 + 2 − mωα2 µαi − µαi+1 = 0; i = 1, 2, ...n (6.156)
d d d
En (6.156) se debe cumplir µα0 = µα n+1 = 0. La matriz n × n en (6.155) es:
 
λ −1 0 0 ··· 0 0
 
 
 −1 λ −1 0 ··· 0 0 
 
 
 
 0 −1 λ −1 · · · 0 0 
 
 
2 τ
 0 0 −1 λ ··· 0 0 
 τ
−m̃ωα + k̃ =   = D̃ (6.157)
d  d
 
 .. .. .. .. .. .. .. 
 . . . . . . . 
 
 
 
 0 0 0 0 ··· λ −1 
 
 
0 0 0 0 ··· −1 λ

donde λ depende de ωα :

d
λ = 2 − mωα2 (6.158)
τ

Llamemos Dn al determinante de la matriz D̃, que es un polinomio de grado n


en λ. Haciendo tomar a n los valores 1, 2, 3, ..., obtenemos la siguiente secuencia de
polinomios:

D1 = λ

D2 = λ2 − 1

D3 = λ3 − 2λ = λD2 − D1

D4 = λ4 − 3λ2 + 1 = λD3 − D2 (6.159)

D5 = λ5 − 4λ3 + 3λ = λD4 − D3

D6 = λ6 − 5λ4 + 6λ2 − 1 = λD5 − D4


.. ..
. .

Notamos la siguiente relación de recurrencia entre los polinomios:

Dk = λDk−1 − Dk−2 ; k = 1, 2, ...n (6.160)


198 / Mecánica clásica avanzada

Los coeficientes de las potencias de λ pueden escribirse en términos de los números


combinatorios. Ası́ por ejemplo:
     
9 8 7
D9 = λ9 − λ7 + λ5
9 7 5
   
6 5
− λ3 + λ
3 1
      (6.161)
10 10 9 8 8 6
D10 = λ − λ + λ
10 8 6
     
7 4 6 2 5
− λ + λ −
4 2 0

De (6.161) se puede obtener fácilmente una generalización. Las fórmulas resultantes


se demuestran fácilmente por el método matemático de inducción,
 n 
Xn/2 +k
 2  k+1 2k
Dn =   (−1) λ si n es par
k=0 2k
  (6.162)
n + 1
(n−1)/2
X  +k
2  k 2k+1
Dn =   (−1) λ si n es impar
k=0
2k + 1

Es conveniente el siguiente cambio de variable:

λ = 2 cos β (6.163)

En términos de β obtenemos la secuencia siguiente de los Dk :

D1 = 2 cos β

D2 = 2 cos 2β + 1

D3 = 2(cos 3β + cos β)
(6.164)
D4 = 2(cos 4β + cos 2β) + 1

D5 = 2(cos β + cos 3β + cos 5β)

D6 = 2(cos 6β + cos 4β + cos 2β) + 1

Se pasa de (6.159) a (6.164) usando identidades trigonométricas (fórmulas 5.53 a


5.67 del manual de fórmulas matemáticas de Spiegel). La generalización de (6.164) es
Pequeñas oscilaciones de sistemas de varios grados de libertad / 199

simple; el resultado es:


n/2
X
Dn = 2 cos 2kβ + 1 ; si n es par
k=1
(6.165)
(n−1)/2
X
Dn = 2 cos(2k + 1)β ; si n es impar
k=0

Las fórmulas (6.165) se pueden simplificar usando

(ei2β )k + (e−i2β )k
cos 2kβ = (6.166)
2
y similarmente para (2n + 1)β. Notamos luego que se obtienen series geométricas de
potencias. La expresión para la suma cerrada de una serie geométrica es conocida. En
este caso la razón de la serie es e±2β :
1 − (ei2β )r+1
1 + ei2β + (ei2β )2 + ...(ei2β )r = (6.167)
1 − ei2β
que vale si ei2β 6= 1. Ası́, si n es par:

1 − (ei2β )(n/2+1)
Dn = 2Re −1 (6.168)
1 − ei2β
El resto es un cálculo trigonométrico. Para n impar el procedimiento es similar.
El resultado final es que, para todo n:
sen(n + 1)β
Dn = ; n par o impar (6.169)
senβ
Se sigue entonces que la ecuación secular correspondiente a (6.156) es:

sen(n + 1)βα = 0; α = 1, 2, ...n (6.170)

Esta ecuación tiene n raı́ces, (n + 1)βα = απ, o sea:


π
βα = α ; α = 1, 2, ...n (6.171)
n+1
Entonces los λ serán, usando (6.163):
απ
λα = 2 cos ; α = 1, 2, ...n (6.172)
n+1
Recordando la relación entre las λα y las ωα , ecuación (6.158), obtenemos para las
frecuencias propias:
r
τ απ
ωα = 2 sen ; α = 1, 2, ...n (6.173)
md 2(n + 1)
200 / Mecánica clásica avanzada

Para hallar los vectores propios, reemplazamos a (6.157) en (6.155):


    
λα −1 0 0 ··· 0 0 µα1 0
 −1 λα −1 0 · · · 0 0   µα2   0 
    
 0 −1 λα −1 · · · 0 0     
   µα3   0 
 0 0 −1 λα · · · 0 0     
  =  (6.174)
 .. .. .. .. .. .. ..   ..   .. 
 . . . . . . 
.  .   . 
   
 0 0 0 0 · · · λα −1   µαn−1   0 
0 0 0 0 · · · −1 λα µαn 0

La ecuación (6.174) representa el siguiente sistema de ecuaciones lineales:

µα2 = λα µα1
µα3 = (λ2α − 1)µα1
µα4 = (λ3α − 2λα )µα1
µα5 = (λ4α − 3λ2α + 1)µα1
..
. (6.175)
senkβα
µαk = Dk−1 (λα )µα1 = µα1
senβα
..
.
α, k = 1, 2, ...n

La última lı́nea de (6.175) también puede obtenerse comparando a (6.160) con la


relación de recurrencia para los µαk , (6.156):

µα,k+1 = λα µα,k − µα,k−1 ; α, k = 1, 2, ...n (6.176)

Entonces los vectores propios son:


µα1
~ Tα =
µ (senβα , sen2βα , ...sennβα ); α = 1, 2, ...n (6.177)
senβα
µα1 es una constante que se determina por normalización:
n
µ2α1 X
(~ µα ) = m~µTα · ~µα = m
µα , ~ sen2 kβα = 1 (6.178)
sen2 βα
k=1

La sumatoria en (6.178) se puede tratar como una serie geométrica:


n
X n
1X
sen2 kβα = (1 − cos 2kβα )
2
k=1 k=0

n
n + 1 1 X i2βα k (6.179)
= − Re (e )
2 2
k=1

n + 1 sen(n + 1) βα cos 2nβα


= −
2 2senβα
Pequeñas oscilaciones de sistemas de varios grados de libertad / 201

como, según (6.170), sen(n + 1)βα = 0, se sigue que:

2 sen2 βα
µ2α1 = (6.180)
(n + 1)m

llamando M a la masa total, M = nm, (6.180) y (6.175) nos dan:


r
2 αk π
µαk = sen = µkα ; α, k = 1, 2, ...n (6.181)
M +m n+1
Como debe ser, las ~
µα son ortogonales pues todas las frecuencias propias ωα son
no degeneradas:
n
2 X
(~
µα , ~
µα ) = m~µα · µ
~β = senkβα senkββ = δαβ (6.182)
n+1
k=1

Las coordenadas normales para este problema son:


 r 
τ απ
θα = Cα sen 2 sen t + φα ; α = 1, 2, ...n (6.183)
md 2(n + 1)

p La matriz à que realiza la transformación de ~η a ~θ, η~ = Ãθ~ es simétrica, Aαβ =


2/(M + m) sen[αβπ/(n + 1)]:
 
π 2π nπ
 sen n + 1 sen n + 1 · · · sen
n+1 
 
 
 2nπ 
 sen 2π sen

· · · sen 
r  
2  n+1 n+1 n+1 
à =   (6.184)
M +m  
.. .. .. .. 
 . . . . 
 
 
 
 nπ 2nπ n π 
2
sen sen · · · sen
n+1 n+1 n+1
Una oscilación arbitraria del sistema está descrita por una superposición de las
oscilaciones propias:
n
X  r 
αiπ τ απ
ηi (t) = Cα sen sen 2t sen + φα (6.185)
α=1
n+1 md 2(n + 1)

En los modos normales de oscilación todas las partı́culas están sobre una curva si-
nusoidal cuya longitud de onda depende del orden del modo, o sea de la frecuencia ωα . Es
una solución del tipo “onda estacionaria”, determinada por las condiciones de frontera
µα0 = µαn+1 . Corben y Stehle obtienen a partir de esta solución la solución para una on-
da viajera, imponiendo las condiciones de frontera periódicas, µα0 = µαn y µα1 = µαn+1 .
202 / Mecánica clásica avanzada

La cuerda uniforme. Lagrange demostró que mediante un procedimiento de paso


al lı́mite las oscilaciones de la cuerda uniforme pueden obtenerse a partir de las de la
cuerda cargada. La densidad lineal de masa ρ es:
M nm n m
ρ= = = (6.186)
L L n+1 d
en (6.173) puede obtenerse en el lı́mite en que n → ∞, m → 0, d → 0 manteniendo m/d
constante:
m
lı́m ρ = (6.187)
n→∞ d
Entonces el lı́mite de ωα cuando n → ∞ es:
r
τ (n + 1)n απ
ωα = 2 sen
ρ L2 2(n + 1)
r r (6.188)
2 τ απ π τ
→ =α ; α = 1, 2, ...∞
L ρ 2 L ρ
p
Esto expresa la Ley de Mersenne. ω1 = (π/L) τ /ρ es la frecuencia del tono
fundamental de una cuerda y ωα es el armónico de orden α. Cuando n → ∞, el número
de modos normales de oscilación es infinito aunque es contable. En cambio el ı́ndice que
numera las partı́culas se convierte en una variable continua:
x → kd ; k = 0, 1, 2, ...∞ ; d→0 (6.189)
x es una variable que define la posición de la partı́cula k. Entonces la fórmula
(6.181) se convierte en:
r  πx 
2
µα,k → µα (x) = sen α ; α = 1, 2, ...∞ (6.190)
M L
Una oscilación general de la cuerda estará dada por:
X∞  r 
απx απ τ
η(x, t) = Cα sen sen t + φα (6.191)
α=1
L L ρ

donde Cα y φα es un conjunto contable infinito de constantes arbitrarias. Ã ya no


será una matriz, pues si bien las filas siguen siendo contables, las columnas forman un
continuo. Las fórmulas de transformación entre las coordenadas ~η y las coordenadas ~θ
son:

X
η(x, t) = µα (x)θα (t) (6.192)
α=1
En vez de la matriz m̃ con elementos mij = mδij debemos tener una función delta
de Dirac, de modo que Ãm̃ÃT = I˜ se convierte en:
Z L Z L Z L
ρ dx dy µα (x)δ(x − y)µβ (y) = ρµα (x)µβ (x)dx =
0 0 0
(6.193)
Z L
2 απx βπx
dx sen sen = δαβ
L o L L
Pequeñas oscilaciones de sistemas de varios grados de libertad / 203

En vez de los elementos de m̃ y k̃, debemos tener:

m(x, x′ ) = ρδ(x − x′ )

τ
k(x, x′ ) = [2δ(x − x′ ) − δ(x − x′ − d) − δ(x − x′ + d)] (6.194)
d2
d2
= −τ 2 δ(x − x′ )
dx

Ãk̃ ÃT = ω̃ se convierte en:


Z L Z L
τ 
2
dx dx′ µα (x) 2δ(x − x′ ) − δ(x − x′ + d)−
d 0 0 
δ(x − x′ − d) µβ (x)
( Z )
L
τ 1
= 2 2 δαβ − µα (x) [µβ (x − d) + µβ (x + d)] dx
d ρ 0
(6.195)
( Z )
L
τ 2 2 απx βπx βπd
= δαβ − sen 2sen cos dx
d2 ρ M 0 L L L
 
2 τ πβd 4τ βπd
= 1 − cos δαβ = 2 sen2 δαβ
ρ d2 L ρd 2L

Entonces, los elementos diagonales de Ãk̃ ÃT son, tomando d → 0:

π2 τ
ωβ2 = β 2 (6.196)
L2 ρ

como debe ser. En vez de las ecuaciones algebraicas (6.156) tendremos ahora una ecua-
ción diferencial. En efecto, (6.156) se convierte en:
 
τ 2τ τ
− µα (x − d) + − ρdωα2 µα (x) − µα (x + d) = 0 (6.197)
d d d

Podemos escribir a (6.197) en la forma:


τ τ
[µα (x) − µα (x − d)] − [µα (x + d) − µα (x)] = ρdωα2 µα (x) (6.198)
d d
En el lı́mite cuando d → 0, en el lado izquierdo obtenemos:

−τ [µ′α (x) − µ′α (x + d)] = ρ dωα2 µα (x) (6.199)

Tomando una vez más el lı́mite cuando d tiende a cero obtenemos:


d2 µα (x) ρ 2
+ ωα µα (x) = 0; α = 1, 2, ...∞ (6.200)
dx2 τ
204 / Mecánica clásica avanzada

Reemplazando a (6.196) en (6.200) vemos que efectivamente (6.190) es la solución


de (6.200). De (6.188) podemos obtener la ecuación diferencial que obedece la amplitud
dependiente del tiempo. En efecto:
X∞  απ 2  r 
∂2η απx απ τ
= − Cα sen sen t + φα
∂x2 α=1
L L L ρ
(6.201)
X∞  απ 2 τ  r 
∂2η απx απ τ
= − C sen sen t + φα
∂t2 α=1
L ρ L L ρ

De donde:
∂2η ρ ∂2η
2
− =0 (6.202)
∂x τ ∂t2
Esta ecuación se obtiene también directamente de (6.15) y (6.195). Es la ecua-
ción de onda en una dimensión. Hemos llegado a la teorı́a de las ondas mecánicas. No
seguiremos con el tema, que nos aleja del propósito del presente capı́tulo.
7
Cinemática del cuerpo rı́gido

7.1. Definición de cuerpo rı́gido


Es un sistema de partı́culas sometidas a las siguientes ligaduras holónomas:

|~ri − ~rj | = lij = Constante; i, j = 1, 2, ...N (7.1)

El número de relaciones de este tipo es:


 
N 1
= N (N − 1) (7.2)
2 2

Para N > 7 el número de ligaduras excede el número de coordenadas 3N . En


realidad, para N ≥ 4 el número de ligaduras independientes es menor que el número dado
por (7.2). Sea un cuerpo rı́gido formado por más de tres partı́culas no colineales. Dados
tres puntos no colineales del cuerpo rı́gido, las ligaduras fijan las posiciones de todos los
demás puntos, pues para ubicar un punto en el espacio bastan sólo las distancias a tres
puntos no colineales (véase figura 7.1). Luego, para especificar los grados de libertad de
un cuerpo rı́gido, basta determinar el número de coordenadas independientes necesarias
para ubicar la posición de tres puntos del cuerpo rı́gido. Como entre los tres puntos
dados, no colineales, hay tres condiciones de ligadura, r12 = l12 , r23 = l23 , r13 = l13 ,
se necesitan 9 − 3 = 6 coordenadas independientes para especificar la posición de tres
puntos no colineales del cuerpo rı́gido. En consecuencia el número de grados de libertad
de un cuerpo rı́gido es seis.
Otra manera de hallar lo anterior es la siguiente. Para especificar la posición del
punto 1 se requieren tres coordenadas. Para especificar la posición del punto 2, dado
el punto 1 y la distancia r12 se requieren dos coordenadas. Para especificar la posi-
ción del punto 3, dados los puntos 1 y 2 y las distancias r23 y r13 , se requiere sólo una
coordenada. O sea que en total se requieren seis coordenadas para ubicar los tres puntos.

205
206 / Mecánica clásica avanzada

l12 2
1
l23
l13
3

Figura 7.1 Posición de un punto respecto de tres puntos no colineales del cuerpo rı́gido

7.2. Sistemas de coordenadas espacial


y del cuerpo rı́gido
Para especificar la posición de un cuerpo rı́gido es suficiente: (a) Especificar la
posición en el espacio de un punto cualquiera del cuerpo, para ello se requieren tres
coordenadas; (b) Especificar la orientación del cuerpo respecto a unas coordenadas fijas
en el punto mencionado, para ello se requieren tres coordenadas dado que seis es el
número total de grados de libertad.
El sistema de coordenadas η, ξ, ζ, está fijado al cuerpo rı́gido (véase figura 7.2).
El sistema de coordenadas x′ , y ′ , z ′ , se obtiene del sistema x, y, z, sólo por translación
al origen de coordenadas fijado al cuerpo rı́gido.

z′

r′
r y′
a
η

ξ
x′
x

Figura 7.2 Sistemas de coordenadas espacial y del cuerpo rı́gido


Cinemática del cuerpo rı́gido / 207

Para una partı́cula del cuerpo rı́gido se tiene:


~r = ~r′ + ~a (7.3)
En el sistema de coordenadas del cuerpo rı́gido la partı́cula tiene coordenadas
η, ξ, ζ y en el sistema de coordenadas trasladado tiene coordenadas x′ , y ′ , z ′ . Estas
coordenadas difieren por una rotación, o sea que están relacionadas entre sı́ mediante
una transformación lineal:
   ′ 
η x
   
   
 ξ  = Ã  y ′  (7.4)
   
   
ζ z′
donde à es la matriz de la transformación. Llamemos las coordenadas ası́:
x1 = x x′1 = x′ x1 = η a1 = ax

x2 = y x′2 = y ′ x2 = ξ a2 = ay (7.5)

x3 = z x′3 = z ′ x3 = ζ a3 = az
Con lo cual podemos describir:
3
X
xi = x′i + ai ; xi = aij x′j ; i = 1, 2, 3 (7.6)
j=1

donde aij son los elementos de la matriz Ã. La transformación de las coordenadas espa-
ciales (x) a las coordenadas del cuerpo rı́gido (x) son:
3
X
xi = a−1
ij xj + ai i = 1, 2, 3 (7.7)
j=1

donde a−1ij son los elementos de la matriz inversa ã


−1 −1
. Obviamente aij no es l/aij ·. a−1
ij
son un conjunto de nueve números que especifican la dirección de los ejes de coordenadas
fijos al cuerpo respecto a los ejes de coordenadas situados en el mismo punto de los
anteriores pero no rotados respecto a los espaciales.
Como la descripción del movimiento translacional del cuerpo rı́gido es posible usan-
do los métodos de la cinemática de partı́culas, podemos sin perder generalidad hacer
coincidir los sistemas de coordenadas (x) y (x′ ).
Nos interesaremos pues, en la relación entre las coordenadas (x) y (x). La longitud
del vector ~r es la misma en los dos sistemas de coordenadas con origen común: r2 = r 2 .
Por tanto:
  !
X3 3
X X3 X3
2
r = xi xi =  −1 
aij xj −1
a xk ik
i=1 i=1 j=1 k=1
(7.8)
3
X 3 X
X 3
r2 = xi xi = δjk xj xk
i=1 j=1 k=1
208 / Mecánica clásica avanzada

Igualando las ecuaciones (7.8) obtenemos:


3 X3 3 X 3 3
!
X X X
−1 −1
δjk xj xk = aij aik xj xk (7.9)
j=1 k=1 j=1 k=1 i=1

Como las x son independientes por definición, se sigue que:


3
X
a−1 −1
ij aik = δjk (7.10)
i=1

En términos de los elementos (Ã−1 T )lm de la matriz traspuesta de la matriz Ã−1 , que
se obtiene por intercambio de filas y columnas, podemos escribir (7.10) como:
3
X
˜ jk
(Ã−1 T )ij (Ã−1 )ik = (I) (7.11)
i=1

donde I˜ es la matriz identidad 3 × 3. En forma de matriz (7.11) es:

Ã−1 T Ã−1 = I˜ ⇒ Ã−1 = ÃT (7.12)

donde hemos usado el hecho de que: Ã−1 Ã = I˜ y (Ã−1 T )T = Ã−1 .


Llegamos a la conclusión que: Ã−1 = ÃT . Una matriz para la cual su inversa
coincide con su transpuesta se llama ortogonal.
La matriz de rotación à contiene nueve parámetros, pero entre ellos hay las rela-
ciones:
3
X 3
X
aji aTik = δjk ⇒ aji aki = δjk (7.13)
i=1 i=1

Tres relaciones se obtienen cuando j = k:


3
X
(aji )2 = 1; j = 1, 2, 3 (7.14)
i=1

Hay seis relaciones cuando j 6= k:


3
X
aji aki = 0 j 6= k; j, k = 1, 2, 3 (7.15)
i=1

Pero de (7.15) también se sigue que:


3
X
aki aji = 0 j 6= k; j, k = 1, 2, 3 (7.16)
i=1

O sea que sólo hay tres relaciones independientes para j 6= k. En total hay seis
relaciones entre los elementos de la matriz Ã. Como era de esperarse, Ã contiene sólo
tres parámetros independientes.
Cinemática del cuerpo rı́gido / 209

x2
x2

r,r

x1

θ
θ
φ
x1

Figura 7.3 Rotación de los ejes (x) alrededor del eje x3 = x3 .

Ejemplo 7.2.1 Supongamos que los ejes (x) y (x) difieren simplemente por una rotación
por un ángulo φ alrededor del eje x3 = x3 (véase figura 7.3). Encontrar las fórmulas de
transformación.

Las fórmulas de transformación se obtienen fácilmente de la figura 7.3, que repre-


senta el plano x1 − x2 :

x= r cos θ
(7.17)
x= r senθ

donde hemos usado que r = r. Como θ = θ − φ podemos escribir:

cos θ = cos θ cos φ + senθ senφ


(7.18)
senθ = senθ cos φ − cos θ senφ

Teniendo en cuenta que:

x1 = r cos θ ; x2 = r senθ (7.19)

Se sigue inmediatamente que las fórmulas de transformación son:

x1 = x1 cos φ + x2 senφ

x2 = −x1 senφ + x2 cos φ (7.20)

x3 = x3
210 / Mecánica clásica avanzada

O en forma de matriz:
    
x1 cos θ senφ 0 x1
    
    
 x2  =  −senφ cos φ 0   x2 
  (7.21)
   
    
x3 0 0 1 x3
Esta matriz satisface idénticamente las relaciones de ortogonalidad (7.13). Para
j = k:
j= primera fila , cos2 φ + sen2 φ + 02 = 1

j= segunda fila , sen2 φ + cos2 φ + 02 = 1 (7.22)

j= tercera fila , 02 + 02 + 12 = 1
satisface también las relaciones para j 6= k (ortogonalidad de las filas entre sı́ o de las
columnas entre sı́):
j = 1, k = 2 ( 1a y 2a filas) : − cos φ senφ + senφ cosφ + 0 = 0

j = 1, k = 3 ( 1a y 3a filas) : 0 +0 +0 =0 (7.23)

j = 1, k = 2 ( 2a y 3a filas) : 0 +0 +0 =0
y similarmente para la ortogonalidad entre columnas.
En general, las relaciones (7.13) pueden expresarse en la siguiente manera. Para
una matriz ortogonal à se cumple que el producto escalar de una fila por sı́ misma, o
de una columna por sı́ misma, es igual a la unidad. Dos filas diferentes o dos columnas
diferentes son ortogonales entre sı́. No es cierto sin embargo que una fila sea ortogonal
a una columna. Es claro en el ejemplo anterior que Ã−1 = ÃT .

7.3. Los cosenos directores


Sean dos sistemas de ejes cartesianos con origen común (x) y (x). Los ejes (x) están
rotados respecto a los ejes (x). Sean ~e1 , ~e2 y ~e3 tres vectores unitarios a lo largo de los
ejes x1 , x2 y x3 respectivamente. Sean ~e′1 , ~e′2 y ~e′3 los tres vectores unitarios a lo largo
de los ejes x1 , x2 y x3 respectivamente. Se definen los cosenos directores de los ejes (x)
respecto a los ejes (x) como los cosenos de los ángulos que hacen cada uno de los ejes
(x) con cada uno de los ejes (x). Los denotaremos αij . De su definición se sigue que:
αij = ~e′i · ~ej ; i, j = 1, 2, 3 (7.24)
Es claro que αij es el coseno del ángulo entre el eje xi y el eje xj . En total hay
nueve cosenos directores, que no son independientes. Es claro que la transformación de
los vectores ~ei a los vectores ~e′i es:
3
X 3
X
~e′i = αij ~ej = (~e′i · ~ej )~ej (7.25)
j=1 j=1
Cinemática del cuerpo rı́gido / 211

en efecto:
3
X 3
X
~e′i · ~ek = (~e′i · ~ej )(~ej · ~ek ) = (~e′i · ~ej )δjk = ~e′i · ~ek (7.26)
j=1 j=1

Un vector cualquiera V~ puede expresarse de dos maneras equivalentes:


3
X 3
X
V~ = Vi~ei = Vi′~e′i (7.27)
i=1 i=1

Multiplicando escalarmente (7.27) a ambos lados por ~e′k :


3
X 3
X
Vi~ek · ~ei = Vi′~e′k · ~e′i = Vk′ (7.28)
i=1 i=1

~ se transforman de la siguiente manera:


Por tanto se tiene que las componentes de V
3
X
Vk′ = αkj Vj (7.29)
j=1

En tanto que:
3
X
~e′k = αkj ~ej (7.30)
j=1

Es decir, las componentes de los vectores se transforman de la misma manera que


los vectores unitarios. Notamos que las componentes Vi y Vi′ de V~ se pueden escribir
como:

Vi = ~ei · V~ ; Vi′ = ~e′i · V~ (7.31)

De acuerdo con (7.29):


3
X
~ =
Vi′ = ~e′i · V (~e′i · ~ej )(~ej · V~ ) (7.32)
j=1

~ como ~e′ , según (7.32):


Tomando V i

3
X 3
X
1= (~e′i · ~ej ) → α2kj = 1 ; i = 1, 2, 3 (7.33)
j=1 j=1

~ como ~e′ con k 6= i, según (7.32):


Tomando V k

3
X 3
X
0= (~ei · ~ej )(~ej · ~e′k ) → αij αkj = 0 ; i, k = 1, 2, 3 (7.34)
j=1 j=1
212 / Mecánica clásica avanzada

Vemos que la fórmula de transformación de los vectores ~e′i a los vectores ~ei es:
3
X 3
X
~ei = αij ~e′j = (~e′j · ~ei )~e′j (7.35)
j=1 j=1

puesto que:
3
X
~ei · ~e′k = (~e′j · ~ei )δjk = (~e′k · ~ei ) (7.36)
j=1

Esto nos dice que la matriz traspuesta de (αij ) produce la rotación de los ejes (x)
a los ejes (x). Las componentes de un vector se transforman según:
3
X 3
X
Vk = αjk Vj′ = αTkj Vj′ (7.37)
j=1 j=1

Las relaciones (7.33) y (7.34) entre los cosenos directores pueden escribirse como:
3
X 3
X
αij αkj = αij αTjk = δik (7.38)
j=1 j=1

En sı́ntesis, vemos que la matriz de los (αij ) es ortogonal y cumple todas las propie-
dades de la matriz de rotación Ã. Los cosenos directores son los elementos de la matriz Ã.

Dı́adas y diádicos. Se define un diádico como una entidad algebraica que se


representa por una matriz 3 × 3, de la misma manera que un vector es una entidad
algebraica que se representa por una matriz columna 3 × 1.
De acuerdo con (7.27) un vector unitario se puede expresar como:
~e1 = 1 · ~e1 + 0 · ~e2 + 0 · ~e3

~e2 = 0 · ~e1 + 1 · ~e2 + 0 · ~e3 (7.39)

~e3 = 0 · ~e1 + 0 · ~e2 + 1 · ~e3


Entonces los vectores unitarios se pueden representar por las tres matrices columna
siguientes:
     
1 0 0
     
     
~e1 →      
 0  ; ~e2 →  1  ; ~e3 →  0  (7.40)
     
0 0 1
~ se puede representar mediante una matriz columna:
Un vector arbitrario V
       
V1 1 0 0
       
       
~ →  V2  = V1  0  + V2  1  V3  0 
V (7.41)
       
       
V3 0 0 1
Cinemática del cuerpo rı́gido / 213

Análogamente podemos suponer que una matriz 3 × 3 es la representación de cierta


entidad que llamaremos diádico. Una dı́ada unitaria es el análogo de un vector unitario
y un diádico es el análogo de un vector cualquiera. Definimos la dı́ada unitaria como
una entidad algebraica ~ei~ej que se puede representar por una matriz 3 × 3 que tiene un
1 en la fila i columna j, y cero en todos los otros lugares. Podemos formar nueve dı́adas
unitarias. Ası́ por ejemplo:
   
1 0 0 0 0 0
   
   
  
~e1~e1 →  0 0 0  ~e2~e3 →  0 0 1   (7.42)
   
0 0 0 0 0 0
Notamos que ~ei~ej se puede representar por el producto de una matriz columna por
una matriz fila:
   
1 1 0 0
   
   
~e1~e1 →  0
 
 (1 0 0) =  0 0 0 
 
   
0 0 0 0
    (7.43)
0 0 0 0
   
   
~e2~e3 →  1
 
 (0 0 1) =  0 0 1 
 
   
0 0 0 0
~B
Es de notarse que en general ~ei~ej 6= ~ej ~ei . Definimos una dı́ada A ~ como un poli-
nomio de dı́adas unitarias ası́:
X3 X 3
A~B~ = Ai Bj ~ei~ej
i=1 j=1
(7.44)
3 X
X 3
~A
B ~= Bi Aj ~ei~ej
i=1 j=1

Un diádico en general es un polinomio de dı́adas unitarias, pero no necesariamente


de la forma A~ B:
~
X3 X 3
~~
D = Dij ~ei~ej (7.45)
i=1 j=1

~~
Es claro que la representación de D es:
 
D11 D12 D13
 
~~  
D →  D21 D22 D23 

 (7.46)
 
D31 D32 D33
214 / Mecánica clásica avanzada

Ası́ como el producto de un vector fila por una matriz da un vector fila y el
producto de una matriz por un vector columna da un vector columna, definimos por
analogı́a el producto de un vector por un diádico y de un diádico por un vector para
obtener vectores. Definimos los productos entre dı́adas unitarias y vectores ası́:
~ = ~ei (~ej · V
~ei~ej · V ~ ) = ~ei Vj
(7.47)
V~ · ~ei~ej = ~ · ~ei )~ej = ~ej Vi
(V
y el producto entre diádicos y vectores ası́:
 
3 X
X 3   X
3 3
X
~~ ~ ~ =  Dij Vj  ~ei
D ·V = Dij ~ei ~ej · V
i=1 j=1 i=1 j=1
(7.48)
!
X 3
3 X   3
X 3
X
~~
V~ · D = Dij V~ · ~ei ~ej = Dij Vi ~ej
i=1 j=1 j=1 i=1

Se define el diádico unidad como:


~
~1 = ~e ~e + ~e ~e + ~e ~e (7.49)
1 1 2 2 3 3

~
~1 claramente tiene las propiedades:
3
X 3
X
~ ~=
~1 · A ~=
~ei~ei · A ~
~ei Ai = A
i=1 i=1
(7.50)
3
X 3
X
~ ·~
A ~1 = ~ · ~ei~ei =
A ~
Ai~ei = A
i=1 i=1

La dı́ada ~ei~ej tiene la propiedad de proyección. Al multiplicarla por un vector se


obtiene la componente del vector en la dirección ~ei :
3
X
~=A
~ei~ei · A ~ · ~ei~ei = Aj (~ei · ~ej )~ei = Ai~ei (7.51)
j=1

Se define el producto escalar de dos matrices ası́:


3 X
X 3
à : B̃ = Aij Bij (7.52)
i=1 j=1

que corresponde al producto escalar de dos diádicos:


~~ ~~
A : B = Ã : B̃ (7.53)
Para el diádico (7.44) y uno similar tenemos:
3
X
~B
A ~ :C
~D~ = ~ · C)(
Ai Bj Ci Dj = (A ~ B ~ · D)
~ (7.54)
i=1
Cinemática del cuerpo rı́gido / 215

Vemos que esto es lo mismo que:


3 X
X 3
~ ·A
C ~B~ ·D
~ = ~ · ~ei )(~ej · D)
Ai Bj (C ~
i=1 j=1
(7.55)
3 X
X 3
= ~ · A)(
Aj Bj Ci Dj = (C ~ B ~ D)
~
i=1 j=1

Por tanto:
~B
A ~ :C
~D~ =C
~ ·A
~B~ ·D
~ (7.56)
Veremos que existe completa correspondencia entre los diádicos y los tensores.
Un tensor es una entidad algebraica, con componentes Tij tales que bajo rotaciones se
transforma ası́:
3 X
X 3
Tij′ = αik αjl Tkl (7.57)
k=1 l=1

donde (αij ) son los elementos de la matriz de rotación. En efecto, Tij son los elementos
~
de la matriz que representa a cierto diádico T~ :
~ ~
Tij′ = T~ · ~e′i~e′j = ~e′i · T~ · ~e′j (7.58)
~
T~ se puede expresar bien en términos de ~ei~ej o de ~e′i~e′j :

XX 3 3 XX 3 3
~
T~ = Tij ~ei~ej = Tij′ ~e′i~e′j (7.59)
i=1 j=1 i=1 j=1

Por tanto (7.57) se puede escribir como:


3 X
X 3 3 X
X 3
Tij′ = Tlk ~ei · ~ek ~el · ~ej = αik αjl Tkl (7.60)
k=1 l=1 k=1 l=1

Se denomina relación de completidad de la base ~ei a:


X ~
~ei~ei = I~ (7.61)
i=1

y relación de ortonormalidad de la base ~ei a:


~ei · ~ej = δij ; i, j = 1, 2, 3 (7.62)
En mecánica cuántica la notación de Dirac es la notación diádica en el espacio de
Hilbert.

Dos forma. Se define el diádico antisimétrico:


~ei ∧ ~ej = ~ei~ej − ~ej ~ei (7.63)
216 / Mecánica clásica avanzada

se cumple que ~ei ∧ ~ei = 0 y además:


   
0 1 0 0 0 1
   
   
~e1 ∧ ~e2 =  −1 0 0   0 0 0 
  , ~e1 ∧ ~e3 =  ,
   
0 0 0 −1 0 0
  (7.64)
0 0 0
 
 
~e2 ∧ ~e3 =  0 0 1 
 
 
0 −1 0

Una 2-forma entre dos vectores es:


3 X
X 3 3 X
X 3
~∧B
A ~ = Ai Bj ~ei ∧ ~ej = (Ai Bj − Aj Bi )~ei~ej (7.65)
i=1 j=1 i=1 j=1

Se cumplen las propiedades:

~ ·A
C ~∧B
~ ·D
~ = (C
~ · A)(
~ B ~ · D)
~ − (C
~ · B)(
~ A ~ · D)
~
(7.66)
~∧B
A ~ :C
~ ∧D
~ = 2(D
~ · B)(
~ A ~ · C)
~ − 2(C
~ · B)(
~ A ~ · D)
~

El deteminante de la matriz de rotación. Sabemos que la matriz de los


cosenos directores de un sistema de ejes (x) rotado respecto a otro sistema de ejes (x)
es ortogonal:

ÃT Ã = I˜ (7.67)

Tomando el determinante a cada lado de (7.67) y teniendo en cuenta el teorema


matemático que dice que el determinante de un producto de matrices es igual al producto
de los determinantes, tenemos que:

det(ÃT Ã) = det ÃT · det à = det I˜ (7.68)

otro teorema matemático dice que los determinantes de una matriz y de su traspuesta
son iguales, entonces:

det(Ã)2 = 1 ⇒ det à = ±1 (7.69)

Es fácil ver que det à = −1 ocurre cuando la matriz à contiene una inversión del
sistema de coordenadas. Entonces los desplazamientos de un sólido rı́gido con un punto
fijo sólo pueden ser descritos mediante una matriz de determinante +1.
Cinemática del cuerpo rı́gido / 217

7.4. El teorema de Euler acerca del movimiento de


un cuerpo rı́gido
El teorema dice: el desplazamiento general de un cuerpo rı́gido con un punto fijo es
un giro alrededor de cierto eje. En otras palabras: es suficiente un solo giro para pasar de
los ejes (x) fijos al cuerpo, a los ejes espaciales (x). El teorema se demuestra teniendo es-
tas dos propiedades de una rotación alrededor de un eje: (a) El eje de rotación permanece
inalterado; (b) La rotación no cambia la longitud de los vectores. El teorema de Euler
queda demostrado si para una rotación arbitraria, descrita por la matriz Ã, podemos
hallar siempre un vector que no cambie, es decir, que tenga las mismas componentes en
los dos sistemas:

V~ ′ = ÃV
~ =V
~ (7.70)

Esta ecuación es un caso particular de:

V~ ′ = ÃV
~ = λV
~ (7.71)

Como à es unitaria (ortogonal) pero no hermı́tica (no simétrica), sus valores pro-
pios no tienen por qué ser reales. Esto nos permite enunciar el teorema de Euler de otra
manera: “la matriz real y ortogonal que determina el movimiento fı́sico de un cuerpo
rı́gido con un punto fijo siempre tiene el valor propio +1”. La ecuación de valores propios
(7.71) puede escribirse:

˜V
(Ã − λI) ~ = ~0 (7.72)

Es un sistema homogéneo de tres ecuaciones lineales, donde las incógnitas son las
componentes de V~ :

(a11 − λ)V1 + a12 V2 + a13 V3 = 0

a21 V1 + (a22 − λ)V2 + a23 V3 = 0 (7.73)

a31 V1 + a32 V2 + (a33 − λ)V3 = 0

Como es conocido, habrá solución no trivial sólo si el determinante de la matriz


˜ es igual a cero. Esto hace que exista solución solamente para ciertos valores de
(Ã − λI)
λ:
 
a11 − λ a12 a13
 
 

det  a21 a22 − λ a23  =0 (7.74)
 
a31 a32 a33 − λ

La ecuación (7.74) es de tercer grado en λ con coeficientes reales:

λ3 + bλ2 + cλ + d = 0 (7.75)
218 / Mecánica clásica avanzada

donde:
b = −a11 − a22 − a23

c = a22 a11 + a33 a11 + a21 a33 − a23 a32 − a12 a21 − a13 a31
(7.76)
d = a23 a32 a11 + a12 a21 a33 + a13 a31 a22

−a22 a33 a11 − a12 a23 a31 − a13 a21 a32


cuyas principales propiedades son:
(a) λ puede ser complejo pero con módulo 1. Si λ es complejo, V ~ podrı́a ser
complejo. En este caso escribimos el módulo de V como |V | = V · V donde V~ † es la
~ ~ 2 ~ ~
~ y tomando el complejo conjugado: V
matriz fila que se obtiene trasponiendo V ~ † = (V
~ T )⋆ .
La longitud de V ~ es la misma de V~ :

~ ′ |2 = V
|V ~ ′† · V
~ ′ = (ÃV
~ )† · (ÃV~ ) = V
~ † ÃT ÃV~ (7.77)
~ ′ |2 = | V
Como à es ortogonal, se sigue que |V ~ |2 . Por otra parte, V
~ ′ = λV
~ , por
tanto:
~ ′ |2 = V
|V ~ ′† · V
~ ′ = (λV
~ )† · (λV
~ ) = λ⋆ λV
~†·V
~ = |λ|2 |V
~ |2 (7.78)
En conclusión:
|λ|2 = 1 (7.79)
(b) La ecuación secular (7.75) tiene al menos una raı́z real. Grafiquemos
la ecuación real:
f (x) = x3 + bx2 + cx + d (7.80)
asumiremos x real. De la ecuación (7.76) sabemos que b, c y d son reales.
Claramente:
f (x) → ∞ para x → ∞
(7.81)
f (x) → −∞ para x → −∞
Como f (x) es continua debe en alguna parte cruzar el eje x. Llamemos x = λ el
punto donde corta el eje, o sea el cero de f (x):
λ3 + bλ2 + cλ + d = 0 (7.82)
Como por (a) sabemos que |λ| = 1, se sigue que el valor propio real debe ser λ = −1
o λ = +1 (véase figura 7.4).

(c) Si λ es un valor propio compleio, λ⋆ también es un valor propio. Como


a, b, c y d son reales, si λ es complejo y satisface (7.75) entonces λ⋆ también la satisface:
de (a), (b) y (c) se sigue que la matriz à tendrá tres valores propios λ, λ⋆ , +1 o −1.
Para cada valor propio habrá un vector propio:
~α = λα V~α ;
ÃV α = 1, 2, 3 con λα = λ, λ⋆ , 1 o − 1 (7.83)
Cinemática del cuerpo rı́gido / 219

λ x

Figura 7.4 Gráfico de la función real f (x) = x3 + bx2 + cx + d

En términos de las componentes podemos escribir a (7.83) como:


3
X 3
X
aij Vαj = λα Vαj = λβ Vβi δαβ (7.84)
j=1 β=1

Definimos las siguientes matrices formadas con las componentes de los vectores
propios y con los valores propios:

Ṽ = (Vαi ) , λ̃ = (λβ δαβ ) (7.85)

Entonces (7.84) puede reinterpretarse como productos de matrices:


~ )αi = (Ṽ T λ̃T )iα = (Ṽ T λ̃)iα
(ÃṼ T )iα = (λ̃V (7.86)

O también:

ÃṼ T = Ṽ T λ̃ ⇒ (Ṽ T )−1 ÃṼ T = λ̃ (7.87)

Es decir, los vectores propios forman una matriz que diagonaliza a à siendo los
elementos de la diagonal los valores propios.

(d) El producto de las raı́ces de la ecuación secular es ±1. Tomando de-


terminantes a ambos lados de (7.87) y teniendo en cuenta que el determinante de una
matriz es igual al inverso del determinante de la matriz, obtenemos:
1
det à det Ṽ = det λ̃ ⇒ det à = det λ̃ (7.88)
det Ṽ
De (7.69) se sigue que:

det λ̃ = ±1 (7.89)
220 / Mecánica clásica avanzada

Hemos dicho que para rotaciones se debe cumplir que det à = +1 y para inversio-
nes det à = −1. Entonces, cuando à representa rotaciones:
det λ̃ = λ1 λ2 λ3 = |λ|2 λ3 = +1 (7.90)
Como |λ|2 = +1 se sigue que siempre el valor propio real debe ser igual a +1. Esto
es lo que afirma el teorema de Euler: existe un vector que no cambia al realizar una
transformación cualquiera à (corresponde al valor propio +1).

~:
Los vectores propios. El vector invariante bajo rotaciones es V
~ =V
ÃV ~ (7.91)
~α formamos la matriz Ṽ que diagonaliza a Ã:
Con las componentes de V
Ṽ ÃṼ T = λ̃ (7.92)
La traza de λ̃ es:
tr λ = λ1 + λ2 + λ3 = λ + λ⋆ + 1 (7.93)
Como |λ| = 1, podemos escribir:
λ = eiΦ (7.94)
De donde:
tr λ̃ = 2 cos Φ + 1 (7.95)
Como, según un teorema matemático, la traza es invariante bajo transformaciones
de semejanza (Ṽ ÃṼ T es una transformación de semejanza sobre Ã):
tr à = tr λ̃ = 1 + 2 cos Φ (7.96)
Es decir,
a11 + a22 + a33 = 1 + cos Φ (7.97)
Podemos mediante una transformación de semejanza rotar los ejes de modo que
~ , de modo que la matriz de rotación tendrá la forma dada por
x3 esté a lo largo de V
(7.21):
 
cos φ senφ 0
 
 
à =  −senφ cos φ 0 
 (7.98)
 
0 0 1
Vemos entonces de (7.97) y (7.98) que cos φ = cos Φ, luego Φ puede identificarse
~ . La ecuación de valores
como el ángulo de rotación alrededor del eje determinado por V
propios para la matriz à es:
    
cos Φ senΦ 0 V1 V1
    
    
 −senΦ cos Φ 0   V2  =  V2  (7.99)
    
    
0 0 1 V3 V3
Cinemática del cuerpo rı́gido / 221

Con lo cual obtenemos:


V1 cos Φ + V2 senΦ = V1

−V1 senΦ + V2 cos Φ = V2 (7.100)

V3 = V3
Esto nos da, multiplicando la primera por V2 y la segunda por V1 y restando:

(V12 + V22 ) senΦ = 0 (7.101)

Como Φ es arbitrario, los vectores propios deben cumplir V1 = V2 = 0, quedando


V3 indeterminado, luego V ~ = V3~e3 . Para una elección general de los ejes, seguirá siendo
válido que Φ representa la rotación alrededor de V ~ , pero no quedará determinado com-
pletamente el vector V~ sino sólo su dirección: su magnitud quedará indeterminada. En
cualquier caso la traza de à nos determina el ángulo de rotación.

Teorema de Chasles. El desplazamiento más general de un cuerpo rı́gido consiste


en una translación más una rotación. Este teorema se demuestra en el texto Dynamics
of a rigid body, de Routh.

7.5. El rotador rı́gido


Es un sólido rı́gido que se mueve sometido a la condición de ligadura que un punto
permanezca fijo. Los movimientos de un rotador rı́gido quedarán especificados por medio
de las tres componentes de la matriz à que relaciona las componentes de los vectores en
el sistema de ejes espacial con el sistema de ejes unido al sólido rı́gido:
3
X
~r = Ã~r o xi = aij xj (7.102)
j=1

En efecto, es suficiente especificar las tres coordenadas de un punto arbitrario del


sólido rı́gido respecto al sistema de ejes espacial para conocer completamente la ubicación
de todos los demás puntos del sólido rı́gido. Es decir, los tres parámetros independientes
de la matriz à sirven para especificar las posiciones de un rotador rı́gido. Es claro que
estos tres parámetros serán funciones del tiempo.

El grupo de rotaciones. El conjunto de todas las infinitas rotaciones de un


cuerpo rı́gido con un punto fijo constituye un grupo. Cada rotación à está especificada
por tres parámetros independientes q1 , q2 y q3 . Un grupo es la siguiente estructura
algebraica:
(i) Existe un conjunto de elementos g = {Ã(q), ∀q1 , q2 , q3 }.
(ii) Si Ã1 y Ã2 ∈ g entonces Ã1 Ã2 ∈ g.
˜
(iii) Si à ∈ g, ∃Ã−1 ∈ g tal que ÃÃ−1 = I.
˜ ˜
(iv) ∃I ∈ g tal que I Ã = Ã, ∀Ã ∈ g.
(v) ∀ Ã, B̃, C̃ ∈ g se cumple Ã(B̃ C̃) = (ÃB̃)C̃.
222 / Mecánica clásica avanzada

Estas propiedades se siguen del hecho de que las matrices de rotación son ortogo-
nales. Es sencillo demostrar a partir de lo anterior que:
(a) El producto de dos matrices ortogonales es ortogonal.
(b) Como para toda matriz de rotación det à = 1, se sigue que toda matriz de
rotación tiene inverso.
(c) I˜ es ortogonal.
(d) El producto de matrices obedece la ley asociativa.
Las rotaciones consideradas en abstracto como simples transformaciones geométri-
cas forman un grupo. El conjunto de matrices ortogonales 3 × 3 constituye una repre-
sentación del grupo de rotaciones.

7.6. Los ángulos de Euler


Los nueve cosenos directores no son independientes, sólo tres lo son. Podemos
pensar que todos los cosenos directores sean expresados en términos de tres parámetros
independientes φ, θ, ψ:

αij = αij (φ, θ, ψ) ; i, j = 1, 2, 3 (7.103)

La elección de estos tres parámetros independientes no es única. Una conveniente


elección de φ, θ y ψ, es la siguiente (véase figura 7.5). Se puede efectuar la transformación
de (x) a la posición del cuerpo rı́gido dada por (x) por medio de las siguientes rotaciones:
una rotación por un ángulo φ alrededor del eje x3 , con lo cual los ejes cambian de (x)
a (µ). Una rotación por un ángulo θ alrededor de µ1 , con lo cual los ejes se cambian de
(µ) a (µ′ ). Finalmente una rotación por un ángulo ψ, alrededor del eje µ′3 , con lo cual
los ejes se cambian de (µ′ ) a (x).1 Para expresar la matriz de rotación S̃ en términos
de los ángulos φ, θ y ψ (ángulos de Euler) debemos calcular los cosenos directores en
términos de estos ángulos.

x3, µ 3 x3 x3 x2
µ3′ µ2′ χ3, µ3′
µ2 θ θ
ϕ
x2 x2
x2

ϕ ϕ x1 ϕ ψ
x1 x1
x1
µ1 µ1, µi
Línea de nodos

Figura 7.5 Angulos de Euler

1 (θ,φ − π/2) son los ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 , y (θ, π/2 − ψ) son los
ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 .
Cinemática del cuerpo rı́gido / 223

Para hallar α11 = ~e′1 · ~e1 tomemos los planos que se cortan en la lı́nea de nodos y
que contienen los ejes x1 − x2 y x1 − x2 como en la figura 7.6. Vemos que:

x3

x3 π- θ
x2

x2
α
a b
φ ψ
l x1
x1 θ

Figura 7.6 Planos que se cortan en la lı́nea de nodos

a cos φ = b cos ψ (7.104)

l2 = a2 + b2 − 2ab cos α (7.105)

l2 = (a senφ)2 + (b senψ)2 − 2(a senφ)(b senψ) cos (π − θ) (7.106)

Igualando (7.105) y (7.106) llegamos a:

−b cos α = −a cos2 φ + b senφ senψ cos θ (7.107)

Ahora, reemplazando (7.104) en (7.107) obtenemos finalmente:

α11 = cos α = cos ψ cos φ − senφ senψ cos θ (7.108)

α12 = ~e′1 · ~e2 se obtiene de α11 reemplazando a φ por φ + 3π/2:

α12 = cos ψ senφ + cos φ senψ cos θ (7.109)

α21 = ~e′2 · ~e1 se obtiene de α11 reemplazando a ψ por ψ + π/2:

α21 = −senψ cos φ − senφ cos ψ cos θ (7.110)

α22 = ~e′2 · ~e2 se obtiene de α21 reemplazando a φ por φ + 3π/2:

α22 = −senψ cos φ + cos φ cos ψ cos θ (7.111)


224 / Mecánica clásica avanzada

α33 = ~e′3 · ~e3 se obtiene directamente:


α33 = ~e′3 · ~e3 = cos θ (7.112)
α13 y α23 se obtienen de las relaciones de ortogonalidad siguientes, ecuación (7.38):
α2j1 + α2j2 + α2j3 = 1 (7.113)
Con lo cual se obtiene para α13 :
α213 = 1 − (α211 + α212 ) = 1 − (1 − sen2 ψ sen2 θ)
(7.114)
⇒ α13 = senψ senθ

Similarmente, α221 + α222 = sen2 ψ + cos2 ψ cos2 θ, con lo cual:


α23 = cos ψ senθ (7.115)
Para calcular a α32 y a α31 usamos la ecuación (7.38) ası́:
α31 α21 + α32 α22 + α33 α23 = 0 (7.116)

α31 α11 + α32 α12 + α33 α13 = 0 (7.117)

Multiplicando a (7.116) por α11 y a (7.117) por α21 y restando:


α13 α21 − α23 α11
α32 = α33 (7.118)
α22 α11 − α12 α21
Con lo cual se obtiene:
α32 = −senθ cos φ (7.119)
Por otra parte la relación (7.38) para la fila tres:
α231 + α232 + α233 = 1 (7.120)
nos permite escribir:
α31 = senθ senφ (7.121)
con lo cual la matriz de rotación es, en definitiva:
à =
 
cos φ cos ψ − senφ cos θ senψ senφ cos ψ + cos φ cos θ senψ senθ senψ
  (7.122)
 
− cos φ senψ − senφ cos θ cos ψ −senφ senψ + cos φ cos θ cos ψ senθ cos ψ 
 
 
senφ senθ − cos φ senθ cos θ

Por la forma como fue obtenida, a partir de los cosenos directores, se tiene que Ã
es una matriz ortogonal. Es decir, que Ã−1 se obtiene simplemente trasponiendo a Ã.
Cinemática del cuerpo rı́gido / 225

Del teorema de Euler se sigue que de alguna manera à representa una rotación
única alrededor de cierto eje n̂ = c1~e1 + c2~e2 + c3~e3 bajo un ángulo Φ. El eje de rotación
se halla resolviendo la ecuación de valores propios (7.91), con λ = 1:
3
X
(aij − δij )Cj = 0 ; i = 1, 2, 3 (7.123)
j=1

El resultado para los cosenos directores del eje n̂ es:


senθ(cos ψ − cos φ)
C1 =
2 senΦ
senθ(senφ − senψ)
C2 = (7.124)
2senΦ
sen(Φ + ψ) (1 + cos θ)
C3 =
2senΦ
Donde Φ es el ángulo de rotación alrededor de n̂ que se halla a partir de la traza
de Ã, ecuación (7.97):
1 − tr Ã
cos φ = (7.125)
2
Calculando la traza de à se llega finalmente a:
Φ θ ψ+φ
cos = cos cos (7.126)
2 2 2
Como C12 + C22 + C32 = 1, vemos que dos cosenos directores de n̂ y Φ especifican la
rotación.2
Se puede ver que à se puede obtener también a partir de la definición de los ángulos
de Euler, de acuerdo con la figura 7.5:
    
µ1 cos φ senφ 0 x1
    
    
 µ2  =  −senφ cos φ 0   x2  o ~µ = Ãφ ~x (7.127)
    
    
µ3 0 0 1 x3
 ′    
µ1 1 0 0 µ1
    
 ′    
 µ2  =  0 cos θ senθ   µ2  o µ~′ = Ãθ ~µ (7.128)
    
    
µ′3 0 −senθ cos θ µ3
    ′ 
x1 cos ψ senψ 0 µ1
    
    
 x2  =  −senψ cos ψ 0   µ′2  o ~x = Ãψ µ ~′ (7.129)
    
    
x3 0 0 1 µ′3
2 Las ecuaciones (7.124) y (7.126) se obtienen al comparar los elementos de (7.122) y (7.138).
226 / Mecánica clásica avanzada

De modo que ~x puede obtenerse de ~x a través de:


~x = Ãψ Ãθ Ãφ ~x = Ã~x (7.130)

Ası́ que:

à = Ãψ Ãθ Ãφ (7.131)

Al hacer el producto de matrices se llega al resultado para la matriz à dado por


(7.122).

Definiciones alternas de los ángulos de Euler. La convención usada en


mecánica cuántica en los textos de teorı́a de grupos de Wigner, y de momentos an-
gulares de Rose, es diferente a la presentada anteriormente. Allı́ la segunda rotación es
tomada no alrededor del eje intermedio µ1 sino alrededor de µ2 . Es la llamada “con-
vención y” que obviamente dará lugar a expresiones diferentes para la matriz Ã. Es
fácilmente demostrable que para obtener la matriz à en la convención “y” a partir de
la matriz à en la convención “x” bastan las sustituciones:
π
φ →φ+
2
(7.132)
π
ψ →ψ−
2
donde se entenderá a φ como el ángulo de la primera rotación y a ψ como el ángulo de
la tercera rotación, con lo cual:

senφ → cos φ senψ → − cos ψ


(7.133)
cos φ → −senφ cos ψ → senψ

Se propone como ejercicio probar estas afirmaciones.


Otra convención es la llamada convención “xyz”, usada en aeronáutica: la primera
rotación es por ángulo φ alrededor de x3 , la segunda por ángulo θ alrededor de x2 y
la tercera por ángulo ψ alrededor de x1 . Es la llamada secuencia 3 2 1. Por ejemplo,
tomando los ejes de coordenadas fijos a un avión de la siguiente manera: x3 perpendicular
al avión en el centro de masa, x2 paralelo a las alas y x1 a lo largo del eje principal del
avión, una posición arbitraria de la nave se puede obtener a partir de la posición en que
los ejes (x) coinciden con los ejes (x) por medio de la siguiente secuencia de rotaciones:
una alrededor de x3 por ángulo φ, otra alrededor de x2 por ángulo θ y la tercera alrededor
de x1 por un ángulo ψ.

7.7. Descripción de las rotaciones en términos de n̂ y


Φ. Parámetros de Euler
Hemos mostrado que los desplazamientos de un cuerpo rı́gido con un punto fijo
se pueden expresar por medio de rotaciones. Cada rotación puede especificarse por tres
Cinemática del cuerpo rı́gido / 227

parámetros independientes que pueden ser por ejemplo tres cosenos directores indepen-
dientes, tres ángulos de Euler, o un eje de rotación y un ángulo. Vimos que las rotaciones
constituyen un grupo matemático que tiene una representación obvia en términos de ma-
trices 3 × 3 ortogonales (hay un homomorfismo entre las rotaciones fı́sicas y las matrices
ortogonales 3 × 3).
Queremos buscar una representación de la transformación de coordenadas en términos
de los parámetros de una rotación: dos cosenos directores del eje de rotación y el ángulo
de rotación.

Formas “activa” y “pasiva” de una rotación. Hasta ahora hemos considerado


que la matriz à rota los ejes coordenados, de modo que la ecuación ~r = Ã~r simplemente
expresa cómo están relacionadas las componentes de un vector vistas respecto a dos
diferentes sistemas de coordenadas: Ã actúa sobre el sistema de coordenadas dejando
los vectores inalterados. Hay además la siguiente interpretación: Ã puede pensarse como
un operador que actúa sobre los vectores ~r para cambiarlos por vectores diferentes ~r′
con respecto al mismo sistema de coordenadas. Por ejemplo, en dos dimensiones, en vez
de rotar en el sentido contrario a las agujas del reloj al sistema de coordenadas por un
ángulo φ, se puede rotar al vector ~r en el sentido del reloj por un ángulo φ para obtener
el vector ~r′ (véase figura 7.7). Las componentes del nuevo vector, ~r′ , estarán entonces

x2 x2 Pasiva: x2 Activa
r = Ar r ′ = Ar
i

x1
r r r r′
i

φ x1 x1

Figura 7.7 Formas activa y pasiva de una rotación

relacionadas con las del viejo vector ~r, por medio de la ecuación ~r′ = Ã~r. En general Ã
corresponde a una rotación en sentido contrario a las agujas del reloj por un ángulo φ
cuando sea aplicada al sistema de coordenadas, y como una rotación en sentido de las
agujas del reloj por un ángulo φ cuando sea aplicada a los vectores.

Rotaciones finitas. Usaremos el punto de vista activo, según el cual en un sistema


de coordenadas dado realizamos una rotación de un vector por un ángulo Φ alrededor
de un eje n̂. Se trata de encontrar la matriz à que relaciona las componentes del viejo
y del nuevo vector.
De las figuras 7.8 y 7.9 se ve que:
~ + N~V + N~Q
~r′ = ON (7.134)
donde los vectores tienen las siguientes expresiones en términos de ~r, n̂ y Φ, teniendo en
228 / Mecánica clásica avanzada

N V P
Φ

r′
i

Figura 7.8 Rotación de un vector alrededor de un eje n̂. Vista lateral.

N V P
Φ

r ×n

Figura 7.9 Rotación de un vector alrededor de un eje n̂. Vista en dirección ~n.
Cinemática del cuerpo rı́gido / 229

cuenta que N V = N Q cos Φ y V Q = N Q senΦ:


~ =
ON (n̂ · ~r)n̂

N~Q = ~ ) cos Φ
(~r − ON (7.135)

V~Q = ~r × n̂ senΦ
Con lo cual obtenemos:
~r′ = ~r cos Φ + n̂(n̂ · ~r)(1 − cos Φ) + ~r × n̂ senΦ (7.136)
Esta fórmula es válida para cualquier rotación finita de un vector. Para Φ infinite-
simal, dicha expresión toma la forma:
~r′ = ~r + ~r × n̂Φ (7.137)
en concordancia con la fórmula (3.148). Escrita en forma de matriz, la ecuación (7.136)
es:
 ′
x1
 
 ′
x2  =
 
 
x′3
   (7.138)
cos Φ+C12 c C1 C2 c + C3 senΦ C1 C3 c−C2 senΦ x1
  
  
C1 C2 c−C3 senΦ cos Φ+C 2
c C C c+C senΦ x2 
 2 2 3 1  
  
C1 C3 c+C2 senΦ C2 C3 c−C1 senΦ cos Φ+C32 c x3
donde hemos llamado c = (1 − cos Φ).
En (7.138) la matriz à depende de los cuatro parámetros no independientes C1 ,
C2 , C3 y Φ. Suele expresarse esta matriz en términos de los llamados parámetros de
Euler, no independientes, e0 , e1 , e2 , e3 , definidos ası́:
Φ
e0 = cos
2
(7.139)
Φ
ei = Ci sen ; i = 1, 2, 3
2
En términos de estos parámetros (7.136) toma la forma:
~r′ = ~r(e20 − e21 − e22 − e23 ) + 2~e(~e · ~r) + 2(~r × ~e)e0 (7.140)
y la matriz à entonces será:
 2 
e0 + e21 − e22 − e23 2(e1 e2 + e0 e3 ) 2(e1 e3 − e0 e2 )
 
 
à = 
 2(e1 e2 − e0 e3 ) e20 − e21 + e22 − e23 2(e2 e3 + e0 e1 ) 
 (7.141)
 
2(e1 e3 + e0 e3 ) 2(e2 e3 − e0 e1 ) e20 − e21 − e22 + e23
230 / Mecánica clásica avanzada

Usando las ecuaciones (7.124), (7.126) y (7.139) se obtienen las siguientes relaciones
entre los parámetros de Euler y los ángulos de Euler:

θ φ+ψ
e0 = cos cos
2 2
θ φ−ψ
e1 = sen cos
2 2
(7.142)
θ φ−ψ
e2 = sen sen
2 2
θ φ+ψ
e3 = cos sen
2 2
Los parámetros y los ángulos de Euler fueron hallados por Euler en 1776, quien
llamó ei a los parámetros simétricos.

7.8. Representación del grupo de rotaciones


por medio de matrices 2 × 2. Los parámetros
de Cayley-Klein
Representación de un grupo. En el numeral 7.5 hemos mencionado que el con-
junto de todos los desplazamientos de un cuerpo rı́gido con un punto fijo satisface los
axiomas de un grupo matemático: (i) Dos desplazamientos sucesivos cualesquiera del
cuerpo equivalen a un desplazamiento; (ii) Existe el desplazamiento identidad que con-
siste en no desplazar el cuerpo; (iii) Para todo desplazamiento existe el desplazamiento
inverso o sea aquel que retorne el cuerpo a su posición original; (iv) Los desplazamientos
sucesivos del cuerpo rı́gido satisfacen la propiedad asociativa.
El conjunto de todas las matrices ortogonales 3 × 3 constituyen una representación
del grupo de los desplazamientos de un rotador rı́gido en el sentido de que a cada despla-
zamiento del rotador se le puede asociar una matriz ortogonal 3 × 3 y sólo una. Se dice
entonces que hay un homomorfismo entre el grupo de los desplazamientos del rotador
rı́gido y el grupo de las matrices ortogonales 3×3. El grupo de matrices ortogonales 3×3
es llamado el grupo O(3). El grupo de las matrices ortogonales 3 × 3 con determinante
+1, que en rigor es el que corresponde a los desplazamientos de un rotador rı́gido, se
llama el grupo SO(3).

Vectores y diádicos en un espacio bidimensional. En un espacio bidimensio-


nal, un vector arbitrario V~ puede expresarse en términos de los vectores unitarios ~e1 , e~2 :
~ = V1~e1 + V2~e2 . V
V ~ y ~ei pueden representarse por matrices 2 × 1:
     
V1 1 0
V~ →   ~e1 →   ~e2 →   (7.143)
V2 0 1
Cinemática del cuerpo rı́gido / 231

Podemos definir las dı́adas unitarias ~e1~e1 , ~e1~e2 , ~e2~e1 y ~e2~e2 , que pueden represen-
tarse por matrices 2 × 2:
   
1 0 0 1
~e1~e1 →   ~e1~e2 →  
0 0 0 0
    (7.144)
0 0 0 0
~e2~e1 →   ~e2~e2 →  
1 0 0 1
En una dı́ada unitaria el primer vector se representa por una matriz columna y el
segundo por una matriz fila. Por ejemplo:
   
1 0 1
~e1~e2 →   (0 1) =   (7.145)
0 0 0
Nótese que:
 
0 1
~e1 ∧ ~e2 = ~e1~e2 − ~e2~e1 =   (7.146)
−1 0
~~
Un diádico D puede expresarse en términos de las dı́adas unitarias:
~~
D = D11~e1~e1 + D12~e1~e2 + D21~e2~e1 + D22~e2~e2 (7.147)
y puede representarse por medio de una matriz 2 × 2:
 
D11 D12
~~
D →  (7.148)
D21 D22

El diádico unidad, ~
~1, es:
 
1 0
~
~1 = ~e1~e1 + ~e2~e2 →   (7.149)
0 1
Se definen los diádicos ~ ~σ x , ~
~σ y y ~~σ z de la siguiente manera:
 
0 1
~
~σ x = ~e1~e2 + ~e2~e1 →   = σ̃x
1 0
 
0 −i
~
~σ y = −i~e1~e2 + i~e2~e1 →   = σ̃y (7.150)
i 0
 
1 0
~
~σ z = ~e1~e1 − ~e2~e2 →   = σ̃z
0 −1
232 / Mecánica clásica avanzada

Las dı́adas unitarias pueden expresarse en términos de ~~σ i y ~~1:


1 ~ 1 ~
~e1~e1 = (~1 + ~~σ z ) ; ~e1~e2 = (~σ x + i~~σ y )
2 2
(7.151)
1 1 ~
~e2~e1 = (~
~σ x − i~~σ y ) ; ~e2~e2 = (~1 − i~~σ z )
2 2
~
Un diádico arbitrario puede igualmente expresarse en términos de ~1 y ~~σ i :
~~ 1 ~1 + 1 (V11 − V22 )~~σ z + 1 (V12 + V21 )~~σ x + i (V12 − V21 )~~σ y
D = (V11 + V22 )~ (7.152)
2 2 2 2
O sea que cualquier diádico de traza cero puede expresarse en términos de ~~σ x , ~~σ y ,
~ ~
~ a cualquier diádico de traza cero:
~σ z . Llamaremos V

~ ~
~σ x ~~σ y ~~σ z
~ = Vx √
V + Vy √ + Vz √ (7.153)
2 2 2
Existe un isomorfismo entre los diádicos bidimensionales de traza cero y los vectores
ordinarios V~ . En efecto, el conjunto de todos los diádicos bidimensionales de traza cero
satisface las mismas propiedades que el conjunto de todos los vectores ordinarios: (i) La
suma de dos diádicos de traza cero es un diádico de traza cero, la suma es conmutativa;
(ii) El producto de un número por un diádico de traza cero es un diádico de traza cero;
(iii) La suma de diádicos es asociativa; (iv) Existe el diádico cero. Además, si se define
el producto escalar de dos diádicos como:
~ ~
~ : W
~ = V ⋆ W11 + V ⋆ W12 + V ⋆ W21 + V ⋆ W22
V 11 12 21 22 (7.154)

Vemos que este producto escalar satisface las mismas propiedades del producto
escalar de vectores. Para ello es suficiente mostrar que:
~
~σ i : ~
~σ j = 2δij ; i, j = x, y, z (7.155)

lo cual es evidente de las ecuaciones (7.150) y (7.154). En resumen, a cada diádico de


traza cero de la forma (7.153) se le puede hacer corresponder el vector ordinario:
~ = Vx~e1 + Vy ~e2 + Vz ~e3
V (7.156)

Homomorfismo entre las rotaciones en el espacio bidimensional y las


~ es rotado para convertirse en V
rotaciones en el espacio ordinario. Si el vector V ~ ′:

~ ′ = ÃV
V ~ (7.157)
donde à es la matriz de rotación 3 × 3, el diádico correspondiente en el espacio bidimen-
sional deberá presentar una transformación correspondiente en virtud del mencionado
homomorfismo. Como:
3
X
Vi′ = aij Vj (7.158)
j=1
Cinemática del cuerpo rı́gido / 233

~′
entonces V~ será:
3 3
~ ′ XX 1
V~ = aij Vj √ ~~σ i (7.159)
i=1 j=1
2

Por otra parte, una transformación de un diádico es de la forma:

~ ′ ~~ ~ ~~ †
V~ = Q ~ ·Q
·V (7.160)

~~ † ~~
donde Q es el adjunto de Q:

~~
Q = Q⋆11 ê1 ê1 + Q⋆21 ê1 ê2 + Q⋆12 ê2 ê1 + Q⋆22 ê2 ê2 (7.161)

~
~ es:
Explı́citamente V
    !
X2 2
X 2
X
~′ = 
V Qij êi êj  ·  Vkl êk êl  · Q⋆mn ên êm
i,j=1 k,l=1 m,n=1
(7.162)
2
X
(Q̃Ṽ Q̃† )im êi êm
i,m=1

~′
Por otra parte V~ está dado por (7.159). Por tanto, según (7.152) y (7.153):

1 h    i
3
1 X
√ a1j Vj = Q̃Ṽ Q̃† + Q̃Ṽ Q̃†
2 j=1 2 12 21

i h    i
3
1 X
√ a2j Vj = Q̃Ṽ Q̃† − Q̃Ṽ Q̃† (7.163)
2 j=1 2 12 21

1 h    i
3
1 X
√ a3j Vj = Q̃Ṽ Q̃† − Q̃Ṽ Q̃†
2 j=1 2 11 22

~~
Estas ecuaciones nos permiten relacionar à con Q̃. El diádico Q en (7.160) debe
ser unitario:

~~ † ~~ ~~ ~~ †
Q ·Q=1=Q ·Q (7.164)

~~
Si llamamos α, β, γ y δ las componentes de Q:

~~
Q = αê1 ê1 + βê1 ê2 + γê2 ê1 + δê2 ê2 (7.165)
234 / Mecánica clásica avanzada

~~ † ~~
Q .Q = (α⋆ ê1 ê1 + γ ⋆ ê1 ê2 + β ⋆ ê2 ê1 + δ ⋆ ê2 ê2 )·

(αê1 ê1 + βê1 ê2 + γê2 ê1 + δê2 ê2 )

= (|α|2 + |γ|2 )ê1 ê1 + (α⋆ β + γ ⋆ δ)ê1 ê2 (7.166)

+(β ⋆ α + δ ⋆ γ)ê2 ê1 + (|β|2 + |δ|2 )ê2 ê2

= ê1 ê1 + ê2 ê2 + ê3 ê3 = ~~1

Con lo cual obtenemos:

|α|2 + |γ|2 = 1

α⋆ β + γ ⋆ δ = 0 (7.167)

|β|2 + |δ|2 = 1

Las ecuaciones (7.167) representan cuatro condiciones sobre los elementos α, β, γ y


δ, que por ser complejos contienen ocho parámetros. Las relaciones (7.167) dejan 8−4 = 4
parámetros independientes. Si además se impone la condición de que el determinante de
Q̃ sea +1, obtenemos:

αδ − βγ = 1 ⇒ β = −γ ⋆ ; δ = α⋆ ; αα⋆ + ββ ⋆ = 1 (7.168)

Con lo cual quedan sólo tres parámetros independientes de los ocho que contiene
Q̃. Entenderemos pues, que en (7.165) α, β, γ y δ satisfacen las condiciones de unitaridad
(7.167) y de unimodularidad (7.168).
En (7.163) se requiere conocer la matriz Q̃Ṽ Q̃† . Esto es:

   
α β V11 V12 α⋆ γ⋆
Q̃Ṽ Q̃† =    
γ δ V21 V22 β⋆ δ⋆
(7.169)
!
|α|2 V11 +|β|2 V22 +α⋆ βV21 +αβ ⋆ V12 γ ⋆ αV11 +γ ⋆ βV21 +δ⋆ αV12 +βδ⋆ V22
=
α⋆ γV11 +α⋆ δV21 +β ⋆ γV12 +β ⋆ δV22 |γ|2 V11 +|δ|2 V22 +γ ⋆ δV21 +δ⋆ γV12
Cinemática del cuerpo rı́gido / 235

De (7.163) y (7.169) obtenemos las siguientes relaciones:

3
√ X
2 a1j Vj = (γ ⋆ α + α⋆ γ)V11 + (γ ⋆ β + α⋆ δ)V21
j=1

+(δ ⋆ α + β ⋆ γ)V12 + (βδ ⋆ + β ⋆ δ)V22

3
√ X
2 a2j Vj = i(γ ⋆ α − α⋆ γ)V11 + i(γ ⋆ β − α⋆ δ)V21
j=1 (7.170)

+i(δ ⋆ α − β ⋆ γ)V12 + i(βδ ⋆ − β ⋆ δ)V22

3
√ X
2 a3j Vj = (|α|2 − |γ|2 )V11 + (|β|2 − |δ|2 )V22
j=1

+(α⋆ β − γ ⋆ δ)V21 + (αβ ⋆ − δ ⋆ γ)V12

Como por otra parte:

1
V1 = √ (V12 + V21 )
2
i
V1 = √ (V12 − V21 ) (7.171)
2
1
V1 = √ (V11 + V22 )
2

Obtenemos usando (7.170) y (7.171) las siguentes relaciones entre las componentes
de à y las de Q̃, igualando coeficientes de los Vij :

a13 = γ ⋆ α + α⋆ γ

(a11 + ia13 ) = δ⋆α + β ⋆γ

a23 = i(γ ⋆ α − α⋆ γ)
(7.172)
(a21 + ia22 ) = i(δ ⋆ α − β ⋆ γ)

a33 = |α|2 − |γ|2

(a31 + ia32 ) = αβ ⋆ − δ ⋆ γ
236 / Mecánica clásica avanzada

Con lo cual la matriz à toma la forma:


 1 i 2 
(α2 − γ 2 + δ 2 − β 2 ) (γ − α2 + δ 2 − β 2 ) γδ − αβ
 2 2 
 
 
à =  i
 (α2 + γ 2 − β 2 − δ 2 )
1 2
(α + γ 2 + β 2 + δ 2 ) −i(αβ + γδ)

 (7.173)
 2 2 
 
βδ − αγ i(αγ + βδ) αδ + βγ

donde hemos usado además las relaciones α⋆ = δ, γ ⋆ = −β de la ecuación (7.168). Ã


es una matriz que está expresada en términos de α, β, γ, δ, o sea que los parámetros
α, β, γ, δ, sirven para especificar las rotaciones de un cuerpo rı́gido. Son llamados los
parámetros de Cayley-Klein, estudiados por estos autores en los años 1875-1879.
En resumen, hemos mostrado que si al efectuar una rotación un vector V~ ′ se cambia
~ , entonces el diádico V~~ en el espacio bidimensional que corresponde
~ ′ = ÃV
en el vector V
~ ′ ~~ ~~ ~~ †
a V~ se transforma en el diádico V~ = Q· V ·Q . Por tanto, a cada rotación del cuerpo rı́gido
le corresponde una matriz à y una matriz Q̃ 2 × 2. La matriz Q̃ es unitaria, Q̃Q̃† = I, ˜ y
unimodular, det Q̃ = 1. El conjunto de todas las matrices unitarias y unimodulares 2 × 2
es llamado el grupo SU (2). Hay pues un homomorfismo entre los grupos SO(3) y SU (2).
Si en (7.173) se hacen las siguientes sustituciones de los parámetros de Cayley-Klein en
términos de e0 , e1 , e2 y e3 :
α = e0 + ie3 ; γ = −β ⋆
(7.174)
β = e2 + ie1 ; δ = α⋆

Se obtiene exactamente la matriz (7.141), o sea que en efecto e0 y ei son los


parámetros de Euler definidos en (7.142). Usando (7.174) y las expresiones para e0 y ei
en términos de los ángulos de Euler, ecuación (7.142), obtenemos para α, β, γ y δ en
términos de los ángulos de Euler:
θ θ
α = ei(φ+ψ)/2 cos ; β = iei(ψ−φ)/2 sen
2 2
(7.175)
θ θ
γ = ie−(ψ−φ)/2 sen ; δ = e−i(φ+ψ)/2 cos
2 2
~~
El diádico Q definido en (7.166) puede escribirse en términos de los diádicos de
~
Pauli y el diádico unidad, ~~σ i , ~1, reemplazando (7.151) en (7.165):
~~ 1 ~ 1 1 i
Q = (α + δ)~1 + (α − δ)~~σ z + (β + γ)~~σ x + (β − γ)~~σ y (7.176)
2 2 2 2
que usando (7.174) toma la forma:3
~~
Q = e0~
~1 + ie1~~σ x + ie2~~σ y + ie3~~σ z (7.177)
3 Los e0 , ei , forman un sistema de cuaterniones.
Cinemática del cuerpo rı́gido / 237

Para una rotación alrededor del eje x1 , de acuerdo con (7.142) se tiene que e1 =
senθ/2, e2 = e3 = 0. Por tanto:

~~ θ~~1 + i sen θ ~
Q θ = cos ~σ x (7.178)
2 2
donde θ es el ángulo de rotación. Para una rotación por φ alrededor del eje x3 :
~~ φ~~1 + i sen φ ~
Q φ = cos ~σ z (7.179)
2 2
Cada diádico de Pauli ~
~σ i está asociado con una rotación alrededor de un eje par-
ticular y puede considerarse como el “rotador unitario” para dicho eje.

Ejemplo 7.8.1 Mostrar que los diádicos de Pauli anticonmutan mutuamente, esto es,
que:
~
~σ i · ~
~σ j = −~
~σ j · ~
~σ i (7.180)

Hagamos los nueve productos ~~σ i · ~~σ j , usando las definiciones (7.150):

~ ~
~σ x · ~
~σ x = ê1 ê1 + ê2 ê2 = ~1 ; ~~σ x · ~~σ y = iê1 ê1 − iê2 ê2 = i~~σ z

~
~σ x · ~
~σ z = −ê1 ê2 + ê2 ê1 = −i~~σy ; ~~σ y · ~~σ x = −iê1 ê1 + iê2 ê2 = −i~~σ z

~ ~σ y = ê1 ê1 + ê2 ê2 = ~


~σ y · ~ ~1 ; ~~σ y · ~~σ z = iê1 ê2 + iê2 ê1 = i~~σ x (7.181)

~
~σ z · ~
~σ x = ê1 ê2 − ê2 ê1 = i~
~σ y ; ~~σ z · ~~σ y = −iê1 ê2 − iê2 ê1 = −i~~σx

~ ~σ z = ê1 ê1 + ê2 ê2 = ~


~σ z · ~ ~1

Las ecuaciones (7.181) se pueden escribir en forma compacta ası́:


3
X
~ ~σ j = ~
~σ i · ~ ~1δij + i ǫijk ~
~σ k (7.182)
k=1

donde ǫij es el tensor de Levi-Civita completamente antisimétrico. Se puede ver direc-


tamente que las ~~σ i obedecen las relaciones de conmutación siguientes:
3
X
~
~σ i · ~
~σ j − ~
~σ j · ~
~σ i = 2i ǫijk ~~σ k (7.183)
k=1

y de anticonmutación:

~σ i · ~
~ ~σ i = 2~
~σ j · ~
~σ j + ~ ~1δij (7.184)

~~
Ejemplo 7.8.2 Mostrar que Q θ puede escribirse simbólicamente como:
238 / Mecánica clásica avanzada

~~ i~
~
σx (θ/2)
Q θ = e (7.185)
2
donde el exponencial denota una serie infinita de términos. Como según (7.181) ~~σ x ≡
~ 2n ~ 2n+1
~
~σ x · ~
~σ x = ~1, se sigue que ~~σ = ~1 y que ~~σ = ~~σ x para n = 0, 1, 2, ... Por lo tanto:
x x
  ∞
X  2n
θ 1 ~~σ x θ θ
cos ~
~σ x ≡ (−1)n = ~~1 cos
2 n=0
(2n)! 2 2
(7.186)
  ∞
X  2n+1
~ θ 1 ~ θ θ
sen ~σ x ≡ (−1)n
~σ x = ~~σ x sen
2 n=0
(2n + 1)! 2 2

~~
Con lo cual Q θ puede expresarse en la forma:

~~ ~ θ θ θ θ ~
Q ~
θ = 1 cos + +i~~σ x sen = cos(~~σ x ) + i sen(~~σ x ) = ei~σ x (θ/2) (7.187)
2 2 2 2

Como ~
~σ i son hermı́ticos, ~~σ i = ~~σ i , se sigue que:

~~ † −i~
~
σx (θ/2)
Q θ = e (7.188)

Ejemplo 7.8.3 Hallar la forma de la matriz de rotación para una rotación arbitraria,
definida por los ángulos de Euler.

~~
Q puede escribirse como el producto de tres rotaciones sucesivas, en virtud del
homomorfismo con el grupo de rotaciones:

~~ † ~ ~ ~
Q = ei~σz (ψ/2) ei~σ µ1 (θ/2) ei~σ z (φ/2) (7.189)
~~
Las tres rotaciones que aparecen en Q son alrededor de los ejes z, µ1 y z. Es
deseable expresarlas en términos de rotaciones alrededor de ejes del mismo sistema de
coordenadas. Para ello hay que notar que cada uno de los diádicos que aparece en el
operador de rotación está asociado con el respectivo eje de rotación.
Como el eje x conduce al eje µ1 por medio de la rotación Aφ , correspondientemente
~
~σ µ1 será, de acuerdo con la ecuación (7.160):

~ ~ ~
~σ µ1 = ei~σ z (θ/2)~~σ x · e−i~σz (θ/2) (7.190)

Como por otra parte:


θ θ
ei~σµ1 (θ/2) = ~
~
~1 cos + i~~σ µ1 sen (7.191)
2 2
~~
Se sigue, usando la ecuación (7.190) y la unitariedad Q φ:

~ ~ ~ ~
ei~σµ1 (θ/2) = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (φ/2) (7.192)
Cinemática del cuerpo rı́gido / 239

~~
Por tanto Q toma la foma:
~~ ~ ~ ~
Q = ei~σz (ψ/2) ei~σ z (φ/2) ei~σ x (θ/2) (7.193)
Por otra parte, el eje z se obtiene del eje µ′3 por medio de la rotación Aψ , y µ′1 se
obtiene de µ3 = z por medio de Ãθ . Por lo tanto ~~σ z puede escribirse en términos de ~~σ z
como:
~ ~ ~ ~ ~
~σ z = ei~σ z (ψ/2) ei~σ µ1 (θ/2)~
~σ z e−i~σµ1 (θ/2) e−i~σz (ψ/2) (7.194)
Usando (7.192):
~ ~ ~ ~ ~ ~
~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · e−i~σz (φ/2) · σz .ei~σ z (φ/2) ·
(7.195)
−i~
~
σ x (θ/2) −i~
~
σ z (φ/2) −i~
~
σ z (ψ/2)
e ·e ·e
~~ ~~
Notando que ~
~σ z y Q φ conmutan y que Qφ es unitario:

~ ~ ~ ~ ~ ~ ~
~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σx (θ/2) · σz · e−i~σ x (θ/2) · e−i~σz (φ/2) · e−i~σ z (ψ/2) (7.196)
Se sigue entonces que:
~ ~ ~ ~ ~ ~
ei~σ z (ψ/2) = ei~σz (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σ z (ψ/2) · e−i~σ x (θ/2) ·
(7.197)
~ ~
e−i~σz (φ/2) · e−i~σz (ψ/2)
O sea:
~ ~ ~ ~ ~ ~
ei~σ z (ψ/2) = ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σz (ψ/2) · e−i~σx (θ/2) · e−i~σz (φ/2) (7.198)
~~
Reemplazando (7.198) en (7.193) obtenemos para Q:
~~ ~ ~ ~ ~ ~ ~ ~
Q = ei~σz (φ/2) ·ei~σ x (θ/2) ·ei~σ z (ψ/2) ·e−i~σ x (θ/2) ·e−i~σ z (φ/2) ·ei~σ z (φ/2) ·ei~σ x (θ/2) (7.199)
~~
Con lo cual, usando la unitaridad de los operadores, se obtiene finalmente para Q:
~~ ~ ~ ~
Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2) (7.200)
~~
Hemos conseguido expresar a Q en términos de rotaciones alrededor de los ejes
~~
del sistema de coordenadas espacial. Es posible, de manera análoga, expresar a Q en
~~
términos de rotaciones respecto a los ejes fijos al cuerpo rı́gido Q de donde toma la
forma:
~~ ~ ~ ~
Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2) (7.201)

Ejercicio 7.8.1 Demostrar que si (e0 , ei ) y (e′0 , e′i ) son los parámetros de Euler que des-
criben dos rotaciones A y A′ , entonces los parámetros de la rotación A” = A′ A están
expresados en términos de los parámetros de las rotaciones A, A′ , por:
240 / Mecánica clásica avanzada

e′1 ′ = e1 e′0 + e2 e′3 − e3 e′2 + e0 e′1

e′2 ′ = −e1 e′3 + e2 e′0 + e3 e′1 + e0 e′2


(7.202)
e′3 ′ = e1 e′2 − e2 e′1 + e3 e′0 + e0 e′3

e′0 ′ = e0 e′0 − e1 e′1 − e2 e′2 − e3 e′3

Ejercicio 7.8.2 Demostrar que si (α, β, γ, δ) y (α′ , β ′ , γ ′ , δ ′ ) son los parámetros de Cayley-
Klein que describen dos rotaciones A y A′ , entonces los parámetros (α′′ , β ′′ , γ ′′ , δ ′′ ) de
la rotación A′′ = A′ A están expresados en términos de los parámetros de A, A′ , por:

α′′ = αα′ + γ ′ β β” = αβ ′ + βδ ′
(7.203)
γ ′′ = γα′ + δ ′ γ δ” = γβ ′ + δδ ′

Ejercicio 7.8.3 Interpretación geométrica del homomorfismo entre SO(3) y SU (2). Sea
una esfera y una figura geométrica F en ella (véase figura 7.10). Se coloca la esfera sobre
un plano. La normal al plano en el punto de contacto corta a la esfera en el punto T .
La proyección estereográfica de F en el plano es P . Al punto T se le llama vértice de la
proyección.

Figura 7.10 Figura geométrica F dentro de una esfera

Al rotar la esfera alrededor de n̂, en la figura, F se cambia en F ′ y su proyección


estereográfica P se cambia en P ′ . Entonces a cada rotación de la esfera le corresponde
cierta transformación en el plano, llamada transformación homográfica.
Estas transformaciones cambian cı́rculos en el plano por cı́rculos en el plano. Sea
z = x + iy un punto del plano y z ′ = x′ + iy ′ el punto del plano que se obtiene de z
mediante la transformación homográfica. (a) Mostrar que:
az + b
z′ = (7.204)
cz + d
Cinemática del cuerpo rı́gido / 241

donde a, b, c y d son constantes reales o complejas.


(b) Mostrar que el resultado de dos homografı́as sucesivas:

α′ z + β ′ α′′ z ′ + β ′′
z′ = y z ′′ = (7.205)
γ ′z + δ′ γ ′′ z ′ + δ ′′
Es una homografı́a:

α′′′ Z + β ′′′
z ′′′ = (7.206)
γ ′′′ Z + δ ′′′

donde la relación entre (α′′′ , β ′′′ , γ ′′′ , δ ′′′ ) con (α′ , β ′ , γ ′ , δ ′ ) y (α′′ , β ′′ , γ ′′ , δ ′′ )
está dada por expresiones análogas a (7.203). Argumentar que lo anterior muestra cone-
~~
xión entre las rotaciones y las transformaciones homográficas, y que por tanto las Q del
grupo SU (2) corresponden a transformaciones homográficas, donde los parámetros de
Cayley-Klein son los parámetros que caracterizan la transformación homográfica corres-
pondiente a una rotación de un sólido rı́gido (véase el texto de L.V. Ahlfors, Análisis de
variable compleja, Aguilar, 1966).

7.9. Las rotaciones infinitesimales. Cinemática de las


rotaciones
Las coordenadas rı́gidamente unidas al cuerpo rı́gido permiten representar cual-
quier punto del mismo ~r = (x1 , x2 , x3 ). La rigidez del cuerpo se puede expresar diciendo
que ningún punto se puede desplazar con relación al origen.
Es decir:

~r˙ = 0 (7.207)

Los desplazamientos del cuerpo son detectables en el sistema de coordenadas es-


pacial relacionado con el del cuerpo rı́gido por medio de la matriz de rotación ÃT ,
~r = ÃT ~r. Como el cuerpo rı́gido se desplaza respecto al sistema de coordenadas espa-
cial, ÃT habrá de ser función del tiempo, con lo cual:

~r(t) = ÃT (t)~r (7.208)

Es posible escoger los sistemas de coordenadas de modo que ~r(0) = ~r, lo cual
implica que:

ÃT (0) = I˜ (7.209)

Podemos decir que el cuerpo rı́gido en el tiempo t estará descrito por la transforma-
ción ÃT (t) que evoluciona de manera continua a partir de la transformación identidad.
Además es posible suponer que para un tiempo infinitesimal, ÃT (∆t) difiere de la iden-
tidad I˜ por términos del orden de ∆t.
242 / Mecánica clásica avanzada

Rotaciones infinitesimales. Al cabo de un tiempo infinitesimal ∆t, un punto del


cuerpo se habrá desplazado una cantidad infinitesimal ∆~r = ~r(∆t) − ~r(0) = ~r(∆t) − ~r0 ,
respecto a los ejes espaciales. Por lo tanto:
~r(∆t) = ~r0 + ∆~r (7.210)
Existe alguna matriz, con componentes infinitesimales, ǫ̃(∆t), tal que:
∆~r = ǫ̃(∆t)~r0 (7.211)
Por lo cual:
~r(∆t) = (I˜ + ǫ̃)~r0 = (I˜ + ǫ̃)~r(0) (7.212)
La matriz I˜ + ǫ̃ describe cómo están relacionadas las componentes del vector de
posición de un punto del cuerpo rı́gido en los sistemas de coordenadas espacial y del
cuerpo rı́gido, según la interpretación pasiva de la matriz de rotación cuando los ejes
fijos al cuerpo rı́gido han rotado alrededor de un eje n̂ un ángulo δΦ en el sentido de la
mano derecha. Desde el punto de vista activo, I˜ + ǫ̃ describe cómo cambia el vector de
posición de un punto del cuerpo rı́gido, en el sistema de coordenadas espacial, cuando
se rota el cuerpo rı́gido alrededor del eje n̂ por un ángulo δΦ según la regla de la mano
izquierda. De acuerdo con esta última interpretación, para Φ infinitesimal, Ã = I˜ + ǫ̃
estará dada por la ecuación (7.138):
 
1 C3 δΦ −C2 δΦ
 
 
I˜ + ǫ̃ = 
 −C 3 δΦ 1 C 1 δΦ 
 (7.213)
 
C2 δΦ −C1 δΦ 1
donde C1 , C2 y C3 son los cosenos directores del eje de rotación. De acuerdo con (7.210),
(7.137) y (7.211), podemos escribir:
∆~r = ǫ̃~r0 = (~r0 × n̂)δΦ = −(n̂δΦ) × ~r0 (7.214)
Usando el tensor de Levi-Civita para expresar el producto vectorial:
3
X 3 X
X 3
ǫij x0j = ǫijk x0j Ck δΦ (7.215)
j=1 j=1 k=1

Como ~r0 es arbitrario, se debe cumplir:


3
X
ǫij = ǫijk Ck δΦ (7.216)
k=1

Es decir, la matriz ǫ̃ es completamente antisimétrica: ǫ̃T = −ǫ̃ y proporcional a δΦ.


Las rotaciones infinitesimales próximas a la identidad tienen la propiedad conmutativa:
(I˜ + ǫ̃a )(I˜ + ǫ̃b ) = I˜ + ǫ̃a + ǫ̃b + ǫ̃a ǫ̃b
(7.217)
(I˜ + ǫ̃b )(I˜ + ǫ̃a ) = I˜ + ǫ̃b + ǫ̃a + ǫ̃b ǫ̃a
Cinemática del cuerpo rı́gido / 243

Vemos que al primer orden en la cantidad infinitesimal δΦ las rotaciones conmutan.


En general dos rotaciones finitas no conmutan. Tampoco conmuta una rotación finita
con una infinitesimal:

Ã(I˜ + ǫ̃) = Ã + Ãǫ̃


(7.218)
(I˜ + ǫ̃)Ã = Ã + ǫ̃Ã

La rotación inversa a I˜ + ǫ̃ es I˜ − ǫ̃, al primer orden en δΦ:

(I˜ + ǫ̃)(I˜ − ǫ̃) = I˜ − ǫ̃2 (7.219)

O sea que:

~r0 = (I˜ − ǫ̃)~r (7.220)

Por tanto al primer orden en δΦ, ǫ̃~r = ǫ̃~r0 = ∆~r.

Generadores infinitesimales del grupo de rotaciones. La matriz ǫ̃ puede


escribirse en la forma siguiente, según (7.213):
   
0 0 0 0 0 −1
   
   
ǫ̃ = C1 
 0 0 1  δΦ + C2  0 0 0  δΦ
  
   
0 −1 0 1 0 0
  (7.221)
0 1 0
 
 
+C3   −1 0 0  δΦ

 
0 0 0

o también:
3
X
ǫ̃ = Ci G̃i δΦ = (C1 ê2 ∧ ê3 + C2 ê3 ∧ ê1 + C3 ê1 ∧ ê2 )δΦ (7.222)
i=1

Las matrices G̃i se llaman los generadores infinitesimales del grupo de rotaciones.
Satisfacen:
~~ 1
G i = ǫijk êj ∧ êk (7.223)
2
El conmutador de dos generadores obedece la siguiente propiedad:
3
X
G̃i G̃j − G̃j G̃i = ǫijk G̃k (7.224)
k=1
244 / Mecánica clásica avanzada

Las ecuaciones (7.224) definen el álgebra de Lie del grupo de rotaciones. Con esta
notación podemos escribir a (7.214) como:
X 3
d~r
= Ci G̃i ~r (7.225)
dΦ i=1

Estas fórmulas, como hemos dicho, están dentro de la interpretación activa de las
rotaciones.

Velocidad angular. Se define el vector velocidad angular como:


dΦ d~r
ω = n̂
~ ⇒ = −~ω × ~r (7.226)
dt dt
El vector ~ω está situado en el eje de la rotación. Esta dirección se conoce como eje
instantáneo de rotación: el eje n̂ no cambia al realizar la rotación infinitesimal por un
ángulo dΦ. Sin embargo el desplazamiento del cuerpo rı́gido puede involucrar el cambio
del eje n̂. Por esta razón ~ω no es en general la derivada temporal de algún vector; en
otras palabras, Ci dΦ no es el diferencial de alguna cantidad, a no ser que los Ci no
cambien con el tiempo.

Cálculo de d~r/dt cuando n̂ también cambia con el tiempo. En este caso


partimos directamente de la expresión:
~r(t) = Ã(t)~r0 (7.227)
donde de la matriz à convierte al vector ~r0 en el vector ~r. El vector ~r˙ estará dado por:
˙ r = Ã
~r˙ = Ã~ ˙ ÃT ~r (7.228)
0

Por otra parte, ~r0 = ÃT ~r nos da:

0 = Ã ˙ T ~r = −ÃÃ
˙ T ~r + ÃT ~r˙ ⇒ ~r˙ = −(ÃT )−1 Ã ˙ T ~r (7.229)
Definimos la matriz Ω̃ ası́:
˙ T = Ã
Ω̃ = −ÃÃ ˙ ÃT (7.230)
De (7.228) y (7.229) vemos que ~r = Ω̃~r0 . Además:
˙ T = −(Ã
Ω̃ = −ÃÃ ˙ ÃT )T = −Ω̃ (7.231)
Por tanto Ω̃ es una matriz antisimétrica. Sus elementos son entonces de la forma:
3
X
Ωij = ǫijk ωk (7.232)
k=1

Entonces (7.228) se puede escribir como:


3 X
X 3
ẋi = (Ω~r)i = ǫijk ωk xj = (~r × ~ω)i = −(~ω × ~r)i (7.233)
j=1 k=1
Cinemática del cuerpo rı́gido / 245

Por tanto:

~r˙ = −~
ω × ~r (7.234)

Podemos expresar a ωi en términos de las Ωij . Para ello multiplicamos (7.232) por
ǫijl y sumamos sobre i, j:

X 3
3 X 3 X
X 3
ǫijl Ωij = ǫijl ǫijk ωk (7.235)
i=1 j=1 i=1 k=1

Ahora usamos la siguiente propiedad de la densidad de Levi-Civita:

3 X
X 3
ǫijl ǫijk = 2δlk (7.236)
i=1 j=1

con lo cual llegamos a:

3 3
1 XX
ωl = ǫijl Ωij (7.237)
2 i=1 j=1

Usando la definición de Ω̃, (7.230), obtenemos:

3 3 3
1 XXX
ωl = Ȧik Ajk ǫijl (7.238)
2 i=1 j=1
k=1

donde ~ω es la velocidad angular de rotación del cuerpo rı́gido en el sistema de coorde-


nadas espacial, de acuerdo con la interpretación activa de las rotaciones que estamos
utilizando. La ecuación (7.238) permite hallar las componentes de ω en términos de la
representación que se tenga de la matriz Ã.
En términos de los parámetros Ci y Φ, usamos la expresión (7.138) para Ã. Notamos
que los elementos de à son de la forma:

3
X
Aij = δij cos Φ + Cj Ck (1 − cos Φ) + ǫjkl Cl senΦ (7.239)
l=1

Con lo cual Ȧik es:

X3
d d
Ȧik = −δik senΦ Φ̇ + [Ci Ck (1 − cos Φ)] + ǫjkm (Cm senΦ) (7.240)
dt m=1
dt
246 / Mecánica clásica avanzada

Como ATkj = Ajk , podemos escribir:


3
X d
Ȧik Ajk = −δik senΦ cos Φ Φ̇ + cos Φ [Ci Cj (1 − cos Φ)]+
dt
k=1

3
X d
ǫijm cos Φ (Cm senΦ) − Ci Cj (1 − cos Φ)senΦ Φ̇+
m=1
dt

d
Cj [Ci n̂(1 − cos Φ)] · n̂(1 − cos Φ)+
dt
3 (7.241)
X d
ǫikm (Cm senΦ)Cj Ck (1 − cos Φ)−
m=1
dt

3
X 3
X d
ǫjil Cl sen2 Φ Φ̇ + ǫjkl [Ci Ck (1 − cos Φ)]Cl senΦ+
dt
l=1 l=1

3
X d
(δji δlm − δjm δli )Cl senΦ (Cm senΦ)
dt
l,m=1

P3
donde hemos usado la conocida propiedad del tensor de Levi-Civita, l=1 ǫkij ǫklm =
δil δjm − δim δjl . Las ecuaciones (7.241) se simplifican notando que n̂.n̂˙ = 0 y n̂ × n̂ = 0 y
P3 ~ ~
k=1 ǫijk Ai Bj = (A × B)k . Luego, al multiplicar por ǫikl y sumar sobre i y sobre j, no-
tando además que ǫijk se anula cuando tiene subı́ndices repetidos, obtenemos finalmente
para ~ ω:

ω = n̂Φ̇ + n̂˙ × n̂(1 − cos Φ) + n̂˙ senΦ


~ (7.242)

En términos de los parámetros de Euler, definidos en (7.139):

ω = 2e0~e˙ − 2ė0~e + 2~e˙ × ~e


~ (7.243)

Con la interpretación activa de las rotaciones, la velocidad angular que hemos ob-
tenido nos permite hallar, por medio de (7.234), la forma en que cambia con el tiempo
el vector de posición de un punto arbitrario del cuerpo rı́gido.

La velocidad angular en la interpretación pasiva de las rotaciones. En


esta interpretación, ~r(t) es el vector de posición de un punto en el sistema de coordenadas
espacial, y ~r en el sistema de coordenadas del cuerpo rı́gido. En este caso:

~r(t) = ÃT (t)~r (7.244)

y ~r˙ estará dado por:

~r˙ = Ω̃~r = −~
ω × ~r (7.245)
Cinemática del cuerpo rı́gido / 247

ahora ~
ω es la velocidad angular de los ejes unidos al cuerpo rı́gido en el sistema de
coordenadas espacial. El tratamiento es igual al anterior, con sólo reemplazar a à por
ÃT :

Ω̃ = −ÃT Ã ˙ T Ã
˙ = Ã (7.246)

donde ÃT se obtiene de (7.138) con sólo reemplazar a Φ por −Φ. ~ω estará dada en
términos de à por:
3 3 3
1 XXX T
ωl = Ȧik Akj ǫijl (7.247)
2 i=1 j=1
k=1

Se obtiene entonces que:

~ = −n̂Φ̇ + n̂˙ × n̂(1 − cos Φ) − n̂˙ senΦ


ω (7.248)

y en términos de los parámetros de Euler:

~ = −2ė0~e + 2e0~e˙ + 2~e˙ × ~e


ω (7.249)

ahora n̂ es el eje alrededor del cual giran los ejes coordenados unidos al cuerpo rı́gido,
y Φ es el ángulo de rotación en el sentido de la regla de la mano derecha (contrario a
las agujas del reloj). ~
ω puede también ser evaluada en términos de los ángulos de Euler.
Para ello hay varias posibilidades de cálculo.
(a) Considerar que ~ ω tiene componentes a lo largo de los ejes de las rotaciones
sucesivas que definen los ángulos de Euler:

~ = φ̇êz + θ̇êµ1 + ψ̇êz


ω (7.250)

Obviamente (7.250) permite hallar a ω ~ respecto a los ejes espaciales (x, y, z) o


respecto a los ejes rotantes (x, y, z). Para hallar a ~ω respecto a los ejes espaciales, basta
expresar a ~eµ1 y êz en términos de (~ex , ~ey , ~ez ). Usando las expresiones (7.30), podemos
escribir:
êµ1 = (êµ1 · êx )êx + (êµ1 · êy )êy + (êµ1 · êz )êz

= cos φ êx + senφ êy


(7.251)
êz = (êz · êx )êx + (êz · êy )êy + (êz · êz )êz

= senθ senφ êx + senθ cos φêy + cos θêz

donde en (7.251) hemos usado la ecuación (7.122). Las ecuaciones (7.251) permiten
escribir a (7.250) en la forma:

ω = (φ̇ + cos ψ̇)êz + (θ̇senθ − ψ̇ senψ cos φ)êy +


~
(7.252)
(θ̇ cos φ + ψ̇ senθ senφ)êx
248 / Mecánica clásica avanzada

De manera similar se obtiene para ~ω respecto a los ejes fijos al cuerpo rı́gido:
~ω = (ψ̇ + φ̇ cos θ)êz + (φ̇ senθ cos ψ − θ̇ senψ)êy
(7.253)
+(φ̇ senθ senψ + θ̇ cos ψ)êx

(b) La otra posibilidad de cálculo consiste en usar la ecuación que define a Ω̃,
(7.246). Ã se puede expresar como producto de tres rotaciones según (7.131). Por tanto:

Ω̃ = ÃTφ ÃTθ ÃTψ (Ã ˙


˙ Ã Ã + Ã Ã ˙
ψ θ φ ψ θ Ãφ + Ãψ Ãθ Ãφ ) (7.254)

Usando la ortogonalidad de las matrices Ã:


˙ + ÃT ÃT Ã
Ω̃ = ÃTφ Ã ˙
˙ Ã + ÃT ÃT ÃT Ã
φ φ θ θ φ φ θ ψ ψ Ãθ Ãφ (7.255)

˙ , ...
Si llamamos Ω̃φ = ÃTφ Ãφ

Ω̃ = Ω̃φ + ÃTφ Ω̃θ Ãφ + ÃTφ ÃTθ Ω̃φ Ãθ Ãφ (7.256)

Usando las definiciones (7.127) se llega fácilmente a:


   
0 1 0 0 0 0
   
   
Ω̃φ = φ̇  −1 0 0  Ω̃θ = θ̇  0 0 1 
  

   
0 0 0 0 −1 0
  (7.257)
0 1 0
 
 
Ω̃ψ = ψ̇ 
 −1 0 0 

 
0 0 0

con lo cual (7.256) conduce al resultado (7.252).


(c) Otra vı́a es expresar a ~ω en términos de los ángulos de Euler usando (7.249) y
(7.142), lo cual se deja como ejercicio al lector.
Las ecuaciones (7.252) y (7.253) muestran que no hay una relación simple entre las
componentes de ~ ω expresadas respecto a los ejes fijos al sólido rı́gido y respecto a los ejes
espaciales. La ecuación (7.247) da las componentes de ω ~ respecto a los ejes espaciales.
Llamaremos ~ω a la velocidad angular respecto a los ejes fijos al sólido rı́gido. Para hallar
~ empecemos por notar que ~r˙ = Ω̃~r, de (7.245). Como ~r = ÃT ~r, tenemos que:
ω

~r˙ = Ω̃ÃT ~r (7.258)

De transformar ~r˙ a las coordenadas del sólido rı́gido obtenemos:

Ã~r˙ = ÃΩ̃ÃT ~r (7.259)


Cinemática del cuerpo rı́gido / 249

Claramente Ã~r˙ no es ~r˙ , puesto que esta última es cero. Usando (7.246) y la or-
togonalidad de à obtenemos que à Ω̃ à = Ãà ˙ T , matriz que llamaremos Ω̃ que es Ω̃
transformada a las coordenadas fijas al sólido rı́gido. La matriz Ω̃ es antisimétrica:
T
Ω̃ = Ã ˙ ÃT = −ÃΩ̃ÃT = −Ω̃
˙ ÃT = Ã(ÃT Ã) (7.260)
por tanto puede expresarse como:
3
X
Ωij = ǫijk ω k (7.261)
k=1

Esto conduce a:
Ã~r˙ = Ω̃~r = −ω
~ × ~r (7.262)
Entonces se sigue que:
3 3 3
1 XXX
ωl = ǫijk Aik ȦTkj (7.263)
2 i=1 j=1
k=1

Comparando a (7.238) y (7.263) vemos que ω ~ y ~ω en el punto de vista activo de


las rotaciones son antiparalelas, como es de esperarse, o sea que, de acuerdo con (7.243):
~ = −2e0~e˙ + 2~eė0 − 2~e˙ × ~e
ω (7.264)
Usando (7.264) y (7.142) se obtiene el resultado (7.253).
No existen en general, funciones λi (φ, θ, ψ) tales que:
d
ωi = λi (φ, θ, ψ) (7.265)

Por ejemplo, si ω1 = λ̇1 se deberı́a cumplir que:
dλ1 dλ1 dλ1
φ̇ + θ̇ + ψ̇ = θ̇ cos θ + ψ̇ senθ senφ (7.266)
dφ dθ dψ
y por tanto:
dλ1 dλ1 dλ1
=0; = cos φ ; = senθ senφ (7.267)
dφ dθ dψ
λ1 no existe puesto que:
∂ 2 λ1 ∂ 2 λ1
= 0 ; en tanto que = −senφ
∂θ ∂φ ∂φ∂θ

∂ 2 λ1 ∂ 2 λ1
= 0 ; en tanto que = cos θ senφ (7.268)
∂ψ ∂θ ∂θ∂ψ

∂ 2 λ1 ∂ 2 λ1
= 0 ; en tanto que = sen θ cos φ
∂ψ ∂φ ∂φ∂ψ
250 / Mecánica clásica avanzada

La ecuación (7.265) se cumple solamente cuando φ = θ = 0 o sea cuando ω1 = 0.


Las componentes de ω ~ son combinaciones no integrables de φ̇, θ̇, ψ̇ (o de las derivadas
temporales de los parámetros usados para describir la rotación), llamadas las derivadas
de cuasicoordenadas, o seudocoordenadas. Las ecuaciones de Appell son las ecuaciones
de movimiento cuando se usan seudocoordenadas para describir el sistema (véase el texto
de Gantmacher, Lectures in analytical mechanics, sección 10).
El cálculo de ωi implica considerar desplazamientos infinitesimales alrededor de
una posición dada del sólido rı́gido. Pero hay maneras diferentes de realizar esos des-
plazamientos. Como una rotación finita no conmuta con una infinitesimal, depende del
orden en que se efectúen las transformaciones. Es de esperarse que ωi sea una derivada
total respecto al tiempo sólo en el caso en que el desplazamiento infinitesimal sea alre-
dedor del mismo eje de rotación en que se hizo la rotación finita. Por ejemplo, si à = Ãφ
y ǫ̃ = ǫ̃φ con θ = φ = 0, entonces ω1 = 0; ω2 = 0; ω3 = φ̇.

Tasa de cambios temporales de un vector. Seguimos con el punto de vista


pasivo de las rotaciones. Un vector arbitrario G~ cambia con el tiempo en el sistema de
~ respecto a los ejes espaciales proviene
coordenadas fijo al cuerpo rı́gido. El cambio de G
de dos efectos: de la rotación del sistema de ejes del sólido rı́gido y de la rotación
~ Es decir:
intrı́nseca de G.
   
~
dG = ~˙
G dt
cuerpo cuerpo
    (7.269)
~
dG = ~
−~ω × G dt
rotacional espacio

En (7.269) ~
ω está dada por (7.248), que es el negativo de la velocidad angular que
usan algunos
  autores para describir
 las
 rotaciones desde el punto de vista pasivo y para
los cuales dG~ = −~ω × G ~ dt.
rotacional espacio
~ visto en los ejes espaciales es:
Entonces el cambio en G
   
~
dG ~
= dG ~
− ~ω × Gdt (7.270)
espacio cuerpo

o también:
! !
~
dG ~
dG
= ~
− ~ω × G (7.271)
dt dt
espacio cuerpo

~ es:
La segunda derivada temporal de G
! ! !
~
d2 G ~
d2 G ~
dG
2
= 2
− 2~ω ×
dt dt dt
espacio cuerpo espacio (7.272)

+~ω × (~ω × G) ~˙ × G
~ −ω ~
Cinemática del cuerpo rı́gido / 251

La ecuación (7.270), y por tanto también (7.271) y (7.272), es válida sólo cuando
los ejes espaciales y del cuerpo rı́gido coinciden instantáneamente. Para una posición
arbitraria del cuerpo rı́gido se cumple:
~ =
G ~
ÃG

~˙ =
G ˙G
à ~˙
~ + ÃG (7.273)

~¨ =
G ¨G
à ˙G
~ + 2Ã ~˙ + ÃG
¨
~

~˙ y G
Las (7.273) pueden expresarse en función de ~ω . Los vectores G ~¨ se pueden
escribir respecto a los ejes espaciales ası́:

~˙ = G
ÃT G ~˙ + ÃT Ã
˙G~ y ~¨ = G
ÃT G
¨~ ˙G
+ 2ÃT Ã ~˙ + ÃT Ã
¨G ~ (7.274)
˙ obtenemos:
Usando la definición Ω̃ = −ÃT Ã,

Ω̃˙ = ˙ T Ã
−Ã ˙ − ÃT Ã
¨

  (7.275)
2
Ω̃ = ˙ T Ã −ÃT Ã
à ˙ T Ã
˙ = −Ã ˙ ⇒ Ω̃˙ = Ω̃2 − ÃT Ã
¨

De (7.275) se sigue que:

~˙ = G
ÃT G ~˙ − Ω̃G
~
(7.276)
~¨ = G
ÃT G
¨~ ~˙ + (Ω̃2 − Ω̃)
− 2Ω̃G ˙ G~

Usando (7.245) obtenemos:


~ = −~
Ω̃G ~
ω×G (7.277)

˙ T = d(Ω̃T )/dt = −Ω̃


Como Ω̃ ˙ se sigue también que:

Ω̃˙ G ω˙ × G
~ = −~ ~ (7.278)

Además se cumple que:


   
~ = Ω̃ −~
Ω̃2 G ω×G ~ = −~ ~
ω × −~ω × G (7.279)

De (7.277) y (7.278) se obtiene para (7.276):

~˙ = G
ÃT G ~˙ + ~ ~
ω×G
(7.280)
T~¨ = G
à G
¨~
+ 2~ ~˙ + ω
ω×G ~ + ~ω˙ × G
~ × (~ω × G) ~
252 / Mecánica clásica avanzada

Explı́citamente las ecuaciones (7.280) se pueden escribir ası́:


! !
~
d2 G h dG
~ i
= Ã + ω
~ × ~
G
dt2 dt
cuerpo espacio
! ! !
~
d2 G h d2 G
~ ~
dG (7.281)
2
= Ã 2
+ 2~ω ×
dt dt dt
cuerpo espacio espacio
i
~ + ~ω˙ × G
+~ω × (~ω × G) ~

Vemos que (7.271) y (7.272) coinciden con (7.281) cuando à = I, ˜ esto es, cuando
escogemos los ejes de modo que coincidan instantáneamente.
En particular, para el vector de posición de una partı́cula moviéndose en el sistema
de coordenadas fijo a la Tierra, siendo ~ω la velocidad angular de la Tierra respecto al
sistema de ejes espacial, (7.281) nos da para à = I:˜

ω × (~r˙ − ~ω × ~r ) + ~ω × (~ω × ~r ) + ~ω˙ × ~r


~¨r = ~¨r + 2~
(7.282)
ω × ~r˙ − ~ω × (~ω × ~r) + ~ω˙ × ~r
= ~¨r + 2~

Como para la Tierra ~ω = −n̂Φ̇ podemos escribir:

~¨r = ~¨r − 2Φ̇n̂ × ~r˙ − Φ̇2 n̂ × (n̂ × ~r) (7.283)


~ = m~¨r y F~ = m~¨r se sigue que:
Como F
~ = F~ − 2mΦ̇n̂ × ~r˙ − mΦ2 n̂ × (n̂ × ~r)
F (7.284)
En el sistema de coordenadas rotante, fijo a la Tierra, la fuerza efectiva no es
F~ = m~g sino que hay otros dos términos de naturaleza inercial. El segundo es la fuerza
de Coriolis y el tercero es la fuerza centrı́fuga. La discusión completa de estos efectos
puede verse en el texto Classical mechanics de Goldstein, sección 4-9, o en el texto Fı́sica,
vol. I de Alonso-Finn, sección 6.5.
8
Dinámica del cuerpo rı́gido

El fin de la dinámica del cuerpo rı́gido es describir la evolución del cuerpo rı́gido, o
sea, hallar las coordenadas generalizadas de rotación en función del tiempo cuando son
conocidas: (i) La distribución de masa del cuerpo rı́gido en reposo y (ii) Las fuerzas y
ligaduras que actúan sobre él. Cuando no hay ligaduras, los ángulos de Euler constituyen
un conjunto adecuado de coordenadas generalizadas independientes.
Hay distintas formas de llegar a las ecuaciones de movimiento para los ángulos de
Euler: a partir del lagrangiano, por medio de tres constantes de movimiento o por medio
de las ecuaciones de movimiento de Euler. Cuál forma se utiliza es algo que depende del
problema particular.

8.1. El tensor de inercia


Un cuerpo rı́gido puede considerarse como un sistema de partı́culas sometido a las
ligaduras de que cualquier par de partı́culas permanece siempre a la misma distancia una
de la otra. En muchos casos es útil considerar una distribución continua de materia, de
acuerdo con cierta función de densidad de masa ρ(~r). La masa total, para distribuciones
discreta y continua respectivamente, es:
N
X Z
M= mi ; M= ρ(~r)d3~r (8.1)
i=1

Las correspondientes expresiones para la energı́a cinética y el momento angular


son:
N
X Z
1 2 1
T = mi~r˙ i ; T = ρ(~r)~r˙ 2 d3~r (8.2)
i=1
2 2

N
X Z
~ =
L mi~ri × ~r˙ i ; ~ =
L ρ(~r)~r × ~r˙ d3~r (8.3)
i=1

253
254 / Mecánica clásica

Similarmente el torque total es:


N
X Z
~ =
K ~ri × F~i ; ~ =
K ~r × F~ (~r) d3~r (8.4)
i=1

donde F~ (~r) es la fuerza por unidad de volumen en el punto ~r. Las ecuaciones (8.2),
(8.3) y (8.4) son cantidades evaluadas en el sistema de coordenadas espacial; es deseable
expresarlas en función de las coordenadas del cuerpo rı́gido.
Supondremos que el cuerpo rı́gido se translada a la vez que rota, siendo V ~ la
velocidad de translación del origen de coordenadas fijo al cuerpo y ω~ la velocidad angular
de rotación. Las fórmulas de transformación para la posición y la velocidad de un punto
arbitrario son, según las fórmulas (7.5), (7.244) y (7.245):

~r = V~ t + AT ~r ; ~ + AT ~r˙ − ~ω × ~r ′
~r˙ = V (8.5)

Por simplicidad hemos tomado a V ~ constante. El vector ~ω está dado por (7.248).
Si el punto en consideración es del cuerpo rı́gido entonces se cumple que ~r˙ = 0.

Constancia de ω respecto a diferentes sistemas de coordenadas fijos al


cuerpo rı́gido. Sean O1 y O2 dos puntos del cuerpo rı́gido en los cuales se toma el
origen de dos sistemas de coordenadas fijos al cuerpo rı́gido. R~1 y R~ 2 son los vectores de
~
posición de O1 y O2 respecto a los ejes espaciales, de modo que R = R ~2 −R~ 1 es el vector
de posición de O2 respecto a O1 . Sea ~ω1 la velocidad angular de los ejes del cuerpo rı́gido
con origen en O1 y ~ ω2 respecto a O2 . De las fórmulas R ~2 = R
~ +R ~1 y R ~1 = R~2 − R ~ se
sigue que:

~ 2
dR dR~ 1 dR ~ dR~ 1 dR~
= + = + −ω
~1 × R~ (8.6)
dt dt dt dt dt
esp esp esp esp 1

~ 1
dR ~ 2
dR ~
dR ~ 2
dR ~
dR
= − = − +ω ~
~2 × R (8.7)
dt dt dt dt dt
esp esp esp esp 2

en donde usamos los resultados de (7.269) y siguientes.


Por tratarse de un cuerpo rı́gido se sigue que:

dR~ ~
dR
= =0 (8.8)
dt dt
1 2

Entonces obtenemos de (8.6) y (8.7):



~ 1
dR dR~ 1
= −ω
~1 × R~ + ~ω2 × R
~ (8.9)
dt dt
esp esp

Por tanto:
(~ ~ =0
ω2 − ω~1 ) × R (8.10)
Dinámica del cuerpo rı́gido / 255

Entonces ~ ~ siendo λ arbitraria. Como esta expresión debe cumplirse


ω2 − ω~1 = λR,
en el caso lı́mite en que el cuerpo rı́gido esté en reposo, λ debe anularse, por lo que se
llega al resultado importante de que el vector ~ω es independiente del punto del cuerpo
rı́gido que se tome como origen del sistema de coordenadas fijo al cuerpo rı́gido.

Energı́a cinética. La energı́a cinética respecto a los ejes espaciales, ecuación (8.2),
puede descomponerse usando (8.5):

1X
N h i
T = mi V~ 2 − 2V
~ · (~
ω × ~ri ) + (~ω × ~ri ′ )2 (8.11)
2 i=1

Si escogemos el origen de coordenadas del sistema de coordenadas del cuerpo rı́gido


(que coincide con el origen de las coordenadas ~r ′ , según la figura 7.2) en el centro de
masa, se cumple que:
N
X
~ CM
mi~ri ′ = M R ′
=0 (8.12)
i=1

Entonces se sigue que:


N
1 ~2 1X
T = MV + ω × ~ri ′ )2
mi (~ (8.13)
2 2 i=r

Cuando los ejes del cuerpo rı́gido coinciden instantáneamente con los espaciales,
~r = ~ri ′ , en vez de (8.13) podemos escribir:
N
1 ~2 1X 2
T = MV + ω × ~r i
mi ~ (8.14)
2 2 i=r

La energı́a cinética, pues, consta de dos partes independientes: la energı́a cinética


del centro de masa y la energı́a cinética de rotación respecto al centro de masa. Como
~ω depende de la orientación del cuerpo rı́gido, según (7.252), se sigue que la energı́a
cinética de rotación depende de los ángulos de Euler y sus derivadas temporales:
T = Ttraslacional + Trotacional (φ, θ, ψ, φ̇, θ̇, ψ̇) (8.15)
Es conveniente escribir a Trotacional de la siguiente manera. Usamos la expresión
para el producto cruz en términos del tensor de Levi-Civita:
2
ω × ~ri = ǫmnp ωn rip ǫmst ωs r it
~ (8.16)
donde los ı́ndices mudos m, n, p, s, t, toman los valores 1, 2, 3, que representan a x, y,
z, y usamos la convención de Einstein. El tensor de Levi-Civita tiene la propiedad:
ǫmnp ǫmst = δns δpt − δnt δps (8.17)
de la cual se sigue que:
2 2
~ ~ · ~r i
ω × ~ri = ω 2 r 2i − ω (8.18)
256 / Mecánica clásica

La ecuación (8.18) permite escribir a Trotacional como:


XN
1 
Trotacional = ωs ωt mi r2i δst − ris r it (8.19)
2 i=1

Definimos el tensor de inercia ası́:


N
X
Ist = mi (r 2i δst − r is r it ) (8.20)
i=1

o usando la notación diádica, ecuación (7.45),


N  
~~ X
I= mi r 2i ~~1 − ~r i r~i (8.21)
i=1

~
donde ~1 es el diádico unidad; vemos entonces que:
1 ~~ 1
Trotacional = ~ω · I · ~ω = ωs Ist ωt (8.22)
2 2
~ ~
En la definición de I~ tomamos los ejes del cuerpo rı́gido; I~ es el tensor de inercia
respecto a los ejes del cuerpo rı́gido con origen en el centro de masa. Sin embargo, cuando
~ = 0, T = Trotacional y la fórmula (8.22) resulta aplicable también en el caso en que el
V
origen de coordenadas no esté en el centro de masa.

Momento angular. El momento angular en el sistema de coordenadas espacial,


ecuación (8.3), puede descomponerse en una parte del centro de masa y una parte res-
pecto al centro de masa. Cuando los ejes ~r ′ y ~r coinciden instantáneamente, el momento
angular de rotación alrededor del centro de masa es:
N
X  XN h 2 i
~ rotacional =
L mi~r i × ω
~ × ~ri = mi ~ω~ri − r i ω
~ .~r i (8.23)
i=1 i=1

Desarrollando el triple producto vectorial llegamos a una expresión que contiene el


tensor de inercia:
~ rotacional = ~I~ · ~ω
L (8.24)
~ rotacional son, usando los resultados de la sección 7.3:
o sea que las componentes de L
~
(Lrotacional )s = ~es · I~ · ~ω ; s = 1, 2, 3 (8.25)
~
donde I~ es el tensor de inercia respecto a los ejes del cuerpo rı́gido con origen en el
centro de masa.

Momentos de inercia y productos de inercia. Los elementos diagonales del


tensor de inercia reciben el nombre de momentos de inercia:
N
X  2 
~~
Iss = ~es · I · ~es = mi ~r i − r 2is ; s = 1, 2, 3 (8.26)
i=1
Dinámica del cuerpo rı́gido / 257

~
Los elementos no diagonales de I~ reciben el nombre de productos de inercia (y a
veces el de momentos centrı́fugos respecto a los planos coordenados):
N
X
Ist = − mi r is rit ; s 6= t = 1, 2, 3 (8.27)
i=1

~~
I es un tensor simétrico, por lo tanto puede ser diagonalizado mediante una trans-
formación de semejanza realizada por una matriz ortogonal, sus valores propios son
reales y sus vectores propios son ortogonales, de acuerdo con conocidos teoremas del
álgebra de matrices.1

Momento de inercia respecto al eje de rotación. Por simplicidad tomaremos


el caso en que el eje de rotación instantáneamente está fijo, de modo que ~ω está dada por
la fórmula (7.226), ω
~ = ωn̂. Entonces de acuerdo con (8.22), Trotacional puede escribirse
como:
1 2
T = Iω (8.28)
2
donde el número I está definido ası́:
N
X h 2 i
I = n̂ · I · n̂ = I n̂n̂ = mi r 2i − ~ri · n̂ (8.29)
i=1

I se denomina el momento de inercia respecto al eje de rotación. De manera similar


puede calcularse el momento de inercia respecto a un eje arbitrario, que por supuesto
será diferente del I dado en (8.29). La componente de Lrotacional en la dirección de n̂ es:

~ · n̂ = n̂ · ~I~ · n̂
Ln̂ = L ω = Iω (8.30)
~ rotacional al cuadrado es:
La magnitud de L
~ ~
ω · I~ · I~ · ω
L2 = ~ ~ 6= I 2 ω 2 (8.31)

o sea que en general L ~ será distinto de Ln̂ ; en otras palabras, en general L


~ y ~ω no son
paralelos.
De acuerdo con la definición elemental, el momento de inercia del cuerpo rı́gido
respecto al eje n̂ depende de las distancias Ai de las partı́culas al eje:
N
X
In = A2i mi (8.32)
i=1

De acuerdo con su definición:



A2i = (~r i × n̂)2 = ~r i · n̂ × ~ri × n̂ (8.33)
1 Véase
por ejemplo el texto de V. I. Smirnov, A course of higher mathematics, vol. III, numeral 40,
Pergamon Press, 1964.
258 / Mecánica clásica

Utilizando un desarrollo similar al de las ecuaciones (8.16), (8.17) y (8.18):


 
n̂ × ~r i × n̂ = ~ri − n̂ n̂ · ~r i (8.34)

Reemplazando (8.34) en (8.32) llegamos a:


N
X h 2 2 i
In = mi ~r i − ~r i .n̂ (8.35)
i=1

~
Si n̂ es el eje de rotación vemos que In coincide con I = n̂ · I~ · n̂.

Teorema de Steiner. Es un teorema que permite relacionar los momentos de


inercia respecto a ejes diferentes. Se llama también el teorema de los momentos de
inercia respecto a ejes paralelos. Si ~r es el vector de posición de la partı́cula i respecto
a los ejes del cuerpo rı́gido con origen en el centro de masa y ~ri ′ respecto a los ejes
del cuerpo rı́gido con un origen diferente O′ , colocado en R ~ respecto al centro de masa,
entonces:
~ + ~r i ′
~r i = R (8.36)

Manipulaciones simples nos conducen a la relación:

I ′ = I + M a2 (8.37)

donde a2 es:
~ × n̂)2
a2 = (R (8.38)

y I ′ es el momento de inercia respecto a un eje paralelo a n̂ que se separa de él una


cantidad a. El teorema de Steiner para el tensor de inercia mismo es:
 
~~ ′ ~~
I = I + M R2~~1 − R
~R~ (8.39)

~ ~
donde I~ es el tensor de inercia respecto al centro de masa y I~ ′ es el tensor de inercia
~
respecto a unos ejes del cuerpo rı́gido con origen en R respecto al centro de masa.
~ ~~
Ejemplo 8.1.1 Expresar a I~ en términos de R i definida ası́:
 
0 z i −y i
 
  ~~
R̃i = 
 −z i 0 x i 
 o sea : R i = ǫmnl xil êm ên (8.40)
 
y i −xi 0

Utilizando la propiedad del tensor de Levi-Civita dada en (8.17), llegamos a la


~~ ~~
siguiente expresión par R i · Ri :

~~ ~~ ~
R r i~r i − r 2i ~1
i · Ri = ~ (8.41)
Dinámica del cuerpo rı́gido / 259

~~
Se sigue entonces la siguiente expresión para I:
N
X ~ ~
~~
I =− mi R i · R i (8.42)
i=1

Ejemplo 8.1.2 Hallar el lagrangiano para una placa uniforme rectangular rı́gida horizon-
tal que está colocada sobre cuatro resortes iguales, para el caso en el cual el centro de
la placa sólo puede tener movimientos perpendiculares a la placa. La placa sólo puede
desplazarse verticalmente y girar de modo que el centro permanezca fijo.

Entonces las correspondientes energı́as cinéticas son:


1 1 ~~
M Ż 2 ; Trotacional = ~ω · I.~
Ttraslacional = ω (8.43)
2 2
Para una placa rectangular homogénea rı́gida usamos la fórmula correspondiente
a (8.21) para una distribución uniforme de masa:
Z  
~~ M 2~~
I= r I − ~r~r d2~r (8.44)
A
donde A es el área de la placa y d2~r el elemento diferencial de área. Tomando el plano
x − y sobre la placa, con origen en el centro de la misma, y llamando 2a la longitud de
la placa (dirección x) y 2b la anchura (dirección y), (8.44) toma la forma:
Z Z
~~ M ~
I= (r2 I~ − ~r~r) dx dy (8.45)
4ab
Con la elección de coordenadas que hemos hecho, los productos de inercia se anulan
~~
(I es diagonal). Los momentos de inercia son:
1 1 1
Ixx = M b2 ; Iyy = M a2 ; Izz = M (a2 + b2 ) (8.46)
3 3 3
En vez de tomar como coordenadas generalizadas de rotación a los ángulos de
Euler ordinarios, con lo cual la velocidad angular estarı́a dada por las fórmulas (7.252)
o (7.253), tomaremos los ángulos de rotación alrededor de los tres ejes perpendiculares
fijos a la placa. Esta es la llamada convención “xyz” de los ángulos de Euler; ver el final
de la sección 7.6. Las componentes de ~ω a lo largo de los ejes de las rotaciones sucesivas
que definen los ángulos de Euler en la convención “xyz” son:
~ = φ̇ êz + θ̇ êµ2 + ψ̇ êµ′1
ω (8.47)
Con lo cual se obtiene para las componentes de la velocidad angular respecto a los
ejes del cuerpo rı́gido:2
~ω = (ψ̇ − φ̇ senθ)êx̄ + (θ̇ cos ψ + φ̇ cos θ senψ)êy
(8.48)
+(−φ̇ senψ + φ̇ cos θ cos ψ)êz̄
2 Las componentes respecto a los ejes espaciales son (ψ̇ cos θ cos φ − θ̇ senφ, φ̇ cos θ senφ + θ̇ cos φ, φ̇ −
ψ̇ senθ). Véase apéndice B del texto de Goldstein, Classical mechanics, 2a ed., Addison Wesley, 1980.
¯
260 / Mecánica clásica

En las fórmulas dinámicas hemos supuesto que los ejes espacial y de cuerpo rı́gido
coinciden instantáneamente. Por esto debemos tomar nulos los valores de los ángulos de
Euler, con lo cual ω
~ yω ~ coinciden instantáneamente:

ω = φ̇ êz + θ̇ êy + ψ̇ êx


~ (8.49)
Entonces Trotacional será:
1 2 1 1
Trotacional = ψ̇ Ixx + θ̇2 Iyy + φ̇2 Izz (8.50)
2 2 2
Con la convención ordinaria para los ángulos de Euler aparecerán términos en φ̇ψ̇.
La energı́a potencial en función de z y de los ángulos de Euler es:
1 1 1 1
V = (4k)z 2 + (4k)(aθ)2 + (4k)(bψ)2 + (4k ′ )(a2 + b2 )φ2 (8.51)
2 2 2 2
En (8.51), k es la constante de estiramiento de los resortes, en tanto que k ′ es la
constante asociada a los desplazamientos horizontales, en que no se estiran los resortes
y por lo tanto k ′ no se puede expresar en función de k. El lagrangiano buscado es:
M 2 2 1
L= |b ψ̇ + a2 φ̇2 + (a2 + b2 )φ̇2 | + M ż 2 − 2kz 2
6 2 (8.52)
2 2 2 2 ′ 2 2 2
−2ka θ − 2kb ψ − 2k (a + b )φ
Vemos que z, φ, θ, ψ, son coordenadas normales.

8.2. Diagonalización del tensor de inercia


El tensor de inercia es simétrico, Ist = Its , con lo cual sus valores propios son reales
y los vectores propios correspondientes a valores propios diferentes son ortogonales. En
general los productos de inercia no son nulos, o sea que cada componente de L ~ depende
de todas las componentes de ω ~:
Ls = Is1 ω1 + Is2 ω2 + Is3 ω3 ; s = 1, 2, 3 (8.53)

si se anulan los productos de inercia, cada componente de L ~ será proporcional a la


respectiva velocidad angular y T será una forma cuadrática en las componentes de ~ω sin
términos cruzados.
~
Como I~ es simétrico, siempre es posible hallar un sistema de coordenadas fijo
al cuerpo rı́gido en que sea diagonal. Esto se logra resolviendo el problema de valores
~~
propios y vectores propios para I:
~~ ~ ~α ;
I · Xα = Iα X α = 1, 2, 3 (8.54)
o en términos de las componentes:
3
X
Irt Xαt = Iα Xαr ; r, α = 1, 2, 3 (8.55)
t=1
Dinámica del cuerpo rı́gido / 261

Vamos a admitir que los valores propios Iα puedan ser complejos. Entonces Iβ⋆
satisface:
X 3
⋆ ⋆
Itr Xβr = Iβ⋆ Xβt

; t, β = 1, 2, 3 (8.56)
r=1

Multiplicando a (8.55) por Xβr y a (8.56) por Xαt , sumando sobre r y t y restando
los resultados obtenemos:
X3 X 3 3 X
X 3 3
X
⋆ ⋆ ⋆ ⋆ ⋆
Irt Xαt Xβr − Itr Xβr Xαt = Iα Xαr Xβr Iβ
r=1 t=1 t=1 t=1 r=1
(8.57)
3
X

− Xβt Xαt
t=1

como Irt es real y simétrica, el lado izquierdo de (8.57) es nulo. El lado derecho puede
escribirse como un producto escalar ordinario, quedando:
~α · X
(Iα − Iβ⋆ )X ~ ⋆ = 0 ; α, β = 1, 2, 3 (8.58)
β

Para α = β se sigue de (8.58), debido a que X~α ·X~ ⋆ es real y positivo, que I ⋆ = Iα ,
α α
o sea que los valores propios son reales. Cuando X~α y X~ β corresponden a valores propios
diferentes, se sigue que son ortogonales. Escogiendo los vectores propios X ~ α normalizados
a la unidad y notando que cuando ocurra que Iα = Iβ entonces Xα · X ~ ~ β puede no ser
cero, pero que puede escogerse cero, obtenemos de esta manera que X ~ 1, X
~2 y X~ 3 , forman
una trı́ada ortonormal de vectores unitarios:
X~α · X
~ β = δαβ ; α, β = 1, 2, 3 (8.59)
Analicemos más en detalle el caso en que ocurran valores propios degenerados,
Iα = Iβ con α 6= β. De (8.58) se sigue que se debe cumplir, en el caso en que I1 6= I2 = I3 ,
que X~1 · X~2 = X~1 · X~ 3 = 0, pero no necesariamente se debe cumplir que X ~2 · X
~ 3 = 0.
~
Todos los vectores perpendiculares a X1 son vectores propios correspondientes al mismo
valor propio I2 , formando un espacio bidimensional, o sea que sólo hay dos vectores
propios de I2 linealmente independientes, con lo cual podemos escoger cualquier par
de vectores ortogonales, lo cual nos está a su vez indicando que el sólido rı́gido posee
~ 1.
simetrı́a de rotación alrededor del eje X

Los ejes principales y la transformación principal. Los vectores propios X ~α


constituyen un sistema de tres ejes cartesianos fijos al cuerpo rı́gido, respecto a los cuales
el tensor de inercia es diagonal. Estos ejes se llaman ejes principales de inercia. Los valores
propios Iα se llaman momentos principales de inercia. En cualquier caso es posible
hallar una transformación de coordenadas que nos permita pasar a los ejes principales.
Tal transformación se llama transformación principal y consiste en una rotación. De
acuerdo con las fórmulas (7.30) y (7.60), las fórmulas de transformación para los vectores
unitarios y para el tensor de inercia serán:
3
X 3
X
~r =
X αrs ês ; ′
Irs αrt αsu Itu ; r, s = 1, 2, 3 (8.60)
s=1 t,u
262 / Mecánica clásica

donde αrs son los cosenos directores de la transformación. Vemos que las componentes
de los nuevos vectores unitarios coinciden con los cosenos directores:
Xrs = αrs ; r, s = 1, 2, 3 (8.61)
Es decir, con los elementos de los vectores propios formamos una matriz que coin-
cide con la matriz de la transformación principal siendo las filas de tal matriz formadas
con las componentes de los vectores propios. Esta matriz es ortogonal.
Los cosenos directores también pueden escribirse en la forma αrs = X ~ r · ês y las
~~ ~ ~
componentes del tensor de inercia en las formas Irs = Xr · I · Xs y Itu = êt · I~ · êu , con
′ ~
lo cual las ecuaciones (8.60) de la derecha quedan en la forma de la identidad siguiente:
3
X  
X~ r · ~I~ · X
~s = ~ r · êt ) êt · ~I~ · êu (êu · X
(X ~ s) (8.62)
t,u=1

Como Irs es diagonal, podemos escribir:

Irs ~ r · ~I~ · X
=X ~ s = Is δrs ; r, s = 1, 2, 3 (8.63)

Usando la completidad de los vectores X~ r, X ~1 + X


~ 1X ~ 2X~2 + X ~ 3 = ~~1, obtenemos
~ 3X
~ r y sumando sobre r la ecuación de valores propios para ~I.
al multiplicar a (8.63) por X ~
En términos de componentes la ecuación de valores propios es (8.55):
3
X
(Irt − Iα δrt )Xαt = 0 ; r, α = 1, 2, 3 (8.64)
t=1

El anterior es un sistema de tres ecuaciones homogéneas en las incógnitas Xαt ,


que admite soluciones no triviales solamente si los Iα tienen un valor tal que se anule el
determinante de la matriz de los coeficientes:
 
~~ ~
~
det I − Iα 1 = 0 (8.65)

que en forma explı́cita es:


 
Ixx − Iα Ixy Ixz
 
 
det 
 Ixy Iyy − Iα Iyz =0
 (8.66)
 
Ixz Iyz Izz − Iα
La ecuación (8.66) es cúbica en Iα , que tendrá tres raı́ces reales según hemos
visto; esta ecuación se llama ecuación secular. Un cuerpo rı́gido cuyos tres momentos
principales de inercia son diferentes es asimétrico. Si por ejemplo I1 = I2 6= I3 , el
~ 3 . Por simetrı́a de rotación
cuerpo tiene simetrı́a de rotación alrededor del eje principal X
entendemos una rotación que deja inalterado el tensor de inercia; tal rotación puede
~~
representarse mediante cierto diádico ortogonal R.
~~ ~~ ~~ −1 ~~
R ·I ·R = I (8.67)
Dinámica del cuerpo rı́gido / 263

Mediante (8.67) la ecuación de valores propios para I1 puede escribirse como:


~~ ~ ~~ ~~ ~~ −1 ~
~1 = R ~
I · X1 = I1 X · I · R · X1 = I1 X (8.68)
~~
o por la ortogonalidad de R:
 
~~ ~~ −1 ~ ~~ −1 ~
I · R X1 = I · (R · X1 ) (8.69)

~1 y R~~ ~
Las ecuaciones (8.68) y (8.69) nos dicen que los vectores X X1 son vectores
~~
propios de I con el mismo valor propio I1 ; estos dos vectores no necesariamente son
ortogonales pero sı́ son linealmente independientes y permiten escribir cualquier vector
en el plano perpendicular al eje de simetrı́a X ~ 3 . Si I1 = I2 = I3 se dice que el cuerpo
~~
rı́gido es esférico; en este caso I será diagonal respecto a cualquier sistema de ejes del
cuerpo rı́gido con origen en el centro de masa.
Ejemplo 8.2.1 Sea un cuerpo rı́gido formado por once masas discretas iguales distri-
buidas como se muestra en la figura 8.1. Las ocho masas del plano están sobre una
circunferencia de radio a, con un ángulo entre sı́ de 45o . Las masas del eje están a una
distancia a del centro de la circunferencia. Al rotar el cuerpo alrededor del eje un ángulo
2π/8, coincide consigo mismo; se dice que posee un eje de simetrı́a de orden 8. Sobre
el plano hay también cuatro ejes de simetrı́a de orden 2. Calcular las componentes del
tensor de inercia para este cuerpo y mostrar que dos momentos principales de inercia
son iguales.

Figura 8.1 Cuerpo rı́gido formado por once masas discretas iguales.

Podemos elegir los ejes del cuerpo rı́gido de modo que coincidan con la posición de
algunas de las masas, digamos, tomando el plano x − y en el plano de la figura y el eje z
264 / Mecánica clásica

a lo largo del eje de simetrı́a. Con esta elección se anulan los productos de inercia o sea
que dichos ejes forman un conjunto de ejes principales y los momentos de inercia serán
también momentos principales de inercia. Los valores de los Iα son:

I1 = Ixx = 6ma2 ; I2 = Iyy = 6ma2 ; I3 = Izz = 8ma2 (8.70)

Vemos que ninguno de los tres momentos principales de inercia es mayor que la
suma de los otros dos y que los momentos principales respecto a los ejes del plano de
simetrı́a son iguales.
Se puede demostrar que si en vez de x − y se toma cualquier par de ejes en ese
plano, perpendiculares o no entre sı́, el tensor de inercia resulta diagonal, siempre que
un eje pueda obtenerse a partir del otro eje mediante una de las operaciones de simetrı́a
del cuerpo. Es decir, cualquier par de ejes no colineales que hagan entre sı́ un ángulo
que sea un múltiplo de 2π/8, forma parte del conjunto de ejes principales del cuerpo.
Usando el lenguaje de la teorı́a de grupos, decimos que el cuerpo rı́gido posee un grupo
de simetrı́as de orden 8, el grupo puntual D4 , que consta de cuatro rotaciones alrededor
del eje de simetrı́a de orden 8, y cuatro rotaciones de π alrededor de ejes horizontales.
Además posee un conjunto de simetrı́as de reflexión en planos horizontales y verticales.
El conjunto de los vectores propios correspondientes al valor propio degenerado I1 cons-
tituye una representación irreductible del grupo de simetrı́as D4 .3

El elipsoide de inercia. Sea n̂ el vector unitario que define una dirección cual-
quiera. El momento de inercia respecto al eje n̂ es:

3
X
~
I = n̂ · I~ · n̂ = nr Irs ns (8.71)
r,s=1

donde nx , ny , nz , son los cosenos directores del eje (véase figura 8.2). Si tomamos un
punto cualquiera sobre el eje, estará descrito respecto al centro de masa por el vector de
posición ~r = (x, y, z) = r(nx , ny , nz ); por lo tanto si multiplicamos por r2 ambos lados
en (8.71) obtenemos:

In r2 = Ixx x2 + Iyy y 2 + Izz z 2 + 2Ixy xy + 2Ixz xz + Iyz yz (8.72)

Ahora consideremos un conjunto de ejes que pasen por el centro de masa. Entonces
podemos hallar el lugar geométrico de los puntos ~r para los cuales In r2 toma el mismo
valor. Este lugar geométrico es una superficie elipsoidal llamada el elipsoide de inercia
o elipsoide de momentos de inercia. Es claro que eligiendo adecuadamente el sistema de
coordenadas fijo al cuerpo rı́gido4 se obtiene la ecuación estándar para un elipsoide:

x2 y2 z2
2
+ 2 + 2 =1 (8.73)
a b c
3 Véase el capı́tulo de teorı́a de la simetrı́a en el libro de Mecánica cuántica no relativı́stica de Landau-

Lifshitz.
4 Que coincide instantáneamente con el sistema de coordenadas espacial.
Dinámica del cuerpo rı́gido / 265

La ecuación (8.73) se identificará con (8.72) si se satisfacen las relaciones:


In r2 In r2 In r2
a2 = ; b2 = ; c2 = ;
I1 I2 I3 (8.74)
I1 = Ixx ; I2 = Iyy ; I3 = Izz ; Irs = 0 si r 6= s
Es claro que tal sistema de coordenadas coincide con el sistema de ejes principales
ortogonales del cuerpo rı́gido y que I1 , I2 , I3 , coinciden con los momentos principales
de inercia.

Cuerpo r
rígido n

Elipsoide
de inercia:
In r 2 = constante

Figura 8.2 Superficie elipsoidal

El elipsoide de inercia es una superficie de la forma:


F (x, y, z) = 0 (8.75)
La normal a F en un punto es el gradiente de F en ese punto.
En los ejes principales de un elipsoide el gradiente es paralelo al eje:
∂F
= K n̂ (8.76)
∂~r
En forma explı́cita (8.76) es:
∂F
= 2xIxx + 2yIxy + 2zIxz = Knx
∂x
∂F
= 2xIxy + 2yIyy + 2zIyz = Kny (8.77)
∂y

∂F
= 2xIxz + 2yIyz + 2zIzz = Knz
∂z
Si estas ecuaciones las dividimos por 2r, luego multiplicamos la primera por nx y la
tercera por nz , el resultado que se obtiene al sumarlas coincide con (8.72) si la constante
266 / Mecánica clásica

K se identifica con K = 2rIn . Entonces (8.77) coincide con el siguiente sistema de


ecuaciones:
(Ixx − In )nx + Ixy ny + Ixz nz = 0

Ixy nx + (Iyy − In )ny + Iyz nz = 0 (8.78)

Ixz nx + Iyz ny + (Izz − In )nz = 0


O sea que las ecuaciones (8.76), (8.77) y (8.78) nos dan los ejes principales y los
momentos principales de inercia, ya que los ejes principales de inercia coinciden con los
ejes principales del elipsoide de inercia.
La construcción del elipsoide de inercia permite interesantes análisis cualitativos
del movimiento del cuerpo rı́gido. Es la base de la representación de Poinsot para el
estudio del movimiento de un cuerpo rı́gido no sometido a torques.

Ejemplo 8.2.2 ¿Cuál es la relación entre el diámetro y la altura de un cilindro circular


recto tal que el elipsoide de inercia en el centro del cilindro es una esfera?

Tomamos el origen en el centro de masa. En virtud de la simetrı́a de rotación,


cualquier par de ejes perpendiculares al eje y del cilindro forman un sistema de ejes
principales.
El momento de inercia Izz = I3 , siendo z el eje del cilindro, es:
Z Z Z
M
I3 = (y 2 + x2 ) d3~r (8.79)
V
donde M es la masa total y V el volumen. Tomando el elemento de volumen como un
anillo cilı́ndrico de radios ρ y ρ + dρ y altura dl:
d3~r = 2πρ dρ dl (8.80)
Entonces una integración elemental nos lleva a:
1
I3 = M R2 (8.81)
2
siendo R el radio de la circunferencia de la base del cilindro.
El momento de inercia Ixx = I1 es:
Z Z Z
M
I1 = (z 2 + y 2 ) d3~r (8.82)
V
En las dos integrales que aparecen en (8.79) y (8.82) es cómodo tomar respectiva-
mente los siguientes elementos de volumen:
p
d3~r = πr2 dz y d3~r = 2lx dy = 2l R2 − y 2 dy (8.83)
Entonces obtenemos para I1 , que además será igual a I2 :
 2 
1 l
I1 = M + R2 (8.84)
4 3
Dinámica del cuerpo rı́gido / 267

El elipsoide de inercia será una esfera si I1 = I2 = I3 , de acuerdo con las fórmulas


(8.74). De (8.81) y (8.84) se sigue entonces que:

l2 = 3R2 (8.85)

Ejemplo 8.2.3 Tres masas iguales están en los puntos (a, 0, 0), (0, a, 2a) y (0, 2a, a),
hallar los momentos principales de inercia y un conjunto de ejes principales respecto al
origen de coordenadas.

Los elementos del tensor de inercia para este problema son:


 
5 0 0
~~ 
I= 0 3 −2  2ma2 (8.86)
0 −2 3

El valor del determinante secular, ecuación (8.66), es:


 
~~ ~
~
det I − I 1 ⇒ (5 − i)[(3 − i)2 − 4] = 0 (8.87)

donde hemos llamado:


I
i= (8.88)
2ma2
Las tres raı́ces de la ecuación secular son entonces i = 5, 5, 1, con lo cual los tres
momentos principales de inercia valen:

I1 = 2ma2 ; I2 = 10ma2 ; I3 = 10ma2 (8.89)


~ ~ ~
Las ecuaciones de valores propios son ~i · X α = iα Xα , que explı́citamente son:

(5 − iα )Xα1 = 0; (3 − iα )Xα2 − 2Xα3 = 0; −2Xα2 + (3 − iα )Xα3 = 0 (8.90)

Para i1 obtenemos las siguientes relaciones entre los componentes del vector propio
~ 1:
X

X11 = 0 ; X12 = X13 (8.91)


~ 1 normalizado a la unidad es entonces:
El vector propio X
 
~ 1 = 0, √1 , √1
X (8.92)
2 2
Para la raı́z doble i2 = i3 = 5 las relaciones entre los componentes de los vectores
~ 2, X
propios X ~ 3 , son:

0.Xα1 = 0 ; Xα2 = −Xα3 ; α = 2, 3 (8.93)

Vemos que los Xα1 pueden asignarse arbitrariamente, ya que la condición de nor-
malización sólo nos permite expresar a Xα2 en función de Xα1 . Este comportamiento es
caracterı́stico de los problemas de valores propios cuando hay degeneración. Una pareja
268 / Mecánica clásica

posible de vectores propios normalizados y ortogonales correspondientes al valor propio


degenerado i2 = i3 = 5 es:
 
~ 1 1 ~ 3 = (1, 0, 0)
X2 = 0, − √ , √ ; X (8.94)
2 2
La matriz de la correspondiente transformación principal es:
 1 1 
0 √ √
 2 2 
 
 
 1 
ÃT =  0 − √1 √  (8.95)
 
 2 2 
 
1 0 0

Es claro que con cualquier par de ejes perpendiculares a X ~ 1 se puede construir


igualmente un sistema de ejes principales respecto al origen de coordenadas (véase figura
8.3). Otro problema serı́a hallar los momentos principales y los ejes principales respecto
al centro de masa que está localizado en el punto:
 
~ = a , a, a
R (8.96)
3

z
m

x2
x1
y

x3
x m

Figura 8.3 Ejes principales de sistema de masas puntuales

8.3. Las ecuaciones de movimiento de Euler


Vamos a suponer que el cuerpo rı́gido no tiene ligaduras adicionales a la de poderse
mover sólo de modo que un punto permanezca fijo; entonces los ángulos de Euler son
coordenadas generalizadas para la descripción del movimiento del cuerpo rı́gido.
Dinámica del cuerpo rı́gido / 269

El lagrangiano del cuerpo rı́gido. La energı́a cinética es puramente rotacional


y está dada por la ecuación (8.22). La energı́a potencial dependerá de la orientación del
cuerpo, con lo cual la lagrangiana será:
1
L(φ, θ, ψ; φ̇; θ̇, ψ̇) = (I1 ωx2 + I2 ωy2 + I3 ωz2 ) − V (φ, θ, ψ) (8.97)
2
donde se supone que los ejes fijos al cuerpo rı́gido son ejes principales. Las fuerzas
generalizadas de este problema son:
∂V ∂V ∂V
Fφ = − ; Fθ = − ; Fψ = − (8.98)
∂φ ∂θ ∂ψ
Fφ , Fθ y Fψ representan respectivamente el torque externo alrededor del eje espacial z,
el torque alrededor de la lı́nea de nodos y el torque alrededor del eje principal del cuerpo
rı́gido z.

Las ecuaciones de movimiento de Euler. Son las ecuaciones de movimiento.


La ecuación de Lagrange que contiene el torque alrededor de la coordenada z del cuerpo
rı́gido es:
d ∂T ∂T ∂V
− =− = Kz (8.99)
dt ∂ ψ̇ ∂ψ ∂ψ
~ obtenemos que:
Recordando las fórmulas (7.253) para las componentes de ω
∂T ∂T ∂ωx ∂T ∂ωy
= + = ωx ωy (I1 − I2 ) (8.100)
∂ψ ∂ωx ∂ψ ∂ωy ∂ψ
Por otra parte:
∂T ∂T ∂ωz ∂T
= = = I3 ωz (8.101)
∂ ψ̇ ∂ω z ∂ ψ̇ ∂ω z

Entonces la ecuación de Lagrange (8.99) toma la forma:


I3 ω̇z − ωx ωy (I1 − I2 ) = Kz (8.102)
La ecuación (8.102) no depende de las coordenadas generalizadas especı́ficas que
se usen para describir el movimiento; en particular no depende de la convención usada
para definir los ángulos de Euler, ya que esta sólo influye en las expresiones para las
componentes de ~ ω. Si hubiéramos usado convenciones para los ángulos de Euler en que
se intercambiaran los papeles de los ejes z y x, y z y y respectivamente, las ecuaciones
de movimiento serı́an en vez de (8.102), las siguientes:
I2 ω̇y − ωx ωz (I3 − I1 ) = Ky
(8.103)
I1 ω̇x − ωy ωz (I2 − I3 ) = Kx
Por tanto las ecuaciones (8.102) y (8.103) son tres ecuaciones diferenciales inde-
pendientes que no dependen de la convención usada para definir los ángulos de Euler. En
la convención adoptada en el numeral 7.6, las ecuaciones (8.103) no son las ecuaciones
270 / Mecánica clásica

de lagrange para φ y θ, en tanto que (8.102) es la ecuación de Lagrange para ψ. No vale


tampoco que Fφ y Fθ correspondan a Ky y Kx pues como digimos representan el torque
alrededor de z, Kz , y el torque alrededor de la lı́nea de nodos, Kµ1 , respectivamente.
Una deducción más simple de las ecuaciones de Euler es la siguiente: el torque total
es igual a la rata de cambio temporal de L ~ respecto a los ejes espaciales:

d ~
L
~ =
K (8.104)
dt
esp

~ respecto a los ejes rotantes se introduce mediante la fórmula:


La derivada de L

~
dL ~
dL
= ~
+ ~ω × L (8.105)
dt dt
esp rot

donde hemos tomado los ejes coincidiendo instantáneamente. Las ecuaciones (8.104) y
(8.105) nos dan:
dLr
+ ǫr st ωs ωt Lt = Kr ; r = 1, 2, 3 (8.106)
dt
Como escogemos los ejes rotantes coincidiendo con los ejes principales se cumple
que Lr = Ir ωr , de modo que obtenemos de (8.106) directamente las ecuaciones de Euler:

Ir ω˙r + ǫr st ωs ωt Is = Kr ; r = 1, 2, 3 (8.107)

Principales casos en que las ecuaciones de Euler se pueden reducir a


cuadraturas. Las ecuaciones de Euler han sido reducidas a cuadraturas para valores
arbitrarios de las constantes de movimiento en los siguientes casos:
(a) El punto fijo es el centro de gravedad del cuerpo, de modo que no hay torques
externos. Los valores de los momentos de inercia son arbitrarios. Es el problema del
cuerpo rı́gido libre. Para el cuerpo rı́gido asimétrico (I1 6= I2 6= I3 ) el problema se
reduce a cuadraturas en términos de funciones elı́pticas y fue resuelto por Euler en 1758.
Para el cuerpo rı́gido simétrico (I1 = I2 6= I3 ) la solución está dada en términos de
funciones trigonométricas. Para el cuerpo libre esférico (I1 = I2 = I3 ) la solución es
trivial.
(b) El caso en que dos momentos principales de inercia alrededor de un punto del
cuerpo que no coincide con el centro de masa y fijo en el espacio son iguales (trompo
simétrico con un punto fijo). Tanto el punto fijo como el centro de masa están sobre el
eje de simetrı́a. No hay torques de fricción en el punto fijo y el único torque es producido
por un campo gravitatorio homogéneo. El problema se reduce a cuadraturas en términos
de funciones elı́pticas y fue resuelto por Lagrange en 1788.
(c) En 1887 la señora S.V. Kovalevski halló otro ejemplo soluble. Es el caso en
que dos momentos principales de inercia alrededor del punto fijo que no coincide con el
centro de masa son iguales entre sı́, y dos veces más grandes que el tercero (I1 = I2 =
2I3 ). Además, el centro de masa está sobre el plano formado por los ejes principales
correspondientes a los momentos principales iguales, y el único torque externo es el de
la gravedad. La solución está expresada en términos de las funciones hiper-elı́pticas.
Dinámica del cuerpo rı́gido / 271

Ejemplo 8.3.1 Sea un sistema de ejes primados que coinciden en el origen con un sistema
de ejes inercial pero que rota con respecto a los ejes inerciales con una velocidad angular
fija ω
~ 0 . Hallar las ecuaciones de movimiento de Euler para un cuerpo rı́gido que se mueve
respecto a este sistema de ejes rotantes en el caso en que no haya torques externos, V = 0.

El lagrangiano del sistema, considerado como un sistema de partı́culas, es:


N
1 X ˙2
L= mi~ri (8.108)
2 i=1

Transformemos primero el lagrangiano de los ejes espaciales a los ejes rotantes,


usando fórmulas de la sección 7.8. Llamemos à a la matriz de rotación de los ejes rotantes
respecto a los ejes espaciales, más adelante usaremos la notación Ã′ para denotar la
matriz de rotación de los ejes del cuerpo rı́gido respecto a los ejes rotantes. La velocidad
angular total es Ω̃′ + Ã′ Ω̃ Ω̃′T y por esto no podemos decir a priori que el vector velocidad
angular sea ω ~ +~ ω0 .
Si ~r ′ es el vector de posición en los ejes rotantes, sabemos que:

~r ′ = Ã~r ; ˙ T ~r˙ ′ + ÃT ~r˙ ′


~r˙ = Ã (8.109)
de modo que:
2
~r˙ = ~r˙ ′T ÃÃT ~r˙ ′ + ~r ′T Ã ˙ T ~r ′ + ~r ′T Ã
˙ ÃT ~r˙ ′ + ~r˙ ′T ÃÃ ˙ T ~r ′
˙ Ã (8.110)
Usando la siguiente definición de Ω̃′0 y las propiedades de Ã:

ÃÃT = I˜ ; Ã ˙ T = 0;
˙ ÃT + ÃÃ ˙ ÃT ;
Ω̃′0 = Ã Ω̃′2 ˙ ˙T
0 = −ÃÃ (8.111)
llegamos a:
2
~r˙ = ~r˙ ′2 + 2~r ′T Ω̃′0 ~r˙ ′ − ~r ′T Ω̃′2
0 ~r′ (8.112)
Expresando ahora la matriz antisimétrica Ω̃′0 en términos del vector velocidad
angular respecto a los ejes rotantes:
Ω̃′0~r ′ = −~
ω0′ × ~r ′ ; Ω̃20~r ′ = ω
~ 0′ × (ω0′ × ~r ′ ) (8.113)
Entonces podemos escribir a (8.112) como:
2 2
~r˙ = ~r˙ ′ − 2~
ω0′ · (~r˙ ′ × ~r ′ ) − ω
~ 0 · [(~ω0′ × ~r ′ ) × ~r ′ ] (8.114)
La ecuación (8.114) puede llevarse a la forma:
 
~ 0′ · ~~1 × ~r ′2 − ~r ′~r ′ · ~ω0′
2 2
~r˙ = ~r˙ ′ + 2~
ω0′ · (~r ′ × ~r˙ ′ ) + ω (8.115)

con lo cual llegamos a la siguiente expresión para L:

L = T′ + ω ~′ + 1ω
~ 0′ · L
~
~ ′ · I~ · ~ω0 (8.116)
2 0
272 / Mecánica clásica

donde L~ ′ es el momento angular total respecto a los ejes rotantes e ~I~ es el momento de
inercia respecto a dichos ejes.
Si ahora el cuerpo rı́gido se mueve respecto a los ejes primados con velocidad
angular ~ω , es claro que:
1~ ~
T′ = ω · ~I · ~ω (8.117)
2
~
donde ~I es el momento de inercia respecto a los ejes del cuerpo rı́gido, que podemos
tomarlos como ejes principales.
Ahora se cumple que:

~r ′ = Ã′T ~r ; ~r = Ã′~r ′ ; Ω ˙ ′ Ã′T ;


˜ = Ã ˜ r = −~ω × ~r
Ω~ (8.118)
˜ la matriz Ω̃′ respecto a los ejes del cuerpo rı́gido:
Llamamos además Ω 0 0

Ω ˜ ′ Ã′T
˜ = Ã′ Ω (8.119)
0 0

Entonces el segundo término de la derecha en (8.112) puede escribirse ası́:


T ˜ ′ Ã
2~r ′T Ω̃′0~r˙ ′ = 2~r Ã′ Ω ˙ ′T ~r = 2(ω
~ 0 × ~r) · (~ω × ~r) (8.120)
0

El tercer término de (8.115) puede escribirse como:


 
~1(~r ′ · ~r ′ ) − ~r ′~r ′ = ~~1r 2 − Ã′T ~r ~rÃ′ = Ã′T ~~1r2 − ~r ~r Ã′
~
(8.121)

Con lo cual construimos el tensor de inercia respecto a los ejes del cuerpo rı́gido.
Finalmente, L toma la forma:
XN
1~ ~~   ~
L= ~+
ω·I ·ω ~ × ~r i + 1 ω
mi ~ω 0 × ~ri · ω ~ 0 · ~I · ω
~0 (8.122)
2 i=1
2

que aún puede transformarse en el segundo miembro para dar:


1~ ~~ ~ 1 ~ ~~ ~
L= ~ + ~ω · ~I · ω
ω·I ·ω ~0 + ω0 · I · ω 0 (8.123)
2 2
~ 0′ está en la dirección del eje x′3 , de modo que las compo-
Vamos a suponer que ω
nentes de ~ω 0 serán:
~ 0 = (senθ senψ, senθ cos φ, cos θ)ω0
ω (8.124)
Entonces los términos que contienen a ~ω0 en (8.123) son de la forma:
~ ~
~ · ~I · ~ω 0 + 1 ~ω0 · ~I · ~ω0 = ωx ω0 senθ senψ I1
ω
2

+ωy ω0 senθ cos ψ I2 + ωz ω0 cos θ I3 (8.125)

1
+ (sen2 θ sen2 ψ I1 + sen2 θ cos2 ψ I2 + cos2 θI3 )ω02
2
Dinámica del cuerpo rı́gido / 273

La derivada parcial de (8.125) respecto a ψ es:


ω0 (ωy senθ senψ + ωx senθ cos ψ + ω0 sen2 θ senψ cos ψ)I1

+ω0 (−ωx senθ cos ψ − ωy senθ senψ − ω0 sen2 θ cos ψ senψ)I2


(8.126)
= ω0 ωy senθ senψ(I1 − I2 ) + ω0 ωx senθ cos ψ(I1 − I2 )

+ω02 sen2 θ senψ cos ψ(I1 − I2 )


La derivada de estos términos respecto a ψ̇ es I3 ω0 cos θ de modo que la ecuación
de Lagrange para ψ es:
(ωx ωy + ωy ω0 senθ senψ + ωx ω0 senθ cos ψ
(8.127)
+ω02 sen2 θ senψ cos ψ)(I1 − I2 ) − (ω˙z − θ̇ ω0 senθ)I3 = 0
Esta ecuación podemos expresarla en términos de las componentes de ~ω 0 :
(ωx + ω0x )(ωy + ω0y )(I1 − I2 ) − (ω̇z + ω̇0z )I3 = 0 (8.128)
Usando los mismos argumentos que en las ecuaciones (8.102) y (8.103), podemos
concluir que las otras dos ecuaciones de Euler son:
(ωx + ω0x )(ωz + ω0z )(I3 − I1 ) − (ω̇y + ω̇0y )I2 = 0
(8.129)
(ωy + ω0y )(ωz + ω0z )(I2 − I3 ) − (ω̇x + ω̇0x )I1 = 0
El resultado exhibe una dependencia “aditiva” con las velocidades angulares.
Ejemplo 8.3.2 Si en el lagrangiano de un cuerpo rı́gido se realiza el siguiente cambio de
variables:
(φ, θ, ψ; φ̇, θ̇, ψ̇) → (φ, θ, ψ; ω 1 , ω 2 , ω2 ) (8.130)
encontrar las ecuaciones de Lagrange correspondientes a las nuevas variables, o sea las
ecuaciones de Euler.5
De acuerdo con las fórmulas (7.253), las fórmulas de transformación son:
ω 1 = cos ψ θ̇ + senθ senψ φ̇ ;

ω 2 = −senψ θ̇ + senθ cos ψ φ̇ ; (8.131)

ω 3 = ψ̇ + cos θ φ̇
y las inversas:
senψ ω 1 + cos ψ ω2
φ̇ = ; θ̇ = cos ψ ω1 − senψ ω2
senθ (8.132)
ψ̇ = − cot θ(senψ ω 1 + cos ψ ω 2 ) + ω3
5 Ver el texto de Corben y Stehle, Classical mechanics, sección 77, capı́tulo 13, 1960.
274 / Mecánica clásica

Si llamamos q̇1 = φ̇, q̇2 = θ̇, q̇3 = ψ̇, estas fórmulas pueden escribirse en forma de
matrices:
~ω = α̃~q˙ ; q~˙ = β̃ ω
~ (8.133)
donde α̃ y β̃ son:
 
senθ senψ cos ψ 0
 
 
α̃ = 
 senθ cos ψ −senψ 0 

 
cos θ 0 1
  (8.134)
senψ cos ψ
0
 senθ senθ 
 
 
β̃ =  cos ψ −senψ 0 
 
 
−senψ cot θ − cos ψ cot θ 1

Si llamamos L̃(q, ω) a L[q, q̇(ω)] obtenemos que:

∂L ∂ L̃ ∂ L̃ ∂αsu
= + q̇u (8.135)
∂qr ∂qr ∂ωs ∂qr
y que:
d ∂L d ∂ L̃
= αsr (8.136)
dt ∂ q̇r dt ∂ωs
Multiplicando a (8.135) y (8.136) por βrt y sumando sobre r llegamos a la siguiente
expresión para las ecuaciones de Lagrange en L̃:
∂ L̃ ∂ L̃ ∂αsu
βrt + βrt βuυ ω υ =
∂qr ∂ωs ∂qr
d ∂ L̃ ∂ L̃ ∂αsr
βrt αsr + βuυ ωυ βrt (8.137)
dt ∂ω s ∂ωs ∂qu
Usando la propiedad α̃β̃ = I˜ obtenemos finalmente:
∂ L̃ d ∂ L̃ ∂ L̃
βrt − = γtυs ωυ ; t = 1, 2, 3 (8.138)
∂qr dt ∂ωt ∂ω s
donde:
 
∂αsr ∂αsu
γtυs = − βrt βuυ (8.139)
∂qu ∂qr
Para nuestro caso, el lagrangiano está dado por la ecuación (8.97):
1 ~ ~~ ~
L̃(q, ω) = ω · I · ω − V (q) (8.140)
2
Dinámica del cuerpo rı́gido / 275

y ası́:
∂ L̃ ∂V ∂ L̃
=− = Kr ; = ωr Ir (8.141)
∂qr ∂qr ∂ωr
Por tanto obtenemos de (8.138):
3
X
Kr βrt − ω̇ t It = γtυs ωυ ω s Is ; t = 1, 2, 3 (8.142)
υ,s=1

Notemos que γtυs puede escribirse como Astυ − Atsυ , donde:


∂αsm
Astυ = βmt βnυ (8.143)
∂qn
que también puede escribirse como:
 
∂ α̃
Astυ = β̃ βnυ (8.144)
∂qn st

De la expresión explı́cita para α̃ obtenemos que:


 
cot θ sen2 ψ cot θ senψ cos ψ 0
 
∂ α̃ ∂ α̃  
β̃ = 0̃ ; 
β̃ =  cot θ senψ cos ψ 2
cot θ cos ψ 0
∂q1 ∂q2 
 
−senψ − cos ψ 0
  (8.145)
0 1 0
 
∂ α̃  
β̃ =  −1 0 0
∂q3  
 
0 0 0
Se sigue entonces que:
 
cot θ sen2 ψ cot θ senψ cos ψ 0
 
 
Astυ = 
 cot θ senψ cos ψ cot θ cos ψ 2
0 
 (cos ψ, senψ, 0)υ
 
−senψ − cos ψ 0 st
  (8.146)
0 1 0
 
 
+ 
 −1 0 0 
 (−senψ cot θ, − cos ψ cot θ, 1)t
 
0 0 0 sυ
Es simple concluir a partir de (8.146) que:
γtυs = ǫtυs (8.147)
276 / Mecánica clásica

Por tanto las ecuaciones (8.142) son:


3
X
ω̇t It + ǫtυs ωυ ω s Is = Kr βrt ; t = 1, 2, 3 (8.148)
υ,s=1

Kr son los torques alrededor de los ejes z, µ1 y z, en tanto que los lados derechos
de (8.148) son los torques alrededor de los ejes x, y, z.

Ejemplo 8.3.3 Otra variante de solución del ejemplo 8.3.1 puede obtenerse partiendo de
las ecuaciones de Lagrange (8.138).
Para este problema tenemos que:
∂ L̃ ~ ∂ω0 ∂ L̃ ~ + ~ω 0 ) · ~I~
ω + ~ω 0 ) · I~ ·
= (~ ; = (ω (8.149)
∂~q ∂~q ∂ω~
En términos de componentes, las ecuaciones (8.138) son:
3
X ∂ω0m 
βrt (ω 0m + ωm )Im − ω̇ 0t + ω̇t It =
r,m=1
∂qr
3
X
ǫtυs (ω s + ω0s )Is ω υ (8.150)
υ,s=1

O en otra forma:
X 3  
∂ω0m
(ω̇ 0t + ω̇t )It = βrt − ǫt,m,r ω r (ω 0m + ω m )Im (8.151)
r,m=1
∂qr

Para cualquier función F se cumple que:


  
senψ/senθ cos ψ −senψ cot θ ∂F/∂φ
  
∂F   
β̃ = 
 cos ψ/senθ −senψ cos ψ cot θ
  ∂F/∂θ 
  (8.152)
∂~q   
0 0 1 ∂F/∂ψ

Usando la expresión (8.124) para ω~ 0 , hallamos que:


 
0 −ω03 ω 02
 
∂ ~ω0  
β̃ = 
 ω 03 0 −ω 01 
 (8.153)
∂~q  
−ω 02 ω 01 0
O en forma más explı́cita:
∂ ~ω0m
βrt = −ǫmrt ω0r (8.154)
∂qr
Dinámica del cuerpo rı́gido / 277

Con lo cual concluimos que (8.151) toma la forma:


3
X
(ω̇ 0t + ω̇ t )It = ǫtrm (−ω0r − ωr )(ω 0m + ω m )Im (8.155)
r,m=1

que coinciden con las ecuaciones (8.128) y (8.129)

8.4. El movimiento de un cuerpo rı́gido libre


En este caso en las ecuaciones (8.102) y (8.103) no aparecen torques, Kr = 0. Esto
se presenta, por ejemplo, cuando el centro de masa coincide con el punto fijo de modo
que la gravedad no produce torques.

El cuerpo rı́gido esférico. Se define por la condición I1 = I2 = I3 = I.


~ yω
Es el único caso en el cual los vectores L ~ son paralelos:
~ = I~
L ω (8.156)
~ como ~ω serán constantes en magnitud y dirección. Cada
Si no hay torques, tanto L
punto del cuerpo rı́gido se moverá sobre trayectoria circular. No hay precesión de ~ω .

La representación de Poinsot. Es una construcción geométrica que permite


analizar el movimiento de un cuerpo rı́gido libre, el cual puede ser asimétrico. Fue elabo-
rada por Poinsot (Parı́s, 1834) y se basa en el elipsoide de inercia, descrito en la sección
8.2. La ecuación del elipsoide de inercia está dada en (8.73). La normal al elipsoide en
un punto cualquiera tiene la dirección del vector gradiente de F , siendo F la superficie
(8.75):
∂F
= (2xI1 , 2yI2 , 2zI3 ) = 2r(n1 I1 , n2 I2 , n3 I3 ) (8.157)
∂~r
donde hemos tomado un sistema de ejes principales. Si escogemos el punto (x, y, z)
sobre el eje de rotación, entonces:
ω
~ = ω(n1 , n2 , n3 ) (8.158)
De modo que (8.149) toma la forma:
∂F 2r 2r ~
= (ω1 I1 , ω2 I2 , ω3 I3 ) = L (8.159)
∂~r ω ω
Hay dos puntos donde el eje de rotación corta la superficie del elipsoide de inercia.
De (8.159) podemos concluir que en esos dos puntos siempre se cumple que la normal
~ Cuando no hay torques se cumple que L
a la superficie está en la dirección de L. ~ y por
lo tanto ∇F~ son constantes, independientemente de la forma que tenga el movimiento
del elipsoide de inercia, el cual se mueve solidariamente con el cuerpo rı́gido. La energı́a
cinética se puede escribir en la forma:
1 ~ = ω ~r · L
~
T = ω·L
~ (8.160)
2 2r
278 / Mecánica clásica

Cuerpo
rígido

Elipsoide
de inercia b
a

c
r
P


F L
ω

Figura 8.4 Elipsoide de inercia

que se puede llevar a la forma:


~ ·L
(~r − d) ~ =0 (8.161)

donde d~ es un vector definido por la relación:

~ = 2r T
d~ · L (8.162)
ω
si escogemos a d~ paralelo a L,
~ entonces adquiere la forma:

2r ~
L
d~ = T 2 (8.163)
ω L
~ y es la normal al plano
La expresión (8.161) es la ecuación de un plano, donde L
y ~r es un punto del mismo.
Como ~r es un punto particular (el punto donde se cortan el eje de rotación y el
elipsoide de inercia) que puede estar cambiando con el tiempo, vemos entonces que el
elipsoide se mueve de tal manera que el punto donde se corta con el eje de rotación
siempre permanece sobre un plano (véase figura 8.4). d~ es un vector constante, pues
usando las relaciones:
1 2
Ir2 = constante y T = Iω = constante (8.164)
2
podemos escribir el vector d~ como una expresión que solo depende de T y L:
~

2Ir2 T ~
d~ = L (8.165)
L2
Dinámica del cuerpo rı́gido / 279

Como d~ y L~ son constantes, el plano es constante y se llama plano invariable. d~


es la perpendicular trazada desde el centro del elipsoide al plano tangente, o sea que es
~ la lı́nea que contiene a d~ se llama lı́nea invariable.
igual a la proyección de ~r sobre L;

Línea invariable

Polodia

Plano invariable
0

r d

P
Herpolodia
r –d

ω L

Figura 8.5 El elipsoide de inercia rueda sin deslizar sobre el plano invariable

Podemos concluir que el elipsoide de inercia toca al plano invariable en el punto


donde el eje de rotación corta al elipsoide. El radio vector de O a P, ~r, está sobre el
eje instantáneo de rotación; no hay movimiento relativo entre un punto del elipsoide y
un punto del plano; por lo tanto el elipsoide de inercia rueda sin deslizar sobre el plano
invariable; en efecto, P está sobre el eje de rotación y por ello es el único punto del
elipsoide de inercia que está en reposo instantáneamente (véase figura 8.5). Como ω~ es
~ es proporcional a d:
proporcional a ~r, la proyección de ~ω sobre L ~

r
ω
~ ·L~
~ = 2T L
L ~ = 2T ~
d (8.166)
L 2 L2 Ir2

o sea que la proyección de ~ ~ es constante; es decir, ω


ω sobre L ~ precesa alrededor de L,~
pero sin mantenerse constante el ángulo entre estos dos vectores, cuyo coseno está dado
por:

ω ~
~ ·L Ir2 ω
= (8.167)
ωL L r2

Como ω y r pueden cambiar, se sigue que el ángulo entre ~ω y L ~ también puede


cambiar, lo cual ocurre cuando el cuerpo es asimétrico.
La curva trazada por el punto de contacto sobre el elipsoide de inercia se llama
polodia (de odos, camino y polein, girar) y la curva correspondiente sobre el plano
invariable se llama herpolodia (de herpeton, reptil).
~ no es constante, ver ecuación (8.105). De
Respecto a los ejes del cuerpo rı́gido L
modo que (8.160) ya no representa un plano, sino un elipsoide que es precisamente
280 / Mecánica clásica

el elipsoide de inercia. Es fácil demostrar que respecto a los ejes del cuerpo rı́gido la
magnitud de L ~ es una constante:

d 2  
L = 2L~ ·L~˙ = −2L~· ω ~ =0
~ ×L (8.168)
dt
Esto implica que respecto a los ejes del sólido rı́gido ~r está además sobre el elipsoide:
Ir2 L2
I12 x2 + I22 y 2 + I32 z 2 = (8.169)
2T
La polodia es, en consecuencia, el lugar geométrico de los puntos del elipsoide de
inercia que satisfacen simultáneamente las ecuaciones (8.73) y (8.169); es decir, es el
lugar geométrico de la intersección de dos elipsoides cuyos semiejes están dados respec-
tivamente por:
Ir2 Ir2 L2 Ir2 Ir2 L2 Ir2 Ir2 L2
a2 : , ; b2 : , ; c2 : , (8.170)
I1 I1 2T I1 I2 I2 2T I2 I3 I3 2T I3
La existencia de una intersección está asegurada por las desigualdades evidentes:
~
I = ~n · I~ · ~n ≥ I1 ; I ≤ I3 ⇒ 2T I1 < L2 < 2T I3 (8.171)
sien