Está en la página 1de 321

Mecánica Celeste y Analítica

Teoría, problemas y algoritmos

R
O
D
A
RR
BO

Jorge I. Zuluaga
Profesor titular de Física y Astronomía
Instituto de Física, Facultad de Ciencias Exactas y Naturales
Universidad de Antioquia

September 5, 2019
2

BO
RR
A
D
O
R
Contents

1 Preambulo 9
1.1 Prólogo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

R
1.2 Prefacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.1 ¿Otro libro de mecánica celeste? . . . . . . . . . . . . 10

O
1.2.2 Mecánica celeste en la era de la información . . . . . 11
1.2.3 ¿Qué hace distinto a este libro? . . . . . . . . . . . . . 14
1.3 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.1 ¿Cómo usar este libro? . . . . . . . . . . . . . . . . . 14
1.3.2
D
Paquetes y herramientas requeridas . . . . . . . . . . 14

2 Fundamentos Matemáticos y Físicos 21


A
2.1 Curvas cónicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1.1 Descripción geométrica . . . . . . . . . . . . . . . . . 21
2.1.2 Descripción algebraica . . . . . . . . . . . . . . . . . 25
RR

2.1.3 Representación en coordenadas polares . . . . . . . . 34


2.1.4 Cónicas en el espacio . . . . . . . . . . . . . . . . . . 39
2.2 Mecánica Newtoniana . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.2.1 Cinemática . . . . . . . . . . . . . . . . . . . . . . . . 46
2.2.2 Propiedades cinemáticas . . . . . . . . . . . . . . . . 47
2.2.3 Dinámica . . . . . . . . . . . . . . . . . . . . . . . . . 55
BO

2.2.4 Partículas y fuerzas . . . . . . . . . . . . . . . . . . . 56


2.2.5 Leyes de Newton . . . . . . . . . . . . . . . . . . . . . 58
2.2.6 La ley de acción y reacción . . . . . . . . . . . . . . . 59
2.2.7 La ley de gravitación universal . . . . . . . . . . . . . 60
2.2.8 Masa y principio de equivalencia . . . . . . . . . . . 61
2.2.9 La fuerza de la Tierra y el Sol sobre la Luna . . . . . 61
2.2.10 Dinámica de un sistema de partículas . . . . . . . . . 62
2.2.11 Dinámica referida al centro de masa . . . . . . . . . . 67
2.2.12 Principios de relatividad . . . . . . . . . . . . . . . . 69
2.3 Fundamentos astronómicos . . . . . . . . . . . . . . . . . . . . . 76
2.3.1 Sistemas de referencia en Astronomía . . . . . . . . . 76
2.3.2 El ecuador y la eclíptica media . . . . . . . . . . . . . 77
2.3.3 Sistemas de coordenadas y escalas de tiempo en
SPICE . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

3 El Problema de los N-cuerpos 87

3
4 Contents

3.1 Formulación del problema . . . . . . . . . . . . . . . . . . . . . . 87


3.1.1 Unidades canónicas . . . . . . . . . . . . . . . . . . . 88
3.1.2 Notación . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.1.3 Solución numérica . . . . . . . . . . . . . . . . . . . . 91
3.1.4 Coreografías . . . . . . . . . . . . . . . . . . . . . . . 95
3.2 Integrales del problema de N-cuerpos . . . . . . . . . . . . . . . 100
3.2.1 Cuadraturas y primeras integrales . . . . . . . . . . . 100
3.2.2 Cuadraturas del problemas de los N-cuerpos . . . . 101
3.2.3 Momentum lineal del centro de masa . . . . . . . . . 101
3.2.4 Momentum angular . . . . . . . . . . . . . . . . . . . 104
3.2.5 Energía . . . . . . . . . . . . . . . . . . . . . . . . . . 107
3.2.6 El teorema del Virial . . . . . . . . . . . . . . . . . . . 109

4 El Problema de los dos cuerpos 111

R
4.1 Formulación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.2 Constantes de movimiento del problema de los dos cuerpos . . . 115

O
4.3 Solución explícita al problema de los dos cuerpos . . . . . . . . . 117
4.4 Las teoremas del movimiento planetario de Newton . . . . . . . 119
4.5 La velocidad en el problema de los dos cuerpos . . . . . . . . . . 120
4.6 Simulaciones numéricas y predicciones analíticas . . . . . . . . . 122
4.6.1
4.6.2
D
Momentum angular específico . . . . . . . . . . . .
Energía específica . . . . . . . . . . . . . . . . . . .
.
.
124
124
4.6.3 Vector LRL . . . . . . . . . . . . . . . . . . . . . . . . 125
A
4.7 El problema de los dos cuerpos en el tiempo . . . . . . . . . . . . 130
4.7.1 Una deducción geométrica . . . . . . . . . . . . . . . 131
4.7.2 Una deducción analítica . . . . . . . . . . . . . . . . . 133
RR

4.7.3 Solución a la ecuación de Kepler . . . . . . . . . . . . 135


4.7.4 Síntesis del cálculo de la posición del sistema en el
tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4.8 El problema de los dos cuerpos en el espacio . . . . . . . . . . . . 137
4.8.1 De vector de estado a elementos orbitales . . . . . . 138
4.8.2 De elementos orbitales a vector de estado . . . . . . 140
BO

4.9 Aplicaciones del problema de los dos cuerpos . . . . . . . . . . . 141


4.9.1 Predicción de la posición de un cuerpo . . . . . . . . 141
4.9.2 Tiempo de observación . . . . . . . . . . . . . . . . . 142
4.9.3 Ubicación geográfica del observador . . . . . . . . . 145
4.9.4 Sistema de coordenadas . . . . . . . . . . . . . . . . . 146
4.9.5 Elementos orbitales del cuerpo a observar . . . . . . 147
4.9.6 Cálculo del vector de estado con SPICE . . . . . . . . 149
4.9.7 Corrección por el tiempo de viaje de la luz . . . . . . 151
4.9.8 Cálculo de efemérides . . . . . . . . . . . . . . . . . . 153
4.9.9 Posición del Sol en el cielo . . . . . . . . . . . . . . . 155
4.9.10 Fases de la Luna . . . . . . . . . . . . . . . . . . . . . 157
4.9.11 Cálculo de una ocultación . . . . . . . . . . . . . . . . 160
4.9.12 Determinación de la órbita de un cuerpo a partir de
su posición en el espacio . . . . . . . . . . . . . . . . 162
4.9.13 Determinación de la órbita de un cuerpo a partir de
su posición en el cielo . . . . . . . . . . . . . . . . . . 163
Contents 5

5 El problema de los tres cuerpos 165


5.1 El problema circular restringido de los tres cuerpos . . . . . . . . 168
5.2 Las regiones de exclusión . . . . . . . . . . . . . . . . . . . . . . . 170
5.2.1 El potencial modificado . . . . . . . . . . . . . . . . . 174
5.2.2 Visualización del Potencial modificado . . . . . . . . 175
5.2.3 Los puntos de equilibrio de Lagrange . . . . . . . . . 176
5.2.4 Puntos triangulares . . . . . . . . . . . . . . . . . . . 177
5.2.5 Puntos de equilibrio colineales . . . . . . . . . . . . . 177
5.3 La constante de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . 180
5.3.1 Unidades en el CRTBP . . . . . . . . . . . . . . . . . 186
5.3.2 Constante de Jacobi para la solución numérica . . . . 190
5.4 El parámetro de Tisserand . . . . . . . . . . . . . . . . . . . . . . 190
5.4.1 Constante de Jacobi en términos de los elementos
orbitales . . . . . . . . . . . . . . . . . . . . . . . . . . 196

R
6 El formalismo lagrangiano 201

O
6.1 Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
6.2 El formalismo Lagrangiano . . . . . . . . . . . . . . . . . . . . . . 202
6.2.1 Principio de los trabajos virtuales . . . . . . . . . . . 202
6.2.2 Principio de d’Alambert-Lagrange . . . . . . . . . . . 204
6.3
6.3.1
D
Restricciones y variables generalizadas . . . . . . . . . . . . . .
Fuerzas de restricción . . . . . . . . . . . . . . . . .
.
.
211
214
6.3.2 Variables generalizadas . . . . . . . . . . . . . . . . . 215
A
6.3.3 Propiedades importantes de las reglas de transfor-
mación . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
6.4 Las ecuaciones de Lagrange . . . . . . . . . . . . . . . . . . . . . 219
RR

6.4.1 Un ejemplo: el péndulo elástico . . . . . . . . . . . . 220


6.5 La función lagrangiana . . . . . . . . . . . . . . . . . . . . . . . . 227
6.5.1 El potencial generalizado . . . . . . . . . . . . . . . . 229
6.5.2 Un ejemplo: el Lagrangiano del péndulo elástico . . 229
6.6 El principio de Hamilton . . . . . . . . . . . . . . . . . . . . . . . 230
BO

7 Aplicaciones del formalismo lagrangiano 237


7.1 Simetrías y leyes de conservación . . . . . . . . . . . . . . . . . . 237
7.1.1 La constante de Jacobi y la conservación de la energía240
7.1.2 Teorema de Noether para el Lagrangiano . . . . . . . 242
7.2 Aplicaciones de las simetrías del Lagrangiano . . . . . . . . . . . 242
7.2.1 Simetría traslacional y la conservación del momen-
tum lineal . . . . . . . . . . . . . . . . . . . . . . . . . 243
7.2.2 Simetría rotacional y la conservación del momen-
tum angular . . . . . . . . . . . . . . . . . . . . . . . . 243
7.2.3 Simetrías más generales . . . . . . . . . . . . . . . . . 244
7.3 El Problema de los N cuerpos . . . . . . . . . . . . . . . . . . . . 251
7.3.1 Simetrías del lagrangiano de N-cuerpos . . . . . . . 252
7.3.2 Variables cíclicas . . . . . . . . . . . . . . . . . . . . . 252
7.3.3 Simetría temporal . . . . . . . . . . . . . . . . . . . . 252
7.3.4 Simetría traslacional . . . . . . . . . . . . . . . . . . . 252
7.3.5 Simetría rotacional . . . . . . . . . . . . . . . . . . . . 253
6 Contents

7.3.6 Problema de N cuerpos jerárquico . . . . . . . . . . . 253


7.4 El Problema general de los dos cuerpos . . . . . . . . . . . . . . . 255
7.4.1 El potencial efectivo y las regiones de exclusión . . . 256
7.4.2 Ecuación de movimiento de la variable radial . . . . 260
7.4.3 Simulación del problema de los dos cuerpos . . . . . 260
7.4.4 Ecuación de la forma orbital . . . . . . . . . . . . . . 265
7.4.5 El problema de los dos cuerpos clásico: n=2 . . . . . 266
7.4.6 La ecuación de Kepler . . . . . . . . . . . . . . . . . . 266
7.4.7 El problema de los dos cuerpos con n arbitrario . . . 267
7.5 El problema de los dos cuerpos postnewtoniano . . . . . . . . . 272
7.5.1 La métrica como la primera cuadratura . . . . . . . . 273
7.5.2 Conservación del momentum angular . . . . . . . . 273
7.5.3 Conservación de la energía . . . . . . . . . . . . . . . 273
7.5.4 Ecuación del movimiento radial y potencial efectivo 274

R
7.5.5 Ecuación de la forma orbital en la métrica de
Schwarzschild . . . . . . . . . . . . . . . . . . . . . . 275

O
7.5.6 Equivalente clásico al movimiento órbital en rela-
tividad general . . . . . . . . . . . . . . . . . . . . . . 275
7.5.7 Regiones de exclusión . . . . . . . . . . . . . . . . . . 276
7.5.8 Avance del perihelio de Mercurio . . . . . . . . . . . 277
7.5.9
D
Simulación del movimiento de una partícula
alrededor de un agujero negro . . . . . . . . . . . . . 279
A
8 El formalismo hamiltoniano 285
8.1 Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
8.1.1 Motivación 1: el problema de las ecuaciones de
RR

movimiento . . . . . . . . . . . . . . . . . . . . . . . . 285
8.1.2 Motivación 2: el problema de la “degeneración” del
espacio de configuración . . . . . . . . . . . . . . . . 287
8.2 Las ecuaciones canónicas de Hamilton . . . . . . . . . . . . . . . 289
8.2.1 Un ejemplo básico: el péndulo simple . . . . . . . . . 293
8.3 Simetrías y candidates conservadas . . . . . . . . . . . . . . . . . 299
BO

8.3.1 Variables cíclicas . . . . . . . . . . . . . . . . . . . . . 300


8.3.2 Ejemplo básico: el péndulo cilíndrico . . . . . . . . . 300
8.3.3 Conservación del Hamiltoniano . . . . . . . . . . . . 305
8.3.4 Cantidades conservadas y los corchetes de Poisson . 306
8.4 Transformaciones canónicas . . . . . . . . . . . . . . . . . . . . . 307
8.4.1 Motivación . . . . . . . . . . . . . . . . . . . . . . . . 307
8.4.2 La función generatriz . . . . . . . . . . . . . . . . . . 308
8.4.3 Funciones generatrices de otros tipos . . . . . . . . . 310
8.4.4 La aproximación simpléctica a las transformaciones
canónicas . . . . . . . . . . . . . . . . . . . . . . . . . 311
8.5 El formalismo de Hamilton-Jacobi . . . . . . . . . . . . . . . . . . 311
8.5.1 Un ejemplo básico: el oscilador armónico . . . . . . . 312
8.5.2 El procedimiento generalizado de Hamilton-Jacobi . 314
8.6 El Problema de los dos cuerpos . . . . . . . . . . . . . . . . . . . 314
8.6.1 Ecuaciones de Hamilton-Jacobi para el problema de
los dos cuerpos . . . . . . . . . . . . . . . . . . . . . . 315
Contents 7

8.6.2 Variables de Delaunay . . . . . . . . . . . . . . . . . . 317

Bibliography 321

R
O
D
A
RR
BO
8 Contents

R
O
D
A
RR
BO
Chapter 1

Preambulo

R
O
1.1 Prólogo
Este es el prólogo. D
José Gregorio Portilla
Medellín, Diciembre 31 de 2021
A
1.2 Prefacio
En el mismo año en el que escribo estas palabras, se cumplen 100 años de la
RR

histórica observación de un eclipse total de Sol, liderada por Sir Arthur Eddington, y
que permitió la primera confirmación experimental de las predicciones de la teoría
general de la relatividad. Hace tan solo unos meses, una nave espacial, la sonda
New Horizons, sobrevoló el objeto más remoto fotografiado por nuestra especie:
2014 (MU69) “Ultima Thule”. Cinco años antes, la misma nave paso “rozando” la
superficie de Plutón y nos envió imágenes inesperadas de un mundo sorprendente.
BO

Muy lejos de allí, y en el mismo año (2019), dos naves espaciales, una japonesa, la
sonda Hayabusa 2 y la otra estaudinense, OSIRIS-REx, transmitieron imágenes im-
pactantes desde la superficie de dos pequeños asteroides, objetos que visitaron con
el objeto de traer muestras a la Tierra.
Todas estas “hazañas” intelectuales y de exploración, desde el surgimiento hace
más de 100 años de la teoría general de la relatividad, hasta la visita a cuerpos
remotos o asteroides cercanos, entre muchas otras que tendremos la oportunidad
de mencionar en este libro, fueron posibles gracias a la mecánica celeste.
Esta disciplina científica, que es mitad astronomía, mitad física, comenzó con
el trabajo pionero de Johanes Kepler a finales de los 1500 y principios de los 1600,
se estableció para siempre en el corazón de nuestra comprensión del Universo con
la obra cumbre de Sir Isaac Newton, los Principios Matemáticos de la Filosofía Natural,
que fue publicada originalmente en 1687 y alcanzó su apogeo entre los 1700 y
1800 con los trabajos de matemáticos como Joseph-Louis de Lagrange, William Rowan
Hamilton y Henri Poincaré (entre muchos otros que mencionaremos en este libro).
Este libro presenta una visión panorámica de la mecánica celeste y en general

9
10 Chapter 1. Preambulo

de la mecánica analítica, al nivel de quién se aproxima por vez primera a esta disci-
plina científica; en particular, lo hace con un énfasis especial en quiénes por razón
de su formación o de su trabajo, están particularmente interesados en aplicar la
mecánica celeste en la solución de problemas específicos. Por su extensión, énfasis
y nivel de profundidad, el libro esta dirigido especialmente a estudiantes de pre-
grado (licenciatura o bachillerato, dependiendo del país) de cualquier programa
científico o técnico, especialmente de astronomía y física.

1.2.1 ¿Otro libro de mecánica celeste?


Al escribirlo, no pretendo realizar un compendio exhaustivo de los resultados,
métodos o técnicas de la Mecánica Celeste, que durante más de 400 años de his-
toria, se ha convertido en una disciplina científica basta y en constante evolución.

R
Una miriada casi incontable de textos sobre esta materia, han sido escritos, prácti-
camente desde los tiempo del mismo Newton; libros con un profundo fundamento
teórico, libros orientados a sistemas específicos (el sistema solar o el movimiento

O
de los satélites), libros de texto o libros divulgativos. Un pequeño subconjunto de
todos ellos, serán referenciados en este texto. De antemano, invito al lector para
que los explore con curiosidad. D
Siendo este el caso, ¿para qué escribir un libro más de Mecánica Celeste? Exis-
ten dos razones fundamentales que me motivaron a emprender esta aventura.
La primera razón es que la mayoría de la literatura escrita en la materia, esta di-
rigida a estudiantes con una formación avanzada en matemáticas, mecánica new-
A
toniana y mecánica analítica. Muchos libros de mecánica celeste tienen, como se
acostumbra decir, un nivel de posgrado. En contraste, el número de textos que es-
tán al “alcance” de estudiantes de los primeros años del pregrado, no es realmente
RR

muy grande. Este libro pretende ser uno de ellos (no sé si lo logre).
Si bien podría argumentarse que la mecánica celeste es tan solo una aplicación
específica de la mecánica y que por lo tanto debería abordarse como un tema espe-
cializado, su importancia en la historia de la astronomía y de la física, así como la
capacidad que ella brinda para describir fenómenos y sistemas fascinantes (desde
naves espaciales, hasta el choque de agujeros negros), la convierte en un medio ed-
BO

ucativo excelente para introducir conceptos teóricos nuevos en física y astronomía.


También podría argumentarse, como lo hacemos muchos en la academia, que
un buen libro de mecánica celeste o de mecánica analítica (mecánica clásica o
mecánica teórica) debería ser estudiado por cualquier estudiante, no importa su
nivel. Pero la realidad es más compleja. En el mejor de los casos, un profesor
sensible reconocería que para valorar apropiadamente muchos resultados que se
exponen en esos textos avanzados, o entender las motivaciones que llevaron a los
padres de la disciplina a introducir ciertos supuestos o hipótesis, es necesaria una
cierta experiencia académica, que la mayoría de los estudiantes de pregrado no
tienen.
La segunda razón que me llevo a escribir este libro, y la original para mi como
profesor del pregrado de Astronomía de la Universidad de Antioquia, fue el deseo
de escribir un texto que permitiera usar la mecánica celeste como un vehículo para
la formación de estudiantes de pregrado en los principios de la mecánica analítica
(mecánica lagrangiana y hamiltoniana).
En muchos textos clásicos de mecánica celeste, los resultados más importantes
1.2. Prefacio 11

se derivan usando, casi exclusivamente, los métodos teóricos de lo que llamaremos


aquí el formalismo vectorial de la mecánica. En este formalismo, las fuerzas jue-
gan el papel central en la descripción de la dinámica de los sistema gravitacionales
(dime cuánto valen las fuerzas y te diré cómo evolucionará el sistema).
Sin embargo, ya desde los trabajos pioneros de William Rowan Hamilton, Carl
Gustav Jakob Jacobi y Henri Poincaré, se ha hecho evidente que problemas realmente
complejos de mecánica celeste pueden abordarse mejor, usando el denominado
formalismo analítico de la mecánica (mecánica analítica o teórica). En este for-
malismo los sistemas se describen usando funciones (o funcionales) tales como el
Lagrangiano y el Hamiltoniano, que contienen toda la información del sistema,
sus restricciones y simetrías. La mecánica analítica, sus principios teóricos y méto-
dos matemáticos, son la base de la construcción moderna de la mecánica cuántica,
la relatividad, el electromagnetismo y la óptica.
Un caso ilustrativo, muy popular y reciente, del poder del formalismo analítico

R
de la mecánica celeste, fue su aplicación en la “predicción” de la existencia de un
noveno planeta en el Sistema Solar. Pero este es apenas la punta del iceberg. La

O
mayoría de los trabajos científicos en astronomía que usan la mecánica celeste hoy,
aplicam, directa o indirectamente, el formalismo analítico.
No es muy común reconocerlo entonces, pero la mecánica celeste se convierte
así en una excelente (y excitante) manera de iniciarse en la mecánica analítica. Para
D
los astrónomos es, además, la primera y más importante manera de hacerlo en el
pregrado. Este libro se aprovecha de esta oportunidad.
A
1.2.2 Mecánica celeste en la era de la información
Hay un ingrediente adicional que hace a este libro diferente de la inmensa may-
RR

oría de los que se han publicado antes en esta materia. Me refiero al enfásis que
he querido dar, a través de todo el texto, a la introducción e implementación de
algoritmos y al uso de herramientas computacionales para, de un lado, apoyar la
comprensión de los conceptos, y del otro, resolver problemas específicos.
Es un hecho ampliamente reconocido que la complejidad de algunos problemas
de mecánica celeste, en particular de aquellos con un interés práctico (el diseño de
BO

trayectorias de vehículos espaciales, la predicción a largo plazo de la posición de


un asteroide, etc.) han exigido el uso de técnicas de aproximación numérica y de
su implementación en calculadores y computadores, casi desde el “principio”. En
este sentido, la relación de la mecánica celeste con algoritmos de toda clase, no es
comparable con la que tienen cualquier otra área de la física. Hoy, es casi impens-
able “saber” de mecánica celeste, sin estar familiarizado también con algoritmos,
métodos numéricos y herramientas computacionales que hacen posible su desar-
rollo y aplicación.
Es por ello que en todo el libro hago un énfasis especial en los aspectos algorítimi-
cos de la mecánica celeste, es decir a las aproximaciones numéricas o las herramien-
tas computacionales de las que se vale. Aún más, el texto fue escrito enteramente
usando libretas o notebooks del Proyecto Jupyter. Este hecho, permite al docente
o al estudiante convertir el texto (en su versión electrónica) en una herramienta
interactiva. Los ejemplos, problemas resueltos, e incluso algunas explicaciones,
pueden personalizarse, cambiando los parámetros e incluso los algoritmos, ha-
ciendo el contenido del libro mucho más dinámico.
12 Chapter 1. Preambulo

Es casi imposible escribir un libro que haga uso intensivo de la informática


sin comprometerse con un lenguaje de programación o alguna herramienta com-
putacional específica. En el caso de este libro el lenguaje elegido es Python y la
herramienta computacional es la biblioteca de rutinas y kernels del NAIF-SPICE de
NASA.
Esta siempre será una apuesta arriesgada. La mecánica celeste no pasará nunca
de “moda”, ni será sustituida por un formalismo teórico más “popular”. Pero los
lenguajes y las herramientas informáticas vienen y van. Cientos de libros escritos
en las últimas décadas, “recogen polvo” en las bibliotecas por haber comprometido
su contenido con lenguajes o herramientas que no son ahora muy utilizadas.
No sabemos si Python (y por lo tanto este libro, que lo utiliza sistemáticamente)
sufrirán la misma suerte, pero hay tres hechos que sugieren que este lenguaje po-
dría conservar su popularidad por un tiempo razonable (o al menos es mi esper-
anza).

R
El primer hecho es que su sintaxis y gramática basica son muy similares a
las del “lenguaje natural” (pseudocódigo). Considere, por ejemplo el siguiente

O
código:

In [1]: from math import pi


for n in range(1,10): D
print("pi a la",n,"es",pi**n)

pi a la 1 es 3.141592653589793
pi a la 2 es 9.869604401089358
A
pi a la 3 es 31.006276680299816
pi a la 4 es 97.40909103400242
pi a la 5 es 306.0196847852814
RR

pi a la 6 es 961.3891935753043
pi a la 7 es 3020.2932277767914
pi a la 8 es 9488.53101607057
pi a la 9 es 29809.0993334462
BO

Es difícil escribir este sencillo algoritmo de una manera más simple en otros
lenguajes de programación populares en la ciencia (C, FORTRAN o Java). Es evidente
que personas poco familiarizados con el lenguaje pueden fácilmente entender al-
goritmos escritos en Python, incluso si son más complicados que el anterior.
El segundo hecho que muestra la estabilidad de Python, es el hecho de que
en años recientes se han escrito innumerables paquetes científicos, de todo tipo,
para quienes usan este lenguaje. Herramientas muy populares, escritas original-
mente en otros lenguajes, han sido traducidas a Python (pythonizadas si quieren)
con el único propósito de que puedan ser usadas por la creciente comunidad que
programa en este lenguaje. Python se esta convirtiendo, de este modo, en el de-
positario de la experiencia computacional acumulada por décadas.
¿Cambiará esta tendencia pronto? Lo dudo (o al menos quiero creer que es así,
por el bien de este libro).
La última razón, pero no por eso menos importante, es la existencia de una bib-
lioteca gráfica amplia y bien documentada, matplotlib. Con la excepción de pa-
quetes que incluyen lenguajes de programación propios, tales como Mathematica
1.2. Prefacio 13

o Matlab (ambos sujetos a un pago), la mayoría de los lenguajes de programación


dependen a veces, de complicadas bibliotecas gráficas o programas de terceros
para hacer hasta los más sencillos gráficos.
En Python, hacer un gráfico elemental, es tan simple como escribir:
In [2]: from matplotlib.pyplot import plot
%matplotlib inline
plot([1,2,3,4],[1,4,9,16]);

R
O
D
A
RR

Además de Python, existe una herramienta desarrollada originalmente por


NASA para la modelación de sus misiones espaciales, y que ha cobrado, en años
recientes, una popularidad significativa en la comunidad académica.
BO

Se trata de la biblioteca de rutinas NAIF-SPICE (o en breve SPICE). Las rutinas y


los denominados kernels de esta herramienta, están detrás de algunas de los servi-
cios más populares de NASA, tales como el sistema Horizons, que permite calcular
en línea, la posición de cuerpos y naves espaciales; o el simulador NASA's Eyes
que ofrece vistas en tiempo real de la posición de los cuerpos del sistema solar y
de las misiones espaciales de la agencia espacial estadounidense.
En este libro nos valdremos de SPICE para ilustrar conceptos de mecánica ce-
leste, desarrollar ejemplos y resolver problemas que implicarían de otro modo, un
gran esfuerzo ilustrar y resolver partiendo desde cero. Al hacerlo, el lector no solo
se familiarizará con una herramienta que usan astrónomos e ingenieros aeroes-
paciales que trabajan en problemas reales de mecánica celeste, sino que además
le permitirá reconocer los problemas en los que se debe enfocar y evitar resolver
aquellos en los que existe una amplia experiencia.
¿Podría SPICE desaparecer o mejor, ser reemplazada por un sistema diferente
en los próximos años? No podemos asegurarlo. Sin embargo, la cantidad de her-
ramientas que hoy dependen de esta biblioteca hace dificil pensar en que en el
14 Chapter 1. Preambulo

futuro inmediato pueda cambiar radicalmente. Un último aspecto hace de SPICE


una opción muy estable para los propósitos de un libro de texto. La biblioteca esta
disponible para un amplio conjunto de lenguajes diferentes a Python (que es con
el que la usamos aquí). Quién se familiarice con SPICE podrá usarla también en
C/C++, FORTRAN e IDL.

1.2.3 ¿Qué hace distinto a este libro?


• Me gusta justificar todo.
• Es realmente un libro para estudiantes de pregrado.
• Solo incluye los aspectos de la mecánica celestes que son últiles para comen-
zar.

Jorge I. Zuluaga

R
Medellín, Diciembre 31 de 2019

O
1.3 Introducción
1.3.1 ¿Cómo usar este libro? D
En un esfuerzo por crear un libro interactivo que permita facilitar el aprendizaje
de la Mecánica Celeste hemos creado un conjunto de Notebooks de IPython que
permiten presentar la teoría asociada con los distintos temas del curso, así como
A
los aspectos prácticos asociados a esa misma teoría.
La idea es que mientras el profesor y los estudiantes van leyendo el libro, ten-
gan también la oportunidad de ejecutar pequeños snippets en python, hacer cálcu-
los numéricos sencillos, visualizar algunos conceptos de interés o interactuar con
RR

scripts un poco más complejos.


Todos estas herramientas están disponibles para su descarga en un reposito-
rio en GitHub, a saber el repositorio de Herramientas de Mecánica Celeste1 . El
repositorio esta públicamente disponible para todos los estudiantes y profesores
que deseen usarlo para los propósitos que consideren, incluyendo naturalmente
BO

ofrecer o seguir este curso.

1.3.2 Paquetes y herramientas requeridas


Para ejecutar este libro electrónico y muchos de los snippets incluídos aquí es nece-
sario habilitar algunos módulos y paquetes de Python, así como definir macros y
constantes que sería incómodo y poco estético que fueran visibles aquí. Con este
propósito hemos desarrollado un paquete autocontenido que no requiere instalación
y viene en el mismo directorio en el que están estos notebooks. El paquete se im-
porta de forma sencilla en los notebooks usando el comando:
In [3]: from meccel import *

En este punto es importante anotar que el paquete meccel importa paquetes de


matplotlib que para que corran apropiadamente en Jupyter un comando mágico
debe ejecutarse, a saber:
1 https://github.com/seap-udea/MecanicaCeleste-Herramientas
1.3. Introducción 15

%matplotlib nbagg

Este es un comando delicado que determina el tipo de backend sobre el que van
a correr los gráficos. Existen dos tipos de backends, inline que ejecuta gráficos
simples sin posibilidad de interacción básica y el nbagg que permite alguna inter-
actividad. Es importante entender que una vez activado un backend, para activar
el otro debe reiniciarse el notebook. Por defecto se activará el backend nbagg.
Podemos probar si el backend funciona correctamente ejecutando el siguiente
comando gráfico:

In [4]: linea,=plt.plot([0,1],[0,1])

R
O
D
A
RR
BO

Si la figura anterior contiene controles para navegar o modificar la figura como


estos:

Figure 1.1: Controles

El backend esta funcionando correctamente. Si no lo hace puede que sea nece-


sario ejecutar nuevamente el comando %matplotlib nbagg de antes.
Una vez importado el paquete meccel, muchos de los macros y módulos es-
tarán inmediatamente disponibles. Estos incluyen, pero no se reducen a:

• Paquete numérico numpy importado con el prefijo np.


• Paquete de graficación matplotlib importado como plt y sus sub paquetes
comunes animation y patches (importado como pat).
16 Chapter 1. Preambulo

Para ver el contenido completo del paquete basta que vaya directamente el
archivo meccel.py2 que esta disponible en el listado que verá en su cuenta en
Jupyter o puede verlo en línea en el archivo meccel.py3 del repositorio GitHub.
Una vez insertado el paquete, las herramientas contenidas en él pueden uti-
lizarse. Así por ejemplo, para generar 10 números aleatorios puede usarse:

In [5]: np.random.rand(20)

Out[5]: array([0.94294412, 0.78931583, 0.40679256, 0.34946848, 0.94446293,


0.7616387 , 0.85395541, 0.40031295, 0.80230527, 0.22708778,
0.50063272, 0.98948594, 0.30342769, 0.16089911, 0.44783298,

R
0.3880809 , 0.61689789, 0.58010575, 0.85005245, 0.55587847])

O
Figuras y gráficos D
Existen tres tipos de elementos gráficos que pueden aparecer en este libro elec-
trónico:
A
• Las imágenes, que son dibujos o representaciones pictóricas de un concepto,
elaboradas con un software diferente al libro mismo. La mayoría de las fig-
RR

uras son incluídas como parte del paquete del libro electrónico y solo en
algunos casos pueden provenir de sitios diferentes.

• Los gráficos, que son producidos por programas incluídos en los libros pero
BO

cuyo código no necesariamente es visible para los profesores y estudiantes,


esto último con el propósito de no recargar mucho los libros de código in-
necesario.

• Las figuras que son productos gráficos (estáticos o animaciones) de los co-
mandos de los mismos snippets incluídos en el libro.

Este es un ejemplo de una imagen:

2 ./meccel.py
3 https://raw.githubusercontent.com/seap-udea/MecanicaCeleste-Herramientas/master/

meccel.py
1.3. Introducción 17

R
O
Figure 1.2: Generación de las figuras cónicas a partir de intersecciones de un plano
con un cono doble
D
Este es un ejemplo de un gráfico:
A
RR
BO

Figure 1.3: Elipse con semilatus rectum p = 1.0 y excentricidad e = 0.5

Los más curiosos podrán encontrar el código fuente de cada figura en el note-
book preparado especialmente para ese fin, Chapter ??
18 Chapter 1. Preambulo

Este es un ejemplo de una figura:

In [6]: fig=plt.figure(figsize=(5,5))
plot=plt.plot(np.random.rand(1000),'ko')

R
O
D
A
RR
BO

Figuras interactivas

En algunos casos especiales es posible toparse con una figura interactiva como
esta:

In [7]: i=interact(elipsePlot,p=(0.1,10),e=(0.0,1.0,0.05),vmax=(1,10,0.5),figsize=fixed((4,4
1.3. Introducción 19

R
O
D
En este caso para ver el código fuente de la rutina elipsePlot es necesario ver
A
el paquete meccel.py.
Nótese como los parámetros de la rutina elipsePlot aparecen enumerados
en la llamada al comando interact con los rangos en los que se permitirá variar
RR

el valor del parámetro respectivo. Cuando un parámetro se desea cambia para


dejar fijo (como es el caso de figsize), su comportamiento se debe indicar con el
modificador fixed.

SPICE
BO

Una de las herramientas más poderosas incluídas con este libro electrónico es la
biblioteca de Python SpiceyPy que provee una interface al sistema SPICE de NASA.
Con esta biblioteca se pueden realizar una innumerable cantidad de operaciones
especialmente con objetos geométricos como vectores y matrices, la mayoría dis-
eñadas para calculos de la posición de objetos astronómicos en el cielo (cálculo de
efemérides).
Una descripción más detallada del uso de SPICE en estas notas esta disponible
en el Apéndice A4 . Sin embargpo para ilustrar las capacidades y el poder de esta
biblioteca mostramos en el snippet abajo cómo calcular por ejemplo la distancia
entre la Tierra y Marte en el momento actual.
Lo primero que necesitamos hacer es cargar los kernels de SPICE, archivos es-
peciales donde se almacenan los datos requeridos para los cálculos de posiciones
y tiempos en el Sistema Solar:
In [8]: spy.furnsh('util/kernels/naif0012.tls')
spy.furnsh('util/kernels/de430.bsp')
4 ./A01-01-MecanicaCeleste-Herramientas-SPICE-Basico.ipynb
20 Chapter 1. Preambulo

Ahora obtenemos la hora actual:

In [9]: from datetime import datetime


now=datetime.now().strftime('%m/%d/%y %H:%M:%S')+" UTC-5"
#Tiempo de Efemérides
et=spy.str2et(now)
print("Fecha y hora actual: ",now)

Fecha y hora actual: 09/05/19 10:48:08 UTC-5

Calculamos la posición cartesiana de los dos planetas en el espacio:

In [10]: marte=spy.spkgeo(4,et,"ECLIPJ2000",0)
tierra=spy.spkgeo(399,et,"ECLIPJ2000",0)

R
Y determinamos la distancia:

O
In [11]: distancia=spy.vnorm(spy.vsub(marte[0][:3],tierra[0][:3]))
print("Distancia Tierra-Marte (millones de km):",distancia/1e6)

Distancia Tierra-Marte (millones de km): 399.9107783684474


D
A
RR
BO
Chapter 2

Fundamentos
Matemáticos y Físicos

R
O
2.1 Curvas cónicas
2.1.1 Descripción geométrica D
A
RR
BO

La descripción geométrica de las órbitas planetarias se remonta a los trabajos de Jo-


hannes Kepler, quién fue el primero en darle una explicación causal al movimiento
de los cuerpos celestes. Más adelante, Issac Newton demostraría la corresponde-
cia entre la forma matemática del potencial gravitaciona la al que está sometido un
cuerpo y el conjunto de órbitas posibles generadas, las cuales desde un punto de
vista geométrico pertenecen a la familia de las secciones cónicas.
Familiarizarse con las propiedades de las cónicas proveerá de muchas her-
ramientas valiosas al momento de encarar problemas en mecánica celeste.
Las cónicas resultan de la intersección de un cono de dos hojas con un plano
ubicado a diferentes inclinaciones respecto al eje de simetría del cono y sin pasar
por el vértice.

21
22 Chapter 2. Fundamentos Matemáticos y Físicos

R
O
Figure 2.1: Generación de las figuras cónicas a partir de intersecciones de un plano
con un cono de dos hojas.
D
Existen tres tipos básicos de curvas cónicas, dos que son abiertas y una cerrada:
A
1. Parábola: es una curva abierta que se obtiene cuando un plano intersecta
paralelo al borde de los conos, intersecta cualquiera de ellos (Caso 1 en la
RR

Figura). Nótese que cuando el plano se aproxima al vértice de los conos, la


forma de la curva no cambia pero su ancho característico si lo hace.

2. Elipse: es una curva cerrada que se obtiene de la intersección de un plano


que forma un ángulo distinto de 0 respecto al eje de simetría de los conos
BO

(Caso 2 en la Figura). La forma de la elipse cambia al modificar el ángulo


del plano, produciendo elipses más y menos excéntricas. La elipse de menor
excentricidad (formada por la intersección de un plano perpendicular al eje
de simetría es una circunferencia.

3. Hipérbola: es una curva abierta y disconexa (formada por dos ramas) que se
produce al intersectar los conos con un plano paralelo a sus ejes (Caso 3 en
la Figura).

¿Qué sucede cuando el plano pasa a través del vértice del cono? En este caso
se tiene una cónica degenerada que tiene la misma forma de una recta o un punto.
Una forma de definir geométricamente las conicas es por medio de la llamada
recta directríz. Este método está basado en la elección de un sistema de coordenadas
(el cartesiano por ejemplo), y el uso de una recta auxiliar paralela a uno de los ejes
coordenados, llamado recta directriz.
2.1. Curvas cónicas 23

R
O
D
A
RR

Figure 2.2: Definición de la figuras cónicas en el plano cartesiano.


BO

La hipérbola, la parábola y la elipse son las tres figuras cónicas que se difer-
encian por el valor de la excentricidad. Este parámetro se define como la razón
constante entre dos distancias: desde el Foco hasta un punto P arbitrario y desde
este punto hasta la recta directriz fija.

PF
≡e (2.1)
PD
Donde e es una constante positiva de valor arbitrario.
Si definimos un sistema de coordenadas tal que el eje y pase por la recta direc-
tríz y el eje x pase por el foco, en términos de las coordenadas ( x, y) de cada punto
de la cónica, la anterior condición se puede escribir como:
p
( F − x )2 + y2
=e (2.2)
x
Donde F es la distancia del Foco a la directriz.
24 Chapter 2. Fundamentos Matemáticos y Físicos

Despejando y obtenemos la siguiente ecuación algebraica que describe la


cónica:

y = ±[(e2 − 1) x2 + 2Fx − F2 ] (2.3)


En la figura a continuación se representa gráficamente esta ecuación. El lector
puede modificar los valores de las constantes F (distancia del foco a la directriz) y e
(razón definitoria de la cónica) para ver el efecto que cada una de estas cantidades
tiene en la forma de la curva resultante.

In [2]: i=interact(conicaDirectriz,e=(0.1,2.0,0.05),F=(0.0,1.5),fx=(1.0,5.0),vmax=(0.1,5,0.1

R
O
D
A
RR
BO

Como puede comprobarse al experimentar con la figura anterior, el parámetro e


determina la forma de la cónica. Así por ejemplo, vemos que cuando e < 1 la cónica
es cerrada (una elipse), mientras que cuando e ≥ 1 la cónica es abierta. Es trivial
entender que la trayectoria intermedia e = 1 debe corresponder a la parábola.
El parámetro e, que llamaremos en lo sucesivo, excentricidad permite entonces
clasificar analíticamente las cónicas así:

• Elipse: cuando 0 < e < 1


• Parabla: cuando e = 1
• Hipérbola: cuando e > 1

Puede demostrarse matemáticamente (se deja al lector) que cuando e = 0 la


curva resultante es una circunferencia centrada en F.
En aplicaciones astronómicas, los casos circulares y parabólicos sirven solo
como referencia ya que una excentricidad exactamente igual a 0 o 1 es difícil de
encontrar en la realidad. La definición directriz no es aplicable al caso circular ya
que la directriz se encuentra en el infinito.
2.1. Curvas cónicas 25

Semilatus rectum

Analicemos un punto relevante sobre la sección cónica. El punto de interés es aquel


que se encuentra justo sobre el foco, a una distancia vertical y ≡ p. Esta distancia
se conoce como el semilatus rectum. En este caso x = F y de la ecuación:

F2 (1 − e2 ) − 2F2 + F2 + p2 = 0

p2 − F 2 e2 = 0

R
O
p = eF

Esta expresión también puede obtenerse de la definición directriz pero no


D
aplica para un círculo porque en ese caso partícular la directriz se encuentra en
el infinito.
A
2.1.2 Descripción algebraica
RR

La ecuación algebráica general de la cónica en coordenadas cartesianas, referida


a un sistema de referencia tal que el origen pase por la directriz, y está última
coincida con el eje y, es (ver sección 2.1.1):
BO

x2 (1 − e2 ) − 2xF + y2 + F2 = 0 (2.4)

Pero esta no es la forma más simple de describir en coordenadas cartesianas


una cónica cualquiera. Comencemos por decir que el origen de coordenadas
elegido para escribir esta ecuación se basa en la definición geométrica misma, pero
no en un criterio de simplicidad algebraica. ¿Existirá entonces un sistema de ejes
coordenados en el que la ecuación tenga una forma más simple?.
Para ello debemos considerar la posibilidad de realizar dos tipos de transfor-
maciones sobre el sistema de coordenadas:

• Una traslación, que implica modificar la posición del origen a un punto ar-
bitrario ( xo , yo ) referido al sistema original.

• Una rotación, que implica modificar la dirección de los ejes coordenados.


26 Chapter 2. Fundamentos Matemáticos y Físicos

Ecuación respecto al centro

R
O
D
Figure 2.3: Definición de la figuras cónicas en el plano cartesiano.
A
Naturalmente la traslación es la transformación más simple. Si llamamos x 0 , y0 las
coordenadas de un punto en el sistema trasladado (ver figura), estas estarán dadas
en términos de las coordenadas en el sistema original por:
RR

x 0 = x − xo (2.5)
0
y = y − yo (2.6)
y la transformación inversa será:
BO

x = x 0 + xo (2.7)
0
y = y + yo (2.8)
Apliquemos por ejemplo una transformación a la ecuación original tal que xo =
C y yo = 0 (traslación solo en dirección del eje x, es decir en el eje de simetría de
la cónica). Esta transformación equivale a poner el origen en un punto distinto al
que pasa por la directriz. La ecuación algebraica de la cónica queda:

( x 0 + C )2 (1 − e2 ) − 2( x 0 + C ) F + y 02 + F 2 = 0 (2.9)
Si desarrollamos los términos obtenemos la ecuación general:

(1 − e2 ) x 02 + 2[(1 − e2 )C − F ] x 0 + y02 + [(1 − e2 )C2 − 2CF + F2 ] = 0 (2.10)


Ahora imaginemos que queremos imponer la condición de que la ecuación no
contenga ningún término lineal en x 0 o en y0 . En el caso en el que e = 1 (parábola)
2.1. Curvas cónicas 27

esta condición es imposible de satisfacer puesto que F 6= 0. Sin embargo, si e 6= 1,


la condición de que no hayan terminos lineales implicará una condición sobre el
valor de C:

F
C=
1 − e2
Con esto la ecuación de la cónica se podría escribir:

e2 F 2
(1 − e2 ) x 02 + y 02 = (2.11)
1 − e2
Que se puede reescribir en una forma más tradicional como:

x 02 y 02
+ =1 (2.12)

R
e2 F 2 / (1 − e2 )2 e2 F 2 / (1 − e2 )

Interpretación de los parámetros

O
Esta forma de la ecuación nos permite hacernos a una idea de dónde queda C.
Si hacemos y0 = 0, en el caso de la elipse, habrán siempre dos puntos ubicados
D
a la misma distancia del origen (el punto C), a saber:

eF
x 0 ( y 0 = 0) = ±
1 − e2
A
Si al contrario hacemos x 0 = 0, las coordenadas de los puntos extremos serán:

eF
y 0 ( x 0 = 0) = ± √
RR

1 − e2
Es decir la forma simétrica de la ecuación algebraica resultante de la traslación,
es indicativa de que C esta ubicada en el centro de simetría de la cónica (el centro
de la elipse o el punto medio entre las ramas de la hiperbola).
2
√ Dado que en el caso en el que e < 1, El valor del factor (1 − e ) es menor que
BO

2
1 − e , los puntos extremos en dirección del eje x estarán más lejos que los puntos
extremos en dirección del eje y.
Llamamos a estas distancias longitudes de los semiejes de la elipse y se denotan:

eF
a≡ Semiejemayor (2.13)
1 − e2
eF
b≡ √ Semiejemenor (2.14)
1 − e2
Estas dos cantidades se relacionan así:
p
b = a 1 − e2
Examinando las expresiones anteriores podemos confirmar algo que intuíamos
de la definición geométrica básica: una elipse o una hipérbola pueden describirse
unicamente usando dos parámetros:
28 Chapter 2. Fundamentos Matemáticos y Físicos

1. F y e, especialmente cuando la ecuación de la elipse se escribe con respecto a


la directriz.

2. p y e que es la parametrización más utilizada en estudios del sistema solar.


3. a y e cuando la ecuación de la cónica se escribe con respecto al centro ge-
ométrico.

En este último caso, la ecuación de la elipse por ejemplo se escribe:

x 02 y 02
2
+ 2 =1
a a (1 − e2 )
Utilice la herramienta interactiva, para ver que efecto tiene la variación de cada
uno de las propiedades de la elipse.

R
In [4]: i=interact(elipseCentrada,a=(0.0,5.0),e=(0.0,0.99,0.05),figsize=fixed((4,4)))

O
D
A
RR
BO

Examine el código fuente de la rutina elipseCentrada usada en este snippet


para saber cómo se grafica una elipse usando la ecuación algebraica simplificada
de arriba.

Parámetros de la hipérbola

¿Qué pasa en el caso de la hipérbola?. Volviendo a la ecuación más simetrica,


vemos que si e > 1 la ecuación debe escribirse como:
2.1. Curvas cónicas 29

x 02 y 02
− =1 (2.15)
e2 F 2 / ( e2 − 1)2 e2 F 2 / ( e2 − 1)
En este caso encontramos nuevamente que cuando y0 = 0 hay dos puntos ex-
tremos de la hipérbola (que llamamos también vértices o apsides de la cónica) que
se encuentran a lado y lado del centro de simetría a una distancia | a| = eF/(e2 − 1).
Sin embargo no existe ningún punto para el cuál x 0 = 0. De esto se deduce
que el centro de la hipérbola esta entre las dos ramas de la misma, en una posición
C = − F/(e2 − 1) de la directriz. Por tanto el foco se encuentra a una distancia del
centro igual a F + F/(e2 − 1) = Fe2 /(e2 − 1) = e| a|. La geometría resultante se
muestra en la figura.

R
O
D
A
RR
BO

Figure 2.4: Gráfica de la Hipérbola respecto a su centro



¿Cómo se interpreta ahora el valor de b = | a| e2 − 1?.
Para encontrar el significado geométrico de b notamos que la ecuación de la
hipérbola se puede escribir como:
r
b p 2 2
b a2
y=± x −a = ± x 1− 2 (2.16)
| a| | a| x
Cuando x → ∞, La ecuación de la hiperbola se hace muy cercana a la de las
rectas y a = ±(b/| a|) x.
Estas rectas definen las denominadas asíntotas de la hipérbola.
Si la coordenada y de las asíntotas se evalúa cuando x = | a|, tenemos que:

y a = ±b (2.17)
por tanto, geométricamente el semieje menor de una hipérbola es la distancia
desde los vértices hasta las asíntotas.
30 Chapter 2. Fundamentos Matemáticos y Físicos

Utilice la herramienta interactiva, para ver que efecto tiene la variación de cada
uno de las propiedades de la hipérbola.
In [5]: i=interact(hiperbolaCentrada,a=(1.01,5.0,0.05),e=(1.01,5.00,0.05),vmax=(1,20,0.5),fi

R
O
D
A
RR

El ángulo entre el eje de simetría de la hipérbola y cualquiera de sus asíntotas


es:

b
BO

tan ψ =
| a|

Rotación de las cónicas en el plano

¿Qué sucede ahora si la dirección de los ejes coordenados no coinciden con aquella
de la directriz?. El resultado será una cónica rotada respecto a los nuevos ejes.
Si llamamos x 0 , y0 , z0 las coordenadas de un punto con respecto a los ejes rota-
dos, la relación que tendrán las coordenadas de ese punto con las coordenadas en
el sistema de ejes natural de la cónica (los ejes cuya dirección coincide con los de la
directriz) será:

x = x 0 cos θ − y0 sin θ (2.18)


0 0
y = x sin θ + y cos θ (2.19)
0
z=z (2.20)
(2.21)
2.1. Curvas cónicas 31

Que matricialmente se puede escribir como:


   0 
x x
 y  = R(θ )  y0  (2.22)
z z0
Donde la matriz R esta dada por:
 
cos θ − sin θ 0
R(θ ) =  sin θ cos θ 0  (2.23)
0 0 1
La matriz de rotación R es una matriz unitaria con las siguientes propiedades:

1. det R = 1

R
2. R−1 = R T

Aprovechando esta última propiedad podemos escribir la transformación in-

O
versa (encontrar las coordenadas de un punto en el sistema rotado en términos de
las coordenadas en el sistema natural de la cónica) como:
 0 
x
D 
 y0  = R(−θ )  y 
x

(2.24)
z0 z
A
Que explícitamente sería:
RR

x 0 = x cos θ + y sin θ (2.25)


0
y = − x sin θ + y cos θ (2.26)
z0 = z (2.27)
(2.28)
BO

O bien:
 
cos θ sin θ 0
R(−θ ) =  − sin θ cos θ 0  (2.29)
0 0 1
Dado que normalmente nos interesa pasar las coordenadas del sistema natu-
ral de la cónica (los ejes rotados) al sistema de coordenadas de referencia (los no
primados), es común definir la matriz de rotación como:

Rz (θ ) ≡ R(−θ )

 
cos θ sin θ 0
Rz (θ ) =  − sin θ cos θ 0  (2.30)
0 0 1
y las rotaciones como:
32 Chapter 2. Fundamentos Matemáticos y Físicos

x0
   
x
 y0  = Rz (θ )  y  (2.31)
z0 z

   0 
x x
 y  = Rz (−θ )  y0  (2.32)
z z0

El paquete SpiceyPy contiene una rutina útil para definir de manera sencilla

R
una matriz de rotación dado un ángulo y un eje:

O
In [6]: Rz=spy.rotate(-30*GRADOS,3)
print(Rz)

[[ 0.8660254 -0.5 0.
D
]
[ 0.5 0.8660254 0. ]
A
[ 0. 0. 1. ]]
RR

Veamos todo esto en la práctica. Si construímos el conjunto de puntos que


definen una de las ramas de una elipse usando:

In [7]: a=1
BO

e=0.5
b=a*np.sqrt(1-e**2)
x=np.linspace(-a,a,1000)
y=b*np.sqrt(1-x**2/a**2)
z=np.zeros_like(y)

Y los graficamos:

In [8]: plt.figure(figsize=(3,3))
plt.plot(x,y)
plt.xlim((-2*a,2*a))
plt.ylim((-2*a,2*a))

Out[8]: (-2, 2)
2.1. Curvas cónicas 33

R
O
Para rotar los puntos de la elipse debemos construir un arreglo de arreglos:
D
In [9]: rps=np.array([[xp,yp,zp] for xp,yp,zp in zip(x,y,z)])
rs=np.array([spy.mxv(Rz,rp) for rp in rps])
A
In [10]: plt.figure(figsize=(3,3))
plt.plot(rs[:,0],rs[:,1])
plt.xlim((-2*a,2*a))
plt.ylim((-2*a,2*a))
RR

Out[10]: (-2, 2)
BO
34 Chapter 2. Fundamentos Matemáticos y Físicos

Ecuación general de las cónica

Si reemplazamos esta relación en la ecuación algebraica original:

( x 0 cos θ − y0 sin θ )2 (1 − e2 ) − 2( x 0 cos θ − y0 sin θ ) F + ( x 0 sin θ + y0 cos θ )2 + F2 = 0


(2.33)
Que puede simplificarse como:

(1 − e2 cos2 θ ) x 02 + 2e2 sin θ cos θx 0 y0 + (1 − e2 sin2 θ )y02 − 2F cos θx 0 + 2F sin θy0 + F2 = 0


(2.34)
De aquí puede verse que una forma más general de expresar la ecuación de una
cónica es hacerlo con la ecuación general:

R
Ax 02 + Bx 0 y0 + Cy02 + Dx 0 + Ey0 + G = 0 (2.35)
o bien, matricialmente como:

O
  
A B/2 D/2 x
x 0 y0 1  B/2

C
D E/2   y  = 0 (2.36)
D/2 E/2 F 1
Donde los coeficientes A, B, C, D, E, G dependerán de las dimensiones de la
cónica (F), de su forma (e) y de su rotación respecto a los ejes coordenados.
A
Las cónicas que son descritas por su ecuación algebráica se pueden clasificar
por medio de su discriminante que se define como dis = B2 − 4AC tal que si dis > 0
la cónica es una hipérbola, si dis = 0 una parábola y si dis < 0 es una elipse o un
RR

círculo cuando A = C.
También es posible probar que:
" p #1/2
( A − C )2 + B2
2
e= p (2.37)
η ( A + C ) + ( A − C )2 + B2
BO

donde η = +1 si el determinante de la matriz C es negativo y η = −1 si es


positivo.
Con respecto al término de acople, es siempre posible encontrar un ángulo θ
tal que si se rota el sistema de coordenadas original a través de esa cantidad, los
nuevos ejes estarán alineados con los ejes de simetria. Puede demostrarse que
dicho ángulo se encuentra mediante
B
tan 2θ = (2.38)
A−C

2.1.3 Representación en coordenadas polares


Cambiemos ahora el sistema de referencia a un sistema polar con origen en el foco
de la curva.
En este caso, el punto P de coordenadas cartesianas ( x, y) se identificará con
una coordenada radial r > 0 medida desde el nuevo orígen y una coordenada
angular f que se mide desde la dirección del periápsis.
2.1. Curvas cónicas 35

R
O
D
A
RR
BO

Figure 2.5: Definición de la anomalía verdadera

Con esta configuración, la ley de transformacion entre las coordenadas carte-


sianas en el sistema referido a la directriz y las nuevas coordenadas polares será:

x = F − r cos f (2.39)
y = r sin f (2.40)

donde hay que tener en cuenta que las variables x y F son cantidades de
definidas positivas. Reemplazando en la ecuación algebraica de la cónica:

r2 sin2 f + ( F − r cos f )2 (1 − e2 ) − 2F ( F − r cos f ) + F2 = 0 (2.41)


De esta expresión podemos deducir la ecuación general de la cónica en coorde-
nadas polares:
36 Chapter 2. Fundamentos Matemáticos y Físicos

p
r= (2.42)
1 + e cos f

Donde usamos el hecho que p = eF.


El ángulo f se conoce comunmente como la anomalía verdadera y corresponde
al parámetro posicional básico de una cónica; es decir para especificar completa-
mente la posición de un cuerpo sobre la cónica con parámetros de tamaño y forma
( p, e), solo es necesario indicar el valor de f .
#### Anomalías #

R
La anterior expresión para la ecuación polar de las cónicas ofrece algunas di-
ficultades cuando se manipula esta ecuación en distintos contextos en mecánica
celeste. Considere por ejemplo el problema de calcular la derivada temporal de r

O
en función de la derivada temporal de f . Dado que la expresión tiene a f en el
denominador la relación resultante no será muy trivial.
Existe una manera más conveniente de escribir la ecuación polar usando para
D
ello, sin embargo una identidad geométrica nueva.
Consideremos inicialmente el caso de una elipse. Respecto al centro, los puntos
de la elipse satisfacen la ecuación algebraica:
A
x2 y2
RR

+ =1
a2 b2

Una manera equivalente de escribir la ecuación de la cónica sería hacerlo en


términos de un parámetro libre E, tal que:
BO

x = a cos E (2.43)
y = b sin E (2.44)

Nótese que los puntos que satisfacen el conjunto anterior de ecuaciones, tam-
bién satisfacen la ecuación general de más arriba.
Pero, ¿qué significado geométrico tiene el ángulo E?.
En la figura abajo se muestra como las ecuaciones paramétricas recién intro-
ducidas equivalen a una construcción geométrica que implica inscribir y circun-
scribir la cónica entre dos circunferencias de radios a y b.
Al parámetro E se lo conoce comunmente como anomalía excéntrica y puede
usarse de forma análoga a como se usa f para definir completamente la posición
de un punto sobre la elipse.
2.1. Curvas cónicas 37

R
O
D
A
Figure 2.6: Definición de la anomalía excéntrica
RR

Un interesante resultado de esta manera de definir la cónica se obtiene al com-


parar el valor de la abscisa de cada punto y con el correspondiente valor de la
abscisa en los puntos de la circunferencia circunscrita (circunferencia de radio a),
yc . La razón de ambos números satisface (se deja al lector probar esta relación):
BO

y b
=
yc a

De modo que uno podría describir la elipse como el lugar geométrico de los
puntos tal que están a una distancia del eje x en proporción b/a de la distancia de
los puntos de una circunferencia de radio a.
¿Será posible escribir una ecuación en términos de E que nos de la distancia de
cada punto de la elipse al foco de la misma manera que lo hicimos con f ?
Consideremos la construcción geométrica que se muestra en la figura abajo
38 Chapter 2. Fundamentos Matemáticos y Físicos

R
O
D
A
Figure 2.7: Construcción geométrica para construir la ecuación de la elipse en tér-
minos de E
RR

Como mencionamos arriba la siguiente relación es válida para los segmentos


definidos en la elipse:

PD b
= (2.45)
QD a
BO

Si usamos el teorema de Pitágoras para relacionar r con los distintos segmentos


de la figura obtenemos:
 2
b
r2 = ( DF )2 + ( PD )2 = (CF − CD )2 + QD (2.46)
a
Por la geometría de la elipse sabemos sin embargo que CD = a cos E, CF = ea
y QD = a sin E. Después de algunas manipulaciones algebraicas se muestra que:

r = a(1 − e cos E)

que es la ecuación buscada.


Con un procedimiento análogo se puede probar que la relación existente entre
las anomalías verdadera f y la anomalía excéntrica E es:
r
f 1+e E
tan = tan (2.47)
2 1−e 2
2.1. Curvas cónicas 39

Que es una importante relación en mecánica celeste.


Igualmente, siguiendo un procedimiento similar al anterior, pero en el caso de
la hipérbola se puede mostrar que es posible definir una anomalía excéntrica F tal
que :

x = a cosh F (2.48)
y = a sinh F (2.49)
(2.50)

En términos de la anomalía excéntrica la ecuación de la hipérbola se puede


escribir como:

R
r = a(e cosh F − 1) (2.51)

Y la relación entre la anomalía verdadera f y la anomalía excéntrica F resulta


ser :

O
r
f e+1 E
tan = tanh (2.52)
2 e−1 2
D
2.1.4 Cónicas en el espacio
A
Hasta ahora hemos descrito la cónica en un sistema de referencia en el que sus
ecuaciones, tanto en coordenadas cartesianas como en coordenadas polares, tienen
formas muy sencillas, referida al centro:
RR

x2 y2
2
± 2 =1
a b
o referida al foco:
BO

p
r= (2.53)
1 + e cos f
x = r cos f (2.54)
y = r sin f (2.55)

¿Cómo se describe en general una cónica referida a un sistema de referencia


arbitrario en el espacio de tres dimensiones?
En una sección anterior habíamos visto que es posible utilizar la descripción de
una cónica en un sistema de coordenadas en el que sus ecuaciones son simples (sis-
tema natural de la cónica) para escribir, mediante rotaciones la ecuación de la misma
cónica en un sistema de coordenadas general (sistema del observador). Extendere-
mos aquí ese resultado al espacio de tres dimensiones.
Partiendo del sistema de referencia natural de la cónica es posible orientar de
forma arbitraria la figura en el espacio realizando en total tres rotaciones. Los
ángulos en los que se realizan esas rotaciones se conocen como los ángulos de
Euler. En la figura se muestra la secuencia de rotaciones involucradas.
40 Chapter 2. Fundamentos Matemáticos y Físicos

R
O
D
A
Figure 2.8: Secuencia de rotaciones que permiten pasar del sistema natural de ejes
RR

de la cónica (ejes azules) a un sistema con una orientación arbitraria

En la figura los ejes azules corresponden a los ejes del sistema del observador
BO

mientras que los ejes rotados son los ejes naturales de la cónica.
Las rotaciones se pueden describir cualitativamente como:

1. Rotación del sistema original ( x, y, z) en un ángulo Ω alrededor del eje z,


para obtener un nuevo sistema de ejes ( x 0 , y0 , z0 )
2. Rotación del sistema ( x 0 , y0 , z0 ) en un ángulo i alrededor del eje z0 , para
obtener un nuevo sistema de ejes ( x 00 , y00 , z00 )
3. Rotación del sistema ( x 00 , y00 , z00 ) en un ángulo ω alrededor del eje z00 , para
obtener un nuevo sistema de ejes ( x 000 , y000 , z000 ).

En la figura se muestra la relación entre los ejes y los ángulos.


2.1. Curvas cónicas 41

R
O
D
A
RR

Figure 2.9: Relación entre los ejes y los ángulos de Euler que representan una
rotación general desde el sistema natural de la cónica (ejes no primados, azul) ha-
cia un sistema de referencia arbitrario (ejes triplemente primados, rojo). La flecha
verde indicada con la letra N se conoce como la línea de los nodos
BO

Esta secuencia de rotaciones puede escribirse matricialmente como:


 000   
x x
 y000  = Rz (ω ) R x (i ) Rz (Ω)  y  (2.56)
z000 z
Aquí las coordenadas ( x, y, z) son las coordenadas de cada punto de la elipse
en el sistema natural en el que es descrita por las ecuaciones simples, mientras que
( x 000 , y000 , z000 ) son las coordenadas en el sistema general rotado.
Aquí debemos recordar que la matriz de rotación alrededor, por ejemplo del eje
x, R x , en un ángulo θ y en sentido antihorario esta dada por:
 
cos θ sin θ 0
R x (θ ) =  − sin θ cos θ 0  (2.57)
0 0 1
Una expresión análoga se escribe para cualquiera de los otros ejes.
42 Chapter 2. Fundamentos Matemáticos y Físicos

La inversa de la transformación es:


   000 
x x
 y  = Rz (−Ω) R x (−i ) Ry (−ω )  y000  (2.58)
z z000
La matriz de rotación original se puede escribir explícitamente como:

x 000 cos Ω sin Ω 0


      
cos ω sin ω 0 1 0 0 x
 y000  =  − sin ω cos ω 0  0 cos i sin i   − sin Ω cos Ω 0   y 
z000 0 0 1 0 − sin i cos i 0 0 1 z
(2.59)
Realizando las multiplicaciones matriciales respectivas obtenemos:

R
x 000 cos ω cos Ω − cos i sin ω sin Ω cos ω sin Ω + cos Ω cos i sin ω
   
sin i sin ω
 y000  =  − cos Ω sin ω − sin Ω cos i cos ω − sin Ω sin ω + cos Ω cos i cos ω sin i cos ω  

O
z000 sin Ω sin i − cos Ω sin i cos i
(2.60)
Puede demostrarse que en tanto esta matriz es el resultado del producto de
D
otras matrices ortonormales, ella es en si misma ortonormal. Por tanto la inversa
es simplemente la transpuesta.
A
T 
cos ω cos Ω − cos i sin ω sin Ω cos ω sin Ω + cos Ω cos i sin ω
  
x sin i sin ω
 y  =  − cos Ω sin ω − sin Ω cos i cos ω − sin Ω sin ω + cos Ω cos i cos ω sin i cos ω  
sin Ω sin i − cos Ω sin i
RR

z cos i
(2.61)
Puede intentarlo usando este comando5 .
Usando SPICE podemos construir una matriz de rotación 3-d mediante la con-
catenación de la rutina rotate que vimos antes. Así:
BO

In [13]: Omega=30.0*GRADOS
omega=60.0*GRADOS
i=45*GRADOS

Las matrices individuales quedarían:

In [14]: RzOmega=spy.rotate(Omega,3)
Rxi=spy.rotate(i,1)
Rzomega=spy.rotate(omega,3)

La matriz de rotación resultante sería:

In [15]: R3d=spy.mxm(Rzomega,spy.mxm(Rxi,RzOmega))
R3d
5 http://www.wolframalpha.com/input/?i=%5B%5Bcos(w),sin(w),0%5D,%5B-sin(w),cos(w)

,0%5D,%5B0,0,1%5D%5D*%5B%5B1,0,0%5D,%5B0,cos(n),sin(n)%5D,%5B0,-sin(n),cos(n)%5D%
5D*%5B%5Bcos(W),sin(W),0%5D,%5B-sin(W),cos(W),0%5D,%5B0,0,1%5D%5D
2.1. Curvas cónicas 43

Out[15]: array([[ 0.12682648, 0.78033009, 0.61237244],


[-0.9267767 , -0.12682648, 0.35355339],
[ 0.35355339, -0.61237244, 0.70710678]])

SPICE tiene una rutina predefinida para calcular una matriz a partir de tres
ángulos de Euler: eul2m. Para ello conviene definir la matriz de rotación de una
rotación general en tres ejes como:

R(θ3 , θ2 , θ1 , e3 , e2 , e1 ) = Re3 (θ3 ) Re2 (θ2 ) Re1 (θ1 )

Donde e1 , e2 , e3 son índices que dan cuenta del eje alrededor del que se realiza

R
la rotación (siendo 1 el eje x, 2 el eje y y 3 el eje z). En estos términos la matriz de
rotación mencionada más arriba se puede describir como:

O
R3d = R(ω, i, Ω, 3, 1, 3)

Usando eul2m la matriz quedaría:


D
A
In [16]: R3d=spy.eul2m(omega,i,Omega,3,1,3)
R3d
RR

Out[16]: array([[ 0.12682648, 0.78033009, 0.61237244],


[-0.9267767 , -0.12682648, 0.35355339],
[ 0.35355339, -0.61237244, 0.70710678]])
BO

Que es la misma matriz calculada usando los métodos vistos anteriormente.

Elementos orbitales

Finalmente una cónica puede especificarse completamente en el espacio indicando


5 números: ( p, e, i, Ω, ω ). Si adicionalmente queremos especificar la posición de
un punto de la cónica se necesitan 6 números: ( p, e, i, Ω, ω, f ). Llamamos a este
conjunto de números, los elementos orbitales de una cónica y ellos constituyen la
manera mas común de identificar las órbitas de objetos en el Sistema Solar y más
allá.
Podemos entender mejor el rol de cada elemento órbital usando este interac-
tivo:

In [17]: i=interact(conicaEspacio,Omega=(0,360),i=(0,180),omega=(0,360),figsize=fixed((4,4))
44 Chapter 2. Fundamentos Matemáticos y Físicos

R
O
D
Una de las rutinas geométricas más útiles en la manipulación de las cónicas en
A
SPICE es aquella que pemite calcular la posición de un punto de una cónica con
una orientación arbitraria a partir de sus 6 elementos orbitales ( p, e, Ω, i, ω, f ).
La rutina que logra esto se llama conics y funciona así:
RR

In [18]: p=1
e=0.5
Omega=60*GRADOS
i=0*GRADOS
omega=30*GRADOS
BO

M=45*GRADOS

En este caso hemos usado en lugar de f un nuevo ánglo M conocido como la


anomalía media (en contraste con la anomalía verdadera f). Más adelante veremos
la manera como estos dos ángulos se conectan matemáticamente, pero por ahora
vasta con decir que cada punto de una cónica puede parametrizarse con un solo
valor de la anomalía media tal que M ∈ [0, 2π )
Los argumentos de conics son:

spy.conics([a,e,i,Omega,omega,mu,to],t)

Donde los parámetros mu, to y t son parámetros dinámicos que por ahora con-
viene asumir iguales a mu=1, to=0, t=0.
Así con los parámetros arriba definidos la posición de un punto sobre la cónica
estará dado por:

In [19]: spy.conics([p/(1+e),e,i,Omega,omega,M,0,1],0)
2.1. Curvas cónicas 45

Out[19]: array([-1.09997903, -0.26107333, 0. , -0.26907133, -0.97297068,


0. ])

conics devuelve un vecor de 6 elementos, el vector de estado, que tiene la


posición en el espacio del punto ~r : ( x, y, z) y la velocidad del punto sobre la cónica
~v : (v x , vy , vz ). La manera como esta última cantidad se obtiene será también tema

R
de discusión más adelante en el curso.
Usando conics podemos dibujar una cónica completa sin recurrir a la matriz
de rotación:

O
D
A
In [20]: p=1
RR

e=0.7
Omega=0*GRADOS
i=30*GRADOS
omega=0*GRADOS
M=45*GRADOS
BO

Ms=np.linspace(0,360*GRADOS,1000)
xs=[];ys=[];zs=[]
for n in range(len(Ms)):
vecx=spy.conics([p/(1+e),e,i,Omega,omega,Ms[n],0,1],0)
xs+=[vecx[0]]
ys+=[vecx[1]]
zs+=[vecx[2]]

fig=plt.figure(figsize=(4,4))
ax=fig.add_subplot(111,projection='3d')

ax.plot(xs,ys,zs,'ko',ms=2)

vmax=p/(1-e)
#Decoración
xl=ax.set_xlim((-vmax,vmax))
yl=ax.set_ylim((-vmax,vmax))
zl=ax.set_zlim((-vmax,vmax))
46 Chapter 2. Fundamentos Matemáticos y Físicos

R
O
D
A
2.2 Mecánica Newtoniana
En 1687 Isaac Newton publica la que es considerada una de las más grandes obras
RR

maestras del intelecto humano, los Philosophiæ Naturalis Principia Mathematica. Los
Principia (como se los denomina generalmente) son un conjunto de libros que bus-
can desarrollar una teoría matemática y física que de cuenta del movimiento de
los cuerpos celestes. Como parte de esta construcción teórica, Newton se ve obli-
gado a formular leyes generales que rigen el movimiento de todos los cuerpos en
el Universo.
BO

Si bien la obra de Newton fue la semilla de los desarrollos futuros de la física


del movimiento y la gravedad, así como la base de todas las obras futuras de
mecánica celeste, la forma que hoy conocemos de sus teorías, fueron completadas
y enriquecidas por autores posteriores, incluyendo Leonhard Euler, Lagrange y
Laplace. En la próxima secciones presentamos una síntesis moderna de la física
del movimiento que comenzó en los Principia y que esta actualmente en la base de
la descripción física y matemática del movimiento de los cuerpos celestes.

2.2.1 Cinemática
La descripción del movimiento y las interacciones que lo afectan, requiere la defini-
ción de propiedades básicas.
Reconocemos dos tipos de propiedades del movimiento básicas: propiedades
cinemáticas y propiedades dinámicas. La definición de las propiedades y sus rela-
ciones, presentadas abajo utilizan las siguientes convenciones para los sistemas de
coordenadas:
2.2. Mecánica Newtoniana 47

R
O
D
A
RR

En esta página interactiva6 encontrará una visualización de los sistemas de co-


BO

ordenadas.

2.2.2 Propiedades cinemáticas


Las propiedades cinemáticas son aquellas que son requeridas para describir el
movimiento tal y como ocurre, independiente de sus causas.

• Tiempo, t: Un número real que indica el intervalo transcurrido desde un


momento de referencia.
• Posición, ~r:
– Coordenadas cartesianas: ~r = x â x + y ây + z âz .
– Coordenadas cilíndricas: ~r = ρ âρ + z âz .
– Coordenadas esféricas: ~r = r âr .
• Velocidad ~v:
6 http://dynref.engr.illinois.edu/rvs.html
48 Chapter 2. Fundamentos Matemáticos y Físicos

– ˙
Definición general: ~v ≡ d~r/dt = ~r.
– Coordenadas cartesianas: ~v = ẋ â x + ẏ ây + ż âz .
– Coordenadas cilíndricas: ~v = ρ̇ âρ + ρθ̇ âθ + ż âz .
– Coordenadas esféricas: ~v = ṙ âr + r θ̇ cos φ âθ + r φ̇ âφ
• Aceleración ~a:
– Definición general: ~a ≡ d~v/dt = ~v˙ = d2~r/dt2 = r̈.
– Coordenadas cartesianas: ~a = ẍ â x + ÿ ây + z̈ âz .
– Coordenadas cilíndricas: ~a = (r̈ − r θ̇ 2 ) âr + (r θ̈ + 2ṙ θ̇ ) âθ + z̈ âz .
– Coordenadas esféricas: ~a = (r̈ − r θ̇ 2 cos2 φ − r φ̇2 ) âr + (2ṙ θ̇ cos φ +
r θ̈ cos φ − 2r θ̇ φ̇ sin φ) âθ + (2ṙ φ̇ + r φ̇2 sin φ cos φ + r φ̈) âφ
• Tirón y otras: Es posible definir propiedades que correspondan a derivadas
superiores de la posición. Así por ejemplo el tirón d~a/dt. Sin embargo, como

R
veremos para la mayoría de las fuerzas consideradas en este texto (y en mu-
chos problemas de física), las derivadas superiores de la aceleración no son
cantidades cinemáticas independientes, sino que pueden escribirse en térmi-

O
nos de las cantidades definidas anteriormente.
Una deducción detallada de las expresiones para ~v y ~a en los sistemas de coor-
denas cilíndrico y esférico esta disponible en estas documento en línea7 .
D
NOTAS: 1. En coordenadas cilíndricas en ocasiones la coordenada radial ρ es
denotada como r.
A
2. La convención para el nombre de los ángulos en mecánica celeste es distinta
de aquella usada en el cálculo vectorial donde normalmente el ángulo θ rep-
resenta el ángulo polar y φ el ángulo azimulat. Aquí, θ corresponde al ángulo
RR

azimutal y φ es el complemento del ángulo polar.

La ecuación de movimiento

Es interesante comentar que una vez especificados valores iniciales t, ~r0 y ~v0 , el
movimiento de un cuerpo puede determinarse en cualquier instante del futuro, si
BO

se provee además la función de aceleración ~a(t). Esto se consigue integrando la


ecuación diferencial:

~r¨ = ~a(t)
que tiene condiciones iniciales ~r (0) = r0 , ~r˙ (t = 0) = ~v0 . A esta ecuación se la
conoce como la ecuación de movimiento (EoM) del sistema.
Esta es una ecuación diferencial vectorial de segundo orden, una forma muy
sofisticada y compacta de expresar las relaciones entre las cantidades cinemáticas
básicas. Es posible también expresar esta ecuación diferencial, como dos ecua-
ciones diferenciales vectoriales de primer orden:

~r˙ = ~v (2.62)
~v˙ = ~a(t) (2.63)
7 https://ocw.mit.edu/courses/aeronautics-and-astronautics/

16-07-dynamics-fall-2009/lecture-notes/MIT16_07F09_Lec05.pdf
2.2. Mecánica Newtoniana 49

En esta última ecuación las funciones a encontrar son ~r (t) y ~v(t) y como vemos
las ecuaciones que las describen están acopladas. En términos de sus componentes
cartesianas estas ecuaciones se pueden escribir en la forma más explícita posible:

ẋ = v x (2.64)
ẏ = vy (2.65)
ż = vz (2.66)
v˙x = a x (t) (2.67)
v˙y = ay (t) (2.68)
v˙z = az (t) (2.69)
(2.70)

R
Una descomposición similar a la anterior puede hacerse si se quiere expresar o
se conocen las componentes de la aceleración en coordenadas cilíndricas o carte-

O
sianas.

Integración numérica de las ecuaciones de movimiento


D
En muchos apartes de este libro estaremos resolviendo la ecuación de movimiento
de diferentes sistemas en mecánica celeste. En algunos casos será posible resolverla
analíticamente, en otros solo será posible encontrar una solución numérica al prob-
A
lema. En este último caso nos valdremos de las herramientas provistas con el mó-
dulo scipy de python. Abajo mostramos un ejemplo de como usar por ejemplo la
rutina odeint para encontrar la solución a una ecuación de movimiento arbitraria.
RR

Para comenzar es necesario expresar la ecuación de movimiento en términos


generales como:

{ẏi = f i (t, {yi }i=1,N )}i=1,N


En lo sucesivo las cantidades encerradas en llaves, {}, representarán conjun-
BO

tos. Así {yi }i=1,N representa el conjunto de todas las variables dependientes del
sistema (ejemplo, x, y, z, v x , vy , vz ). Para abreviar evitaremos indicar explícita-
mente el rango de valores de i y nos reduciremos a indicar el número de valores.
En esta notación:

{ẏi = f i (t, {yi } N )} N


La anterior ecuación representa un conjunto de N ecuaciones diferenciales de
primer orden que describen la evolución de N variables dependientes yi . Es posi-
ble mostrar que toda ecuación diferencial de orden superior puede expresarse de
forma general en esta forma.
Considerese por ejemplo el caso de un movimiento oscilatorio simple para el
cual ~a(t) = −(k/m) x (t)~a x . Donde k y m son constantes positivas.
La ecuación de movimiento de ese sistema será:

ẍ = −(k/m) x
50 Chapter 2. Fundamentos Matemáticos y Físicos

Que puede escribirse en términos de ecuaciones diferenciales de primer orden


como:

ẋ = v x (2.71)
v̇ x = −(k/m) x (2.72)

En términos de la notación general introducida antes, podemos hacer las sigu-


ientes identificaciones:

y1 = x (2.73)
y2 = v x (2.74)

R
f 1 (t, y1 , y2 ) = y2 (2.75)
f 2 (t, y1 , y2 ) = −(k/m)y1 (2.76)
(2.77)

O
Esto permite escribir de forma general en python el sistem de ecuaciones difer-
enciales como: D
In [22]: def EoM(y,t,k,m):
dydt=[0,0]
dydt[0]=y[1]
A
dydt[1]=-(k/m)*y[0]
return dydt
RR

Las condiciones iniciales pueden ser:

In [23]: y=[1.0,0.0]
Nt=1000
ts=np.linspace(0,100.0,Nt)

La integración de la ecuación de movimiento se realiza con el comando:


BO

In [24]: k=1.0
m=1.0
solucion=odeint(EoM,y,ts,args=(k,m))

El vector solucion que devuelve la rutina odeint es una matriz cuyas colum-
nas representan cada una de las variables del problema y las filas el valor de esas
variables en cada uno de los tiempos definidos en el vector ts. Por ejemplo los
primeros 10 valores de la solución son:

In [25]: solucion[:10]

Out[25]: array([[ 1. , 0. ],
[ 0.99499417, -0.099933 ],
[ 0.98002679, -0.19886552],
[ 0.9552477 , -0.29580707],
[ 0.920905 , -0.38978709],
2.2. Mecánica Newtoniana 51

[ 0.87734249, -0.47986469],
[ 0.82499634, -0.56513805],
[ 0.76439061, -0.64475343],
[ 0.69613204, -0.71791376],
[ 0.62090404, -0.78388658]])

Un gráfico de la posición x y la velocidad v x como función del tiempo sería:

In [26]: fig,axs=plt.subplots(2,1)
axs[0].plot(ts,solucion[:,0],'k-')
axs[1].plot(ts,solucion[:,0],'k-')

R
Out[26]: [<matplotlib.lines.Line2D at 0x125d6dcc0>]

O
D
A
RR
BO

También se puede representar la evolución de la velocidad como función de la


posición (diagrama de fase) usando:

In [27]: fig,axs=plt.subplots(1,1)
axs.plot(solucion[:,0],solucion[:,1],'k-')

Out[27]: [<matplotlib.lines.Line2D at 0x10e1cfdd8>]


52 Chapter 2. Fundamentos Matemáticos y Físicos

R
O
D
O combinar las propiedades para obtener una cantidad nuevas:

In [28]: xs=solucion[:,0]
A
vs=solucion[:,1]
Es=0.5*m*vs**2+0.5*k*xs**2
RR

fig,axs=plt.subplots(1,1)
axs.plot(ts,Es,'k-')

Out[28]: [<matplotlib.lines.Line2D at 0x125c26470>]


BO
2.2. Mecánica Newtoniana 53

Usando la solución a las ecuaciones de movimiento de un sistema dinámico


como el anterior podemos construir una animación que nos muestre el movimiento
del cuerpo. Para ello nos valdremos del siguiente snippet
Extraemos las variables de la solución:

In [29]: xs=solucion[:,0]
vs=solucion[:,1]

Preparamos el escenario en el que se realizará la simulación:

In [30]: fig,axs=plt.subplots(1,1)
axs.plot(xs,vs,'k-')

R
particula,=axs.plot(xs[0],vs[0],'ro',ms=10)

O
D
A
RR
BO

Creamos una función que permita actualizar la posición de la partícula de


acuerdo al tiempo que será representado por una variable entera i:

In [31]: def animacion(i):


x=xs[i]
v=vs[i]
particula.set_data(x,v)
return particula,

Ejecutamos la animación. Nótese que para ejecutar la animación en Jupyter es


necesario que el comando de creación de la figura y el comando de animación
deben estar en la misma celda, de modo que se repite los comandos que ya
habíamos ejecutado antes:
54 Chapter 2. Fundamentos Matemáticos y Físicos

In [32]: fig,axs=plt.subplots(1,1)
axs.plot(xs,vs,'k-')
particula,=axs.plot(xs[0],vs[0],'ro',ms=10)
animation.FuncAnimation(fig,animacion,frames=Nt,interval=50,blit=True,repeat=True)

Out[32]: <matplotlib.animation.FuncAnimation at 0x125db0d30>

R
O
D
A
RR

Las animaciones pueden ser ricas en detalles. Por ejemplo en la animación


arriba se podría incluir texto o cambiar el tamaño del disco:
BO

In [33]: fig,axs=plt.subplots(1,1)
axs.plot(xs,vs,'k-')
texto=axs.text(0,0,"t = 0")
particula,=axs.plot(xs[0],vs[0],'ro',ms=10)

def animacion(i):
x=xs[i]
v=vs[i]
t=ts[i]
particula.set_data(x,v)
particula.set_markersize(20*np.abs(v))
texto.set_text("t = %g"%t)
return particula,

animation.FuncAnimation(fig,animacion,frames=Nt,interval=50,blit=True,repeat=True)

Out[33]: <matplotlib.animation.FuncAnimation at 0x125c0d358>


2.2. Mecánica Newtoniana 55

R
O
D
Se pueden hacer muchas cosas usando las rutinas de Matplotlib para que la
animación tenga la apariencia y funcionalidad deseada. Para ello se recomienda el
tutorial de artista8 de Matplotlib.
A
2.2.3 Dinámica
RR

Las propiedades dinámicas son aquellas que son requeridas para describir la
relación entre las causas del movimiento y su descripción. Las más importantes
cantidades dinámicas son:

• Masa, m. Escalar que mide (en el contexto de la mecánicaR Newtoniana): (1)


BO

la cantidad de materia contenida en un cuerpo, m = ρdV donde ρ es la


densidad y la integral se realiza sobre el volumen del cuerpo, (2) la inercia o
resistencia del cuerpo a moverse y (3) la intensidad de la atracción gravita-
cional que experimenta de otros cuerpos.

• Momentum lineal, p:

– Definción: ~p ≡ m~v = m~r˙


– Patrón: [ p] =M L T−1 .

• Momentum angular, L:

– Definción: ~L ≡ ~r × ~p
– Una propiedad: ~L = m~r ×~r˙
– Patrón: [ L] =M L2 T−1 .
8 https://matplotlib.org/users/artists.html
56 Chapter 2. Fundamentos Matemáticos y Físicos

• Fuerza, F:
– Definción: ~F ≡ d~p/dt
– Una propiedad: Si la masa es contante, ~F = m~r¨
– Patrón: [ F ] =M L T−2 .
– Unidad del Sistema Internacional (SI): kg m s−2 ≡ N (Newton)
• Momento de fuerza o torca, τ:
– Definción: ~τ ≡ ~r × ~F
– Una propiedad: Si la masa es constante: ~τ = d~L/dt
– Patrón: [τ ] =M L2 T−2 .
• Energía cinética o vis viva, K o T:

R
– Definción: K ≡ m~v2 /2 = m~r˙ 2 /2 = mv2 /2
– Patrón: [K ] =M L2 T−2 .
– Unidad del Sistema Internacional: kg m2 s−2 ≡ J (Joule)

O
• Trabajo, W:
R ~r
1
D
– Definición: W = ~r 2 F (~r ) · d~r, donde para hacer la integral hay que
especificar la trayectoria ~r (t) sobre la que se mueve la partícula.
– Teorema del trabajo y la energía: Si m es constante,
A
W = ∆K = mv22 /2 − mv21 /2
– Patrón: [W ] =M L2 T−2 .
RR

2.2.4 Partículas y fuerzas


Aquí es importante hacer claridad sobre dos conceptos que son centrales a la
Mecánica. El concepto de partícula y el concepto de fuerza.
Entenderemos por partícula a una entidad material de tamaño insignificante,
sin estructura o volumen. Este tipo de entidad ideal es conocido como partícula
BO

puntual y muchos de las afirmaciones que haremos en lo sucesivo sobre el


movimiento se referiran estrictamente a este tipo de partículas. Normalmente a
las partículas se las representa como una esfera de tamaño visible. No significa
esto sin embargo que se asuma para ellas una forma o volumen no nulo.
El concepto de fuerza es uno de los más esquivos de la Física. En los Principia
Newton reconoce una interesante diversidad de Fuerzas cuya naturaleza postula
a priori. Muchos años de investigación teórica y experimental permiten reconocer,
en el contexto de la mecánica newtoniana, tres tipos básicos de fuerza:
• Fuerzas de contacto: Fuerzas que resultan de la interacción por contacto de
una partícula con otras partículas (ej. fuerzas en choques) o con fronteras
materiales (ej. fuerza de fricción).
• Fuerzas de campo o a distancia: Fuerzas que resultan de la interacción de las
partículas con un campo (por ejemplo campo gravitacional o campos electro-
magnéticos de todo tipo). No requieren contacto con otras partículas o con
fronteras materiales.
2.2. Mecánica Newtoniana 57

• Fuerzas ficticias: Fuerzas que resultan de estudiar la dinámica en sistema


de referencia acelerados. Se las llama fuerzas ficticias porque no son ni de
contacto, ni de campo, que son normalmente asumidas como el producto de
interacciones materiales reales.

Aunque hoy sabemos que a nivel microscópico las fuerzas de contacto son re-
alidad fuerzas de campo entre las partículas que constituyen los cuerpos, en el
contexto del concepto idealizado de partículas, la existencia de los átomos es irrel-
evante y es por ello que hacemos esta distinción.
En general la existencia de una fuerza se ve reflejada en el cambio en el mo-
mentum lineal de un cuerpo. Siempre que exista un cambio tal, sabemos que hay
una fuerza involucrada, sea esta una fuerza real o una fuerza ficticia.
### Fuerzas conservativas y no conservativas
Una clasificación adicional de las fuerzas se puede hacer con base en una

R
propiedad matemática relacionada con el trabajo. De acuerdo a esta propiedad
las fuerzas se clasifican en:

O
• Fuerzas conservativas: Una fuerza es conservativa si el trabajo realizado por
ella entre dos puntos arbitrarios del espacio es independiente de la trayecto-
ria específica que sigan. Como consecuencia de esta propiedad si se calcula el
D
trabajo de una fuerza conservativa a través de una trayectoria cerrada, este
solo podrá ser identicamente cero. Es decir la partícula no se ve modificada
por la fuerza si vuelve a su posición inicial.
A
• Fuerzas no conservativas o disipativas: Una fuerza es no conservativa si el
trabajo realizado por ella entre dos puntos arbitrarios del espacio es dependi-
ente de la trayectoria específica que sigan. En este caso el trabajo realizado
RR

para ir y volver al mismo punto es distinto de cero. Decimos que a lo largo de


una trayectoria cerrada la partícula si se modifica y de allí viene el término
de no conservativo.

La propiedad matemática fundamental de las fuerzas conservativas se escribe


BO

en la forma:
I
~F (~r ) · d~r = 0

por el teorema de Stokes, esta propiedad implica que

∇ × ~F = 0
A su vez por identidades vectoriales, está última relación a su vez implica que
la fuerza se puede escribir como el gradiente de un campo escalar:

~F = −∇U

Donde a U se la llama en matemáticas la función potencial y en el contexto de la


mecánica, la energía potencial. El signo menos es una convención usada exclusiva-
mente en mecánica.
Con esta definición el trabajo realizado por una fuerza conservativa será
58 Chapter 2. Fundamentos Matemáticos y Físicos

Z Z
~F (~r )d~r = − ∇U · d~r = −[U (~r2 ) − U (~r1 )]

Donde hemos usado la definción de la derivada direccional

d~r
dU/dt = ∇U ·
dt
En términos de la energía potencial U, el teorema del trabajo y la energía se
escribe:

−∆U = ∆K
Lo que nos permite definir:

R
Energía mecánica asociada a una fuerza conservativa. Cuando una
partícula esta sometida a una fuerza conservativa F = −∇U, la canti-
dad E = K + U es constante a lo largo de la trayectoria de la partícula.

O
De aquí se deriva un teorema general:
D
Conervación de la Energía. Si una partícula esta sometida a fuerzas
conservativas y no conservativas, a lo largo de una trayectoria el trabajo
realizado por las fuerzas no conservativas WNC satisface:
A
W = ∆E
RR

Donde E = K + ∑ Ui , siendo Ui la energía potencial asociada a la fuerza


conservativa i-esima.

2.2.5 Leyes de Newton


Si bien clásicamente se reconocen tres postulados como las leyes fundamentales
BO

del movimiento en el contexto de la mecánica Newtoniana (las tres leyes de New-


ton), un análisis más detenido de la teoría permite reformularla de formas diversas,
algunas inclusive más económicas o consistentes internamente.
En la formulación que usaremos aquí solo hay dos postulado fundamentales
que deben aceptarse a priori: la ley de acción y reacción y la ley de gravitación
universal.
¿Qué hay entonces de la ley de inercia? La ley de inercia esta intrínsicamente
ligada a la definición de fuerza o mejor a su identificación con el cambio instantá-
neo del momentum lineal.
### ¿Ley de inercia?
Por la definición de fuerza ~F = d~p/dt vemos que una partícula para la cuál
~F = ~0 (donde en lo sucesivo ~0 es una notación para un vector nulo), es decir sobre
la cuál la suma de todas las fuerzas reales es cero, tendrá ~p constante y por lo tanto
su movimiento se realizará con rapidez y dirección constante (línea recta). Esta
idea (que es conocida clásicamente como la ley de inercia) no parece un postulado,
sino una consecuencia lógica de la definición misma de fuerza.
2.2. Mecánica Newtoniana 59

El problema radica en que el resultado descrito arriba no es sin embargo cierto


en todos los sistemas de referencia desde los que se describe el movimiento de las
partículas.
En particular si quién describe el movimiento, se mueve él mismo con acel-
eración distinta de cero, el movimiento de una partícula sobre la que la fuerza real
neta es cero, no ocurrirá en línea recta.
Considerese por ejemplo el caso en el que se describe el movimiento de una
mariposa atrapada en el vagón del metro. Si en un momento dado la suma de
todas las fuerzas reales sobre la mariposa es cero, y la mariposa en ese mismo in-
stante esta en reposo, la definición de fuerza indica que la posición de la mariposa
debería mantenerse constante. Sin embargo cuando el vagón acelera, desde aden-
tro, medimos una velocidad para la mariposa que cambia constantemente con el
tiempo, sin que haya cambiado la condición de que no actúa sobre ella ninguna
fuerza real neta.

R
Esta salvedad nos lleva a formular el siguiente postulado:

O
Sistema de referencia inercial. Si desde un sistema de referencia, la
suma de fuerzas reales sobre una partícula es cero y su movimiento
D
ocurre con velocidad constante, decimos que el sistema de referencia
es inercial.
A
Las reglas del movimiento y sus cantidades asociadas que describiremos ar-
riba no dependen si el mismo movimiento se describe en un sistema de referencia
RR

inercial o no. En el caso de sistemas de referencia no inerciales basta con incluir


las fuerzas ficticias. Es natural, sin embargo, que la descripción será mucho más
simple si se hace desde un sistema de referencia inercial.
BO

2.2.6 La ley de acción y reacción

La ley de acción y reacción que se formula en dos formas:

• Forma débil de la ley de acción y reacción. Si una partícula realiza una


fuerza sobre otra (de contacto o de campo), la segunda ejercerá sobre la
primera una fuerza de magnitud y dirección igual pero de sentido contrario
(ver imagen).

• Forma fuerte de la ley de acción y reacción. La forma débil de la ley de


acción y reacción es válida, pero además las fuerzas actúan sobre la línea que
une las posiciones de las partículas (fuerzass centrales).
60 Chapter 2. Fundamentos Matemáticos y Físicos

Figure 2.10: Las dos formas de la ley de acción y reacción

R
2.2.7 La ley de gravitación universal
Una de las más atrevidas y visionarias propuestas de Newton sobre la naturaleza

O
del movimiento de los cuerpos, tanto terrestres como celestes se conoce como la
ley de gravitación universal y establece que:
D
Ley de gravitación universal. Una partícula de masa m1 situada en ~r1
ejerce sobre cualquier otra partícula de masa m2 situada en un ~r2 , una
fuerza de campo dada por la relación matemática:
A
G Gm1 m2
F12 =− r̂
RR

r2

donde ~r ≡ ~r2 −~r1 y G = 6.67408(31) × 10−11 kg m3 /s2 = (6.67408 ±


0.00031) × 10−11 kg m3 /s2 es una constante de la naturaleza conocida
como la constante de gravitación universal o constante de Cavendish.
BO

Como puede verse de la relación matemática que define ~F G , la fuerza satisface


la ley de acción y reacción en su forma fuerte.
Es posible demostrar que la Fuerza gravitacional que produce una partícula de
masa M sobre otra partícula de masa m, es conservativa y tiene energía potencial:

GMm
U=−
r
Dado que la energía potencial de cualquier otra partícula sometida a la fuerza
de M tiene la misma energía potencial es común escribir U en la forma:

U = mV

Donde V se conoce como el potencial gravitacional y esta dado por:

GM
V=−
r
2.2. Mecánica Newtoniana 61

2.2.8 Masa y principio de equivalencia


Nótese que en la formulación de la ley de gravitación universal, la fuerza de atrac-
ción depende únicamente de la masa del cuerpo y no de su composición lo que es
un hecho importante de resaltar en esta ley: el fenómeno gravitacional es indepen-
diente de la composición de los cuerpos que afecta.
Ahora bien, esta masa que aparece en la ley de gravitación no necesariamente
coincide con la masa que usamos en la definición de las propiedades dinámicas
al principio. Para esto es bueno hacer la distinción entre la masa inercial, mi , que
aparece por ejemplo en la definición de la fuerza ~F = mi~r¨ y la masa gravitacional
m g que aparece en la ley de gravitación universal F G = −( Gm g Mg /r2 )r̂.
Si usamos la definición de fuerza y la expresión de la fuerza gravitacional,
podemos obtener el siguiente resultado para la aceleración sufrida por la masa
m g cuando actúa sobre ella la fuerza gravitacional de la partícula Mg :

R
mg
~a = ~g
mi

O
Donde ~g = −( GMg /r2 )r̂ es una cantidad independiente de la partícula estudi-
ada.
La razón m g /mi ha sido medida cuidadosamente en el laboratorio desde fi-
D
nales del siglo xvii con un resultado ampliamente conocido: el valor de la masa
gravitacional coincide con el valor de la masa inercial en una parte en 1017 , lo que
ha llevado a formular el siguiente principio general
A
Principio de equivalencia (versión débil). La trayectoria de una
partícula puntual en un campo gravitacional depende únicamente de
su posición y velocidad inicial y es independiente de su composición y
RR

estructura.
Este principio equivale a afirmar por principio que m g = mi . Por la misma
razón en lo sucesivo usaremos un solo símbolo m para representar esta cantidad
física.
Más adelante veremos una generalización fuerte del principio de equivalencia
BO

en el contexto de la teoría general de la relatividad que ofrece una descripción más


fundamental del fenómeno gravitacional.

2.2.9 La fuerza de la Tierra y el Sol sobre la Luna


Una aplicación particular de la ley de gravitación universal, de gran interés en
Mecánica celeste, es el calculo de la fuerza entre los tres cuerpos celestes más im-
portantes en la historia de la Astronomía: la Luna, el Sol y la Tierra misma.
Si bien la ley aplica solamente para partículas puntuales, como se explico al
principio, dadas las dimensiones del Sistema Solar, podemos asumir que los tres
cuerpos son muy pequeños y estimar con las fórmulas arriba las fuerzas entre ellos.
Para hacerlo necesitamos primero definir las cantidades básicas del problema:
In [35]: G=6.67408e-11
Mtierra=5.97e24 #kg
Mluna=7.34e22 #kg
Msol=1.98e30 #kg
62 Chapter 2. Fundamentos Matemáticos y Físicos

Las distancias entre los cuerpos cambian continuamente. Vamos a asumir sin
embargo los valores promedio y para la distancia Tierra Luna estimaremos un
valor igual a la diferencia entre la distancia media Tierra-Sol:

In [36]: dsoltierra=1.496e11 #m
dtierraluna=3.84e8 #m
dsolluna=dsoltierra-dtierraluna

Las fuerzas entre ellos son por tanto:

In [37]: Fsoltierra=G*Msol*Mtierra/dsoltierra**2
print("Fuerza del Sol sobre la Tierra (N):",Fsoltierra)

Fsolluna=G*Msol*Mluna/dsolluna**2
print("Fuerza del Sol sobre la Luna (N):",Fsolluna)

R
Ftierraluna=G*Mtierra*Mluna/dtierraluna**2
print("Fuerza de la Tierra sobre la Luna (N):",Ftierraluna)

O
Fuerza del Sol sobre la Tierra (N): 3.525069974834854e+22
Fuerza del Sol sobre la Luna (N): 4.3563410318011734e+20
Fuerza de la Tierra sobre la Luna (N): 1.9833499537760423e+20
D
De manera sorprendente descubrimos que la fuerza de la Tierra sobre la Luna
A
es casi la mitad que la que ejerce el Sol sobre nuestro satélite:

In [38]: razon=Fsolluna/Ftierraluna
RR

print("El Sol ejerce sobre la Luna una fuerza %g veces mayor que la Tierra"%razon)

El Sol ejerce sobre la Luna una fuerza 2.19646 veces mayor que la Tierra

¿Cómo es posible que dada esta situación, la Luna siga orbitando la Tierra y no
BO

se escape hacia el Sol? En este curso encontraremos respuesta a esta pregunta.


El estudiante puede usar el código arriba para responder a la pregunta: ¿a qué
distancia de la Tierra debería estar la Luna para que la fuerza del planeta superará
la fuerza ejercida por el Sol?

2.2.10 Dinámica de un sistema de partículas


Imáginemos ahora un sistema de N partículas interactuantes. ¿Cómo son y cómo
evolucionan las cantidades dinámicas del sistema?
La partícula i-esima del sistema esta sometida a dos tipos de fuerzas: (1) fuerzas
externas FiE y (2) fuerzas entre partículas (2) Fji .

Notación para la fuerza. En lo sucesivo en estas notas la fuerza entre


partículas ~Fji se lee como la fuerza de la partícula j sobre la partícula i.

La evolución del sistema se obtiene mediante la solución a las ecuaciones de


movimiento:
2.2. Mecánica Newtoniana 63

( )
mi~¨ri = ~FiE + ∑ ~Fji
j N
Si sumamos todas las ecuaciones diferenciales y tenemos en cuenta que las
fuerzas entre partículas satisfacen la ley de acción y reacción (débil o fuerte), i.e.
~Fji = −~Fij :

∑ mi~¨ri = ∑ ~FiE
i i
Si introducimos la definición

~R ≡ ∑i mi~ri
M

R
donde M = ∑i mi , las ecuaciones de movimiento se convierten en una sola
ecuación que tiene la forma de la ecuación de movimiento de una sola partícula

O
sometida a una fuerza total F E = ∑i ~FiE :

M~R¨ = ~F E
D
Esto da a entender la posibilidad que incluso cuando se tiene un número muy
grande de partículas su dinámica puede describirse como la de una sola partícula
con masa M = ∑i mi , ubicada en R, con momentum lineal ~ P = M~R˙ y sometida a
A
una fuerza F .E

Llamamos a esta idealización la dinámica del Centro de Masa y la usaremos


con frecuencia.
RR

Para ilustrar numéricamente el concepto de centro de masa consideremos el


siguiente ejemplo.
Para empezar generemos masas, posiciones y velocidades de N partículas en
una caja cúbica de lado 2 m. Asumiremos que las masas están en el intervalo
[0, 100) kg y que las componentes rectangulares de la velocidad están comprendi-
das en el intervalo [−0.2, 0.2] m/s:
BO

In [39]: N=5
ms=100*np.random.rand(N)
M=ms.sum()
rs=1-2*np.random.rand(N,3)
vs=0.3*(1-2*np.random.rand(N,3))

La posición y velocidad del centro de masa será:

In [40]: R=[0,0,0]
R[0]=(ms*rs[:,0]).sum()/M
R[1]=(ms*rs[:,1]).sum()/M
R[2]=(ms*rs[:,2]).sum()/M

V=[0,0,0]
V[0]=(ms*vs[:,0]).sum()/M
V[1]=(ms*vs[:,1]).sum()/M
V[2]=(ms*vs[:,2]).sum()/M
64 Chapter 2. Fundamentos Matemáticos y Físicos

Gráficamente:
In [41]: fig=plt.figure()
ax=fig.add_subplot(111,projection='3d')

#Masas
for i in range(len(ms)):
ax.text(rs[i,0],rs[i,1],rs[i,2],'%.1f'%ms[i],fontsize=6)

#Posiciones
ax.scatter(rs[:,0],rs[:,1],rs[:,2],s=ms,c='k')
ax.scatter(R[0],R[1],R[2],marker='+',s=M,c='k')

#Velocidades
ax.quiver(rs[:,0],rs[:,1],rs[:,2],vs[:,0],vs[:,1],vs[:,2])
ax.quiver(R[0],R[1],R[2],V[0],V[1],V[2],color='r')

R
Out[41]: <mpl_toolkits.mplot3d.art3d.Line3DCollection at 0x125c570f0>

O
D
A
RR
BO

Centro de masa de un sistema de dos partículas

Una caso particular de interés en relación con la definición del centro de masa es el
de un sistema formado por solo dos partículas. En esta situación el centro de masa
es:

~R = m1~r1 + m2~r2
M
Si introducimos el vector relativo ~r = ~r2 −~r2 es posible mostrar que la posición
de cada partícula se puede escribir en términos de la posición del centro de masa
y su vector relativo como:
2.2. Mecánica Newtoniana 65

m2
~r1 = ~R − ~r (2.78)
M
m
~r2 = ~R + 1~r (2.79)
M

R
O
D
A
Figure 2.11: Relación entre las posiciones de dos partículas, su centro de masa y el
vector relativo
RR

Usando este resultado es posible calcular la posición del centro de masa en el


caso de los sistemas Sol-Tierra y Sol-Luna:

In [42]: dcm_soltierra_sol=(Mtierra/(Msol+Mtierra))*dsoltierra
print("Distancia del CM Sol-Tierra al centro del Sol (km):",dcm_soltierra_sol/1e3)
BO

dcm_soltierra_tierra=dsoltierra-dcm_soltierra_sol
print("Distancia del CM Sol-Tierra al centro de la Tierra (AU):",dcm_soltierra_tier

Distancia del CM Sol-Tierra al centro del Sol (km): 451.06530663642394


Distancia del CM Sol-Tierra al centro de la Tierra (AU): 0.9999969848575759

En el caso del sistema Tierra-Luna:

In [43]: dcm_tierraluna_tierra=(Mluna/(Mluna+Mtierra))*dtierraluna
print("Distancia del CM Tierra-Luna al centro de la Tierra (km):",dcm_tierraluna_ti

dcm_tierraluna_luna=dtierraluna-dcm_tierraluna_tierra
print("Distancia del CM Tierra-Luna al centro de la Luna (km):",dcm_tierraluna_luna

Distancia del CM Tierra-Luna al centro de la Tierra (km): 4663.864711917133


Distancia del CM Tierra-Luna al centro de la Luna (km): 379336.1352880828
66 Chapter 2. Fundamentos Matemáticos y Físicos

Teoremas de conservación

Usando las propiedades de la dinámica de un sistema de partículas podemos en-


contrar un conjunto de resultados de gran interés para entender la dinámica de
este tipo de sistemas.
Sabemos que M~R¨ = ~F E , de modo que si ~F E = ~0 entonces M~R˙ será una cantidad
constante.

Teorema de conservación del momentum lineal. Si la fuerza externa


total sobre un sistema es cero, el momentum total se conserva.

Calculemos ahora cuál es la torca total sobre el sistema:

~τ ≡ ∑~ri × FiE + ∑~ri × Fji

R
Si la ley de acción y reacción se fumple entonces ~ri × ~Fji +~r j × ~Fij = (~ri −~r j ) ×
~Fji . Si adicionalmente se cumple la versión fuerte de la ley de acción-reacción,

O
~ri −~r j = ~r j −~ri entonces:

~τ ≡ ∑~ri × FiE
D
Es decir la torca sobre un sistema de partículas interactuantes es la suma de las
torcas producidas solo por las fuerzas externas.
Si tomamos en cuenta además que por definición y para partículas cuya masa
A
es constante se cumple que ~L˙ = ~τ , en ausencia de torques externos el siguiente
resultado será cierto:
Podemos demostrar:
RR

Teorema de conservación del momentum angular. Si la torca externa


total sobre un sistema de partículas es cero, y las fuerzas entre las
partículas cumplen la ley de acción y reacción fuerte (fuerzas centrales)
el momentum angular total del sistema se conserva.
BO

Aunque este resultado es conocido no es para nada trivial. Para ilustrarlo


numéricamente tomemos el sistema de partículas considerados en el ejemplo an-
terior. Calculemos para ellas sus momentums angulares individuales:

In [44]: ls=np.array([ms[i]*np.cross(rs[i],vs[i]) for i in range(N)])


ls

Out[44]: array([[-2.79688042, -4.88410957, -0.38710241],


[-2.10366693, -1.07660915, 0.79158925],
[16.85754265, -0.81098286, 2.09691063],
[ 0.88826538, -1.69299317, 2.44957822],
[ 0.22484005, 0.20127213, -0.0171316 ]])

De aquí su momentum angular total se puede obtener sumando componente


por componente:

In [45]: L=ls.sum(axis=0)
L
2.2. Mecánica Newtoniana 67

Out[45]: array([13.07010072, -8.26342262, 4.9338441 ])

Propaguemos sus posiciones a un momento futuro (asumiendo que sobre ellas


no actúa ninguna fuerza externa o interna):
In [46]: rsf=rs+10*vs

Calculemos nuevamente sus momentos angulares individuales


In [47]: lsf=np.array([ms[i]*np.cross(rsf[i],vs[i]) for i in range(N)])
lsf

Out[47]: array([[-2.79688042, -4.88410957, -0.38710241],


[-2.10366693, -1.07660915, 0.79158925],
[16.85754265, -0.81098286, 2.09691063],
[ 0.88826538, -1.69299317, 2.44957822],

R
[ 0.22484005, 0.20127213, -0.0171316 ]])

Y su nuevo momentum angular total

O
In [48]: Lf=lsf.sum(axis=0)
Lf D
Out[48]: array([13.07010072, -8.26342262, 4.9338441 ])

Como vemos tanto los momentums angulares individuales como el total se


A
conservan a pesar de que intuitivamente las posiciones se transforman continua-
mente.
RR

2.2.11 Dinámica referida al centro de masa


Una forma especial de las ecuaciones dinámicas del sistema de partículas se ob-
tiene cuando nos localizamos en el sistema de referencia del centro de masa.
En este caso la posición y velocidad de cada partícula se escribe:
BO

~ri = ~ri0 + ~R (2.80)


~vi = ~vi0 + V~ (2.81)
(2.82)

Donde las cantidades primadas están referidas al centro de masa.


En el sistema de referencia del centro de masa el momentum angular es:

~L = ∑~ri × ~pi = ∑(~ri0 + ~R) × (~


mi vi0 + mi V
~)
i i

~L = ~R × ~P + ∑~ri0 × ~pi0
i

Teorema del momentum angular total de un sistema. El momentum


angular total de un sistema de partículas es igual a la suma del momen-
tum angular del centro de masa y la suma de los momentums angulares
de las partículas referidas al centro de masa.
68 Chapter 2. Fundamentos Matemáticos y Físicos

Podemos nuevamente verificar este resultado general con el sistema en el ejem-


plo considerado antes. Para ello calculamos primero las posiciones y velocidades
referidas al centro de masa:

In [49]: rsp=rs-R
vsp=vs-V

Ahora podemos calcular el momento total referido al centro de masa:

In [50]: Lp=np.array([ms[i]*np.cross(rsp[i],vsp[i]) for i in range(N)]).sum(axis=0)


Lp

Out[50]: array([ 1.81684484, -7.29669721, 6.23911917])

Que claramente no coincide con el momentum angular calculado antes. Debe-

R
mos a este momentum angular sumar el del centro de masa:

In [51]: LCM=M*np.cross(R,V)

O
LCM

Out[51]: array([11.25325588, -0.96672541, -1.30527507])


D
El resultado es:

In [52]: L=LCM+Lp
A
L

Out[52]: array([13.07010072, -8.26342262, 4.9338441 ])


RR

Que coincide con el momentum angular total calculado anteriormente.


De otro lado el trabajo realizado por las fuerzas cuando el sistema se mueve de
una configuración 1 a una configuración 2 será:
Z 2 Z
W= ∑ Fie · d~ri + ∑ Fji · d~ri
BO

i 1 i,j

De aquí puede probarse que el teorema del trabajo y la energía sigue siendo
válido siempre y cuando la energía mecánica se defina como:

1 1
K= MV 2 + ∑ mi vi 02
2 2
Teorema de la energía cinética total de un sistema. La energía cinética
total de un sistema de partículas es igual a la suma de la energía cinética
del centro de masa y la energía cinética de las partículas referidas al
centro de masa.

De nuevo verifiquemos esta afirmación con el ejemplo provisto antes:


Referida al sistema original la energía cinética total es:

In [53]: K=0.5*np.array([ms[i]*spy.vnorm(vs[i])**2 for i in range(N)]).sum()


K
2.2. Mecánica Newtoniana 69

Out[53]: 5.302601755279212

Usando la energía del centro de masa queda:


In [54]: Kp=0.5*np.array([ms[i]*spy.vnorm(vsp[i])**2 for i in range(N)]).sum()
KCM=0.5*M*spy.vnorm(V)**2
K=KCM+Kp
print("K referida al centro de masa:",Kp)
print("K del centro de masa:",KCM)
print("K total:",K)

K referida al centro de masa: 3.4578085804875136


K del centro de masa: 1.8447931747916986
K total: 5.302601755279213

R
2.2.12 Principios de relatividad

O
En las transformaciones entre sistemas de coordenadas definidas hasta ahora, el
tiempo se considera una variable de naturaleza absoluta, cuyo valor solo depende
del patrón de medida o del instante de referencia usado para definirlo.
D
Dado que el tiempo juega un papel fundamental en Astronomía y Mecánica
Celeste, es necesario introducir aquí una versión un poco más moderna del modo
en el que esta importante variable es considerada. Para ello deberemos intro-
A
ducir unas primeras ideas de la teoría de la relatividad, que aunque apareceran
descontextualizadas y faltas de una construcción teórica mucho más rigurosa, nos
servirán para los propósitos prácticos que perseguimos en este curso.
Una discusión profunda y desde los fundamentos de estos temas puede encon-
RR

trarse en cualquier texto de teoría de la relatividad. Recomendamos el texto muy


práctico de Relativity, Gravitation and Cosmology de Robert A. Lambourne y que
pueden encontrar entre las referencias en la plataforma virtual del curso.

El tiempo en sistemas de referencia inerciales


BO

Comencemos por señalar que independientemente de cómo sean las transforma-


ciones de coordenadas entre dos sistemas de referencia inercial, una propiedad
geométrica debe cumplirse siempre para las medidas de posición y tiempo real-
izadas en todos los sistemas inerciales, a saber el intervalo espacio-temporal ds entre
eventos:

ds2 = (c dt)2 − (d~r )2


La invariancia de esta cantidad puede probarse partiendo desde distintos prin-
cipios físicos o postularse como un principio fundamental de la naturaleza:

Principio geométrico de relatividad. El valor del intervalo ds entre


dos eventos del espacio tiempo (t,~r ) y (t + dt,~r + d~r ), medido por ob-
servador inerciales es el mismo (es invariante).

El atributo geométrico para el principio anterior, viene del hecho que la función
ds tiene las propiedades de lo que se conoce en la geometría como una métrica.
70 Chapter 2. Fundamentos Matemáticos y Físicos

Una métrica, en términos simples, define la distancia generalizada entre dos pun-
tos en un espacio geométrico o matemático abstracto.
A la métrica particular definida por la ecuación de arriba se la conoce como la
métrica de Minkowski. Es claro que la métrica de Minkowski difiere de la métrica
euclidiana convencional de un espacio Rn para la cuál la distancia entre puntos con
coordenadas xi esta dada por ds2 = dx12 + dx22 + ... + dxn2 . Esta discrepancia entre
la métrica euclidiana, que produce en la geometría clásica todas las propiedades
geométricas que conocemos, es lo que da a la relatividad de Einstein sus caracterís-
ticas más inusuales.
Consideremos ahora una situación en la que queremos medir el intervalo de
tiempo transcurrido entre dos eventos cualquiera (la duración de una erupción
solar, la duración de una supernova, el tiempo de viaje de un vehículo espacial,
etc.)
Para ello usaremos dos sistemas de referencia inerciales: (1) un sistema de ref-

R
erencia arbitrario y (2) un sistema de referencia en el que los eventos ocurren en el
mismo lugar del espacio, ie. d~r = ~o (sistema de referencia propio).
Dado que en ambos sistemas de referencia el valor del ds es el mismo, la sigu-

O
iente igualdad aplicará para las medidas del intervalo de tiempo dt y el desplaza-
miento d~r: D 1 2
dτ 2 = dt2 − d~r
c2
Donde dτ es el intervalo medido en el sistema de referencia propio (tiempo pro-
A
pio). Sabiendo que d~r = ~vt (~v es la velocidad del sistema de referencia propio
respecto al sistema de referencia arbitrario), obtenemos la siguiente relación para
el intervalo de tiempo propio y el medido en el sistema de referencia arbitrario:
RR


dt = √ = γdτ
1 − v2 /c2

Donde hemos introducido el factor de Lorentz γ = 1/ 1 − v2 /c2 ≈ 1 +
v2 /(2c2 ) + O(v3 /c3 ), que cuantifica la discrepancia entre los tiempos medidos
BO

en los dos sistemas de referencia.


Un gráfico del factor de Lorentz como función de la fracción v/c se muestra en
la figura interactiva abajo.

In [56]: vL=np.logspace(np.log10(1e-5),np.log10(1),1000)
gamma=1/np.sqrt(1-vL**2)-1

plt.plot(vL,gamma)

plt.xscale("log")
plt.yscale("log")
plt.xlim((1e-5,1e0))
plt.ylim((1e-11,1e1))

plt.xlabel(r"$v/c$")
plt.ylabel(r"$\gamma-1$")
plt.grid()
2.2. Mecánica Newtoniana 71

R
O
D
El valor de γ es para la mayoría de las velocidades comunes, i.e. v/c  1, es
muy cercano a 1 (γ − 1 ≈ 0). Así por ejemplo, en el caso de un sistema de referencia
A
unido a la Tierra, v = 30 km/s (sistema propio de la Tierra) y otro unido al Sol, el
valor de la velocidad será v/c = 10−4 y γ − 1 ∼ 10−8 .
Esto implica que por cada segundo propio que pase en el sistema de referencia
RR

de la Tierra pasarán 10 nanosegundos más en el sistema de referencia del Sol. Los


relojes de la Tierra se atrasan respecto a los del Sol. A este efecto se lo llama en
física dilatación del tiempo.

Dilatación del tiempo para fenómenos acelerados


BO

¿Qué sucede si queremos estudiar ahora un fenómeno que no se mueve con ve-
locidad constante?.
En este caso no podemos encontrar un observador inercial que se mueva a la
misma velocidad constante que el fenómeno. Para resolver este problema A. Ein-
stein introdujo implícitamente en 1905 en su teoría de la relatividad el denominado
postulado de los relojes que establece que:
Postulado de los relojes. Si un fenómeno se mueve con velocidad vari-
able ~v(t) con respecto a un observador inercial y respecto a este ob-
servador tiene una duración ∆t, la duración propia del fenómeno ∆τ
se puede obtener sumando la duración propia de porciones infinites-
imales del movimiento tal y como son medidas por observadores in-
erciales que se mueven a la velocidad instantánea v(t) del fenómeno.
Matemáticamente:

Z ∆t q
∆τ = 1 − v(t)2 /c2 dt
0
72 Chapter 2. Fundamentos Matemáticos y Físicos

¿Qué aplicaciones pueden tener estos resultados en Mecánica Celeste?. Hasta


hace unas décadas la precisión con la que se podían conocer las variables cinemáti-
cas de los sistemas gravitacionales en Astronomía no era muy grande. Con el
advenimiento de la exploración espacial esto cambio significativamente cuando
pudimos medir con precisiones increíbles (en la mayoría de los casos precisiones
relativas del orden de 10−7 − 10−8 ) la posición de los cuerpos. Estos desarrollos
además vinieron acompañados de la necesidad de diseñar y volar misiones espa-
ciales que requieren la medida muy precisa de tiempos y posiciones con el fin, por
ejemplo de programar maniobras en los vehículos.
A este hecho debe sumarse los avances recientes en la capacidad para simu-
lar con un gran nivel de detalle la evolución dinámica de sistemas gravitacionales
(exoplanetas, sistemas binarios). Siendo estos sistemas normalmente caóticos y
complejos, se ha hecho necesario por no decir obligatorio tener en cuenta los efec-
tos sobre las diferencias de tiempo medidos en distintos sistemas de referencia a la

R
hora de describir la evolución de estos sistemas.
Imagine por ejemplo esta situación hipotética. En una misión espacial se debe

O
conocer el tiempo en el que se debe producir una maniobra. Los controladores en
Tierra pueden determinar ese tiempo t en su sistema de referencia, sin embargo el
tiempo τ medido en la nave será distinto por las consideraciones anteriores. Si a
la nave se la instruye para que realice la maniobra en el tiempo t de la Tierra esta
D
podría ocurrir más tarde de lo necesario para que la maniobra sea exitosa.
En la próxima sesión pondremos en práctica estas ideas cuando aprnedamos a
calcular, al menos numéricamente, la posición y velocidad de cuerpos del sistema
A
Solar y vehículos espaciales.

El tiempo en sistemas de referencia no inerciales


RR

Uno de los descubrimientos más asombrosos de la denominada teoría general de


la relatividad que fue desarrollada por Albert Einstein entre 1907 y 1915 con el
propósito original de extender los resultados anteriores para incluir sistemas de
referencia no inerciales (el postulado de los relojes fue la cuota inicial), fue des-
cubrir que los efectos en el espacio-tiempo producidos por la aceleración, eran in-
BO

distinguibles a los producidos por el fenómeno gravitacional (que se consideraba


de naturaleza enteramente diferente).
Esta relación quedo formulada en uno de los principios físicos más importantes
de la mecánica moderna:

Principio de equivalencia fuerte. Un sistema de referencia en caída


libre en un campo gravitacional, independientemente de su ubicación,
es localmente inercial.

Con la formulación de este principio, Einstein consiguió reducir la descrip-


ción de la gravedad a un procedimiento geométrico. Según la teoría del científico
Alemán para predecir el comportamiento de los cuerpos en un sistema de referen-
cia en reposo en un campo gravitacional se parte del comportamiento predicho por
las leyes mecánicas en sistemas inerciales y se aplica a ellas simplemente transfor-
maciones geométricas. El resultado de estas transformaciones se manifiesta como
el fenómeno gravitacional que en el pasado se consideraba fundamental. En el
2.2. Mecánica Newtoniana 73

marco de la Teoría general de la Relatividad la gravedad es simplemente una man-


ifestación de las propiedades del espacio-tiempo.
En el corazón de la Teoría General de la Relatividad esta la idea de que en
presencia de un cuerpo masivo la métrica no es la métrica de Minkowski (que
aplica en lugares vacíos muy lejos de los cuerpos astronómicos), sino que tiene
una forma más general del tipo:

ds2 = gtt (cdt)2 − ∑ gij2 dxi dx j


i

Donde dxi son los intervalos medidos en cada una de las tres coordenadas
del espacio (x,y,z) y los coeficientes métricos gtt y gij dependen de la intensidad y
propiedades del campo gravitacional (determinadas a su vez por la distribución y
densidad de materia) y de la ubicación dentro del campo en el que se encuentre el

R
cuerpo.
Es importante anotar aquí que las coordenadas t y ~r que aparecen en esta
ecuación son las coordenadas medidas por un observador que se encuentra en

O
un lugar muy lejano en el que el campo gravitacional es despreciable.
Un caso de particular interés en mecánica celeste es el del campo gravitacional
producido por una partícula puntual de masa M (o equivalentemente el producido
por una distribución de materia esféricamente simétrica) que no rota (o lo hace
D
muy lentamente). En esta situación, puede probarse que el intervalo viene dado
por la denominada métrica de Schwarzschild:
A
    −1
2 2GM 2 2GM
ds = 1− 2 (cdt) − 1 − 2 dr2 − r2 (dφ2 + cos2 φdθ 2 )
c r c r
RR

Donde hemos usado la convención para las coordenadas esféricas en mecánica


celeste (θ es la “longitud” y φ la “latitud”)
Es posible escribir el intervalo en términos del potencial gravitacional clásico
V = − GM/r como:
BO

    −1
2 2V 2 2V
ds = 1+ 2 (cdt) − 1 + 2 dr2 − r2 (dφ2 + cos2 φdθ 2 )
c c
Una serie de interesantes consecuencias para la medida del tiempo, se derivan
de esta métrica.
Si comparamos por ejemplo el intervalo de un fenómeno medido en reposo en
elobtenemos la relación:
r
2V
dτ = 1 + 2 dt
c
O equivalentemente:


dt = √ = Σdτ
1 + 2V/c2

Donde introducimos el factor de Schwarzschild, Σ = 1/ 1 + 2V/c2 = 1 −
V/c2 + O(V 2 /c4 ), que tiene una clara analogía con el factor de Lorentz gamma.
74 Chapter 2. Fundamentos Matemáticos y Físicos

En la figura abajo se muestra un gráfico del factor de Schwarzschild calculado


en las vecindades de la Tierra:

In [57]: G=6.67308e-11 #m^3/(kg m^2), Constante de gravitacion universal


M=5.97e24 #kg, Masa de la Tierra
R=6.471e6 #m, Radio de la Tierra
c=3e8 #m/s, Velocidad de la luz

rs=np.linspace(R,10*R,1000)
Vs=-G*M/rs
Sigmas=1/np.sqrt(1+2*Vs/c**2)

fig=plt.figure()
plt.plot(rs/R,Sigmas-1)

R
plt.xlabel(r"$r/R$")
plt.ylabel(r"$\Sigma-1$")

O
plt.xlim((1,rs.max()/R))
plt.grid()
D
A
RR
BO

Ahora podemos comparar la duración de un fenómeno tal y como es medida


por observadores a dos distancias diferentes r1 y r2 del centro de un cuerpo de
masa M.
Supongamos que la duración del evento observada a una gran distancia es dt.
Sabemos entonces para los dos observadores la duración del evento será:
2.2. Mecánica Newtoniana 75

dt
dτ1 = (2.83)
Σ (r1 )
dt
dτ2 = (2.84)
Σ (r2 )
De allí los tiempos medidos por los dos observadores se relacionarán como:

Σ (r2 )
p
1 + 2V (r1 )/c2
dτ1 = dτ2 = dτ2 p
Σ (r1 ) 1 + 2V (r2 )/c2
Que expandiendo a términos de primer orden en V/c2 queda:

V (r1 ) − V (r2 )
 
dτ1 ≈ dτ2 1 +

R
c2
Una expresión que es comúnmente utilizada en aplicaciones satelitales.
El último caso de interés es el de una partícula móvil con velocidad ~v(t) en

O
el campo gravitacional (medida por un observador en reposo en el campo) y la
diferencia entre el tiempo que ella percibe y el que percibe un observador muy
lejano.
D
La velocidad instantánea v medida por el observador en reposo en el campo
gravitacional estará dada por:
A
dl
v=

Donde definimos el desplazamiento propio dl 2 = (1 + 2V/c2 )dr2 + r2 (dφ2 +
cos2 φdθ 2 ). Con esta definición podemos re escribir la métrica de Schwarzschild
RR

como

ds2 = (1 + 2V/c2 )(1 − v2 /c2 )(cdt)2


Ahora bien, en el sistema de referencia propio de la partícula que se mueve en
el campo, ds = cdτ, de modo que la relación entre el tiempo coordenado t y el
BO

tiempo propio de la partícula τ será:


dt = √ √
1 + 2V/c2 1 − v2 /c2
dt = Σγdτ
Es decir el efecto sobre el tiempo de estar moviéndose en un campo gravita-
cional es rigurosamente equivalente a la combinación simple del efecto de moverse y
el efecto de la geometría del espacio tiempo en el campo gravitacional.
Con un razónamiento similar al hecho anteriormente, puede probarse que el
tiempo medido para un evento que ocurre en un tiempo propio dτ en un vehículo
que se mueve con velocidad v respecto al campo gravitacional, medido por dos
observadores en posiciones r1 y r2 diferentes en el campo será:
p
1 + 2V (r1 )/c2
dτ1 = p γdτ2
1 + 2V (r2 )/c2
76 Chapter 2. Fundamentos Matemáticos y Físicos

2.3 Fundamentos astronómicos


2.3.1 Sistemas de referencia en Astronomía
La mecánica celeste ha sido desde su aparición con la obra de Newton no solo un
esfuerzo por comprender el funcionamiento del Sistema Solar y de otros sistemas
donde dominan los efectos gravitacionales, sino también una herramienta para
predecir la posición de estos cuerpos con fines teóricos o muy prácticos.
Para que las posiciones de un objeto concreto (por ejemplo la Luna), calculadas
por distintos astrónomos puedan compararse, los sistemas de referencia (en los
que se miden las variables cinemáticas y dinámicas, incluyendo el tiempo) deben
coincidir rigurosamente. Esto ha llevado, desde tiempos históricos a definir es-
tándares universales para los sistemas de referencia que es menester conocer en el
contexto de cualquier curso de Mecánica Celeste.

R
Sistemas de referencia celestes

O
La posición de cualquier cuerpo en el cielo se determina respecto a dos circunferen-
cia máximas de referencia perpendiculares: un ecuador (en general) y un meridiano
de referencia. Los ángulos esféricos medidos respecto a estos dos planos se llaman
latitud φ y longitud θ.
D
A
RR
BO

Figure 2.12: Definición de la latitud y longitud de un cuerpo en el espacio

En astronomía de posición se definen distintos sistemas de coordenadas ce-


lestes (θ, φ) respecto a ecuadores y meridianos de referencia diferentes (horizonte,
ecuador, eclíptica) que permiten precisar la posición del cuerpo en el cielo. En
mecánica celeste estamos interesados en la posición del cuerpo
La posición en el espacio de un cuerpo que se encuentra a una distancia r del
origen del sistema de coordenadas estará dada por:
   
x cos φ cos θ
 y  = r  cos φ sin θ 
z sin φ
2.3. Fundamentos astronómicos 77

2.3.2 El ecuador y la eclíptica media


Las circunferencias máximas (planos) de referencia más importantes en astronomía
de posición son el Ecuador Celeste y la Eclíptica. Estos planos están definidos por
las circunferencias máximas resultantes de la proyección en el cielo del Ecuador
Terrestre y de la órbita de la Tierra. La intersección instantánea de esos planos (en
dos puntos conocidos como punto vernal y de libra) define la dirección del eje x de
ambos sistemas.

• Sietema de coordenadas ecuatoriales. La latitud y longitud relativa al plano


del ecuador celeste y al punto vernal se conocen como declinación δ y ase-
censión recta α. La posición de un cuerpo en el espacio referida a este sistema
de referencia esta dada por:

R
   
x EQ cos δ cos α
 y EQ  = r  cos δ sin α 

O
z EQ sin δ

• Sietema de coordenadas eclíptico. La latitud y longitud relativa al plano de


la eclíptica y al punto vernal se conocen como latitud eclíptica β (centrada
D
en la Tierra) o b (centrada en el Sol), y longitud eclíptica λ (geocéntrica) o l
(heliocéntrica). La posición de un cuerpo en el espacio referida a este sistema
de referencia esta dada por:
A
   
x EC cos b cos l
RR

 y EC  = r  cos b sin l 
z EC sin b
Distintos fenómenos dinámicos hacen que la posición de estos planos cambie
respecto a las estrellas. Las componentes más importantes de estos cambios son
producidas por los movimientos de precesión y nutación. Distintos modelos físicos
BO

se han desarrollado para predecir con precisión la orientación de los planos del
ecuador y de la eclíprica.
Por esta misma razón cuando se especifica la posición de un cuerpo en el es-
pacio debe indicarse claramente respecto a que tiempo se específica esa posición.
Normalmente las posiciones de los cuerpos en catálogos se proveen respecto a un
ecuador y una eclíptica media (calculada con modelos simples de la precesión y la
nutación) en tiempos específicos de la historia.
El sistema más utilizado actualmente es referido al ecuador y la eclíptica me-
dia correspondientes al primero de enero del año 2000 a las 12:00:00 de tiempo de
efemérides ver más abajo. A este sistema de referencia específico se lo llama J2000.0
y es un estándar de facto en astronomía.

Sistema celeste de referencia internacional

Definir un sistema de referencia inercial en el Sistema Solar es difícil. De un lado la


Tierra, en donde hacemos las observaciones, se mueve a una velocidad no despre-
ciable respecto al Sol y lo hace de forma acelerada. El baricentro del sistema solar
78 Chapter 2. Fundamentos Matemáticos y Físicos

(centro de masa de todos los planetas) es un mejor lugar para referir las observa-
ciones. Sin embargo la definición de la dirección de unos ejes fijos en el espacio no
es trivial.
Desde tiempos históricos se han usado fenómenos como las estaciones (el
movimiento del Sol por la eclíptica) para definir direcciones de referencia (el punto
vernal por ejemplo). Sin embargo fenómenos dinámicos complejos como la prece-
sión de los equinoccios, hacen que estas definiciones no sean estacionarias y difí-
ciles de estandarizar.
Las estrellas podrían permitir definir direcciones fijas en el espacio. Sin em-
bargo el movimiento del Sol en la Galaxia y el movimiento propio de esas mismas
estrellas dificultan la tarea, especialmente si de lo que se trata es de construir un
sistema de referencia preciso.
Esto ha obligado a los Astrónomos a recurrir a observaciones de objetos extra-
galácticos que por su distancia carecen completamente de movimientos propios en

R
el cielo (movimientos relativos entre sí). La observación de cientos de estos objetos
ha permitido de definir un sistema de referencia estándar respecto al cuál definir

O
la posición de cualquier cuerpo en el espacio.

** Sistema Celeste de Referencia Internacional (ICRS)**. Es un sistema


de referencia que tiene origen en el baricentro del Sistema Solar y con
D
ejes definidos en relación con fuentes de radio extragalácticas y una
métrica definida por la resolución B1.3 de la Unión Astronómica Inter-
nacional de 2000.
A
Este sistema de referencia, definido de esta manera, es de alguna manera ab-
stracto. No tiene establecida en su definición la manera específica como se miden
la posición de los objetos en el espacio. Para ello se han construído (y se siguen
RR

construyendo) realizaciones del ICRS que se conocen como marcos de referencia.


Entre ellos algunos comunes son:

• Marco de Referencia Celestee Internacional (ICRF)9 . Este marco de referen-


cia tiene definidos ahora sí un conjunto específico de fuentes extragalácticas
BO

de referencia. La primera realización del ICRS que antecedió las realizaciones


futuras, fijaba la dirección del eje X de modo que la fuente 3C273B tuviera las
coordenadas calculadas en el sistema de referencia anterior (FK5). En realiza-
ciones posteriores (ICRF1, ICRF2 y la más reciente ICRF3) la dirección de los
ejes queda fijada al definir las coordenadas de ascensión recta y declinación
de un centenar de fuentes extragalácticas.
• Marco de Referencia Celeste de Hipparcos (HCRF). Se define de forma
análoga al ICRF pero usando la posición medida por el satélite Hipparcos
y compiladas en el catálogo Hipparcos. El marco de referencia de Hipparcos se
usa para observaciones en el visible.
• Marco de Referencia Celeste de Gaia (Gaia-CRF2). Se define de forma
análoga al ICRF pero usando la posición medida por el satélite Gaia
de 500,000 fuentes extragalácticas. El catálogo de las fuentes está en
preparación. Se piensa que este se convertirá en el standard de facto de los
9 http://iers.obspm.fr/icrs-pc/newwww/icrf/
2.3. Fundamentos astronómicos 79

marcos de referencia usados para observaciones en el visible en tiempos fu-


turos.

Escalas de tiempo usadas en astronomía

Definir de forma exacta el tiempo en el que ocurre un evento en astronomía es una


tarea bastante ardua. Si bien desde tiempos históricos se definieron sistemas de
medida del tiempo bastante apropiados para la precisión de las observaciones re-
alizadas en el pasado, con el advenimiento de instrumentos cada vez más precisos
se ha hecho necesario definir de forma más rigurosa las etiquetas de tiempo que
asociamos a los eventos astronómicos.
Desde 1972 la definición del tiempo en astronomía se hace de forma rigurosa
usando dos escalas de tiempo básicas:

R
1. Escalas de tiempo uniformes. Estas escalas están basadas en la definición
del segundo atómico, un estándar que fue definido en el año 1972. Este se-
gundo es constante y no se modifica en el tiempo (lo que es esperable para

O
un estándar científico). Algunas escalas de tiempo uniformes son el tiempo
atómico internacional (TAI), el tiempo terrestre (TT), el tiempo geocéntrico coor-
dinado (TCG), el tiempo coordinado del baricentro TCB, el tiempo dinámico del
D
baricentro (TDB) o el tiempo de efemérides (Teph ).

2. Escalas de tiempo astronómicas. Estas son escalas basadas en la rotación


de la Tierra, como esperaríamos de cualquier escala de tiempo astronómica.
A
La variación en la velocidad de rotación de la Tierra hacen que la duración
del segundo en estas escala cambie en el tiempo, lo que las hace no muy
apropiadas para definir la duración precisa de eventos. Sin embargo como
RR

están referidas a la rotación juegan un papel central en la planeación de las


observaciones. Las dos escalas de tiempo astronómicas más usadas son el
tiempo universal coordinado (UTC) y el tiempo universal (UT1).

Un artículo completo sobre estas escalas de tiempo puede encontrarse en la


Circular 179 del Observatorio Naval de los Estados Unidos10 o en este artículo
BO

divulgativo11 .

Escalas uniformes

• TCG, Tiempo Coordinado Geocéntrico. Tiempo calculado en el centro de la


Tierra (donde no hay efecto gravitacional de nuestro planeta). Por efecto de
la dilatación gravitacional del tiempo, este tiempo avanza a un ritmo LG =
6.97 × 10−10 más rápido que un reloj atómico en la superficie de la Tierra.
Use lo aprendido en la sección anterior para calcular este valor.

• TCB, Tiempo Coordinado del Baricentro (del Sistema Solar). Tiempo cal-
culado en el Baricentro del Sistema Solar (donde se asume no hay ningún
efecto de la gravedad producida por el Sol y los planetas). Por efecto de la
dilatación gravitacional del tiempo, Avanza a un ritmo L B = 6.97 × 10−8 más
10 documentos/USNO-Circular-179-Oct-2006.pdf
11 https://www.investigacionyciencia.es/blogs/astronomia/76/posts/qu-hora-es-14889
80 Chapter 2. Fundamentos Matemáticos y Físicos

rápido que un reloj atómico en el geocentro y en la superficie de la Tierra. Use


lo aprendido en la sección anterior para calcular este valor.

• TAI, Tiempo Atómico Internacional. Tiempo atómico medido en el geoide.


Fue introducido como el standar de tiempo en 1972. Se mide como el número
de segundos transcurridos desde una fecha de referencia, a diferente de la es-
cala civil UTC que utiliza el sistema de año, mes, día, etc. La diferencia entre
el TAI y el UTC se denota como ∆AT=TAI-UTC. Como un ejemplo entre 1999
y 2005 ∆AT=32 s. ∆AT se incrementa por 1 segundo (leap second o segundos
bisciestos) cada 2 o 3 años o bien a finales de junio o a finales de diciembre. El
último leap second se introdujo el 31 de diciembre de 2016.

• TT, Terestrial time. Tiempo terrestre. Se calcula a partir del tiempo TAI como
TT = TAI + 32.184, donde la diferencia de 32.184 segundos, se asume con-

R
stante. Esta diferencia corresponde al número de segundos bisciestos acumu-
lados desde tiempos históricos hasta la definición de la escala TAI. Por efecto
de la dilatación gravitacional del tiempo se cumple que: TT=(1-LG )TCG.

O
• ET, Ephemeris time. Tiempo de efemérides. Este es el tiempo utilizado
actualmente para el reporte y el cálculo de la posición de cuerpos en as-
D
tronomía. En el presente el valor del ET es el mismo TT. Se define ∆ET=ET-
UTC.
A
• TDT, Terrestrial Dynamical Time. Hoy es el mismo TT.

• TDB, Barycentric Dynamical Time. Tiene el mismo ritmo de TT con varia-


RR

ciones periódicas de amplitud máxima 0.0016 s.

• Teph , Tiempo de efemétrides. El mismo TDB.

NOTA. La época standard para asuntos astrométricos modernos es


J2000.0, expresada como el instante TT correspondiente al año 2000,
BO

enero 1, 12h TT (JD 2451545.0 TT).

Escalas basadas en la rotación de la Tierra

• UT, Universal Time. Es el tiempo obtenido a partir de las observaciones


de las estrellas (tiempo sideral) en el meridiano de Greenwich. Los segun-
dos de UT varían continuamente como producto de variaciones en la tasa de
rotación de la Tierra.

• UT1, Universal Time (uniforme). Tiempo universal definido a partir de


una fórmula (estimación) que depende de la rotación de la Tierra. Este es
el tiempo usualmente utilizado en las observaciones astronómicas. El se-
gundo de UT1 no es uniforme (varía continuamente como producto de varia-
ciones en la rotación de la Tierra). La diferencia acumulada entre UT1 y TT
es ∆T=TT-UT1. Al pasar los años ∆T se va haciendo más grande por la de-
saceleración de la rotación de la Tierra.
2.3. Fundamentos astronómicos 81

• UTC, Tiempo Universal Coordinado. Tiempo usado con propósitos cibiles.


Usa la escala de TAI y periódicamente esta sujeto a una corrección de 1 se-
gundo para mantenerse siempre a menos de 0.9 segundos de UT1. Se in-
troducen al final de Junio o en Diciembre. La última se introdujo el 31 de
diciembre de 2016. La diferencia entre UT1 y UTC es: DUT1=UT1-UTC. El
valor de esta cantidad se publica en Internet periódicamente.

Comparación de escalas de tiempo:

R
O
D
A
RR

Figure 2.13: Comparación de las escalas de tiempo

2.3.3 Sistemas de coordenadas y escalas de tiempo en SPICE


BO

SPICE tiene incluídas algunas rutinas útiles para la manipulación de sistemas de


referencia y escalas de tiempo. En esta sección conoceremos algunas de esas ruti-
nas.
Es posible por ejemplo transformar las coordenadas de un cuerpo en J2000.0 a
sus coordenadas cartesianas y viceversa. Para ello se utilizan las rutinas latrec y
reclat.
Así por ejemplo si tenemos las coordenadas α y δ en el sistema ICRF de J2000.0 y
su distancia en un momento dado, podemos calcular las coordenadas cartesianas
x, y, z en ese sistema de coordenadas usando latrec. Estas son por ejemplo las
coordenadas del cometa 21P Giacobini-Zinner obtenidas con el simulador del cielo
Stellarium para el 30 de agosto de 2018 a las 09:00:00 UTC-5:

In [59]: #Cometa 21P/Giacobini-Zinner


alpha=15*(4+41/60.+25.75/3600) # Conversión de Sexagesimal a Decimal
delta=51+49/60.+9.7/3600
r=6.0922e6 # Distancia en km
82 Chapter 2. Fundamentos Matemáticos y Físicos

Sus coordenadas en J2000.0 serán


In [60]: pos_J2000=spy.latrec(r,alpha*GRADOS,delta*GRADOS)
pos_J2000

Out[60]: array([1265904.2312772 , 3546704.0698003 , 4788870.17557341])


Ahora bien, imaginemos que queremos calcular la posición del cuerpo pero en
el sistema de coordenadas eclíptico J2000.0, es decir aquel que utiliza el plano de
la eclíptica en lugar del ecuador. Para esta transformación podemos recurrir a una
nueva rutina de SPICE: pxform. Esta rutina permite crear la matriz de rotación
necesaria para pasar de un sistema de referencia a otro:
In [61]: J2000_EJ2000=spy.pxform("J2000","ECLIPJ2000",0)
J2000_EJ2000

R
Out[61]: array([[ 1. , 0. , 0. ],
[ 0. , 0.91748206, 0.39777716],
[ 0. , -0.39777716, 0.91748206]])

O
De lo que sabemos sobre matrices de rotación vemos que la transformación
entre ambos sistemas involucra simplemente una rotación alrededor del eje x en un
ángulo cos−1 (0.91748206) = 23.439291409155842, que es justamente la oblicuidad de
la eclíptica en J2000.0
D
Usando esta matriz podemos convertir la posición calculada antes en J2000
(ecuatorial) al sistema eclíptico J2000.0:
A
In [62]: pos_EJ2000=spy.mxv(J2000_EJ2000,pos_J2000)
pos_EJ2000
RR

Out[62]: array([1265904.2312772 , 5158940.52207629, 2982904.62584939])


Con esto podemos calcular ahora las coordenadas sobre el cielo en el sistema
eclíptico (latitud y longitud eclíptica geocéntrica) utilizando la función reclat:
In [63]: r,l,b=spy.reclat(pos_EJ2000)
BO

print("Latitud eclíptica:",l*RADIAN)
print("Longitud eclíptica:",b*RADIAN)

Latitud eclíptica: 76.21312592837896


Longitud eclíptica: 29.31605770828343

Queremos ahora determinar el valor del tiempo de efemérides para un deter-


minado momento. Para ello la primera información que necesitamos es la provista
en el kernel de tiempo de NAIF:
In [64]: spy.furnsh("util/kernels/naif0012.tls")

Este kernel (puede ver el contenido del kernel aquí12 ) contiene el valor de los
leap seconds introducidos en los últimos años. El archivo actualizado puede descar-
garse del sitio https://naif.jpl.nasa.gov/pub/naif/generic_kernels13 .
12 http://localhost:8888/edit/util/kernels/naif0012.tls
13 https://naif.jpl.nasa.gov/pub/naif/generic_kernels/
2.3. Fundamentos astronómicos 83

Una vez tenemos este Kernel podemos calcular el valor del tiempo en otras
escalas de tiempo con rutinas como str2et, utc2et, unitim, etc.
Por ejemplo la siguiente rutina permite convertir el tiempo expresado en una
cadena de caracteres a la escala de tiempo de efemérides (ET):
In [65]: et=spy.str2et("2000-01-01 12:00:00 UTC+0")
et

Out[65]: 64.18392728473108
Para ilustrar los conceptos mostrados antes se muestra el tiempo de efemérides
en el inicio del primer día Juliano del año 2000. Como se ve, el tiempo UTC
esta adelantado en esa época de referencia 64.18 segundos respecto al tiempo de
efemérides, esto porque, como se explico antes el segundo del presente (con el que
se mide el UTC) es menor que el segundo del tiempo en el que se estableció un

R
segundo estándar con base en la rotación de la Tierra en astronomía (origen del
tiempo de efemérides). Esta diferencia es justamente la que llamamos ∆ET y que
puede ser calculada independientemente usando la rutina.

O
In [66]: spy.deltet(et,"UTC")

Out[66]: 64.18392730611507 D
Con esto en mente podemos calcular el valor de tiempo de efemérides justo
ahora:
In [67]: ahora=datetime.now().strftime('%Y-%m-%d %H:%M:%S UTC-5')
A
print("Fecha ahora:",ahora)
et=spy.str2et(ahora)
print("Tiempo de efemérides (segundos transcurridos desde 2000.0):",et)
RR

Fecha ahora: 2019-09-05 10:48:22 UTC-5


Tiempo de efemérides (segundos transcurridos desde 2000.0): 620970571.18256

Otra conversión útil es la de expresar un tiempo en la escala ET en el mismo


tiempo pero en UTC. Esto se realiza con la rutina inversa et2utc:
BO

In [68]: JDUTC=spy.et2utc(et,"J",3)
print("Tiempo en JDUTC:",JDUTC)
C=spy.et2utc(et,"C",3)
print("Tiempo en Calendar:",C)
D=spy.et2utc(et,"D",3)
print("Tiempo en Calendar (day of year):",D)
ISOC=spy.et2utc(et,"ISOC",3)
print("Tiempo en ISO:",ISOC)
ISOD=spy.et2utc(et,"ISOD",3)
print("Tiempo en ISOD:",ISOD)

Tiempo en JDUTC: JD 2458732.159


Tiempo en Calendar: 2019 SEP 05 15:48:22.000
Tiempo en Calendar (day of year): 2019-248 // 15:48:22.000
Tiempo en ISO: 2019-09-05T15:48:22.000
Tiempo en ISOD: 2019-248T15:48:22.000
84 Chapter 2. Fundamentos Matemáticos y Físicos

Si nos dan una fecha en et, dígase por ejemplo “2018-08-30 10:00:00 TT” y quer-
emos obtener ET en formato de segundos transcurridos desde 2000.0. Se puede
hacer un truco.
Primero obtenemos un “fake ET” suponiendo que la fecha anterior esta en UTC
(no lo está). Y al resultado le debemos restar el ∆ET. Demostremos esto usando la
fecha de la época J2000.0:

In [69]: fake_et=spy.str2et("2000-01-01 12:00:00 UTC")


deltet=spy.deltet(fake_et,"UTC")
et=fake_et-deltet
print(et)

-2.1383982584666228e-08

R
Como era de esperarse el resultado no es exactamente 0 porque el valor del
∆ET tampoco fue calculado exactamente en el momento elegido. Aún así la pre-
cisión con la que se obtiene el ET para este tiempo es suficientemente buena (10−8

O
segundos) como para trabajar.
Con esta sencilla rutina podemos obtener tiempos aún más precisos:
D
In [70]: def etstr2et(str):
fake_et=spy.str2et(str)
deltet=spy.deltet(fake_et,"UTC")
et=fake_et-deltet
A
deltet_corrected=spy.deltet(et,"UTC")
et=et-(deltet_corrected-deltet)
return et
RR

In [71]: etstr2et("2000-01-01 12:00:00")

Out[71]: 6.16608986092615e-11

unitim permite convertir cualquier escala de tiempo uniforme a otra escala de


BO

tiempo que use los mismos segundos:

In [72]: #Julian Day


spy.unitim(et,"ET","JDTDT")

Out[72]: 2451545.000000001

In [73]: #Tiempo TAI


spy.unitim(et,"ET","TAI")

Out[73]: -32.18392728460781

Usando el tiempo de efemérides se puede calcular la posición de cualquier


cuerpo del sistema solar si se cuenta con un Kernel Planetario que puede descar-
garse del sitio https://naif.jpl.nasa.gov/pub/naif/generic_kernels14

In [74]: spy.furnsh("util/kernels/de430.bsp")
14 https://naif.jpl.nasa.gov/pub/naif/generic_kernels/
2.3. Fundamentos astronómicos 85

In [75]: spy.spkezr("MOON",et,"J2000","NONE","EARTH")

Out[75]: (array([-2.91608385e+05, -2.66716833e+05, -7.61024860e+04, 6.43531387e-01


-6.66087685e-01, -3.01325705e-01]), 1.3424241640895664)

La posición de las naves espaciales puede obtenerse con un proced-


imiento similar. Por ejemplo para calcular la posición de la sonda Voy-
ager podemos descargar el Kernel correspondiente a la sonda desde https:
//naif.jpl.nasa.gov/pub/naif/VOYAGER/kernels/spk/. El Kernel se llama
Voyager_2.m05016u.merged.bsp:

In [76]: spy.furnsh("util/kernels/Voyager_2.m05016u.merged.bsp")

In [77]: spy.spkez(-32,et,"J2000","NONE",10)

R
Out[77]: (array([ 2.36245473e+09, -5.62158066e+09, -6.54384428e+09, 4.36517433e+00
-4.36251183e+00, -1.45583060e+01]), 29835.860377972775)

O
Usando estos datos podríamos poner en práctica lo que vimos antes sobre el
cálculo del retraso en los relojes acumulado durante el viaje de la Voyager.
En este archivo15 encontrará los rangos de fechas en los que están disponibles
las posiciones de la sonda.
D
A
RR
BO

15 https://naif.jpl.nasa.gov/pub/naif/VOYAGER/kernels/spk/aa_summaries.txt
86 Chapter 2. Fundamentos Matemáticos y Físicos

R
O
D
A
RR
BO
Chapter 3

El Problema de los
N-cuerpos

R
O
En este capítulo desarrollaremos los elementos teóricos básicos y los resultados
más importantes de la Mecánica Celeste obtenidos con el denominado formalismo
vectorial de la mecánica. En este formalismo la descripción del movimiento de los
D
cuerpos sometidos a su mutua atracción gravitacional se hace partiendo de las
fuerzas que intercambian y resolviendo analítica y numéricamente la ecuación de
movimiento.
A
3.1 Formulación del problema
RR

El problema de los N-cuerpos es uno de los más importantes problemas en la his-


toria de la Física. Podría considerarselo el primer problema serio de Física Teórica
que se formuló en la historia.
Cuando Newton desarrollo su teoría mecánica con el propósito de describir el
movimiento de los cuerpos del Sistema Solar, era claro que en el sistema existían
cuerpos que dominaban el movimiento de otros, sin verse significativamente afec-
BO

tados. Por ejemplo el Sol domina el movimiento de la Tierra, Júpiter domina el


movimiento de sus lunas y las partículas de sus anillos.
Cuando un cuerpo domina el movimiento de muchos en un sistema, el prob-
lema de describir y predecir sus movimientos se hace relativamente trivial. La
fuerza que ejercé el cuerpo central sobre cada cuerpo es independiente de la posi-
ción de todos los demás y la solución al problema consiste simplemente en resolver
la ecuación de movimiento de cada cuerpo.
Pero rapidamente fue claro que el movimiento de los cuerpos del Sistema Solar
era mucho más complejo que eso. Prueba de ello es la Luna, cuyo movimiento
se escapa rápidamente a los modelos simplificados que asumen que solamente la
Tierra ejerce una fuerza sobre ella, mientras se mantiene en un movimiento simple
alrededor del Sol.
Cuando se admite en el problema que las fuerzas que ejercen entre sí los cuer-
pos deben tenerse en cuenta para la descripción correcta, emerge el denominado
problema de los N-cuerpos.
Históricamente, el problema matemático de los N-cuerpos, puede formularse

87
88 Chapter 3. El Problema de los N-cuerpos

de la siguiente forma:

Dado un sistema con un número arbitrario de partículas puntuales


que se atráen mutuamente obedeciendo la ley de gravitación universal,
cuyo estado cinemático (posiciones y velocidades) en un instante dado
de tiempo, con respecto a un sistema de referencia inercial, son cono-
cidas, y bajo la suposición de que ninguna de esas partículas colisiona,
encontrar una representación de las coordenadas de cada partícula
puntual como una serie de una variable dependiente del tiempo, de
modo que la serie converga uniformemente.

Matemáticamente, en el formalismo vectorial de la Mecánica, el problema de


los N-cuerpos puede formularse como la solución al conjunto de las ecuaciones de
movimiento de todos los cuerpos:

R
( )
1
mi ∑
~¨ri = ~Fji

O
j N

Donde se ha asumido que ninguna fuerza externa actúa sobre el sistema y solo
las fuerzas entre las partículas modifican sus movimientos.
D
La dificultad matemática más relevante del problema de los N-cuerpos, estriba
en el hecho de que las fuerzas entre las partículas ~Fji dependen a su vez de las
posiciones que cada una de ellas ocupa instántaneamente. De este modo el con-
A
junto de ecuaciones diferenciales que define el problema es altamente acoplado y
en general no lineal.
Como mencionamos antes, asumimos que las fuerzas entre las partículas son
RR

únicamente gravitacionales, esto es, obedecen la ley de gravitación universal

Gmi m j
~Fji = − (~r −~r j )
|~ri −~r j |3 i
Es importante tener en cuenta aquí la dirección del vector relativo ~r ji = ~ri −~r j
BO

tal y como se usará en esta ecuación (y que produce el signo menos en la expresión
para la fuerza). Este vector apunta en la dirección que va de la partícula que pro-
duce la fuerza (partícula j-esima) hacia la partícula que la experimenta (partícula
i-esima).
En términos explícitos, el problema de los N-cuerpos resulta de resolver el con-
junto de ecuaciones de movimiento:
( )
Gm j
~¨ri = − ∑ 3 ~r ji
j r ji
N

3.1.1 Unidades canónicas


La fuerza gravitacional es la fuerza más débil del Universo. Por esta razón el valor
de la constante que determina su intensidad, G es muy pequeño, mientras que
las cantidades involucradas en la fuerza, masas m j y distancias entre cuerpos rij
pueden ser inmensas.
3.1. Formulación del problema 89

Con el propósito de evitar la combinación de cantidades muy grandes y muy


pequeñas en las mismas ecuaciones, casi desde el principio del desarrollo de la
mecánica celeste, se ha convenido utilizar un sistema de unidades en el cuál las
cantidades implicadas en el problema tengan un tamaño similar y de orden 1.
¿Pero es posible esto?.
Las dimensiones de la constante de gravitación universal G son:

L3
[G] =
MT 2
Es decir, esta constante combina los patrones fundamentales usados para medir
las demás propiedades del sistema (masas, distancias y tiempos). Como tal, la
constante puede ser usada para definir el conjunto de unidades más apropiadas
para los propósitos perseguidos aquí.

R
Imaginemos que tenemos un conjunto de tres nuevas unidades, de nombre
arbitrario, y que en unidades del SI tienen un valor (factor de conversión) que lla-
mamos UL , U M y UT . Así por ejemplo, en el Sistema Solar se define una unidad de

O
longitud más apropiada para describir la posición y demás propiedades cinemáti-
cas del sistema, la Unidad Astronómica (AU, por sus siglas en inglés). Sabemos que
1 AU = 1.496 × 108 km. Si usaramos esta como la unidad de longitud, el factor de
conversións sería UL = 1.496 × 1011 m.
D
El primer propósito en nuestro problema será el de hacer que la constante de
gravitación tenga un valor pequeño. Arbitrariamente podríamos asignarle un valor
de 1, siempre y cuando usemos un sistema apropiado de unidades:
A
GC = 1
El subíndice C hace referencia a que esta elección conduce a lo que se conoce
RR

en mecánica celeste como un sistema de unidades canónico. Si utilizamos los factores


de conversión para pasar de las unidades arbitrarias definidas a las unidades del
sistema internacional, obtenemos la siguiente igualdad:

UL3 m3
1 = G = 6.67308 × 10−11
BO

U M UT2 kg · s2
De allí vemos que si escogemos armitrariamente el valor de al menos 2 de los
factores de conversión (por ejemplo UL y U M ) el tercero (por ejemplo UT ) puede
ser calculado.
Volviendo al ejemplo anterior, si hacemos UL = 1.496 × 1011 m. y U M = 1.98 ×
30
10 kg, el factor de conversión de los tiempos será:

s
UL3
UT = (3.1)
GU M
(3.2)

Numéricamente:

In [2]: G=6.67308e-11
UL=1.496e11
90 Chapter 3. El Problema de los N-cuerpos

UM=1.98e30

UT=np.sqrt(UL**3/(G*UM))
print("UT (s) = ",UT)
print("UT (h) = ",UT/3600)
print("UT (d) = ",UT/86400)
print("UT (a) = ",UT/(365.25*86400))

UT (s) = 5033865.755208481
UT (h) = 1398.296043113467
UT (d) = 58.26233512972779
UT (a) = 0.15951358009507952

R
Es interesante anotar que el valor del factor de conversión de tiempo (unidad de
tiempo) no es arbitrario. En realidad es del mismo orden de magnitud del período
de revolución de la Tierra (365.25 días). Esta no es una casualidad, sino el resultado

O
de que las escala de tiempo en un sistema en el que la masa que atrae tiene la masa
del Sol y las separaciones típicas son como la separación entre la Tierra y el Sol, es
similar a la duración del año.
Teniendo los valores de los patrones fundamentales de longitud, masa y
D
tiempo, es posible encontrar los patrones de velocidad, aceleración, energía y mo-
mentum angular, que son fundamentales en el estudio de la dinámica del sistema.
En la elección hecha anteriormente, estos patrones son:
A
In [3]: UV=UL/UT
print("UV (m/s):",UV)
RR

UA=UL/UT**2
print("UA (m/s^2):",UA)

UE=UM*UL**2/UT**2
print("UE (J = kg m^2/s^2):",UE)
BO

UV (m/s): 29718.710683774327
UA (m/sˆ2): 0.005903755111670335
UE (J = kg mˆ2/sˆ2): 1.7487394941176467e+39

Intente utilizar estas ideas para responder a esta pregunta: ¿cuáles es la unidad
de longitud característica, de un sistema gravitacional, tal que teniendo como
unidad de masa el Sol, las unidades de velocidad sean las mismas que la velocidad
de la luz?

3.1.2 Notación
A menudo cuando se cambian los sistemas de unidades en física (en electromag-
netismo, física atómica, relatividad o física de partículas), la mayoría de las can-
tidades físicas siguen escribiéndose con los mismos símbolos, lo que puede con-
ducir a confusiones muy grandes. La mecánica celeste no es la excepción, excepto
3.1. Formulación del problema 91

por una sola cantidad, cuya representación en unidades canónicas cambia. Nos
referimos a la masa de las partículas cuando aparece en el contexto de la fuerza
gravitacional.
Así mientras que en un sistema arbitrario de unidades escribiremos Gm, dado
que en el sistema canónico GC = 1, escribiremos este factor como µ. En térmi-
nos del sistema canónico de unidades, las ecuaciones de movimiento se pueden
escribir como:
( )
µj
~ri = − ∑ 3 ~rij
¨
j rij N

3.1.3 Solución numérica

R
En el tiempo de Newton y sus contemporáneos, la solución a los problemas debía
obtenerse en términos de funciones o series (solución analítica). En tiempos más
recientes y con el advenimiento de los computadores, la solución a algunos prob-

O
lemas de la física teórica e incluso de las matemáticas, ha sido posible mediante el
uso de métodos numéricos (aproximados).
Si bien la solución a un problema usando estos métodos carece del valor general
D
que reconocemos en las soluciones analíticas, esta aproximación es reconocida en
el presente como una alternativa igualmente poderosa para entender los sistemas
físicos y eventualmente descubrir regularidades subyacentes.
A
En el capítulo anterior vimos que la ecuación de movimiento de una partícula
puede escribirse como un conjunto de 6 ecuaciones diferenciales de primer orden.
En el caso del problema de los N-cuerpos, las ecuaciones de movimiento se es-
criben como un sistema de 6N ecuaciones lineales de la forma:
RR

( )
ẏi = y3N +i−1 , i < 3N
µ
ẏi = − ∑ r j r~ji , i ≥ 3N
ji 3N

Donde ~ri : (y3i , y3i+1 , y3i+2 ), y los índices i y j se asumen comenzando en 0.


BO

Estas ecuaciones se pueden escribir en Python como:

In [4]: def EoM_Nbody(y,t,masas):


M=len(y);N=int(M/6)

#Vector de estado
r=np.zeros((N,3))
v=np.zeros((N,3))

#Vectores nulo con las derivadas


drdt=np.zeros((N,3))
dvdt=np.zeros((N,3))

#Asignación de los vectores de estado


for i in range(N):
r[i]=y[3*i:3*i+3];
v[i]=y[3*N+3*i:3*N+3*i+3]
92 Chapter 3. El Problema de los N-cuerpos

# Ecuaciones de movimiento
for i in range(N):
drdt[i]=v[i]
for j in range(N):
if i==j:continue
dvdt[i]+=-masas[j]/spy.vnorm(r[i]-r[j])**3*(r[i]-r[j])

# Devuelve derivadas
dydt=np.array([])
for i in range(N):dydt=np.concatenate((dydt,drdt[i]))
for i in range(N):dydt=np.concatenate((dydt,dvdt[i]))
return dydt

Para definir las condiciones iniciales podemos crear un diccionario, que nos
permitirá gestionar mejor la información sobre el sistema:

R
In [5]: sistema=dict(
particula1=dict(

O
m=1.0,
r=[1,0,0],
v=[0,0.5,0]), D
particula2=dict(
m=1.0,
r=[-1,0,0],
v=[0,-0.5,0.5],
A
),
particula3=dict(
m=1.0,
r=[0,1,0],
RR

v=[0,0,1]
)
)

Necesitamos sin embargo una rutina capaz de convertir este diccionario en


BO

la información que se le pasa al sistema de ecuaciones diferenciales. Para ello


definiremos esta rutina:

In [6]: def sis2ini(sistema):


# Prepara el Sistema de Partículas
masas=[]
rs=[];vs=[];ys=[]
for i in sistema.keys():
particula=sistema[i]
if particula['m']>0:
masas+=[particula['m']]
rs+=particula['r'];vs+=particula['v']
ys=rs+vs
M=len(ys)
N=int(M/6)
return ys,masas,N

Ahora podemos resolver el sistema de ecuaciones como:


3.1. Formulación del problema 93

In [7]: y,masas,N=sis2ini(sistema)
T=10.0
Nt=100.0
solucion=odeint(EoM_Nbody,y,np.linspace(0,T,Nt),args=(masas,))

La extracción de la solución no es simple. La matriz resultante tiene 6N × Nt


elementos, incluyendo posiciones y velocidades. La siguiente rutina será útil con
ese propósito:

In [8]: def sol2pos(solucion):


Nt=int(solucion.shape[0])
N=int(solucion.shape[1]/6)
rs=np.zeros((N,Nt,3))
vs=np.zeros((N,Nt,3))
for i in range(N):

R
n=3*i
rs[i]=solucion[:,n:n+3]
m=3*N+3*i

O
vs[i]=solucion[:,m:m+3]
return rs,vs

Debemos tener en cuenta que los objetos rs y vs son hipercubos con dimen-
D
siones N × Nt × 3. Así, rs[0] es una matriz con las posiciones de la n-esima
partícula en cualquier tiempo y rs[0][0] corresponde a la posición inicial de la
partícula 0.
A
Combinando los elementos anteriores se puede escribir un código relativa-
mente legible para la integración de las ecuaciones de movimiento de un sistema
de N-partículas:
RR

In [9]: #Condiciones iniciales


T=10.0
Nt=1000.0
sistema=dict(
particula1=dict(
BO

m=1.0,
r=[0.0,0.0,0.0],
v=[0.0,0.0,0.0]),
particula2=dict(
m=0.01,
r=[1.0,0.0,0.0],
v=[0.0,1.0,0.0],
),
particula3=dict(
m=0.001,
r=[0.88,0.0,0.0],
v=[0.0,0.88,0.0],
)
)
#Preparación de la solución
y,masas,N=sis2ini(sistema)
#Solución
solucion=odeint(EoM_Nbody,y,np.linspace(0,T,Nt),args=(masas,))
94 Chapter 3. El Problema de los N-cuerpos

#Extracción de la solución
rs,vs=sol2pos(solucion)

Ahora podemos graficar la solución en 2 dimensiones:

In [10]: fig2d = plt.figure()


ax2d=fig2d.gca()

for i in range(N):
# Grafica en 2D
line,=ax2d.plot(rs[i,0,0],rs[i,0,1],'o',markersize=5,markeredgecolor='none')
color=line.get_color()
ax2d.plot(rs[i,:,0],rs[i,:,1],color=color)

ext=np.abs(rs[:,:,:2]).max()

R
ax2d.set_xlim(-ext,ext)
ax2d.set_ylim(-ext,ext)

O
Out[10]: (-1.0191547952456945, 1.0191547952456945)

D
A
RR
BO

Ahora podemos graficar la solución en 3 dimensiones:

In [11]: # Graficar en 3D
fig3d = plt.figure()
ax3d=Axes3D(fig3d)

for i in range(N):
line,=ax3d.plot(rs[i,:,0],rs[i,:,1],rs[i,:,2])
color=line.get_color()

ax3d.view_init(elev=30,azim=80)
3.1. Formulación del problema 95

ext=ext=np.abs(rs).max()
ax3d.set_xlim(-ext,ext)
ax3d.set_ylim(-ext,ext)
ax3d.set_zlim(-ext,ext)

Out[11]: (-1.0191547952456945, 1.0191547952456945)

R
O
D
A
RR
BO

3.1.4 Coreografías
Antes de intentar resolver el problema de los N-cuerpos, o mejor, de intentar ganar
algún entendimiento básico del mismo usando métodos analíticos, es interesante
mencionar una familia de soluciones al problema en las que dadas unas condi-
ciones iniciales muy específicas, la solución se hace increíblemente simple.
Considerese por ejemplo el caso de 3 partículas de masa idéntica que se encuen-
tran sobre los vértices de un triángulo equilatero. ¿Qué sucede si las partículas se
sueltan desde el reposo?. Dada la simetría del problema, las fuerzas sobre cada
partícula actuarán a lo largo de las mediatrices del tríangulo, y por la identidad
de las masas, lo que pase a una partícula le pasará exactamente a las demás. En
esta situación y sin resolver rigurosamente las ecuaciones de movimiento sabemos
que las partículas se moverán en línea recta a lo largo de las mediatrices hasta
encontrarse en el centro del triángulo.
96 Chapter 3. El Problema de los N-cuerpos

Figure 3.1: La coreografía más simple con un sistema de 3 cuerpos

Esta sencilla solución podría generalizarse al caso de un sistema con un polí-


gono regular de N-lados. Sin embargo, esta solución trivial no satisface una de
las condiciones importantes del problema de los N-cuerpos: que las partículas no

R
colisionan. ¿Cómo construir un sistema con simetrías similares pero garantizando
que las partículas no colisionen?

O
Una posible solución puede obtenerse si poniendo las partículas en la misma
configuración del triángulo equilatero, las dotamos de una rapidez idéntica, di-
rigida en un ángulo γ respecto a la línea perpendicular al radio del triángulo (ver
figura abajo).
D
Configuración de una solución de equilibrio relativo con 3 cuerpos
Supongamos que el Triángulo tiene el siguiente radio y la rapidez v de las
partículas, así como el ángulo que forman respecto a la línea perpendicular al radio
A
γ es:
In [12]: R=1.0
v=0.5
RR

gama=10.0*GRADOS

Las siguientes condiciones iniciales satisfacen la configuración mencionada:


In [13]: sistema=dict(
particula1=dict(
m=1.0,
BO

r=[0.0,R,0.0],
v=[-v*np.cos(gama),+v*np.sin(gama),0.0]),
particula2=dict(
m=1.0,
r=[-R*np.cos(30*GRADOS)+0.01,-R*np.sin(30*GRADOS),0.0],
v=[+v*np.cos(60*GRADOS+gama),-v*np.sin(60*GRADOS+gama),0.0],
),
particula3=dict(
m=1.0,
r=[+R*np.cos(30*GRADOS),-R*np.sin(30*GRADOS),0.0],
v=[+v*np.cos(60*GRADOS-gama),+v*np.sin(60*GRADOS-gama),0.0],
)
)

La solución al movimiento del sistema será:


In [14]: tini=0.0
tend=10.0
3.1. Formulación del problema 97

Nt=300
rs,vs,masas,N=solucionNbody(sistema,tini,tend,Nt)

Veámos como se ve la solución animada:


In [15]: fig,ax=plt.subplots(1,1,figsize=(6,6))

lines=[]
for i in range(N):
line,=ax.plot(rs[i,0,0],rs[i,0,1],'o',ms=3)
lines+=[line]

vmax=np.abs(rs[:,:,0:2]).max()
ax.set_xlim((-1.2*vmax,1.2*vmax))
ax.set_ylim((-1.2*vmax,1.2*vmax))
ax.grid()

R
def animacion(n):
for i in range(N):lines[i].set_data(rs[i,:n,0],rs[i,:n,1])

O
return lines

anim=animation.FuncAnimation(fig,animacion,frames=Nt,interval=50,blit=True,repeat=T
D
A
RR
BO
98 Chapter 3. El Problema de los N-cuerpos

A este tipo de configuraciones se las conoce como soluciones de equilibrio relativo


y forman una familia infinita de soluciones al problema de los 3-cuerpos.
Estas soluciones pueden generalizarse fácilmente a sistemas de N partículas
idénticas.
Muchos autores han buscado configuraciones similares a la anterior, en las
cuales las partículas mantienen a lo largo del tiempo una trayectoria estable y una
configuración relativa sencilla de predecir. Un número muy grande de ellas ha
sido encontrado y forman las que se conocen como coreografías del sistema de
N-cuerpos.
Una reconocida coreografía se produce cuando se colocan 3 partículas en la
siguiente configuración:

In [16]: #Condiciones en Simó (1993)


x3=0.0

R
dx3=0.695804
y3=0.0
dy3=1.067860

O
x1=0.995492
dx1=-dx3/2
y1=0.0
dy1=-dy3/2
D
x2=-x1
A
dx2=dx1
y2=-y1
dy2=dy1
RR

#Sistema
sistema=dict(
particula1=dict(
m=1.0,
r=[x1,y1,0.0],
v=[dx1,dy1,0.0]),
BO

particula2=dict(
m=1.0,
r=[x2,y2,0.0],
v=[dx2,dy2,0.0],
),
particula3=dict(
m=1.0,
r=[x3,y3,0.0],
v=[dx3,dy3,0.0],
)
)

tini=0.0
tend=10.0
Nt=300
rs,vs,masas,N=solucionNbody(sistema,tini,tend,Nt)

Animada, resulta:
3.1. Formulación del problema 99

In [17]: fig,ax=plt.subplots(1,1,figsize=(6,6))

lines=[]
for i in range(N):
line,=ax.plot(rs[i,0,0],rs[i,0,1],'ko',ms=5)
lines+=[line]

vmax=np.abs(rs[:,:,0:2]).max()
ax.set_xlim((-1.2*vmax,1.2*vmax))
ax.set_ylim((-1.2*vmax,1.2*vmax))
ax.grid()

def animacion(n):
for i in range(N):lines[i].set_data(rs[i,n,0],rs[i,n,1])
return lines

R
animacion(200)
anim=animation.FuncAnimation(fig,animacion,frames=Nt,interval=50,blit=True,repeat=T

O
D
A
RR
BO

Se reta al estudiante a construir una animación con la coreografía de 4 y 5 cuer-


pos que se encuentra en el artículo New Families of Solutions in N-Body Prob-
100 Chapter 3. El Problema de los N-cuerpos

lems16 de Carles Simó.

3.2 Integrales del problema de N-cuerpos


Después de explorar numéricamente la solución al problema de las N-cuerpos,
volvamos al problema original, a saber, resolver analíticamente (en términos de se-
ries que convergan o funciones analíticas) el conjunto de ecuaciones:
( )
µj
~¨ri = − ∑ 3 ~r ji
j r ji N
La solución a este conjunto de ecuaciones diferenciales equivale a encontrar
las N funciones vectoriales {~ri (t)} N que describen la posición de las partículas
en el tiempo, o equivalentemente, las 3N funciones escalares { xij (t)}3N (donde

R
j = x, y, z) que nos dan la posición de la partícula en el tiempo.

O
3.2.1 Cuadraturas y primeras integrales
La teoría de ecuaciones diferenciales señala que si existen simetrías implícitas en el
sistema, estas simetrías pueden expresarse en la forma de ecuaciones algebraicas
D
que relacionan las variables dependientes {~ri (t)} N con sus primeras derivadas
{~r˙i (t)} N , relaciones que pueden escribirse en general de la forma:
A
f ({~ri (t)} N , {~r˙i (t)} N , t) − k = 0
donde k es una constante. A estas relaciones se las conoce como cuadraturas o
primeras integrales del sistema de ecuaciones diferenciales.
RR

Considerese por ejemplo el caso de la siguiente ecuación diferencial:

ÿ = t
Es claro que la ecuación puede escribirse en la forma:
BO

d dy 1 d 2
= t
dt dt 2 dt
o equivalentemente:

dy t2
 
d
− =0
dt dt 2
De aquí resulta entonces claro que la ecuación original tiene la siguiente
cuadratura:

dy t2
f (y, t) =− =k
dt 2
En este caso particular, basta una sola cuadratura para resolver el problema
original (la ecuación diferencial de primer orden resultante es separable), pero en
general se sabe que para tener un sistema completo de ecuaciones se requieren
16 documentos/simo-CoreographiesNBodyProblem.pdf
3.2. Integrales del problema de N-cuerpos 101

como mínimo 2 cuadraturas para una ecuación de segundo orden (esto porque en
realidad las funciones que hay que encontrar son y(t) y ẏ(t)).
Cuando una ecuación diferencial de segundo orden en una variable independi-
ente y(t) puede reducirse a dos cuadraturas decimos que la ecuación es integrable.
Las cuadraturas se llaman, primeras integrales del problema.
Si de lo que hablamos es de un sistema de N ecuaciones diferenciales de se-
gundo orden, harán falta 2N cuadraturas o primeras integrales para reducir el
problema solo a ecuaciones de primer orden.
En ocasiones encontrar las cuadraturas no es un proceso simple. Es necesario
utilizar lo que se conoce en matemáticas como un factor integrante.
Considere por ejemplo la siguiente ecuación diferencial:

ÿ = y

R
Si multiplico a ambos lados por ẏ se obtiene:

ÿẏ = yẏ

O
Que se puede escribir en la forma:

1 d 2 1 d 2
(ẏ ) = (y )
2 dt
D
2 dt
De donde se obtiene la ecuación diferencial equivalente:
A
d 2
(ẏ − y2 ) = 0
dt
Y de aquí la cuadratura:
RR

f (y, ẏ, t) = ẏ2 − y2 = k


Las cuadraturas en ocasiones pueden no ser de utilidad para encontrar directa-
mente la solución al problema. La cuadratura anterior por ejemplo, parece haber
hecho más compleja la solución. Lo que si pueden ofrecer es información sobre
BO

las propiedades de la solución. En el caso anterior, por ejemplo, la ecuación que


representa la cuadratura indica que en un espacio de coordenadas (ÿ, ẏ, y, t), las
soluciones a la ecuación diferencial original se encuentran sobre una hipérbola.
Equivalentemente, se puede saber que sin importar el valor de t, siempre existirá
una relación entre y y ẏ dada por la cuadratura.

3.2.2 Cuadraturas del problemas de los N-cuerpos


En términos de cuadraturas y primeras integrales de movimiento, la solución a
la ecuación diferencial original del problema de los N-cuerpos implica encontrar
entonces 6N cuadraturas. Para ello nos podemos valer bien sea de trucos simples
o de factores integrantes.

3.2.3 Momentum lineal del centro de masa


La primera cuadratura interesante resulta de sumar las ecuaciones diferenciales
que definen el sistema:
102 Chapter 3. El Problema de los N-cuerpos

N mi µ j
∑ mi~r¨i = − ∑ ∑ r3ji
~r ji (3.3)
i =1 i j

En el lado derecho el término en el denominador es simétrico, r ji = rij , mientras


el término en el numerador, r~ji = ~ri −~r j es antisimétrico (el signo cambia al cambiar
el orden de los índices). Como resultado la doble sumatoria será nula y la suma
queda:
N
∑ mi~r¨i = 0 (3.4)
i =1

Esta ecuación puede expresarse de la forma:

R
!
d
dt ∑
˙
mi~ri = 0
i

O
De donde resultan las primeras 3 cuadraturas del problema:

~ ({~ri }, {~r˙i }) =
f CM D ∑ mi~r˙ i = ~P
i

Estas primeras integrales no son otra cosa que las componentes momentum
del centro de masa, ~P. Si bien ya habíamos mencionado esta cantidad antes, en el
A
contexto de nuestro problema, ~ P no es simplemente una cantidad arbitraria, sino
una estricta relación que existe entre las velocidades de todas las partículas del
sistema.
Esta expresión nos permite además demostrar que dado un sistema de N-
RR

cuerpos, existe simple un sistema de referencia inercial, aquel con velocidad


~ = ~P/M (donde M = ∑ mi ), en el cuál el movimiento de las partículas es mucho
V
más simple. Nos referimos al sistema del centro de masa.
Para expresar la ecuación original en términos de las coordenadas del sistema
respecto al centro de masas, debemos, además de la velocidad, encontrar la posi-
BO

ción de las partículas respecto del centro de masa:

~R = ∑ mi~ri
M
En los ejemplos desarrollados en la sección anterior, las posiciones y veloci-
dades siempre fueron expresadas en un sistema de referencia inercial arbitrario.
En lo sucesivo, las posiciones y velocidades siempre estarán referidas al centro de
masa. En el ejemplo a continuación mostramos cuan diferente se ve la solución de
un sistema respecto al sistema arbitrario definido por las condiciones iniciales, y
aquel sistema de referencia del centro de masa.
Primero resolvemos el sistema en el sistema de referencia original:

In [19]: sistema=dict(
particula1=dict(
m=1.0,
r=[0.0,0.0,0.0],
v=[0.0,0.0,0.2]),
3.2. Integrales del problema de N-cuerpos 103

particula2=dict(
m=0.1,
r=[1.0,0.0,0.0],
v=[0.0,1.0,-0.2],
),
particula3=dict(
m=0.1,
r=[0.88,0.0,0.0],
v=[0.0,0.88,0.0],
)
)
Nt=1000
rs,vs,masas,N=solucionNbody(sistema,0.0,10.0,Nt)

Ahora encontramos el momentum, la velocidad y la posición del centro de

R
masa:

In [20]: # Propiedades del centro de masa

O
Masa=np.array(masas).sum()
P=np.zeros((Nt,3))
R=np.zeros((Nt,3))
for n in range(Nt):
for i in range(N):
P[n]+=masas[i]*vs[i,n]
D
R[n]+=masas[i]*rs[i,n]/Masa
A
V=P/Masa

Y con estas propiedades podemos calcular la posición y velocidad de las


partículas relativa al centro de masa:
RR

In [21]: rscm=np.zeros((N,Nt,3))
vscm=np.zeros((N,Nt,3))
for n in range(Nt):
for i in range(N):
rscm[i,n]=rs[i,n]-R[n]
BO

vscm[i,n]=vs[i,n]-V[n]

Ahora podemos comparar la trayectoria de los cuerpos en el sistema de refer-


encia inercial original y en el sistema de referencia del centro de masa:

In [22]: # Graficar en 3D
fig3d=plt.figure(figsize=(10,6))
ax3d_in=fig3d.add_subplot(121,projection='3d')
ax3d_cm=fig3d.add_subplot(122,projection='3d')

for i in range(N):
ax3d_in.plot(rs[i,:,0],rs[i,:,1],rs[i,:,2])
ax3d_cm.plot(rscm[i,:,0],rscm[i,:,1],rscm[i,:,2])

for ax3d in ax3d_in,ax3d_cm:


ax3d.view_init(elev=30,azim=80)
ext=np.abs(rs).max()
ax3d.set_xlim(-ext,ext)
104 Chapter 3. El Problema de los N-cuerpos

ax3d.set_ylim(-ext,ext)
ax3d.set_zlim(-ext,ext)
fig3d.tight_layout()

R
O
D
A
Nótese como respecto al centro de masa, la trayectoria de las partículas es mu-
cho más simple y la relación entre ellas se hace más fácil de entender.
En el problema de los N-cuerpos, las ecuaciones diferenciales originales no se
RR

modifican (en su forma) al pasarnos al sistema de referencia del centro de masa del
sistema. Por la misma razón, en lo sucesivo y a menos que se indique otra cosa, la
descripción de los sistemas estará referida al centro de masa.
En realidad el centro de masa permite definir dos cuadraturas que se pueden
escribir (en el sistema de referencia del centro de masa como):
BO

~f P ({~ri }, {~r˙i }) = ∑ mi~r˙ i = 0


i

~f R ({~ri }, {~r˙i }) = ∑ mi~ri = 0


i

3.2.4 Momentum angular


Una segunda cuadratura puede obtenerse mediante el uso de un factor integrante.
Si tomamos las ecuaciones de movimiento originales y premultiplicamos con pro-
ducto cruz, el vector posición de cada partícula, además de la masa de cada una
de ellas, el resultado será el conjunto de ecuaciones:
( )
µj
mi~ri ×~¨ri = −mi ∑ ~ri ×~r ji
j r3ji
N
3.2. Integrales del problema de N-cuerpos 105

El último término en el lado derecho, ~ri ×~r ji = −~ri × ~r j , es también anti-


simétrico. Como resultado, si sumamos todas las ecuaciones diferenciales obten-
emos la identidad:

∑ mi~ri ×~r¨i = ~0 (3.5)


i

Teniendo en cuenta la propiedad:

d
(~r ×~r˙ i ) = ~ri ×~r¨i
dt i
La ecuación de movimiento conjunta se puede escribir de la forma
!
d
dt ∑
mi~ri ×~r˙ i = 0

R
i

Y de aquí resulta nuestra segunda cuadratura:

O
~f L ({~ri }, {~r˙i }) = ∑ mi~ri ×~r˙ i = ~L
D i

La constante asociada a esta cuadratura no es nada más y nada menos que el


momentum angular total del sistema.
En el sistema de referencia del centro de masa, la dirección del momentum an-
A
gular del sistema define un plano. Es extraño pensar que un sistema formado por
muchos cuerpos restringan su movimiento a un plano (en realidad no lo hacen),
pero este plano puede usarse como el lugar sobre el cuál definir los ejes del sistema
RR

de referencia inercial.
A este plano lo conocemos por el plano invariable de Laplace.
Rotando la figura en 3D anterior puede encontrarse claramente el plano de
Laplace del Sistema.
Considerese el sistema más complejo descrito por las condiciones iniciales
abajo:
BO

In [23]: sistema=dict(
particula1=dict(
m=1.0,
r=[1,0,0],
v=[0,0.5,0]),
particula2=dict(
m=1.0,
r=[-1,0,0],
v=[0,-0.5,0.5],
),
particula3=dict(
m=1.0,
r=[0,1,0],
v=[0,0,1]
)
)
Nt=1000
106 Chapter 3. El Problema de los N-cuerpos

rs,vs,masas,N=solucionNbody(sistema,0.0,10.0,Nt)
rs,vs=in2cm(rs,vs,masas,Nt,N)

Calculemos ahora el momentum angular total del sistema en cada tiempo:

In [24]: L = np.zeros((Nt,3))
for n in range(Nt):
for i in range(N):
L[n]+=masas[i]*np.cross(rs[i,n],vs[i,n])

El momento angular debe ser el mismo en todos los tiempos, de modo que una
gráfica de sus componentes en el tiempo debe producir una línea horizontal o de
muy poca variación:

In [25]: fig=plt.figure()

R
ts=np.linspace(0.0,10.0,Nt)
plt.plot(ts,L[:,0],'bo-')

O
plt.plot(ts,L[:,1],'ro-')

Out[25]: [<matplotlib.lines.Line2D at 0x1269838d0>]


D
A
RR
BO

Gráficamente:

In [26]: # Graficar en 3D
fig3d=plt.figure(figsize=(10,6))
ax3d=fig3d.add_subplot(111,projection='3d')

for i in range(N):
ax3d.plot(rs[i,:,0],rs[i,:,1],rs[i,:,2])
3.2. Integrales del problema de N-cuerpos 107

ax3d.plot([0,L[0,0]],[0,L[0,1]],[0,L[0,2]],'k',ms=10)

ax3d.view_init(elev=30,azim=80)
ext=np.abs(rs).max()
ax3d.set_xlim(-ext,ext)
ax3d.set_ylim(-ext,ext)
ax3d.set_zlim(-ext,ext)
fig3d.tight_layout()

R
O
D
A
RR

3.2.5 Energía
Para la siguiente cuadratura o primera integral debemos primero identificar que
BO

la fuerza gravitacional sobre cada partícula deriva de un potencial:


µj
− (~r −~r j ) = −∇i Vj
|r i − r j |3 i
Donde, en cooredenadas cartesianas, el operador gradiente respecto a las co-
ordenadas de la partícula se escribe ∇i = ∂/∂xi î + ∂/∂yi ĵ + ∂/∂zi k̂. Aquí Vj es
el potencial gravitacional producido por la partícula j-esima en la posición de la
partícula i, Vj = −µ j /|ri − r j | .
Utilizando este hecho, la ecuación de movimiento de la i-esima partícula se
puede escribir de la forma:

mi~r¨i = − ∑ ∇i (mi Vj ) (3.6)


j

mi~r¨i = − ∑ ∇i Uji (3.7)


j
108 Chapter 3. El Problema de los N-cuerpos

Para obtener la primera integral multiplicamos a ambos lados de la ecuación


de movimiento de cada partícula por el factor integrante ~ri ·:

mi~˙ri ·~¨ri = −~˙ri · ∑ ∇i Uji


j

Reconociendo la identidad vectorial ~ri · ∇i Uji = dUji /dt, sumando las ecua-
ciones de movimiento de todas las partículas obtenemos:
! !
d 1 d
dt 2 ∑ dt ∑ ∑ Uji
˙
mi~ri 2
=−
i i j

Si llamamos U al término en la derivada del lado derecho y que podemos es-


cribir como:

R
1 mi µ j
U ({~ri } N ) = − ∑ ∑
2 i j r ji

O
e identificamos en el término en la derivada del lado izquierdo la energía cinética
U ({~ri } N ), de todo el sistema, obtenemos la cuadratura:
D
f E ({~ri }, {~r˙i }) = K ~˙ri N + U ({~ri } N ) ≡ E
 

Que identificamos como la energía mecánica total del sistema de N-cuerpos.


A
Hasta aquí hemos identificado un total de 10 cuadraturas (consideradas como
ecuaciones escalares):
RR

∑ mi~r˙ i = 0 (3.8)
i

∑ mi~ri = 0 (3.9)
i
~˙ri N + U ({~ri } N ) = E
 
K (3.10)
BO

∑ mi~ri ×~r˙ i = ~L (3.11)


i

Con E y ~L constantes determinadas por las condiciones iniciales del sistema.


¿Existirán otras cuadraturas o primeras integrales? La respuesta es negativa.
En el año 1887 H. Bruns en un artículo titulado Über die integrale des Vielkörper-
Problems demostró que no existen otras primeras integrales de movimiento que
puedan expresarse en términos de funciones algebráicas, aparte de las 10 que
hemos deducido. Este resultado fue posteriormente confirmado por H. Poincarè y
se considera como un hecho.
Ahora bien. Dado que para N partículas, son necesarias 6N cuadraturas
(primeras integrales de movimiento), de las cuales podría obtenerse la solución
deseada, a saber las funciones {~ri } N , {~˙ri} N .
Notamos entonces que ni siquiera en el caso de N = 2, no existen suficientes
cuadraturas (se necesitan 12) que permitan conseguir el objetivo deseado. Jacobi
demostró, sin embargo que el problema, tiene adicionalmente otras dos simetrías
3.2. Integrales del problema de N-cuerpos 109

que permiten encontrar 2 relaciones adicionales. Como resultado el problema de


los 2 cuerpos es soluble. La primera solución fue encontrada en 1710 por Johann
Bernoulli y será discutida aquí.
En el caso de N > 2 no hay suficientes cuadraturas para resolver el problema
general de forma cerrada, lo que se ha convertido en uno de los más importantes
problemas de física teóricas en la historia de la física.

3.2.6 El teorema del Virial


La estabilidad a largo plazo de un sistema de N-cuerpos es un tema de gran in-
terés en mecánica celeste. Es posible mostrar que la condición de estabilidad esta
relacionada con el valor promedio de una la función escalar G, definida como:
N

R
G= ∑ pk · rk
k =1

Si factorizamos la derivada obtenemos:

O
N
1 d
G=
2 dt ∑ mk rk · rk
D
k =1

En esta expresión identificamos el momento de inercia del sistema:


N
A
I= ∑ mk rk2
k =1

Lo que conduce a la identidad:


RR

1 dI
G=
2 dt
El rango de valores del escalar G, para valores del tiempo muy largos, puede
escribirse como:
BO

G ( τ ) − G (0)
 
1 τ dG dG
Z
= dt =
τ τ 0 dt dt τ
Esto implica que una forma de la estabilidad a largo plazo de un sistema esta
determinada por la variación del escalar G, que por su relación con el momento de
inercia, depende a su vez de la segunda derivada de esta cantidad:

dG 1 d2 I
=
dt 2 dt2
Derivando obtenemos:

1
Ï = 2K − ∑~ri · ∇i U
2 i

El teorema de Euler para funciones homogéneas17 establece que:


17 http://mathworld.wolfram.com/EulersHomogeneousFunctionTheorem.html
110 Chapter 3. El Problema de los N-cuerpos

 
∂U ∂U ∂U
∑~ri · ∇i U = ∑ xi
∂xi
+ yi
∂yi
+ zi
∂zi
= −U
i i

De donde obtenemos:

1
Ï = 2K + U
2
Este resultado se conoce como el teorema del virial.
Si un sistema es estable a largo plazo el promedio de estas cantidades será:
1
h K i = − hU i
2

R
O
D
A
RR
BO
Chapter 4

El Problema de los dos


cuerpos

R
O
In [1]: from meccel import *
%matplotlib inline

Si bien el problema de los N-cuerpos es la situación más general que pode-


D
mos encontrar en un sistema de partículas interactuantes gravitacionalmente, en
la práctica (en el Universo real) la inmensa mayoría de los sistemas de N-cuerpos
tiene una estructura jerarquica que permite la simplificación en la descripción del
A
sistema.
Consideremos por ejemplo el siguiente sistema de partículas:
In [2]: #Condiciones iniciales
RR

T=10.0
Nt=1000.0
sistema=dict(
particula1=dict(
m=10.0,
r=[1,0,0],
BO

v=[0,1,1]),
particula2=dict(
m=1.0,
r=[1.5,0,0],
v=[0,-3,1],
),
particula3=dict(
m=0.1,
r=[-1,0,0],
v=[0,3,1],
)
)

La solución al sistema se obtiene recogiendo lo aprendido en secciones anteri-


ores sobre integración numérica del sistema de N-cuerpos:
In [3]: tini=0.0
tend=10.0

111
112 Chapter 4. El Problema de los dos cuerpos

Nt=300
rs,vs,masas,N=solucionNbody(sistema,tini,tend,Nt)

Ahora podemos graficar la solución:

In [4]: fig3d = plt.figure()


ax=Axes3D(fig3d)

for i in range(N):
line,=ax.plot(rs[i,:,0],rs[i,:,1],rs[i,:,2])
color=line.get_color()

R
O
D
A
RR
BO

Si ahora representamos el movimiento de las partículas respecto al centro de


masa del sistema el resultado es el siguiente:

In [5]: rscm,vscm=in2cm(rs,vs,masas,Nt,N)
fig3d = plt.figure()
ax=Axes3D(fig3d)

for i in range(N):
line,=ax.plot(rscm[i,:,0],rscm[i,:,1],rscm[i,:,2])
color=line.get_color()

ext=ext=np.abs(rscm).max()
ax.set_xlim(-ext,ext)
ax.set_ylim(-ext,ext)
ax.set_zlim(-ext,ext)

Out[5]: (-2.1413054520246635, 2.1413054520246635)


113

R
O
D
Este sistema, que es similar a lo que sería un sistema formado por planetas
A
alrededor de una estrella, presenta un comportamiento que parece perfectamente
predecible, al menos cuando se consideran por separado los movimientos de la
partícula 2 respecto a la partícula 1 o la partícula 3 respecto a la partícula 1. Lla-
mamos a este tipo de sistemas, sistemas jerarquicos de N-cuerpos.
RR

El tratamiento analítico de este tipo de sistemas se ha hecho en la historia me-


diante el estudio de tres aspectos del problema:

• El problema de los dos cuerpos. Nótese que el sistema anterior puede verse
como un sistema de 2 sistemas de dos cuerpos. Si podemos resolver el prob-
BO

lema de los dos cuerpos, podemos describir aproximadamente el sistema an-


terior.

• El problema restringido de los tres cuerpos. En algunos sistemas hay dos


partículas que dominan gravitacionalmente el sistema y el resto de partícu-
las tienen masa despreciable. En estos casos una descripción más sofisticada
puede hacerse con el formalismo del problema de los tres cuerpos que estu-
diaremos más adelante.

• Teoría de perturbaciones. Una vez un sistema de N-cuerpos es descrito


como un conjunto jerárquico de sistemas de dos cuerpos, la descripción del
sistema puede hacerse usando la denominada teoría de perturbaciones, que
describe como cambian las propiedades de los sistemas de dos cuerpos im-
plicados en el sistema por efecto de pequeñas perturbaciones de los otros
cuerpos. La teoría de perturbaciones esta más allá del nivel de este curso y
es vista normalmente en cursos de astrodinámica avanzada.
114 Chapter 4. El Problema de los dos cuerpos

4.1 Formulación
Consideremos dos cuerpos m1 y m2 en posiciones ~r1 y ~r2 medidas respecto a un
orígen inercial. Asumiendo que la única interacción es de tipo gravitacional, las
ecuaciones de movimiento para cada partícula son

Gm
~r¨1 = 3 2~r (4.1)
r
Gm
~r¨2 = − 3 1~r (4.2)
r

R
Donde hemos utilizado la definición ~r = ~r2 −~r1 que usamos en la sección 2.3.2.

O
La primera propiedad interesante resulta al restar estas dos ecuaciones y teniendo
en cuenta que ~r¨ = ~r¨2 −~r¨1 :
D
µ
~r¨ = − 3~r
A
r
RR

donde hemos definido µ ≡ G (m1 + m2 ) y que llamaremos en lo sucesivo el


parámetro gravitacional del sistema de dos partículas.
Como vemos la simetría del sistema de dos cuerpos alrededor del centro de
masa permite reducir el problema de dos ecuaciones diferenciales vectoriales de
segundo orden (12 cantidades a determinar), a solo una ecuación (6 cantidades
BO

a determinar, x, y, z, v x , vy , vz ). Es decir el problema de los dos cuerpos se puede


resolver simplemente resolviendo la ecuación relativa.
Una vez obtenida la solución a la ecuación anterior es posible retornar a la
posición de los dos cuerpos usando las relaciones deducidas en la sección 2.3.2:

m2
~r1 = ~R − ~r (4.3)
M
m
~r2 = ~R + 1~r (4.4)
M

Donde ~R = ~R(0) + ~
PCM t/(m1 + m2 ) es la posición del Centro de Masa del
sistema de partículas.
4.2. Constantes de movimiento del problema de los dos cuerpos 115

R
Figure 4.1: Relación entre las posiciones de dos partículas, su centro de masa y el

O
vector relativo
D
Si queremos obtener la solución a este problema usando el método de cuadrat-
uras, es necesario entonces encontrar 6 constantes de movimiento (cuadraturas). El
proceso de reducción que realizamos hace inviable que podamos usar las mismas
cuadraturas que deducimos para el problema de los N-cuerpos.
A
4.2 Constantes de movimiento del problema de los
RR

dos cuerpos
Podemos tomar la ecuación original y premultiplicar por el factor integrante ~r ×
que se integra trivialmente para dar:
BO

d
(~r ×~r˙ ) = 0
dt
El término entre paréntesis es una constante. Sin embargo no esta asociado con
ninguna cantidad física del sistema concreta pero su estructura nos recuerda el
momentum angular del sistema. Por esta misma razón la llamaremos el momentum
angular específico:

~h ≡ ~r ×~r˙ (4.5)
˙ concluimos que el movimiento del vector
Ya que ~h es perpendicular a ~r y ~r,
relativo del sistema ocurre sobre un plano. Si nos pasamos al sistema de referencia
del centro de masa esto implica además que las partículas se mueven sobre un
plano. Este es el plano invariante de Laplace para el problema y será en lo sucesivo
el plano respecto al que describiremos el movimiento del sistema.
Respecto al plano invariante de Laplace la posición y velocidad se puede es-
cribir como:
116 Chapter 4. El Problema de los dos cuerpos

~r = r aˆr (4.6)
~r˙ = ṙ aˆr + r θ̇ aˆθ (4.7)

De modo que hemos reducido el tamaño del problema de 12 variables a 6 (por


la simetría respecto al centro de masa) y ahora a 4 (x, y, v x , vy o r, θ, ṙ, θ̇) al describir
el sistema en el plano de Laplace.
el momento angular específico se puede escribir como ~h = (0, 0, h), donde

h = r2 θ̇
Intentemos encontrar una nueva constante de movimiento, ahora a través de
un producto escalar.

R
µ
~r˙ ·~r¨ = − 3~r˙ ·~r (4.8)
r

O
µ
~r˙ ·~r¨ = − 2~r˙ · aˆr (4.9)
r
el producto punto en el segundo miembro de la última expresión, es la compo-
nente radial de la velocidad ~r˙ · aˆr = ṙ
D
µ
~r˙ ·~r¨ = − 2 ṙ
A
r
expresando lo último en términos de derivadas temporales
 
d 1 ˙2 d µ
RR

~r =
dt 2 dt r
de manera que
 
d 1 ˙2 µ
~r − =0
dt 2 r
BO

De aquí se deduce una nueva constante de movimiento:

1 µ
e ≡ ~r˙ 2 −
2 r
Que en términos de las componentes explícitas es e = (v2x + v2y )/2 − µ/r o bien
e = (ṙ2 + r2 θ̇ 2 )/2 − µ/r.
Por su similaridad con la energía llamaremos a esta la energía mecánica específica
del sistema.
Finalemte calculemos el producto ~r¨ × ~h.
µ
~r¨ × ~h = − 3~r × ~h
r
como ~h es constante, el miembro de la izquierda se puede escribir como

d
~r¨ × ~h = (~r˙ × ~h)
dt
4.3. Solución explícita al problema de los dos cuerpos 117

y el miembro de la derecha queda, después de aplicar identidades vectoriales,


como

~r × ~h = ~r × (~r ×~r˙ ) (4.10)


= ~r (~r ·~r˙ ) −~r˙ (~r ·~r ) (4.11)
= ~rrṙ −~rr ˙ 2 (4.12)
Reemplazando e integrando queda,

!
d ˙ ~ ~rṙ ~r˙
(~r × h) = −µ 2 − (4.13)
dt r r
 
d ˙ ~ d ~r

R
(~r × h) = µ (4.14)
dt dt r
finalmente

O
 
d ˙ ~ ~r
~r × h − µ = ~0 (4.15)
dt rD
De donde deducimos que la constante de movimiento es:

~ ≡ ~r˙ × ~h − µ~r
A (4.16)
A
r
que se conoce como el vector de Laplace-Runge-Lenz (LRL). Notemos que este
vector esta siempre sobre el plano de la órbita.
RR

El vector LRL aporta en realidad dos constantes de movimiento para la solución


al problema.
Tenemos entonces todos los elementos para resolver el problema. Necesitamos
determinar 4 cantidades r, θ, ṙ, θ̇ y para ello tenemos las siguientes cuadraturas:
• Momentum angular específico, h = r2 θ̇ 2 .
BO

• Energía específica, e = (ṙ2 + r2 θ̇ 2 )/2 − µ/r


~ ≡ ~r˙ × ~h − µ~r/r
• Vector LRL, A
En principio tenemos todos los elementos para resolver el problema.
Puede probarse que existe esta relación interesante entre las constantes de
movimiento del sistema:
s
A 2eh2
= 1+ 2
µ µ

4.3 Solución explícita al problema de los dos


cuerpos
Para obtener una solución explícita al problema de los dos cuerpos, es decir, una
ecuación que nos permita calcular la relación entre las coordenadas en el plano del
vector relativo.
118 Chapter 4. El Problema de los dos cuerpos

Para encontrar respuesta a esta pregunta averiguemos la dirección del vector


~ Para ello podemos recurrir a calcular el producto punto de A
A. ~ con ~r:

~ = ~r · (~r˙ × ~h) − µ~r · ~r


~r · A
r
Utilizando la propiedad cíclica del tripe producto escalar obtenemos:

~r · (~r˙ × ~h) = ~h · (~r ×~r˙ ) (4.17)


= ~h · ~h (4.18)
= h2 (4.19)

De donde lo anterior:

R
h2
 
~ =µ
~r · A −r
µ

O
~
Si definimos ~e ≡ A/µ obtenemos:

h2
~r ·~e = −r
D
µ
Si ahora hacemos ~r ·~e = re cos θre , la anterior ecuación se puede escribir como:
A
h2 /µ
r= (4.20)
1 + e cos θre
RR

Es decir, buscando la dirección del vector A ~ o equivalente el vector ~e hemos


encontrado una ecuación en coordenadas polares que nos da el lugar geométrico
en el que se encuentra el vector relativo del problema de los dos cuerpos a lo largo
de la trayectoria.
Que ahora sabemos muy bien que se trata de la ecuación de una cónica con las
siguientes propiedades:
BO

• Semilatus rectum, p = h 2 /µ.


• Excentricidad, e = |~e| = ~r˙ × ~h − µ~r/r

• Anomalía verdadera, f = θre

De aquí se deduce que la dirección del vector LRL es la dirección del periapsis
y la magnitud es proporcional a la excentricidad, a saber A = µe.
Estas son las propiedades de la óirbita descrita por el vector relativo. ¿Cómo es
la órbita de cada uno de los cuerpos?. Si nos paramos en el sistema de referencia
del centro de masa, la posición de los cuerpos será:

m2
~r1 = − ~r (4.21)
M
m
~r2 = + 1~r (4.22)
M
(4.23)
4.4. Las teoremas del movimiento planetario de Newton 119

Como puede verse aquí, la ecuación de la trayectoria de cada cuerpo sería:

(m2 /M)h2 /µ
r1 = (4.24)
1 + e cos f 1
(m1 /M)h2 /µ
r2 = (4.25)
1 + e cos f 2
(4.26)

Donde f 2 es el mismo f del vector relativo y f 1 = f 2 + π.


Como puede verse, los dos cuerpos tienen también, en el sistema del centro de
masa y el plano invariante de Laplace, trayectorias cónicas. Las excentricidades
de ambos cuerpos son exactamente las mismas, pero el tamaño de las órbitas es

R
diferente:

m2

O
a1 = a (4.27)
M
m
a2 = 1 a (4.28)
DM

4.4 Las teoremas del movimiento planetario de


Newton
A
El resultado anterior es histórico y fue la motivación original que llevo a Newton
a escribir los Principia, a saber, probar que si dos cuerpos se atraen con una fuerza
RR

que va como el inverso del cuadrado de la distancia entre ellos, su movimiento


sigue una elipse.
Si bien estas ideas habían sido intuidas ya por Johanes Kepler, es realmente la
teoría Newtoniana del movimiento el que eleva este resultado a la altura de leyes o
mejor teoremas del movimiento bajo la influencia de la gravedad. Las llamaremos
mejor teoremas porque en realidad pueden probarse por dedución a partir de las
BO

leyes fundamentales del movimiento.


A estos teoremas, que son la versión rigurosa de las denominadas leyes de Kepler
(que en realidad eran solo leyes empíricas específicas) las llamaremos aquí, las
teoremas de Newton del movimiento planetario y aplican a cualquier problemas
de dos cuerpos (El Sol y un planeta, dos estrellas binarias, una planeta y una luna,
etc.)

• Primera teorema: El movimiento relativo de dos cuerpos que se atraen


con una fuerza de acción instantánea y que disminuye como el inverso del
cuadrado de la distancia, sigue una trayectoria cónica.

• Segundo teorema: El vector relativo barre áreas iguales en tiempos iguales,


o equivalentemente, la velocidad areal del vector relativo es constante e igual
a:

dA h
=
dt 2
120 Chapter 4. El Problema de los dos cuerpos

Donde h = |~r × ~r˙ | donde la posición y la velocidad se calculan en cualquier


instante del movimiento.

• Tercer teorema (corolario): Para casos en los que la órbita es elíptica (e < 1),
el producto del cuadrado de la velocidad angular promedio (mean angular
motion), n ≡ 2π/T (donde T es el período de revolución) y el cubo del
semieje mauor a es constante:

n2 a3 = µ

Donde µ = G (m1 + m2 ).

Este última corolario es particularmente útil y como su nombre lo indica no es


independiente de los anteriores. Podemos partir del segundo teorema y expresarlo

R
no en términos diferenciales sino en terminos de un tiempo finito ∆t:

O
∆A =
h∆t
2
Teniendo en cuenta que el área de una elipse es A = πab, una revolución com-
pleta se cumplirá la relación:

πab =
D 1
hT
2
A
Sabiendo que para una elipse b = a (1 − e2 ) y como demostramos antes h2 =
p

µp = µa(1 − e2 ), es fácil probar el resultado búscado.


Una manera alternativa (realmente la original de Kepler) consiste en escribir
RR

esta ley en términos del período y queda:

T2 4π 2
= (4.29)
a3 µ
Es importante señalar que el semiejemayor que aparece en esta ecuación no es
BO

el semiejemayor de la órbita de cualquiera de los dos cuerpos, sino el del vector


relativo.

4.5 La velocidad en el problema de los dos cuerpos


La velocidad relativa en el problema de los dos cuerpos merece un tratamiento
especial.
Si partimos de la energía relativa específica

v2 µ
e= −
2 r
El propósito es encontrar el valor de e como función de otras propiedades de
la órbita. Tomemos por ejemplo el caso del periapsis. Allí el momentum angular
específico es:

h = |~r ×~r˙ | = qv
4.5. La velocidad en el problema de los dos cuerpos 121

donde q = p/(1 + e) es la distancia al periapsis. En el periapsis la energía


específica es:

(h/q)2 µ
e= −
2 q

Para el caso de una parábola e = 0 es fácil probar que e = 0. En los demás ca-
sos la manipulación algebraica de la expresión anterior conduce al resultado muy
general y útil:

µ
e=−
2a

R
Esta expresión permite escribir la rapidez de un cuerpo en una cónica en fun-
ción de la distancia al centro de masa de una forma muy general:

O
 
2 1
v2 = µ −
D r a

A esta relación se la conoce universalmente como la vis-viva.


A
Una interesante consecuencia de la vis viva es que si se tiene una condición
inicial en la cual r es fijo, pero la velocidad v tiene dirección arbitraria el valor del
semiejemayor de la órbita resultante será siempre el mismo:
RR

µ
a=
2µ/r − v2

¿Cuál es la dirección de ~v?. Podemos usar para ello el vector ~h:


BO

h = |~r ×~r˙ | = vr sin φ

Donde φ es la dirección relativa del vector ~v relativa al vector ~r. Llamamos a φ


el argumento de v y está dado por:

h
sin φ =
rv

Esta expresión nos da el argumento de la velocidad como función de la anoma-


lía verdadera f . La dirección de la velocidad respecto al sistema de referencia
natural de la cónica es simplemente:

θv = φ + f
122 Chapter 4. El Problema de los dos cuerpos

R
O
D
Figure 4.2: Definición del argumento de la velocidad
A
4.6 Simulaciones numéricas y predicciones
analíticas
RR

Con la descripción anterior, podemos poner a prueba nuestra hipótesis al principio


de esta sección sobre el hecho de que un sistema jerárquico puede descomponerse
en varios sistemas de dos cuerpos.
Para ellos volvamos sobre el sistema estudiado originalmente:

In [7]: #Condiciones iniciales


BO

T=10.0
Nt=1000.0
sistema=dict(
particula1=dict(
m=10.0,
r=[1,0,0],
v=[0,1,1]),
particula2=dict(
m=1.0,
r=[1.8,0,0],
v=[0,-3,1],
),
particula3=dict(
m=0.1,
r=[-1,0,0],
v=[0,3,1],
)
)
4.6. Simulaciones numéricas y predicciones analíticas 123

tini=0.0
tend=10
Nt=100
rs,vs,masas,N=solucionNbody(sistema,tini,tend,Nt)
rscm,vscm=in2cm(rs,vs,masas,Nt,N)

fig=plt.figure(figsize=(6,6))
ax=fig.gca()
for i in range(N):ax.plot(rscm[i,:,0],rscm[i,:,1])
ext=ext=np.abs(rscm[:,:,:2]).max()
ax.set_xlim(-ext,ext)
ax.set_ylim(-ext,ext)

Out[7]: (-2.2061734200733785, 2.2061734200733785)

R
O
D
A
RR
BO

Descompongamos el sistema en dos sistemas de dos cuerpos: el formado por


la partícula 1 y la partícula 2 y el sistema formado por la partícula 1 y la partícula
3.
In [8]: mu=masas[0]+masas[1]

Para comprobar nuestra descripción debemos construir el vector relativo y su


velocidad por ejemplo en el sistema 1-2:
124 Chapter 4. El Problema de los dos cuerpos

In [9]: r=rscm[1,:,:]-rscm[0,:,:]
v=vscm[1,:,:]-vscm[0,:,:]

Verifiquemos si las constantes de movimiento del sistema se conservan real-


mente:

4.6.1 Momentum angular específico


In [10]: h=np.array([spy.vcrss(r[i,:],v[i,:]) for i in range(Nt)])
plt.figure()
plt.plot(h[:,2])

R
Out[10]: [<matplotlib.lines.Line2D at 0x119a587b8>]

O
D
A
RR
BO

4.6.2 Energía específica


In [11]: epsilon=np.array([0.5*spy.vnorm(v[i,:])**2-mu/spy.vnorm(r[i,:]) for i in range(Nt)]
plt.figure()
plt.plot(epsilon)

Out[11]: [<matplotlib.lines.Line2D at 0x119a51d68>]


4.6. Simulaciones numéricas y predicciones analíticas 125

R
O
D
4.6.3 Vector LRL
A
In [12]: e=np.array([spy.vcrss(v[i,:],h[i,:])-mu*r[i,:]/spy.vnorm(r[i]) for i in range(Nt)])
plt.figure()
plt.plot(e[:,0])
RR

plt.plot(e[:,1])

Out[12]: [<matplotlib.lines.Line2D at 0x11bf4b908>]


BO
126 Chapter 4. El Problema de los dos cuerpos

Hasta ahora todo se cumple. Veamos ahora cuáles son las propiedades
predichas para este sistema:

In [13]: ecc=spy.vnorm(e[0])
print("Eccentricidad = ",ecc)
p=spy.vnorm(h[0])**2/mu
print("Semilado recto = ",p)
a=p/(1-ecc**2)
print("Semi eje mayor = ",a)
n=np.sqrt(mu/a**3)
print("Velocidad angular promedio = ",n)

R
O
Eccentricidad = 0.1636363636363637
Semilado recto = 0.9309090909090911
Semi eje mayor = 0.956521739130435
D
Velocidad angular promedio = 3.5453088548154796
A
Hasta ahora todo parece razonable pero la verdadera prueba de fuego se pro-
RR

duce si comparamos la trayectoria elíptica predica para el vector relativo con la


verdadera trayectoria del vector relativo:

In [14]: f=np.linspace(0,2*np.pi,100)
BO

rmag=p/(1+ecc*np.cos(f))
x=rmag*np.cos(f)
y=rmag*np.sin(f)

In [15]: fig=plt.figure(figsize=(6,6))
ax=fig.gca()

#Posición según la simulación


ax.plot(r[:,0],r[:,1],'r+')
#Posición teórica
ax.plot(x,y,'k--')

ext=ext=np.abs(r).max()
ax.set_xlim(-ext,ext)
ax.set_ylim(-ext,ext)
ax.grid()
4.6. Simulaciones numéricas y predicciones analíticas 127

R
O
D
A
RR

La coincidencia es asombrosamente buena.


Pero ¿coincidiran también las posiciones de los cuerpos individuales?. Pode-
mos hacer esto usando las ecuaciones que nos dan el vector posición de cada
cuerpo a partir de la posición del vector relativo:
BO

In [16]: x1=-masas[1]/mu*x
y1=-masas[1]/mu*y

x2=masas[0]/mu*x
y2=masas[0]/mu*y

Comparemos ahora gráficamente las posiciónes calculadas con las predichas


teóricamente:

In [17]: fig=plt.figure(figsize=(6,6))
ax=fig.gca()

#Numéricas
ax.plot(rscm[0,:,0],rscm[0,:,1],'r+',lw=3)
ax.plot(rscm[1,:,0],rscm[1,:,1],'g+',lw=3)

#Teóricas
128 Chapter 4. El Problema de los dos cuerpos

ax.plot(x1,y1,'k--')
ax.plot(x2,y2,'k--')

ext=np.abs(rscm[:2,:,:2]).max()
ax.set_xlim(-ext,ext)
ax.set_ylim(-ext,ext)

Out[17]: (-1.0185026604961642, 1.0185026604961642)

R
O
D
A
RR
BO

De nuevo la coincidencia es bastante buena.


Para la partícula 3, no podemos calcular el sistema formada por ella con la
partícula 1, sino con el centro de masas de las partícula 1 y 2.
In [18]: rcm12=(masas[0]*rscm[0]+masas[1]*rscm[1])/(masas[0]+masas[1])

In [19]: r=rscm[2,:,:]-rcm12
v=vscm[2,:,:]-rcm12
h=np.array([spy.vcrss(r[i,:],v[i,:]) for i in range(Nt)])
epsilon=np.array([0.5*spy.vnorm(v[i,:])**2-mu/spy.vnorm(r[i,:]) for i in range(Nt)]
e=np.array([spy.vcrss(v[i,:],h[i,:])-mu*r[i,:]/spy.vnorm(r[i]) for i in range(Nt)])
ecc=spy.vnorm(e[0])
print("Eccentricidad = ",ecc)
p=spy.vnorm(h[0])**2/mu
4.6. Simulaciones numéricas y predicciones analíticas 129

print("Semilado recto = ",p)


a=p/(1-ecc**2)
print("Semi eje mayor = ",a)
n=np.sqrt(mu/a**3)
print("Velocidad angular promedio = ",n)

Eccentricidad = 0.034821974426422826
Semilado recto = 2.142852987615105
Semi eje mayor = 2.1454545011713835
Velocidad angular promedio = 1.0554007034461281

In [20]: plt.figure()
plt.plot(h[:,2],label=r'$h$')
plt.plot(epsilon,label=r'$\epsilon$')

R
plt.plot(e[:,0],label=r'$e_x$')
plt.plot(e[:,1],label=r'$e_y$')
plt.legend()

O
Out[20]: <matplotlib.legend.Legend at 0x11c236748>
D
A
RR
BO

In [21]: f=np.linspace(0,2*np.pi,100)
fo=np.pi
rmag=p/(1+ecc*np.cos(f+fo))
x=rmag*np.cos(f)
y=rmag*np.sin(f)

fig=plt.figure(figsize=(6,6))
ax=fig.gca()
130 Chapter 4. El Problema de los dos cuerpos

#Posición según la simulación


ax.plot(r[:,0],r[:,1],'r+')
#Posición teórica
ax.plot(x,y,'k--')

ext=ext=np.abs(r).max()
ax.set_xlim(-ext,ext)
ax.set_ylim(-ext,ext)
ax.grid()

R
O
D
A
RR
BO

Las discrepancias son atribuibles a las perturbaciones gravitacionales de la


partícula 2.

4.7 El problema de los dos cuerpos en el tiempo


Hemos resuelto el problema de los dos cuerpos desde una perspectiva geométrica.
Está solución muestra que el movimiento de dos partículas producto de su in-
teracción gravitacional es una cónica que con foco en el centro de masa del sistema.
Como vimos, la relación entre la coordenada radial y la anomalía verdadera es
4.7. El problema de los dos cuerpos en el tiempo 131

h2 /µ
r= (4.30)
1 + e cos f

Sin embargo la variable temporal no aparece explicitamente en esta ecuación,


aunque es claro que implícitamente las variables f y r dependenderán de t.
¿Cómo es esa dependencia?
En esta sección queremos resolver este problema que nos permitirá, entre otras
cosas acceder a uno de los premios más preciados de la mecánica celeste, a saber
la capacidad de predecir la posición futura de sistemas jerarquicos de N-cuerpos

R
como el Sistema Solar.

O
4.7.1 Una deducción geométrica
D
La primera solución a este problema se la dedemos al mismísimo Johanes Kepler.
A
Como era el estilo de la época, Kepler resolvió la pregunta de cuál era la posición
del cuerpo en el tiempo usando únicamente métodos geométricos. La deducción
presentada aquí naturalmente tiene elementos modernos pero sigue las líneas gen-
RR

erales de la deducción original de Kepler.


Como es de esperarse la deducción de Kepler aplica exclusivamente para el
caso de una elipse, que era la cónica de interés para Kepler.
La primera pregunta que debemos hacernos es ¿cuál propiedad geométrica del
movimiento de la partícula sobre la elipse puede predecirse con precisión en el
tiempo?. Examinando los teoremas del movimiento planetario de Newton nos
BO

damos cuenta que la única cantidad con esta propiedad es el área barrida por el
radio vector:

h
∆A = (t − t p )
2

Donde ∆A es el área barrida por el radio vector entre el paso de la partícula


por el periapsis (que ocurre en el tiempo t p ) y el punto en el que se encuentra en el
tiempo t.
Naturalmente el área barrida por el radio vector dependerá también de la
anomalía verdadera f . Si logramos encontrar una relación entre f y ∆A podremos
a través de la ecuación anterior encontrar la relación entre f y t.
Consideremos la siguiente construcción geométrica:
132 Chapter 4. El Problema de los dos cuerpos

R
O
D
A
**
En este gráfico el área ∆A corresponde al área del sector de elipse PQF:
RR

∆A = APQF
El área de la región comprendida por PQM se relaciona con el área de la región
RQM delimitada por la circunferencia circunscrita así:

b
APQM = A
a RQM
BO

De allí el área que buscamos será simplemente:

b
APQF = APQM − APFM = A − APFM
a RQM
De otro lado el área de la región RQM se puede calcular a partir del área del
círculo circunscrito como:

ARQM = ARQC − ARMC


Por lo que el área buscada se puede escribir como:

b
APQF = (A − ARMC ) − APFM
a RQC
Nótese que las áreas en las que hemos logrado expresar el áreas del sector de
elipse son todas áreas de figuras geométricas conocidas (sector de círculo y trían-
gulos). Las áreas de estas figuras pueden calcularse ahora usando la anomalía
excéntrica (que sabemos tiene una relación directa con la anomalía verdadera) así:
4.7. El problema de los dos cuerpos en el tiempo 133

1 2
ARQC = a E (4.31)
2
1 1
ARMC = a cos Ea sin E = a2 cos E sin E (4.32)
2 2
1 1
APFM = ( ae − a cos E)b sin E = ( abe sin E − ab cos E sin E) (4.33)
2 2
(4.34)

Reemplazando y después de unas cancelaciones asimbrosas llegamos a la


ecuación:

APQF = ab( E − e sin E)

R
Si usamos el segundo teorema de Newton obtenemos:

h 1

O
(t − t p ) = ab( E − e sin E)
2 2
Usando el tercer teorema a3 n2 = µ permite escribir finalmente la ecuación an-
D
terior como:

n(t − t p ) = E − e sin E
A
Que al resolverla numéricamente (es una ecuación trascendental) permite
obtener la anomalía excéntrica E a partir del tiempo t.
Como era de esperarse esta ecuación se conoce como la Ecuación de Kepler.
RR

4.7.2 Una deducción analítica


Otra forma de deducir la ecuación de Kepler, que como vimos es la ecuación que
permite resolver el problema en el tiempo, utiliza métodos de la mecánica newto-
niana y el cálculo integral. Aunque no es tan elegante como la solución geométrica,
BO

la reproducimos aquí como una muestra de la validez universal de esta relación.


En cualquier punto de la órbita es cierto que ~r = rr̂ y ~r˙ = ṙr̂ + r θ̇ θ̂. De manera
que

~h = r2 θ̇ k̂

entonces

dθ h
= 2 (4.35)
dt r
reemplazando y separando variables obtenemos

µ2 dθ 0
Z θ
(t − t p ) = (4.36)
h3 θ =0 (1 + e cos θ 0 )2
A la constante de integración t p le llamamos, tiempo de paso por el periapsis.
La integración de esta ecuación dependerá de los valores de e.
134 Chapter 4. El Problema de los dos cuerpos

De una tabla de integrales (por ej. Standard Mathematical Tables and Formulae,
Zwillinger 2003) se halla que :

dθ e sin θ 1 dθ
Z Z
2
= 2 − 2 (4.37)
(1 + e cos θ ) (e − 1)(1 + e cos θ ) e − 1 1 + e cos θ
y además,

"√ #
dθ 2 1 − e2 tan 2θ
Z
− 1
= √ tan si 0 < e < 1 (4.38)
1 + e cos θ 1 − e2 1+e
"√ #
1 e2 − 1 tan 2θ + 1 + e
= √ ln √ si e > 1 (4.39)
e2 − 1 e2 − 1 tan 2θ − 1 − e

R
Para el caso 0 < e < 1 la integral queda como:

O
" ! √ #
dθ 0
r
1 1−e e 1 − e2 sin θ
Z θ
θ
= 2 tan−1 tan −
θ =0 (1 + e cos θ 0 )2 (1 − e2 )3/2 D 1+e 2 1 + e cos θ
(4.40)
y reemplazando queda:
A
" r ! √ #
µ2 1 1−e θ e 1 − e2 sin θ
(t − t p ) = 2 tan−1 tan −
h3 (1 − e2 )3/2 1+e 2 1 + e cos θ
RR

" r ! √ #
µ2 1−e θ e 1 − e2 sin θ
(1 − e2 )3/2 (t − t p ) = 2 tan−1 tan − (4.41)
h3 1+e 2 1 + e cos θ

teniendo en cuenta que h2 /µ = a(1 − e2 ), el lado izquierdo queda como


BO

µ2
r
2 3/2 µ
(1 − e ) ( t − t p ) = (t − t p ) = n(t − t p ) (4.42)
h3 a3
Podemos definir una variable angular auxiliar para describir físicamente el de-
splazamiento angular de un cuerpo ficticio en una órbita circular, cuyo centro co-
incide con el centro geométrico de la elipse. A esta nueva variable auxiliar la lla-
maremos Anomalía media definida como

M = n(t − t p ) (4.43)
En términos de la anomalía media ls integrales anteriores quedan:
" r ! √ #
−1 1−e θ e 1 − e2 sin θ
M = 2 tan tan − (4.44)
1+e 2 1 + e cos θ
Busquemos simplificar esta última expresión usando la anomalía excéntrica E.
Sabemos que
4.7. El problema de los dos cuerpos en el tiempo 135

r = a(1 − e cos E)
y ya que r = a(1 − e2 )/(1 + e cos θ ) se sigue que

e + cos θ
cos E = (4.45)
1 + e cos θ
y de la identidad pitagórica

1 − e2 sin θ
sin E = (4.46)
1 + e cos θ
También habíamos demostrado que

R
r
θ 1+e E
tan = tan (4.47)
2 1−e 2

O
de manera que
r !
−1 1−e θ
E = 2 tan tan (4.48)

Comprando se obtiene finalmente


D 1+e 2
A
M = E − e sin E (4.49)
RR

4.7.3 Solución a la ecuación de Kepler


Existen múltiples métodos para la solución de la ecuación de Kepler, y todos se car-
acterizan por la necesidad de recurrir a cálculos numéricos en todas las situaciones
prácticas. Una gran cantidad de estas soluciones consisten en expresar la anoma-
lía excéntrica en una serie de potencias en la excentricidad. Podemos derivar una
BO

primera solución en series considerando un método iterativo de la forma

Ei+1 = M + e sin Ei i = 0, 1, 2, ... (4.50)


tomando a E0 = M como una primera aproximación. Entonces

E1 = M + e sin M (4.51)
E2 = M + e sin( M + e sin M ) (4.52)

de esta última expresión vemos que

E2 = M + e sin( M + e sin M ) = M + e[sin M cos(e sin M ) + sin(e sin M) cos M]

como cos x = 1 − x2 /2 + x4 /4! y sin x = x − x3 /6 + x5 /5!, podemos aproximar


el valor de E2 hasta O(e2 )
136 Chapter 4. El Problema de los dos cuerpos

1
E2 ≈ M + e sin M + e2 sin 2M (4.53)
 2 
1 2
E3 ≈ M + e sin M + e sin M + e sin 2M (4.54)
2

manteniendo términos hasta O(e3 )


 
1 1 3
E3 ≈ M + e − e3 sin M + e2 sin 2M + e3 sin 3M
8 2 8
vemos, de la regularidad de la solución, que la solución a la ecuación de Kepler
puede expresarse como una serie de Fourier como

R

E = M+ ∑ an en
n =1

O
donde

f loor (n/2)
1 1
∑ (−1)k (n − 2k)n−1 sin[(n − 2k) M]
an =
2n −1 k =0
D
(n − k)!k!
esta serie, solo converge para valores de e < 0.6627434.... A esta cota maximal
A
para e se le conoce como el límite de Laplace. \
Existe otra solución en serie de potencias que converge para valores de e < 1 y
que se expresa en terminos de las funciones de Bessel de primera especie así,
RR


2
E = M+ ∑ n
Jn (ne) sin(nM) (4.55)
n =1

donde

(−1)k  x n+2k
BO

Jn ( x ) = ∑ (n + k)!k! 2
k =0

4.7.4 Síntesis del cálculo de la posición del sistema en el


tiempo
Con todos los elementos recopilados hasta ahora podemos escribir un sencillo al-
goritmo que nos permite a partir de las posiciones y velocidades iniciales de dos
cuerpos que interactúan gravitacionalmente, determinar su posición en cualquier
instante del tiempo futuro.
El algoritmo sería el siguiente:

1. Partimos de conocer las masas m1 y m2 y las condiciones iniciales de las


partículas (relativas al centro de masa): ~r1 (0), ~v1 (0), ~r2 (0), ~v2 (0).

2. A partir de ellas podemos calcular las condiciones iniciales del sistema rela-
tivo: µ = G (m1 + m2 ), ~r (0) = ~r2 (0) −~r1 (0), ~v(0) = ~v2 (0) − ~v1 (0).
4.8. El problema de los dos cuerpos en el espacio 137

3. Usando las condiciones iniciales podemos determinar p las constantes de


movimiento del sistema: h = |~r × ~v|, e = v2 /2 − µ/r, e = 1 + 2eh2 /µ2 .
4. De las condiciones iniciales podemos
p obtener dos propiedades derivadas:
2 2
p = h /µ, a = p/(1 − e ), n = µ/a .3

5. Dado un tiempo t, resolviendo la ecuación de Kepler podemos obtener la


anomalía excéntrica del sistema E
NOTA: asumiremos t p = 0 lo que implica que el tiempo t es en realidad el
tiempo transcurrido desde el paso de la partícula por el periapsis).
6. Usando la anomalía excéntrica ppodemos obtener la anomalía verdadera us-
ando la relación: tan( f /2) = (1 + e)/(1 − e) tan( E/2).
7. Con la anomalía verdadera podemos calcular la magnitud del vector posi-

R
ción: r = p/(1 + e cos f )
8. Con la magnitud del vector posición podemos calcular las coordenadas del

O
sistema relativo en el plano de la órbita: x = r cos f , y = r sin f .
9. Usando la vis-viva podemos ahora determinar la magnitud del vector veloci-
D
dad: v2 = µ(2/r − 1/a)
10. Calculamos ahora el argumento de la velocidad: sin φ = h/(rv)
A
11. Con el argumento de la velocidad determinamos la dirección del vector ve-
locidad respecto al eje x (dirección del vector LRL o dirección del periapsis):
θv = f + φ.
RR

12. Con la dirección de la velocidad podemos calcular las componentes: v x =


v cos θv , vy = v sin θv .

Este procedimiento nos permite encontrar las coordenadas y componentes de


la velocidad del vector relativo en el sistema natural de la cónica x, y, v x , vy . Sin
embargo para determinar la posición del sistema en el espacio respecto al sistema
BO

de referencia en el que fueron especificadas las posiciones iniciales, hará falta de-
terminar la orientación del plano del sistema. Esto será lo que veremos justamente
en la próxima sesión.

4.8 El problema de los dos cuerpos en el espacio


En la última parte de la sección anterior vimos un algortimo que nos permite cal-
cular la posición futura del sistema relativo a partir de las condiciones iniciales de
dos partículas que interactúan gravitacionalmente. Sin embargo un asunto quedo
pendiente. El algoritmos solo permite calcular la posición y velocidad relativa en
el sistema natural de la órbita relativa, es decir en el plano invariante de Laplace,
con el eje x apuntando en dirección al periapsis.
Las posiciones iniciales sin embargo pueden estar referidas a un sistema de
ejes completamente arbitrarios y por lo tanto la posición predicha solo podrá con-
vertirse en una predicción real si encontramos a partir de la información inicial
provista la orientación general de la cónica en el espacio de tres dimensiones.
138 Chapter 4. El Problema de los dos cuerpos

4.8.1 De vector de estado a elementos orbitales


Para hacerlo consideremos la figura abajo en la que mostramos la dirección en el
espacio de los vectores ~r (0), ~h y ~e que definen la orientación completa de la órbita.

R
O
D
A
Figure 4.3: Construcción requerida para establecer la relación entre los vectores
posición y los vectores constantes en el problema de los dos cuerpos y los elemen-
RR

tos orbitales

Antes de eso, vamos a definir un vector de importancia que da la dirección de


la línea de los nodos medida respecto al punto vernal.

~n = aˆz × ~h
BO

(4.56)
Los ángulos claves para la conversión resultan de aplicar simples relaciones
geométricas tales como:

~n · aˆx nx
cos Ω = = (4.57)
n n
~n ·~e
cos ω = (4.58)
ne
~e ·~r
cos f = (4.59)
er
~h · aˆz hz
cos i = = (4.60)
h h
(4.61)
El único cuidado adicional que hay que tener es el cuadrante en el que caen
cada uno de los ángulos mencionados:
4.8. El problema de los dos cuerpos en el espacio 139

• Longitud del nodo ascendente. En este caso, necesitamos de un criterio para


determinar si el valor principal de Ω (el valor devuelto por la calculadora de
cos−1 ) es el correcto desde un punto de vista físico. El criterio consiste en
tomar la proyección del vector nodal ~n sobre el eje y de manera que si el signo
es positivo, entonces el valor principal es el valor correcto. Si es negativo, el
valor de Ω se obtiene restando el valor principal de 2π.

!
−1 ~n · î
Ω = cos sii ~n · ĵ = ny ≥ 0 (4.62)
n
!
−1 ~n · î
= 2π − cos sii ~n · ĵ = ny < 0 (4.63)
n

R
• Argumento del periapsis. De nuevo, es necesario un criterio para concer el
cuadrante correcto de ω. En este caso analizamos la proyección del vector de

O
excentricidad sobre el eje z.

ω = cos −1~n ·~e




ne

D
sii ~e · k̂ = ez ≥ 0 (4.64)

n ·~e
 
−1 ~
A
= 2π − cos sii ~e · k̂ = ez < 0 (4.65)
ne

• Anomalia verdadera. En este caso también hay una indeterminación en el


RR

valor de f pero el criterio para decidir el cuadrante es sencillo de entender.


Todo depende de si el cuerpo se aleja del periapsis o si se acerca al periapsis.
Para esto necesitamos conocer el signo de la taza de cambio de la variable
radial. Notemos que

~r · ~v
BO

vr =
r
Para una órbita elíptica, si el cuerpo se aleja del periáspsis vr > 0 y si se
acerca al periápsis vr < 0.
Finalmente, el criterio para seleccionar el cuadrante de f es

~e ·~r
 
−1
f = cos sii vr ≥ 0 (4.66)
er
−1 ~e ·~r
 
f = 2π − cos sii vr < 0 (4.67)
er

Es interesante anotar que el valor de f calculado con este procedimiento a


partir del vector de estado inicial, es el valor inicial de la anomalía verdadera
ó f (0). Pero la anomalía verdadera del cuerpo cambia en el tiempo. ¿De qué
nos sirve entonces calcular f (0)?. Una de las cantidades que no habíamos
140 Chapter 4. El Problema de los dos cuerpos

precisado hasta ahora era el tiempo de paso por el periapsis. f (0) nos da
la clave sobre esta cantidad. Por la ecuación de Kepler la relación entre el
tiempo de observación t = t0 (el que llamamos aquí tiempo cero) y la anoma-
lía excéntrica inicial será:

n(t0 − t p ) = E(0) − e sin E(0)

Si usamos la anomalía verdadera f (0) y calculamos con ella la anomalía ex-


céntrica inicial E(0) podemos obtener el tiempo del paso por el periapsis:

E(0) − e sin E(0)


t p = t0 −
n
• Inclinación. No hay ambiguedad en la determinación ya que 0 ≤ i < 180. Si

R
90 < i <≤ 180 la órbita es retrógrada. Una órbita con inclinación 0º es igual
a una con inclinación 180º pero retrograda.

O
Es de anotar

4.8.2 De elementos orbitales a vector de estado


D
Las fórmulas y el procedimiento anterior nos permiten encontrar a partir de las
condiciones iniciales del problema (vector de estado inicial) los elementos orbitales
A
Ω, ω, i, t p . Usando el algorítmo de la sección anterior podemos, por otro lado cal-
cular el valor de r, vy f como función del tiempo. ¿Cuánto vale ahora el valor del
vector de estado X (t) = [~r (t) ~v(t)] T a partir de estas cantidades?
RR

Podemos aprovechar lo aprendido en capítulos anteriores para realizar esta


tarea analíticamente
teniendo en cuenta que, sobre la órbita

x 000 = r cos f (4.68)


BO

y000 = r sin f (4.69)


000
z =0 (4.70)

Usando la matriz de rotación en tres dimensiones obtenemos:


 000   
x x
 y000  = Rz (ω ) R x (i ) Rz (Ω)  y  (4.71)
z000 z

x = r cos f (cos Ω cos ω − sin Ω sin ω cos i ) − r sin f (cos Ω sin ω + sin Ω cos i cos(4.72)
ω)
y = r cos f (sin Ω cos ω + cos Ω cos i sin ω ) + r sin f (− sin Ω sin ω + cos Ω cos i cos ω)
(4.73)
z = r cos f sin i sin ω + r sin f sin i cos ω (4.74)

Nos queda determinar el vector velocidad del cuerpo en el plano fundamental.


Para esto, tengamos en cuenta que
4.9. Aplicaciones del problema de los dos cuerpos 141

r2
ṙ = e sin f f˙
p
Pero por definición del momentum angular específico:

r2 f˙ = h
De donde resulta que:

h
ṙ = e sin f
p
h
r f˙ = (1 + e cos f )
p

R
De aquí se deducen derivando las relaciones para x, y, z y después de manipu-
laciones algebraicas y trigonométricas, las siguientes ecuaciones:

O
h
ẋ = − [cos Ω(e sin ω + sin(ω + f )) + sin Ω cos i (e cos ω + cos(ω + f ))](4.75)
p D
h
ẏ = − [sin Ω(e sin ω + sin(ω + f )) − cos Ω cos i (e cos ω + cos(ω + f ))](4.76)
p
h
ż = + sin i [e cos ω + cos(ω + f )] (4.77)
A
p
(4.78)
RR

4.9 Aplicaciones del problema de los dos cuerpos


Hemos visto ya la teoría básica del problema de los dos cuerpos, la base para
la solución de una inmensa diversidad de problemas en Mecánica Celeste, in-
cluyendo, por supuesto, problemas que involucran más de dos cuerpos (proble-
mas jerárquicos de n-cuerpos).
BO

Los elementos desarrollados en la teoría del problema de los dos cuerpos son
además la base para el cálculo de efemérides, es decir las condiciones de ubnicación
y tiempo de eventos astronómicos tales como eclipses, ocultaciones, tránsitos, en-
tre muchos otros, naturalmente, en su mayoría relacionados con el Sistema Solar.
En esta sección estudiáremos algunas herramientas y métodos comunes en la
aplicación del problema de los dos cuerpos a situaciones concretas relacionadas
con el cálculo de efemérides. Para ello desarrollaremos aplicaremos algunos méto-
dos numéricos reconocidos, pero también nos valdremos de la herramienta SPICE
cuyos rudimentos están explicados en uno de los apéndices.

4.9.1 Predicción de la posición de un cuerpo


Imaginemos que deseamos saber dónde estará Venus el día de mañana en el cielo
vespertino tal y como es visto desde un lugar específico de la Tierra. ¿Qué infor-
mación necesitamos para resolver esta pregunta?. Naturalemente necesitamos que
nos sean dados:
142 Chapter 4. El Problema de los dos cuerpos

a. El tiempo de observación.
b. La ubicación geográfica del observador.
c. El sistema de coordenadas en el que deseamos nuestra predicción.
d. Los elementos orbitales del cuerpo que queremos observar.

Manipular cada uno de estos datos para producir una predicción tan precisa
como sea posible de la posición de un cuerpo en el Sistema Solar no es sin embargo
una tarea simple. Algunas de las cosas que hemos visto hasta ahora nos permitirán
precisar cada uno de estos datos y juntarlos para producir nuestra predicción.

4.9.2 Tiempo de observación


A pesar de parecer uno de los asuntos más sencillos en nuestro problema, precisar
el tiempo de observación no es para nada simple. Recordemos que existe una gran

R
diversidad de escalas de tiempo que pueden ser usadas para indicar el tiempo de
una observación.
Naturalmente para facilidad del observador asumimos que el tiempo es dado

O
en una escala de tiempo uniforme, es decir una escala de tiempo que use el segundo
atómico en lugar de una escala basada en un segundo ajustado al sistema de refer-
encia (TDB o TDT).
D
Supongamos por ejemplo que el tiempo es provisto por el observador en UTC.
Recordemos que esta escala utiliza el segundo atómico e intenta aproximarse a
UT1, que es el sistema de tiempo que deberíamos usar rigurosamente puesto se
A
ajusta a la rotación de la Tierra, desde cuya superficie realizamos las observaciones.
Supongamos por ejemplo que el tiempo de observación es el primero de abril
de 2018 a las 19 horas de tiempo local en el huso horario UTC-5. El tiempo en
RR

formato calendario internacional sería:

In [25]: #MM/DD/CCYY HH:MM:SS.CCC UTC-N


tiempo="4/1/2018 19:00:00.000 UTC-5"

(En la documentación de la rutina18 str2et de SPICE podrán encontrar otros


formatos para indicar la fecha y hora de una observación.)
BO

El primer problema que enfrentamos es que el tiempo que necesitamos para


el cálculo de la posición es el tiempo de efemérides (abreviado ET). Recordemos que
esta es una escala de tiempo uniforme que se estableció para tener una medida de
tiempo que se ajustará a las observaciones realizadas en tiempos históricos (hace
uno o dos siglos).
El tiempo de efemérides tiene una diferencia de más de 37 segundos respecto
al tiempo UTC (o UT1), diferencia que cambia cada uno o dos años con la adición
de un segundo bisciesto (leap second). La diferencia en segundos entre UTC y ET es
igual a:

ET = UTC + ∆AT + 32.184 + K sin E(ET)


Donde ∆AT es el número (entero) de segundos bisciestos agregados a la fecha.
El último segundo bisciesto se agrego el 31 de diciembre de 2017 a la media noche,
después de los cuál el valor de ∆AT quedo en 37 segundos. K = 1.657 × 10−3 es
18 https://naif.jpl.nasa.gov/pub/naif/toolkit_docs/C/cspice/index.html
4.9. Aplicaciones del problema de los dos cuerpos 143

una constante y E es la anomalía excéntrica de la órbita heliocéntrica del baricentro


del sistema Tierra-Luna.
Como es de esperarse si se quiere calcular el valor del ET en cualquier fecha
de la historia es necesario conocer de antemano el valor de ∆AT inmediata-
mente anterior a esa fecha. Con ese propósito el sistema de información NAIF
de NASA distribuye una tabla de los valores de ∆AT, así como los parámetros
para calcular la corrección periódica K sin E, en la forma de archivo plano cono-
cido como kernel de tiempo. El archivo actualizado puede descargarse de este sitio:
https://naif.jpl.nasa.gov/pub/naif/generic_kernels/lsk/. El último archivo se
llama naif0012.tls.
Para cargar la información en un kernel en SPICE usamos el siguiente comando:

In [26]: spy.furnsh('util/kernels/naif0012.tls')

R
Una vez cargado el kernel con los segundos bisciestos podemos calcular el
tiempo de efemérides de la observación usando el comando:

O
In [27]: spy.str2et(tiempo)

Out[27]: 575899269.185656 D
El valor devuelto por esta rutina corresponde al número de segundos transcur-
ridos desde las 12:00:00 ET del primero de enero del año 2000, conocida también
como la época J2000.0. Para comprobar este hecho veámos esta conversión:
A
In [28]: spy.str2et("1/1/2000 12:00:00.000 UTC")

Out[28]: 64.18392728473108
RR

Nótese que las 12:00:00 UTC no corresponden al segundo 0 del tiempo ET por
la fórmula vista antes. Viendo este número podemos darnos cuenta que en la fecha
indicada arriba el valor ∆AT = 32 segundos.
También es posible indicar la fecha usando la escala de tiempo de efemérides
así:
BO

In [29]: spy.str2et("1/1/2000 12:00:00.000 TDB")

Out[29]: 0.0

Otra rutina que puede ser de utilidad en algunas situaciones nos permite calcu-
lar el valor de ∆AT + 32.184 para cualquier momento del tiempo. Así por ejemplo
en la fecha de nuestro ejemplo:

In [30]: et=spy.str2et(tiempo)
spy.deltet(et,"ET")

Out[30]: 69.18565599150625

Aquí puede notarse que el último valor de ∆AT = 37 y que la corrección per-
iíodica para la fecha del cálculo es:

In [31]: spy.deltet(et,"ET")-37-32.184
144 Chapter 4. El Problema de los dos cuerpos

Out[31]: 0.001655991506254395
Otras dos rutinas que pueden resultar útil en este contexto y que permiten
convertir entre escalas de tiempo son: utc2et y unitim. utc2et tiene una fun-
ción parecida a str2et pero recibe el tiempo únicamente en UTC-0 así la fecha
4/1/2018 19:00:00.000 UTC-5 debe escribirse como:
In [32]: spy.utc2et("4/2/2018 00:00:00.000")
Out[32]: 575899269.185656
Muchos otros formatos de fecha y hora para esta rutina pueden ser encontrados
en la documentación de la misma.
De otra parte unitim permite convertir entre distintos sistemas de tiempo. Esto
es particularmente útil para encontrar el tiempo por ejemplo en días julianos:
In [33]: spy.unitim(et,"ET","JDTDB")

R
Out[33]: 2458210.50080076
Las escalas de tiempo aceptadas por unitim son:

O
"TAI" International Atomic Time.
"TDB" Barycentric Dynamical Time.
D
"TDT" Terrestrial Dynamical Time.
"ET" Ephemeris time (in the SPICE system, this is
equivalent to TDB).
"JDTDB" Julian Date relative to TDB.
A
"JDTDT" Julian Date relative to TDT.
"JED" Julian Ephemeris date (in the SPICE system
this is equivalent to JDTDB).
RR

Esta rutina puede utilizars por ejemplo si se tiene una fecha de un evento en
días julianos y se quiere convertir a ET. Así por ejemplo si nos dicen que el día
juliano (en UTC) de una observación es el 2458211.5 (Abril 3 de 2018, 00:00:00.000),
la fecha de efemérides puede calcularse así:
In [34]: #Fecha juliana de la observación
BO

JD=2458211.5
#Fecha juliana de J2000 en UTC (es una constante)
JD2000=spy.j2000()
#Tiempo en segundos transcurridos en UTC desde J2000
tutc=(JD-JD2000)*86400
#Calcula el deltet
det=spy.deltet(tutc,"UTC")
#Calcula el ET
ET=tutc+det
print(ET)
575985669.1856568

Lo que puede verificarse usando:


In [35]: spy.str2et("4/3/2018 00:00:00")
Out[35]: 575985669.1856568
4.9. Aplicaciones del problema de los dos cuerpos 145

4.9.3 Ubicación geográfica del observador


La ubicación geográfica del observador nos permitirá determinar el lugar en el
sistema solar desde el que se hacen las observaciones.
La ubicación geográfica de un punto sobre la Tierra (y cualquier cuerpo del
Sistema Solar) se expresa con tres números: la latitud geodésica (φ), la longitud
geodésica (λ) y la altura sobre el geoide (altura sobre el nivel del mar.
La latitud geodésica difiere de la latitud geográfica o astronómica en el hecho
de que en un determinado punto de la Tierra, la vertical no necesariamente coin-
cide con la línea perpendicular al geoide (o datum). Esto debido a que el potencial
gravitacional de la Tierra o el planeta puede estar afectado por distintos factores in-
trínsecos (distribución interna de la materia) o extrínsecos (deformación de marea).

R
O
D
A
RR
BO

Figure 4.4: Definición de la latitud geodésica y la latitud geográfica o astronómica

Los sistemas de información geográfica, incluyendo programas como Google


Earth o los sistemas de posicionamiento global proveen normalmente el valor de
la latitud geodésica y por lo tanto será esa la latitud que usaremos para el cálculo
de efemérides.
Usando las coordenadas referidas al elipsoide podemos calcular la posición
cartesiana del observador respecto a ese mismo elipsoide (en un sistema en el que
el eje X pasa por el ecuador y por el meridiano de refencia del cuerpo y el eje
Y esta también sobre el ecuador en la dirección de rotación del mismo). Para ello
usamos en SPICE una sencilla rutina conocida como georec. La rutina sin embargo
necesita como entradas las propiedades del elipsoide, a saber su radio ecuatorial
r E y su achatamiento f = (r E − r P )/r E .
Los valores de los radios ecuatorial y achatamientos de distintos cuerpos del
sistema solar son provistos también por SPICE en la forma del kernel pck00010.tpc
146 Chapter 4. El Problema de los dos cuerpos

(el kernel actualizado puede encontrarse en este enlace19 ) que brinda además in-
formación sobre la forma y orientación de un sin número de cuerpos pequeños del
sistema solar.
In [36]: spy.furnsh('util/kernels/pck00010.tpc')

Una vez cargado el kernel, podemos recuperar la información de un cuerpo


(por ejemplo la Tierra) usando la rutina bodvrd:
In [37]: datos=spy.bodvrd('EARTH','RADII',3)
print(datos)

(3, array([6378.1366, 6378.1366, 6356.7519]))

R
Usando estos valores podemos calcular el achatamiento de la Tierra:
In [38]: rE=datos[1][0]
rP=datos[1][2]

O
f=(rE-rP)/rE
print("Radio ecuatorial (km)=",rE)
print("Achatamiento, f = ",f) D
Radio ecuatorial (km)= 6378.1366
Achatamiento, f = 0.0033528131084554717
A
Supongamos que queremos determinar la posición de un observador que se
encuentra ubicado (según un dispositivo de GPS) en las siguiente coordenadas:
RR

φ = 6◦ 13’ 8" N, λ = 75◦ 36’ 21" W, h = 1586 m.


Las coordenadas cartesianas del observador relativas al centro de la Tierra
serían:
In [39]: lat=6+13./60+8./3600
lon=-(75+36./60+21./3600)
BO

h=1586.0
observador_geocentro_fijo=spy.georec(lon*GRADOS,lat*GRADOS,h/1000,rE,f)
print("Posición del observador respecto al geocentro en el sistema fijo de coordena
observador_geocentro_fijo)

Posición del observador respecto al geocentro en el sistema fijo de coordenadas:


[ 1576.67248907 -6143.33043121 686.49845578]

4.9.4 Sistema de coordenadas


Con el objeto de conocer la posición absoluta del observador respecto al sistema de
referencia inercial del Sistema Solar (baricentro) es necesario primero saber en que
sistema de coordenadas deseamos calcular las coordenadas del cuerpo en cuestión.
Usando SPICE podemos definir como mínimo dos sistemas de referencia bási-
cos:
19 https://naif.jpl.nasa.gov/pub/naif/generic_kernels/pck/
4.9. Aplicaciones del problema de los dos cuerpos 147

• El ecuador de J2000 (abreviado J2000 simplemente).


• La eclíptica de J2000 (abreviado ECLIPJ2000).
Para convertir la posición de nuestro observador a cualquierda de esos dos
sistemas necesitamos primero rotar las coordenadas referidas al meridiano de ref-
erencia y el ecuador de la Tierra al sistema J2000 (que usa como dirección de ref-
erencia sobre el plano XY la dirección del punto vernal en J2000). Esta conver-
sión es bastante compleja. Para ello es necesario conocer y predecir con precisión
los movimientos de precesión y nutación de la Tierra así como los cambios en el
período de rotación. Si se desea obtener una predicción de alta precisión no es fácil
realizar estas tareas de forma manual.
La información para realizar esta rotación es provista por
NAIF en otro kernel que se encuentra ubicado en este enlace:
https://naif.jpl.nasa.gov/pub/naif/generic_kernels/pck/. El kernel es

R
earth_latest_high_prec.bpc y se actualiza dos veces cada semana. Para
predicciones en una ventana de tiempo amplia es posible usar el kernel
earth_070425_370426_predict.bpc que permite predecir la orientación de

O
la Tierra entre 2007 y 2037.
Esta rotación se consigue primero calculando la matriz de rotación correspon-
diente, para lo cual en SPICE usamos la rutina pxform.
D
In [40]: spy.furnsh("util/kernels/earth_070425_370426_predict.bpc")

Una vez cargado el kernel podemos calcular la matriz de transformación que


A
lleva las coordenadas cartesianas referidas al sistema de referencia en reposo en la
Tierra (ITRF93) al sistema de referencia en el que deseamos realizar los cálculos:
In [41]: Mobs=spy.pxform("ITRF93","ECLIPJ2000",et)
RR

print(Mobs)

[[-0.98457702 0.17494296 0.00174821]


[-0.1598249 -0.90346744 0.39774688]
[ 0.07116247 0.39133303 0.91749352]]
BO

Las coordenadas respecto al geocentro del observador en el sistema ECLIPJ2000


serán:
In [42]: observador_geocentro_EJ2000=spy.mxv(Mobs,observador_geocentro_fijo)
print("Posición del observador respecto al geocentro en el sistema J2000:\n",
observador_geocentro_EJ2000)

Posición del observador respecto al geocentro en el sistema J2000:


[-2625.88774635 5571.36014492 -1662.03030472]

4.9.5 Elementos orbitales del cuerpo a observar


En el problema de los dos cuerpos dados los elementos orbitales del cuerpo a
observar es posible determinar su posición en cualquier instante del futuro re-
solviendo la ecuación de Kepler, utilizando la ecuación de la cónica referida a su
sistema de referencia natural y después realizando la rotación respectiva.
148 Chapter 4. El Problema de los dos cuerpos

En este curso hemos aprendido cómo realizar todas estas tareas de forma man-
ual.
SPICE incorpora también rutinas especializadas que simplifican el cálculo de la
posición tomando como entradas los elementos orbitales. La rutina en particular
que realiza la tarea indicada se conoce como conics.
Imaginemos que obtenemos los elementos orbitales de Venus (el baricentro de
Venus) del sistema de JPL Horizons para en la fecha y hora de observación. Aquí
es importante entender que el JPL Horizons solo recibirá como entrada la fecha y
hora en ET. El siguiente código permite expresar en formato de calendario en ET,
un tiempo dado en UTC:

In [43]: #MM/DD/CCYY HH:MM:SS.CCC UTC-N


tiempo="4/1/2018 19:00:00.000 UTC-5"
#Tiempo en ET

R
et=spy.str2et(tiempo)
#Cálculo del ET-UTC
dt=spy.deltet(et,"ET")

O
#Formato de calendario del tiempo ET
tiempo_et=spy.et2utc(et+dt,"C",0)
print("Fecha UTC: ",tiempo)
print("Fecha ET: ",tiempo_et)

Fecha UTC: 4/1/2018 19:00:00.000 UTC-5


D
Fecha ET: 2018 APR 02 00:01:09
A
Para comprobar que esta si es la fecha realicemos la siguientes conversiones:
RR

In [44]: print(spy.str2et("4/1/2018 19:00:00.000 UTC-5"))


print(spy.str2et("4/2/2018 00:01:09.000 TDB"))

575899269.185656
575899269.0
BO

Al introducir esta fecha a JPL Horizons nos entrega los siguientes elementos
orbitales (expresados en km y km/s):

In [45]: e=1.098041049378980E-02
q=1.088516441933395E+08
i=3.396461754625563E+00
O=7.679136022578597E+01 #Longitud del nodo ascendente
w=1.880966457070962E+00 #Argumento del periapsis
M=3.421364194895987E+02 #Anomalía media

Adicionalmente JPL Horizons provee el valor de µ para estos elementos or-


bitales:

In [46]: mu=1.3288954423984404E+11 #km^3/(kg s^2)

Una vez con los elementos orbitales podemos calcular el vector de estado del
sistema usando:
4.9. Aplicaciones del problema de los dos cuerpos 149

In [47]: spy.conics([q,e,i,O,w,M,0,mu],0)

Out[47]: array([-1.05530219e+08, 2.11331814e+07, 2.80345975e+07, 6.60498889e+00,


3.37441345e+01, -1.40047251e-01])
Internamente SPICE resuelve la ecuación de Kepler, calcula la posición de la
partícula en su órbita en el sistema de referencia natural y realiza la rotación al sis-
tema de referencia respecto al que se calcularon los elementos orbitales indicados
(que en el caso de JPL Horizons están referidos a ECLIPJ2000).

4.9.6 Cálculo del vector de estado con SPICE


Con todos estos elementos en mano podemos proceder a calcular la posición del
cuerpo en el cielo del observador.

R
Para ello sin embargo será necesario realizar dos operaciones importantes:
1. Encontrar la posición del geocentro de la Tierra respecto al baricentro del
Sistema Solar. Esto es indispensable para conocer la posición del cuerpo (que

O
es referida a ese sistema) respecto al observador. Esto implicará conocer los
elementos orbitales de la Tierra en la fecha de observación.
D
2. Para conocer la posición del cuerpo con precisión es necesario corregir por
el tiempo de viaje de la luz desde el objeto observado hasta el observador.
Esta corrección es importante si de lo que se trata es de calcular por ejem-
plo un eclipse o una ocultación para los cuales diferencias muy pequeñas de
A
posición en el cielo pueden ser fundamentales.
El cálculo de estos dos efectos no es simple y requiere automatizar de alguna
RR

manera los pasos anteriores. SPICE provee facilidades para hacerlo. En particular
la determinación de los elementos orbitales instantáneos de los cuerpos implicados
es fundamental para el éxito de nuestro propósito. Si cada vez que desearamos
calcular una efeméride necesitaramos buscar los elementos en el JPL Horizons los
cálculos serían muy laboriosos.
De otro lado ¿cómo es que JPL conoce precisamente los elementos orbitales de
BO

los cuerpos?. El sistema de información NAIF provee un conjunto de Kernels que


tiene precalculados con modelos muy elaborados que tienen en cuenta perturba-
ciones gravitacionales de otros cuerpos y efectos complejos (mareas, intrerior plan-
etario), la posición de los cuerpos y naves espaciales más importantes del Sistema
Solar.
Estas posiciones vienen en distintos formatos en kernels
en formato binario que pueden ser obtenidos de este sitio:
https://naif.jpl.nasa.gov/pub/naif/generic_kernels/spk/.
Un kernel muy popular es el de430.bsp que contiene la posición calculada de
todos los planetas del Sistema Solar (incluyendo la Luna y planetas enanos como
Plutón) en el intervalo 1549 DEC 31 00:00:00.000 y 2650 JAN 25 00:00:00.000.
In [48]: spy.furnsh('util/kernels/de430.bsp')

Una vez cargado un kernel, obtener la posición (vector de estado) de cualquiera


de los cuerpos que el contiene es tan sencillo como invocar a la rutina spkgeo con
las opciones:
150 Chapter 4. El Problema de los dos cuerpos

In [49]: #MM/DD/CCYY HH:MM:SS.CCC UTC-N


tiempo_utc="4/1/2018 19:00:00.000 UTC-5"
et=spy.str2et(tiempo_utc)
salida=spy.spkgeo(299,et,"ECLIPJ2000",0)
venus_SSB_EJ2000=salida[0]
print("Posicion de Venus:",venus_SSB_EJ2000[:3])

Posicion de Venus: [53714076.14834774 94726625.43862288 -1818940.89077003]

Donde 299 se refiere al código del baricentro del planeta Venus (para los códi-
gos enteros de los cuerpos en el kernel vea la documentación de de43020 ).
Usando el vector de estado es posible en SPICE encontrar el vector de elemen-
tos orbitales instantáneos. La rutina usada con ese propósito es oscltx:

R
In [50]: q,e,i,O,w,M,t,mu,f,a,P=spy.oscltx(venus_SSB_EJ2000,et,mu)
print("Elementos orbitales de Venus:",q,e,i*RADIAN,O*RADIAN,w*RADIAN,M*RADIAN,t,mu,

O
Elementos orbitales de Venus: 108851644.16252816 0.010980411143205526 3.39646175405
D
Los elementos orbitales devueltos por oscltx son en su orden: q, e, i, Ω, ω, M,
t, µ, f , a, Porb .
Si comparamos estos valores con los devueltos por JPL Horizons vemos una
A
coincidencia grande pero no una coincidencia exacta. Esto se debe principalmente
al hecho que el JPL Horizons usa para sus cálculos un Kernel mucho más grande
y preciso, el de431.bsp que no usamos aquí para evitar ocupar mucho espacio en
RR

disco (este kernel pesa varios Giga bytes).


Una vez tenemos una herramienta para calcular la posición podemos determi-
nar la posición de los dos cuerpos que nos interesan, el observador y Venus:

In [51]: posicion=spy.spkgeo(399,et,"ECLIPJ2000",0)
tierra_SSB_EJ2000=posicion[0]
BO

print("Posición de la Tierra:",tierra_SSB_EJ2000[:3])

observador_SSB_EJ2000=observador_geocentro_EJ2000+tierra_SSB_EJ2000[0:3]
print("Posición del observador respecto al SSB:",observador_SSB_EJ2000)

Posición de la Tierra: [-1.46080640e+08 -2.99848241e+07 -1.44610680e+04]


Posición del observador respecto al SSB: [-1.46083266e+08 -2.99792527e+07 -1.612309

La posición de Venus respecto al observador resulta ser entonces:

In [52]: venus_observador_EJ2000=venus_SSB_EJ2000[:3]-observador_SSB_EJ2000
print("Posición de Venus respecto del observador:",venus_observador_EJ2000)

Posición de Venus respecto del observador: [ 1.99797343e+08 1.24705878e+08 -1.8028

20 https://naif.jpl.nasa.gov/pub/naif/generic_kernels/spk/planets/aa_summaries.txt
4.9. Aplicaciones del problema de los dos cuerpos 151

La posición en el cielo en coordenadas celeste (ascensión recta, RA y decli-


nación, DEC) en J2000 se puede calcular si se convierte del sistema ECLIPJ2000
al sistema J2000:

In [53]: MJ2000=spy.pxform("ECLIPJ2000","J2000",et)

De modo que la posición de Venus respecto al observador en J2000 es:

In [54]: venus_observador_J2000=spy.mxv(MJ2000,venus_observador_EJ2000)
print("Posición de Venus respecto del observador (J2000):",venus_observador_J2000)

R
Posición de Venus respecto del observador (J2000): [1.99797343e+08 1.15132526e+08 4

O
Una vez tenemos las coordenadas cartesianas en J2000 podemos determinar las
coordenadas en el cielo y la distancia:
D
In [55]: do,RA,DEC=spy.recrad(venus_observador_J2000)
A
print("Distancia (km):",do)
print("RA (hh:mm:ss.ccc) = ",dec2sex(RA*RADIAN/15))
print("DEC (gg:mm:ss.ccc) = ",dec2sex(DEC*RADIAN))
RR

Distancia (km): 235528733.44972843


RA (hh:mm:ss.ccc) = (1, 59, 48.6114657138053)
DEC (gg:mm:ss.ccc) = (11, 44, 48.919792592616886)
BO

La posición reportada por el JPL Horizons es RA = 01 59 47.51 y DEC = +11 44


41.7. Nótese el nivel de precisión conseguida con nuestro procedimiento.

4.9.7 Corrección por el tiempo de viaje de la luz


La posición determinada en el aparte anterior contiene un error conceptual impor-
tante: asume implícitamente que la velocidad de la luz es infinita. El hecho de que
la velocidad de la luz sea en realidad finita y que los objetos que estamos obser-
vando y el observador se muevan introducen un error en el cálculo de la posición
que debe ser tenido en cuenta especialmente cuando se quieren hacer cálculo de
alta precisión.
Para corregir el cálculo anterior por el efecto de la velocidad de la luz podemos
usar un procedimiento como el ilustrado en la figura.
152 Chapter 4. El Problema de los dos cuerpos

Figure 4.5: Procedimiento para el cálculo de la posición de un cuerpo teniendo en


cuenta el tiempo de viaje de la luz

R
Para ello comenzamos con una primera estimación de la posición como la que
hemos hecho hasta ahora. Con esa estimación calculamos una primera estimación
del tiempo luz ∆t0 . A continuación repetimos el cálculo de la posición del objeto

O
observado pero en un tiempo t0 = t − ∆t0 que es el tiempo realmente en el que
observaríamos al objeto. Esto nos da una nueva posición y distancia con la que
determinamos una segunda aproximación ∆t1 al tiempo luz con la que repetimos
D
el procedimiento anterior. El proceso se repite hasta que ∆tn satisface un cierto
criterio de convergencia.
En el código abajo hemos implementado de manera sencilla este procedimiento
A
para calcular con mayor precisión la posición de Venus en el cielo.

In [56]: delta=do/spy.clight()
print("Initial distance:",do)
RR

print("Initial light time:",delta)


delta_prev=delta
dif=1
i=0
while dif>1e-10:
print("Paso %d:"%i)
BO

venus_SSB_EJ2000=spy.spkgeo(299,et-delta,"ECLIPJ2000",0)[0]
venus_observador_EJ2000=venus_SSB_EJ2000[:3]-observador_SSB_EJ2000
d=spy.vnorm(venus_observador_EJ2000)
delta=d/spy.clight()
print("\tCorrected distance:",d)
print("\tCorrected light time:",delta)
dif=(delta-delta_prev)/((delta+delta_prev)/2)
print("\tRelative difference:",dif*100)
delta_prev=delta
i+=1

etvenus=et-delta

Initial distance: 235528733.44972843


Initial light time: 785.639288663254
Paso 0:
Corrected distance: 235541933.27993652
4.9. Aplicaciones del problema de los dos cuerpos 153

Corrected light time: 785.6833185574553


Relative difference: 0.005604182616480321
Paso 1:
Corrected distance: 235541934.01959723
Corrected light time: 785.6833210246979
Relative difference: 3.140250645947487e-07
Paso 2:
Corrected distance: 235541934.0196373
Corrected light time: 785.6833210248315
Relative difference: 1.7002019865798876e-11

etvenus es entonces el tiempo correcto en el que debo calcular la posición de


Venus. Con esto podemos estimar la posición de Venus de forma más precisa:

R
In [57]: venus_SSB_EJ2000=spy.spkgeo(299,etvenus,"ECLIPJ2000",0)[0]
venus_observador_EJ2000=venus_SSB_EJ2000[:3]-observador_SSB_EJ2000

O
venus_observador_J2000=spy.mxv(MJ2000,venus_observador_EJ2000)
do,RA,DEC=spy.recrad(venus_observador_J2000)
print("Distancia (km):",do)
print("RA (hh:mm:ss.ccc) = ",dec2sex(RA*RADIAN/15))
D
print("DEC (gg:mm:ss.ccc) = ",dec2sex(DEC*RADIAN))

Distancia (km): 235541934.0196373


A
RA (hh:mm:ss.ccc) = (1, 59, 47.288155609565194)
DEC (gg:mm:ss.ccc) = (11, 44, 40.41421486493903)
RR

La posición reportada por el JPL Horizons es RA = 01 59 47.51 y DEC = +11 44


41.7. Nótese el nivel de precisión conseguida con nuestro procedimiento.

4.9.8 Cálculo de efemérides


BO

Una vez tenemos en nuestro poder la capacidad de calcular la posición en el es-


pacio con gran precisión de los cuerpos del sistema solar, se abren una infinidad
de posibilidades para predecir o calcular las condiciones en las que ocurren dis-
tintos fenómenos astronómicos: eclipses, ocultaciones, tránsitos, posiciones y bril-
los de los cuerpos principales, etc. En astronomía llamamos a esta capacidad cál-
culo de efemérides astronómicas. En esta sección mostraremos algunos ejemplos de
cómo, con las herramientas conocidas en las secciones precedentes podemos cal-
cular efemérides astronómicas útiles.
Para el cálculo de efemérides es mejor automatizar algunas de las tareas de-
scritas arriba de modo que el cálculo de la posición de los cuerpos en el cielo se
realice de forma automática. La rutina abajo es una propuesta de automatización.
El lector puede considerar otras posibles parametrizaciones. La rutina asume que
existen variables globales RE, F que contienen el radio ecuatorial y el achatamiento
de la Tierra. En nuestro caso estas constantes son

In [58]: datos=spy.bodvrd('EARTH','RADII',3)
RE=datos[1][0]
154 Chapter 4. El Problema de los dos cuerpos

rP=datos[1][2]
F=(RE-rP)/RE

In [59]: def calculaPosicion(tiempo,bodyid,lat,lon,alt):


"""
tiempo: Fecha de observación, formato MM/DD/CCYY HH:MM:SS.CCC [UTC-N|TDB].
Si se pasa en tiempo un real asume que es el ET
bodyid: Cuerpo del que se va a calcular la posición
10: Sol, 199: Mercurio, 299: Venus, 399: Tierra,
3: Baricentro Tierra-Luna, 301: Luna, etc.
lat: Latitude (grados)
lon: Longitude (grados)
alt: Altitude (metros)
"""
#Tiempo en ephemeris time

R
if(type(tiempo)==str):et=spy.str2et(tiempo)
else:et=tiempo
#Posición del obervador

O
observador_geocentrico_fijo=spy.georec(lon*GRADOS,lat*GRADOS,alt/1000,RE,F)
Mobs=spy.pxform("ITRF93","ECLIPJ2000",et)
observador_geocentro_EJ2000=spy.mxv(Mobs,observador_geocentro_fijo)
#Posición de la Tierra
D
tierra_SSB_EJ2000=spy.spkgeo(399,et,"ECLIPJ2000",0)[0]
observador_SSB_EJ2000=observador_geocentro_EJ2000+tierra_SSB_EJ2000[0:3]
#Calcula posición del cuerpo teniendo en cuenta
A
delta=0.0
dif=1.0
delta_prev=0.0
while dif>1e-10:
RR

body_SSB_EJ2000=spy.spkgeo(bodyid,et-delta,"ECLIPJ2000",0)[0]
body_observador_EJ2000=body_SSB_EJ2000[:3]-observador_SSB_EJ2000
d=spy.vnorm(body_observador_EJ2000)
delta=d/spy.clight()
dif=(delta-delta_prev)/((delta+delta_prev)/2)
delta_prev=delta
BO

#break
#Tiempo para calcular la posición del cuerpo
etbody=et-delta
#Conversión J2000
MJ2000=spy.pxform("ECLIPJ2000","J2000",et)
body_observador_J2000=spy.mxv(MJ2000,body_observador_EJ2000)
d,RA,DEC=spy.recrad(body_observador_J2000)
#Coordenadas en horas y grados
RA=RA*RADIAN/15
DEC=DEC*RADIAN
#Return
return et,etbody,observador_geocentrico_fijo,observador_SSB_EJ2000,body_SSB_EJ2

Veamos un ejemplo con los mismos datos de las secciones anteriores:

In [60]: latitud=6.21889
longitud=-75.60583
altura=1586.0
4.9. Aplicaciones del problema de los dos cuerpos 155

et,etbody,obs_fijo,obs_ssb,body_ssb,body_obs,d,RA,DEC=calculaPosicion("4/1/2018 19:
299,latitud,longitud,a
print("Distancia (km) = ",d)
print("Tiempo-luz (s) = ",et-etbody)
print("RA (hh:mm:ss) = ",dec2sex(RA))
print("DEC (dd:mm:ss) = ",dec2sex(DEC))

Distancia (km) = 235541934.0196373


Tiempo-luz (s) = 785.6833209991455
RA (hh:mm:ss) = (1, 59, 47.288155609565194)
DEC (dd:mm:ss) = (11, 44, 40.41421486493903)

Sin correccion:

R
Distancia (km) = 235528733.44972843
Tiempo-luz (s) = 785.6392886638641
RA (hh:mm:ss) = (1, 59, 48.6114657138053)

O
DEC (dd:mm:ss) = (11, 44, 48.919792592616886)

Con esta información podemos proceder a calcular efemérides diversas.


D
Veamos aquí 3 ejemplos específicos:

a. La posición del Sol en el cielo.


b. Las fases de la Luna.
A
c. El tiempo de inicio de un eclipse de Sol.
d. El tiempo de inicio de una ocultación de un planeta por la Luna.
RR

4.9.9 Posición del Sol en el cielo


El cálculo de la posición del Sol en el cielo puede usarse para distintos propósitos
en Astronomía, tanto astronómicos (cálculo de hora solar verdadera, ecuación del
tiempo) como prácticos (generación de energía solar). Evidentemente podría pen-
sarse que siendo el Sol siendo el centro del Sistema Solar no es un objeto de estudio
BO

interesante en Mecánica Celeste y en el cálculo de Efemérides. Sin embargo, su


posición en el cielo en realidad refleja la posición de la Tierra en el espacio. Adi-
cionalmente sabemos que el Sol no esta realmente en el centro del Sistema Solar,
de modo que su posición, como la de otros cuerpos en el Sistema Solar cambia
continuamente.
El cálculo de la posición del Sol se realiza como el de cualquier otro cuerpo:
In [61]: efemerides_sol=calculaPosicion("4/5/2018 12:05:00.000 UTC-5",10,latitud,longitud,al
et=efemerides_sol[0]
print("RA J2000 (hh:mm:ss) = ",dec2sex(efemerides_sol[7]))
print("DEC J2000 (dd:mm:ss) = ",dec2sex(efemerides_sol[8]))
print(et)

RA J2000 (hh:mm:ss) = (0, 57, 30.802263393636053)


DEC J2000 (dd:mm:ss) = (6, 8, 38.6787276357947)
576219969.1856563
156 Chapter 4. El Problema de los dos cuerpos

Los valores obtenidos por el sistema NASA Horizons son: RA 00 42 54.60 y


DEC +04 36 47.2.
La verdadera pregunta es ¿qué podemos hacer con esta información?. Cálcule-
mos por ejemplo la altura y el acimut del Sol.
Para ello necesitamos, sin embargo, transformar primero las coordenadas del
Sol referidas a la eclíptica y el equinoxio de J2000.0 a los de la época de observación.
Esto se realiza cargando un nuevo kernel, esta vez uno elaborado manualmente
usando instrucciones provistas por NAIF. El kernel es el siguiente:
In [62]: spy.furnsh("util/kernels/frame.tk")

Con este kernel podemos construir la matriz de transformación del sistema


ECLIPJ2000 al sistema de la época de observación:
In [63]: Mtrue=spy.pxform("J2000","EARTHTRUEEPOCH",et)

R
Con esto podemos convertir las coordenadas del Sol en :
In [64]: sol_obs_EJ2000=efemerides_sol[5]

O
MJ2000=spy.pxform("ECLIPJ2000","J2000",et)
sol_obs_J2000=spy.mxv(MJ2000,sol_obs_EJ2000)
sol_obs_true=spy.mxv(Mtrue,sol_obs_J2000[:3])
D
Las coordenadas ecuatoriales reales del Sol en el cielo serían:
In [65]: d,RAtrue,DECtrue=spy.recrad(sol_obs_true)
A
#Coordenadas en horas y grados
RAtrue=RAtrue*RADIAN/15
DECtrue=DECtrue*RADIAN
print("RA true (hh:mm:ss) = ",dec2sex(RAtrue))
RR

print("DEC true (dd:mm:ss) = ",dec2sex(DECtrue))

RA true (hh:mm:ss) = (0, 58, 26.810615105192)


DEC true (dd:mm:ss) = (6, 14, 26.296793103592222)
BO

Estas coordenadas tienen una precisión no muy alta. En particular la decli-


nación tiene un error superior a 6 arcsec lo que probablemente se debe a los mod-
elos limitados de precesión y nutación incluidos en el archivo frame.tk. Aún así
para propósitos de astronomía de posición básica, los resultados son aceptables.
Para convertir la posición del Sol calculada arriba y referida al sistema de la
eclítpica de la época a un sistema local, necesitamos encontrar primero la matriz
de transformación del sistema de ejes fijos en la Tierra al sistema de referencia local
del observador.
Para ello necesitamos calcular la dirección en el sistema de ejes fijos en la Tierra
de los ejes locales del observador (z apuntando hacia el cenit). Esto requiere
primero calcular la dirección de la normal (plomada) en el sitio del observador,
lo que puede hacerse usando la rutina surfnm de SPICE que requiere nuevamente
conocer los radios del elipsoide del sitio de observación:
In [66]: obs_fijo=efemerides_sol[2]
radios=spy.bodvrd('EARTH','RADII',3)[1]
normal=spy.surfnm(radios[0],radios[1],radios[2],obs_fijo)
4.9. Aplicaciones del problema de los dos cuerpos 157

Con el vector normal calculamos la dirección de los ejes x e y a través de pro-


ductos escalares, y con los vectores unitarios podemos construir la matriz de trans-
formación del sistema de referencia fijo al sistema de referencia local:

In [67]: uz=[0,0,1]
uy=spy.ucrss(normal,uz)
uz=normal
ux=spy.ucrss(uy,uz)
Mfijo2local=np.array([ux,uy,uz])
Mlocal2fijo=spy.invert(Mfijo2local)

Ahora convertimos la posición del Sol referida al equinoccio de la época hasta


el sistema de referencia local:

In [68]: Mfijo=spy.pxform("EARTHTRUEEPOCH","ITRF93",et)

R
sol_obs_fijo=spy.mxv(Mfijo,sol_obs_true)
sol_obs_local=spy.mxv(Mfijo2local,sol_obs_fijo)

O
Este último vector apunta en dirección al Sol desde el observador, referida a ejes
que apuntan hacia el norte (x), el occidente (y) y el cenit (z) del observador. Para
calcular la elevación y el acimut solo debemos encontrar los ángulos esféricos de
D
este vector. Debe anotarse sin embargo que el acimut en astronomía esta realmente
referido al oriente (-y) no al occidente. Este hecho nos obliga entonces a realizar
una transformación de la componente y del vector posición del Sol:
A
In [69]: direccion=sol_obs_local
direccion[1]*=-1
d,az,el=spy.reclat(direccion)
az*=RADIAN
RR

el*=RADIAN
if(az<0):az+=360.0
print("Azimuth (dd:mm:ss):",dec2sex(az))
print("Elevación (dd:mm:ss):",dec2sex(el))

Azimuth (dd:mm:ss): (8, 38, 34.601443852178164)


BO

Elevación (dd:mm:ss): (89, 58, 41.31549530251391)

Nótese que la altura y el acimut del Sol no corresponde al instante de la cul-


minación (medio día verdadero) esto por efecto de la denominada ecuación del
tiempo.

4.9.10 Fases de la Luna


Otro cálculo de interés en astronomía es el de las fases de la Luna. Este puede
obtenerse si conocemos la posición relativa a un observador de la Luna y el Sol,
que con las herramientas vistas arriba es relativamente trivial.

In [70]: tiempo="4/1/2018 12:00:00.000 UTC-5"


efemerides_luna=calculaPosicion(tiempo,301,latitud,longitud,altura)
etobs=efemerides_luna[0]
etluna=efemerides_luna[1]
158 Chapter 4. El Problema de los dos cuerpos

efemerides_sol=calculaPosicion(etluna,10,latitud,longitud,altura)
etsol=efemerides_sol[1]
print(etobs,etluna,etsol)

575874069.1856557 575874067.8862016 575873569.2432396

La fase de la Luna se cálcula usando el denominado ángulo de fase φ, es decir


el ángulo que forma la dirección de la visual dirigida desde la Luna al Sol ~rLuna−Sol
con la dirección de la visual dirigida desde la Luna a la Tierra ~rLuna−Tierra y puede
ser obtenido de manera trivial usando:

~rLuna−Sol ·~rLuna−Tierra
cos φ =
rLuna−Sol rLuna−Tierra
La porción visible de la Luna (su fase, f ) medida en fracción de la superficie

R
que aparece iluminada se calcula usando:
cos φ + 1

O
f =
2
Donde f = 0 corresponde a la Luna nueva, f = 1 es la Luna llena.
Los vectores ~rLuna−Sol y ~rLuna−Tierra pueden ser obtenidos a partir de las posi-
D
ciones del Sol y la Luna vistas desde la Tierra usando:
In [71]: sol_obs=efemerides_sol[5]
luna_obs=efemerides_luna[5]
A
r_luna_tierra=-luna_obs
r_luna_sol=sol_obs-luna_obs

Para la fecha calculada la fase es entonces:


RR

In [72]: cosphi=spy.vdot(r_luna_tierra,r_luna_sol)/(spy.vnorm(r_luna_tierra)*spy.vnorm(r_lun
f=0.5*(1+cosphi)
print("Fase de la Luna:",f)

Fase de la Luna: 0.9824322153980877


BO

Usando este procedimiento podemos cálcular la fecha exacta de la próxima


Luna nueva si automatizamos el procedimiento anterior usando la rutina:
In [73]: def faseLuna(t):
efemerides_luna=calculaPosicion(t,301,latitud,longitud,altura)
etluna=efemerides_luna[1]
efemerides_sol=calculaPosicion(t,10,latitud,longitud,altura)
sol_obs=efemerides_sol[5]
luna_obs=efemerides_luna[5]
r_luna_tierra=-luna_obs
r_luna_sol=sol_obs-luna_obs
cosphi=spy.vdot(r_luna_tierra,r_luna_sol)/(spy.vnorm(r_luna_tierra)*spy.vnorm(r
f=0.5*(1+cosphi)
return f

f=faseLuna(etobs)
print("Fase de la luna en t = '%s', f= %g"%(tiempo,f))
4.9. Aplicaciones del problema de los dos cuerpos 159

Fase de la luna en t = '4/1/2018 12:00:00.000 UTC-5', f= 0.982432

Podemos hacer un gráfico de las fases de la Luna para los próximos 30 días:

In [74]: ts=np.linspace(etobs,etobs+30.0*86400,100)
fs=[faseLuna(t) for t in ts]

In [75]: fig,axs=plt.subplots(1)
axs.plot(ts,fs)

Out[75]: [<matplotlib.lines.Line2D at 0x11c47ecc0>]

R
O
D
A
RR
BO

¿Cómo podríamos determinar cuándo caerá la próxima luna nueva o la próx-


ima luna nueva?. Para ello sería necesario encontrar máximos y mínimos de la
función anterior. Sin embargo la función tiene muchos mínimos y máximos lo que
dificulta la tarea. Una forma alternativa sería encontrar los lugares en los que la
derivada de la función se hace cero.
Para determinar la próxima luna nueva debemos calcular el momento en el que
f = 0. Esto se conseguiría minimizando la función faseLuna. Para ello podemos
usar la rutina de minimización de Python:

In [76]: from scipy.misc import derivative

Definimos la derivada de la fase:

In [77]: def d_faseLuna(t):


dfdt=derivative(faseLuna,t)
return dfdt
160 Chapter 4. El Problema de los dos cuerpos

Una gráfica de esta derivada sería:

In [78]: dfs=[d_faseLuna(t) for t in ts]


fig,axs=plt.subplots(2)
axs[0].plot(ts,fs)
axs[1].plot(ts,dfs)

Out[78]: [<matplotlib.lines.Line2D at 0x11bd28b38>]

R
O
D
A
RR

Para encontrar el momento en el que la Luna estaría en la fase de nueva encon-


tramos el momento en el que la derivada de la fase se hace 0:
BO

In [79]: from scipy.optimize import brentq

In [80]: etnew=brentq(d_faseLuna,etobs,etobs+15*86400)
spy.et2utc(etnew,"C",2)

Out[80]: '2018 APR 16 02:03:47.76'

La fase calculada independientemente arroja que la próxima Luna nueva es el


16 de abril de 2018 a las 1:57:00 UTC. La diferencia puede venir del hecho que
calculamos la fase referida a un observador cuando normalmente la fase se calcula
referida al centro de la Tierra.

4.9.11 Cálculo de una ocultación


Las mismas herramientas introducidas hasta ahora nos permiten el cálculo de
otro fenómeno de interés en Mecánica Celeste: las ocultaciones. Entendemos una
ocultación como el momento en el que un cuerpo de fondo pasa detrás de otro que
4.9. Aplicaciones del problema de los dos cuerpos 161

esta más adelante. Para el cálculo de una ocultación basta que conozcamos la posi-
ción en el cielo de los dos cuerpos en cuestión y evaluemos su distancia angular
comparada con sus tamaños angulares.
Estudiemos por ejemplo el caso de una ocultación de Marte por la Luna.

In [81]: tiempo="7/5/2014 22:11:00.000 UTC-5"


efemerides_luna=calculaPosicion(tiempo,301,latitud,longitud,altura)
efemerides_marte=calculaPosicion(tiempo,4,latitud,longitud,altura)

La distancia angular entre ambos cuerpos, ∆ puede obtenerse a partir de sus


vectores posición como:

R
In [82]: luna_obs=efemerides_luna[5]
dluna=spy.vnorm(luna_obs)

O
marte_obs=efemerides_marte[5]
dmarte=spy.vnorm(marte_obs)
Delta=np.arccos(spy.vdot(luna_obs,marte_obs)/(dluna*dmarte))*RADIAN
D
print("Distancia angular (grados) = ",Delta)

Distancia angular (grados) = 0.2556357786281554


A
RR

Para saber si ocurre una ocultación es necesario saber si esta distancia es mayor
o menor que el radio angular de los cuerpos. Para ello necesitamos sin embargo
calcular sus radios físicos:
BO

In [83]: radios_luna=spy.bodvrd('MOON','RADII',3)[1]
radios_marte=spy.bodvrd('MARS','RADII',3)[1]
radio_angular_luna=np.arctan(radios_luna[0]/dluna)*RADIAN
radio_angular_marte=np.arctan(radios_marte[0]/dmarte)*RADIAN
print("Radio angular de la Luna:",radio_angular_luna)
print("Radio angular de Marte:",radio_angular_marte)

Radio angular de la Luna: 0.2567266861100834


Radio angular de Marte: 0.0012723858127023247

Cómo vemos la distancia angular entre ellos es menor que la suma de sus ra-
dios y por lo tanto podemos concluir que hay una ocultación ocurriendo a esa
hora. ¿A qué horas comenzó y término el tránsito?. Una manera de responder esa
pregunta es utilizando el diagrama mostrado en la figura:
162 Chapter 4. El Problema de los dos cuerpos

Figure 4.6: Tiempos de ocultación

R
Definimos la función f (t; k) así:

f (t; k) = ∆Luna,Marte (t) − ρLuna (t) − kρMarte (t)

O
Los distintos instantes de la ocultación pueden calcularse encontrando los pun-
tos en los que la función anterior cambia de signo así:
D
• Contact 1: The disk of the planet starts to be occulted (k = +1).
• Contact 2: The whole disk of the planet is occulted (k = -1).
• Contact 3: The disk of the planet starts to appear behind the lunar limb (k =
-1).
A
• Contact 4: The occultation ends (k = +1).

4.9.12 Determinación de la órbita de un cuerpo a partir de su


RR

posición en el espacio
Imaginemos ahora que observaramos un cuerpo (cometa, asteroide, basura espa-
cial) que pasa cerca a la Tierra y pudiéramos conocer su posición en el cielo referida
al ecuador y equinoccio de la época (RA, DEC) o al horizonte (elevación y azimuth)
BO

y con una determinación independiente pudiéramos saber su distancia (triangu-


lación o medidas de radar). ¿Podríamos usar esta información para obtener los
elementos orbitales del cuerpo?.
Imaginemos que estamos en el siguiente sitio de la Tierra:
In [84]: latitud=6.21889
longitud=-75.60583
altura=1586.0

Observamos un Asteroide cercano a la Tierra pasar el 6 de abril de 2018, con


las siguientes coordenadas (referidas a J2000): a las 20:24:12 UTC-5, RA=12h 38m
40s y DEC=43o 27’ 35“; a las 20:39:12 UTC-5, RA=12h 38m 45s y DEC=43o 27’ 47”.
La distancia al asteroide en ambas posiciones fue medida usando un potente radar
obteniendo para la primera observación 43189 km y para la segunda 54290 km.
¿Cuáles son los elementos orbitales de el cuerpo referidos al geocentro? ¿cuáles
son sus elementos orbitales referidos al Sol? ¿cuáles son sus elementos orbitales
referidos al baricentro del Sistema Solar?
Comenzamos con la fecha:
4.9. Aplicaciones del problema de los dos cuerpos 163

In [85]: fecha="4/6/2018"

Las operaciones que debemos hacer ahora son las inversas a las que hicimos
para calcular la posición. Ahora tenemos las coordenadas en J2000 en el cielo y
necesitamos las coordenadas cartesianas en el espacio del cuerpo. Para ello usare-
mos la rutina latrec de SPICE:

In [86]: d1=43189.0
RA1=12+38.0/60+40.0/3600
DEC1=43+27.0/60+35.0/3600
r1=spy.latrec(d1,RA1*15*GRADOS,DEC1*GRADOS)

d2=54290.0
RA2=12+38.0/60+45.0/3600
DEC2=43+29.0/60+47.0/3600

R
r2=spy.latrec(d2,RA2*15*GRADOS,DEC2*GRADOS)

La rápidez promedio del cuerpo en este intervalo de tiempo fue

O
In [87]: v=spy.vnorm(r2-r1)/900
print("Rapidez (km/s): ",v) D
Rapidez (km/s): 12.334500670270591
A
Ahora es menester encontrar la posición y velocidad relativa, bien sea al geo-
centro, al Sol o al baricentro del Sistema Solar del cuerpo.
La posición y velocidad relativa al geocentro se calcula determinando primero
RR

la velocidad relativa del observador respecto del geocentro.

4.9.13 Determinación de la órbita de un cuerpo a partir de su


posición en el cielo
Dada la posición en el cielo de un cuerpo (ascención recta y declinación) en distin-
BO

tos instantes del tiempo, ¿cuáles son los elementos orbitales del cuerpo?
164 Chapter 4. El Problema de los dos cuerpos

R
O
D
A
RR
BO
Chapter 5

El problema de los tres


cuerpos

R
O
In [1]: from meccel import *
%matplotlib inline
D
Hasta ahora hemos estudiado en detalle el problema de los dos cuerpos como la
base fundamental para el estudio de sistemas jerárquicos de N-cuerpos (sistemas
que pueden dividirse en subsistemas de dos cuerpos anidados).
Existen sin embargo muchas situaciones (algunas muy interesantes) en las que
A
no es posible estudiar la dinámica de un sistema de N-cuerpos, simplemente,
asumiéndolo como un sistema anidado de dos cuerpos.
Consideremos por ejemplo el siguiente sistema de partículas:
RR

In [2]: #Factor
#Pasa masa1=100, masa2=5, r=3, factor=0.695549078
#factor=0.695249071
factor=0.695549078
BO

#Propiedades del sistema


masa1=100.0
masa2=5.0
masa3=0.01
mu=masa1+masa2

r=3.0
r1=-masa2/mu*r
r2=+masa1/mu*r
vcirc=np.sqrt(mu/r)

alpha=(masa2/(3*masa1))**(1./3)

r3=r2+alpha*r
vsmall=factor*np.sqrt(mu/r**3)*r3

#Condiciones iniciales
T=5.0

165
166 Chapter 5. El problema de los tres cuerpos

Nt=1000

sistema=dict(
# Particula 0
particula1=dict(
m=masa1,
r=[r1,0,0],
v=[0,-vcirc/2,0]
),
# Particula 1
particula2=dict(
m=masa2,
r=[r2,0,0],
v=[0,+vcirc/2,0]
),

R
# Particula 2
particula3=dict(
m=masa3,

O
r=[r3,0,0],
v=[0,vsmall,0]
)
)
D
Resolvamos el sistema de ecuaciones diferenciales del problema de los N-
cuerpos y veamos la solución:
A
In [3]: #Preparación de la solución
y,masas,N=sis2ini(sistema)
RR

#Solución
solucion=odeint(EoM_Nbody,y,np.linspace(0,T,Nt),args=(masas,))
#Extracción de la solución
rs,vs=sol2pos(solucion)
#En el centro de masa
rs,vs=in2cm(rs,vs,masas,Nt,N)
BO

#Gráfico
fig2d = plt.figure(figsize=(6,6))
ax2d=fig2d.gca()

for i in range(N):
# Grafica en 2D
line,=ax2d.plot(rs[i,0,0],rs[i,0,1],'o',markersize=10,markeredgecolor='none')
color=line.get_color()
ax2d.plot(rs[i,:,0],rs[i,:,1],color=color)
ax2d.plot(rs[i,-1,0],rs[i,-1,1],'s',markersize=10,markeredgecolor='none',color=c

ax2d.legend(loc='best')
ext=np.abs(rs[:,:,:2]).max()
ax2d.set_xlim(-ext,ext)
ax2d.set_ylim(-ext,ext)

Out[3]: (-3.7266967521473777, 3.7266967521473777)


167

R
O
D
A
RR

¿Puede este sistema considerarse un sistema jerarquico de 3 cuerpos? ¿cuáles


serían las parejas?
Si se examina la posición inicial y final de la partícula de menor masa (P3), esta
BO

se encuentra siempre opuesta a la línea de las partículas P1-P2. Esto implica que
su período respecto a la partícula P1 es igual al de la partícula P2. Sin embargo de
acuerdo al problema de los dos cuerpos no es posible que dos partículas situadas
a distancias diferentes (distintos valores de a) respecto a otra más masiva, tengan
exactamente el mismo período.
Ahora bien, tampoco podemos suponer que la partícula P3 forma un sistema
de 2 partículas respecto a la P2 puesto que en este caso el período orbital relativo
es igual al período de P2 respecto a P1.
¿Qué pasa entonces? Estamos aquí en presencia de un sistema de partículas
al que no le podemos aplicar bajo ninguna aproximación lo que hemos aprendido
sobre el problema de los dos cuerpos. Este es un caso típico del que se conoce en
Mecánica Celeste como el problema de los tres cuerpos.
Si bien situaciones tan específicas como estas no deberían ser comunes en la
naturaleza (varíe por ejemplo el valor de la variable factor en la definición de
las condiciones iniciales para que note la sensibilidad a las condiciones iniciales),
en la era de la exploración espacial, estas configuraciones tienen aplicaciones muy
168 Chapter 5. El problema de los tres cuerpos

interesantes. Así por ejemplo la configuración mostrada en el sistema anterior,


si suponemos que P1 es la Tierra, P2 la Luna y P3 una nave espacial, permitiría
estacionar una nave en un punto sobre la Luna desde el que siempre se vería su
lado lejano.
Adicionalmente sistemas de partículas en los que existen grandes cuerpos per-
turbadores en la naturaleza pueden conducir a situaciones si bien no iguales a la
anterior, si muy diferentes a las que normalmente observamos en la naturaleza
(es el caso por ejemplo de la órbita de los denominados asteroides Trojanos y de
algunas lunas de los planetas gigantes).
Si bien, como sucede en general en el problema de los N-cuerpos, el problema
de los 3 cuerpos no puede resolverse de forma cerrada, estudiraemos aquí ver-
siones restringidas del problema que nos permiten ganar alguna intuición sobre
las propiedades de estos sistemas y su comportamiento general.

R
5.1 El problema circular restringido de los tres
cuerpos

O
En este problema se tienen inicialmente tres partículas autogravitantes de masas
m1 , m2 y m3 con posiciones respectivas ~r1 , ~r2 y ~r3 respecto a un orígen inercial.
D
Determinar el movimiento de los tres cuerpos implica conocer en todo instante de
tiempo el valor los tres vectores de posición y de los vectores de velocidad asocia-
dos. Como el movimiento es en el espacio, necesitariamos partir de 18 condiciones
iniciales. Ahora bien, como este es un caso particular del problema de los N cuer-
A
pos, es claro que solo tenemos a disposición 10 constantes de movimiento. La
primera dificultad con que nos encontramos en este caso es la falta de restricciones
naturales (por ejemplo, la existencia asociada a la ubicación de las dos partículas
RR

respecto al centro de masa) que lo vuelvan analíticamente soluble.


Si se quiere obtener una aproximación analítica es necesario imponer restric-
ciones artificiales:
1. Una primera restricción posible sería asumir que m1 >> m2 ≈ m3 . En este
caso, la partícula m1 puede ubicarse en el orígen de coordenadas y en reposo,
BO

de manera que la descripción se reduce a encontrar ~r2 , ~r3 , ~v2 y ~v3 . Sin em-
bargo, esto representa de nuevo un sistema no soluble, ya que requerimos 12
constantes de integración.
2. La segunda restricción implica asumir que la interacción gravitacional entre
los dos cuerpos menos masivos (de masas comparables m2 y m3 ) es despre-
ciable. De esta manera, m2 y m3 describirán trayectorias keplerianas alrede-
dor de m1 de manera que lo que se ha logrado es pasar de un problema de
tres cuerpos a dos problemas independientes de dos cuerpos, cuya descrip-
ción ya ha sido analizada.
3. Otra restricción natural puede ser asumir que las distancias entre m1 y el
sistema m2 -m3 es muy grande, similar a lo que sucede con el sistema Sol-
Tierra-Luna. Al igual que el caso anterior, m3 describirá una órbita kepleriana
alrededor de m2 y el baricentro de este sistema hará lo propio respecto a m1 .
Una vez más, dividimos el movimiento en dos sistemas de dos cuerpos. Esta
suposición también presenta problemas en lo que respecta a la estabilidad.
5.1. El problema circular restringido de los tres cuerpos 169

Por ejemplo, si la luna no estuviera a 380000.0 km sino a 700000.0 km, esta


podría escapar de la atracción gravitacional del planeta y convertirse en un
cuerpo orbitando al Sol.
Pero existe una restricción más interesante que las anteriores y esta consiste en
asumir que m1 ≈ m2 >> m3 . En este caso, m1 y m2 describen una trayectoria ke-
pleriana respecto a su centro de masa común, esto es un problema de dos cuerpos
clásico.
Además, y por simplicidad podriamos asumir también que la excentricidad de
dicha órbita es casi cero. Estas suposiciones constituyen el conocido problema circu-
lar restringido de los tres cuerpos o CRTBP por su sigla en inglés (Circular Restricted
Three Body Problem).
En estas condiciones podemos ubicar un plano de referencia que coincida con el
plano de Laplace del sistema m1 -m2 . En esta situación la ecuación de movimiento

R
para la partícula m3 es:

~r (t) ~r (t)
~r¨3 (t) = − Gm1 13 − Gm2 23 (5.1)

O
3 (t)
r13 3 (t)
r23
es importante tener en cuenta que, en coordenadas cartesianas
D
~r13 = ~r3 −~r1 = [ x3 (t) − x1 (t)]î + [y3 (t) − y1 (t)] ĵ + [z3 (t) − z1 (t)]k̂ (5.2)
~r23 = ~r3 −~r2 = [ x3 (t) − x2 (t)]î + [y3 (t) − y2 (t)] ĵ + [z3 (t) − z2 (t)]k̂ (5.3)
A
(5.4)
Notemos que en este sistema de referencia, las tres partículas se mueven, las
dos más masivas lo hacen sobre el plano en torno al centro de masa y la de prueba
RR

orbita alrededor de estas dos. La descripción del movimiento podría simplificarse


si nos montamos en un sistema de coordenadas rotante tal que las dos particu-
las más masivas esten siempre a lo largo del mismo eje. En un sistema como
aquel, la partícula de prueba experimentará aceleraciones ficticias y la ecuación
de movimiento de m3 se escribirá ahora como:
BO

~r 0 0
~r23
~r¨30 = − Gm1 1303
− Gm 2 03
−ω
~ × (~ ~ ×~r˙ 30
ω ×~r30 ) − 2ω (5.5)
r13 r23
Aquí ω = n âz , con n la velocidad angular promedio del movimiento relativo
de las partículas 1 y 2.
Para no recargar la notación, de ahora en adelante quitaremos todo subíndices
asociado a la tercera partícula, y toda comilla que denote medición respecto al
sistema rotante de manera que, por ejemplo ~r¨30 → ~r¨ que denotará la aceleración de
la partícula m3 medida respecto al sistema rotante y r13 0 → r será la posición de
1
m3 respecto a m1 con componentes en el sistema rotante. Así las cosas, la ecuación
anterior queda

~r ~r
~r¨ = − Gm1 13 − Gm2 23 − ω
~ × (~ ~ ×~r˙
ω ×~r ) − 2ω (5.6)
r1 r2
y en este caso (las cantidades primadas son medidas respecto al sistema
rotante)
170 Chapter 5. El problema de los tres cuerpos

~r1 = ~r −~r1 = [ x (t) − x1 ]î + y(t) ĵ + z(t)k̂ (5.7)


~r2 = ~r −~r2 = [ x (t) − x2 ]î + y(t) ĵ + z(t)k̂ (5.8)
Ahora bien, dado que se asume que p el movimiento relativo de los dos cuerpos
mayores es circular (con radio a = µ/n3 , el valor de x1 y x2 en las expresiones
anteriores será constante e igual a:

m2
x1 = − a (5.9)
M
m
x2 = + 1 a (5.10)
M
(5.11)

R
5.2 Las regiones de exclusión

O
Al ser una constante, el valor de C J puede definirse desde t = 0 con las condiciones
iniciales ~r (t = 0), ~r˙ (t = 0). De la ecuación que define la constante de Jacobi en las
unidades canónicas del CRTBP es claro que

(1 − α ) α
D
v2 = 2 + 2 + x 2 + y2 − C (5.12)
r1 r2
A
Claramente, el movimiento solo tendrá lugar cuando v2 ≥ 0 ya que de lo con-
trario, la situación no tendría sentido físico. Las regiones para las cuales v2 < 0
se conocen como regiones de exlusión y claramente determinan los lugares donde
RR

la partícula de prueba m3 no puede estar. Analizando los signos de cada uno de


los términos de las ecuaciones se halla que las regiones de exlusión dependen del
valor de C, la cual puede ser negativa, positiva o cero.
Si C es negativa, lo que ocurre cuando la velocidad inicial de la partícula es
muy grande, la partícula es libre de moverse por todos los puntos del espacio (en
una órbita que no posee ninguna regularidad).
BO

En el caso en el que C = 0, ie. v2c = 2(1 − α)/r1 + 2α/r2 + x2 + y2 la partícula


también estaría libre de moverse en cualquier lugar del espacio. Sin embargo esta
condición define la transición entre la situación anterior y la que describiremos
abajo. La velocidad vc es aquí el equivalente a la velocidad de escape en el problema
de los dos cuerpos, que define la separación entre una órbita ligada (elíptica) y una
no ligada (hiperbólica).
Experimente definiendo en el sistema de la sección anterior, fijando la veloci-
dad inicial de la partícula en el valor de vc .
Las situaciones más interesantes se producen cuando C > 0. En este caso no en
todos los puntos del espacio, se cumple que v2 ≥ 0, por lo tanto, pueden originarse
regiones de exclusión tal que la partícula solo puede estar en lugares donde

(1 − α ) α
2 + 2 + x 2 + y2 − C ≥ 0 (5.13)
r1 r2
Las superficies que limitan las regiones donde la partícula puede o no estar
se conocen como superficies de cero velocidad o curvas de cero velocidad y y están
5.2. Las regiones de exclusión 171

definidas por la igualdad a cero en la ecuación anterior. Se las llama curvas puesto
que es común mostrar las zonas de restricción en el plano xy en lugar de hacerlo
en todo el espacio.
Consideremos el siguiente sistema (y su solución):

In [6]: alpha=0.3

ro=[0.3,0,0]
vo=[0.5,0.401,0.0]

Nt=1000
T=20.0
ts=np.linspace(0,T,1000)
y=ro+vo
solution=odeint(EoM_CRTBP,y,ts,args=(alpha,))

R
rs=solution[:,:3]
vs=solution[:,3:]

O
Para visualizar las curvas de cero velocidad, por ejemplo, en el sistema anterior,
debemos primero calcular el valor de la constante de Jacobi del sistema

In [7]: r1=norm(np.array([-alpha,0,0])-ro)
D
r2=norm(np.array([1-alpha,0,0])-ro)
CJ=2*(1-alpha)/r1+2*alpha/r2+(ro[0]**2+ro[1]**2)-norm(vo)**2
print("Constante de Jacobi:",CJ)
A
Constante de Jacobi: 3.5125323333333336
RR

Ahora podemos construir las superficies de cero velocidad creando una malla
de puntos en la región del espacio alrededor de los dos cuerpos y calculando allí
el valor de v2 :

In [8]: #Tamaño de la malla


BO

xmax=2
ymax=2
NG=80

#Malla de puntos
X,Y=np.meshgrid(np.linspace(-xmax,xmax,NG),np.linspace(-ymax,ymax,NG))

#C=3.8
#Cuadrado de la velocidad
V2=2*(1-alpha)/np.sqrt((X+alpha)**2+Y**2)+2*alpha/np.sqrt((X-1+alpha)**2+Y**2)+X**2+

Con la malla podemos dibujar la curva de cero velocidad obteniendo el con-


torno de la matriz V2 correspondiente al valor 0 y superponerlo con la trayectoria
de la partícula:

In [9]: fig=plt.figure(figsize=(8,8))
ax=fig.gca()
172 Chapter 5. El problema de los tres cuerpos

#Curva de cero velocidad


ax.contour(X,Y,V2,levels=[0])
#Región de exclusión
ax.contourf(X,Y,V2,levels=[-100,0],colors='r')

ax.plot(rs[:,0],rs[:,1],color='green')
ax.plot([-alpha],[0],'o',color='blue',markersize=10*(1-alpha))
ax.plot([1-alpha],[0],'o',color='orange',markersize=max(2,10*alpha))

ext=1.5*rs.max()
ax.set_xlim((-ext,ext))
ax.set_ylim((-ext,ext))
ax.grid()

R
O
D
A
RR
BO

Podemos también dibujar, con un procedimiento similar las curvas de cero ve-
locidad para distintos valores de la constante de Jacobi:

In [10]: alpha=0.2

xmax=2
ymax=2
5.2. Las regiones de exclusión 173

NG=80
X,Y=np.meshgrid(np.linspace(-xmax,xmax,NG),np.linspace(-ymax,ymax,NG))

fig=plt.figure(figsize=(8,8))
ax=fig.gca()

colors=['b','r','g','y']
for i,C in enumerate([3.805,3.554,3.199]):
V2=2*(1-alpha)/np.sqrt((X+alpha)**2+Y**2)+2*alpha/np.sqrt((X-1+alpha)**2+Y**2)+
c=ax.contour(X,Y,V2,levels=[0],colors=colors[i])

ax.plot([-alpha],[0],'o',color='blue',markersize=10*(1-alpha))
ax.plot([1-alpha],[0],'o',color='orange',markersize=max(2,10*alpha))
ax.grid()

R
O
D
A
RR
BO

Los valores aquí escogidos para la constante de Jacobi, C J = 3.805, 3.554, 3.199,
no son arbitrarios, sino que corresponden a situaciones críticas en la que la ge-
ometría de la curva cambia. Así por ejemplo cuando la constante de Jacobi pasa el
límite de 3.805 la zonas permitidas para la partícula pasan de ser solo alrededor de
cada uno de los cuerpos a crear una región en la que los dos cuerpos están incluí-
dos. Esta es una situación muy particular e interesante para los viajes espaciales.
174 Chapter 5. El problema de los tres cuerpos

Puede notarse también que cada uno de estos valores define un punto sobre
el eje x en los que la curva de cero velocidad tiene un intercepto. Como veremos
más adelante a estos puntos se los conoce como puntos de equilibrio de Lagrange y el
orden de estos viene determinado por el orden decreciente del valor de C J .

5.2.1 El potencial modificado


Queremos encontrar una herramienta matemática que nos permita estudiar el
siguiente problema: ¿cuáles son las condiciones necesarias para que la partícula
de prueba esté en reposo respecto al sistema rotante?
Partamos de la ecuación:

~r ~r
~r¨ = −(1 − α) 13 − α 23 − k̂ × (k̂ ×~r ) − 2k̂ ×~r˙ (5.14)

R
r1 r2

Como sabemos, esta ecuación representa la aceleración que siente la partícula

O
de prueba en el sistema rotante.
Podemos preguntarnos ¿cuál es la aceleración que siente la partícula cuando
en un instante dado esta en reposo en el sistema rotante? En este caso la ecuación
de movimiento se escribe como

~r
D ~r
~r¨0 = −(1 − α) 13 − α 23 − k̂ × (k̂ ×~r ) (5.15)
r1 r2
A
Donde hemos usado aquí el subíndice 0 para indicar que esta es solo la acel-
eración de la partícula cuando se encuentra instantáneamente en reposo.
RR

Es fácil mostrar que esta ecuación puede escribirse en la forma

(1 − α )
 
¨ α 1 2 2
~r0 = −∇ − − − (x + y ) (5.16)
r1 r2 2
Es decir, en el sistema rotante, una partícula en reposo experimenta una acel-
BO

eración correspondiente a un potencial diferente del potencial gravitacional y que


llamaremos el potencial modificado:

(1 − α ) α 1
Vmod = − − − ( x 2 + y2 ) (5.17)
r1 r2 2
En términos del potencial modificado las ecuaciones de movimiento del sis-
tema, aún cuando la velocidad de la partícula ligera no es 0, se escriben:

∂Vmod
ẍ − 2ẏ = − (5.18)
∂x
∂Vmod
ÿ + 2ẋ = − (5.19)
∂y
∂Vmod
z̈ = − (5.20)
∂z
(5.21)
5.2. Las regiones de exclusión 175

5.2.2 Visualización del Potencial modificado


Usando la expresión anterior podemos visulizar el potencial modificado e inter-
pretar su significado:

In [11]: alpha=0.1
xs=np.linspace(-2,2,100)
ys=np.linspace(-2,2,100)
X,Y=np.meshgrid(xs,ys)
Z=np.zeros_like(X)
R1=np.sqrt((X+alpha)**2+Y**2+Z**2)
R2=np.sqrt((X-1+alpha)**2+Y**2+Z**2)
Vmod=-(1-alpha)/R1-alpha/R2-0.5*(X**2+Y**2)

Una gráfica en 3D:

R
In [12]: fig=plt.figure()
ax=fig.add_subplot(111, projection='3d')

O
ax.plot_surface(X,Y,Vmod)
ax.set_zlim((-5,0))

Out[12]: (-5, 0)
D
A
RR
BO

In [13]: fig=plt.figure()
ax=fig.add_subplot(111)
levels=np.linspace(Vmod.min(),Vmod.max(),1000)
ax.contourf(X,Y,Vmod,levels=levels,cmap="prism")

Out[13]: <matplotlib.contour.QuadContourSet at 0x12199aac8>


176 Chapter 5. El problema de los tres cuerpos

R
O
D
5.2.3 Los puntos de equilibrio de Lagrange
A
En secciones anteriores derivamos una expresión para la aceleración que experi-
mentará una partícula de prueba en reposo en el sistema rotante en función del
potencial modificado
RR

~r¨0 = −∇Vmod (5.22)


(1 − α ) α 1
donde Vmod = − − − ( x 2 + y2 )
r1 r2 2
Es claro que para garantizar que el reposo en el sistema rotante se mantenga
BO

r¨0 = 0, lo cual a su vez implica


más allá de la condición incial, es necesario que ~
∂Vmod /∂x = ∂Vmod /∂y = ∂Vmod /∂z = 0. Llamamos a todos los puntos del es-
pacio en los que se cumple esta condición puntos de equilibrio de Lagrange y estos
corresponden a lugares muy especiales en el problema de los tres cuerpos.
La condición ∂Vmod /∂z = 0 implica que:

∂Vmod z z
= (1 − α ) 3 + α 3 (5.23)
∂z r1 r2
que solo es válida para valores finitos de x, y, z si z = 0, es decir los puntos de
equilirbio se encuentran todos sobre el plano xy.
Por otro lado ∂Vmod /∂y = 0 implica que:

∂Vmod y y
= (1 − α ) 3 + α 3 − y (5.24)
∂y r1 r2
Esta condición produce dos familias de puntos:
5.2. Las regiones de exclusión 177

y=0 (5.25)
1−α α
+ 3 −1 = 0 (5.26)
r13 r2

La primera familia de puntos es aquella que se encuentra sobre el eje x (y = 0)


posibilidad nos dice que los puntos de. La segunda familia de puntos se encuen-
tran fuera del eje x y su distancia satisface la segunda condición.
Para saber la ubicación exacta de los puntos es necesario aplicar la última condi-
ción ∂Vmod /∂x = 0:

( x − x1 ) ( x − x2 )
(1 − α ) +α −x =0 (5.27)
r13 r23

R
5.2.4 Puntos triangulares

O
La ubicación de los puntos que se encuentran fuera del eje x puede hayarse re-
solviendo simultáneamente las ecuaciones:
1−α
3
r1
α
r2
D
+ 3 −1 = 0 (5.28)

( x − x1 ) ( x − x2 )
A
(1 − α ) 3
+α −x =0 (5.29)
r1 r23
Multipliquemos la ecuación por ( x − x2 ) y por ( x − x1 ) y substraemos los pro-
RR

ductos separadamente de la ecuación para obtener

(1 − α )
− x2 + (− x1 + x2 ) = 0 (5.30)
r13
α
− x1 + 3 (− x2 + x1 ) = 0 (5.31)
BO

r2

Teniendo en cuenta que x1 = −α y x2 = 1 − α, la solución a las dos últimas


ecuaciones es

r1 = r2 = 1 (5.32)

5.2.5 Puntos de equilibrio colineales


Recordando que las dos restricciones ya deducidas son: z = y = 0, la ecuacion
anterior queda

( x − x1 ) ( x − x2 )
x − (1 − α ) 3
−α =0 (5.33)
| x − x1 | | x − x2 |3
Los valores de la variable x pueden estar en tres regiones diferentes como se
aprecia en la imagen. Analicemos cada una de ellas.
178 Chapter 5. El problema de los tres cuerpos

• Región I:

( x − x1 ) ( x2 − x )
x − (1 − α ) +α =0 (5.34)
( x − x1 )3 | − ( x2 − x )|3

(1 − α ) α
x− + =0 (5.35)
( x − x1 )2 ( x2 − x )2

• Región II: En este caso la ecuación se escribe como

( x − x1 ) ( x − x2 )

R
x − (1 − α ) 3
−α =0 (5.36)
( x − x1 ) ( x − x2 )3

O
(1 − α ) α
x− 2
− =0 (5.37)
( x − x1 )
D ( x − x2 )2

• Región III: En este caso la ecuación se escribe como,


A
( x1 − x ) ( x2 − x )
x + (1 − α ) +α =0 (5.38)
| − ( x1 − x )|3 | − ( x2 − x )|3
RR

(1 − α ) α
x+ + =0 (5.39)
( x1 − x )2 ( x2 − x )2

Nótese que las ecuaciones anteriores corresponden a polinomios de quinto


BO

grado y no tienen solución analítica. Solo podemos obtener soluciones aproxi-


madas o soluciones numéricas.

In [14]: def lagrangePoints(x,alpha):


x1=-alpha
x2=1-alpha
f=(1-alpha)*(x-x1)/abs(x-x1)**1.5+alpha*(x-x2)/abs(x-x2)**1.5-x
return f

Un gráfico de esta función es:

In [15]: fig=plt.figure()
ax=fig.gca()
xs=np.linspace(-2,2,100)
ax.plot(lagrangePoints(xs,0.2),'k-')

Out[15]: [<matplotlib.lines.Line2D at 0x122285c88>]


5.2. Las regiones de exclusión 179

R
O
D
A
La posición se puede encontrar resolviendo encontrando los ceros de esta fun-
ción:
RR

In [16]: from scipy.optimize import bisect


alpha=0.2
L1x=bisect(lagrangePoints,0,1-alpha-alpha/10,args=(alpha,))
L2x=bisect(lagrangePoints,(1-alpha)+alpha/2,2,args=(alpha,))
L3x=bisect(lagrangePoints,-2,-alpha-alpha/2,args=(alpha,))
BO

Un gráfico de la posición de los puntos colineales es:

In [17]: fig=plt.figure()
ax=fig.gca()

alpha=0.2
ax.plot([-alpha],[0],'o',color='blue',markersize=10*(1-alpha))
ax.plot([1-alpha],[0],'o',color='orange',markersize=max(2,10*alpha))
ax.plot([L1x],[0],'kv',markersize=10)
ax.plot([L2x],[0],'kv',markersize=10)
ax.plot([L3x],[0],'kv',markersize=10)

ax.grid()
180 Chapter 5. El problema de los tres cuerpos

R
O
D
5.3 La constante de Jacobi
A
En el CRTBP las ecuaciones de movimiento que debemos resolver son:
RR

~r ~r
~r¨ = − Gm1 13 − Gm2 23 − ω
~ × (~ ~ ×~r˙
ω ×~r ) − 2ω (5.40)
r1 r2

Con ~r1 = [ x (t) − x1 ]î + y(t) ĵ + z(t)k̂ y ~r2 = [ x (t) − x2 ]î + y(t) ĵ + z(t)k̂
Las variables son ~r y ~r˙ (posición y velocidad de la partícula más liviana, tal y
como es medida en el sistema rotante).
BO

¿Tiene este problema alguna constante de movimiento (primera integral o


cuadratura)?
Multiplicando escalarmente la ecuación de movimiento en el sistema rotante
por ~r˙ obtenemos en el lado izquierdo
 
d 1 ˙2
~r˙ ·~r¨ = ~r (5.41)
dt 2
Ahora bien, el primer término del lado queda como
" #
~r1 ·~r˙ ( x − x1 ) ẋ + yẏ + zż
 
d 1
− 3 =− 3
≡ (5.42)
r1 r1 dt r 1
p
siendo r1 = ( x − x1 )2 + y2 + z2 . Por analogía, sucede lo mismo con el se-
gundo término del miembro de la derecha.
Ahora, analicemos el término ω ~ × (~ ˙ Notemos primero que
ω ×~r ) ·~r.
5.3. La constante de Jacobi 181

~ × (~
ω ω ×~r ) = ω k̂ × ( xω ĵ − ωyî )
= − xω 2 î − yω 2 ĵ

y por lo tanto:

1 d
ω ×~r ) ·~r˙ = −ω 2 ( x ẋ + yẏ) = − ω 2 ( x2 + y2 )
~ × (~
ω
2 dt
Por propiedades del producto punto es claro que multiplicando escalarmente
el último término de la derecha por ~r˙ obtenemos

ω ×~r˙ ) ·~r˙ = 0
2(~ (5.43)

R
Juntando todos estos resultados obtenemos finalmente que
   
d 1 ˙2 d Gm1 Gm2 1
~r = + + ω 2 ( x 2 + y2 ) (5.44)

O
dt 2 dt r1 r2 2
Agrupando términos y multiplicando ambos lados de la ecuación por dos se
halla finalmente

d

−~r˙ 2 + 2
Gm1
+2
Gm2
D 
+ ω 2 ( x 2 + y2 ) = 0 (5.45)
dt r1 r2
A
de manera que la cantidad conservada (cuadratura) es

Gm1 Gm2
CJ = 2 +2 + ω 2 ( x 2 + y2 ) − v2 (5.46)
RR

r1 r2
A la constante C J , se le conoce como la constante de Jacobi la cual es una canti-
dad escalar.
La constante de Jacobi resulta ser la única cantidad conservada en el CRTBP
cuando la dinámica es descrita en un sistema rotante.
Para convencernos de esto, notemos que no es posible definir una energía
BO

cinética de los dos objetos masivos del sistema puesto que estos están en reposo
respecto al sistema rotante aunque si es posible hablar de una energía potencial la
cuál se conservaría solamente para el sistema de dos cuerpos.
¿Por qué no para el tercero? Básicamente porque para m3 la energía mecánica
resulta ser una cantidad no conservada debido a que sobre esta actúa una fuerza de
coriolis que evidentemente depende de la velocidad. Por regla general, las fuerzas
que dependen explícitamente de la velocidad del objeto no pueden derivar de fun-
ciones escalares y por tanto se conocen como disipativas, o sea, disipan la energía
mecánica.
Por otro lado, el problema de los tres cuerpos no puede reducirse a un problema
equivalente de dos cuerpos de manera que la fuerza sobre m3 no es central, lo cuál
no garantiza la conservación del momentum angular.
Estas cantidades no conservadas pueden conservarse si la dinámica del sistema
se describe respecto a un sistema inercial lo cual nos dejaría de nuevo con diez
cantidades conservadas y con 18 variables a encontrar. Esta es una demostración
eurística de la no solubilidad analítica del problema de los tres cuerpos.
182 Chapter 5. El problema de los tres cuerpos

Verfiquemos si efectivamente la constante de Jacobi, es constante en un sistema


que satisfaga las condiciones propuestas para el CRTBP.
Consideremos por ejemplo el siguiente sistema:

In [19]: masa1=4.0
masa2=1.0
a=1.0
masa3=0.0001
sistema=dict(
particula1=dict(

R
m=masa1,
r=[0,0,0],
v=[0,0,0]),

O
particula2=dict(
m=masa2,
r=[a,0,0],
v=[0,np.sqrt((masa1+masa2)/a),0],
),
particula3=dict(
D
m=masa3,
A
r=[0.5,0.0,0.5],
v=[0,1.5,0],
),
)
RR

tini=0.0
tend=10.0
Nt=300
ts=np.linspace(tini,tend,Nt)
rs,vs,masas,N=solucionNbody(sistema,tini,tend,Nt)
rscm,vscm=in2cm(rs,vs,masas,Nt,N)
BO

fig=plt.figure()
ax=Axes3D(fig)
ax.plot(rscm[0,:,0],rscm[0,:,1],rscm[0,:,2],'-')
ax.plot(rscm[1,:,0],rscm[1,:,1],rscm[1,:,2],'-')
ax.plot(rscm[2,:,0],rscm[2,:,1],rscm[2,:,2],'-')

max=1.0
ax.set_xlim((-max,max))
ax.set_ylim((-max,max))
ax.set_zlim((-max,max))

Out[19]: (-1.0, 1.0)


5.3. La constante de Jacobi 183

R
O
D
Para comenzar debemos verificar que las dos partículas masivas se mueven en
un círculo. Esto puede hacerse calculando la excentricidad del sistema de esas dos
A
partículas o, en un enfoque más práctico, examinando la distancia relativa entre
ellas:
RR

In [20]: plt.figure()
plt.plot([spy.vnorm(rscm[0,i]-rscm[1,i]) for i in range(Nt)])

Out[20]: [<matplotlib.lines.Line2D at 0x1224b6470>]


BO
184 Chapter 5. El problema de los tres cuerpos

Para probar que la constante de Jacobi es realmente constante tenemos que


pasarnos al sistema rotante de las dos partículas centrales.

In [21]: omega=np.sqrt((masa1+masa2)/a**3)

Debemos calcular el ángulo que ha rotado el sistema en cada momento

R
In [22]: # Ángulos de rotación
r12=rscm[1,:]-rscm[0,:]
tetas=np.arctan2(r12[:,1],r12[:,0])

O
D
Una vez hecho esto hay que rotar todas las posiciones al sistema rotante us-
ando:
A
In [23]: # Rota cada una de las posiciones para encontrar la posición en el sistema rotante
rsr=np.zeros_like(rs)
RR

for i in range(len(tetas)):
Rtot=spy.rotate(tetas[i],3)
for n in range(N):rsr[n,i]=Rtot.dot(rscm[n,i])
BO

En el espacio las posiciones son ahora:

In [24]: fig=plt.figure()
ax=Axes3D(fig)
ax.plot(rsr[0,:,0],rsr[0,:,1],rsr[0,:,2],'o-')
ax.plot(rsr[1,:,0],rsr[1,:,1],rsr[1,:,2],'o-')
ax.plot(rsr[2,:,0],rsr[2,:,1],rsr[2,:,2],'-')

max=1.5
ax.set_xlim((-max,max))
ax.set_ylim((-max,max))
ax.set_zlim((-max,max))

Out[24]: (-1.5, 1.5)


5.3. La constante de Jacobi 185

R
O
D
Nótese que la posición de los cuerpos masivos ahora parece constante y la
A
trayectoria del tercer cuerpo se ha modificado considerablemente.
La velocidad en el sistema rotante es un poco más complicada. Debemos uti-
lizar la relación que habíamos deducido antes ~v0 = ~v − Ω ×~r:
RR

In [25]: # Encuentra la velocidad en el sistema rotante


vsr=np.zeros((Nt,3))
for i in range(Nt):
vsr[i]=vscm[2,i]-np.cross(np.array([0,0,omega]),rscm[2,i])
BO

Veamos cuánto vale la constante de Jacobi, C J = 2Gm1 /r1 + 2Gm2 /r2 +


ω 2 ( x2 + y2 ) − v2 , en este sistema:

In [26]: r1=rsr[2,:]-rsr[0,:]
r2=rsr[2,:]-rsr[1,:]
rho=np.sqrt(rsr[2,:,0]**2+rsr[2,:,1]**2)
CJ=[2*masa1/spy.vnorm(r1[i])+2*masa2/spy.vnorm(r2[i])+omega**2*rho[i]**2-spy.vnorm(

Gráficamente:

In [27]: plt.figure()
plt.plot(CJ)

Out[27]: [<matplotlib.lines.Line2D at 0x1225fd898>]


186 Chapter 5. El problema de los tres cuerpos

R
O
D
A
5.3.1 Unidades en el CRTBP
Vamos a deducir un conjunto de unidades canónicas trabajando con la constante
de gravitación universal y forzando a que esta adopte un valor de 1 u3L (u M u2T ).
RR

Como siempre, debemos seleccionar las unidad de masa y a unidad de longitud


para luego, calcular la unidad de tiempo. La unidad de masa va a ser tal que la
suma de m1 y m2 es igual a la unidad, luego 1 u M = m1 + m2 . La unidad de
longitud va a ser la separación constante entre las dos partículas masivas 1 u L = a.
Aplicando la tercera ley de Kepler
BO

r
µ
n= = 1 u T −1 (5.47)
a3

Por otro lado, como la suma de las dos masas es siempre igual a la unidad,
solo necesito especificar el valor de una de ellas. Entonces, podemos introducir
una nueva variable α definida como α ≡ m2 /(m1 + m2 ) = m2 de manera que
m1 = 1 − α. Con esta definición y recordando del problema de los dos cuerpos que

m2
x1 = − a = −α = −α
m1 + m2
m1
x2 = a = 1−α
m1 + m2

En términos de las unidades canónicas del CRTBP, la constante de Jacobi y el


potencial modificado se escriben como
5.3. La constante de Jacobi 187

(1 − α ) α
CJ = 2 + 2 + x 2 + y2 − v2 (5.48)
r1 r2
p p
Donde r1 = ( x + α)2 + y2 + z2 , r2 = ( x − 1 + α)2 + y2 + z2
Una de las ventajas de la unidades canónicas del CRTBP, es que todas las
propiedades del sistema se reducen a especificar un solo parámetro, α.
Podemos calcular ahora en unidades canónicas la constante de Jacobi del prin-
cipio:

In [28]: UM=masa1+masa2
UL=a
UT=1/omega
UV=UL/UT

R
CJ=[2*(masa1/UM)/(spy.vnorm(r1[i])/UL)+
2*(masa2/UM)/(spy.vnorm(r2[i])/UL)+
(omega/(1/UT))**2*(rho[i]/UL)**2-

O
spy.vnorm(vsr[i])**2/UV**2 for i in range(Nt)]

# Gráfica D
plt.figure()
plt.plot(CJ)

Out[28]: [<matplotlib.lines.Line2D at 0x1223dd8d0>]


A
RR
BO

Como vemos el valor de la constante de Jacobi en el sistema de unidades


canónicas propias del problema de los 3 cuerpos es del orden de 3. Esto se en-
tiende si analizamos cada uno de los términos de la constante:
188 Chapter 5. El problema de los tres cuerpos

(1 − α ) α
CJ = 2 + 2 + x 2 + y2 − v2 (5.49)
r1 r2
Dado que normalmente α  1, el primer término es del orden de 2, el segundo
término es muy pequeño, el tercer término (x2 + y2 ), si asumimos que la partícula
esta relativamente cerca a las otras dos, es del orden de 2 mientras que el último
término es el más incierto, en tanto la velocidad de la partícula podría ser arbi-
traria. Si asumimos una velocidad relativamente pequeña, v ∼ 1, el resultado es
que la constante de Jacobi sería C J ∼ 2 + 2 − 1 ∼ 3
### Solución numérica al CRTBP
En el sistema rotante y con las unidades canónicas todo es más sencillo. Debería
también serlo la solución a las ecuaciones de movimiento. El sistema de ecuaciones
diferenciales puede escribirse numéricamente como se muestra a continuación

R
In [29]: def EoM_CRTBP(y,t,alpha):
r1=np.array([-alpha,0,0])
r2=np.array([1-alpha,0,0])

O
omega=np.array([0,0,1])

r=y[:3]
v=y[3:]

R1=r-r1
D
R2=r-r2
A
drdt=v
dvdt=-(1-alpha)/spy.vnorm(R1)**3*R1-alpha/spy.vnorm(R2)**3*R2-np.cross(omega,np
RR

dydt=drdt.tolist()+dvdt.tolist()

return dydt

In [30]: alpha=0.3
BO

ro=[0.3,0,0]
vo=[0.5,0.401,0.0]
#ro=[0.5,0,0]
#vo=[0,1,0]

# Solución
Nt=1000
T=20.0
ts=np.linspace(0,T,1000)
y=ro+vo
solution=odeint(EoM_CRTBP,y,ts,args=(alpha,))
rs=solution[:,:3]
vs=solution[:,3:]

Así se ve la solución:

In [31]: #Gráfico de la órbita


fig=plt.figure(figsize=(12,6))
5.3. La constante de Jacobi 189

axr=fig.add_subplot(1,2,1)

# Rotante
axr.plot(rs[:,0],rs[:,1],color='green')
axr.plot([-alpha],[0],'o',color='blue',markersize=10*(1-alpha))
axr.plot([1-alpha],[0],'o',color='orange',markersize=10*alpha)

# Decoration
ext=rs.max()
axr.set_xlim((-ext,ext))
axr.set_ylim((-ext,ext))
axr.grid()

R
O
D
A
RR
BO

Es interesante notar, en la dinámica del sistema, como la partícula parece de-


scribir una trayectoria muy compleja, pero igual acotada, es decir, hay una región
del espacio en la que la partícula se puede mover mientras que hay otras regiones
en las que no puede hacerlo. ¿A qué se debe ese comportamiento?
190 Chapter 5. El problema de los tres cuerpos

5.3.2 Constante de Jacobi para la solución numérica


En el caso del problema real vimos que la constante de Jacobi no es exactamente
constante. Sin embargo cuando tenemos la solución al CRTBP la constante debe
ser estrictamente constante. Comprobémoslo usando la solución vista en la sección
anterior:
In [32]: def JacobiConstant(r,v,alpha):
r1=np.array([-alpha,0,0])
r2=np.array([1-alpha,0,0])
omega=np.array([0,0,1])
R1=r-r1
R2=r-r2
C=2*(1-alpha)/norm(R1)+2*alpha/norm(R2)+(r[0]**2+r[1]**2)-norm(v)**2
return C

R
Cs=np.array([JacobiConstant(rs[i],vs[i],alpha) for i in range(Nt)])
Grafiquemos:

O
In [33]: fig=plt.figure()
ax=fig.gca()
#ax.plot(Cs-Cs.mean())
ax.plot(Cs)
D
ax.set_ylabel(r"$C_J-\langle C_J\rangle$")
Out[33]: Text(0, 0.5, '$C_J-\\langle C_J\\rangle$')
A
RR
BO

5.4 El parámetro de Tisserand


Una de las más interesantes aplicaciones de lo que hemos visto hasta aquí sobre el
problema de los tres cuerpos tiene que ver con el estudio de los cuerpos pequeños
5.4. El parámetro de Tisserand 191

del Sistema Solar (asteroides y cometas) sometidos a las perturbaciones gravita-


cionales de los planetas.
Para ilustrar la importancia del problema de los tres cuerpos en esta situación
consideremos por ejemplo el sistema descrito abajo:
In [35]: #Sistema Sol - Júpiter - Cometa
masa1=1000.0
masa2=1.0
masa3=1e-5
mu=masa1+masa2

r=5.0
a=r
r1=-masa2/mu*r
r2=+masa1/mu*r

R
vcirc=np.sqrt(mu/r)

sistema=dict(

O
# Particula 0
particula1=dict(
m=masa1,
r=[r1,0,0],

),
v=[0,-vcirc/2,0]
D
# Particula 1
A
particula2=dict(
m=masa2,
r=[r2,0,0],
v=[0,+vcirc/2,0]
RR

),
# Particula 2
particula3=dict(
m=masa3,
r=[6.0,0,-0.1],
v=[0,2.0,0.1]
BO

)
)

Resolvamos las ecuaciones de movimiento mutuo y grafiquemos solo la posición


del Sol y el Cometa:
In [36]: T=20.0
Nt=1000
ts=np.linspace(0,T,Nt)
y,masas,N=sis2ini(sistema)
solucion=odeint(EoM_Nbody,y,ts,args=(masas,))
rs,vs=sol2pos(solucion)
rs,vs=in2cm(rs,vs,masas,Nt,N)

#Gráfico
fig2d = plt.figure(figsize=(6,6))
ax2d=fig2d.gca()
192 Chapter 5. El problema de los tres cuerpos

for i in range(N):
if i==1:continue
line,=ax2d.plot(rs[i,0,0],rs[i,0,1],'o',markersize=10,markeredgecolor='none')
color=line.get_color()
ax2d.plot(rs[i,:,0],rs[i,:,1],color=color)
ax2d.plot(rs[i,-1,0],rs[i,-1,1],'s',markersize=10,markeredgecolor='none',color=

ax2d.legend(loc='best')
ext=np.abs(rs[:,:,:2]).max()
xlim=ax2d.set_xlim(-ext,ext)
ylim=ax2d.set_ylim(-ext,ext)

R
O
D
A
RR
BO

Pongámonos ahora en la posición de un astrónomo que observará el cometa


cuando pasa cerca al Sol. ¿Qué vería? Como puede apreciarse prácticamente cada
paso por el perihelio es diferente (se da a distancias diferentes y en direcciones
diferentes). Dado que el cometa es esencialmente invisible durante el resto de
su órbita es muy posible que los astrónomos concluyan que, en cada paso por el
perihelio están observando un cometa diferente.
El modo que usan los astrónomos para identificar los cuerpos pequeños es de-
terminar sus elementos orbitales respecto del Sol. Intentemos calcularlos en este
5.4. El parámetro de Tisserand 193

caso usando SPICE:

In [37]: it=10
state=rs[2,it,:].tolist()+vs[2,it,:].tolist()
elements=spy.oscltx(state,0,mu)
print("Elementos orbitales: q = %e, e = %e, i = %g, M = %g"%(elements[0],
elements[1],
elements[2]*RADIAN,
elements[5]*RADIAN))

R
O
Elementos orbitales: q = 1.994051e+00, e = 5.018058e-01, i = 1.1795, M = 227.491
D
A
Hagamos un gráfico de los elementos orbitales:
RR

In [38]: fig,axs=plt.subplots(4,1)
BO

elts=[]
for it in range(Nt):
state=rs[2,it,:].tolist()+vs[2,it,:].tolist()
distance=spy.vnorm(rs[2,it])
elements=spy.oscltx(state,0,mu)
elts+=[[elements[9],elements[1],elements[2]*RADIAN,distance]]
elts=np.array(elts)

axs[0].plot(ts,elts[:,3])
axs[0].set_ylabel('r(AU)')
axs[1].plot(ts,elts[:,0])
axs[1].set_ylabel('a(AU)')
axs[2].plot(ts,elts[:,1])
axs[2].set_ylabel('e')
axs[3].plot(ts,elts[:,2])
axs[3].set_ylabel('I (grados)')

plt.tight_layout()
194 Chapter 5. El problema de los tres cuerpos

R
O
D
A
Como puede verse, en los primeros 4 o 5 perihelios (panel superior) la deter-
minación de los elementos orbitales (a, e, I) del cometa producen valores más o
menos consistente. Sin embargo, a partir de t ≈ 7.5 UT al medir los elementos or-
RR

bitales del cometa el valor es muy diferente y por la misma razón el cuerpo podría
confundirse con un cuerpo diferente.
Si nos pasamos ahora al sistema rotante Sol-Júpiter:
BO

In [39]: rsr,vsr=sol2rot(rs,vs,masas,Nt,N,0,1)

#Gráfico
fig2d = plt.figure(figsize=(6,6))
ax2d=fig2d.gca()

for i in range(N):
if i==1:continue
line,=ax2d.plot(rsr[i,0,0],rsr[i,0,1],'o',markersize=10,markeredgecolor='none')
color=line.get_color()
ax2d.plot(rsr[i,:,0],rsr[i,:,1],color=color)
ax2d.plot(rsr[i,-1,0],rsr[i,-1,1],'s',markersize=10,markeredgecolor='none',colo

ax2d.legend(loc='best')
ext=np.abs(rsr[:,:,:2]).max()
xlim=ax2d.set_xlim(-ext,ext)
ylim=ax2d.set_ylim(-ext,ext)
5.4. El parámetro de Tisserand 195

R
O
D
A
RR
BO

Calculemos en este sistema de referencia el valor de la constante de Jacobi:

In [40]: C=CJacobi(rsr,vsr,masas,Nt,0,1,2)

fig=plt.figure()
ax=fig.gca()
ax.plot(ts,C)
#ylim=ax.set_ylim((0.9999*C.max(),1.0001*C.max()))

Out[40]: [<matplotlib.lines.Line2D at 0x122f58f60>]


196 Chapter 5. El problema de los tres cuerpos

R
O
D
Es decir, a pesar de que los elementos orbitales cambian del cometa respecto al
Sol considerablemente durante el movimiento, la constante de Jacobi no lo hace.
De allí surge la idea de usar la constante de Jacobi en lugar de los elementos or-
A
bitales como el criterio para determinar si durante el paso por el perihelio dos
cometas con órbitas aparentemente muy diferentes son el mismo realmente.
Pero el procedimiento anterior es relativamente complejo. Requiere una
RR

rotación de coordenadas y otras operaciones que son difíciles de realizar, especial-


mente por un descubridor de cometas. ¿Existe una manera más simple de calcular
la constante de Jacobi en términos de propiedades observacionales más fácilmente
manipulables? Esta es justamente la idea de Felix Tisserand quién en 1889 desar-
rollo la teoría básica que presentaremos a continuación.
BO

5.4.1 Constante de Jacobi en términos de los elementos


orbitales
La deducción del parámetro de Tisserand se basa en la constante de Jacobi expre-
sada como una función de los elementos orbitales. Ya que los elementos orbitales
fueron deducidos para con base en un sistema no rotante (no necesariamente iner-
cial), es necesario reescribir la constante de Jacobi como una función de las coorde-
nadas de un sistema inercial, con origen en el centro de masa. Sea la posición de
m3 dada por el vector ( x, y, z) y la velocidad ( ẋ, ẏ, ż). La relación que existe entre
las coordenadas del sistema inercial (no primadas) y las del rotante (primadas) es:
 0    
x cos ωt sin ωt 0 x
 y0  = − sin ωt cos ωt 0  y  (5.50)
z0 0 0 1 z
Si partimos de la constante de Jacobi en el sistema rotante:
5.4. El parámetro de Tisserand 197

(1 − α ) α
C = −( ẋ 02 + ẏ02 + ż02 ) + 2 + 2 + x 02 + y 02 (5.51)
r1 r2
Si usamos el hecho que ~v0 = ~v − ω
~ ×~r obtenemos:
(1 − α ) α
C = −( ẋ2 + ẏ2 + ż2 ) + 2 + 2 + 2( x ẏ − y ẋ ) (5.52)
r1 r2
el término x ẏ − y ẋ, es la componente del momentum angular específico h a lo
largo del eje de rotación, de manera que x ẏ − y ẋ = ω~ · ~h = h cos I,
teniendo en cuenta que ω ~ : (0, 0, 1) en las unidades del CRTBP y siendo I la in-
clinación de la órbita del cometa respecto al plano de movimiento de m1 y m2 .
Entonces

R
(1 − α ) α
C = −( ẋ2 + ẏ2 + ż2 ) + 2 + 2 + 2h cos I (5.53)
r1 r2
Ahora bien, sabemos que en el sistema no rotante, la ecuación vis-viva es siem-

O
pre válida, luego podemos escribir
2 1
ẋ2 + ẏ2 + ż2 =
− (5.54)
r
D a
donde r es la distancia a m3 medida desde m1 (el Sol en nuestro modelo), a es
el semieje mayor de su órbita. En definitiva, obtenemos
A
2 1 (1 − α ) α
− + + 2h cos I + 2 +2 = C (5.55)
r a r1 r2
RR

Vamos a aplicar algunas suposiciones válidas que nos permitiran simplificar la


última ecuación.
En nuestro caso es válido asumir que r1 ≈ r (esto si α  1), por tanto
 
1 1 1
+ 2h cos I + 2α − + =C (5.56)
a r1 r2
BO

La segunda suposición es que debe observarse al cuerpo m3 cuando este se


encuentra muy lejos del Sol y de Júpiter, de manera que los cocientes 1/r1 y 1/r2
son siempre pequeños. Teniendo en cuenta además que α  1 se sigue que
1
+ 2h cos I ≈ C (5.57)
a
y teniendo en cuenta que h2 = a(1 − e2 ) obtenemos

1
q
TP ≡ +2 a(1 − e2 ) cos I ≈ C (5.58)
a
Donde hemos introducido el denominado parámetro de Tisserand TP que es
aproximadamente igual a la constante de Jacobi C.
Como C es una constante de movimiento, debe tener el mismo valor antes y
después del encuentro cercano con Júpiter. Por lo tanto el valor calculado para
TP debe ser también aproximadamente constante. Así, si previo al encuentro los
198 Chapter 5. El problema de los tres cuerpos

elementos orbitales son a1 , e1 , I1 y luego de este son a2 , e2 , I2 , entonces el criterio de


Tisserand sostiene que

1 1
q q
+2 a1 (1 − e12 ) cos I1 ≈ +2 a2 (1 − e22 ) cos I2 (5.59)
a1 a2
Se debe hacer énfasis en que en la ecuación anterior el semieje mayor debe
medirse en las unidades canónicas del CRTBP, es decir, en términos del semieje-
major relativo del cuerpo más masivo al segundo cuerpo.
Pongamos a prueba el criterio de Tisserando para el sistema estudiado antes,
calculando el valor de TP en dos momentos arbitrarios de la órbita del cometa:

In [41]: it1=10
a1=elts[it1,0]
e1=elts[it1,1]

R
I1=elts[it1,2]
TP1=(a/a1)+2*np.sqrt((a1/a)*(1-e1**2))*np.cos(I1*GRADOS)
print("Instante 1: (a,e,I) = ",a1,e1,I1)

O
it1=500
a2=elts[it1,0] D
e2=elts[it1,1]
I2=elts[it1,2]
print("Instante 2: (a,e,I) = ",a2,e2,I2)
A
Instante 1: (a,e,I) = 4.002557243719078 0.5018057970678459 1.1795045258285082
Instante 2: (a,e,I) = 3.6482690846375117 0.5386706717043267 1.6204980944977534
RR

Como vemos los elementos orbitales son diferentes en los momentos selec-
cionado, siendo el semieje mayor el más diferente de los dos. El valor del
parámetro de Tisserand en ambos instantes será:

In [42]: #Distancia entre los cuerpos más masivos


BO

a=norm(rsr[0,0]-rsr[1,0])

TP1=(a/a1)+2*np.sqrt((a1/a)*(1-e1**2))*np.cos(I1*GRADOS)
print("Parámetro de Tisserand en el Instante 1, TP = ",TP1)

TP2=(a/a2)+2*np.sqrt((a2/a)*(1-e2**2))*np.cos(I2*GRADOS)
print("Parámetro de Tisserand en el Instante 1, TP = ",TP2)

Parámetro de Tisserand en el Instante 1, TP = 2.7966917609637933


Parámetro de Tisserand en el Instante 1, TP = 2.8092885619693755

Como vemos el valor de TP es aproximadamente el mismo. Veámoslo mejor


graficando el valor del parámetro de Tisserand como función del tiempo:

In [43]: TPs=[]
for it in range(Nt):
ac=elts[it,0]
5.4. El parámetro de Tisserand 199

ec=elts[it,1]
Ic=elts[it,2]
TPs+=[(a/ac)+2*np.sqrt((ac/a)*(1-ec**2))*np.cos(Ic*GRADOS)]

fig=plt.figure()
ax=fig.gca()
ax.plot(ts,TPs)
ax.set_ylim((1.5,4.5))

Out[43]: (1.5, 4.5)

R
O
D
A
RR
BO
200 Chapter 5. El problema de los tres cuerpos

R
O
D
A
RR
BO
Chapter 6

El formalismo
lagrangiano

R
O
6.1 Motivación
La teoría desarrollada hasta este punto en el texto se basa en el denominado for-
D
malismo vectorial de la mecánica que basicamente expresa la dinámica de los sis-
temas usando cantidades vectoriales y sus relaciones matemáticas y geométricas.
En este formalismo la solución a cualquier problema mecánico que requiera
predecir la posición de un sistema de partículas, requiere resolver las ecuaciones
A
de movimiento:

{~r¨i = ~Fi }
RR

Esta aproximación a los problemas físicos enfrenta una serie de limitaciones, de


un lado bastante obvias y del otro muy sutiles. Así por ejemplo:

1. Para resolver el problema es necesario que se especifiquen completamente el


valor de las fuerzas como función del tiempo y el valor inicial de las variables
de estado (~ri ,~˙ri).
BO

2. Existen situaciones en física en donde no es posible, incluso por principio,


encontrar fuerzas asociadas a las interacciones. Este es el caso por ejemplo de
la teoría general de la relatividad, en el que el concepto de fuerza es accesorio
y no intrínseco a la teoría, o en el caso de la aun más original teoría cuántica.
En estas situaciones describir la dinámica usando la ecuación anterior es muy
complicado.
3. El uso de cantidades vectoriales produce claramente una mayor complejidad
matemática y computacional. Es posible que la notación sea más compacta
pero el problema es en el fondo más elaborado y complejo.

Las limitaciones más profundas del formalismo vectorial residen en la inca-


pacidad que tiene para revelar propiedades no triviales de los sistemas dinámicos,
como descubriremos más adelante.
En este capítulo presentaremos una reformulación nueva de la mecánica, par-
tiendo de principios fundamentales novedosos (y más generales) y que tiene una

201
202 Chapter 6. El formalismo lagrangiano

estuructura matemática más fácil de manejar en tanto se basa enteramente en can-


tidades escalares. Llamamos a esta formulación nueva, el formalismo escalar de
la mecánica.
El formalismo escalar no solamente ha sido exitosamente aplicado en los úl-
timos 250 años para resolver todos los problemas conocidos de la mecánica, in-
cluyendo naturalmente los problemas de la mecánica celeste, sino que además
ha probado ser increíblemente poderoso en la descripción de fenómenos en
áreas diferentes como la electricidad y el magnetismo, la relatividad general y
la mecánica cuántica. No sería exagerado decir que el formalismo escalar de la
mecánica fue posiblemente uno de los descubrimientos teóricos más importantes
en la historia de la física. Es interesante anotar que si bien la mecánica Newtoni-
ana hoy se considera una teoría efectiva, conceptualmente limitada (que fue reem-
plazada con la más fundamental Teoría de la Relatividad) el formalismo escalar
sigue estando en la base de las teorías física modernas.

R
Si bien la mayoría de los problemas que resolveremos en este capítulo, apli-
cando este nuevo formalismo, ya los resolvimos usando el formalismo vectorial,

O
veremos como sus principios y las herramientas derivadas permiten entender as-
pectos de los problemas que en el formalismo vectorial toma tiempo entender, e
incluso resolver más fácil problemas que no hemos abordado todavía.
D
6.2 El formalismo Lagrangiano
En el año 1788 el matemático y astrónomo italo-francés Joseph-Louis Lagrange
A
presentó una versión alternativa de la mecánica que ofrecía una serie de impor-
tantes ventajas frente a la formulación Newtoniana. A esta nueva formulación se
la conoce como el formalismo Lagrangiano. En esta sección presentamos la moti-
RR

vación fundamental del desarrollo de este formalismo y las versiones básicas de


su formulación.
El desarrollo del formalismo Lagrangiano partió originalmente de una in-
geniosa y poderosa herramienta teórica ideada originalmente por el físico y
matemático Francés Jean le Rond d’Alembert para resolver problemas en los que
un cuerpo o conjunto de cuerpos se encuentran en equilibrio mecánico (estática).
BO

En el formalismo vectorial de la mecánica el equilibrio se expresa como una


condición en el que la fuerza y la torca neta que actúa sobre cada partícula en el
sistema es nula.

6.2.1 Principio de los trabajos virtuales


Para d’Alembert otra forma de expresar el equilibrio es la siguiente: supongamos
que tomamos cada partícula del sistema en equilibrio y la desplazamos infinitesi-
malmente de su posición de forma imaginaria (desplazamiento virtual) en una mag-
nitud δ~ri (el uso de δ en lugar del tradicional d del cálculo es para resaltar el hecho
de que el desplazamiento no es real).
Si los desplazamientos de las partículas satisfacen las restricciones internas del
sistema, entonces, postula d’Alambert, la suma del trabajo realizado por todas las
fuerzas que actúan sobre las partículas será nulo. A esta idea se la conoce como el
principio de los trabajos virtuales y es de amplió uso en el estudio de sistemas de
partículas en equilibrio en partícular aquellas que forman cuerpos rígidos.
6.2. El formalismo Lagrangiano 203

En términos matemáticos el principio de los trabajos virtuales puede escribirse


como:

∑ ~Fi · δ~ri = 0
i

En la figura abajo se presenta un sencillo problema de mecánica con el que


podemos ilustrar el uso del principio de los trabajos virtuales:

R
O
D
A
RR
BO

Figure 6.1: Un problema simple que ilustra la manera como puede aplicarse el
principio de los trabajos virtuales

Queremos resolver la pregunta de cuál es la magnitud de la fuerza R que debo


aplicar sobre la barra para que el sistema este en equilibrio.
Para hacerlo puedo desplazar de forma imaginaria todas las partes de la barra
manteniendo eso sí su forma y longitud (restricciones internas). El desplazamiento
puede realizarse en cualquier dirección y de cualquier manera, pero evidente-
mente existirán unos desplazamientos en los que el principio pueda usarse de
forma más útil. Así por ejemplo, el desplazamiento virtual mostrado en la figura
será a todas luces el más útil. Dadas las restricciones impuestas por la rigidez de
la barra los desplazamientos virtuales asociados a las fuerzas serán:
204 Chapter 6. El formalismo lagrangiano

δr R = −dδθ (6.1)
δrW = −( L/2 − D )δθ (6.2)
δr F = + Dδθ (6.3)
δr N = 0 (6.4)
(6.5)

Donde introdujimos una nueva variable θ que cuantifica la rotación de la barra.


En estos términos el principio de los trabajos virtuales puede escribirse como:

− Rdδθ − W ( L/2 − D )δθ + FDδθ = 0

R
Dado que el desplazamiento δθ es arbitrario esta igualdad es equivalente a:

− Rd − W ( L/2 − D ) + FD = 0

O
Y de allí puede obtenerse el valor de la magnitud de la fuerza necesaria:

FD − W ( L/2 − D )
D
R=
d
Si bien este problema parece trivial, debe anotarse que en ningún momento
recurrimos a los principios de la mecánica Newtoniana, es decir a la segunda ley
A
de Newton o la ley de acción y reacción para resolver el problema.
Esto ilustra claramente como esta forma de aproximarse al problema es real-
mente una alternativa nueva a estas leyes.
RR

Otro elemento novedoso de esta aproximación es la manera como quedan ex-


cluidas de forma natural fuerzas que son mucho más difíciles de modelar, tales
como las fuerzas que mantienen unidas las partes del cuerpo o las fuerzas que
resultan de la interacción de este con su entorno (por ejemplo la fuerza N).
BO

6.2.2 Principio de d’Alambert-Lagrange


¿Podríamos aplicar un principio parecido a este pero en el caso de un sistema en
movimiento?. Esta fue justamente la pregunta que intentaron resolver d’Alambert
y luego Lagrange para generalizar el principio de los trabajos virtuales a todos los
problemas de la mecánica.
Considere por ejemplo el mismo ejemplo anterior pero en una situación en la
que la barra ya no esta en equilibrio. En su lugar rota con aceleración angular α.
En esta situación, sabemos que incluso si F se hace cero, un valor de R positivo
podría ser consistente con la situación dinámica, lo que ciertamente contradice la
solución encontrada con el principio de los trabajos virtuales.
Para resolver la situación d’Alambert y Lagrange formulan el siguiente princi-
pio general:

Principio de d’Alambert-Lagrange. En un sistema de N partículas


sometidas a fuerzas {~Fi } el trabajo virtual total realizado por las fuerzas
efectivas ~Fi − ~p˙ i es cero:
6.2. El formalismo Lagrangiano 205

∑(~Fi − ~p˙ i) · δ~ri = 0


i

Como cualquier principio de la física el principio de d’Alambert-Lagrange no


tienen ninguna justificación. Postula una relación inesperada, nueva entre las can-
tidades involucradas en los problemas mecánicos. Algunos podrían encontrarlo
bastante obvio, en tanto de acuerdo con la segunda ley de Newton ~Fi = ~p˙ i y por
lo tanto ~Fi − ~p˙ i = ~o, pero no debemos olvidar que es justamente la segunda ley de
Newton la que queremos reemplazar en esta reformulación.
Para ilustrar mejor de qué manera el principio de d’Alambert-Lagrange consti-
tuyen una alternativa nueva en la solución de problemas mecánicos consideremos
otro problema bien conocido, el péndulo simple. En la figura abajo se ilustra las
condiciones del problema y de la aplicación del principio de d’Alambert-Lagrange

R
tal y como se explica aquí.

O
D
A
RR
BO

Figure 6.2: Un problema simple que ilustra la manera como puede aplicarse el
principio de d’Alambert-Lagrange a un sistema dinámico

El sistema esta formado por una sola partícula, de modo que solo hay un de-
splazamiento y un trabajo virtual en este caso. Incluso en el caso dinámico el de-
splazamiento virtual no puede ser arbitrario. Así por ejemplo no se puede consid-
erar el desplazamiento δr que aparece tachado en la figura (desplazamiento hor-
206 Chapter 6. El formalismo lagrangiano

izontal) porque viola las restricciones del problema, a saber, que la cuerda man-
tenga su longitud. Este aspecto del principio de d’Alambert-Lagrange es funda-
mental y lo discutiremos más adelante.
El trabajo total realizado por la fuerza efectiva que actúa sobre la partícula es
en este caso:

~ − m~v) · δ~r = 0
(~T + W
Por las restricciones del problema, sin embargo ~T · δ~r = 0 y por lo tanto la
tensión no aparecerá en la ecuación que rige la dinámica del sistema (solo lo
hace implícitamente al restringir la manera como se puede definir el desplaza-
miento virtual). En términos del peso y en coordenadas cartesianas el principio de
d’Alambert-Lagrange para el sistema se escribe:

R
(Wx − mv̇ x )δx + (Wy − mv̇y )δy = 0
Lamentablemente esta ecuación contiene muy poca información útil. Para em-

O
pezar hay dos incognitas v x , vy y peor aún los desplazamientos δx y δy no son inde-
pendientes. Este es otro aspecto de gran interés del nuevo principio: la elección del
sistema de coordenadas es fundamental para que pueda aplicarse exitosamente.
D
Nótese que un sistema de coordenadas más apropiado para describir la
dinámica del sistema (dadas las restricciones implícitas en él) es el sistema de coor-
denadas polares, en particular la dinámica puede describirse teniendo como única
variable dependiente, el ángulo θ. En términos de esta variable las coordenadas
A
cartesianas x, y se pueden escribir como:
RR

x = L sin θ (6.6)
y = − L cos θ (6.7)
(6.8)

Las componentes del desplazamiento virtual son ahora:


BO

δx = L cos θδθ (6.9)


δy = L sin θδθ (6.10)
(6.11)

y las componentes de la aceleración son:

v̇ x = − L sin θ θ̇ 2 + L cos θ θ̈ (6.12)


2
v̇y = L cos θ θ̇ + L sin θ θ̈ (6.13)
(6.14)

Del otro lado las componentes cartesianas del peso son Wx = 0 y Wy = −mg.
Usando esta transformación el principio de d’Alambert-Lagrange se puede escribir
así:
6.2. El formalismo Lagrangiano 207

(Wx − mv̇ x )δx + (Wy − mv̇y )δy = 0

−m(− L sin θ θ̇ 2 + L cos θ θ̈ ) L cos θδθ + (6.15)


h i
−mg − m( L cos θ θ̇ 2 + L sin θ θ̈ ) L sin θδθ = 0 (6.16)

Vemos que el resultado no depende de la masa y dado que el desplazamiento


virtual es arbitrario, ie. δθ es arbitrario, el principio de d’Alambert-Lagrange apli-
cado al péndulo produce la ecuación:

g
θ̈ + sin θ = 0

R
L
Que es justamente la ecuación de movimiento del péndulo que conocíamos del
formalismo vectorial.

O
Como vemos entonces, en el contexto de los problemas de mecánica resueltos
con el principio de d’Alambert-Lagrange no juega ningún papel la segunda ley de
Newton ni sus derivados. Más allá del principio modificado de los trabajos vir-
D
tuales lo único necesario es desarrollar de forma ingeniosa el problema buscando
un sistema de coordenadas en el que la ecuación del trabajo virtual de la fuerza
efectiva pueda utilizarse efectivamente para deducir la ecuación de movimiento.
A
Usando la ecuación resultante podemos simular la dinámica del sistema. Para
ello necesitamos definir el sistema de ecuaciones diferenciales:

In [2]: def EoM_dinamico(y,t,g,L):


RR

q=y[0]
qp=y[1]
dqdt=qp
dqpdt=-g/L*np.sin(q)
dydt=[dqdt,dqpdt]
return dydt
BO

Tomando como condiciones iniciales:

In [3]: y=[10*GRADOS,0.0]
T=10.0
Nt=1000
ts=np.linspace(0.0,T,Nt)
g=9.81
L=1.0

La solución será:

In [4]: solucion=odeint(EoM_dinamico,y,ts,args=(g,L))

La solución puede representarse de distintas maneras. Como en este caso solo


hay una coordenada (generalizada), θ, podemos mostrar la evolución de esta coor-
denada en el tiempo:
208 Chapter 6. El formalismo lagrangiano

In [5]: fig=plt.figure()
ax=fig.gca()
ax.plot(ts,solucion[:,0]*RADIAN)
ax.set_xlabel("t")
ax.set_ylabel(r"$\theta$")

Out[5]: Text(0, 0.5, '$\\theta$')

R
O
D
A
RR
BO

También puede mostrarse la evolución del sistema en el plano θ-θ̇ (que más
adelante introduciremos y que llamamos el espacio de fase):

In [6]: fig=plt.figure(figsize=(6,6))
ax=fig.gca()
ax.plot(solucion[:,0]*RADIAN,solucion[:,1]*RADIAN)
ax.set_xlabel(r"$\theta$")
ax.set_ylabel(r"$\dot\theta$")

Out[6]: Text(0, 0.5, '$\\dot\\theta$')


6.2. El formalismo Lagrangiano 209

R
O
D
A
RR

Finalmente podemos mostrar la evolución del sistema en el espacio de config-


uración, es decir, el espacio físico, usando para ello la transformación de la coorde-
nada generalizada θ a las coordenadas cartesianas x, y:
BO

In [7]: xs=L*np.sin(solucion[:,0])
ys=-L*np.cos(solucion[:,0])

La trayectoria sería:

In [8]: fig=plt.figure(figsize=(6,6))
ax=fig.gca()
ax.plot(xs,ys)
ax.set_xlabel("x")
ax.set_ylabel("y")

ax.set_xlim((-0.6*L,0.6*L))
ax.set_ylim((-1.2*L,0.0))

Out[8]: (-1.2, 0.0)


210 Chapter 6. El formalismo lagrangiano

R
O
D
A
RR

O podemos animar el movimiento:


BO

In [9]: fig=plt.figure(figsize=(6,6))
ax=fig.gca()
line,=ax.plot([],[],color='k',marker='o',markersize=15)
string,=ax.plot([],[],'b-')
tiempo=ax.text(0.05,0.9,'',transform=ax.transAxes)
xlim=ax.set_xlim((-0.6*L,0.6*L))
ylim=ax.set_ylim((-1.2*L,0.0))

# Rutina de animación de la trayectoria


def animacion(i):
x=xs[i]
y=ys[i]
line.set_data([x],[y])
string.set_data([0,x],[0,y])
tiempo.set_text("t = %.2f s"%ts[i])
return line,string

anim=animation.FuncAnimation(fig,animacion,frames=Nt,interval=Nt/100,blit=True)
6.3. Restricciones y variables generalizadas 211

R
O
D
A
RR

6.3 Restricciones y variables generalizadas


BO

Como vimos en el ejemplo del péndulo simple, la aplicación del principio de


d’Alambert-Lagrange es truculento. El número de desplazamientos virtuales con-
sistentes con las restricciones puede ser enorme (si no infinito) y no todos conducen
a una ecuación útil e incluso, como vimos a una ecuación soluble.
Uno de los aspectos claves de la utilización del principio, es la elección de un
conjunto apropiado de variables capaces de describir el estado mecánico del sis-
tema sin redundancias. Así por ejemplo cuando se utilizan las coordenadas carte-
sianas para expresar la configuración del sistema, x y y están conectadas por una
relación matemática, a saber:

x 2 + y2 − L2 = 0

Esto quiere decir que basta expresar una de ellas para indicar el estado del
sistema, en tanto la otra se puede obtener de la ecuación anterior. A este tipo de
relaciones matemáticas en sistemas dinámicos se las conoce como restricciones y
las implicaciones que tienen para el sistema dinámico son muy interesantes.
212 Chapter 6. El formalismo lagrangiano

Partiendo de este ejemplo como base, introduciremos las siguientes defini-


ciones para lo que sigue en la reconstrucción y aplicación del formalismo La-
grangiano.

Definición. Espacio de coordenadas. En el espacio geométrico en el


que se desarrolla la dinámica del sistema. En física este espacio tiene
tres dimensiones y por tanto la ubicación de los puntos de este espacio
se específican usando tres coordenadas. El sistema natural de coorde-
nadas es el sistema cartesiano.

Es importante entender que el espacio físico es el mismo para todas las partícu-
las que constituyen un sistema. Sin embargo, para especificar la configuración
física de N partículas en un sistema, 3 coordenadas no son suficientes. En realidad
es necesario específicar 3N coordenadas cartesianas, que describiremos en general

R
como {~ri } N . O equivalentemente { xα,i }3N , donde xα (α : 1, 2, 3):( xi , yi , zi ) son las
coordenadas cartesianas de la partícula i-esima.

O
Definición. Restricción. Entendemos por restricción cualquier función
o desigualdad que involucre las coordenadas cartesianas del sistema
y que se relaciona con las regiones del espacio físico a las que puede
D
realmente acceder el sistema.

Matemáticamente las restricciones pueden escribirse de dos formas:


A
Definición. Restricción holonómica. Son aquellas restricciones que
conectan las coordenadas cartesianas del sistema a través de una igual-
dad del tipo:
RR

f n ({~ri }, t) = 0
Aquí el índice n representa el hecho que en un mismo problema pueden existir
más de una restricción. La partícula del péndulo simple por ejemplo esta sometida
BO

en realidad a dos condiciónes holonómicas:

f 1 (~r, t) ≡ z = 0 (6.17)
2 2 2
f 2 (~r, t) ≡ x + y − L = 0 (6.18)

Es decir, la partícula se mueve sobre un plano y lo hace siempre a la misma


distancia del punto desde el que se cuelga el péndulo.

Definición. Restricción no holonómica. Son aquellas restricciones que


conectan las coordenadas cartesianas del sistema de una forma que no
puede reducirse a la forma de una función.

Un caso partícular de restricciones no holonómicas son por ejemplo las restric-


ciones que se escriben como desigualdades:

f n ({~ri }, t) ≤ 0
6.3. Restricciones y variables generalizadas 213

Este tipo de restricciones son utilizadas para delimitar regiones del espacio
físico a las que el sistema puede o no puede acceder. Un ejemplo de una restric-
ción no holonómica es la que debemos aplicar, por ejemplo, si queremos describir
el movimiento de las partículas de un gas contenido en una caja. En ese caso las
coordenadas cartesianas pueden ser cualquiera excepto si están por fuera de la
caja.
Otro tipo de restricción no holonómica se obtiene en un sistema como el
mostrado en la figura abajo. Un cuerpo se mueve sobre un cascarón esférico en
un campo gravitacional.

R
O
D
A
RR

Figure 6.3: Un cuerpo desliza por la superficie de una esfera en presencia de la


gravedad. En algún punto el cuerpo puede despegarse de la superficie por lo tanto
la condición es no holonómica

En esta situación las restricciones son una combinación de restricciones


BO

holonómicas y no holonómicas:

f 1 (~r, t) = z = 0 (6.19)
2 2 2
f 2 (~r, t) = x + y − R ≥ 0 (6.20)
Es importante anotar que las restricciones no holonómicas no se restringen
necesariamente a aquellas que se expresan en términos de desigualdades. Otro
tipo de restricciones no holonómicas comunes son aquellas que se escriben en tér-
minos de velocidades. En ese caso, no siempre es posible expresar la condición en
la forma:

f n ({~ri }, t) = 0
y por lo tanto tampoco podemos llamar a la restricción holonómica.
En la definición de la restricción aparece explícitamente el tiempo. ¿Pero es esto
valido?. En el caso del péndulo ciertamente la restricción no depende del tiempo.
Las restricciones de este tipo tiene un nombre específico:
214 Chapter 6. El formalismo lagrangiano

Definición. Restricción esclerónoma. Son aquellas restricciones que


no dependen explícitamente del tiempo.

Lo de explícitamente es muy importante en tanto las restricciones siempre in-


volucran variables dinámicas que cambián intrínsecamente con el tiempo. También,
será importante más adelante al construir algunas cantidades abstractas de utili-
dad en el formalismo.
La palabra esclerónoma es ciertamente ajena al lenguaje cotidiano. La palabra
viene del griego sklero que significa duro y de la partícula nomos o nomía que se
refiere a una ley. Es decir, una restricción esclerónoma se llama así porque es fija,
no se modifica con el tiempo.

Definición. Restricción reónoma. Son aquellas restricciones que de-


penden explícitamente del tiempo.

R
Un caso muy común de una condición reónoma se da por ejemplo cuando se
describe el movimiento de una “cuenta” (un cuerpo con un agujero) que puede

O
moverse libremente sobre un aro, pero el aro a su vez se mueve. Es claro que las
restricciones que debemos aplicar a la posición de la cuenta tienen que ver con el
hecho que ella no puede estar a una distancia mayor al radio del aro de su centro.
D
Sin embargo, el centro mismo está en movimiento. En este caso al restricción se
escribiría como:
A
f (~r, t) = [ x − xo (t)]2 + [ x − xo (t)]2 − R2 = 0
Aquí el tiempo aparece explícitamente porque la posición del centro del aro
xo (t), yo (t) no es producto de la dinámica del sistema, sino que debe ser provista a
RR

priori, es decir ecuaciones explícitas para estas cantidades deben ser provistas en
el problema.
De nuevo la palabra reónomo no es común. Para recordarla basta recordar que
reo- viene del griego rheos que significa flujo, corriente. Es decir una restricción
reónoma para un griego clásico sonaría algo así a una ley en movimiento.
BO

6.3.1 Fuerzas de restricción


Un asunto interesante para mencionar en este punto es que para que un sistema
satisfaga una restricción, según las mismas leyes de Newton deben mediar inter-
acciones, fuerzas entre el sistema y su entorno. A estas fuerzas se las conoce como
fuerzas de restricción. Estas fuerzas son en general muy difíciles de modelar y mu-
cho menos de conocer a priori. En términos de las fuerzas de restricción la fuerza
sobre cada partícula en el sistema es:

~Fi = ~Fia + ~f i

Donde ~Fia es la que llamamos la fuerza aplicada y ~f i la fuerza de restricción.


Una de las características interesantes del formalismos Lagrangiano y su prin-
cipio de d’Alambert-Lagrange es que para satisfacer las restricciones, los desplaza-
mientos virtuales se realizan normalmente en dirección perpendicular a las fuerzas
de restricción y por lo tanto no realizan trabajo virtual, es decir:
6.3. Restricciones y variables generalizadas 215

∑(~Fi − ~p˙ i) · δ~ri = ∑(~Fia − ~p˙ i) · δ~ri = 0


i i

Que parece una expresión sencilla pero en realidad es poderosa en tanto mues-
tra que en el contexto de este formalismo las desconocidas fuerzas de restricción
no juegan (aparte de las restricciones) ningún papel a la hora de determinar la
dinámica del sistema.
Ahora que aclaramos lo que significan las palabras esclerónoma y renoma, sería
interesante aclarar también lo que significa la palabra holonoma para referirnos a las
restricciones que pueden expresarse como igualdades en lugar de desigualdades.
Curiosamente la comprensión de esta palabra nos lleva al siguiente concepto cen-
tral del formalismo escalar, el concepto de variables generalizadas

R
6.3.2 Variables generalizadas
La palabra holonomía tiene significados muy específicos en matemáticas, en par-

O
ticular en geometría. Si bien la raíz griega holo significa todos, la holonomía hace
referencia a la manera como las propiedades geométricas de un sistema se mod-
ifican cuando se produce un desplazamiento en el espacio. La holonomía hace
D
referencia por lo tanto en las matemáticas a una transformación. Es el mismo caso
en la mecánica.
Cuando las variables cartesianas de un sistema dinámico están sometidas a re-
A
stricciones holonómicas, sabemos que es posible describir el estado o configuración
del sistema usando un conjunto reducido de variables, en lugar de usar todas las
coordenadas físicas del sistema.
Así por ejemplo, en el caso del péndulo simple, las dos restricciones
RR

holonómica impuesta por la cuerda, permiten describir el sistema usando una sola
variable, en lugar de las tres coordenadas cartesianas.

Definición. Número de grados de libertad, M. El número de grados de


libertad de un sistema es el número mínimo de variables que pueden
BO

usarse para describir completamente el estado del sistema.

En estos términos, el número de grados de libertad de la partícula en el péndulo


simple es de solo 1, en tanto solo necesitamos una variable para decir dónde esta
la partícula.
Es sencillo probar que si un sistema de N partículas esta sometido a K restric-
ciones holonomas, { f n }K , el número de grados de libertad M es:

M = 3N − K
En el péndulo simple, N = 1 y K = 2 de donde obtenemos M = 3 × 1 − 2 = 1.
Ahora bien, ¿cuáles son las variables que pueden usarse en lugar de las coor-
denadas físicas del sistema para describir el estado del mismo?. En principio, el
número de M-variables que podrían usarse para específicar completamente el es-
tado del sistema no tiene límites. En el caso del péndulo simple podríamos usar la
coordenada x solamente, el ángulo θ, la longitud del arco l medido a lo largo del
movimiento, la altura h sobre el nivel del techo, etc. pero más interesante aún, la
216 Chapter 6. El formalismo lagrangiano

velocidad tangencial vt , la energía potencial gravitacional U, etc. Es decir para es-


pecificar el estado del sistema no solo pueden usarse coordenadas sino que también
podrían usarse cantidades físicas diferentes (energías, velocidades, momentums)
para espefificar al estado.
A las variables usadas para describir el estado del sistema las llamamos vari-
ables generalizadas:

Definición. Variables generalizadas. Cualquier conjunto de M vari-


ables físicas (M el número de grados de libertad) que permitan de-
scribir completamente unívocamente el estado del sistema. Simbóli-
camente:

{q j } M

R
La holonomía de las restricciones permite que podamos escribir relaciones
matemáticas cerradas entre las coordenadas del sistema y las variables general-

O
izadas. Estas transformaciones pueden escribirse de forma general así:

{~ri = ~ri ({q j } M , t)} N


D
Nótese que estas relaciones representan en realidad 3N ecuaciones de relación
que dependen a su vez de M variables generalizadas y en general del tiempo.
Asumimos que estas relaciones pueden siempre invertirse de modo que estas
transformaciones pueden escribirse también en la forma:
A
{q j = q j ({~ri } N , t)} M
RR

Para hacer más evidente lo que estas transformaciones expresan usemos nueva-
mente el ejemplo trivial del pendulo simple. En este caso si tomamos como única
variable generalizada q1 el ángulo θ, las ecuaciones de transformación se escriben
como:
BO

x1 (q1 , t) = L sin q1 (6.21)


y1 (q1 , t) = − L cos q1 (6.22)
z1 ( q1 , t ) = 0 (6.23)

y su inversa como:

q1 ( x1 , y1 , z1 , t) = tan−1 (y1 /x1 ) (6.24)

Una cosa que es bastante natural es que en el caso de restricciones esclerónomas


las ecuaciones de transformación no dependerán explícitamente del tiempo mien-
tras que cuando las restricciones son reónomas el tiempo aparecerá explícitamente
en las ecuaciones de transformación.

NOTA. Variables generalizadas independientes. Un importante de-


talle para tener en cuenta sobre las variables generalizadas es que al
elegirlas no se trata simplemente de escoger M variables en lugar de
6.3. Restricciones y variables generalizadas 217

3N. Las variables escogidas deben ser tales que sean independientes.
Esto significa que es posible realizar un cambio de una variable que
no implique necesariamente el cambio de una u otras variables gen-
eralizadas. Imaginen por ejemplo el caso del péndulo cónico (ver
figura abajo). En esta situación el número de grados de libertad es
de 2. ¿cuáles podrían ser las variables generalizadas?. Podría elegir
por ejemplo como variables generalizadas las coordenadas cartesianas
x, y (recordemos que y va en la dirección vertical). El problema es que
dadas las restricciones no es posible variar la coordenada x sin que se
produzca un cambio en la coordenada y. Es decir, este par de variables
no es el más apropiado para describir el sistema. Lo mismo podría de-
cir si elijo la coordenada y y la energía potencial U. Sin embargo si elijo
la coordenada z y el ángulo θ como variables generalizadas es posible
imaginarse un desplazamiento de θ sin que se modifique z y vicev-

R
ersa. O puedo escoger como variables generalizadas (la elección más
poderosa) dos ángulos, el ángulo θ y un ángulo horizontal φ y de nuevo

O
puedo imaginarme cambios de una variable que no impliquen nece-
sariamente cambios de la otra. Estas son las elecciones más poderosas
y por tanto las que usaremos en la solución a problemas con el formal-
ismo escalar.
D
A
RR
BO

Figure 6.4: En el péndulo cónico generalizado, la partícula puede moverse libre-


mente oscilando y alrededor de la dirección vertical

Definición. Espacio de configuración. Llamamos al espacio definido


por las variables generalizadas de un sistema, el espacio de configu-
218 Chapter 6. El formalismo lagrangiano

ración. Este espacio es diferente al espacio coordenado en tanto cada


punto del espacio de configuración esta determinado por M coorde-
nadas (variables generalizadas). El espacio de configuración no es un
espacio coordenado tradicional.

6.3.3 Propiedades importantes de las reglas de transformación


Muchos de los resultados sobre los que se basa la construcción del formalismo
Lagrangiano dependen de propiedades matemáticas específicas de las reglas de
transformación ~ri ({qh }, t) que definimos antes. He aquí algunas de ellas:
Desplazamientos virtuales en el espacio de configuración. Un desplaza-
miento virtual en el espacio coordenado se conecta con un desplazamiento virtual
en el espacio de configuraciones a través de la regla de la cadena:

R
!
n
∂~ri ∂~ri
δ~ri = ∑ δq + δt
j =1
∂q j j ∂t

O
Aquí se debe tener en cuenta que cuando se habla de desplazamientos virtuales
no existen cambios en el tiempo. Ese es precisamente el sentido de virtual y por lo
D
tanto la relación correcta es:

∂~r
δ~ri = ∑ ∂qij δq j
A
Velocidad coordenada y velocidad generalizada. Usando también la regla de
la cadena podemos escribir las relaciones entre las velocidades en la forma:
RR

∂~r ∂~r
~r˙ i = ∑ i q̇ j + i
∂q j ∂t
Arbitrariedad en el orden de las derivadas. Una propiedad útil muy im-
portante de las reglas de transformación es aquella que permite intercambiar las
BO

derivadas temporales de las derivadas totales respecto al tiempo, así:


   
∂ d~ri d ∂~ri
=
∂ql dt dt ∂ql
Se deja al lector la demostración de esta propiedad.
Regla de cancelación de “puntos”. Otra propiedad que será de gran utilidad
en la deducción de las ecuaciones propias del formalismo Lagrangiano se obtiene
si derivamos la velocidad son respecto de la velocidad generalizada qk :

∂~r˙ i ∂~r ∂q̇ j ∂2~r


∂q̇k
= ∑ ∂qij ∂q̇k + ∂q̇ j ∂ti
Si ahora reconocemos que ∂q̇ j /∂q̇k = δjk con δjk el delta de kroenecker, entonces:

∂~r˙ i ∂~r
= i
∂q̇l ∂ql
6.4. Las ecuaciones de Lagrange 219

El nombre de la regla se entiende si se ve como los “puntos” sobre las variables


en el lado izquiero desaparecen, como si se cancelaran.
Para ilstrar esta regla usemos nuevamente el ejemplo trivial del péndulo sim-
ple. En este caso tenemos la ley de transformación de la posición:

x (q) = L sin(q)
Usando la regla de la cadena:

ẋ = L cos(q)q̇
Aquí se ve exactamente lo que significa la regla de transformación de puntos.
Nótese que ∂ ẋ/∂q̇ es igual a ∂x/∂q, pero esta no es una propiedad extraña sino
más bien algo natural que resulta de la regla de la cadena.

R
6.4 Las ecuaciones de Lagrange

O
Una vez definidos apropiadamente los términos y cantidades básicas involucradas
en la descripción de los sistemas mecánicos en el contexto del formalismo la-
grangiano, podemos proceder a encontrar una expresión o una receta matemática
D
más simple para expresar el principio de d’Alambert-Lagrange, que si bien es su-
ficientemente general es muy artificioso.
Para empezar expresemos el principio de d’Alambert-Lagrange en términos
de las variables generalizadas en lugar de las coordenadas del sistema. Para ello
A
debemos apelar a las propiedades de las reglas de transformación que vimos al
final de la sección anterior.
La expresión matemática del principio se escribe en términos de las coorde-
RR

nadas generalizadas como:

∂~r ∂~r
∑ ∑ ~Fi · ∂qij δq j − ∑ ∑ ~p˙ i · ∂qij δq j = 0 (6.25)
i j i j

Consideremos por separado los dos términos. El primer término después de


BO

algunas transformaciones algebraicas simples se puede escribir en la forma:

( ! !)
∂~r d ∂~r d ∂~ri
∑ ∑ ~p˙ i · ∂qij δq j = ∑ ∑ dt
mi~r˙ i · i
∂q j
− mi~r˙ i ·
dt ∂q j
δq j (6.26)
i j j i

Si ahora usamos la ley de cancelación de “puntos” y la inversión de la derivada


y la derivada parcial el término puede escribirse como:

( "  # )
∂~r d ∂ 1 ˙2 ∂ 1
∑ ∑ ~p˙ i · ∂qij δq j = ∑ dt ∂q̇ j ∑ m ~r
2 i i

∂q j ∑ 2 mi~r˙ i2 δq j (6.27)
i j j i i

En esta expresión reconocemos claramente la energía cinética total del sis-


tema, T = ∑i mi~˙ri2 /2. Ahora bien, es importante entender que en esta canti-
dad ~ri son funciones de las coordenadas generalizadas y no cantidades físicas
220 Chapter 6. El formalismo lagrangiano

convencionales. De modo que la energía cinética aquí también es una función,


T ({q j }, {q̇ j }, t).
En términos de la energía cinética el término inercial del principio de
d’Alambert-Lagrange se puede escribir finalmente como:
( " # )
∂~r d ∂T ∂T
∑ ∑ ~p˙ i · ∂q j δq j = ∑ dt ∂q̇ j − ∂q j δq j
i
(6.28)
i j j

Analicemos ahora el término que involucra las fuerzas aplicadas, que por sim-
plicidad en la notación escribiremos como Fia ≡ Fi . No hay mucho que hacer en
este término, excepto simplificar introduciendo una cantidad nueva:

∂~r
∑ ∑ ~Fi · ∂qij δq j = ∑ Q j δq j (6.29)

R
j i j

Donde a la nueva cantidad escalar Q j la llamaremos la fuerza generalizada aso-


ciada a la variable generalizada q j y es igual:

O
∂~r
Qj = ∑ ~Fi · ∂qij (6.30)
i
D
Si ponemos juntos el término de fuerzas y el término inercial el principio de
d’Alambert-Lagrange se puede escribir como:
A
" ! #
d ∂T ∂T
∑ Q j − dt ∂q̇ j + ∂q j δq j = 0
j
RR

En este punto es importante entender que las variables generalizadas son com-
plemetamente independientes. Esto significa que se puede variar una de ellas
mientras las demás se mantienen fijas. Esto implica que para que la igualdad ante-
rior sea valida en general (para cualquier conjunto de desplazamientos virtuales)
las M cantidades entre corchetes deben ser simultáneamente cero. Esto conduce al
conjunto de ecuaciones diferenciales:
BO

( ! )
d ∂T ∂T
− = Qj
dt ∂q̇ j ∂q j
M

A este conjunto de ecuaciones se lo conoce como las Ecuaciones de Lagrange y


continen los detalles completos del movimiento del sistema. Estas ecuaciones son
el equivalente en el formalismo Lagrangiano a la segunda ley de Newton.

6.4.1 Un ejemplo: el péndulo elástico


Una buena manera de entender el poder de esta versión del principio de
d’Alambert-Lagrange es aplicarlo a un sistema físico concreto. Para empezar a
considerar sistemas menos triviales, pero mantenernos en el terreno de sistemas
cuyo comportamiento todavía podemos intuir, consideremos otra vez el caso de
un péndulo pero en el cuál la cuerda en lugar de tener una longitud fija, puede
cambiar.
6.4. Las ecuaciones de Lagrange 221

R
Figure 6.5: En el péndulo elástico la cuerda (mostrada aquí como un resorte) tiene
una longitud que puede cambiar pero obedeciendo la ley de Hooke, es decir es

O
una cuerda elástica ideal

Para ilustrar como se aplica la metodología de Lagrange, desarollemos la solu-


D
ción al problema paso por paso:
1) Variables generalizadas. Este sistema tiene 3 coordenadas y una sola re-
stricción (movimiento en un plano) de modo que se necesitan dos variables
A
generalizadas. Es claro que las variables son el ángulo q1 = θ y la elongación
q2 = e del resorte (es decir la diferencia entre la longitud instantánea de la
cuerda y su longitud L en equilibrio. Podemos verificar que estas dos vari-
RR

ables son independientes: se puede variar el ángulo del péndulo sin cambiar
la elongación e (no hay ninguna restricción que lo impida) y viceversa.
2) Reglas de transformación. Las reglas de transformación en este caso nos
permiten pasar del conjunto de variables generalizadas a las coordenadas
cartesianas del sistema:
BO

x ( q1 , q2 , t ) =
( L + q2 ) sin q1
−( L + q2 ) cos q1
y ( q1 , q2 , t ) =
z ( q1 , q2 , t ) = 0
Como vemos la restricciones y por lo tanto las reglas de transformación son
esclerónomas.
Una de las funciones básicas de las reglas de transformación es escribir las ve-
locidades coordenadas como función de las coordenadas generalizadas y las ve-
locidades generalizadas:

ẋ (q1 , q2 , q̇1 , q̇2 , t) =( L + q2 ) cos q1 q̇1 + q̇2 sin q1


ẏ(q1 , q2 , q̇1 , q̇2 , t) = ( L + q2 ) sin q1 q̇1 − q̇2 cos q1
3) Función de energía cinética y sus derivadas. Usando las reglas de transfor-
mación podemos ahora escribir la función de energía cinética. Después de
un poco de álgebra se puede mostrar que:
222 Chapter 6. El formalismo lagrangiano

1 h i
T ((q1 , q2 , q̇1 , q̇2 , t) = m (1 + q2 )2 q̇21 + q̇22
2
Con esta función podemos obtener las derivadas que necesitaremos más ade-
lante:

∂T
= 0
∂q1
∂T
= m( L + q2 )q̇21
∂q2
∂T
= m( L + q2 )2 q̇1
∂q̇1

R
∂T
= mq̇2
∂q̇2
Y las derivadas de los últimos dos términos:

O
d ∂T
= 2m( L + q2 )q̇2 q̇1 + m( L + q2 )2 q̈1
dt ∂q̇1 D
d ∂T
= mq̈2
dt ∂q̇2
A
4) Fuerzas generalizadas. Finalmente necesitamos escribir las fuerzas gener-
alizadas asociadas a cada una de las variables generalizadas. Para ello es
necesario conocer la expresión de las fuerzas coordenadas como función de
RR

las variables generalizadas. Es fácil mostrar que las componentes cartesianas


de las fuerzas que actúan sobre el péndulo son:

~F : (−kq2 sin q1 , −W + kq2 cos q1 )


BO

De allí la fuerza generalizada asociada con la primera variable (q1 ≡ θ) es:

∂~r j
 
∂~r ∂x ∂y
Q1 = ∑ ~Fi · = ~F · = ~F · ,
i
∂q1 ∂q1 ∂q1 ∂q1

Que puede probarse con un poco de algebra es igual a:

Q1 = −W ( L + q2 ) sin q1
De la misma manera puede calcularse la fuerza generalizada asociada con la
segunda variable generalizada para obtener:

Q2 = W cos q1 − kq2

5) Ecuaciones de Lagrange. Si ahora ponemos todo esto junto podemos final-


mente obtener las dos ecuaciones de Lagrange que describen el movimiento
del péndulo:
6.4. Las ecuaciones de Lagrange 223

2q̇1 q̇2 g sin q1


q̈1 = − −
L + q2 L + q2
q̈2 = g cos q1 − (k/m)q2 + ( L + q2 )q̇21

Estas dos ecuaciones describen la dinámica del péndulo elástico. Para deducir-
las no necesitamos en ningún momento recurrir a la segunda ley de Newton y el
procedimiento realizado, si bien laborioso es analítico y reproducible sin recurrir a
ningún tipo de truco heurístico. Este es justamente el poder del nuevo formalismo.
Visualicemos la dinámica del sistema. Para ello necesitamos primero escribir el
sistema de ecuaciones diferenciales:

In [12]: def eom_penduloelastico(y,t,L,kom):

R
g=9.81
# Lee variables
q1=y[0]

O
q2=y[1]
q1p=y[2]
q2p=y[3] D
# Primeras derivadas
dq1dt=q1p
dq2dt=q2p
A
# Segundas derivadas
dq1pdt=(-g*np.sin(q1)-2*q1p*q2p)/(L+q2)
RR

dq2pdt=(L+q2)*q1p**2+g*np.cos(q1)-kom*q2

return [dq1dt,dq2dt,dq1pdt,dq2pdt]

Definir las condiciones iniciales:


BO

In [13]: #Propiedades del sistema


L=1.0
kom=50.0

#Condiciones iniciales
y=[20*GRADOS,0.1,0.0,0.0]

#Tiempo de integración
Nt=1000
ts=np.linspace(0,10,Nt)

Y resolver el sistema:

In [14]: solucion=odeint(eom_penduloelastico,y,ts,args=(L,kom))
q1s=solucion[:,0]
q2s=solucion[:,1]

Vemos distintas representaciones de la solución:


224 Chapter 6. El formalismo lagrangiano

In [15]: fig,axs=plt.subplots(2,1,sharex=True)
axs[0].plot(ts,q1s)
axs[0].set_ylabel("Ángulo")
axs[1].plot(ts,q2s)
axs[1].set_ylabel("Elongación")

Out[15]: Text(0, 0.5, 'Elongación')

R
O
D
A
RR
BO

In [16]: fig,ax=plt.subplots(1,1)
ax.plot(q1s,q2s)
ax.set_xlabel("Ángulo")
ax.set_ylabel("Elongación")
ax.set_title("Espacio de Configuración")

Out[16]: Text(0.5, 1.0, 'Espacio de Configuración')


6.4. Las ecuaciones de Lagrange 225

R
O
D
A
La mejor manera de ver la dinámica (o la que se ajusta más a nuestra intuición)
es la del espacio coordenado. Para ello tenemos que aplicar la transformación:
RR

x ( q1 , q2 , t ) = ( L + q2 ) sin q1
y(q1 , q2 , t) = −( L + q2 ) cos q1
BO

z ( q1 , q2 , t ) = 0

In [17]: fig,ax=plt.subplots(1,1)

xs=(L+q2s)*np.sin(q1s)
ys=-(L+q2s)*np.cos(q1s)

ax.plot(xs,ys)
ax.set_xlabel("x")
ax.set_ylabel("y")
ax.set_title("Espacio Coordenado")

Out[17]: Text(0.5, 1.0, 'Espacio Coordenado')


226 Chapter 6. El formalismo lagrangiano

R
O
D
A
RR

Para visualizar mejor la dinámica podemos ahora animar el sistema:


BO

In [18]: L=1.0
fig=plt.figure(figsize=(6,6))
ax=fig.gca()
line,=ax.plot([],[],color='k',marker='o',markersize=15)
string,=ax.plot([],[],'b-')
tiempo=ax.text(0.05,0.9,'',transform=ax.transAxes)
xlim=ax.set_xlim((-0.9*L,0.9*L))
ylim=ax.set_ylim((-1.8*L,0.0))

def animacion(i):
x=xs[i]
y=ys[i]
line.set_data([x],[y])
string.set_data(xs[:i],ys[:i])
tiempo.set_text("t = %.2f s"%ts[i])
return line,string

anim=animation.FuncAnimation(fig,animacion,frames=Nt,interval=Nt/50,blit=True)
6.5. La función lagrangiana 227

R
O
D
A
RR

6.5 La función lagrangiana


BO

En la sección anterior vimos que la dinámica de un sistema físico puede ser de-
scrita en términos de un conjunto de variables generalizadasa {q j } M resolviendo
las ecuaciones de Lagrange:
( ! )
d ∂T ∂T
− = Qj
dt ∂q̇ j ∂q j
M

Donde T ({q j }, {q̇ j }, t) = ∑i mi~ri ({q j }, {q̇ j }, t)2 /2 es la función de energía


cinética, y Q j se conoce como la fuerza generalizada que se puede expresar en
términos de las fuerzas coordenadas y las leyes de transformación como:

∂~r
Qj = ∑ ~Fi · ∂qij (6.31)
i

En esa misma sección vimos un ejemplo de la forma como este formalismo se


puede usar para describir un sistema particular. A pesar de que el formalismo
228 Chapter 6. El formalismo lagrangiano

representa una versión alternativa para el formalismo vectorial, todavía es muy


laborioso (aunque en la mayoría de las situaciones lo es menos respecto al formal-
ismo vectorial) resolver problemas usando este nuevo formalismo.
Existe una “simplificación” adicional, que más allá de un simple ejercicio
matemático, constituye una de las características fundamentales del formalismo
Lagrangiano.
En muchas de las situaciones en las que el formalismo Lagrangiano se utiliza,
están involucradas las denominadas fuerzas conservativas, ie. fuerzas que pueden
derivar de una función potencial:

~Fi (~ri , t) = −∇i U (~ri , t)


Nótese que el potencial es exclusivamente función de las posiciones y (posi-
blemente) del tiempo. El potencial en este caso no depende de las velocidades (lo

R
que sería muy extraño porque implicaría que en un determinado punto del espa-
cio de coordenadas la energía potencial dependería del estado de movimiento del
sistema).

O
Para fuerzas de este tipo, las fuerzas generalizadas en el formalismo La-
grangiano se pueden escribir en la forma:

∂~ri
Q j = − ∑ ∇i U ·
i
D ∂q j
Que por propiedades de la regla de la cadena puede probarse es equivalente a:
A
∂U
Qj = −
∂q j
RR

Si reemplazamos en las Ecuaciones de Lagrange:


( ! )
d ∂T ∂( T − U )
− =0
dt ∂q̇ j ∂q j
M
Ahora bien, dado que la función potencial U solo depende de las coordenadas o
BO

de las variables generalizadas y no de las velocidades, una forma más “simétrica”


de escribir estas ecuaciones sería:
( ! )
d ∂( T − U ) ∂( T − U )
− =0
dt ∂q̇ j ∂q j
M
En esta ecuación encontramos que la función T − U, que no tiene precedente
en la historia de la mecánica y que no debe confundirse con T + U que tiene en
la mecánica vectorial la interpretación de la energía mecánica, es fundamental en
la descripción de la dinámica del sistema. Si se provee la forma funcional de esta
cantidad las ecuaciones de movimiento quedan completamente determinadas por
las operaciones diferenciales en las ecuaciones anteriores.

Definición. Función Lagrangiana. Dado un sistema dinámico con


función de energía cinética T ({q j }, {q̇ j }, t), tal que todas las partícu-
las están sometidas a una fuerza que deriva de una función potencial
U ({q j }, t), definimos la función lagrangiana como:
6.5. La función lagrangiana 229

L({q j }, {q̇ j }, t) ≡ T − U

A la función lagrangiana se la llama simplemente el Lagrangiano del sistema.


En términos del Lagrangiano las ecuaciones de Lagrange se escriben como:
( ! )
d ∂L ∂L
− =0
dt ∂q̇ j ∂q j
M

Que reciben en tiempo modernos el nombre de Ecuaciones de Euler-Lagrange.


Es importante anotar que no todos los sistemas dinámicos tienen asociado un
Lagrangiano. Las condición necesarias y suficientes para que podamos definir un
Lagrangiano y usarlo para describir la dinámica usando las ecuaciones de Euler-

R
Lagrange son:

1. El sistema debe estar sometido a restricciones holonómicas de modo que

O
pueda encontrarse un conjunto de variables generalizadas independientes.

2. Las fuerzas sobre el sistema deben derivar de un potencial.


D
6.5.1 El potencial generalizado
Si bien en el desarrollo anterior la condición de que las fuerzas sobre el sistema
A
derivaran de un potencial se restringían a las clásicas fuerzas conservativas, en
el formalismo Lagrangiano es posible extender estas fuerzas a un conjunto más
amplio de sistemas.
RR

En realidad la condición 2 debe aplicarse es a la fuerza generalizada. En este


caso se deja al lector probar que si la fuerza generalizada tiene la forma general:

∂Ugen d ∂Ugen
Qj = − + (6.32)
∂q j dt ∂q̇ j
BO

también es posible escribir una función Lagrangiana.


Nótese que la forma de la fuerza expresada en la condición arriba incluye un
potencial Ugen que en general puede depender de las velocidades generalizadas.
Es decir, la idea de que solo en los casos en los que la fuerza coordenada deriva de
un potencial que depende solo de la posición, es posible escribir un Lagrangiano
es incorrecta. Hay casos en los que es posible tener potenciales y por lo tanto
fuerzas que aún dependiendo de la velocidad permiten encontrar una función La-
grangiana.

6.5.2 Un ejemplo: el Lagrangiano del péndulo elástico


Para ilustrar la construcción de la función Lagrangiana, volvamos a nuestro ejem-
plo del péndulo elástico.
Para proceder a encontrar el Lagrangiano del sistema debemos primero de-
mostrar que las fuerzas generalizadas Q j , derivan de un potencial U ({q j }), medi-
ante la regla:
230 Chapter 6. El formalismo lagrangiano


Qj = − U ({q j })
∂q j
Habíamos encontrado que las fuerzas generalizadas eran:

Q1 = −W ( L + q2 ) sin q1 (6.33)
Q2 = W cos q1 − kq2 (6.34)

Es fácil encontrar una única función U que permita escribir las Q j como
derivadas de esa función:

kq22
U (q1 , q2 ) = −W ( L + q2 ) cos q1 +

R
2
Se deja al lector verificar que esta función satisface la definición original de U.
Es interesante notar que si escribimos esta función de energía potencial, en tér-

O
minos de las coordenadas cartesianas originales, la función es muy familiar para
nosotros:

ke2
U ( x, y) = −mgy +
D
2
Esto es natural, en tanto la función U en el formalismo Lagrangiano no es dis-
A
tinta de la función U del formalismo vectorial, solo cambian las coordenadas en
las que se expresa. Esto se puede escribir de forma simple diciendo:

U ({q j }, t) = U ({~ri ({q j }, r )}, t)


RR

Con esto el Lagrangiano del péndulo elástico queda:

1 h i kq2
L= m (1 + q2 )2 q̇21 + q̇22 − W ( L + q2 ) cos q1 + 2
2 2
BO

Se deja al lector probar que las ecuaciones de movimiento para las variables
q1 y q2 obtenidas a partir de las ecuaciones de Euler-Lagrange asociadas a este
Lagrangiano, son las mismas que las que dedujimos usando las ecuaciones de La-
grange en la sección anterior.

6.6 El principio de Hamilton


En la sección anterior vimos que a un sistema físico para el cual es posible definir
un Lagrangiano L, las ecuaciones de Lagrange adoptan la forma:
( ! )
d ∂L ∂L
− =0
dt ∂q̇ j ∂q j
M

Que reciben en tiempo modernos el nombre de Ecuaciones de Euler-Lagrange.


Pero ¿por qué esta forma adopta además del nombre de Lagrange el nombre de
Euler?.
6.6. El principio de Hamilton 231

Es importante anotar en este punto que las ecuaciones de Euler-Lagrange sur-


gen en el contexto de otros problemas en física y matemáticas lo que revela un
hecho fundamental y es que su estructura obedece principios matemáticos más
profundos que el expresado por el principio de D’Alambert-Lagrange e incluso
que la segunda ley de Newton.
Para ilustrar la manera como estas mismas ecuaciones pueden derivarse de
otros principios, consideremos el caso de un sistema con un espacio de configu-
ración unidimensional (una sola variable generalizada q). En este caso solo hay
una ecuación de Euler-Lagrange, a saber:
 
d ∂L ∂L
− =0
dt ∂q̇ ∂q
Podemos considerar el lado izquierdo de la ecuación como una función f (ex-

R
plícita o implícita) del tiempo:

f (t) = d(∂L/∂q̇)/dt − ∂L/∂q

O
Lo que dice la ecuación de Euler-Lagrange para el sistema es que el valor de la
función f (t) es cero en todos los instantes del tiempo.
Pero este es un resultado curioso en tanto en cada instante del tiempo la posi-
D
ción q y velocidad q̇ del sistema cambian continuamente. Las ecuaciones de Euler-
Lagrange expresan entonces el hecho básico de que la función f es cero.
Ahora consideremos la situación en el diagrama representado en la Figura de
A
abajo:
RR
BO

Figure 6.6: Trayectoria de un sistema dinámico en el tiempo


232 Chapter 6. El formalismo lagrangiano

Existen muchas maneras para ir del punto inicial i : (ti , qi ) hasta el punto final
f : (t f , q f ), pero solo una de ellas satisface las condiciones dinámicas del sistema
(implícitas en su Lagrangiano). La línea continua, descrita por la función q(t) en
la figura, representa la trayectoria real del sistema. La línea punteada, descrita por
q0 (t), representa una trayectoria arbitraria (no física) que une los mismos puntos
extremos. La función arbitraria η (t) cuantifica la diferencia que existe entre esta
trayectoria física y la trayectoria real.
Las trayectorias no físicas difieren de la física en todos los puntos intermedios,
pero son iguales los extremos, es decir η (t1 ) = η (t2 ) = 0.
El parámetro α sirve para identificar todas las trayectorias no físicas del sistema
que difieren de la real de acuerdo con la función η (t).
Pero ¿qué tiene todo esto que ver con los principios fundamentales de la
mecánica?
Para empezar consideremos la siguiente propiedad matemática:

R
Lema funamental del cálculo de variaciones. Si una función f ( x ) es
Rb
continúa en un intervalo [ a, b] y se cumple que a f ( x )h( x )dx para toda

O
función h( x ) tal que h( a) = h(b) = 0, entonces f ( x ) = 0 para todos los
x ∈ [ a, b]
D
El inverso de este lema es bastante obvio y podemos utilizarlo en el caso de
nuestro sistema dinámico para decir que si f (t) = 0 en el intervalo [t1 , t2 ] entonces
la siguiente integral es también cero:
A
Z t2
f (t)η (t)dt = 0
t1
Aquí la función η (t) es la que definimos en la Figura y que cuantifica la
RR

desviación de una trayectoria no física q0 (t) respecto a la trayectoria verdadera


q(t). Otra manera de escribir la anterior igualdad es reemplazar f (t) y escribir
η (t) = ∂q0 /∂α:

∂L ∂q0
Z t     
2 d ∂L
− dt =0
dt ∂q˙0 ∂q0 ∂α
BO

t1 α =0
Esta última expresión viene del hecho que la función f (t) podría ser calculada
para cualquier otra trayectoria, pero solo en la trayectoria real α = 0 es cero en
todos los puntos.
Consideremos ahora la integral para un α arbitrario:

d ∂L ∂q0 ∂L ∂q0 d ∂L ∂q0 ∂L ∂q0


Z t2     Z t2   Z t2
− dt = − dt
t1 dt ∂q˙0 ∂α ∂q0 ∂α t1 dt ∂q˙0 ∂α 0
t1 ∂q ∂α

La primera integral de la izquierdo puede calcularse usando integración por


u dv = uv tt21 − v du
R R
partes, ie.

Teniendo en cuenta que ∂q0 /∂α = η (t) evaluada en los extremos es siempre
cero, la integral anterior se convierte en:

∂L ∂q̇0 ∂L ∂q0
Z t2   Z t2 Z t2
dL d
− + dt = − dt = − Ldt
t1 ∂q˙0 ∂α ∂q0 ∂α t1 dα dα t1
6.6. El principio de Hamilton 233

Es decir el lema fundamental del cálculo de variaciones sumado con las ecua-
ciones de Euler-Lagrange conducen al resulado:
 Z t2 
d
Ldt =0
dα t1 α =0

Este resultado es bastante curioso. Significa que si nosotros definimos una can-
Rt
tidad matemática S(α) = t 2 L(q0 (t, α), q̇0 (t, α), t)dt, entonces S tiene un valor esta-
1
cionario (no cambia, ni aumenta, ni disminuye instantáneamente) exactamente en
α = 0, lo que corresponde justamente a la trayectoria real del sistema dinámico.
Este resultado es de suma trascendencia en tanto se conecta con principios físi-
cos que habían sido enunciados en tiempos anteriores en contextos completamente
diferentes, creando una conexión inesperada entre áreas completamente disímiles
de la física y las matemáticas.

R
Podemos enunciar el resultado anterior en la forma de un principio fundamen-
tal (que reemplazaría el principio de D’Alambert-Lagrange):

O
Principio de Hamilton o Principio de Acción Estacionaria. El
movimiento de un sistema dinámico entre dos instantes de tiempo t1 y
Rt
t2 es tal que la integral de acción o acción, S ≡ t 2 Ldt tiene un valor
D 1
estacionario cuando el Lagrangiano se evalúa en la trayectoria real del
sistema.
A
Para ilustrar numéricamente el principio de Hamilton consideremos por ejem-
plo un sistema que conozcamos a profundidad, el péndulo simple por ejemplo.
El lagrangiano de este sistema se escribe en términos de la única variable del
RR

sistema, q = θ como:

1 2 2
L= ml q̇ − mgl cos q
2
Las ecuaciones de Euler-Lagrange para el sistema producen:
BO

q̈ + ω 2 sin q = 0
Donde ω 2 = g/l.
Si aproximamos el movimiento a pequeñas amplitudes q  1, sin q ≈ q, El La-
grangiano y la solución, para condiciones iniciales q(0) = θ0 , q̇(0) = 0, se escriben:

mL2 2
L≈ (q̇ − ω 2 q2 )
2

q(t) ≈ θ0 cos(ωt) (6.35)


q̇(t) ≈ −θ0 sin(ωt) (6.36)
(6.37)

Si ahora definimos q0 (t) = q(t) + αη (t), donde escojo arbitrariamente η (t) =


sin(2ωt) las variables y rutinas necesarias para calcular la acción serían:
234 Chapter 6. El formalismo lagrangiano

In [21]: #Propiedades del Sistema


l=1.0
g=9.8
m=1.0
w=np.sqrt(g/l)
q0=1.0

#Función perturbadora
def h(t):
nt=np.sin(2*w*t)
return nt

def hp(t):
npt=2*w*np.cos(2*w*t)
return npt

R
#Trayectoria real
def q(t):

O
return q0*np.cos(w*t)

def qp(t):
return -q0*w*np.sin(w*t)
D
#Lagrangiano en la trayectoria perturbada
def L(t,alfa):
A
qprima=q(t)+alfa*h(t)
qprimap=qp(t)+alfa*hp(t)
L=0.5*m*l**2*qprimap**2-m*g*l*qprima**2/2
return L
RR

Así se verían las trayectorias, la real y las no físicas:


BO

In [22]: fig=plt.figure()
ax=fig.gca()

t1=0
t2=np.pi/2

ts=np.linspace(t1,t2,100)
ax.plot(ts,q(ts),'k-',lw=5,label='Real')

alpha=0.5
ax.plot(ts,q(ts)+alpha*h(ts),'b--',label=r'No física, $\alpha$=%.2f'%alpha)

alpha=0.2
ax.plot(ts,q(ts)+alpha*h(ts),'r--',label=r'No física, $\alpha$=%.2f'%alpha)

ax.legend()
ax.grid()
6.6. El principio de Hamilton 235

R
O
D
La acción se puede calcular numéricamente con la integral del Lagrangiano así:
A
In [23]: #Puntos extremos
t1=0
t2=2*np.pi/w
RR

alfa=0.1

#Accion
S,error=integral(L,t1,t2,args=(alfa,))

print("El valor de la acción para alfa = %.2f es %.5f"%(alfa,S))


BO

El valor de la acción para alfa = 0.10 es 0.14752

Gráfiquemos el valor de la acción para distintos valores de α:

In [24]: alfas=np.linspace(-1,1,100)
Ies=[]
for alfa in alfas:
I,error=integral(L,t1,t2,args=(alfa,))
Ies+=[I]

fig=plt.figure()
ax=fig.gca()
plt.plot(alfas,Ies)

Out[24]: [<matplotlib.lines.Line2D at 0x128b3fb70>]


236 Chapter 6. El formalismo lagrangiano

R
O
D
Como puede verse la acción es mínima cuando α = 0 lo que confirma el prin-
cipio de Hamilton.
A
RR
BO
Chapter 7

Aplicaciones del
formalismo lagrangiano

R
O
7.1 Simetrías y leyes de conservación
Uno de los aspectos mejor conocidos del formalismo escalar de la mecánica, es
D
su capacidad implícita para revelar propiedades de los sistemas dinámicos muy
difíciles de revelar con el formalismo vectorial. Este es el caso por ejemplo, de
las denominadas cantidades conservadas (constantes de movimiento, primeras
integrales o cuadraturas) que tanta utilidad tienen en la descripción de sistemas
A
dinámicos como vimos en los capítulos anteriores.
El poder de las simetrías para revelar aspectos profundos de los sistemas físicos
o simplemente para entender su comportamiento, es uno de los descubrimientos
RR

más importantes de la física moderna, de modo que merece una consideración


relativamente detallada.
El resultado más importante en esta materia fue descubierto en 1915 por la
matemática alemana Emmy Noether (ver foto abajo). La pronunciación correcta de
este importante nombre es, en alemán (original) “Noutar” y en inglés “Nouder”.
BO

Figure 7.1: La matemática y física Emmy Noether (1883-1935), considerada como


una de las matemáticas más importantes de la historia, descubrió el teorema que
lleva su nombre y que juega un papel fundamental en la física contemporánea.

El teorema de Noether. Si la acción S[{q j (t)}] =


R t2
t1 L ({ q j ( t )}, { q̇ j ( t )}, t ) dt de un sistema dinámico es simétrica
bajo una transformación continua local de coordenadas o tiempo, ex-
iste una cantidad conservada (corriente conservada) asociada a esa

237
238 Chapter 7. Aplicaciones del formalismo lagrangiano

transformación.

Una forma más informal de expresar el teorema de Noether es escribirla como


una regla general:

Regla de Noether. Por cada simetría de un sistema dinámico, existe


una cantidad conservada.

Pero ¿qué es exactamente una simetría en este contexto?. En la vida cotidiana,


una simetría es una propiedad, normalmente geométrica, que tiene un cuerpo y
que lo hace ver igual incluso al cambiar la manera como lo observamos. Así por
ejemplo, un cuerpo esférico se ve igual no importa en que dirección lo veamos. Un
cilindro es el mismo, si lo rotamos alrededor de su eje principal, pero cambia si lo
rotamos alrededor de un eje perpendicular a él.

R
La simetría a la que hace referencia el teorema de Noether, no es una simetría
geométrica de los cuerpos implicados en el sistema dinámico. Es en realidad una
simetría matemática, es decir una transformación de las coordenadas que mantiene

O
la forma matemática de alguna función física relevante (la acción o el lagrangiano).
En física, decimos también que la función correspondiente es covariante bajo la
transformación indicada. D
Consideren por ejemplo el Lagrangiano de un oscilador armónico en 2 dimen-
siones (una masa unida a un resorte que puede además moverse en cualquier di-
rección):
A
1 1
m( ẋ2 + ẏ2 ) − k ( x2 + y2 )
L( x, y, ẋ, ẏ, t) =
2 2
Hay dos posibles transformaciones que hacen que la forma funcional del La-
RR

grangiano se mantenga igual. Si cambiamos el valor del tiempo t por un valor


nuevo t0 = t + e, el Lagrangiano seguirá siendo el mismo:
1 1
L( x, y, ẋ, ẏ, t0 ) =
m( ẋ2 + ẏ2 ) − k( x2 + y2 )
2 2
Decimos que es covariante o simétrico bajo una traslación temporal.
BO

La otra transformación es x 0 = x + ey y y0 = y − ex, con la cual el lagrangiano


se convierte en:

1 1
L( x 0 , y0 , ẋ 0 , ẏ0 , t0 ) = m[ ẋ 02 + ẏ02 + e2 ( ẋ 02 + ẏ02 )] − k[ x 02 + y02 + e2 ( x 02 + y02 )]
2 2
Si suponemos que e es muy pequeño, a primer orden en e el Lagrangiano
queda:
1 1
L( x 0 , y0 , ẋ 0 , ẏ0 , t0 ) =
m( ẋ 02 + ẏ02 ) − k( x 02 + y02 )
2 2
Que es funcionalmente idéntico (covariante) al Lagrangiano original. Como
la dinámica depende de la forma funcional del Lagrangiano, esta simetría impli-
cará que la dinámica del sistema es la misma descrita con respecto a las variables
x 0 , y0 , t0 que con respecto a las variables originales.
¿Cuál es la cantidad conservada aquí?
7.1. Simetrías y leyes de conservación 239

Para encontrar las cantidades conservadas a una determinada transformación


de coordenadas, escribamos de forma general la transformación (por lo menos de
las coordenadas generalizadas) así:

q0j (e) = q j + eK j ({qk })

Asumimos que bajo esta transformación el Lagrangiano mantiene su forma


matemática L({q0j }, {q̇0j }, t) = L({q j }, {q̇ j }, t) de modo que sigue satisfaciendo las
ecuaciones de Euler-Lagrange ahora respecto a las coordenadas transformadas:
( ! )
d ∂L ∂L
− 0 =0
dt ∂q˙0 j ∂q j
M

La invarianza del Lagrangiano (y por tanto de la acción) frente a esta trans-

R
formación se puede expresar matemáticamente en términos del parámetro e de la
transformación así:

O
d
L({q0j (e)}, {q̇0j (e)}, t) = 0
de
Usando la regla de la cadena queda:

∂L ∂q j
0
D
∂L ∂q̇ j
0
!
∑ ∂q0j ∂e
+
∂q̇0j ∂e
=0
A
j

Usando ∂q0j /∂e = K j , ∂q̇0j /∂e = K̇ j y aprovechando las ecuaciones de Euler-


Lagrange (asumimos el lagrangiano en términos de las variables transformadas
RR

sigue cumpliendo estas ecuaciones), la ecuación anterior queda:


!
d ∂L
dt ∑
K =0
j
∂q̇0j j
BO

De donde se identifica claramente que la cantidad conservada asociada a la


transformación es:

∂L
P({q j }, {q̇ j }) ≡ ∑ ∂q̇ j K j
j

que recibe el nombre de momentum conservado. Claramente no se trata del mo-


mentum lineal pero tiene una estrecha relación con él como veremos aquí. Nótese
que en la expresión del momentum conservado, hemos escrito ∂L/∂q̇ j en términos
de las variables originales en lugar de las nuevas variables transformadas. Esto es
valido en tanto la forma funcional de L no se modifica por la transformación.
En el ejemplo del oscilador armónico bidimensional, las funciones de transfor-
mación K j : (y, − x ) de modo que el momentum conservado será:

P( x, y, ẋ, ẏ) = m ẋy − mẏx = m(y ẋ − x ẏ)


Que no es nada más que la componente z del momentum angular del sistema.
240 Chapter 7. Aplicaciones del formalismo lagrangiano

7.1.1 La constante de Jacobi y la conservación de la energía


¿Qué podemos decir ahora de la invarianza respecto a una traslación temporal?.
En este caso al cambiar el tiempo con la transformación t0 = t + e, la forma fun-
cional del Lagrangiano se mantiene igual. Esta condición es equivalente a:

∂L
=0
∂t
¿Qué cantidad física es conservada en este caso?. Una manera de obtener
la cantidad conservada en esta situación, es calculando la derivada total del La-
grangiano respecto al tiempo:

dL ∂L ∂L ∂L
∑ ∂q j q̇ j + ∑ ∂q̇ j q̈ j +

R
=
dt j j
∂t

O
Si despejamos la derivada parcial del lagrangiano respecto al tiempo (que es
la que nos indica si el Lagrangiano es simétrico o no respecto a una traslación
temporal) y nos valemos de las ecuaciones de Euler-Lagrange para modificar el
primer término del lado izquierdo de la ecuación anterior, obtenemos:

∂L d
D ∂L dL
=
dt ∑ ∂q̇ j q̇ j − dt
A
∂t j

De donde se sigue que si hay simetría temporal la cantidad conservada es:


RR

∂L
h({q j }, {q̇ j }) ≡ ∑ ∂q̇ j q̇ j − L
j

A esta función se la llama la constante de Jacobi y juega el mismo papel que


BO

el momento conservado en el caso de simetrías respecto a transformaciones de las


coordenadas.
En el caso de la simetría espacial, la cantidad conservada es análoga al momen-
tum lineal o angular. En el caso de la simetría temporal ¿cuál es el análogo clásico
de la función de Jacobi?. No es fácil decirlo, pero existen situaciones en las que la
función de Jacobi es igual a una cantidad muy conocida.
Consideremos por ejemplo la situación en la que el potencial solo depende
de las coordenadas U ({q j }) (fuerzas conservativas en el sentido clásico). En esta
situación, la constante de Jacobi se puede escribir como:

∂T
h({q j }, {q̇ j }) ≡ ∑ q̇ j ∂q̇ j − T + U
j

Ahora bien, la función de energía cinética T ({q j }, {q̇ j }, t) = ∑i mi~r˙ i ({q j }, t)2 /2
se puede escribir, usando la regla de la cadena, en términos de las variables y
velocidades generalizadas como:
7.1. Simetrías y leyes de conservación 241

!2
1 ∂~ri ∂~r
T = ∑ mi ∑ q̇ + i (7.1)
i
2 j
∂q j j ∂t
"  2 #
1 ∂~ri ∂~ri ∂~r ∂~r ∂~ri
= ∑ mi ∑∑ · q̇ j q̇k + 2 ∑ i q̇ j · i + (7.2)
i
2 j k
∂q j ∂qk j
∂q j ∂t ∂t

Si asumimos ahora que las ecuaciones de transformación no dependen explíci-


tamente del tiempo (por ejemplo en el caso en el que las restricciones son escleróno-
mas), la energía cinética será:

1 ∂~r ∂~r
2∑ ∑ ∑ mi ∂qij · ∂qki q̇ j q̇k
T=

R
i j k

Es decir bajo esta condición la energía cinética será una función cuadrática de
las velocidades generalizadas. Esta propiedad nos permite aprovechar el teorema

O
de Euler para funciones homogéneas, que dice que si f ({ xi }) es un función de grado
k en { xi }, es decir, si f ({λxi }) = λk f ({ xi }), entonces:

∑ xi f ( xi ) = k f ( xi )
D
Usando esta propiedad en el caso de la función de energía cinética T, que bajo
las condiciones establecidas antes es una función de grado 2, obtenemos:
A
∂T
∑ q̇ j ∂q̇ j = 2T
j
RR

De donde la constante de Jacobi en este caso se puede finalmente escribir como:

h({q j }, {q̇ j }) = T + U
Que tiene la forma de lo que conocemos en la mecánica Newtonicana como la
Energía Mecánica.
BO

Es importante sin embargo precisar que h, en general, como T y L no son canti-


dades numéricas sino funciones de las variables generalizadas.
En síntesis, en el contexto del formalismo Lagrangiano, podemos formular el
ahora teorema de conservación de la energía mecánica así:

Teorema de conservación de la energía mecánica. Si en un sistema


dinámico se cumplen las siguientes condiciones: 1. La dinámica puede
ser descrita completamente con una función lagrangiano L = T − U
de las variables generalizadas {q j }. 2. La función Lagrangiana no de-
pende explícitamente del tiempo, ie. ∂L/∂t = 0. 3. La función de en-
ergía potencial solo depende de las variables generalizadas y no de las
velocidades, U ({q j }). 4. Las transformaciones entre las coordenadas
cartesianas y las variables generalizadas, ~ri = ~ri ({q j }, t), no dependen
explícitamente del tiempo (restricciones esclerónomas).

Entonces la energía mecánica definida como E ≡ T + U es una cantidad


conservada.
242 Chapter 7. Aplicaciones del formalismo lagrangiano

7.1.2 Teorema de Noether para el Lagrangiano


En síntesis, podríamos formular el teorema de Noether para el formalismo la-
grangiano en estos términos:
Teorema de Noether para el Lagrangiano. Dada un sistema dinámico
con Lagrangiano L: 1. Si el Lagrangiano es covariante bajo las
r-transformaciones espaciales {q j → q j + eK j ({qk })}r , la cantidad
P({q j }r , {q̇ j }r ) = ∑rj=1 ∂L/∂q̇ j K j se conserva. 2. Si el Lagrangiano es
covariante bajo una translación temporal (no depende explícitamente
del tiempo) la cantidad h({q j }, {q̇ j }) = ∑ j (∂L/∂q̇ j )q̇ j − L se conserva.

7.2 Aplicaciones de las simetrías del Lagrangiano

R
Para aterrizar algunos de los conceptos mencionados hasta aquí, consideremos al-
gunos ejemplos generales y otros específicos que nos permitirán ilustrar el poder
que el teorema de Noether tiene en el contexto del formalismo escalar de la

O
mecánica
### Variables cíclicas y conservación de los momentos generalizados
Un caso muy particular de simetría del Lagrangiano se produce cuando este
D
último es covariante frente a un cambio arbitrario de un una de las variables gen-
eralizadas. Simbólicamente, q0k = qk + e.
En este caso Kk = 1 y de acuerdo al teorema de Noether la cantidad conservada
será:
A
∂L
pk ≡
∂q̇k
RR

Llamamos a esta cantidad, el momentum generalizado correspondiente a la co-


ordenada qk . Si el momentum generalizado es constante, la ecuación de Euler-
Lagrange correspondiente a la coordenada qk implica necesariamente que:

∂L
=0
BO

∂qk
Es decir, la simetría mencionada inicialmente es equivalente a decir que el La-
grangiano no depende explícitamente de la coordenada qk . En otras palabras la
coordenada qk , sencillamente, no aparece en la expresión matemática de L. Lla-
mamos a este tipo de coordenadas, coordenadas cíclicas y la simetría correspon-
diente es una de las más fáciles de identificar en física.
Dos ejemplos concretos nos permiten ilustrar esta simetría.
El lagrangiano de un cuerpo que cae libremente en un campo gravitacional esta
dado por:
1
L= m( ẋ2 + ẏ2 + ż2 ) − mgz
2
En este caso las variables x, y son variables ciclicas y podemos concluir que sus
momentums generalizados, p x = ∂L/∂ ẋ = m ẋ y py = ∂L/∂ẏ = mẏ son constantes.
Este resultado, el hecho de que en un campo gravitacional la velocidad del
cuerpo en dirección perpendicular al campo se mantiene constante, había sido in-
tuido originalmente por Galileo y ahora podemos decir que es producto de una
7.2. Aplicaciones de las simetrías del Lagrangiano 243

simetría, a saber, que la dinámica de este movimiento es exactamente la misma


independientemente del lugar del plano xy en el que lancemos el cuerpo.
Consideremos ahora el lagrangiano de un cuerpo que se mueve en un plano
bajo la influencia de una fuerza central (caso que desarrollaremos a fondo en la
siguiente sección). En este caso el Lagrangiano se escribe:
1
L= m(ṙ2 + r2 θ̇ 2 ) − U (r )
2
En este caso la variable cíclica es θ y el momentum generalizado que se con-
serva será pθ = ∂L/∂θ̇ = mr2 θ̇. Esta última cantidad es claramente el momentum
angular. Es decir en este caso la covarianza bajo la traslación en θ (rotación alrede-
dor del eje z) tiene asociada la conservación del momentum angular.
Si bien los dos casos anteriores corresponden en general al mismo tipo de
simetría (variables ciclicas) en realidad son físicamente diferentes y podemos dis-

R
tinguirlos en dos tipos generales de simetrías.

7.2.1 Simetría traslacional y la conservación del momentum

O
lineal
Entendemos por simetría traslacional a aquella que se produce cuando el La-
D
grangiano es invariante bajo una traslación en el espacio coordenado. En esta
situación suponemos que las variables generalizadas son las coordenadas carte-
sianas y la transformación la escribimos como:
A
~r 0 = ~r + k̂δr
Donde el vector k̂ es el vector unitario en la dirección del desplazamiento y
RR

en este caso el papel del parámetro e es jugado por la cantidad δr. El momento
conservado, de acuerdo al teorema de Neother en este caso será:

∂L
P= ∑ ∂q̇ j K j = ∑ p j K j
j j
BO

Donde en coordenadas cartesianas sabemos que ∂L/∂q̇ j = p j = m ẋ j . En otros


términos:

pk = ~p · k̂
Este resultado lo podemos enunciar de forma general diciendo:
Conservación del momentum lineal. Si el Lagrangiano de un sistema
dinámico es covariante bajo una traslación de coordenadas en la direc-
ción k̂, la componente del momentum lineal pk = ~p · k̂ en esa dirección
se conserva.

7.2.2 Simetría rotacional y la conservación del momentum


angular
Entendemos por simetría rotacional aquella que se produce cuando el Lagrangiano
es invariante bajo una rotación en el espacio coordenadas. En general una rotación
puede escribirse en términos de las coordenadas cartesianas como:
244 Chapter 7. Aplicaciones del formalismo lagrangiano

~r 0 = ~r + δθ (n̂ ×~r )

R
O
D
A
RR

Figure 7.2: Una rotación general en el espacio coordenado

Aquí nuevamente el papel del parámetro e es jugado por el ángulo de rotación


δθ. En este caso el momento conservado es de acuerdo al teorema de Noether:

P = ~p · (~n ×~r )
BO

Utilizando propiedades cíclicas del triple producto vectorial el vector puede


finalmente escribirse como:

Ln = (~r × ~p) · n̂
Que no es otra cosa que la componente del momentum angular ~L. De forma
general:

Conservación del momentum angular. Si el Lagrangiano de un sis-


tema dinámico es covariante bajo una rotación alrededor de una di-
rección n̂, la componente del momentum angular Ln = ~L · n̂ en esa
dirección se conserva.

7.2.3 Simetrías más generales


Considere el sistema desconocido descrito por el siguiente Lagrangiano:
7.2. Aplicaciones de las simetrías del Lagrangiano 245

L = ( a ẋ2 + b ẋ ẏ + cẏ2 ) − (ex + f y)

¿Es posible identificar alguna simetría, es decir encontrar alguna cantidad con-
servada?. En general en este tipo de Lagrangianos una traslación del tipo

x0 = x + ek x
0
y = y + ek y

R
Con k x , k y constantes es suficiente. Si reemplazamos en el Lagrangiano obten-
emos:

O
L = ( a ẋ 02 + b ẋ 0 ẏ0 + cẏ02 ) − [ex 0 + f y0 + e(ek x + f k y )]
D
A
La covarianza se produce si se cumple que ek x = − f k y . En este caso el mo-
mento conservado será:
RR

∂L ∂L
P= kx + ky
∂ ẋ ∂ẏ
= k x (2a ẋ + bẏ) + k y (b ẋ + 2cẏ)
1
= k x [(2a f − eb) ẋ + (b f − 2ec)ẏ]
BO

Naturalmente como k x es una constante por definición, el momento conservado


será en realidad:

1
P= [(2a f − eb) ẋ + (b f − 2ec)ẏ]
f

Este resultado no es para nada trivial. El momentum conservado, no es ni el


momentum lineal y mucho menos el momentum angular.
Puede mostrarse fácilmente que un sistema con un Lagrangiano del tipo indi-
cado arriba es el formado por tres cuerpos unidos por cuerdas y poleas ligeras sin
fricción como los mostrados en la figura:
246 Chapter 7. Aplicaciones del formalismo lagrangiano

R
Figure 7.3: Sistemas de cuerpos acoplados por poleas que tienen una simetría en

O
el Lagrangiano no tirvial.

Considetemos por ejemplo el sistema mostrado a la derecha e intentemos de-


D
ducir las ecuaciones de movimiento de los cuerpos aprovechando el momento con-
servado.
Si tomamos como altura de referencia la posición media de las masas m2 y m3 ,
A
cuando la masa m1 sube una distancia x respecto a ese nivel, la posición media
de las masas m2 y m3 , que medida respecto a la segunda polea es (y2 + y3 )/2
desciende una cantidad − x. Si llamamos y = y2 , la posición de la masa 3 será
RR

−2x − y.
Las ecuaciones de transformación serán entonces:

y1 = x
y2 = y
BO

y3 = −2x − y

Las velocidades serán:

ẏ1 = ẋ
ẏ2 = ẏ
ẏ3 = −2ẋ − ẏ

Y el Lagrangiano será:

1
L= [m ẋ2 + m2 ẏ2 + m3 (−2ẋ − ẏ)2 ] − g[m1 x + m2 y + m3 (−2x − y)]
2 1
1
L= [(m1 + 4m3 ) ẋ2 + 4m3 ẋ ẏ + (m2 + m3 )ẏ2 ] − g[(m1 − 2m3 ) x + (m2 − m3 )y]
2

Aquí podemos identificar los coeficientes de lagrangiano escrito arriba así:


7.2. Aplicaciones de las simetrías del Lagrangiano 247

a= (m1 + 4m3 )/2


b= 2m3
c= (m2 + m3 )/2
e= (m1 − 2m3 ) g
f = ( m2 − m3 ) g
Para simplificar el algebra, demos valores concretos a las masas. Por ejemplo
m1 = 5m, m2 = 4m, m3 = 2m (unidades arbitrarias). En este caso el Lagrangiano
será:
m
L= (13ẋ2 + 8ẋ ẏ + 6ẏ2 ) − mg( x + 2y)
2

R
Y los coeficientes serán:

a= 13m/2

O
b= 4m
c= 3m
e= mg
f =
D 2mg
El momento conservado queda:
A
1
P= [(2a f − eb) ẋ + (b f − 2ec)ẏ]
f
RR

P = m(11ẋ + ẏ)
Las ecuaciones de movimiento del sistema (después de reemplazar la función
Lagrangiana en las ecuaciones de Euler-Lagrange) son:

13m ẍ + 4mÿ = −mg


BO

4m ẍ + 6mÿ = −2mg
Si usamos el momento conservado podemos eliminar ÿ = −11ẍ de la primera
ecuación para escribir la ecuación de movimiento de la primera partícula:

1
ẍ = g
41
Que tiene como solución:

1 2
x = xo + ẋo t + gt
41
Y la ecuación de movimiento de la segunda partícula será:

11
ÿ = − g
41
Que tiene como solución
248 Chapter 7. Aplicaciones del formalismo lagrangiano

11 2
y = yo + ẏo t −
gt
41
Una animación del movimiento de este sistema se puede construir así. Las
condiciones iniciales son:
In [3]: #Condiciones iniciales
m=1
g=9.81
xo=2
xpo=0
yo=0
ypo=0

#Propiedades de las poleas

R
R=0.5
l1=4
l2=4

O
#Posición de la polea
R=0.5
xpol1=0
xpol2=xpol1+R
D
ypol1o=-2.0
A
ypol2o=ypol1o-l2/2

#Posición inicial de referencia


yini=ypol1o-l1/2-l2/2
RR

El dibujo del sistema será:


In [4]: fig=plt.figure(figsize=(6,6))
ax=fig.gca()
BO

#Muro superior
ax.axhspan(0,1,color='k',alpha=0.2)

#Polea 1
polea1=pat.Circle((xpol1,ypol1o),R,color='w',ec='k',lw=1)
polea1=ax.add_patch(polea1)
polea2=pat.Circle((xpol2,ypol2o),R,color='w',ec='k',lw=1)
polea2=ax.add_patch(polea2)

cuerda_polea1,=ax.plot([xpol1,xpol1],[0,ypol1o],'k-')
cuerda_polea2,=ax.plot([xpol2,xpol2],[ypol1o,ypol2o],'k-')

#Referencia
ax.axhline(yini,color='k',ls='--')

#Cuerpo 1
cuerpo1,=ax.plot([xpol1-R],[yini+xo],'ko',ms=10)
cuerda1,=ax.plot([xpol1-R,xpol1-R],[ypol1o,yini+xo],'k-')
7.2. Aplicaciones de las simetrías del Lagrangiano 249

#Cuerpo 2
cuerpo2,=ax.plot([xpol2-R],[yini+yo],'ko',ms=10)
cuerda2,=ax.plot([xpol2-R,xpol2-R],[ypol2o,yini+yo],'k-')

#Cuerpo 3
cuerpo3,=ax.plot([xpol2+R],[yini],'ko',ms=10)
cuerda3,=ax.plot([xpol2+R,xpol2+R],[ypol2o,yini],'k-')

ax.set_xlim((-6,6))
ax.set_ylim((-10,2))

Out[4]: (-10, 2)

R
O
D
A
RR
BO

Una animación del movimiento del sistema sería:

In [5]: fig=plt.figure(figsize=(6,6))
ax=fig.gca()

#Muro superior
ax.axhspan(0,1,color='k',alpha=0.2)
250 Chapter 7. Aplicaciones del formalismo lagrangiano

#Polea 1
polea1=pat.Circle((xpol1,ypol1o),R,color='w',ec='k',lw=1)
polea1=ax.add_patch(polea1)
polea2=pat.Circle((xpol2,ypol2o),R,color='w',ec='k',lw=1)
polea2=ax.add_patch(polea2)

cuerda_polea1,=ax.plot([xpol1,xpol1],[0,ypol1o],'k-')
cuerda_polea2,=ax.plot([xpol2,xpol2],[ypol1o,ypol2o],'k-')

#Referencia
ax.axhline(yini,color='k',ls='--')

#Cuerpo 1
cuerpo1,=ax.plot([xpol1-R],[yini+xo],'ko',ms=10)

R
cuerda1,=ax.plot([xpol1-R,xpol1-R],[ypol1o,yini+xo],'k-')

#Cuerpo 2

O
cuerpo2,=ax.plot([xpol2-R],[yini+yo],'ko',ms=10)
cuerda2,=ax.plot([xpol2-R,xpol2-R],[ypol2o,yini+yo],'k-')

#Cuerpo 3
D
cuerpo3,=ax.plot([xpol2+R],[yini],'ko',ms=10)
cuerda3,=ax.plot([xpol2+R,xpol2+R],[ypol2o,yini],'k-')
A
ax.set_xlim((-6,6))
ax.set_ylim((-10,2))

Nt=100
RR

ts=np.linspace(0,0.5+0.5,Nt)
def animacion(i):
t=ts[i]
x=xo+xpo*t+g/41.*t**2
y=yo+ypo*t-11*g/41.*t**2
BO

#Cuerpos
y1=yini+x
cuerpo1.set_data([xpol1-R],[y1])

y2=yini+yo+y
cuerpo2.set_data([xpol2-R],[y2])

y3=yini+2*xo+yo-2*x-y
cuerpo3.set_data([xpol2+R],[y3])

#Poleas
yp2=ypol2o+xo-x
polea2.center=(xpol2,yp2)

#Cuerdas
cuerda1.set_data([xpol1-R,xpol1-R],[ypol1o,y1])
cuerda2.set_data([xpol2-R,xpol2-R],[yp2,y2])
7.3. El Problema de los N cuerpos 251

cuerda3.set_data([xpol2+R,xpol2+R],[yp2,y3])
cuerda_polea2.set_data([xpol2,xpol2],[ypol1o,yp2])

return cuerda_polea2,cuerpo1,cuerda1,cuerpo2,cuerda2

animacion(0)
anim=animation.FuncAnimation(fig,animacion,frames=Nt,interval=Nt/30,blit=True)

R
O
D
A
RR
BO

7.3 El Problema de los N cuerpos


Después de la presentación amplia del formalismo Lagrangiano realizada en las
secciones anteriores, es hora de aplicarlo en los problemas de mecánica celeste.
¿Cuál es el Lagrangiano del problema de los N-cuerpos?
Al tratarse de un problema sin restricciones, el número de variables general-
izadas del problema serán 3N. Podemos llamar a estas variables xiα donde el indice
i corre sobre las partículas y el índice α sobre las coordenadas, α = 1( x ), 2(y), 3(z).
El Lagrangiano tiene la forma:
1
L NB = ∑ 2 mi ẋiα2 − U ({ xiα })

252 Chapter 7. Aplicaciones del formalismo lagrangiano

7.3.1 Simetrías del lagrangiano de N-cuerpos


Examinemos ahora las simetrías que tiene L NB y sus constantes de movimiento
asociadas de acuerdo al teorema de Noether.
Para hacerlo deduzcamos primero los momentums generalizados, que tienen
en este caso, por usar coordenadas cartesianas una forma elemental:

∂L
piα = = mi ẋiα
∂ ẋiα

7.3.2 Variables cíclicas


Como vemos el sistema no tiene ninguna variable cíclica.

R
7.3.3 Simetría temporal
El lagrangiano no depende explícitamente del tiempo por lo que sabemos que la

O
función de Jacobi del sistema es constante. Adicionalmente dado que el poten-
cial solo depende de las coordenadas, la constante de Jacobi coincidirá con la en-
ergía mecánica, h = T + U, de donde encontramos nuestra primera constante de
D
movimiento:

1
E= ∑ 2 mi ẋiα2 + U ({xiα })
A

7.3.4 Simetría traslacional


RR

Dado que la energía potencial solo depende de la distancia entre las partículas,
i.e. U ({ xiα } = U ({| xiα − x jα |}), entonces el Lagrangiano es simétrico frente a
traslaciones, ~ri → ~ri + δ~r y por lo tanto todas las componentes del momentum
lineal total se conservan. Esta es nuestra segunda constante de movimiento:
BO

~P = ∑ mi~r˙ i
i

La simetría traslacional nos permite identificar otra propiedad interesante. Si


definitimos:

∑i mi~ri
rCM ≡
M
Donde M = ∑i mi , podemos escribir la conservación del momentum como:

~P = M~r˙ CM

Como ~
P es constante, podemos integrar esta ecuación para obtener:

∑i mi~ri ~P
= ~rCM,0 + t
M M
Esta expresión puede ser considerada en sí misma una “cuadratura”.
7.3. El Problema de los N cuerpos 253

7.3.5 Simetría rotacional


De nuevo la dependencia del potencial únicamente de las distancias entre las
partículas, hace que el problema sea simétrico bajo rotaciones en el espacio en di-
recciones arbitrarias. Esto implica que el momentum angular total es constante.
Esta es nuestra tercera constante de movimiento:

~L = ∑ mi~ri ×~r˙ i
i
Como vemos, lo que en el formalismo vectorial requirio de algunas truculen-
cias matemáticas, en el formalismo Lagrangiano es completamente elemental: la
identificación de las simetrías conduce de forma directa a la identificación de las
integrales de movimiento.

R
7.3.6 Problema de N cuerpos jerárquico
Dependiendo de la intensidad de las interacciones entre las partículas, un prob-

O
lema típico de N-cuerpos puede considerarse como un sistema anidado de prob-
lemas de dos cuerpos. A estos sistemas los llamamos problemas jerarquicos de dos
cuerpos. D
El Lagrangiano en términos de las coordenadas cartesianas del problema de los
dos cuerpos es:
A
1 1 Gm1 m1
L2B = m1 ( ẋ12 + ẏ21 + ż21 ) + m1 ( ẋ22 + ẏ22 + ż22 ) + p
2 2 ( x1 − x2 )2 + ( y1 − y2 )2 + ( z1 − z2 )2
El Lagrangiano escrito en términos de las coordenadas cartesianas tiene una
RR

forma muy compleja y en el que no se reconoce ninguna simetría adicional a las ya


reconocidas en el Lagrangiano de los N-cuerpos.
Una manera de simplificar el Lagrangiano es realizando un cambio de vari-
ables. Las coordenadas cartesianas usadas hasta ahora están referidas a un punto
arbitrario del espacio. Escribamos el Lagrangiano realizando una traslación al cen-
BO

tro de masa.
En este caso habíamos visto que:
m2
~r1 = ~rCM −
~r
M
m
~r2 = ~rCM + 2~r
M
Donde ~r = ~r2 −~r1 es el vector relativo.
Con esta transformación las velocidades quedan:
m
~r˙ 1 = ~r˙ CM − 2~r˙
M
m
~r˙ 2 = ~r˙ CM + 2~r˙
M
La energía cinética se puede escribir ahora como:
1 ˙2 1 ˙2 1 1 m1 m2 ˙
T= m1~r1 + m2~r2 = M~r˙ CM + ~r
2 2 2 2 M
254 Chapter 7. Aplicaciones del formalismo lagrangiano

Si llamamos mr = m1 m2 /M (masa reducida), el Lagrangiano adopta la forma:

1 ˙2 1 GMmr
L2B = M~rCM + mr~r˙ 2 +
2 2 r
El cambio realizado hasta ahora implico simplemente pasar del conjunto de
variables originales ( x1 , y1 , z1 , x2 , y2 , z2 ) a un nuevo conjunto de variables general-
izadas que pueden describir también el estado del sistema ( x, y, z, xCM , yCM , zCM ).
En este nuevo conjunto de variables generalizadas, descubrimos una simetría
que no existía en la forma original del Lagrangiano: las variables xCM , yCM , zCM
son cíclicas (no aparecen explícitamente en el Lagrangiano). Esto implica que sus
momentos generalizados, ∂L/∂ ẋCM = M ẋCM , ∂L/∂ẏCM = MẏCM , ∂L/∂żCM =
M żCM son constantes de movimiento.
Esto por supuesto no es nuevo. Las nuevas constantes no son otra cosa que
el momentum del centro de masa (o momentum total) que habíamos demostrado

R
constante por la invarianza translacional del Lagrangiano.
Con esto aprendemos una lección nueva, muy interesante: una simetría en un

O
conjunto de variables (pe. simetría traslacional) puede ser otra simetría en un con-
junto de variables distintas (pe. simetría de variables cíclicas).

Procedimiento de Routh. En un problema en el que existen variables


D
cíclicas y momentums generalizados conservados, el Lagrangiano
puede ser simplificado reemplazando los momentums generalizados
por constantes.
A
En el caso del problema de los dos cuerpos si reconociemos que M~r˙ CM =
P2 /(2M ) el Lagrangiano queda:
RR

P2 1 GMmr
L2B = + mr~r˙ 2 +
2M 2 r
Ahora bien, si tenemos en cuenta el siguiente teorema:

Libertad del Lagrangiano. la dinámica de un sistema (ecuaciones de


BO

Euler-Lagrange) es descrita igual de bien con el Lagrangiano original


del sistema o cualquier Lagrangiano que cumpla con la condición:

d
L0 = L +F ({q j }, t)
dt
En particular agregar o quitar una cantidad constante al Lagrangiano deja co-
variante la dinámica. De allí que el Lagrangiano del problema de los dos cuerpos
pueda escribirse de forma general como

1 ˙ 2 GMmr
L2B = mr~r +
2 r
El procedimiento de Routh, muestra que el número de grados de libertad de un
sistema es realmente menos cuando existen simetrías. En este caso, el problema de
los dos cuerpos, que originalmente tenía 6 grados de libertad (no existe ninguna
restricción geométrica), tiene en realidad solo 3 grados de libertad.
7.4. El Problema general de los dos cuerpos 255

De nuevo este Lagrangiano no parece tener más simetrías de las que hemos
identificado hasta aquí, al menos usando coordenadas cartesianas. Sin emabargo si
hacemos una nueva transformación de coordenadas y en lugar de las coordenadas
( x, y, z) usamos las coordenadas cartesianas (r, φ, θ ) (recordemos que en mecánica
celeste, φ es el ángulo respecto al plano x-y y θ es el ángulo acimutal sobre ese
plano), el Lagrangiano adpota la forma:

1 GMmr
L2B = mr (ṙ2 + r2 cos2 φθ̇ 2 + r2 φ̇2 ) +
2 r
En este Lagrangiano identificamos una nueva simetría: la coordenada angular
θ es cíclica y tiene como cantidad conservada el momentum generalizado:

∂L
pθ = = mr r2 cos2 φθ̇ ≡ Lr

R
∂θ̇
Por la conservación del momentum angular total que conocemos del problema
original, sabemos que las partículas en este sistema se mueven sobre un plano (el

O
plano invariante de Laplace) de modo que tenemos libertad para escoger el sistema
de coordenadas esférico referido a ese plano. En este caso φ = 0 y es constante con
lo que el Lagrangiano (referido al plano invariante de Laplace es):
D
1 GMmr
L2B = mr (ṙ2 + r2 θ̇ 2 ) +
2 r
A
y La constante de movimimiento Lr es:

Lr = mr r2 θ̇
RR

Aplicando nuevamente el procedimiento de Routh el Lagrangiano del prob-


lema de los dos cuerpos puede escribirse de la forma más compacta y general
posible como:

L2
 
1 GMmr
BO

L2B,eq = mr ṙ2 + 2r 2 +
2 mr r r

Nótese que este Lagrangiano corresponde al de un sistema con un solo grado


de libertad. En realidad el problema de los dos cuerpos tiene como mínimo dos
grados de libertad, pero la ecuación que rige el segundo grado de libertad, θ es
trivial y esta dada por:

Lr
θ̇ =
mr r 2

7.4 El Problema general de los dos cuerpos


En la sección anterior probamos, partiendo del lagrangiano del problema de los N-
cuerpos y mediante un conjunto de transformaciones de coordenadas, además de
la aplicación del procedimiento de Routh, que en el plano invariante de Laplace,
el problema tiene dos grados de libertad (r, θ ) y el Lagrangiano general se escribe:
256 Chapter 7. Aplicaciones del formalismo lagrangiano

1 Mmr
L2B = mr (ṙ2 + r2 θ̇ 2 ) +
2 r
Sin perdida de generalidad el Lagrangiano se puede escribir como:
1
L2B = mr (ṙ2 + r2 θ̇ 2 ) − U (r )
2
Donde U (r ) = − GMmr /r
Este Lagrangiano tiene una constante de movimiento (el momentum angular
reducido):

Lr = mr r2 θ̇
y la dinámica de la coordenada r puede obtenerse también usando el La-

R
grangiano (reducido):

L2r
 
1 2
L2B,eq = mr ṙ + 2 2 − U (r )

O
2 mr r
¿Cuál es la solución a este problema? ¿cuáles son las ecuaciones que rigen la
variable radial r y la variable angular θ?. En el capítulo 3 del formalismo vectorial
D
vimos cómo resolver este problema usando métodos vectoriales. Aquí veremos
como, usando exclusivamente ecuaciones escalares, el problema puede resolverse
de la misma manera, encontrando en el camino otros resultados interesantes.
A
El aspecto más interesante de la solución que encontraremos aquí, es que puede
aplicarse para describir el movimiento de sistemas sometidos a fuerzas centrales,
F (r ) = −∂U/∂r arbitrarias, no solo de fuerzas gravitacionales.
RR

7.4.1 El potencial efectivo y las regiones de exclusión


El primer resultado de interés se obtiene al reconocer que el Lagrangiano anterior
cumple las condiciones que nos permiten decir que la función de Jacobi es con-
stante e igual a la energía total del sistema reducido:
BO

∂L2B,eq 1 1 L2r
h= ṙ − L = mr ṙ2 + + U (r )
∂ṙ 2 2 mr r 2
1 1 L2r
Er = mr ṙ2 + + U (r )
2 2 mr r 2
Si dividimos toda la ecuación por mr obtenemos la energía específica:

1 2 1 h2
e= ṙ + + V (r )
2 2 r2
Donde h = Lr /mr es el momentum angular específico y V (r ) = U (r )/mr es el
potencial.
Despejando ṙ2 en función de las constantes e y h obtenemos:

1 h2
 
1 2
ṙ = e − V (r ) +
2 2 r2
= e − Veff (r )
7.4. El Problema general de los dos cuerpos 257

Donde hemos definido Veff (r ) ≡ V (r ) + h2 /(2r2 ) que se conoce como el poten-


cial efectivo.
El potencial efectivo puede verse como la suma del potencial convencional V (r )
y un potencial adicional Vcen = h2 /(2r2 ) que se conoce como el potencial centrífugo.
Esta ecuación tiene una estructura similar a la ecuación que nos permitio definir
las regiones de exclusión en el problema de los 3 cuerpos en el capítulo anterior. No
es de extrañar, tiene exactamente el mismo origen, a saber la constante de Jacobi.
Como sucedio en ese caso, estas regiones permiten obtener información rele-
vante sobre la dinámica del sistema sin necesidad de resolver explícitamente las
ecuaciones de movimiento.
Para entender las regiones de exclusión hagamos un gráfico del potencial efec-
tivo en el caso de un problema general para el cual podemos escribir V (r ) = −µ/r n
(el potencial gravitacional es un caso particular de este con n = 1).
Primero debemos definir las rutina que nos da el potencial del problema

R
In [8]: def Vgrav(r,mu=1,n=1):
V=-mu/r**n

O
return V

Ahora podemos definir las rutinas que nos dan el potencial centrífugo y el po-
D
tencial efectivo:

In [9]: def Vcen(r,h,**pars):


Vcenval=h**2/(2*r**2)
A
return Vcenval

def Veff(r,h,V,**pars):
Veffval=V(r,**pars)+Vcen(r,h,**pars)
RR

return Veffval

Nótese que el potencial efectivo depende, no solo de los parámetros del poten-
cial, sino también del momentum angular. Es decir para cada momentum angular
hay un potencial efectivo espefício.
BO

Usando la figura interactiva abajo puede visualizar el efecto que tiene el mo-
mentum angular específico h sobre la forma del potencial efectivo

In [10]: def PotencialEfectivo(mu=1,h=1.0,n=1.0):


fig=plt.figure()
ax=fig.gca()

rmax=5
rs=np.linspace(1e-3,rmax,1000)

Vs=Vgrav(rs,mu=mu,n=n)
Vcens=Vcen(rs,h)
Veffs=Veff(rs,h,Vgrav,mu=mu,n=n)

ax.plot(rs,Vs,'g--',label='Potencial')
ax.plot(rs,Vcens,'b--',label='Potencial Centrífugo')
ax.plot(rs,Veffs)
258 Chapter 7. Aplicaciones del formalismo lagrangiano

ax.set_xlim((0,rmax))
ax.set_ylim((-3.5*np.abs(Veffs.min()),+2.5*np.abs(Veffs.min())))

ax.set_xlabel(r"$r$")
ax.set_ylabel(r"$V(r)$")

ax.set_title(r"$h$=%g, n=%g"%(h,n))
ax.legend()
ax.grid()

i=interact(PotencialEfectivo,mu=fixed(1),l=(0.2,2.0),n=(-1.0,2.0))

R
O
D
A
RR
BO

El potencial efectivo gravitacional tiene varias características:

1. Cerca al origen el potencial crece indefinidamente. Este crécimiento obedece


a la dependencia del potencial centrífugo Vcen ∼ 1/r2 .
2. Lejos del origen el potencial efectivo es negativo. Si n > 0, el potencial tiende
a cero. Esto es debido a la dependencia V ∼ 1/r n que para n < 2 es más
suave que la caida 1/r2 del potencial centrífugo.
3. El hecho de que el potencial gravitacional y el potencial centrífugo tengan
signos diferentes y caigan a ritmos diferentes, hace que el potencial efectivo
tenga un valor mínimo a una distancia finita r = ρ del origen.

Pero ¿cuáles son las regiones de exclusión? ¿qué significado tiene la distancia
ρ?
Supongamos ahora que la partícula, además de tener un momento angular es-
pecífico h tiene una energía específica e (ambas cantidades vienen determinadas
por la posición y velocidad inicial de la partícula).
7.4. El Problema general de los dos cuerpos 259

En este caso podemos afirmar que la partícula no podrá encontrarse en ningún


lugar en el cual se cumpla la condición:

e − Veff (rexclusion ) < 0


Independientemente de si sabemos cómo se mueve o no la partícula podemos
decir a qué distancias del origen no estará la partícula.
Los límites de la región de exclusión se pueden encontrar resolviendo la
ecuación:

e − Veff (r ) = 0
Que sería el equivalente aquí a las superficies de cero velocidad que definimos
en el problema de los 3 cuerpos.
En la figura abajo podemos reconocer varias situaciones, que son válidas al

R
menos si n < 2:

O
D
A
RR
BO

Figure 7.4: Distancias permitidas en un problema de fuerzas centrales determi-


nadas por el potencial efectivo

1. Si e > 0 la partícula puede acercarse al centro hasta una distancia mínimima,


pero puede alejarse de él a una distancia arbitraria. Esta situación es familiar,
en el caso del potencial gravitacional convencional, y se puede asimilar al
caso de órbitas abiertas (parabólicas e hiperbólicas). En el caso de potenciales
distintos al gravitacional clásico, el resultado sigue siendo válido.

2. Si e < 0 la partícula solo puede estar en un íntervalo de distancias y nunca


260 Chapter 7. Aplicaciones del formalismo lagrangiano

más cerca de un valor mínimo o más lejos de un valor máximo. Esta condi-
ción se asemeja al caso de una órbita elíptica.
3. Si e = Veff,0 , donde Veff,0 es el mínimo del potencial, la partícula solo puede
estar a una distancia fija r = ρ del centro. Esta condición equivale a decir que
la partícula sigue una trayectoria circular de radio ρ.
Aquí descubrimos que independientemente de la forma del potencial siempre
y cuando 0 < n < 2 siempre será posible encontrar una condición para la cuál la
partícula se mueve en una trayectoria circular. Este es un resultado muy general
que revela el poder del formalismo escalar en la descripción de problemas dinámi-
cos muy generales.

7.4.2 Ecuación de movimiento de la variable radial

R
Si ahora queremos encontrar de forma explícita la ecuación de movimiento del
sistema, debemos resolver las ecuaciones de movimiento. De un lado tenemos la

O
ecuación de movimiento angular, dada por la constancia del momentum angular
específico:

θ̇ = h/r2
D
y la ecuación para la variable radial que se obtiene de la ecuación de Euler-
Lagrange aplicada al Lagrangiano L2B,eq :
A
r̈ − r θ̇ 2 − f (r ) = 0
Donde f (r ) = −∂V/∂r es la fuerza específica.
RR

7.4.3 Simulación del problema de los dos cuerpos


Con todos los elementos anteriores a la mano podemos simular el problema de
los dos cuerpos usando las ecuaciones para r y para θ. Nuestra solución no va a
depender de qué forma específica asumamos para el potencial.
BO

Las ecuaciones de movimiento que debemos programar son:

r̈ = f (r ) + r θ̇ 2
θ̇ = h/r2
Que se convierten en primer orden en:

ṙ = vr
v̇r = f (r ) + h /r3
2

θ̇ = h/r2
Asumiendo que el poencial es del tipo V (r ) = −µ/r n , la fuerza queda:

f (r ) = −
r n +1
Para ello lo primero que debemos hacer es escribir la ecuación de movimiento
del sistema:
7.4. El Problema general de los dos cuerpos 261

In [11]: def Fcen(r,mu=1.0,n=1.0):


F=-n*mu/r**(n+1)
return F

def EoM_2B(y,t,F,h,params):
r=y[0]
vr=y[1]
q=y[2]

drdt=vr
dvrdt=F(r,**params)+h**2/r**3
dqdt=h/r**2

return [drdt,dvrdt,dqdt]

R
Definimos las condiciones iniciales del sistema:

In [12]: #Masa del sistema

O
mu=1

#Exponente del potencial


n=1.1

#Condiciones iniciales
D
r=1.0
A
q=0.0
rdot=0.0
qdot=1.2
RR

#Momentum angular específico


h=r**2*qdot

#Energía específica
eps=0.5*rdot**2+Vgrav(r,mu=mu,n=n)+Vcen(r,h)
BO

#Tiempos de integración
Nt=1000
ts=np.linspace(0.0,50.0,Nt)

Integramos:

In [13]: solucion=odeint(EoM_2B,[r,rdot,q],ts,args=(Fcen,h,dict(mu=mu,n=n)))
rs=solucion[:,0]
qs=solucion[:,2]

Grafiquemos la solución en el espacio coordenado

In [14]: fig=plt.figure(figsize=(4,4))
ax=fig.gca()
line,=ax.plot([],[])

def animacion(i,delta=Nt):
ini=i-delta
262 Chapter 7. Aplicaciones del formalismo lagrangiano

if ini<0:ini=0
line.set_data(rs[ini:i]*np.cos(qs[ini:i]),rs[ini:i]*np.sin(qs[ini:i]))
return line,

ax.set_xlabel("x")
ax.set_ylabel("y")

xlims=ax.set_xlim((-1.2*rs.max(),1.2*rs.max()))
ylims=ax.set_ylim((-1.2*rs.max(),1.2*rs.max()))
ax.grid()

animacion(Nt,delta=Nt)
a=animation.FuncAnimation(fig,animacion,frames=Nt,interval=Nt/300,blit=True)

R
O
D
A
RR
BO

En el espacio de configuración:

In [15]: fig=plt.figure(figsize=(4,4))
ax=fig.gca()
ax.plot(rs,np.mod(qs,2*np.pi),'b.',ms=1)

ax.set_xlabel(r"$r$")
ax.set_ylabel(r"$\theta$")

Out[15]: Text(0, 0.5, '$\\theta$')


7.4. El Problema general de los dos cuerpos 263

R
O
D
A
RR

Las variables generalizadas como función del tiempo:


BO

In [16]: fig,axs=plt.subplots(2,1)
axs[0].plot(ts,rs)
axs[1].plot(ts,np.mod(qs,2*np.pi))

axs[0].set_ylabel('r')
axs[1].set_ylabel(r'$\theta$')

Out[16]: Text(0, 0.5, '$\\theta$')


264 Chapter 7. Aplicaciones del formalismo lagrangiano

R
O
D
A
Grafiquemos el potencial efectivo:
RR
BO

In [17]: fig=plt.figure()
ax=fig.gca()

rmax=3*rs.max()
res=np.linspace(1e-3,rmax,1000)

Vs=Vgrav(res,mu=mu,n=n)
Veffs=Veff(res,h,Vgrav,mu=mu,n=n)

ax.plot(res,Veffs)
ax.axhline(eps,color='g')
ax.plot(rs,eps*np.ones_like(rs),'ro',ms=2)

ax.set_xlim((0,rmax))
ax.set_ylim((-1.1*np.abs(Veffs.min()),1.5*np.abs(Veffs.min())))

ax.set_title(r"$h$=%g, n=%g"%(h,n))
ax.grid()
7.4. El Problema general de los dos cuerpos 265

R
O
D
A
7.4.4 Ecuación de la forma orbital
Una solución clásica a este problema se obtiene con un cambio de la variable de-
pendiente:
RR

1
u=
r
y escribiendo las ecuaciones en términos no del tiempo sino de la variable an-
gular. En este caso el operador derivada temporal se convierte en:
BO

d dθ d h d
= = 2
dt dt dθ r dθ
De allí la velocidad generalizada es:

h dr
ṙ =
r2 dθ
du
= −h

Y la aceleración

d du d2 u
r̈ = −h = − h2 u2 2
dt dθ dθ
Reemplazando en la ecuación para la coordenada radial queda:

d2 u
 
1 1
+u = − 2 2 f
dθ 2 h u u
266 Chapter 7. Aplicaciones del formalismo lagrangiano

A esta ecuación se la llama ecuación de la forma orbital.

7.4.5 El problema de los dos cuerpos clásico: n=2


Si consideramos el caso de la fuerza gravitacional clásica para la cuál f (r ) =
−µ/r2 , la anterior ecuación queda:

d2 u µ
+u = 2
dθ 2 h
Una solución general para esta ecuación tiene la forma:

u = c(1 + e cos θ )
Donde c y e son constantes que deben determinarse.

R
Al reemplazar en la ecuación diferencial obtenemos c = µ/h2 de modo que la
solución general a la ecuación resulta ser:

O
h2 /µ
r=
1 + e cos θ
D
que es justamente la ecuación de una cónica, con p = h2 /µ, tal y como lo
habíamos predicho con el formalismo vectorial.
¿Qué es el parámetro e en este caso?
A
Podemos reemplazar la solución anterior en la ecuación de la energía, para lo
cual necesitamos primero demostrar, usando el momentum angular específico:
µ
RR

ṙ = − e sin θ
h
Reemplazando en la conservación de la energía queda:

1 h2
 
1 2
ṙ = e − V (r ) +
2 2 r2
BO

1 µ2 2 µ2 1 µ2
2
e sin2 θ = e + 2 (1 + e cos θ ) − (1 + e cos θ )2
2h h 2 h2
Que puede probarse conduce a:
s
2eh2
e= 1+
µ2

7.4.6 La ecuación de Kepler


La solución anterior solo muestra como depende la distancia al centro del ángulo θ,
pero no nos dice como resolver el problema en el tiempo. Una manera de obtener
esta solución es partir nuevamente de la ecuación de conservación de la energía:

1 h2
 
1 2
ṙ = e − V (r ) +
2 2 r2
7.4. El Problema general de los dos cuerpos 267

Esta ecuación diferencial es separable y puede escribirse en la forma:

dr
p = dt
e − V (r ) − h2 /(2r2 )
Si usamos la forma polar de la posición r = a(1 − e cos E), dr = − ae sin EdE,
con h2 /µ = a(1 − e2 )la ecuación anterior queda:

(1 − e cos E)dE = ndt


p
Donde n = µ/a3 , que se integra trivialmente para dar

( E − e sin E) = n(t − t0 )

R
7.4.7 El problema de los dos cuerpos con n arbitrario
Como vimos experimentando con la solución numérica al problema de los dos

O
cuerpos, si n no es 2 las órbitas resultantes tienen una estructura peculiar: no se
cierran sobre sí mismas. Aún así la variación de r y θ siguen siendo períodicas.
Un tipo de fuerza (potencial) de gran interés en la mecánica celeste (por razones
que veremos más adelante) es el siguiente:

f (r ) = −
D µ σ
− 4
r2 r
A
Con σ  µr2 para todos los valores de r relevantes para el sistema.
La ecuación de movimiento angular en términos de la variable u y θ es en este
caso:
RR

d2 u u2
 
1
2
+ u = − 2
f
dθ h u
d2 u µ σ
+u = + 2 u2
dθ 2 h2 h
BO

Si llamamos p = h2 /µ y q = σ/h2 , podemos adivinar para esta ecuación una


solución de la forma:
1
u(θ ) = (1 + e cos θ ) + g(θ )
p
Donde asumimos que para valores normales de θ, g(θ )  u(θ ).
Donde el propósito es encontrar la función g(θ ). Si reemplazamos esta solución
en la ecuación para diferencial para u y obtenemos:
2
d2 g

1
+ g = q ( 1 + e cos θ ) + g ( θ )
dt2 p
Si despreciamos la variación de g(θ ) en el lado derecho y desarrollamos el bi-
nomio obtenemos:

d2 g q
+ g ≈ 2 (2 + e2 + 4e cos θ + e2 cos 2θ )
dt2 2p
268 Chapter 7. Aplicaciones del formalismo lagrangiano

Si absorbemos el factor constante en la g como g0 = (2p2 /q) g y descom-


ponemos la función g0 (θ ) así:

g0 = g00 (θ ) + g10 (θ ) + g20 (θ )


De modo que satisfagan cada una por separado la ecuación diferencial arriba
obtenemos:

g00 = 2 + e2
g10 = eθ sin θ
1
g20 =− e2 cos 2θ
3
De ese modo la solución a la ecuación diferencial original se puede escribir en

R
la forma:

e2
   
1 q q qe
u(θ ) ≈ 1 + e cos θ + 1+ + eθ sin θ − cos 2θ

O
p p 2 p p6
La perturbación en u(θ ) con respecto a una cónica pura tiene 3 partes reconoci-
bles: D
1. Un término constante q/p(1 + e2 /2)
2. Un término que aumenta sistemáticamente a medida que el cuerpo orbita el
centro, qe/pθ sin θ. Llamamos a este un término secular.
A
3. Un término pequeño que oscila alrededor de cero −q/p(e/6) cos 2θ. Lla-
mamos a este el término oscilatorio.
RR

Una gráfica de u(θ ) para la solución cónica y para la solución con el potencial
modificado se puede construir así. Primero calculemos cada uno de los términos
de la función:

In [18]: q=0.1
p=1.0
BO

e=0.2

qmin=0.0
qmax=3*np.pi
qs=np.linspace(qmin,qmax,1000)
u_conica=(1/p)*(1+e*np.cos(qs))
u_const=(q/p**2)*(1+e**2/2)
u_secul=(q/p**2)*e*qs*np.sin(qs)
u_oscil=-(q/p**2)*(e/6)*np.cos(2*qs)
u=u_conica+u_const+u_secul+u_oscil

Un gráfico de la cónica se ve así:

In [19]: fig=plt.figure()
ax=fig.gca()

ax.plot(qs,u_conica,'k--')
ax.axhline(u_conica.max(),color='r',label='Periastro')
7.4. El Problema general de los dos cuerpos 269

ax.axhline(u_conica.min(),color='b',label='Apoastro')

ax.grid()
ax.set_xlim((qmin,qmax))
ax.legend()

Out[19]: <matplotlib.legend.Legend at 0x1240ba198>

R
O
D
A
RR
BO

La sucesión de picos corresponden naturalmente a la llegada al perihelio y el


afelio del cuerpo. La perturbación por efecto de los términos constante y oscilato-
rio se ve así:

In [20]: fig=plt.figure()
ax=fig.gca()

ax.plot(qs,u_conica,'k--')
ax.plot(qs,u_conica+u_const,'b-')
ax.plot(qs,u_conica+u_const+10*u_oscil,'g-')

ax.grid()
ax.set_xlim((qmin,qmax))

Out[20]: (0.0, 9.42477796076938)


270 Chapter 7. Aplicaciones del formalismo lagrangiano

R
O
D
A
En este gráfico se ha amplificado por un factor de 10 el término oscilatorio
para que se vea en la gráfica. Como se nota, estos dos términos no modifican
RR

considerablemente el movimiento de los cuerpos, excepto porque las distancias


mínima y máxima se modifican un poco.
Si agregamos ahora el término secular obtenemos:
BO

In [21]: fig=plt.figure()
ax=fig.gca()

ax.plot(qs,u_conica+u_const+u_oscil,'g--',label='Cónica+Constante+Oscilatorio')
ax.plot(qs,u,'k-',label='Cónica+Constante+Oscilatorio+Secular')

ax.axvline(2*np.pi,color='g',ls='--')
ax.axvline(2*np.pi*(1+q/p),color='k')

ax.legend()
ax.grid()
ax.set_xlim((qmin,qmax))

Out[21]: (0.0, 9.42477796076938)


7.4. El Problema general de los dos cuerpos 271

R
O
D
Con el término secular notamos que el ángulo de llegada al afelio ya no es 2π
(línea verde vertical), como es en la órbita no perturbada, sino que es 2π + ∆θ p ,
A
con ∆θ p un desfase angular cuyo valor queremos estimar.
Usando lo aprendido en estas gráficas podemos aproximar el movimiento del
sistema bajo el potencial propuesto ofiginalmente con una función de la forma:
RR

 
0 1 qe
u (θ ) ≈ 0 1 + e cos θ + θ sin θ
p p
Donde p0 es un semilatus rectum efectivo (debido al cambio en la distancia al
periapsis y al apoapsis de la órbita por efecto del término constante). El segundo
BO

término del lado derecho lo podemos escribir en la forma:


q
cos θ + θ sin θ ≈ cos(θ − qθ/p)
p
Donde hemos utilizado el hecho que dado que q/p  1, entonces sin(qθ/p) ≈
q/p y cos(qθ/p) ≈ 1
De allí entonces la solución para el movimiento del cuerpo se puede escribir en
la forma:
1
u0 (θ ) ≈ [1 + e cos(θ − qθ/p)]
p0
Que es la ecuación de una cónica con un desplazamiento proporcional al án-
gulo recorrido.
Esta función alcanza el perihelio (después de pasar por el cuando se cumple:

qθ p
θp − = 2π
p
272 Chapter 7. Aplicaciones del formalismo lagrangiano

es decir cuando θ p = 2π/(1 − q/p) ≈ 2π (1 + q/p). Esto es, cuando la órbita a


completado una vuelta el avance angular del perihelio es del orden de:

2πq
∆θ p ≈
p

7.5 El problema de los dos cuerpos postnewtoniano


Los resultados obtenidos hasta ahora son muy interesantes pero tienen una lim-
itación. Se aplican únicamente para problemas en los que se desprecian los efectos
de la relatividad general.
Resolver la pregunta de cómo es el movimiento orbital en el contexto de la rel-
atividad general, es responder a la pregunta de ¿cómo es la órbita de una partícula

R
en la métrica de Schwarzschild?.
En una sección anterior habíamos explicado que la propiedad más importante
que se debe conocer en relatividad general es la métrica (distancia infinitesimal) en

O
la región del espacio en el que ocurre dicho movimiento. Para el caso del espacio-
tiempo en el exterior de un cuerpo esférico isotrópico, la métrica esta dada por la
métrica de Schwarzschild: D
ds2 = gtt (cdt)2 − ∑ gij2 dxi dx j
i
A
    −1
2V 2V
ds2 = 1+ (cdt)2 − 1 + dr2 − r2 (dφ2 + cos2 φdθ 2 )
c2 c2
RR

Donde V = −µ/r, el intervalo se puede escribir ds = cdτ con τ el denomi-


nado tiempo propio (tiempo marcado por un reloj que haya estado entre los dos
eventos). Como habíamos visto antes, la cantidad V/c2 , para sistemas de cuerpos
comunes, es extremadamente pequeña, razón por la cuál las peculiaridades de la
estructura no trivial del espacio tiempo no había sido evidente.
Los coeficientes métricos gµν : ( gtt , gij ) son fundamentales en nuestro proceso.
BO

El movimiento de una partícula en una métrica como esta, se obtiene en rela-


tividad general usando un principio variacional similar al principio de Hamilton.
En particular se asume que de todas las trayectorias, x 0µ (τ ) la verdadera es aquella
para la cual el intervalo espacio temporal entre los estados extremos son:
Z
δ dτ = 0

Al aplicar los métodos del cálculo variacional se obtiene las que son las equiv-
alentes de las ecuaciones de Euler-Lagrange en el espacio-tiempo:

d2 x µ α
µ dx dx
β

dτ 2
+ ∑ Γ αβ dτ dτ = 0

A esta ecuación se la llama la ecuación de la geodésica.


Donde Γαβ son conocidos como los símbolos de Christoffel (o conexión afin) y son
µ

funciones relativamente sencillas de calcular de los coeficientes métricos:


7.5. El problema de los dos cuerpos postnewtoniano 273

 
∂gνα ∂gνβ ∂gαβ
Γαβ = ∑ 1 µν
µ
2g + α

ν ∂x β ∂x ∂x ν
Como sucede en la mecánica Lagrangiana, la descripción del movimiento de
las partículas no requiere necesariamente la solución explícita a las ecuaciones
geodésicas. Más útil es encontrar las constantes de movimiento o cuadraturas del
sistema usando procedimientos análogos a los utilizados en el formalismo escalar.

7.5.1 La métrica como la primera cuadratura


Es interesante anotar en este punto que el número de grados de libertad que tiene el
movimiento de una partícula en una métrica de Schwarzschild no es 3 xi : ( x, y, z)
con variable independiente t, sino que es 4, xµ : ( x, y, z, t) con variable indepen-

R
diente τ. En este sentido las velocidades las denotaremos como es usual como
ẋµ = dx µ /dτ, donde no debemos olvidar que el punto ahora hace referencia a la
derivada con respecto al tiempo propio.

O
La velocidad generalizada más interesante aquí es ṫ, que parece una contradic-
ción. Pero no lo es, debemos recordar que el flujo del tiempo coordenado (medido
por un observador remoto) no es el mismo que el flujo de tiempo propio τ, medido
D
por un observador en movimiento a través de la geodésica.
Si dividimos a ambos lados de la métrica por dτ obtenemos:
 −1
A
  
2 2V 2 2 2V
c = 1+ 2 c ṫ − 1 + 2 ṙ2 − r2 (φ̇2 + cos2 φθ̇ 2 )
c c
Como vemos esta es claramente una cuadratura del problema en tanto es-
RR

tablece una relación entre las variables y sus velocidades.

7.5.2 Conservación del momentum angular


La simetría esférica de la métrica de Schwarzschild implica la conservación del
BO

momentum angular total de la partícula. Esto implica que también en este caso
existe un plano análogo al plano invariante de Laplace que es perpendicular al
vector momentum angular total.
Si nos situamos sobre este plano, entonces φ = 0, φ̇ = 0 y el momentum angular
específico es:

H = r2 θ̇
Es importante distinguir aquí entre el momentum angular específico relativis-
tico H y el clásico h. La diferencia estriba en el hecho que H es calculado respecto
al tiempo propio y no respecto al tiempo coordenado.

7.5.3 Conservación de la energía


Si recordamos de nuestra motivación histórica del teorema de Noether, el
propósito era resolver el problema de la conservación de la energía en el contexto
del espacio-tiempo curvo.
274 Chapter 7. Aplicaciones del formalismo lagrangiano

La métrica de Schwarzschild es independiente del tiempo y no hay en ella


ninguna dependencia de las velocidades. Estos implica que existe una cantidad
análoga a la función de Jacobi (que puede interpretarse como la Energía) que se
conserva durante el movimiento de la partícula a lo largo de la geodésica:
Si bien no es el propósito mostrar aquí todos los detalles de la mecánica rela-
tivista, puede probarse en relatividad que en espacio-tiempo curvo esta cantidad
(que se conserva) es:
 
2V
E = 1 + 2 c2 ṫ
c
Para una partícula de masa m la energía total es E = mE . Recordemos aquí que
el potencial V = V (r ) es función de la coordenada radial a lo largo de la trayectoria
de la partícula.

R
Esta, también es una cuadratura en el problema.

7.5.4 Ecuación del movimiento radial y potencial efectivo

O
Si reemplazamos las dos ecuaciones de movimiento H y E en la primera
cuadratura obtenemos: D
 −1
E∈ 2V −1 2 H 2
  
2V
c2 = 1+ − 1+ 2 ṙ − 2
c2 c2 c r
A
Despejando ṙ2 /2, en analogía con el caso clásico obtenemos:
"  # 
E 2 H2
 
1 2 1 2 2V
ṙ = c − 1 − V + 1 +
RR

2 2 c2 2r2 c2

Que es una ecuación muy sugestiva de la ecuación de conservación de la en-


ergía en el caso clásico:

1 2
ṙ = eg − Vg,e f f
BO

2
Donde los subíndices g hacen referencia al hecho que esta expresión es también
válida en relatividad general. En este caso la energúa específica generalizada será:
"  #
1 2 E 2
eg ≡ c −1
2 c2

Y el potencial efectivo general:

H2
 
2V
Vg,e f f (r ) ≡ V (r ) + 2 1+ 2
2r c
Desarrollando este último término nos da:

H 2 V (r ) H2
Vg,e f f (r ) ≡ V (r ) +
2 2
+ 2
c r 2r
Que poniéndolo en términos de µ = GM y r queda:
7.5. El problema de los dos cuerpos postnewtoniano 275

µ µH 2 H2
Vg,e f f (r ) = − − 2 3 + 2
r c r 2r

µ σ H2
Vg,e f f (r ) = − − 3+ 2
r 3r 2r
Con σ = 3µH 2 /c2 .

7.5.5 Ecuación de la forma orbital en la métrica de


Schwarzschild
Si partimos de la euación para ṙ y hacemos la sustitución:

R
dr dθ dr
=
dτ dτ dθ
dr H dr

O
ṙ = θ̇ = 2
dθ r dθ
Obtenemos:

H2
r4

dr

2
DH2
= 2e − 2V − 2
r

2V
1+ 2
c


Con el cambio de variable, u = 1/r queda:


A
 2  
du 2e 2µ 2 2µu
= + u − u 1 −
dθ H2 H2 c2
RR

Derivando toda la ecuación respecto a θ y dividiendo por du/dθ queda:

d2 u µ 3µ
+ u = 2 + 2 u2
dθ H c
BO

Que sería el equivalente a la ecuación de la forma orbital en relatividad general.

7.5.6 Equivalente clásico al movimiento órbital en relatividad


general
De manera muy interesante (pero también predecible), todas las ecuaciones
obtenidas hasta ahora muestran que es posible describir el movimiento de un
cuerpo en una métrica de Schwarzschild como si fuera el movimiento clásico de
una partícula muy ligera sometida a un potencial gravitacional del tipo:
µ σ
Vg (r ) = −
− 3
r 3r
O equivalentemente a una fuerza específica del tipo:
µ σ
f g (r ) = − − 4
r2 r
Con σ = 3µH 2 /c2 .
276 Chapter 7. Aplicaciones del formalismo lagrangiano

Ya habíamos mostrado antes que esta forma del potencial conduce a una
ecuación para ṙ2 idéntica a la del problema de fuerzas centrales clásica.
Si tomamos ahora la ecuación de la forma orbital clásica:

d2 u
 
1 1
2
+u = − 2 2 f
dθ h u u
Y reemplazamos f g obtenemos:

d2 u µ σ
+ u = 2 + 2 u2
dθ 2 H H
Que coincide exactamente con la ecuación de la forma orbital deducida en rel-
atividad general.
Así que todo lo que hemos dicho para el problema de fuerzas centrales en el for-

R
malismo clásico aplica también en el caso de la relatividad general, al menos para
describir el movimiento de partículas de prueba en la métrica de Schwarzschild.

O
7.5.7 Regiones de exclusión
Podemos comparar las regiones de exclusión clásica y relativística:

In [23]: def Vgrav(r,mu=1):


D
V=-mu/r
return V
A
def Vg(r,mu=1,sigma=0.15):
V=-mu/r-sigma/(3*r**3)
return V
RR

def Veff(r,H,V,**pars):
Veffval=V(r,**pars)+H**2/(2*r**2)
return Veffval

#Valores arbitrarios
BO

mu=1.0
H=1.0
sigma=0.15

#Gráfico
fig=plt.figure()
ax=fig.gca()

rmax=3
rs=np.linspace(1e-3,rmax,1000)
Veffs=Veff(rs,H,Vgrav,mu=mu)
Veffgs=Veff(rs,H,Vg,mu=mu,sigma=sigma)

ax.plot(rs,Veffs,label="Clásico")
ax.plot(rs,Veffgs,label="Relativistico")

ax.set_xlim((0,rmax))
ax.set_ylim((-1.5*np.abs(Veffgs.max()),+1.5*np.abs(Veffgs.max())))
7.5. El problema de los dos cuerpos postnewtoniano 277

ax.set_xlabel(r"$r$")
ax.set_ylabel(r"$V(r)$")

ax.set_title(r"$H$=%g, $\sigma$=%g"%(H,sigma))
ax.legend()
ax.grid()

R
O
D
A
RR

Como vemos existe una región del espacio en la que hay orbitas acotadas e
incluso una órbita circular estable. La distancia mínima a la que pueden llegar las
partículas es menor como lo habíamos mostrado en el análisis del movimiento bajo
BO

esta potencial en la sección anterior.


Interesantemente, sin embargo, cuando la energía un cierto valor la partícula
puede pasar por el centro de atracción, algo que no pasaba en el potencial clásico.

7.5.8 Avance del perihelio de Mercurio


Si usamos el resultado obtenido en la sección anterior para el avance del perihelio
obtenemos:
q
∆θ p ≈ 2π
p
Recordemos que q = σ/H 2 = 3µ/c2 y p = h2 /µ, de modo que el avance
predicho por la relatividad general sería:

6πµ2
∆θ p ≈
c2 h2
278 Chapter 7. Aplicaciones del formalismo lagrangiano

Escrita en términos de los elementos orbitales no perturvados a, e y teniendo


en cuenta que p = a(1 − e2 ) = h2 /µ podemos reemplazar h2 = a(1 − e2 )µ para
obtener

6πµ
∆θ p ≈
c2 a (1 − e2 )

Desde tiempos históricos se ha observado que el perihelio de Mercurio avanza


a un ritmo medio de 43.11 ± 0.45 arcsec/siglo. Teniendo en cuenta que el período
orbital promedio de Mercurio es 2.40846 × 10−3 siglos, el avance observado por
orbita es:

∆θ obs
p = 0.1038 ± 0.0010 arcsec

R
Si usamos el valor predicho por la relatividad general obtenemos:

In [24]: #Constantes

O
AU=1.496e11
year=365.25*86400
G=6.67e-11
M=1.98e30
mu=G*M
c=spy.clight()*1e3
D
A
#Tierra
#Avance observado (Marion Tabla 8-2): 5.0+/-1.2 arcsec/siglo
a=1.0*AU
e=0.016
RR

#Venus
#Avance observado (Marion Tabla 8-2): 8.4+/-4.8 arcsec/siglo
a=0.723332*AU
e=0.006772
BO

#Mercurio
#Avance observado (Marion Tabla 8-2): 43.11+/-0.45 arcsec/siglo
a=0.387098*AU
e=0.205630

#Orbital mean motion


n=np.sqrt(mu/a**3)

#Periodo
P=2*np.pi/n

#Avance por período


Deltaq=6*np.pi*mu/(c**2*a*(1-e**2))*RADIAN*3600

#Avance por siglo


Avance=Deltaq/P*100*year

print("Avance por órbita: %.4f arcsec"%Deltaq)


7.5. El problema de los dos cuerpos postnewtoniano 279

print("Avance por siglo: %.3f arcsec/siglo"%Avance)


print("Diferencia en distancia por órbita: %.4f km"%(Deltaq/3600*GRADOS*a*(1-e)/1e3

Avance por órbita: 0.1030 arcsec


Avance por siglo: 42.666 arcsec/siglo
Diferencia en distancia por órbita: 22.9740 km

Es interesante notar como el avance del perihelio medido en distancia, es decir


la distancia lineal que hay desde la posición del planeta en el último perihelio con
la posición en el perihelio constante y que se puede estimar como:
6πµ
r p ≈ a(1 − e)∆θ p ≈
c2 (1 + e )

R
Es independiente del tamaño de la órbita y solo depende de la masa del cuerpo
central. En el caso del Sol la constante 6πµ/c2 es 27.7 km y es la misma para
cualquier objeto. Es mucho más fácil recordar este hecho que la fórmula completa

O
del avance del perihelio.

7.5.9 Simulación del movimiento de una partícula alrededor de


D
un agujero negro
Con todos los elementos acumulados hasta ahora podemos pensar en simular el
movimiento de una partícula en la métrica de Schwarzschild.
A
Como sabemos la métrica de Schwarzschild es diferente de la métrica de
Minkowski que describe el espacio-tiempo plano en el que se desarrolla la
mecánica clásica, para valores de 2|V |/c2 ∼ 1. Esta condición nos permite in-
RR

troducir una escala de distancia natural en el problema:

2GM
=1
Rc2
2GM 2µ
R≡ = 2
BO

c2 c
Llamamos a esta escala de distancia el radio de Schwarzschild. Si lo escribimos
en términos de la masa del Sol queda:
 
M
R = 2.938 km
M
El término 2V/c2 = R/r define ahora la magnitud de la diferencia entre la
métrica de Schwarzschild y la métrica de Minkowski. Como vemos en el caso de
cuerpos astronómicos típicos R  r (donde r es una distancia típica por fuera
del cuerpo). Esto implica que lo que hemos visto hasta ahora se notará de forma
particularmente intensa cuando el radio del planeta sea comparable o menor que
R.
En particular un cuerpo con un tamaño igual o menor que R se conoce en física
y astronomía como un agujero negro.
Como demostramos antes las ecuaciones de movimiento de una partícula se
pueden escribir usando la teoría clásica del problema de fuerzas centrales:
280 Chapter 7. Aplicaciones del formalismo lagrangiano

H
θ̇ =
r2

r̈ − r2 θ̇ = f (r )
Donde la fuerza es ahora la fuerza general es f g = −µ/r2 − σ/r4 , con σ =
3µH 2 /c2 = 3R/(2c2 ). La única salvedad que debemos tener en cuenta es que la
variable independiente ahora es el tiempo propio τ y no el tiempo coordenado.
Como las medidas se hacen normalmente en el tiempo coordenado es necesario
escribir además de las anteriores, una ecuación diferencial para el tiempo propio.
Esta la podemos obtener directamente de la métrica:
s
R −1 r2 θ̇
   

ṫ = 1− 1+ 2 + 2

R
r c c
Donde tomamos la raíz positiva en tanto solo nos interesan los instantes futuros
en el movimiento del cuerpo.

O
Si usamos el siguiente conjunto de unidades:

UM = M
UL =
G=
D R
1
A
p
= = 3
Entonces en estas unidadesp µ 1 y U T √ R /( GM). √La unidad de veloci-
dad es UV = UL /UT = R/ R /√ 3 ( GM) = GM/R = c/ 2. Es decir en estas
unidades, la velocidad de la luz es 2.
RR

Por otro √lado las unidades de momentum angular específico son UH =


UL UV = Rc/ 2
En estas unidades las ecuaciones de movimiento se pueden escribir como:
H
θ̇ =
r2
BO

1 3
r̈ = r2 θ̇ − 2 − 4
q r r

ṫ = 1 + 2ṙ + 2r2 θ̇ / (1 − 1/r )

In [25]: # Potenciales
def U(r,params):
mu=params["mu"]
h=params["h"]
Rs=params["Rs"]
Upot=-mu/r-Rs*h**2/2*mu/r**3
return Upot

def Ueff(r,params):
h=params["h"]
Upot=U(r,params)+h**2/(2*r**2)
return Upot
7.5. El problema de los dos cuerpos postnewtoniano 281

# Ecuaciones diferenciales para el sistema de 2-cuerpos relativistico


def eom(y,T,params):
mu=params["mu"]
h=params["h"]
E=params["E"]
Rs=params["Rs"]
c=params["c"]

r=y[0]
vr=y[1]
q=y[2]
t=y[3]

f=(1-Rs/r)

R
drdT=vr
dvrdT=-mu/r**2-3./4*Rs*h**2*mu/r**4+h**2/r**3
dqdT=h/r**2

O
# Fuente: http://bit.ly/1VIbNSa
dtdT=np.sqrt((1/f)*(1+(drdT/c)**2)/f**2+(r*dqdT/c)**2/f)

return [drdT,dvrdT,dqdT,dtdT]

In [26]: # Constants
D
mu=1
Rs=1
A
# Position
t=0
RR

r=2
q=0

# Initial Velocity
drdT=0.0
dqdT=0.48
BO

vx=drdT*np.cos(q)-r*np.sin(q)*dqdT
vy=drdT*np.sin(q)+r*np.cos(q)*dqdT

print("v = ",vx,vy)

# Constantes
h=r**2*dqdT

# Parametros
params=dict(mu=mu,Rs=Rs,h=h)

# Total energy
E=0.5*(drdT**2+r**2*dqdT**2)+U(r,params)
params["E"]=E

print("h = ",h)
print("E = ",E)
282 Chapter 7. Aplicaciones del formalismo lagrangiano

v = 0.0 0.96
h = 1.92
E = -0.26959999999999995

In [27]: # Unidades
c=spy.clight()*1e3
GCONST = 6.67E-11 # m^3 / (kg s^2)
UM = 1.98e30 # kg
UL = 2*GCONST*UM/c**2 # metros
UT = np.sqrt(UL**3/(UM*GCONST))

print("UT = ",UT)

# Velocidad de la luz en unidades del sistema

R
c = c*UT/UL
print("c = ",c)
params["c"]=c

O
UT = 1.3863532628540203e-05
c = 1.4142135623730951 D
In [28]: # Nt=1000
Nt=1000
A
Ts=np.linspace(0,100,Nt)

ys=[r,drdT,q,t]
solucion=odeint(eom,ys,Ts,args=(params,))
RR

rs=solucion[:,0]
vrs=solucion[:,1]
qs=solucion[:,2]
ts=solucion[:,3]
BO

In [29]: fig=plt.figure(figsize=(10,6))

axr=plt.subplot(1,3,1)
axq=plt.subplot(1,3,2)
axt=plt.subplot(1,3,3)

axr.plot(Ts,rs)
axq.plot(Ts,qs)
axt.plot(Ts,ts)

for ax in axr,axq,axt:
ax.set_xlabel("Proper time")

axr.set_ylabel("r")
axq.set_ylabel(r"$\theta$")
axt.set_ylabel("Coordinate time")

fig.tight_layout()
7.5. El problema de los dos cuerpos postnewtoniano 283

R
O
D
A
RR

In [30]: fig = plt.figure(figsize=(6,6))


BO

ax=fig.gca()

tetas=np.linspace(0,2*np.pi,1000)
ax.plot(Rs*np.cos(tetas),Rs*np.sin(tetas))
ax.plot(rs*np.cos(qs),rs*np.sin(qs))

ext=5
ax.set_xlim(-ext,ext)
ax.set_ylim(-ext,ext)

Out[30]: (-5, 5)
284 Chapter 7. Aplicaciones del formalismo lagrangiano

R
O
D
A
RR
BO
Chapter 8

El formalismo
hamiltoniano

R
O
Como hemos visto el formalismo Lagrangiano ofrece ventajas teóricas impresio-
nantes sobre el formalismo vectorial de la mecánica. Sin embargo, en términos
prácticos, tiene todavía una serie de inconvenientes:
D
Así por ejemplo las ecuaciones de movimiento de los sistemas estudiados son
ecuaciones diferenciales de segundo orden, no trivialmente acopladas y en muchas
ocasiones difíciles de resolver. A continuación ofrecemos un ejemplo de cómo el
formalismo lagrangiano puede conducir a callejones matemáticos y numéricos.
A
RR
BO

8.1 Motivación
8.1.1 Motivación 1: el problema de las ecuaciones de
movimiento

Consideremos por ejemplo un problema relativamente elemental (ver figura). Una


partícula (partícula 1) de masa m rueda sobre una esfera (partícula 2) de masa M y
radio R que se puede además deslizar en la dirección de x.

285
286 Chapter 8. El formalismo hamiltoniano

R
O
D
Figure 8.1: Sistema mecánico simple
A
El sistema tiene 2 grados de libertad y por lo tanto, dos variables generalizadas:
RR

θ y x. En términos de estas cantidades las coordenadas cartesianas de la partícula


se pueden escribir como:

x1 = x − R sin θ
y1 = R cos θ
BO

Usando esta transformación es posible mostrar que el Lagrangiano del sistema


es

1 1
L= M ẋ2 + m( ẋ2 + R2 θ̇ 2 − 2R ẋ θ̇ cos θ ) − mgR cos θ
2 2
De allí es posible también deducir las ecuaciones de movimiento, que resultan
ser:

( M + m) ẍ − mR cos θ θ̈ + mR sin θ θ̇ = 0
r θ̈ − ẍ cos θ − g sin θ = 0
¿Cuál es la solución a este sistema de ecuaciones?. Ciertamente la simplicidad
mecánica del sistema original no se compara con la complejidad matemática de las
ecuaciones de movimiento resultantes.
Podría uno pensar que siempre es posible apelar a una solución numérica. Para
esto último, sin embargo y como hemos mostrado a través de estas notas, es nece-
sario linearizar las ecuaciones de movimiento. La receta normal para hacerlo es
8.1. Motivación 287

hacer cambios de variable del tipo v x = ẋ, vθ = θ̇. Sin embargo esta sencilla
linearización no conduce, como se puede verificar fácilmente, a un conjunto de
ecuaciones que puedan programarse fácilmente.
La búsqueda de simetrías y cuadraturas no parece tampoco sencilla. No hay
variables cíclicas, ni simetría traslacional o rotacional. A lo sumo podemos asegu-
rar que la energía se conserva, de la que podríamos deducir al menos una integral
de movimiento, relacionando θ̇ con ẋ.
En síntesis, incluso un sistema mecánico tan sencillo y en nuestro poderoso
formalismo lagrangiano, parece lejos de resolverse.

8.1.2 Motivación 2: el problema de la “degeneración” del


espacio de configuración
Hay otro inconveniente del formalismo Lagrangiano que también existe en el for-

R
malismo vectorial.
En ambos el movimiento del sistema se representa en un espacio geométrico,

O
el espacio de configuración en el caso del formalismo Lagrangiano y el espacio
coordenado en el formalismo vectorial, que tiene un defecto.
En ambos espacios un punto representa la configuración de un sistema. Sin
embargo, dado el conocimiento de las fuerzas que actúan sobre el sistema o equiv-
D
alentemente el Lagrangiano, no es posible saber a priori cuál será la trayectoria
que seguirá la partícula (ver figura).
A
RR
BO

Figure 8.2: Degeneración en el espacio de configuración

Decimos que existe una degeneración en el movimiento, en tanto la configu-


ración del sistema no determina su dinámica (a una configuración le pueden corre-
sponder muchas trayectorias).
Para saber por cuál trayectoria se mueve la partícula es necesario además de
indicar el punto en el espacio de configuración, indicar la velocidad generalizada
de la partícula. En otros términos, además de las fuerzas o el lagrangiano y el espa-
cio de configuración, es necesario proveer información adicional (las velocidades)
para resolver el problema.
Es interesante anotar que la razón por la cuál los sistemas dinámicos en el for-
malismo vectorial y en el formalismo Lagrangiano, tienen esta característica, reside
288 Chapter 8. El formalismo hamiltoniano

justamente en el hecho de que en ambos casos el movimiento en el espacio de con-


figuración es descrito por ecuaciones diferenciales de segundo orden. Sabemos
que para resolver este tipo de ecuaciones es necesario específicar no solamente la
“posición” inicial sino también la “velocidad” incial. Este es el origen de la degen-
eración del espacio de configuración.
Existen soluciones ingeniosas a este problema. Consideremos por ejemplo el
caso de un cuerpo unido a un resorte (un grado de libertad). Tanto en el formal-
ismo vectorial como en el formalismo lagrangiano la ecuación de movimiento del
cuerpo es muy simple:

ẍ + ω 2 x = 0
Como explicamos antes el grado de esta ecuación es responsable que una vez
sabida la posición no podamos solo con la fuerza saber hacia dónde se mueve la

R
partícula.
Haciendo un cambio de variables y llamando v x = ẋ, la ecuación de segundo
orden anterior, se convierte en un sistema de ecuaciones de primer orden:

O
ẋ = vx
v̇ x = −ω 2 x
D
Si ahora en lugar de usar el espacio de configuración, introducimos un espa-
cio geométrico nuevo, bidimensional, cuyas coordenadas son x y v x (lo podemos
llamar el espacio configuración-velocidad), la dinámica se hace más sencilla (ver
A
figura).
RR
BO

Figure 8.3: Construcción del espacio configuración-velocidad en el que la dinámica


se puede describir geométricamente de forma muy simple.

Nótese que en este espacio por cada punto pasa una y solo una trayectoria.
Esto porque la variación instantánea de las coordenadas depende solo de las coor-
denadas mismas (y posiblemente del tiempo).
¿Podrá esta construcción geométrica que hicimos en el caso de un oscilador
armónico generalizarse para cualquier sistema dinámico? ¿será posible construir
un espacio generalizado que combien configuración y velocidades generalizadas
en el que la dinámica no este degenerada?.
Esta es justamente la idea del formalismo Hamiltoniano de la mecánica que
introduciremos en esta sección.
8.2. Las ecuaciones canónicas de Hamilton 289

8.2 Las ecuaciones canónicas de Hamilton


Como vimos en la motivación, el reto en última instancia es el de “linearizar” las
ecuaciones de movimiento.
Las ecuaciones de Euler-Lagrange:
( ! )
d ∂L ∂L
− =0
dt ∂q̇ j ∂q j
M
Son ecuaciones de segundo orden. ¿Cómo encontramos un conjunto de ecua-
ciones de primer orden equivalentes?.
Una primera idea, bastante trivial, surge de utilizar los métodos usados en la
linearización de ecuaciones diferenciales ordinarias de segundo orden, a saber re-
alizar un sencillo cambio de variables:

R
∂L
pj ≡
∂q̇ j

O
Si de esta identidad podemos invertir las coordenadas y velocidades general-
izadas para escribir funciones del tipo:
D
q̇ j = q̇ j ({qk }, { pk })
De modo que el Lagrangiano se puede escribir también como función de q j y
pj:
A
Lqp ({q j }, { p j }) = L({q j }, q̇ j ({qk }, { pk }), t)
RR

Nótese que hemos cambiado el nombre del Lagrangiano L que depende natu-
ralmente de q y q̇, a Lqp para representar el lagrangiano que depende del nuevo
conjunto de variables. Estos dos largangianos son matemáticamente completa-
mente diferentes y no deben confundirse.
Haciendo esta reemplazo las ecuaciones de Euler Lagrange se hacen lineales en
pj:
BO

( )
∂Lqp
ṗ j =
∂q j
M
Para ilustrar este aparentemente confuso cambio de variables, consideremos
nuevamente el oscilador armónico simple. El Lagrangiano del sistema es:

1 2 1 2
L( x, ẋ ) = m ẋ − kx
2 2
La nueva variable es:

∂L
px = = m ẋ
∂ ẋ
El Lagrangiano modificado será:

1 2 1 2
L xp = p − kx
2m x 2
290 Chapter 8. El formalismo hamiltoniano

Y las ecuaciones linearizadas se podrán escribir ahora de la forma:

∂L xp
ṗ x == −kx
∂x
Hasta aquí todo muy bien. Excepto porque M ecuaciones de segundo orden
(las ecuaciones de Lagrange) no pueden ser equivalentes a M ecuaciones de primer
orden (las ecuaciones para las nuevas variables { p j }). La razón es simple. Además
de la ecuación diferencial para p j nos hace falta la ecuación diferencial para q j .
Cuando linearizamos ecuaciones ordinarias, la definición misma de la variable
auxiliar, ej. v x = ẋ en el caso del oscilador armónico simple, era en si misma una
ecuación del sistema. No es el caso ahora con p j = ∂L/∂q̇ j .
Podríamos especular en que por “simetría” la ecuación diferencial para q j ten-
dría una forma similar a la de p j , algo de la forma:

R
( )
∂Lqp
q̇ j = ?
∂p j
M

O
Lamentablemente el mundo es más complicado. Para demostrar que la
ecuación anterior no es válida, calculemos ∂Lqp /∂p j :

∂Lqp
∂p j
= ∑ ∂q̇k ∂pkj
k
D
∂L ∂q̇
= ∑ pk
k
∂q̇k
∂p j
Nótese que en esta última expresión q̇ j es la función q̇ j ({qk }, { pk }), no la vari-
A
able.
Sin embargo, en nuestra búsqueda aparece una interesante relación. La expre-
sión anterior se puede escribir también en la forma:
RR

∂Lqp ∂
∂p j
= ∑ ∂p j ( pk q̇k ) − q̇ j
k
Despejando q̇ j obtenemos:
BO

∂ ∂Lqp
q̇ j = ∑ ∂p j ( pk q̇k ) − ∂p j
k
De entrada vemos que la ecuación propuesta anteriormente, no es la ecuación
correcta, primero porque tiene un término adicional, ∑k ∂( pk q̇k )/∂p j y segundo
porque la derivada del Lagrangiano tiene un signo negativo. Sin embargo, si jun-
tamos los términos anteriores obtenemos una ecuación nueva e inesperada:
( )
∂H
q̇ j =
∂p j
M
En la que hemos introducido una nueva función:

H ({q j }, { p j }, t) ≡ ∑ pk q̇k ({ql }, { pl }, t) − Lqp ({ql }, { pl }, t)


k
A esta nueva función la llamamos el Hamiltoniano, dado que juega un papel
central en esta forma linearizada del formalismo escalar.
8.2. Las ecuaciones canónicas de Hamilton 291

Nótese la similaridad del Hamiltoniano con la función de Jacobi. Sin embargo


ambas cosas son muy diferentes, en tanto la función de Jacobi depende de las co-
ordenadas y velocidad generalizadas, mientras que el Hamiltoniano depende de
las coordenadas y los momentos generalizados (tratados estos como variables in-
dependientes).
En síntesis, la dinámica de cualquier sistema dinámico (para el cuál se pueda
escribir un Lagrangiano) se puede describir con el siguiente conjunto de 2M ecua-
ciones diferenciales de primer orden:
( )
∂H
q̇ j =
∂p j
M
( )
∂Lqp
ṗ j =

R
∂q j
M

Llamamos aquí a este conjunto de ecuaciones, las ecuaciones de Hamilton.

O
Hemos logrado nuestro objetivo. La dinámica del sistema se puede escribir
como un conjunto de ecuaciones diferenciales de primer orden. La dinámica en
el espacio {q j } − { p j } (llamado también el espacio de fase) es una dinámica no
D
degenerada.
Pero hay un defecto en esta forma linearizada de las ecuaciones de movimiento:
no es la más simple. Para describir el movimiento de un sistema usando esta ver-
A
sión es necesario encontrar dos funciones (interrelacionadas), Lqp y H.
¿Existe alguna manera de describir la dinámica como de una sola función?
Aquí las matemáticas salen en nuestra ayuda. La transformación de coorde-
nadas:
RR

∂L
pj ≡
∂q̇ j

tiene una forma conocida en la física-matemática. Se la llama una transformación


de Legendre. El uso de este tipo de transformaciones es muy común en la termod-
BO

inámica.
Una particularidad especial de este tipo de transformación es que permite es-
cribir la relación entre las variables y funciones implicadas (L, Lqp , q̇ j , q j , p j , etc.)
de formas simple. Para ello se toma la función clave de la transformación (el La-
grangiano o el Hamiltoniano) y se encuentra el diferencial total por dos caminos
diferentes.
Dado que H ({q j }, { p j }, t) el diferencial total es:

∂H ∂H ∂H
dH = ∑ ∂q j dq j + ∂p j dp j + ∂t
dt
j

Ahora bien, por definición, H ({q j }, { p j }, t) ≡ ∑k pk q̇k ({ql }, { pl }, t) −


Lqp ({ql }, { pl }, t) y del diferencial total será entonces:
 
∂L ∂L ∂L
dH = ∑(q̇k dpk + pk dq̇k ) − ∑ dq + dq̇ +
∂qk k ∂q̇k k ∂t
dt
k j
292 Chapter 8. El formalismo hamiltoniano

Usando la definición p j = ∂L/∂q̇ j y la ecuación de Euler Lagrange ṗ j = ∂L/∂q j


se elimina el incomodo diferencial total sobre q̇ j (ese es justamente el propósito de
las transformaciones de Legendre) y queda:

 
∂L
dH = ∑ q̇k dpk − ṗk dqk +
∂t
dt
k

R
Comparando con el diferencial original nos quedan las relaciones:

O
 D 
∂H 
 q̇ j = +

 
 
∂p j 
∂H 


 ṗ j =
 
A
 
∂q j  M
RR

Con un extra:
BO

∂H ∂L
=−
∂t ∂t

Que son, nuevamente, un conjunto de 2M ecuaciones diferenciales lineales or-


dinarias que describen completamente la dinámica del sistema. Este conjunto de
ecuaciones es distinto del conjunto encontrado anteriormente, pero ahora solo se
necesita una función para determinar la dinámica: el Hamiltoniano. Llamamos a
este sistema de ecuaciones, las ecuaciones canónicas de Hamilton.
Bajo estas condiciones la dinámica en el espacio de fase no es degenerada y
esta determinada completamente por la función H ({q j }, {q̇ j }, t) que actúa como
un campo escalar en el espacio de fase que determina hacia dónde se mueve el
sistema dinámico.
8.2. Las ecuaciones canónicas de Hamilton 293

R
O
D
A
Figure 8.4: Dinámica en el espacio de fase descrita por las ecuaciones canónicas de
Hamilton.
RR

Nótese que la dirección de movimiento del sistema en el espacio de fase sigue


curvas de igual valor de H en el espacio de fase. De allí uno de los poderes in-
creíbles del formalismo Hamiltoniano, al reducir la dinámica a un problema ge-
ométrico, a saber, el problema de encontrar las curvas de nivel de la función La-
grangiana.
BO

8.2.1 Un ejemplo básico: el péndulo simple


Consideremos el problema del péndulo simple que hemos estudiado antes en estas
notas.
El Lagrangiano del sistema se puede escribir en la forma:

1 2 2
L(θ, θ̇ ) = ml θ̇ + mglcosθ
2
Lo primero que debemos hacer es encontrar el momento generalizado (la trans-
formación de Legendre):

∂L
pθ = = ml 2 θ̇
∂θ̇
De allí debemos escribir la función que nos da la velocidad generalizada en
términos del momento:
294 Chapter 8. El formalismo hamiltoniano


θ̇ =
ml 2
El Lagrangiano Lqp es en este caso:

1 p2θ
Lθ p = + mgl cos θ
2m l 2
La función Hamiltoniana es:

p2θ p2
H (θ, pθ ) = pθ θ̇ − Lθ p = 2
− θ 2 − mgl cos θ
ml 2ml
Que queda,

R
p2θ
H (θ, pθ ) = − mgl cos θ
2ml 2

O
En la figura abajo se muestran gráficos de contorno de este Hamiltoniano para
el siguiente conjunto de propiedades:

In [3]: m=1.0 #kg


g=9.81 #m/s^2
l=1.0 #m
D
A
Para hacer el gráfico debemos constuir una malla de datos

In [4]: pext=10.0
RR

pqs=np.linspace(-pext,pext,100)

qext=np.pi
qs=np.linspace(-qext,qext,100)

QS,PS=np.meshgrid(qs,pqs)
BO

HS=PS**2/(2*m*l**2)-m*g*l*np.cos(QS)

Un gráfico de contornos se muestra abajo:

In [5]: fig=plt.figure(figsize=(8,6))
ax=fig.gca()

c=ax.contourf(QS*RADIAN,PS,HS,10,cmap="jet")
c=ax.contour(QS*RADIAN,PS,HS,np.linspace(-m*g*l,m*g*l,10))
cb=fig.colorbar(c)
c.clabel(colors='w')
c=ax.contour(QS*RADIAN,PS,HS,[0],colors=['w'],linewidths=2)

xl=ax.set_xlabel(r"$\theta$ (grados)")
tl=ax.set_ylabel(r"$p_\theta$")

fig.tight_layout()
8.2. Las ecuaciones canónicas de Hamilton 295

R
O
D
A
Interpretemos estas curvas de contorno:
RR

• Cuando fijas unas condiciones iniciales (ángulo y momentum angular pθ )


definimos su posición en el espacio de fase. Supongamos por ejemplo que
comentamos con θ = 45◦ y pθ = 0.

• La dinámica indica que la partícula se moverá siguiendo una trayectoria de


igual valor de H, a saber H = −mgl cos 45◦ . En este caso el valor de H es
BO

negativo.

• Como vemos la trayectoria en el espacio de fase es una elipse acotada por


θ = ±45◦ , es decir, se trata de un movimiento oscilatorio con amplitud igual
a 45◦ .

• ¿Qué pasa ahora si lanzamos la partícula en reposo pero en un ángulo θ =


90◦ . En este caso el valor del Hamiltoniano alcanza un valor crítico H = 0.
Sin embargo la trayectoria sigue estano acotada (elipse).

• Para ángulos iniciales mayores a 90◦ la trayectoria sigue siendo acotada, pero
la forma de la misma en el espacio de fase se va modificando. Ya no tiene la
forma de una elipse y se parece más a un pastel.

• La situación se vuelve crítica cuando lanzamos en reposo el péndulo desde


un ángulo de θ = 180◦ . En este caso todavía la partícula se mueve en una
trayectoria acotada y vuelve al mismo punto después de una vuelta.
296 Chapter 8. El formalismo hamiltoniano

• Cuando lanzamos la partícula desde un ángulo de θ = 180◦ pero con una


pequeña velocidad angular inicial, el movimiento ya no esta acotado. La
partícula comienza a moverse descontroladamente, de modo que su veloci-
dad es mayor cuando el ángulo se acerca a 0 y se hace mínima cuando el
ángulo es θ = 180◦ (ese es el significado de las ondulaciones que se ven en la
figura arriba y abajo del contorno crítico (contorno amarillo).
A pesar de que la descripción anterior parece bastante técnica, en realidad re-
fleja el movimiento de un sistema que conocemos bastante bien.
Para poner en evidencia el hecho de que el comportamiento descrito anterior-
mente es precisamente el que conocemos del péndulo, intentemos ver, lado a lado
el movimiento del sistema en el espacio coordenado y el mismo movimiento en el
espacio de fase.
Para ello es necesario primero resolver las ecuaciones canónicas de Hamilton,

R
que usando el Hamiltoniano escrito anteriormente quedarán:

O
∂H p
θ̇ = = θ2 (8.1)
∂pθ ml
∂H
ṗθ = − = −mgl sin θ (8.2)
∂θ
D (8.3)
Al ver estas ecuaciones reconocemos el poder de la linearización conseguido
A
con el formalismo Hamiltoniano. A diferencia del formalismo Lagrangiano en las
ecuaciones de una de las variables no aparecen las derivadas de la otra.
Numéricamente este sistema se puede escribir como:
RR

In [6]: def HE_pendulo(y,t,m,l):


q=y[0]
p=y[1]

g=9.8
dqdt=p/(m*l**2)
BO

dpdt=-m*g*l*np.sin(q)

return [dqdt,dpdt]

Definamos unas condiciones iniciales


In [7]: y=[45*GRADOS,0.0]
ts=np.linspace(0,10.0,100)

Resolvamos:
In [8]: solucion=odeint(HE_pendulo,y,ts,args=(m,l))

Un gráfico de la trayectoria del sistema en el espacio de fase:


In [9]: plt.figure()
plt.plot(solucion[:,0]*RADIAN,solucion[:,1])
plt.xlabel(r"$\theta$ (grados)")
plt.ylabel(r"$p_\theta$")
8.2. Las ecuaciones canónicas de Hamilton 297

Out[9]: Text(0, 0.5, '$p_\\theta$')

R
O
D
A
Que coincide con lo que esperabamos anteriormente. Se invita al lector de la
versión digital a cambiar las condiciones iniciales tal y como se descibe anterior-
RR

mente para ver el efecto de la trayectoria del sistema.


Ahora pongamos juntos la trayectoria del sistema en el espacio coordenado y
en el espacio de fases

In [10]: fig,axs=plt.subplots(1,2,figsize=(8,4))
BO

#Espacio coordenado
x=l*np.sin(solucion[:,0])
y=-l*np.cos(solucion[:,0])
axs[0].plot(x,y,'ko')
axs[0].set_xlim((-1.2*l,1.2*l))
axs[0].set_ylim((-1.2*l,1.2*l))
axs[0].set_xlabel(r"$x$")
axs[0].set_ylabel(r"$y$")
axs[0].set_title("Espacio coordenado")

#Espacio de Fase
axs[1].plot(solucion[:,0]*RADIAN,solucion[:,1],'r-')
c=axs[1].contourf(QS*RADIAN,PS,HS,np.linspace(-m*g*l,5*m*g*l,10))
axs[1].set_xlabel(r"$\theta$ (grados)")
axs[1].set_ylabel(r"$p_\theta$")
axs[1].set_title("Espacio de Fase")

fig.tight_layout()
298 Chapter 8. El formalismo hamiltoniano

R
O
Y ahora podemos ver todo animado:

In [11]: #Condiciones iniciales


y=[45*GRADOS,0]
Nt=500
ts=np.linspace(0,10.0,Nt)
D
solucion=odeint(HE_pendulo,y,ts,args=(m,l))
A
#Gráfico básico
fig,axs=plt.subplots(1,2,figsize=(8,4))
RR

#Espacio coordenado
q=solucion[0,0]
p=solucion[0,1]
x=l*np.sin(q)
y=-l*np.cos(q)
Ho=p**2/(2*m*l**2)-m*g*l*np.cos(q)
BO

part_conf,=axs[0].plot(x,y,'ko')
barra,=axs[0].plot([0,x],[0,y],'k-')
axs[0].set_xlim((-1.2*l,1.2*l))
axs[0].set_ylim((-1.2*l,1.2*l))
axs[0].set_xlabel(r"$x$")
axs[0].set_ylabel(r"$y$")
axs[0].set_title("Espacio coordenado")

#Espacio de Fase
part_fase,=axs[1].plot(solucion[0,0]*RADIAN,solucion[0,1],'ro-')
c=axs[1].contourf(QS*RADIAN,PS,HS,np.linspace(-m*g*l,5*m*g*l,10))
c=axs[1].contour(QS*RADIAN,PS,HS,[Ho],colors=['w'])
axs[1].set_xlabel(r"$\theta$ (grados)")
axs[1].set_ylabel(r"$p_\theta$")
axs[1].set_title("Espacio de Fase")

fig.tight_layout()
8.3. Simetrías y candidates conservadas 299

#Animacion
def animacion(i):
q=solucion[i,0]
p=solucion[i,1]
x=l*np.sin(q)
y=-l*np.cos(q)

#Pone el ángulo q entre -180 y 180


q=np.mod(q*RADIAN,360)
if q>180:q=q-360

part_conf.set_data(x,y)
barra.set_data([0,x],[0,y])
part_fase.set_data(q,p)

R
return part_conf,barra,part_fase

O
#animacion(10)
a=animation.FuncAnimation(fig,animacion,frames=Nt,interval=Nt/30,blit=True)
D
A
RR
BO

8.3 Simetrías y candidates conservadas


En la sección anterior dedujimos las ecuaciones canónicas de Hamilton:
 
 q̇ j = + ∂H 

 

 ∂p j 
∂H 


 ṗ j =

 

∂q j  M
Con un extra:

∂H ∂L
=−
∂t ∂t
300 Chapter 8. El formalismo hamiltoniano

Es interesante anotar aquí que cuando dos cantidades físicas se relacionan a


través de ecuaciones como las ecuaciones canónicas de Hamilton, a través de un
funcional como H, se dice que son variables canónicas conjugadas. Así, en sis-
temas dinámicos, p j es el momentum canónico conjugado de q j . Esta terminología
es extensamente utilizada en muchas aplicaciones de la física moderna y será uti-
lizada aquí a partir de ahora.
Del formalismo Lagrangiano sabemos que una manera de estudiar los proble-
mas dinámicos es hacerlo a través de sus simetrías y las correspondientes canti-
dades conservadas de acuerdo al teorema de Noether.
¿Cómo se identifican las simetrías y cantidades conservadas en el formalismo
Hamiltoniano?

R
8.3.1 Variables cíclicas
Como sucede en el formalismo Lagrangiano las variables cíclicas (variables que

O
no aparecen explícitamente en el Lagrangiano) se corresponden con cantidades
conservadas.
En el caso del formalismo Hamiltoniano, sin embargo, las cantidades conser-
D
vadas asociadas a las variables cíclicas son triviales.
Así por ejemplos si la variable generalizada qk no aparece explícitamente en el
Lagrangiano, ie. ∂H/∂qk , entonces por las ecuaciones canónicas sabemos que el
A
momento canónico conjugado pk será constante.
La diferencia entre este resultado en el formalismo Hamiltoniano y el mismo re-
sultado en el formalismo Lagrangiano, es que en este último la cantidad que es
constante (cuadratura) no es una función compleja de las variables independientes
RR

del problema ({q j }, {q̇ j }), sino una de las variables mismas, pk .

Conservación del momento en el formalismo Hamiltoniano. A cada


variable cíclica en el Hamiltoniano le corresponde un momento gener-
alizado constante. Matemáticamente
BO

∂H
= 0 → pk : cte
∂qk

Las implicaciones geométricas de estas simetrías son muy interesantes y


pueden entenderse con un ejemplo simple

8.3.2 Ejemplo básico: el péndulo cilíndrico


Consideremos por ejemplo el caso de un cuerpo unido a una cuerda de modo que
el cuerpo puede oscilar, pero también moverse en el espacio de tres dimensiones
(ver figura abajo). A este problema se lo conoce como el péndulo cónico.
8.3. Simetrías y candidates conservadas 301

R
O
D
Figure 8.5: Sistema mecánico simple
A
Como vemos el problema tiene dos grados de libertad y por lo tanto puede ser
descrito por dos variables generalizadas independientes θ y φ.
Sin embargo el espacio de fase del problema es enorme, conteniendo un total de
RR

4 dimensiones (θ, φ, pθ , pφ ) que hacen muy difícil representar o siquiera imaginarse


una representación geométrica de la dinámica.
Las simetrías de este problema nos pueden sin embargo ayudar en la repre-
sentación del mismo.
Para escribir el Hamiltoniano debemos comenzar por escribir el Lagrangiano:
BO

1
m(b2 θ̇ 2 + b2 sin2 θ φ̇) + mgb cos θ
L=
2
Los momentos canónicos conjugados serán en este caso:

∂L
pθ = = mb2 θ̇
∂θ
∂L
pφ = = mb2 sin2 θ φ̇
∂φ
Con esto el Lagrangiano escrito en términos de pθ , pφ será:

p2θ p2φ
Lqp = + + mgb cos θ
2mb2 2mb2 sin2 θ
Y el Hamiltoniano H = pθ θ̇ + pφ φ̇ − Lqp queda:
2
p2θ pφ
H= + − mgb cos θ
2mb2 2mb2 sin2 θ
302 Chapter 8. El formalismo hamiltoniano

Como vemos la variable φ es cíclica y por lo tanto pφ ≡ αφ es contante. Esto


implica inmediatamente que la ecuación de movimiento para φ será:

∂H α2φ
φ̇ ≡ ωφ = − =
∂pφ mb2 sin2 θ
En términos de αφ el Hamiltoniano es ahora:
2
p2θ αφ
H= 2
+ − mgb cos θ
2mb 2mb2 sin2 θ
Por otro lado las ecuación de movimiento para θ y pθ serán:

p2θ
θ̇ =

R
mb2
α2φ cos θ
ṗθ = − mbg sin θ
mb2 sin3 θ

O
El espacio de fase de este problema se puede reducir a 3 dimensiones sola-
mente: θ, pθ y φ, ya que en la cuarta dimensión pφ el sistema se mantiene sobre la
D
hipersuperficie constante pφ = αφ .
Simulemos el movimiento del sistema y representémoslo, tanto en el espacio
coordenado como en el espacio de fase.
Las ecuaciones canónicas de Hamilton serán:
A
In [13]: def EoM_PenduloCilindrico(y,t,alpha,b,m,g):
q=y[0]
RR

f=y[1]
pq=y[2]

dqdt=pq/(m*b**2)
dfdt=alpha/(m*b**2*np.sin(q)**2)
dpqdt=alpha**2*np.cos(q)/(m*b**2*np.sin(q)**3)-m*b*g*np.sin(q)
BO

return [dqdt,dfdt,dpqdt]

Las propiedades del sistema y las condiciones iniciales son:

In [14]: b=1.0
g=9.81
m=1.0

t0=0.0
tmax=50.0
Nt=1000

q0=15*GRADOS
f0=0.0*GRADOS
pq0=0.0
alpha=0.8

Solución:
8.3. Simetrías y candidates conservadas 303

In [15]: ts=np.linspace(t0,tmax,Nt)
solucion=odeint(EoM_PenduloCilindrico,[q0,f0,pq0],ts,args=(alpha,b,m,g))
qs=solucion[:,0]
fs=solucion[:,1]
pqs=solucion[:,2]

#Coordenadas cartesianas
xs=b*np.sin(qs)*np.cos(fs)
ys=b*np.sin(qs)*np.sin(fs)
zs=-b*np.cos(qs)

R
La animación del movimiento:

O
D
A
RR

In [16]: fig=plt.figure()
ax=fig.add_subplot(111,projection='3d')
BO

masa,=ax.plot([xs[0]],[ys[0]],[zs[0]],'ko')
traj,=ax.plot([xs[0]],[ys[0]],[zs[0]],'b-')
cuerda,=ax.plot([0,xs[0]],[0,ys[0]],[0,zs[0]],'k-')

ax.set_xlim((-b,b))
ax.set_ylim((-b,b))
ax.set_zlim((-b,0))

def animacion(i):
cuerda.set_data([0,xs[i]],[0,ys[i]])
cuerda.set_3d_properties([0,zs[i]])
masa.set_data([xs[i]],[ys[i]])
masa.set_3d_properties([zs[i]])
traj.set_data(xs[:i],ys[:i])
traj.set_3d_properties(zs[:i])
return traj,cuerda

anim=animation.FuncAnimation(fig,animacion,frames=Nt,interval=Nt/5.0,blit=True)
304 Chapter 8. El formalismo hamiltoniano

R
O
D
El movimiento en el espacio de fase es:

In [17]: fig=plt.figure()
A
ax=fig.add_subplot(111,projection='3d')

fs=np.mod(fs,2*np.pi)
RR

masa,=ax.plot([qs[0]],[fs[0]],[pqs[0]],'ko')
traj,=ax.plot([qs[0]],[fs[0]],[pqs[0]],'bo',ms=2)

pqmax=max(np.abs(pqs.min()),pqs.max())
BO

ax.set_xlim((-2*np.pi,2*np.pi))
ax.set_ylim((-2*np.pi,2*np.pi))
ax.set_zlim((-pqmax,+pqmax))

ax.set_xlabel(r"$\theta$")
ax.set_ylabel(r"$\phi$")
ax.set_zlabel(r"$p_\theta$")

ax.view_init(0,90) #Movimiento proyectado en el plano q-pq


#ax.view_init(0,0) #Movimiento proyectado en el plano f-pq
#ax.view_init(90,0) #Movimiento proyectado en el plano q-f

def animacion(i):
masa.set_data([qs[i]],[fs[i]])
masa.set_3d_properties([pqs[i]])
traj.set_data(qs[:i],fs[:i])
traj.set_3d_properties(pqs[:i])
return masa,traj
8.3. Simetrías y candidates conservadas 305

anim=animation.FuncAnimation(fig,animacion,frames=Nt,interval=Nt/5.0,blit=True)

R
O
D
A
8.3.3 Conservación del Hamiltoniano
RR

Al deducir las ecuaciones canónicas de Hamilton habíamos encontrado que:


 
∂L
dH = ∑ q̇k dpk − ṗk dqk + dt
k
∂t
Si utilizamos las ecuaciones canónicas encontramos que:
BO

dH ∂L ∂H
= =−
dt ∂t ∂t
De aquí se sigue que si la siguiente regla de conservación:
Conservación del Hamiltoniano. Si el Hamiltoniano no depende ex-
plícitamente del tiempo, el Hamiltoniano mismo es una constante de
movimiento.
El Hamiltoniano hereda algunas condiciones que demostramos para la función
de Jacobi, en particular el hecho de que si se cumple que las ecuaciones de trans-
formación entre las cooredenadas cartesianas y las variables generalizadas no de-
penden del tiempo y se cumple además que la función de energía potencial no
depende de las velocidades entonces:

H = T+U
Que es lo que llamamos la energía mecánica del sistema.
306 Chapter 8. El formalismo hamiltoniano

Hamiltoniano y Energía. Son condiciones necesarias y suficientes para


que el Hamiltoniano sea igual a la energía mecánica H = T + U: 1) las
ecuaciones de transformación ~r ({q j }) no dependen explícitamente del
tiempo, 2) La energía potencial U ({q j }) solo depende de las coorde-
nadas generalizadas.

8.3.4 Cantidades conservadas y los corchetes de Poisson


Consideremos ahora una cantidad física arbitraria, c({q j }, { p j }, t) que depende en
general de las coordenadas generalizadas, los momentos canónicos y el tiempo. La
derivada total de f respecto al tiempo por regla de la cadena es:
!
dc ∂c ∂c ∂c
=∑ q̇ j + ṗ j +
dt

R
j
∂q j ∂p j ∂t

Si sustituimos las derivadas por las ecuacione canínicas de Hamilton obten-


emos:

O
!
dc ∂c ∂H ∂c ∂H ∂c
=∑ − +
dt ∂q j ∂p j ∂p j ∂q j ∂t
j
D
Este resultado sugiere la definición de una nueva operación entre funciones:

Los corchetes de Poisson. El corchete de Poisson de las funciones


A
f ({q j }, { p j }, t) y g({q j }, { p j }, t) se define como:
RR

∂ f ∂g ∂ f ∂g
{ f , g} ≡ −
∂q j ∂p j ∂p j ∂q j
En términos de los corchetes de Poisson la derivada total de la cantidad c es:

dc ∂c
= {c, H } +
dt
BO

∂t
Este resultado muestra la sencillez con la que en un problema físico puede pro-
barse si una determinada cantidad es constante o no. Para ello formulamos el
siguiente teorema:

Constante de movimiento en el formalismo hamiltoniano. Una can-


tidad física c({q j }, { p j }, t) es constante en el tiempo si se cumple que:
1) no depende explícitamente del tiempo ∂c/∂t = 0 (condición trivial)
y 2) se cumple que:

{c, H } = 0
El uso de los corchetes de Poisson se vuelve así en el formalismo Hamiltoniano
una herramienta de primera mano para encontrar ecuaciones de movimiento o
probar si una determinada cantidad lo es.
En este caso es bueno contar con las siguientes propiedades de los corchetes de
Poisson:
8.4. Transformaciones canónicas 307

Propiedades de los corchetes de Poisson. Dadas funciones


f ({q j }, { p j }, t), g({q j }, { p j }, t) y h({q j }, { p j }, t) y una constante arbi-
traria α, se cumple que:

1. { f , g} = −{ g, f } (no conmutatividad).
2. {α f , g} = α{ f , g} (linearidad).
3. {α f , g} = { f , αg} (intercambio).
4. { f + g, h} = { f , h} + { g, h} (distributividad respecto a la suma).
5. { f g, h} = { f , h} g + f { g, h} (distributividad respecto al producto).
6. { f , { g, h}} + { g, {h, f }} + {h, { f , g}} = 0 (propiedad cíclica).
7. { f , f } = 0 (Inversa).
8. {q j , pk } = { p j , qk } = δjk (identidad).
9. {q j , qk } = { p j , pk } = 0.

R
8.4 Transformaciones canónicas

O
Una de las características más poderosas del formalismo Hamiltoniano es la man-
era como puede manipularse para simplificar la solución a problemas dinámicos
muy complicados. D
Así por ejemplo una transformación de coordenadas (adecuadamente dis-
eñada) puede hacer que la dinámica de un sistema se exprese de forma realmente
simple de modo que su solución pueda verse de forma inmediata.
A
Consideremos un caso ejemplar: el oscilador armónico.

8.4.1 Motivación
RR

Consideremos el caso que hemos estudiado sistemáticamente de un cuerpo unido


a un resorte. El Hamiltoniano del sistema es:

p2x 1 1
H ( x, p x ) = + kx2 = ( p2 + mkx2 )
2m 2 2m x
BO

Ya habíamos mostrado las curvas de nivel de este Hamiltoniano en el espacio


de fase.
Consideremos ahora la posibilidad de introducir un conjunto nuevo de vari-
ables X, P tal que las coordenadas originales se pueden escribir como:

x = f ( P) sin X (8.4)
f ( P)
px = cos X (8.5)

√ Donde f ( P) es una función desconocida (¿arbitraria?) de la variable P y ω ≡


k/m.
Reemplazando en el Hamiltoniano obtenemos una nueva función:

f ( P )2
K ( X, P) =
2m
308 Chapter 8. El formalismo hamiltoniano

Esta forma del “Hamiltoniano” es mucho más simple que la forma original y en
ella, por ejemplo la variable X, en contraposición con la variable original x, aparece
como una variable ciclica.
Pero, ¿es este en realidad un Hamiltoniano?, es decir, ¿satisfacen las nuevas
variables X, P las ecuaciones canónicas de Hamilton?:

Ẋ = +∂K/∂P
?
Ṗ = −∂K/∂X
Transformación Canónica. Llamamos a una transformación del tipo:
Qk = Qk ({q j }, { p j }, t), Pk = Pk ({q j }, { p j }, t), una transformación
canónica si la función resultante de transformar el Hamiltoniano,
K ({ Qk }, { Pk }, t) = H ({q j ({ Qk }, { Pk }, t)}, { p j ({ Qk }, { Pk }, t)}, t) es tal
que:

R
 
∂K 
 Q̇k = +

 
∂Pk 

O
∂K 
 Ṗk = −

 

∂Qk M
En otras palabras una transformación puntual en el espacio de fase es canónica
D
si la variable correspondiente al momento, sigue siendo canónica conjugada a la
variable de configuración correspondiente.
A
8.4.2 La función generatriz
Existen tres formas diferentes de abordar este problema.
RR

La primera y más general de todas es mediante el uso de la denominada fun-


ción generatriz.
Sabemos que el conjunto de ecuaciones canónicas de Hamilton es equivalente
al principio de Hamilton:
Z
!
∑ p j q̇ j − H
BO

δ dt = 0
j
Si queremos que un nuevo conjunto de variables satisfagan las mismas ecua-
ciones canónicas se debe cumplir que:
Z
!
δ ∑ Pk Q̇k − K dt = 0
k
Por comparación, podemos decir que estas dos ecuaciones se cumplen si la
siguiente relación se satisface:

dF
∑ p j q̇ j − H = ∑ Pk Q̇k − K + dt
j k

Donde F es una función generalizada de todas las variables implicadas


F ({q j }, { p j }, { Qk }, { Pk }, t). A esta función se la conoce como la función gener-
atriz de la transformación.
8.4. Transformaciones canónicas 309

Función generatriz de tipo 1: F1 ({q j }, { Q j }, t)

Si la función generatriz depende únicamente de las coordenadas, lo que se denota


de forma estándar como F1 ({q j }, { Q j }, t), la derivada total en la condición arriba
se puede escribir de la forma
!
dF1 ∂F1 ∂F1 ∂F
=∑ q̇ j + Q̇ j + 1
dt j
∂q j ∂Q j ∂t

La condición entonces para que la transformación sea canónica se escribe como:


! !
∂F1 ∂F1 ∂F
∑ p j − ∂q j q̇ j − ∑ Pj + ∂Q j Q̇ j = H − K + ∂t1
Si las variables {q j }, { Q j } son tratadas como variables independientes, como

R
lo sugiere la función F1 , es decir si cualquier variación dq j se puede hacer indepen-
dientemente de la variación dQ j , el lado izquierdo de la ecuación debe ser idénti-

O
camente cero, lo que implica que las siguientes relaciones se cumplen:

∂F1
pj = + (8.6)
D
∂q j
∂F1
Pj = − (8.7)
∂Q j
A
∂F1
K= H+ (8.8)
∂t
RR

Se dice que F1 es la función generatriz en tanto una vez escogida, el primer


conjunto de ecuaciones arriba permite encontrar la función de transformación
Qk ({q j }, { p j }, t). Así mismo, una vez se reemplaza esta transformación en la se-
gunda ecuación, se puede obtener la transformación Pk ({q j }, { p j }, t) y finalmente
la última ecuación permite escribir el Hamiltoniano en términos del nuevo con-
junto de variables.
BO

Volviendo sobre el caso particular del oscilador armónico.


Consideremos por ejemplo la siguiente función generatriz:

mωx2
F1 ( x, X ) =
cot X
2
Aplicando las primeras dos condiciones obtenemos:

∂F1
px = = mωx cot X (8.9)
∂x
∂F mωx2
P= 1 =− (8.10)
∂X 2 sin2 X
(8.11)

Estas dos ecuaciones implícitamente contienen la transformación entre las vari-


ables x, p x y las nuevas X, P. Así, por ejemplo si elevamos al cuadrado la primera
ecuación y dividimos las ecuaciones obtenemos:
310 Chapter 8. El formalismo hamiltoniano


px = 2mωP cos X
Si reemplazamos en la primera ecuación y despejamos x obtenemos:
r
2P
x= sin X

Que es justamente
√ la forma que habíamos postulado originalmente, donde la
función f ( P) = 2mωP. Reemplazando en el Hamiltoniano encontramos que:

K ( X, P) = ωP
Este Hamiltoniano es muy simple y tiene a la variable X como una variable

R
cíclica, tal que P es una constante de movimiento. Adicionalmente como no de-
pende del tiempo el Hamiltoniano es en sí mismo constante K ≡ E
El espacio de fase tiene ahora una estructura geométrica muy simple. Un grá-

O
fico de contornos elíptico se convierte simplemente en un gráfico de líneas hori-
zontales constantes.
La solución al problema se hace también trivial:
D
∂K
Ẋ = + =ω
∂P
A
De modo que X = ωt + Xo
La solución al problema se obtiene volviendo a las variables originales:
RR

r
2E
x (t) = sin(ωt + Xo ) (8.12)
mω 2

p x (t) = 2mE cos(ωt + Xo ) (8.13)
(8.14)
BO

Lo que coincide con lo que conocemos del oscilador armónico.

8.4.3 Funciones generatrices de otros tipos


De la misma manera que deducimos las ecuaciones que definen la transformación
de canónica a partir de la función generatriz de tipo 1, se puede hacer lo mismo
para transformaciones de otros tipos. En resumen:

• Transformación de tipo 1. F = F1 ({q j }, { Qk }, t), { p j = ∂F1 /∂q j , Pj =


−∂F1 /∂Q j }
• Transformación de tipo 2. F = F2 ({q j }, { Pk }, t) − ∑ Qk Pk , { p j =
∂F2 /∂q j , Q j = ∂F2 /∂Pj }
• Transformación de tipo 3. F = F3 ({ p j }, { Qk }, t) + ∑ qk pk , {q j =
−∂F3 /∂p j , Pj = −∂F3 /∂Q j }
• Transformación de tipo 4. F = F4 ({ p j }, { Pk }, t) + ∑ qk pk − ∑ Qk Pk , {q j =
−∂F4 /∂p j , Q j = −∂F4 /∂Pj }
8.5. El formalismo de Hamilton-Jacobi 311

8.4.4 La aproximación simpléctica a las transformaciones


canónicas
Existe una aproximación alternativa a las transformaciones canónicas que tiene un
poderoso contenido geométrico y que es más moderna.
Supongamos que tenemos dos juegos de coordenadas canónicas conjugadas
{q j }, { p j } y { Qk }, { Pk } y sus respectivas funciones hamiltonianas H y K respecti-
vamente. La función de transformación Qk ({q j }, { p j }, t) satisface:

! !
∂Qk ∂Qk ∂Qk ∂H ∂Qk ∂H
Q̇k = ∑ q̇ +
∂q j j

∂p j j
=∑
∂q j ∂p j

∂p j ∂q j
= { Q, H }
j j

Del otro lado, dado que Qk cumple la ecuación canónica de Hamilton:

R
!
∂H ∂H ∂p j ∂H ∂q j
Q̇k = =∑ +

O
∂Pk j
∂p j ∂Pk ∂q j ∂Pk

Comparando uno a uno la ecuación anterior con esta obtenemos las relaciones:

∂Qk
!
=+
D
∂p j

(8.15)
∂q j ∂Pk Q,P
q,p
A
!  
∂Qk ∂q j
=− (8.16)
∂p j ∂Pk Q,P
q,p
RR

(8.17)

Relaciones similares pueden deducirse para el caso de Ṗk :

!  
∂p j
BO

∂Pk
=− (8.18)
∂q j ∂Qk Q,P
q,p
!  
∂Pk ∂q j
=+ (8.19)
∂p j ∂Qk Q,P
q,p
(8.20)

8.5 El formalismo de Hamilton-Jacobi


Como vimos en la sección anterior, usando transformaciones canónicas es posible
hacer que un Hamiltoniano complejo se convierta en un Hamiltoniano muy simple
tal que algunas o todas las (nuevas) coordenadas (después de la transformación)
sean cíclicas y por lo tanto encontrar las constantes de movimiento sea mucho más
sencillo.
Hay un ideal muy perseguido en la modelación de sistemas físicos usando el
formalismo Hamiltoniano: ¿será posible, dado un sistema dinámico, encontrar
312 Chapter 8. El formalismo hamiltoniano

una transformación tal que todas las coordenadas y momentos sean constantes
de movimiento?. Esto lo podemos escribir matemáticamente como:

∂K
Q̇k = + =0 (8.21)
∂Pk
∂K
Ṗk = − =0 (8.22)
∂Qk

Una manera de conseguir esto sería si el Hamiltoniano K en las nuevas co-


ordenadas fuera constante k o lo que es lo mismo cero (siempre podemos hacer
K = K 0 − k).
Si asumimos que la transformación es canónica esta condición implica que:

R
∂F
H ({q j }, { p j }, t) +
=0
∂t
Si usamos una transformación canónica de tipo 2, F = F2 ({q j }, { Pj }, t) ≡

O
S({q j }, {α j }, t), donde por la condición de constancia de las coordenadas y los
momentos canónicos conjugados hemos hecho la identificación Pj ≡ α j con α j con-
stante. Ahora bien, como esta es una transformación canónica de tipo 2, se cumple
D
que:

∂S
pj =
A
∂q j
Y de allí la condición buscada es:
RR

( ) !
∂S ∂S
H { q j }, ,t + =0
∂q j ∂t

Que se conoce como la ecuación de Hamilton-Jacobi y a la función S la lla-


mamos la función principal de Hamilton
¿Qué significado físico tiene la función S?. Si derivamos con respecto al tiempo:
BO

dS ∂S ∂S
dt
= ∑ ∂q j q̇ j + ∂t
= ∑ p j q̇ j − H
j j

Es decir S difiere por una constante k de la acción:


Z
S= Ldt + k

8.5.1 Un ejemplo básico: el oscilador armónico


Consideremos nuevamente un problema bien conocido. El oscilador armónico:
1
( p2 + m2 ω 2 x 2 )
H ( x, p x ) =
2m x
Como sabemos, dada la invariancia explícita de H del tiempo, H es en sí misma
una constante que llamaremos E. Podríamos pensar en esta cantidad como nuestro
8.5. El formalismo de Hamilton-Jacobi 313

nuevo momento canónico conjugado P (dado que el propósito es justamente tener


variables que son en sí mismas constantes).
La ecuación de Hamilton-Jacobi se obtiene haciendo p x = ∂S/∂x de donde:
"  #
1 ∂S 2 ∂S
+ m2 ω 2 x 2 + =0
2m ∂x ∂t

Por la condición original de la transformada canónica, sabemos que

∂S/∂t = − H = − E
De modo que podemos escribir

S = W − Et

R
donde W ( x ) es una función solo de las coordenadas (llamada en algunos con-
textos la función característica de Hamilton). Con esta sustitución la ecuación

O
anterior se puede escribir en la forma:
" #
∂W 2

1
+ m2 ω 2 x 2 = E
2m ∂x
D
Esta ecuación diferencial es separable y produce:
A
√ Z r
mω 2 x2
W = 2mE 1− dx
2E
De donde
RR

√ Z r
mω 2 x2
S= 2mE 1− dx − Et
2E
¿Qué propósito puede tener esta función?. Nótese que esta función es de la
forma S = S( x, E). Como el ideal original era que la función fuera S = S( x, P)
BO

podemos hacer aquí la identificación de que en el formalismo de Hamilton-Jacobi,


cuando el Hamitloniano es constante (e igual a la energía), esta última juega el
papel del momentum generalizado en el nuevo conjunto de variables.
Quedará por resolver quién juega en este caso el papel de la nueva variable de
configuración Q.
Como sabemos que la transformación es de tipo 2, se cumple que la coordenada
generalizada constante se puede calcular como:

∂S ∂S
Q= =
∂P ∂E
Como Q es en sí misma constante por construcción (recordemos que el
propósito original es encontrar un conjunto de variables en el que el Hamiltoni-
ano sea una constante, ie. Q̇ = 0), ie. Q ≡ β, obtenemos la siguiente relación:
r
m dx
Z
∂S
β= = q −t
∂E 2E 2 2
1 − mω2Ex
314 Chapter 8. El formalismo hamiltoniano

Que se integra trivialmente como


r !
1 mω 2
β + t = sin−1 x
ω 2E

Esta ecuación es interesante en tanto nos da una el valor de la nueva variable


de configuración en función de las variables de configuración originales (x). Invir-
tiendo esta ecuación es posible hayar la variable de configuración original como
función del tiempo:
r
2E
x= sin(ωt + φ)
mω 2
Donde hemos hecho φ ≡ βω. Esta es justamente la solución al problema del
oscilador armónico simple.

R
La solución para el momentum se obtiene de la relación que conecta la función
generatriz S de la transformación y los momentos del sistema:

O
∂S
px =
∂x
R
Que se puede obtener teniendo en cuenta que (∂/∂x ) f ( x )dx = f ( x ) y obte-
niendo posteriormente la derivada parcial:
D

px = 2mE cos(ωt + φ)
A
8.5.2 El procedimiento generalizado de Hamilton-Jacobi
RR

El ejemplo anterior nos permite ilustrar el que sería un procedimiento general para
conseguir los mismos resultados poderosos descritos arriba, pero en el caso de un
sistema general.

8.6 El Problema de los dos cuerpos


BO

Con los elementos vistos en este capítulo podemos volver ahora sobre el problema
de los dos cuerpos y aplicar la “tecnología” matemática desarrollada para obtener
poderosas formas de la solución al problema.
El Lagrangiano del sistema en el plano invariante de Laplace, lo habíamos es-
crito ya y era:

1 mr µ
L= mr (ṙ2 + r2 θ̇ ) +
2 r
Los momentos generalizados serán:

∂L
pr = = mr ṙ (8.23)
∂ṙ
∂L
pθ = = mr r2 θ̇ (8.24)
∂θ̇
(8.25)
8.6. El Problema de los dos cuerpos 315

De donde el Hamiltoniano se puede escribir finalmente como


!
1 2 p2θ mr µ
H (r, θ, pr , pθ ) = pr + 2 −
2mr r r

Con un procedimiento similar podemos escribir el Hamiltoniano respecto a un


plano arbitrario,

p2φ
!
1 2 p2θ mr µ
H (r, θ, φ, pr , pθ , pφ ) = pr + 2 2
+ 2 −
2mr cos φr r r

Dado que se cumplen las condiciones, el Hamiltoniano es en sí mismo una


constante H ≡ E
El sistema resultante tiene la estructura:

R
p2φ p2φ
!
1 mr µ

O
H ( qr , q θ , q φ , pr , p φ , p θ ) = p2r + + − (8.26)
2mr cos2 φr2 r2 r
pr = ṙ D (8.27)
2
pθ = r θ̇ (8.28)
2 2
pφ = r cos φφ̇ (8.29)
qr = r (8.30)
A
qθ = θ (8.31)
qφ = φ (8.32)
RR

No había mucho que decir excepto preguntarse si existe algún sistema de co-
ordenadas y momentos { Q j }, { Pj } en el cuál el sistema tuviera una forma más
“simple”, más simétrica.
Como bien sabemos existen otras maneras de parametrizar el movimiento del
problema de los dos cuerpos. Por ejemplo, en el plano invariante de Laplace, en
BO

lugar de usar las coordenadas r, θ podría usarse los elementos orbitales t0 , a, e, ω,


donde ω es el argumento del periapsis.
¿Cuál sería el Hamiltoniano en términos de coordenadas generalizadas que
fueran función de los elementos orbitales?.
Como sabemos que en el problema de los dos cuerpos los elementos orbitales
son constantes, este es un caso clásico de aplicación de la ecuación de Hamilton-
Jacobi.

8.6.1 Ecuaciones de Hamilton-Jacobi para el problema de los


dos cuerpos
Usando el Hamiltoniano anterior podemos escribir la ecuación de Hamilton-Jacobi
(en un sistema en el plano invariante de Laplace) como:
( ) !
∂S ∂S
H { q j }, ,t + =0
∂q j ∂t
316 Chapter 8. El formalismo hamiltoniano

" 2  2 #
1 ∂S 1 ∂S mr µ ∂S
+ 2 − + =0
2mr ∂r r ∂θ r ∂t

La función característica S de nuestra transformación será una función


S(r, θ, P1 , P2 ) donde P1 y P2 son dos momentos generalizados que desconocemos
pero que por definición esperamos que sean constantes.
Con el ejemplo del oscilador armónico aprendimos que dado que en esta
situación el Hamiltoniano es constante e igual a la energía, E = −∂S/∂t, uno de los
momentos generalizados será E, es decir P1 = E. El otro estará por determinarse.
Adicionalmente en este caso S(r, θ, P1 , P2 , t) = W (r, θ, P1 , P2 ) − Et
Si suponemos que la función W es separable W (r, θ, E, P2 ) = Wr (r, E, P2 ) +
Wθ (θ, E, P2 ), la anterior ecuación diferencial se puede escribir como:

R
∂Wθ
= P2 (8.33)
∂θ

O
 2
∂Wr P  mr µ 
+ 22 = 2mr αt + (8.34)
∂r r r
(8.35)
D
Aquí podemos identificar ahora mas claramente el significado de P2 =
∂Wθ /∂θ = pθ = mr r2 θ̇ = mr h, es decir, no se trata de otra cosa sino del momentum
A
angular específico del sistema.
De modo que la función principal de Hamilton S para el problema de los dos
cuerpos se puede escribir en la forma:
RR

r
mr µ  m2r h2
Z 
S(r, θ, E, h) = − Et + mr hθ + dr 2mr E + − 2
r r
Podemos ahora deducir las variables generalizadas Q j que son constantes en el
nuevo sistema. La primera es Q1 que esta asociada a P1 = E:
BO

∂S
β 1 = Q1 = = −t + I1
∂E
Donde I1 puede escribirse como:

mr dr
Z
I1 = p
2mr ( E + mr µ/r ) − m2r h2 /r2
O equivalentemente:

mr dr
Z
t= p − β1
2mr ( E + mr µ/r ) − m2r h2 /r2
Por otro lado Q2 estará dada por:

∂S
β 2 ≡ Q2 = = mr h − mr h2 I2
∂P2
Donde I2 es:
8.6. El Problema de los dos cuerpos 317

mr dr
Z
I2 = q
r2 2mr ( E + mr µ/r ) − α2θ /r2

Es posible mostrar facilmente que las ecuaciones anteriores son equivalentes a


la ecuación de la forma orbital:

d2 u
 
1 1
+u = − 2 2 f
dθ 2 h u u

Qué sabemos tiene como solución una cónica que se puede escribir como:

R
r = a(1 − e cos E)

Adicionalmente la ecuación con β 1 conduce a la ecuación de Kepler:

O
n(t + β 1 ) = E − e sin E
D
De aquí se sigue naturalmente que la constante β 1 es simplemente el tiempo de
paso por el periapsis.
Reemplazando las ecuaciones en la decinición de β 2 obtenemos un resultado
A
increible:

βθ = ω
RR

Donde ω es el argumento del periapsis.


De modo que el problema de los dos cuerpos se puede escribir como:

K ( Q1 , Q2 , P1 , P2 ) = 0 (8.36)
BO

mr µ
P1 = − (8.37)
2a q
P2 = mr h = mr µa(1 − e2 ) (8.38)
Q1 = − t0 (8.39)
Q2 = ω (8.40)

Donde todas estas variables son constantes y están expresadas en términos de


los elementos orbitales.

8.6.2 Variables de Delaunay


Un procedimiento similar al anterior permite deducir la forma del Hamiltoniano
de los dos cuerpos en 3 dimensiones (respecto a un plano arbitrario).
Al hacerlo se obtiene:
318 Chapter 8. El formalismo hamiltoniano

K ( Q1 , Q2 , Q3 , P1 , P2 , P3 ) = 0 (8.41)
mr µ
P1 = − (8.42)
2a
q
P2 = mr µa(1 − e2 ) (8.43)
q
P3 = mr µa(1 − e2 ) cos i (8.44)
Q1 = − t0 (8.45)
Q2 = ω (8.46)
Q3 = Ω (8.47)
(8.48)

R
En este conjunto de ecuaciones las coordenadas generalizadas son ángulos
(ω, Ω), excepto una Qr que es un tiempo. Nos preguntamos cuál es el conjunto

O
de variable tal que:

L=? (8.49)
G = P2 = mr
q
D µa(1 − e2 ) (8.50)
q
µa(1 − e2 ) cos i
A
H = P3 = mr (8.51)
l = n ( t + Q1 ) = n ( t − t0 ) (8.52)
g = Q2 = ω (8.53)
RR

h = Q3 = Ω (8.54)
(8.55)

Una función generatriz que puede dar cuenta de una transformación de este
tipo es:
BO

 

F2 ( Q1 , Q2 , Q3 , L, G, H, t) = nL − ( t + Q1 ) + Q2 G + Q3 H
2a
Donde se ha introducido el término −3µ/(2a) para simplificar la forma final
del momento L.
Usando las reglas de las transformaciones canónicas de tipo 2:

∂F2 3µ
P1 = = nL −
∂Q1 2a

Reemplazando Pr y despejando L obtenemos L = µa. El Hamiltoniano en
este conjunto de variables es:

∂F2
K D (l, g, h, L, G, H ) = K ( Q1 , Q2 , Q3 , P1 , P2 , P3 ) +
∂t
Con esto el Hamiltoniano del problema de los dos cuerpos en las variables de
Dalaunay queda:
8.6. El Problema de los dos cuerpos 319

µ2
KD = − 2 (8.56)
√ 2L
L = µa (8.57)
q
G = mr µa(1 − e2 ) (8.58)
q
H = mr µa(1 − e2 ) cos i (8.59)
l=M (8.60)
g=ω (8.61)
h=Ω (8.62)
(8.63)

R
En términos de los elementos orbitales tenemos que:
µ

O
αt = E = −
2a
Sabemos que D
∂S
pθ = = αθ
∂θ
De modo que
A
q
αθ = mr r2 θ̇ = mr h = mr µa(1 − e2 )
RR
BO
320 Chapter 8. El formalismo hamiltoniano

R
O
D
A
RR
BO
Bibliography

R
O
D
A
RR
BO

321

También podría gustarte