Está en la página 1de 391

Prefacio

Este libro presenta los elementos de la teorı́a de la relatividad. El texto


se dirige especialmente a estudiantes de pregrado; pensando en ellos, he
intentado presentar la teorı́a ası́ como yo habrı́a deseado leerla cuando la
estudié por vez primera, hace años.

La primera parte del libro se dedica a la relatividad especial, y la segun-


da parte a la general. La fundamentación de la teorı́a especial, en el primer
capı́tulo, se apoya fuertemente en el experimento de Michelson y Morley.
Esta ruta es probablemente cuestionable desde un punto de vista históri-
co, pero tiene la ventaja de aprovechar las enseñanzas y sugerencias que se
derivan de ese experimento, y lo hacen pedagógicamente valioso.

Para algunos la esencia de la relatividad especial está en las transforma-


ciones de Lorentz, y la covariancia de las ecuaciones de Maxwell resulta al
final, como una virtud de las transformadas. Este punto de vista tiene ven-
tajas pedagógicas, y por eso lo he seguido en los primeros capı́tulos, que se
dedican a mostrar la estructura de la teorı́a.

Pero también se puede pensar que la esencia del proyecto relativista es el


empeño por extender el principio de la relatividad al electromagnetismo: que
las ecuaciones de Maxwell sean las mismas para todos los observadores in-
erciales; en busca de este objetivo se encuentran, como un paso intermedio,
las transformaciones de Lorentz y la constancia de la velocidad de la luz. Me
gusta este punto de vista, aunque admito que tiene dificultades didácticas.
El lector interesado puede ir al apéndice, donde se ejecutan en detalle los
pasos correspondientes.

Los capı́tulos 5 y 9 dan los fundamentos del cálculo tensorial que se usa
en la relatividad especial, y en la general, respectivamente. Si bien la teorı́a
especial puede estudiarse sin tensores, la general se entiende con el uso de-

i
cidido del cálculo tensorial.

El capı́tulo 11 es crucial, y desarrolla la idea de que la gravitación puede


entenderse como un hecho geométrico. El 12 construye la ecuación de los
campos gravitacionales, de Hilbert-Einstein, y el capı́tulo 13 está dedicado
a la solución de Schwarzschild. En este último capı́tulo se enfatiza el asunto
de las partı́culas en caı́da libre, que siguen trayectorias geodésicas. Ası́ se
justifica que se haya dedicado antes todo un capı́tulo, el 10, al estudio de las
lı́neas geodésicas.

La teorı́a de la relatividad es la gloria de la fı́sica teórica. Si hay un lec-


tor que, iniciándose en el camino de esa teorı́a, encuentra que este libro es
de alguna ayuda, yo sentiré que mi trabajo ha sido bien pagado.

Lorenzo de la Torre
Medellı́n, diciembre de 2006

ii
Índice General

Prefacio I

1. El origen de la relatividad 1
1.1. Corpúsculos y ondas . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. El éter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3. El experimento de Michelson y Morley . . . . . . . . . . . . . 8
1.4. La transformación de Galileo . . . . . . . . . . . . . . . . . . 11
1.5. La constancia de la velocidad de la luz . . . . . . . . . . . . . 12
1.6. El principio de la relatividad . . . . . . . . . . . . . . . . . . 13
1.7. Homogeneidad del espacio y el tiempo . . . . . . . . . . . . . 14
1.8. El concepto de observador . . . . . . . . . . . . . . . . . . . . 15
1.9. Transformaciones de coordenadas . . . . . . . . . . . . . . . . 17
1.10. Las transformaciones de Lorentz . . . . . . . . . . . . . . . . 20

2. Propiedades del espaciotiempo 31


2.1. Las separaciones espacial y temporal son relativas . . . . . . . 32
2.2. El intervalo es absoluto . . . . . . . . . . . . . . . . . . . . . 32
2.3. Clases de intervalos . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4. La simultaneidad es relativa . . . . . . . . . . . . . . . . . . . 36
2.5. Tiempo propio . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.6. Longitud propia . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.7. Comparación de longitud propia y tiempo propio . . . . . . . 44
2.8. Un caso de simultaneidad . . . . . . . . . . . . . . . . . . . . 44
2.9. La adición de velocidades . . . . . . . . . . . . . . . . . . . . 45
2.10. La adición de aceleraciones . . . . . . . . . . . . . . . . . . . 49
2.11. Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.12. Más gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

iii
3. Mecánica 61
3.1. La conservación del momentum . . . . . . . . . . . . . . . . . 62
3.2. Las nuevas cantidades dinámicas . . . . . . . . . . . . . . . . 65
3.3. La energı́a en la relatividad especial . . . . . . . . . . . . . . 69
3.4. E = mc2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.5. La velocidad lı́mite . . . . . . . . . . . . . . . . . . . . . . . . 75
3.6. Las transformaciones de p , E , m , F . . . . . . . . . . . . . . 76
3.7. Masa y potencial electrostático . . . . . . . . . . . . . . . . . 82
3.8. La aceleración . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.9. Movimiento circular . . . . . . . . . . . . . . . . . . . . . . . 85

4. El campo electromagnético 93
4.1. Transformación de los campos E y B . . . . . . . . . . . . . . 93
4.2. Dos cantidades invariantes . . . . . . . . . . . . . . . . . . . . 99
4.3. El campo electromagnético total . . . . . . . . . . . . . . . . 101
4.4. Una carga con velocidad uniforme . . . . . . . . . . . . . . . 102
4.5. Un alambre recto con corriente . . . . . . . . . . . . . . . . . 104
4.6. Anulando el campo menor . . . . . . . . . . . . . . . . . . . . 108
4.7. La corriente eléctrica . . . . . . . . . . . . . . . . . . . . . . . 110
4.8. Covariancia de la electrodinámica . . . . . . . . . . . . . . . 111

5. Tensores en la relatividad especial 119


5.1. Subı́ndices y superı́ndices . . . . . . . . . . . . . . . . . . . . 119
5.2. Los vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
5.3. Otros tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.4. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.5. Ecuaciones tensoriales . . . . . . . . . . . . . . . . . . . . . . 137
5.6. El principio de la relatividad . . . . . . . . . . . . . . . . . . 139
5.7. Los tensores m0 , xµ , dτ, U µ , pµ , k µ y J µ . . . . . . . . . . . 140
5.8. Aberración de la luz y efecto Doppler . . . . . . . . . . . . . 143

6. La electrodinámica
manifiestamente covariante 147
6.1. El cuadripotencial Aµ . . . . . . . . . . . . . . . . . . . . . . 148
6.2. Las dos ecuaciones de Maxwell . . . . . . . . . . . . . . . . . 150
6.3. La fuerza de Lorentz . . . . . . . . . . . . . . . . . . . . . . . 152
6.4. El tensor electromagnético . . . . . . . . . . . . . . . . . . . . 155
6.5. La transformación de los campos . . . . . . . . . . . . . . . . 158
6.6. Dos escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

iv
7. Las leyes de conservación 161
7.1. La nube de partı́culas . . . . . . . . . . . . . . . . . . . . . . 161
7.2. Otras corrientes . . . . . . . . . . . . . . . . . . . . . . . . . . 164
7.3. El tensor de energı́a y momentum . . . . . . . . . . . . . . . . 165
µν µν
7.4. ∂µ Tmec = 0 , ∂µ Tmec 6= 0 . . . . . . . . . . . . . . . . . . . . 166
7.5. La corriente de momentum angular . . . . . . . . . . . . . . . 172
7.6. Generalización . . . . . . . . . . . . . . . . . . . . . . . . . . 173

8. Dinámica lagrangiana 177


8.1. Teorı́a lagrangiana para una partı́cula . . . . . . . . . . . . . 177
8.2. Teorı́a lagrangiana para coordenadas continuas . . . . . . . . 185
8.3. El tensor energı́a-momentum . . . . . . . . . . . . . . . . . . 188
8.4. Formulación lagrangiana del campo electromagnético . . . . . 193

9. Transformaciones generales
de coordenadas 199
9.1. Subı́ndices y superı́ndices . . . . . . . . . . . . . . . . . . . . 199
9.2. Transformaciones generales . . . . . . . . . . . . . . . . . . . 202
9.3. Los vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
9.4. Otros tensores . . . . . . . . . . . . . . . . . . . . . . . . . . 207
9.5. La derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
9.6. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
9.7. Coordenadas esféricas . . . . . . . . . . . . . . . . . . . . . . 214
9.8. La relatividad especial . . . . . . . . . . . . . . . . . . . . . . 217
9.9. Ecuaciones tensoriales . . . . . . . . . . . . . . . . . . . . . . 218
9.10. Covariancia general . . . . . . . . . . . . . . . . . . . . . . . 220
9.11. El elemento invariante de volumen . . . . . . . . . . . . . . . 221
9.12. El sı́mbolo de Christoffel . . . . . . . . . . . . . . . . . . . . 222
9.13. La derivada covariante . . . . . . . . . . . . . . . . . . . . . 226
9.14. El tensor de Riemann . . . . . . . . . . . . . . . . . . . . . . 230
9.15. Plano y curvo . . . . . . . . . . . . . . . . . . . . . . . . . . 233
9.16. Coordenadas adaptadas . . . . . . . . . . . . . . . . . . . . . 236
9.17. Las identidades de Bianchi . . . . . . . . . . . . . . . . . . . 238
9.18. El tensor de Riemann es el único . . . . . . . . . . . . . . . . 240
9.19. Obligar a gµν a que tome el valor que queramos . . . . . . . 244
9.20. Dos transformaciones sucesivas . . . . . . . . . . . . . . . . . 246
9.21. Un ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248

v
10. Las geodésicas 253
10.1. La ecuación diferencial . . . . . . . . . . . . . . . . . . . . . . 253
10.2. Parámetros afines . . . . . . . . . . . . . . . . . . . . . . . . . 256
10.3. Constantes del movimiento . . . . . . . . . . . . . . . . . . . 258
10.4. Las ecuaciones algebraicas . . . . . . . . . . . . . . . . . . . . 260
10.5. Derivada a lo largo de una curva . . . . . . . . . . . . . . . . 267
10.6. Rαβµν y la curvatura . . . . . . . . . . . . . . . . . . . . . . . 269

11. El principio de equivalencia 273


11.1. El postulado de las geodésicas . . . . . . . . . . . . . . . . . 274
11.2. El principio de Galileo . . . . . . . . . . . . . . . . . . . . . . 275
11.3. Coordenadas geodésicas . . . . . . . . . . . . . . . . . . . . . 276
11.4. El principio de equivalencia . . . . . . . . . . . . . . . . . . . 277
11.5. El acople mı́nimo . . . . . . . . . . . . . . . . . . . . . . . . 281
11.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

12. La ecuación del campo gravitatorio 287


12.1. El lı́mite newtoniano . . . . . . . . . . . . . . . . . . . . . . . 288
12.2. Los 10 potenciales gµν . . . . . . . . . . . . . . . . . . . . . . 288
12.3. El potencial g00 en coordenadas cartesianas . . . . . . . . . . 290
12.4. La ecuación de Hilbert-Einstein . . . . . . . . . . . . . . . . . 292
12.5. Las coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . 298

13. La solución de Schwarzschild 301


13.1. Campo isótropo estático . . . . . . . . . . . . . . . . . . . . 301
13.2. La geometrı́a del espaciotiempo . . . . . . . . . . . . . . . . 307
13.3. Subespacios . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
13.4. Relojes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311
13.5. Corrimiento hacia el rojo . . . . . . . . . . . . . . . . . . . . 316
13.6. Constantes del movimiento . . . . . . . . . . . . . . . . . . . 317
13.7. Una tercera constante del movimiento . . . . . . . . . . . . . 319
13.8. J y D en términos de r, v y vϕ . . . . . . . . . . . . . . . . . 320
13.9. Las cuatro variables t, T, τ y λ . . . . . . . . . . . . . . . . . 323
13.10. La caı́da vertical . . . . . . . . . . . . . . . . . . . . . . . . 324
13.11. Potencial efectivo . . . . . . . . . . . . . . . . . . . . . . . . 328
13.12. Puntos de retorno . . . . . . . . . . . . . . . . . . . . . . . . 332
13.13. Eliminación del parámetro afı́n λ . . . . . . . . . . . . . . . 335
13.14. La variable u . . . . . . . . . . . . . . . . . . . . . . . . . . 336
13.15. Deflexión de un rayo de luz . . . . . . . . . . . . . . . . . . 338
13.16. La precesión anómala del perihelio de Mercurio . . . . . . . 339

vi
13.17. Coordenadas temporaloides y espacialoides . . . . . . . . . . 344
13.18. El cono de la luz . . . . . . . . . . . . . . . . . . . . . . . . 345
13.19. Singularidades . . . . . . . . . . . . . . . . . . . . . . . . . . 347
13.20. Las coordenadas de Kruskal-Szekeres . . . . . . . . . . . . . 349

A. La constancia de la velocidad de la luz 357


A.1. El principio de la relatividad . . . . . . . . . . . . . . . . . . 358
A.2. Transformaciones . . . . . . . . . . . . . . . . . . . . . . . . . 360
A.3. La velocidad de la luz . . . . . . . . . . . . . . . . . . . . . . 361
A.4. Las transformaciones de Lorentz . . . . . . . . . . . . . . . . 366
A.5. Regreso al campo . . . . . . . . . . . . . . . . . . . . . . . . . 367
A.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . 369

Bibliografı́a 373

vii
viii
Capı́tulo 1

El origen de la relatividad

En este primer capı́tulo nos proponemos construir las primeras bases de la


teorı́a especial de la relatividad. Comenzamos mostrando algunas de las di-
ficultades en que se hallaba la fı́sica a fines del siglo XIX; es allı́, en la crisis
del electromagnetismo, donde se encuentra el origen histórico de la relativi-
dad. Antes de revisar las dificultades de la fı́sica en esa época, conviene que
presentemos un recuento breve de la polémica ondas-corpúsculos que acom-
pañaba a la óptica desde siglos atrás.

Para darle fundamento a la teorı́a ondulatoria de la luz, los cientı́ficos de


los siglos XVIII y XIX se apoyaron en aquella otra onda que conocı́an bi-
en, el sonido, en un intento por sacar de allı́ los elementos conceptuales que
pudieran servirles para la luz. Ellos tenı́an muy claro que la onda acústica se
propaga en medios elásticos como el aire, el agua, los cuerpos sólidos, etc., y
que, sin el medio, la onda no puede propagarse. Para trasladar este concepto
al estudio de la luz, era necesario aceptar la existencia de un medio (al que
llamaron éter) que soportara la propagación de la onda luminosa.

El concepto del éter penetró con dificultad en la fı́sica teórica; para ajus-
tarlo al conocimiento de la época, los cientı́ficos tuvieron que admitir que él
debı́a tener un conjunto de propiedades extrañas, absurdas y contradictorias.
Aún ası́, los fı́sicos se aferraron a su creencia en el éter, ese medio curioso
que cumplı́a una doble función: de un lado, supuestamente soportaba a las
ondas electromagnéticas, y de otro lado era como una corporización del es-
pacio absoluto en que se apoyaba la mecánica newtoniana. Era importante
que la idea del éter tuviera un respaldo experimental, y el instrumental ópti-
co de fines del siglo XIX contaba ya con la precisión suficiente para medir
la velocidad v que nuestro planeta supuestamente tenı́a respecto al éter. El
experimento de Michelson y Morley dio un resultado sorpresivo: v debe ser

1
cero. Este resultado no es ilógico, pero sı́ es increı́ble.

Nuestra presentación se basa fuertemente en el experimento de Michelson


y Morley. Hemos preferido esta ruta didáctica porque el análisis del experi-
mento trae unas ventajas pedagógicas que no podemos despreciar. Tal como
veremos, el estudio de este experimento dispara una variedad de ideas sug-
estivas que se conectan con el principio de la constancia de la velocidad de
la luz y con el principio de la relatividad. No se nos escapa que nuestra
presentación es cuestionable, en cuanto los historiadores aceptan1 que el ex-
perimento no fue decisivo en las motivaciones que tuvo el joven Einstein en
aquellos años de creación de la teorı́a.

El principio de la relatividad, que dice que lo que ocurre para un observador


inercial también puede ocurrir para cualquier otro observador inercial, lo
aceptaron los cientı́ficos desde el siglo XVIII, cuando se dieron las bases de
la ciencia. Pero lo aceptaban únicamente para experiencias de mecánica, co-
mo las que se realizan con resortes, péndulos, planos inclinados, etc. Habı́a
otro conjunto de experiencias para las cuales no creı́an que valiera el prin-
cipio de la relatividad: las de la electricidad y el magnetismo. ¿Por qué los
cientı́ficos anteriores a 1905 pensaban que el Principio no se aplica a los
fenómenos electromagnéticos? Porque ellos creı́an, equivocadamente, que el
espacio y el tiempo tienen una estructura galileana. La teorı́a de la rela-
tividad encuentra la verdadera estructura y demuestra que, dentro de esta
estructura, el principio de la relatividad sı́ abarca los fenómenos del electro-
magnetismo, asuntos que estudiaremos en los capı́tulos 4 y 6.

Se puede pensar que la parte fuerte de la teorı́a de la relatividad es en-


contrar la estructura verdadera del espaciotiempo y que, después, la teorı́a
electromagnética resulta válida para todos los observadores inerciales; este
es el punto de vista que se sigue en el capı́tulo presente. Pero también se

1
Einstein conoció antes de 1905 los resultados del experimento de Michelson y Morley.
Decimos esto porque se sabe que él habı́a estudiado el artı́culo [1] de Lorentz de 1895 en
el que el fı́sico holandés discutı́a en detalle los resultados del experimento. El experimento
impresionó a muchos, pero no a Einstein. ¿Por qué no? Porque él ya sabı́a que el resul-
tado del experimento tenı́a que ser nulo, simple y llanamente porque el éter era, para él,
inexistente. El Michelson-Morley no fue lo que condujo a Einstein hacia la relatividad.
Cuando, años después, le preguntaron a Einstein sobre las motivaciones que habı́a tenido
para formular la relatividad especial, respondió que la aberración y el experimento de
Fizeau le mostraron el camino, y que ellos dos “fueron suficientes”. Estas dos palabras de
Einstein son, según Pais, “la declaración más crucial que Einstein jamás hiciera acerca de
los orı́genes de la teorı́a de la relatividad”[?].

2
puede pensar que la parte fuerte de la teorı́a es su motivación: que las leyes
electromagnéticas sean válidas para todos los observadores inerciales; y que
para darle cumplimiento a esa motivación es necesario averiguar cuál es la
estructura verdadera del espaciotiempo. Este segundo punto de vista se sigue
en el apéndice.

1.1 Corpúsculos y ondas


La óptica moderna nació en el siglo XVII, cuando los cientı́ficos lograron
controlar, en el laboratorio, los fenómenos básicos de la luz. Animados por
el espı́ritu experimental, estudiaron la propagación rectilı́nea de un rayo de
luz, la descomposición espectral, la polarización, difracción e interferencia.
Esta fase inicial de la óptica se dio dentro de un debate intenso respecto
a la naturaleza de la luz, ya que unos creı́an que la luz estaba compuesta
de corpúsculos, mientras otros preferı́an pensar a la luz como un fenómeno
ondulatorio.

La interpretación ondulatoria mostró su eficacia al explicar los fenómenos


de difracción y de interferencia en láminas delgadas. La base teórica de la
visión ondulatoria está en el principio de Huygens, según el cual todo punto
de un frente de onda origina una onda esférica secundaria, y el frente de on-
da está formado por la envolvente de las ondas secundarias emitidas por el
frente anterior. La potencia explicativa de este principio se manifestó rápida-
mente, porque condujo a una visión cuantitativa y exacta de la interferencia
y la difracción, y permitió deducir, con argumentos elementales, la ley de
refracción de Snell. La interpretación ondulatoria de la luz tuvo numerosos
adeptos, aunque se debe tener en cuenta que la palabra onda no significaba
lo mismo para todos. Huygens, por ejemplo, no concebı́a la onda como una
perturbación continua, con longitud de onda, sino más bien como pulsos de
duración finita.

Los primeros seguidores de la interpretación ondulatoria se encontraron


con un escollo que no pudieron vencer, que es la polarización de la luz. La
teorı́a ondulatoria inicial, con ondas longitudinales, no pudo explicar la po-
larización, ya que ésta pone de manifiesto unas propiedades perpendiculares
a la dirección de propagación. En cambio, los seguidores de la interpretación
corpuscular sı́ tenı́an al menos un intento de explicación, propuesto por New-
ton: “la luz tiene lados”, enunciado que hoy se interpreta como si él hubiera
querido decir que los corpúsculos luminosos son ovalados y se pueden ajustar

3
ası́ a las exigencias de las placas de polarización.

Que la teorı́a ondulatoria inicial fuera incapaz de explicar la polarización


de la luz incomodaba a muchos, y fue lo que condujo a Newton a preferir la
teorı́a corpuscular. Es justo anotar, sin embargo, que él nunca tomó partido
decidido por ninguna de las dos teorı́as de la luz, y por eso carece de funda-
mento la creencia, altamente generalizada, de que Newton fuera el padre de
la teorı́a corpuscular.

Uno de los seguidores más importantes de la interpretación corpuscular fue


Bradley quien, con una serie de observaciones astronómicas, descubrió la
aberración de la luz de las estrellas. Interpretando la luz como corpúsculos,
el inglés explicó este efecto, midió la velocidad de la luz y demostró, por
primera vez, que la Tierra se mueve anualmente alrededor del Sol. Estas ob-
servaciones astronómicas y la explicación subsecuente aportada por Bradley,
se dieron en un perı́odo dominado por la interpretación corpuscular. En efec-
to, ésta se impuso durante casi todo el siglo XVIII.

Pero en los primeros años del XIX resurgió vigorosamente la idea ondu-
latoria, debido, en parte, a la gran precisión, nunca antes vista, que se es-
taba logrando en los experimentos de interferencia y difracción. A Young
se le ocurre una idea que habrı́a de cambiar radicalmente el rumbo de la
óptica: la polarización se entiende fácilmente si las ondas de la luz no son
longitudinales, sino transversales. Fresnel toma esta idea y en poco tiempo
reconstruye toda la teorı́a de interferencia, difracción, refracción y polar-
ización a partir de ondas transversales. Renovada, la teorı́a ondulatoria fue
capaz de explicar una gran variedad de fenómenos de interferencia y difrac-
ción, y también pudo hacer predicciones, como por ejemplo esta: Si un haz
de luz que ha pasado por un agujero bien pequeño se dirige hacia un disco
opaco, como una moneda por ejemplo, entonces detrás del disco, en el eje
óptico, no todo es obscuridad, sino que en cierto lugar deberá aparecer un
punto brillante; en la zona de la sombra debe aparecer un punto brillante.
Una predicción de estas, tan puntual y precisa, no puede pasar desapercibida
a los rivales de la teorı́a ondulatoria, entre los que se contaba Poisson. Este
matemático y fı́sico francés piensa que no puede haber un punto brillante
en la región de las sombras y que, por consiguiente, la predicción debe estar
equivocada.

La teorı́a undulatoria substituyó a la corpuscular tan súbitamente, que po-


drı́amos decir que el cambio se efectuó “de un dı́a para otro”. Fresnel presen-

4
ta su teorı́a ondulatoria a la Academia Francesa en 1815. Poisson se opone a
esta teorı́a y, para atacarla, trae a cuento la predicción del punto brillante en
la sombra de la moneda. Arago recibe la objeción de Poisson como un reto
y se dispone a montar un experimento para establecer si tal punto brillante
verdaderamente existe o no; y mostró a los académicos pasmados, en una
escena memorable de la historia de la fı́sica, el puntico brillante en medio de
la sombra. La teorı́a ondulatoria fue acatada desde ese momento.

1.2 El éter
Anotamos arriba que el sonido era bien conocido y se le entendı́a, correc-
tamente, como las vibraciones longitudinales de un medio material, bien
sea gaseoso, lı́quido o sólido. También apuntamos que los primeros ópticos
partidarios de la teorı́a ondulatoria trasladaron a la luz las propiedades cono-
cidas del sonido: la luz debe de ser una vibración longitudinal. Pero, ¿qué es
lo que vibra en los fenómenos luminosos? Hoy por hoy se acepta que lo que
vibra es el campo electromagnético, y que esta ondulación puede darse en el
vacı́o, pero en la cultura de los siglos anteriores la idea del vacı́o era difı́cil
de aceptar. Que el espacio entre los astros pueda estar vacı́o era inadmisible,
porque los hombres tenı́an horror a la idea del vacı́o. Prefirieron pensar en
una substancia que rellena tal espacio, un medio a través del cual viajan
los astros y la luz: estas son las caracterı́sticas principales de lo que se ha
denominado2 el éter3 .

No hay una definición precisa4 de en qué consiste este medio transmisor de


la luz, el éter, pero podemos reseñar algunas de sus propiedades. El éter debe
invadir todo el universo, porque de lo contrario no podrı́amos recibir la luz
que proviene de las estrellas. Debe ser suficientemente rı́gido para transmitir
las ondas con una velocidad tan grande. Un medio con estas caracterı́sticas
debe causar rozamiento en los planetas, motivando ası́ un frenado, un retar-
do en sus trayectorias. Sin embargo, un frenado acumulado serı́a fácilmente
2
La palabra éter tiene varios significados. El que estamos discutiendo es el éter lu-
minı́fero. Este se debe distinguir del éter etı́lico, que es un gas usado en medicina como
antiespasmódoco y anestésico.
3
La teorı́a corpuscular se basa en la supuesta existencia de las partı́culas luminı́feras;
dado que éstas podrı́an perfectamente propagarse en el vacı́o, la teorı́a corpuscular no
necesita éter. Pero la ondulatoria es hermana del éter.
4
El Diccionario de la Real Academia Española de 1780 trae esta definición de éter: /La
esfera, ó cielo del fuego/Se toma tambien muy freqüentemente por la substancia celeste y
pura desde la atmósfera arriba, por la cual caminan los astros.

5
detectable en las observaciones astronómicas y, dado que los astrónomos no
han notado el más mı́nimo indicio de frenado, se concluye que el éter debe
ser un gas delgadı́simo, muy sutil: cuando los astros viajan en el espacio no
lo notan, porque el éter se cuela a través de ellos libremente, ası́ “como la
brisa fluye entre los árboles con poca o ninguna oposición”. Mientras la luz
sea ondas longitudinales, el éter como un gas sutil no está mal; pero, tal co-
mo hemos mencionado, la teorı́a ondulatoria pasó de ondas longitudinales a
transversales y aquı́ hay un problema, ya que los gases no transmiten ondas
transversas. Para que el éter transmita las nuevas ondas transversas de la
luz, debe ser un sólido. Y como la velocidad de la luz es tan alta, el sólido
debe ser muy elástico y muy rı́gido. En conclusión, el éter luminı́fero es una
substancia que no atrae ni es atraı́da gravitacionalmente, inmóvil, transpar-
ente, sólida, rı́gida, elástica y se cuela entre los objetos móviles sin rozarlos.

Debemos entender que un medio transmisor tan contradictorio se presta a


múltiples interpretaciones. Se propusieron toda clase de explicaciones. Fres-
nel5 dice que un medio óptico de ı́ndice de refracción n, cuando se mueve
con velocidad v, arrastra parcialmente al éter consigo y le imparte6 una ve-
locidad (1 − n−2 )v. Para Stokes el éter es completamente arrastrado por un
cuerpo en movimiento. Lorentz propone que no hay arrastre de éter, sino
que hay un parámetro temporal efectivo dado por t0 = t−vx/c2 . Planck dice
que probablemente el éter es compresible y se acumula con gran densidad
alrededor de los cuerpos grandes.

En el siglo XIX se dan los grandes avances del electromagnetismo, no sólo en


el lado experimental, sino además en el teórico. A fines de ese siglo se pro-
duce una compilación de la teorı́a electromagnética, una reunión expresada
en las cuatro ecuaciones de Maxwell. Estas ecuaciones hacen una predicción
definitiva: debe haber ondas electromagnéticas, y éstas tienen una velocidad
c que es la misma en todas las direcciones. Con esto queremos decir que la
velocidad c de un pulso de luz tiene una magnitud c que no depende de la
dirección del vector c. En pocas palabras, la velocidad de la luz es isótropa.
Pero hay un detalle crucial acerca de esta isotropı́a, y es que como las ecua-
ciones de Maxwell se consideraban válidas únicamente para un observador
inercial O en reposo respecto al éter, la velocidad de la luz se consideraba,
5
Fresnel fue quien más empeño puso en fundamentar el concepto del medio transmisor
de la onda luminosa, y se le considera el padre de la hipótesis etérea. Es él quien introduce
la idea del éter en reposo absoluto en 1818, y quien hace los esfuerzos iniciales para
someterlo a la observación experimental.
6
Véase la ecuación (2.31).

6
también, que era isótropa únicamente respecto a O: se pensaba que para
los otros observadores inerciales la velocidad de la luz no podı́a ser isótropa.
Veamos esto.

Consideremos un observador inercial O0 que se mueve con velocidad v re-


specto a O. Llamaremos c 0 a la velocidad del pulso de luz respecto a O0 .
Quizás no sea equivocado pensar que

c0 = c − v (1.1)

Esta ecuación implica que:

c02 = c2 + v 2 − 2vc cos θ , (1.2)

donde θ es el ángulo que se forma entre c y v . La Figura 1.1 muestra los


vectores c, v y c 0 , el ángulo θ, y el ángulo θ0 que se forma entre c 0 y v .
En esta figura se ve claramente que c cos θ = v + c0 cos θ0 . Remplazando este
valor en el lado derecho de (1.2) se llega a:

c02 = c2 + v 2 − 2v(v + c0 cos θ0 )

c02 + 2v cos θ0 c0 − (c2 − v 2 ) = 0

Esta última es una ecuación de segundo grado, y sus dos soluciones son

" r #
v v2
c = c − cos θ0 ±
0
1 − 2 sen2 θ0
c c

La solución con el signo inferior da una c0 negativa, y por eso es inaceptable.


Queda la solución del signo superior:

" r #
v v2
c0 = c − cos θ0 + 1 − 2 sen2 θ0 (1.3)
c c

Nótese que c0 depende explı́citamente de θ0 : la velocidad c0 de la luz es

7
anisótropa. En O se cumplen las ecuaciones de Maxwell y por consiguiente
la velocidad de la luz es isótropa. En O0 la velocidad de la luz es anisótropa, o
sea que para ese observador no se deben cumplir las ecuaciones de Maxwell.
Hemos llegado a una idea importante: si la fórmula (1.1) es válida, las ecua-
ciones de Maxwell se cumplen únicamente para un observador inercial. Este
observador es especial, privilegiado.

Serı́a interesante averiguar la velocidad v de la Tierra respecto a O. Si dec-


imos que O0 es un laboratorio fijo en la Tierra, la ecuación (1.1) podrı́a
utilizarse para medir v: la anisotropı́a de la velocidad c0 indicarı́a la mag-
nitud de v. La gran dificultad experimental se centra en el hecho de que
en (1.1) ocurre la fracción v/c que, presumiblemente, es muy pequeña. En
efecto, las velocidades involucradas con nuestro planeta son muy bajas en
comparación con c; por ejemplo, la velocidad de la Tierra respecto al Sol es
tan sólo 30 km/s, es decir, 104 veces más pequeña que c. Se necesitarı́a un
instrumental sumamente fino para averiguar la v de la Tierra a través de la
fórmula (1.1). Ocurrı́a, felizmente, que a fines del siglo XIX los instrumentos
ópticos ya habı́an alcanzado un nivel de precisión suficiente.

1.3 El experimento de Michelson y Morley


El interferómetro de Michelson está capacitado para mostrar la supuesta
anisotropı́a de la velocidad c0 . La luz incide sobre un espejo semitranspar-
ente P colocado a 45o , de modo que en P emergen dos rayos perpendiculares.
Uno de los rayos va hacia el punto A, donde hay un espejo; el otro rayo va
hacia el punto B, donde hay otro espejo. Los rayos reflejados en los espejos
A y B se reúnen finalmente en una pantalla de observación, como muestra
la Figura 1.2.

En la pantalla se observa la interferencia de las señales que provienen de


los espejos que hay en A y B. Llamemos t0P AP al tiempo total que tarda
la luz para recorrer el trayecto P AP , y t0P BP para el trayecto P BP . La
interferencia en la pantalla depende del retardo t0P AP − t0P BP de una señal
respecto a la otra. Si t0P AP − t0P BP es un número entero de perı́odos, hay in-
terferencia constructiva y la pantalla muestra mucho brillo, alta intensidad.
Y si t0P AP − t0P BP es un número impar de semiperı́odos, se observa interfer-
encia destructiva: cero intensidad y pantalla opaca. En el experimento se usa
un interferómetro cuyos brazos P A y P B tienen la misma longitud L. Si la
velocidad c0 de la luz fuera la misma en todas las direcciones, la luz demor-

8
arı́a el mismo tiempo recorriendo los trayectos P AP y P BP , y se observarı́a
interferencia constructiva en la pantalla. Pero la fórmula (1.3) afirma que c0
es anisótropa y, en consecuencia, el retardo t0P AP − t0P BP también debe ser
anisótropo: esto significa que el grado de interferencia en la pantalla debe
depender de la orientación que se le dé al interferómetro.

Veamos el análisis que hace un observador en reposo respecto a la Tier-


ra. Llamamos α al ángulo formado por v y la dirección P A, como muestra
la Figura 1.2. Para el recorrido P A hacemos θ0 = α en la fórmula (1.3):

" r #
v v2
c0 = c − cos α + 1 − 2 sen2 α
c c

El tiempo que demora la luz en este trayecto es L/c0 :

" r #−1
L v v2
t0P A = − cos α + 1 − 2 sen2 α
c c c

Para el trayecto AP hacemos θ0 = α + π en la fórmula (1.3). Para el trayecto


P B hacemos θ0 = α + π/2 y para BP se tiene θ0 = α − π/2. Llegamos a

" r #−1
L v v2
t0AP = + cos α + 1 − 2 sen2 α
c c c

" r #−1
L v v2
t0P B = + sen α + 1 − 2 cos2 α
c c c

" r #−1
L v v2
t0BP = − sen α + 1 − 2 cos2 α
c c c

El retardo t0P AP − t0P BP es la diferencia (t0P A + t0AP ) − (t0P B + t0BP ):

"r r #
2L/c v2 v2
t0P AP − t0P BP = 1 − 2 sen2 α − 1 − 2 cos2 α (1.4)
1 − v 2 /c2 c c

9
Al mirar esta ecuación, concentremos nuestra atención en tres de las vari-
ables que en ella participan: t0P AP − t0P BP corresponde al grado de interfer-
encia, α es la orientación que se le da al interferómetro y v es la velocidad de
la Tierra. Escogiendo un α y midiendo el grado de interferencia, deberı́amos
ser capaces de deducir el valor de v. El problema es que el grado de inter-
ferencia no es una cantidad fácil de medir. Por tal motivo, no es aconsejable
que se use un sólo valor de α, sino permitir que α tome todos los valores
dentro de un rango continuo. En tal caso nos interesa tomar la derivada de
t0P AP − t0P BP respecto a α:

d 0
(t − t0P BP ) =
dα P AP  
(Lv 2 /c3 ) sen 2α  1 1  (1.5)
− r + r 
1 − v /c2 2  2 2 
v v
1 − 2 sen2 α 1 − 2 cos2 α
c c

Podrı́amos utilizar esta ecuación si α cambiara a medida que pasa el tiempo,


es decir, si el interferómetro, como un todo, se hiciera rotar continuamente.
En tales circunstancias el patrón de interferencia deberı́a ir cambiando a
medida que pasa el tiempo. Michelson y Morley efectivamente montaron
el interferómetro sobre un “lago” de mercurio, lo que les permitió rotar-
lo suave y continuamente. ¿Qué esperaban ellos? Ellos esperaban que, a
medida que rotaran el espectrómetro, el patrón de interferencia fuera cam-
biando paulatinamente. Pero, para su sorpresa, el patrón de interferencia
permaneció inmutable, sin mostrar ningún cambio paulatino. Esto significa
que la derivada (1.5) tiene que ser cero para todos los valores del ángulo α.
Haciendo (1.5) igual a cero se llega a:

r r
2 v2 v2
v 1 − 2 cos2 α = −v 2 1− sen2 α (1.6)
c c2

Esta ecuación corresponde al resultado experimental. Hay dos posibilidades:


La primera es v = 0. La segunda posibilidad es v 6= 0; pero si v 6= 0 la
ecuación (1.6) es absurda; no puede ser válida, porque implica que una can-
tidad positiva iguale a una cantidad negativa.

La única implicación válida de (1.6) es v = 0. Esta conclusión dice que

10
la Tierra estarı́a en reposo respecto al éter; la Tierra serı́a ese único y priv-
ilegiado observador en el que se cumplen las ecuaciones de Maxwell, ese
observador en el que la velocidad de la luz es isótropa. Eso es increı́ble.

Como el análisis de los resultados del experimento conduce a una conclusión


increı́ble, nos vemos impulsados a pensar que alguna de las suposiciones en
que se basa el análisis está probablemente equivocada. Volviendo sobre los
pasos del estudio recién hecho, nos damos cuenta de que la suposición (1.1)
es el paso débil, el que podemos abandonar. De ahora en adelante vamos a
pensar que (1.1) es falsa. En nuestro haber tenemos un hecho experimental
y una guı́a teórica:

El hecho experimental: la velocidad de la luz es isótropa respecto a la Tierra.


La guı́a teórica: la ecuación (1.1) es falsa.

El hecho experimental trae consigo una pregunta inmediata: ¿acaso el plan-


eta Tierra es el único observador respecto al cual la velocidad de la luz es
isótropa? Nos parece prudente responder de esta manera: No vemos ninguna
razón que nos lleve a pensar que este planeta es especial; si la velocidad de
la luz es isótropa respecto al observador inercial O0 , se espera que también
sea isótropa respecto a todos los otros observadores inerciales O00 , O000 , ...etc:
todas las velocidades c, c0 , c00 , c000 , ... etc. deben ser isótropas. Demos un salto
adicional: supongamos que c = c0 = c00 = c000 ... El salto, en palabras, dice
que la velocidad de la luz es la misma para todos los observadores inerciales.
Este enunciado es El Principio de la Constancia de la Velocidad de la Luz.

De otro lado, la frase escrita en bastardilla en la página 8 señala que la


ecuación (1.1) es un impedimento; si ahora adoptamos la guı́a teórica recién
mencionada, desaparece el impedimento y se nos abre un camino interesante:
la posibilidad de que las ecuaciones de Maxwell sean válidas para todos los
observadores inerciales.

1.4 La transformación de Galileo


El siguiente conjunto de ecuaciones:

t0 = t
(1.7)
r0 = r − v t

11
recibe el nombre de la transformación de Galileo 7 . Tomando una derivada
temporal se llega a la fórmula galileana para la adición de velocidades:

u0 = u − v , (1.8)

y tomando otra derivada temporal:

a0 = a (1.9)

Estas ecuaciones son tradicionales en la fı́sica clásica. Han tenido gran pres-
tigio por dos razones: primero, porque la ecuación (1.8) es cercana a nuestra
intuición, nos parece “natural” y razonable; y segundo, porque la teorı́a de la
mecánica newtoniana es invariante bajo las transformaciones (1.7). Nótese
de paso que haciendo u = c y u 0 = c 0 , la ecuación (1.8) se convierte en
(1.1). Esto muestra que en el fondo de (1.1) está (1.8); dado que queremos
abandonar (1.1), lo que verdaderamente queremos abandonar es la transfor-
mación de Galileo (1.8). La teorı́a de la relatividad repudia la transformación
de Galileo.

Queremos substituir la transformación de Galileo por otra que esté de acuer-


do con la isotropı́a de u 0 que resulta en el experimento de Michelson y Mor-
ley. Para encontrar la nueva transformación nos basaremos en estos tres
postulados:

1) El Principio de la Constancia de la Velocidad de la Luz.


2) El Principio de la Relatividad. (1.10)
3) El Principio de la Homogeneidad del Espacio y el Tiempo.

Las próximas secciones están dedicadas a la descripción de estos tres postu-


lados.

1.5 La constancia de la velocidad de la luz


La velocidad de la luz en el vacı́o es la misma para todos los observadores
inerciales: éste es el principio de la constancia de la velocidad de la luz.
7
Ası́ la llamó Philipp Frank en 1909.

12
El sentido de este principio se puede entender con el siguiente ejemplo.
Supongamos que alguien apunta una linterna hacia el norte, la prende, y
un instante después la apaga; de este modo se forma un pulso de luz que
viaja hacia el norte. La velocidad de este pulso es 300.000 km/s. Pensemos
en un observador inercial que también viaja hacia el norte en un cohete de
alta velocidad; si este observador mide la velocidad del pulso de luz, obtiene
300.000 km/s. Pensemos en otro observador inercial que viaja hacia el sur
en un cohete de alta velocidad; si este observador mide la velocidad del pul-
so de luz, obtiene 300.000 km/s. Pensemos aún en otro observador inercial
que viaja hacia el oriente; si mide la velocidad del pulso de luz, obtiene
300.000 km/s. Todos los observadores inerciales, los lentos, los veloces, los
que viajan en esta dirección, los que viajan en esa otra dirección, todos ellos
registran que la velocidad del pulso de luz es 300.000 km/s. Cualquiera que
sea el estado de movimiento del observador inercial, él siempre registra que
la velocidad del pulso es 300.000 km/s. Si el observador persigue al pulso
con intención de darle alcance, nunca lo logra, porque el pulso se aleja con
velocidad 300.000 km/s. Y si el observador huye del pulso de luz, de nada
le vale viajar muy rápido porque el pulso siempre tendrá velocidad 300.000
km/s.

El principio que estamos discutiendo afirma que la velocidad de la luz es


independiente de la velocidad relativa entre el observador y la fuente de luz.
Si este principio es válido, el resultado del experimento de Michelson y Mor-
ley no presenta ninguna paradoja y es enteramente entendible: la luz tiene
la misma velocidad en los dos brazos del interferómetro y por consiguiente
tarda lo mismo en recorrer ambas rutas, o sea que las franjas de interferencia
no tienen por qué mostrar variaciones. No hay tal cosa como “la velocidad de
la luz respecto al éter”, éste queda devaluado y se puede incluso considerar
la posibilidad de erradicarlo de la fı́sica.

1.6 El principio de la relatividad


La experiencia de viajar en automóvil en lı́nea recta y a velocidad constante
es muy simple: no se siente nada especial. Uno puede comer, tomar café y
recoger un lápiz que se cayó, del mismo modo como se realizan esas activi-
dades en casa. En realidad las experiencias en el carro y en casa son iguales.
Estamos poniendo de manifiesto una de las observaciones más importantes
de la fı́sica, al establecer que todos los observadores inerciales son equiva-
lentes. Esto, que ningún observador inercial es preferido, es lo que afirma el

13
Principio de la Relatividad: lo que ocurre para un observador inercial tam-
bién puede ocurrir para cualquier otro observador inercial. Las leyes de la
fı́sica son las mismas para todos los sistemas inerciales.

¿Cómo se aplica este principio, de qué modo se implementa en las ecua-


ciones de la fı́sica? Para responder esta pregunta presentemos un ejemplo: la
ley de la conservación del momentum debe ser válida en todos los sistemas
inerciales. Esta ley de conservación se expresa mediante una ecuación; lo que
el principio de la relatividad afirma es que tal ecuación se cumple para todos
los observadores inerciales. Más concretamente, pensemos en el choque de
dos partı́culas, llamando pa al momentum total antes del choque, y pd al mo-
mentum total después del choque. La ley de la conservación del momentum
dice que

pa = pd (1.11)

Esto es lo que registra un observador inercial O. Ahora introducimos otro


observador inercial O0 . El nuevo observador registra que el momentum antes
del choque es p0a , y después p0d ; este observador también registra que se
conserva el momentum:

p0a = p0d (1.12)

Nótese que las ecuaciones (1.11) y (1.12) tienen la misma forma. La ecuación
que expresa la ley de conservación tiene la misma forma para todos los
observadores inerciales. Este ejemplo del choque de dos partı́culas nos ha
servido para ver la manera como se expresa, formalmente, el principio de
la relatividad: las ecuaciones que representan las leyes de la fı́sica tienen la
misma forma para todos los observadores inerciales.

1.7 Homogeneidad del espacio y el tiempo


La observación directa nos permite afirmar que la Luna da una vuelta alrede-
dor de la Tierra en 28 dı́as, y ésta da una vuelta alrededor del Sol en 365
dı́as. Si el sistema solar en pleno se trasladara a otro lugar B del universo,
allá funcionarı́a como funciona aquı́, sin ninguna modificación: la “nueva”
Luna tomarı́a 28 dı́as para darle una vuelta a la “nueva” Tierra, y ésta darı́a
una vuelta alrededor del “nuevo” Sol en 365 dı́as. Pensamos que el sistema
solar funcionarı́a lo mismo en un lugar A y en otro B. Respecto al tiempo

14
tenemos una idea similar: si el sistema solar se trasladara en pleno al futuro
o al pasado, funcionarı́a como funciona ahora, sin ninguna modificación.

Conviene anotar que las ideas recién expresadas se basan en la suposición


de que el sistema solar está aislado del exterior, o al menos suficientemente
aislado. En general, cualquier sistema aislado funcionarı́a lo mismo si se le
trasladara en el espacio, y también funcionarı́a lo mismo si se le trasladara
en el tiempo. Dicho de otra manera, todos los puntos del espacio son equiv-
alentes, y todos los instantes son equivalentes: éste es el principio de la
homogeneidad del tiempo y el espacio.

Las interacciones que se dan entre los objetos fı́sicos que pueblan el universo
hacen que en un lugar ocurran fenómenos diferentes de los que ocurren en
otro lugar: no es lo mismo pararse en la superficie de la Luna y pararse en
la superficie de la Tierra. La diferencia entre estos dos lugares no indica
que esos puntos del espacio sean inequivalentes; la diferencia proviene de las
interacciones que se dan entre los objetos fı́sicos que hay en el universo.

1.8 El concepto de observador


Las coordenadas (x, y, z) de los puntos del espacio se pueden establecer con
relojes y pulsos de luz, como explicaremos enseguida. En un punto del espa-
cio tenemos un reloj; enviamos un pulso de luz a otro punto donde hay un
espejo, y esperamos a que el pulso regrese al punto inicial. Registramos el
tiempo ∆t que toma el pulso en el viaje total de ida y vuelta, y finalmente
decimos que la distancia entre los dos puntos es 12 c∆t. De esta manera se
establecen las distancias entre todos los puntos y podemos calibrar o marcar
las escalas de los tres ejes cartesianos. Todo punto en el espacio se caracter-
iza por medio de sus tres coordenadas (x, y, z).

Ahora suponemos que en todo punto del espacio hay un reloj en reposo,
formándose ası́ una gran red tridimensional, rı́gida e infinita. A esta gran
malla rı́gida de relojes se le llama observador. Si suponemos que todos los
relojes son igualmente construidos, podemos afirmar que marchan a la mis-
ma frecuencia. A pesar de que tengan la misma frecuencia, los relojes podrı́an
estar descuadrados, es decir, podrı́a ser que marquen horas diferentes por
haber comenzado a marchar en diferentes instantes. Es preciso sincronizar-
los. Para sincronizar dos relojes, el reloj uno envı́a un pulso de luz hacia el
reloj dos, y mide el tiempo ∆t que tarda el pulso en ir y regresar. Supong-

15
amos que ∆t = 6 minutos. Más tarde, cuando en el reloj uno sean las 3:57
p.m., el reloj uno envı́a otra señal luminosa hacia el reloj dos con la siguiente
instrucción: “en el instante en que reciba esta señal, cuadre las manecillas de
su reloj en la hora 4:00 p.m.”. De esta manera se pueden sincronizar todos
los relojes de un observador inercial. En lo sucesivo, siempre que hablemos
de observador inercial, hemos de entender que sus relojes están sincroniza-
dos.

Veamos de qué manera este observador registra el vuelo de una partı́cula


puntual. A medida que transcurre el tiempo, la partı́cula visita un punto, y
otro, y otro, y los relojes de los puntos visitados registran a qué hora fueron
visitados. Luego se recogen todos los registros y se reconstruye la trayec-
toria: la partı́cula pasó por tal punto en tal instante, pasó por aquel otro
punto en este otro instante, etc. Ası́ se establece la posición de la partı́cula
como función del tiempo. Nótese que los relojes no necesitan enviar datos a
un computador central ni hay un reloj principal: el observador no es un ser
humano que usa la vista, sino que es un látice infinito con un reloj en cada
punto.

Llamemos O a un observador inercial, y O0 a otro observador inercial que


se mueve con cierta velocidad (constante) v respecto a O. Nos imaginamos
dos mallas de relojes, una para O y otra para O0 ; las dos mallas se cuelan
una a través de la otra, y cada una de ellas tiene su propio sistema de co-
ordenadas. En cada punto del espacio hay dos relojes, uno pertenece a O
y el otro pertenece O0 , de manera que el de O0 se desplaza con velocidad
v respecto al de O. Podemos pensar que hay un número infinito de obser-
vadores inerciales, y cada uno es una malla rı́gida de relojes; estas mallas
se cuelan unas entre las otras; en cada punto del espacio hay un número
infinito de relojes que pertenecen a todos los observadores inerciales. Todos
los observadores inerciales son igualmente dignos, no hay ninguno preferido,
todos registran las mismas leyes de la fı́sica: las ecuaciones que expresan las
leyes de la fı́sica tienen la misma forma para todos estos observadores.

Como todos los observadores inerciales están en un plano de igualdad, no


habiendo ninguno que sea especial, desaparecen las nociones de espacio y
tiempo absolutos. Cada observador tiene pleno derecho a medir distancias
y tiempos, y los resultados de sus mediciones son distancias verdaderas y
tiempos verdaderos. Aquı́ se establece una diferencia radical con la fı́sica
preeinsteiniana. En esa fı́sica la variable t se refiere al tiempo absoluto, ese
flujo imperturbable dentro del cual se suponı́a que las cosas del mundo fı́sico

16
están inscritas. En la relatividad especial t es lo que marca un reloj.

Nota. Antes de concluir esta sección queremos hacer un comentario ac-


erca de la velocidad que puede tener un observador inercial respecto a otro.
El lector notará, obviamente, que esta nota desubicada introduce un elemen-
to de desorden, pero aún ası́ queremos presentarla desde ya, porque pronto
nos será útil. Supongamos que deseamos acelerar una partı́cula masiva con
el propósito de que adquiera la velocidad de la luz c. Tal como veremos en
la sección 3.5, cuando estudiemos la dinámica relativista, para realizar este
proceso habrı́a que darle a la partı́cula una energı́a infinita, y por eso es
imposible: no se puede acelerar una partı́cula masiva hasta darle la veloci-
dad c. Esta afirmación está de acuerdo con el hecho de que no se observan
partı́culas masivas que viajen a la velocidad de la luz. Los laboratorios (los
laboratorios constan de objetos masivos como relojes) tienen velocidades que
son menores que c: la velocidad relativa entre dos observadores inerciales es
siempre menor que c.

1.9 Transformaciones de coordenadas


Un evento es un punto en el espaciotiempo. Un evento no es un suceso,
no es algo que ocurre, sino que es un simple punto en el cuadriespacio. En
un evento pueden ocurrir fenómenos, como por ejemplo la desintegración
de una partı́cula. Para caracterizar un evento, el observador O usa cuatro
números (t, x, y, z) de la manera siguiente; supongamos que una partı́cula
se desintegra en el evento (9,2,4,6); esto quiere decir que el fenómeno ocurre
en aquel lugar cuyas coordenadas espaciales son (2,4,6) y que el reloj que se
encuentra en ese punto marca t = 9 en el instante de la desintegración.

Ası́ como en la sección anterior, pensemos en dos observadores inerciales


O y O0 tales que el segundo se mueve respecto al primero con cierta ve-
locidad (constante) v . Un evento cualquiera, genérico, tiene coordenadas
(t, x, y, z) en el sistema O y tiene coordenadas (t0 , x0 , y 0 , z 0 ) en el sistema O0 .
Con t y t0 queremos decir que en el sitio y en el instante del evento hay dos
relojes que pertenecen a O y O0 .

(t, x, y, z) y (t0 , x0 , y 0 , z 0 ) son las coordenadas de un mismo evento para dos


observadores diferentes. Debe existir una manera de averiguar las cuatro
coordenadas (t0 , x0 , y 0 , z 0 ) cuando se conocen v y las cuatro coordenadas
(t, x, y, z). Pero, y aquı́ radica la importancia, no se trata de encontrar

17
las fórmulas de conexión para un evento particular, sino las fórmulas de
conexión para todos los eventos; en términos matemáticos, se debe recono-
cer que (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) son variables algebraicas. Las coordenadas
primadas deben ser funciones de las no primadas:

t0 = t0 (v , t, x, y, z)
x0 = x0 (v , t, x, y, z)
(1.13)
y 0 = y 0 (v , t, x, y, z)
z 0 = z 0 (v , t, x, y, z)

A cualquier conjunto de cuatro ecuaciones como (1.13) se le llama transfor-


mación de coordenadas. Hay, por supuesto, un número infinito de transfor-
maciones de coordenadas, pero sólo una es verdadera. Es decir, hay sólo una
transformación que verdaderamente corresponde a los registros de las dos
mallas infinitas de relojes (la red primada y la no primada).

En las próximas secciones concentraremos el esfuerzo en encontrar la trans-


formación verdadera. Ese es nuestro propósito a corto plazo. No podemos
olvidar, sin embargo, el propósito a largo plazo, el gran objetivo del proyec-
to relativista: que se cumpla el principio de la relatividad: que las leyes de
la fı́sica se expresen mediante ecuaciones que tengan la misma forma para
todos los observadores inerciales. Por ejemplo, para los observadores O y O0
la ecuación de Maxwell ∇ · B = 0 se escribe

∂Bx ∂By ∂Bz


+ + = 0
∂x ∂y ∂z

∂Bx0 ∂By0 ∂Bz0


+ + = 0
∂x0 ∂y 0 ∂z 0

Debemos ser capaces de pasar de una ecuación a la otra: que las dos ecua-
ciones sean equivalentes. Para que se pueda ejecutar la conversión de una
de las ecuaciones en la otra, la teorı́a de la relatividad debe suministrar:

1) La fórmula que permita averiguar las variables (Ex0 , Ey0 , Ez0 , Bx0 , By0 , Bz0 )
cuando se conocen las (Ex , Ey , Ez , Bx , By , Bz ) (a esa fórmula se le dice “la
transformación del campo electromagnético”, y la deduciremos en el capı́tu-
lo 4).

18
µ ¶
∂ ∂ ∂
2) La fórmula que permita averiguar las variables , , cuan-
µ ¶ ∂x0 ∂y 0 ∂z 0
∂ ∂ ∂
do se conocen las , , . Más precisamente, la fórmula que permite
∂x ∂y ∂z
averiguar las variables (t0 , x0 , y 0 , z 0 ) cuando se conocen las (t, x, y, z); esta
fórmula se llama “la transformación verdadera de las coordenadas”, y la de-
duciremos enseguida.

El propósito 2) de encontrar la transformación verdadera de coordenadas


es válido de por sı́; pero ese propósito cobra una gran importancia cuan-
do se inscribe dentro del principio de la relatividad 1), que pide que las
ecuaciones que expresan las leyes de la fı́sica sean las mismas para todos los
observadores inerciales (que las ecuaciones sean invariantes). La transforma-
ción verdadera de coordenadas deja invariantes las ecuaciones que describen
las leyes de la fı́sica.

Hay dos métodos para encontrar la transformación verdadera de coorde-


nadas:

Método a): Acudir a las ecuaciones que expresan las leyes de la fı́sica y
averiguar la transformación de coordenadas que las deja invariantes (esta
ruta se explora en el apéndice).

Método b): Establecer un conjunto de primeros principios, como por ejemplo


(1.10), deducir una transformación de coordenadas a partir de ellos y luego
estudiar si las ecuaciones de las leyes fı́sicas son covariantes: si lo son, en-
tonces la transformación es muy probablemente la transformación verdadera
de coordenadas.

En la próxima sección seguiremos el método b) y encontraremos:

v
t− 2 x
t0 = p c
1 − v 2 /c2
x − vt
x0 = p (1.14)
1 − v 2 /c2
y0 = y

z0 = z

19
Einstein dedujo estas transformaciones en su célebre artı́culo [2] de 1905
en el que funda la relatividad especial. Ellas son quizá las ecuaciones más
importantes de la fı́sica del siglo XX, y se conocen como las transforma-
ciones de Lorentz. El origen de este nombre es curioso, porque las ecuaciones
(1.14) ya habı́an sido obtenidas, usando el método a), por Hendrik Antoon
Lorentz [4] unos meses antes, cuando el holandés probó la covariancia de los
campos eléctrico y magnético bajo la transformación (1.14) (sin embargo,
por un error de cálculo, sólo pudo probar la covariancia hasta primer orden
en v/c). Einstein, que no conocı́a este trabajo de Lorentz, dedujo indepen-
dientemente las transformaciones (1.14). Lorentz no le dio al t0 de estas
ecuaciones la importancia que luego habrı́a de lograr en la relatividad; en
efecto, Lorentz pensaba en 1904 que mientras t es el tiempo verdadero, la
variable t0 era simplemente una cantidad auxiliar.

1.10 Las transformaciones de Lorentz


Einstein [2] se basa en los tres principios (1.10) para derivar las transforma-
ciones de Lorentz. Aquı́ seguiremos la presentación de Resnick [6] que nos
parece más ordenada y pedagógica. Ası́ como en las secciones anteriores,
suponemos que la velocidad de separación v es paralela al eje común xx0 .

Comencemos el estudio demostrando que las ecuaciones (1.13) deben ser


lineales. Para tal efecto consideremos dos eventos que son iguales en todo,
excepto en la coordenada x; en estas condiciones podemos decir que los dos
eventos son (t, x, y, z) y (t, x + δx, y, z). Asumiendo que δx es infinitesimal
nos preguntamos cuál es la separación δx0 de acuerdo con el observador O0 .
Tomando diferenciales δ en la segunda de las ecuaciones (1.13) escribimos:

∂x0 ∂x0 ∂x0 ∂x0


δx0 = δt + δx + δy + δz,
∂t ∂x ∂y ∂z

pero δt = δy = δz = 0, entonces

∂x0
δx0 = δx (1.15)
∂x

La homogeneidad del espacio nos permite afirmar que, para un δx dado, el

20
valor δx0 debe ser igual en todas las regiones del espacio, o sea que ∂x0 /∂x
debe ser independiente de x, y, z. Ası́ mismo, la homogeneidad del tiem-
po dice que δx0 debe ser igual en todas las épocas, o sea que ∂x0 /∂x es
independiente del tiempo. En conclusión, la derivada ∂x0 /∂x es una con-
stante. Consideraciones parecidas, invocando la homogeneidad del espacio
y del tiempo, nos llevan a afirmar que ∂x0 /∂t, ∂x0 /∂y, ∂x0 /∂z son también
constantes. La segunda función (1.13) debe ser:

x0 = a10 t + a11 x + a12 y + a13 z, (1.16)

con a10 , a11 , a12 , a13 constantes. Se puede repetir este razonamiento para
las otras tres funciones de (1.13), con resultados similares a (1.16):

t0 = a00 t + a01 x + a02 y + a03 z (1.17)


0
x = a10 t + a11 x + a12 y + a13 z (1.18)
0
y = a20 t + a21 x + a22 y + a23 z (1.19)
0
z = a30 t + a31 x + a32 y + a33 z (1.20)

Aquı́ los 16 coeficientes aµν son constantes. Ahora procedemos a averiguar


los valores de estos coeficientes utilizando los tres principios (1.10). Primero
vamos a averiguar los ocho coeficientes de las dos últimas ecuaciones (1.19)
y (1.20), y luego atacaremos las dos primeras ecuaciones (1.17) y (1.18).

Los puntos que pertenecen al eje x (los que tienen y = z = 0) también


pertenecen al eje x0 , es decir, tienen y 0 = z 0 = 0. Formalmente, las condi-
ciones {y = z = 0} y {y 0 = z 0 = 0} se implican mutuamente:

{y = z = 0} ⇔ {y 0 = z 0 = 0}

De aquı́ podemos concluir que a20 = a21 = a30 = a31 = 0.

Los puntos que pertenecen al plano xy (los que tienen z = 0) también


pertenecen al plano x0 y 0 , es decir, tienen z 0 = 0. Formalmente:

z=0 ⇔ z0 = 0

21
De aquı́ se deduce que a32 = 0. Un razonamiento similar (con el plano xz)
nos lleva a que a23 = 0 .

Vamos a probar que a22 = 1 al comparar estas dos situaciones:

Situación 1: En t = 0 hay una varilla en reposo respecto a O parada en


el eje y, con sus extremos en los puntos y = 0 y y = L; o sea que los dos
extremos tienen coordenadas no primadas (0, 0, 0, 0) y (0, 0, L, 0). Veamos
de qué manera el observador O0 registra este objeto: claramente se trata de
una varilla que viaja hacia la izquierda y cuyos extremos tienen, de acuerdo
con (1.19), coordenadas primadas y 0 = 0 y y 0 = a22 L.

Situación 2: En t0 = 0 hay una varilla en reposo respecto a O0 parada


en el eje y 0 , con sus extremos en los puntos y 0 = 0 y y 0 = L; o sea que los
dos extremos tienen coordenadas primadas (0, 0, 0, 0) y (0, 0, L, 0). Veamos
de qué manera el observador O registra este objeto: claramente se trata de
una varilla que viaja hacia la derecha y cuyos extremos tienen, de acuerdo
con (1.19), coordenadas no primadas y = 0 y y = L/a22 .

De acuerdo con el principio de la relatividad (1.10), la Situación 1 y la


Situación 2 son equivalentes. Entonces a22 L = L/a22 , de donde a22 = 1. Un
análisis parecido nos permitirá concluir que a33 = 1. Ya hemos averiguado
los ocho coeficientes de las ecuaciones (1.19) y (1.20), ecuaciones que ahora
se escriben:

y0 = y , z0 = z (1.21)

Nos falta estudiar las ecuaciones (1.17) y (1.18). Comencemos considerando


dos eventos (t, x, y, z) y (t, x, −y, z). Por la homogeneidad del espacio, ambos
eventos deben tener la misma coordenada temporal t0 . En vista de (1.17)
concluimos que a02 = 0. Un análisis parecido nos conduce a que a03 = 0.
Hasta el momento la ecuación (1.17) se ha convertido en

t0 = a00 t + a01 x (1.22)

Pensemos en los eventos del plano x = 0; de acuerdo con la ecuación (1.22),


los eventos de este plano cumplen la ecuación t0 = a00 t. Para estos eventos
la condición t > 0 debe implicar que t0 > 0, o sea que a00 debe ser positiva:

22
a00 > 0 (1.23)

Sean (T, X, Y, Z) las coordenadas no primadas de un evento cualquiera en


el plano x0 = 0. Haciendo x0 = 0 en (1.18) escribimos:

a10 T + a11 X + a12 Y + a13 Z = 0 (1.24)

Si hacemos T = X = 0 en (1.24) se obtiene

a12 Y + a13 Z = 0

Como esta última ecuación debe cumplirse para todos los (arbitrarios) val-
ores de Y y de Z, entonces a12 = a13 = 0. Con este resultado regresamos a
(1.24) para escribir

a10 T + a11 X = 0 (1.25)

No olvidemos que (T, X, Y, Z) pertenece al plano x0 = 0, cuyos puntos


cumplen la condición X = vT ; claramente la ecuación (1.25) dice que
a10 T + a11 v T = 0, de donde a10 = −va11 .

Hasta el momento la ecuación (1.18) se ha convertido en

x0 = a11 (x − vt) (1.26)

Demostraremos enseguida que a11 debe ser positiva. Para tal efecto consid-
eremos aquellos eventos que están a la derecha del origen de O0 ; esos eventos
cumplen las condiciones x0 > 0 y x > vt. En otras palabras, x > vt ⇒ x0 > 0.
Al poner esto en (1.26) encontramos:

a11 > 0 (1.27)

Hagamos un resumen de lo que hemos averiguado hasta el momento:

23
t0 = a00 t + a01 x
x0 = a11 (x − vt)
(1.28)
y0 = y
z0 = z

Hasta aquı́ se llega usando los principios de la relatividad y de la homogenei-


dad del espacio y del tiempo. Pero todavı́a hay tres coeficientes desconocidos
a00 , a01 , a11 , o sea que (1.28) no es una transformación particular, sino una
familia de transformaciones. Para individualizar una transformación partic-
ular es necesario dar los valores de a00 , a01 y a11 , lo que se logra imponiendo
alguna condición suplementaria.

Por ejemplo, la transformación de Galileo (1.7) pertenece a la familia de


transformaciones (1.28). Para obtener Galileo a partir de (1.28) se impone
la condición suplementaria a01 = 0, a00 = a11 = 1.

La transformación de Lorentz también pertenece a la familia de transforma-


ciones (1.28). Einstein obtiene la transformación de Lorentz usando, como
condición suplementaria, el principio de la constancia de la velocidad de la
luz. En efecto, tal como veremos enseguida, al implementar este principio
quedan unı́vocamente determinados los tres coeficientes a00 , a11 , a01 .

Supongamos que un pulso de luz sale del origen de coordenadas cuando


los orı́genes de O y O0 coinciden. Un tiempo después, este pulso llega a un
evento E. Las coordenadas no primadas de E son (t, x, y,pz), y las primadas
son (t0 , x0 , y 0 , z 0 ). Para O la velocidad del 2 2 2
p pulso es c = x + y + z /t, y
2 2 2
para O0 la velocidad del pulso es c0 = x0 + y 0 + z 0 /t0 . Pero c0 = c, por
el principio de la constancia de la velocidad de la luz:
p
x2 + y 2 + z 2
c =
p t
x + y02 + z02
0 2
c =
t0

Estas dos ecuaciones pueden escribirse ası́:

c2 t2 − (x2 + y 2 + z 2 ) = 0 (1.29)
2 2 2 2
c2 t0 − (x0 + y 0 + z 0 ) = 0 (1.30)

24
Usar ahora las cuatro ecuaciones (1.28) en (1.30) para que (1.30) quede en
términos de cantidades no primadas:

(c2 a200 − v 2 a211 )t2 − (a211 − c2 a201 )x2 − y 2 − z 2


(1.31)
+ 2 (c2 a00 a01 + va211 ) xt = 0

Vamos a comparar, término a término, las ecuaciones (1.29) y (1.31); igua-


lando los coeficientes correspondientes se llega a:

c2 a200 − v 2 a211 = c2
a211 − c2 a201 = 1
c2 a00 a01 + va211 = 0

Este es un sistema de tres ecuaciones para las tres incógnitas a00 , a01 , a211 .
Hay dos soluciones:

Primera solución:

1 v/c2 1
a211 = , a01 = p , a00 = − p
1 − v 2 /c2 1 − v 2 /c2 1 − v 2 /c2

Segunda solución:

1 v/c2 1
a211 = , a01 = − p , a00 = p
1 − v 2 /c2 1− v 2 /c2 1 − v 2 /c2

En vista de (1.23), la primera solución está descartada. Adoptamos entonces


la segunda solución, utilizando (1.27) al tomar la raı́z cuadrada de a211 :

1 v/c2
a11 = a00 = p , a01 = − p
1 − v / c2 1 − v / c2
p
He aquı́ el factor 1/ 1 − v 2 /c2 , que aparece innumerables veces en la rela-
tividad. Tradicionalmente se le conoce como γ:

25
1
γ = p (1.32)
1 − v 2 /c2

Los tres coeficientes son, entonces, a11 = a00 = γ, a01 = −γv/c2 y el resul-
tado final de las transformaciones queda:

v
t0 = γ (t − x)
c2
x0 = γ (x − vt) (1.33)
y0 = y , z0 = z

Estas son las transformaciones de Lorentz. Las hemos presentado como una
consecuencia directa de los tres postulados de la relatividad, y en este sentido
ellas son del ámbito de la fı́sica teórica. Lo importante es que ellas también
son del ámbito de la fı́sica experimental: innumerables experimentos real-
izados durante el siglo XX han confirmado, una y otra vez, y sin ninguna
excepción, que las transformaciones de Lorentz son buenas.

Anotemos que las transformaciones de Lorentz se confunden con las de


Galileo a bajas velocidades. En efecto, las ecuaciones (1.33) se convierten
en (1.7) cuando v ¿ c. Esta observación deja en claro que la relatividad
especial abarca al pensamiento newtoniano, y que este último es un caso
lı́mite del pensamiento relativista. El espaciotiempo relativista es diferente
del newtoniano para todos los valores de v, pero la diferencia es notoria
únicamente a altas velocidades.

Si queremos expresar las coordenadas no primadas en términos de las pri-


madas, podemos resolver estas cuatro ecuaciones simultáneas y despejar
t, x, y, z. Pero hay otra manera más simple, que consiste en lo siguiente: en
cada una de las cuatro ecuaciones se cambia v por −v y se intercambian
coordenadas primadas y no primadas:

v 0
t = γ (t0 + x)
c2
x = γ (x0 + vt0 ) (1.34)
y = y0 , z = z0

Generalización. Hemos asumido que O0 se mueve, respecto a O, con


una velocidad v que apunta en la dirección del eje común x x0 . Enseguida
escribimos el caso [7] general, cuando v apunta en cualquier dirección:

26
1
t0 = γ(t − 2 v · r)
µc ¶ (1.35)
0 γ−1
r =r+ v · r − γt v
v2
1
t = γ(t0 + 2 v · r0 )
µc ¶ (1.36)
0 γ−1 0 0
r=r + v · r + γt v
v2

Los diferenciales. En diferenciales, las dos primeras ecuaciones (1.33)


son:

v
∆t0 = γ(∆t − ∆x) (1.37)
c2
∆x0 = γ(∆x − v∆t) (1.38)

Y las inversas proceden de (1.34):

v
∆t = γ(∆t0 + ∆x0 ) (1.39)
c2
∆x = γ(∆x0 + v∆t0 ) (1.40)

También podemos escribir las ecuaciones (1.35) en diferenciales:

1
∆t0 = γ(∆t − 2 v · ∆r) (1.41)
µc ¶
0 γ−1
∆r = ∆r + v · ∆r − γ∆t v (1.42)
v2

Las derivadas: A partir de las transformaciones (1.33) calculamos estas


seis derivadas:

∂t0 ∂x0 ∂t0 γv


= = γ, =− 2,
∂t ∂x ∂x c
(1.43)
∂x0 ∂y 0 ∂z 0
= −γv, = =1
∂t ∂y ∂z

Ahora, la regla de la derivación en cadena dice que

27
∂ ∂t0 ∂ ∂x0 ∂ ∂y 0 ∂ ∂z 0 ∂
= 0
+ 0
+ 0
+ ,
∂t ∂t ∂t ∂t ∂x ∂t ∂y ∂t ∂z 0

entonces, utilizando las derivadas (1.43):

∂ ∂ ∂
= γ 0 − γv 0 ,
∂t ∂t ∂x

que escribimos cortamente ∂t = γ ∂t0 − γv ∂x0 . De la misma manera se cal-


culan ∂x , ∂y , y ∂z :

∂t = γ ∂t0 − γv ∂x0
γv
∂x = γ ∂x0 − 2 ∂t0 (1.44)
c
∂y = ∂y0 ∂z = ∂z 0

c c'

q q' Luz
a
v

Figura 1.1 Las velocidades c, v Figura 1.2 Interferómetro de


y c 0 tales que c = v + c 0 Michelson. En P la luz se reparte
hacia A y B. Después de refle-
jarse en los espejos, los haces se
encuentran de nuevo en P y de
allı́ salen juntos hacia el detector.

28
y

x y'
z
x'

z'

Figura 1.3 Definición de los sis-


temas coordenados. Los ejes x y
x0 coinciden, los ejes y y y 0 son
paralelos y los ejes z y z 0 tam-
bién son paralelos. La velocidad
de separación v apunta en direc-
ción x.

29
30
Capı́tulo 2

Propiedades del espaciotiempo

En este capı́tulo nos proponemos estudiar las consecuencias más directas de


las transformaciones de Lorentz. La más importante se refiere a dos eventos
que son simultáneos para un observador: para otros observadores, en gen-
eral, esos dos eventos no son simultáneos. Directamente conectado con esto
aparece otro efecto curioso: la longitud de un objeto cualquiera depende,
en general, del estado de movimiento del observador que la registra. Las
implicaciones de estos dos resultados son inmediatas. Surge un conjunto de
definiciones y efectos de primera importancia: el tiempo propio, la longitud
propia, el modo como se adicionan velocidades y como se adicionan acelera-
ciones. Estos asuntos están cobijados por la idea central de la relatividad, la
gran idea que revolucionó el pensamiento cientı́fico: el espacio y el tiempo no
son independientes uno del otro, sino que forman un todo espaciotemporal.

Consideremos dos eventos E1 y E2 . El observador O registra que estos dos


eventos tienen coordenadas (t, r) y (t + ∆t, r + ∆r), respectivamente. Para
O0 las coordenadas1 de E1 y E2 son (t0 , r0 ) y (t0 + ∆t0 , r0 + ∆r0 ). La conexión
entre ∆t, ∆r, ∆t0 y ∆r0 está dada por las fórmulas (1.41) y (1.42).

Supongamos que para O la separación entre los dos eventos es puramente es-
pacial, es decir, ∆t = 0; las ecuaciones (1.41) y (1.42) muestran que para O0
los dos eventos tienen separaciones espacial y temporal. Ası́ mismo, supong-
amos que para O la separación entre los dos eventos es puramente temporal,
es decir, ∆r = 0; las ecuaciones (1.41) y (1.42) muestran que para O0 los dos
eventos tienen separaciones espacial y temporal. Vemos ası́ que el espacio
y el tiempo no son independientes uno del otro. Cada observador inercial
puede establecer un corte, un lindero, entre su espacio y su tiempo, pero el
1
Estamos mencionando cuatro relojes: los dos relojes de O marcan t y t + ∆t, y los dos
relojes de O0 marcan t0 y t0 + ∆t0 .

31
lindero que establece O es diferente al que establece O0 .

2.1 Las separaciones espacial y temporal son rel-


ativas
Las ecuaciones (1.41) y (1.42) muestran que, en general, ∆t0 6= ∆t; por esto
decimos que la separación temporal entre dos eventos es relativa. Ası́ mismo,
en general ∆r0 6= ∆r: la separación espacial también es relativa.

El adjetivo relativo se aplica a cualquier cantidad que, registrada por difer-


entes observadores, da resultados diferentes. También decimos que una can-
tidad es absoluta cuando, al registrarla diferentes observadores, todos ob-
tienen el mismo resultado. Acabamos de probar que en la relatividad es-
pecial las separaciones espacial y temporal no son absolutas, sino relativas.
Comparando, las transformaciones de Galileo (1.7) dan t02 − t01 = t2 − t1 y
x02 −x01 6= x2 −x1 . En palabras: en Galileo la separación temporal es absoluta
y la separación espacial es relativa.

2.2 El intervalo es absoluto


A pesar de que las separaciones espacial y temporal son relativas, hay una
función de ∆t y ∆r que resulta absoluta. Definamos:

∆s2 = c2 (∆t)2 − (∆r)2 (2.1)


2
∆s0 = c2 (∆t0 )2 − (∆r0 )2

En palabras: el cuadrado de la separación temporal menos el cuadrado de la


separación espacial. Enseguida probaremos que ∆s02 = ∆s2 . Para tal efecto
se eleva al cuadrado cada uno de los lados en las ecuaciones (1.41) y (1.42),
obteniéndose:

γ2
c2 (∆t0 )2 = γ 2 c2 (∆t)2 + (v · ∆r)2 − 2γ 2 ∆t(v · ∆r)
c2
γ2
−(∆r0 )2 = −(∆r)2 − (v · ∆r)2 + 2γ 2 ∆t(v · ∆r) − γ 2 v 2 (∆t)2
c2

Ahora sumar lado a lado estas dos ecuaciones:

32
c2 (∆t0 )2 − (∆r0 )2 = c2 (∆t)2 − (∆r)2 (2.2)

Es decir,

∆s02 = ∆s2 (2.3)

A ∆s2 se le llama intervalo. El intervalo es la separación espaciotemporal.


La separación espacial es relativa; la separación temporal es relativa; la sep-
aración espaciotemporal es absoluta.

En las geometrı́as euclidianas la definición de distancia involucra únicamente


signos +. Esto tiene una consecuencia importante: la distancia entre dos
puntos diferentes es siempre positiva; o sea que que si la distancia entre dos
puntos es cero es porque se trata, no de dos puntos, sino del mismo punto.
La geometrı́a del espaciotiempo no es euclidiana, porque el intervalo tiene
un signo − que es crucial. En el espaciotiempo la cantidad ∆s2 puede ser
positiva, negativa o cero; el intervalo entre dos eventos diferentes puede ser
cero.

2.3 Clases de intervalos


Cuando ∆s2 es positivo, cero o negativo, el intervalo es temporaloide, lumi-
noide o espacialoide, respectivamente. Vamos a estudiar por separado cada
uno de estos casos.

Intervalos temporaloides. Para que ∆s2 sea positivo debe cumplirse la


siguiente desigualdad:

c|∆t| > |∆r| (2.4)

Este intervalo tiene dos propiedades interesantes:

a) Un observador inercial que recorra el espacio ∆r en el lapso ∆t, debe


registrar que los dos eventos ocurren en el mismo punto del triespacio. Es-
cribamos la velocidad de este observador inercial:

∆r
v = (2.5)
∆t

33
Para verificar que esto es cierto, notemos que al colocar el valor v = ∆r/∆t
en (1.42) se obtiene ∆r0 = 0.

b) ¿Existe acaso un observador inercial O0 para el cual los dos eventos son
simultáneos? Respondamos esta pregunta averiguando la velocidad v que
deberı́a tener O0 . Al imponer la condición ∆t0 = 0 en (1.41) se obtiene

∆r
v· = c2 (2.6)
∆t

Sin embargo, la combinación de (2.4) y (2.6) implica que v tendrı́a que ser
mayor que c, lo que es imposible (ver la frase en bastardilla en la página
17). En conclusión: si dos eventos tienen intervalo temporaloide, ningún
observador registra que son simultáneos.

Intervalos espacialoides. Para que ∆s2 sea negativo debe cumplirse la


siguiente desigualdad:

|∆r| > c|∆t| (2.7)

Este intervalo tiene dos propiedades interesantes:

a) Los observadores inerciales que cumplen la condición

∆r
v· = c2
∆t

registran que los dos eventos son simultáneos. Podemos convencernos de que
esto es cierto de la manera siguiente: al poner v · (∆r/∆t) = c2 en (1.41) se
obtiene ∆t0 = 0.

b) ¿Existe acaso un observador inercial O0 para el cual los dos eventos


ocurren en el mismo punto r0 ? Respondamos esta pregunta averiguando
la velocidad v que deberı́a tener O0 . Al imponer la condición ∆r0 = 0 en
(1.42) se obtiene

µ ¶
γ−1
∆r + v · ∆r − γ∆t v = 0
v2

34
µ ¶
∆r γ−1 ∆r
= − v · − γ v (2.8)
∆t v2 ∆t

Multiplicar escalarmente ambos lados de esta ecuación por el vector v :

µ ¶
∆r ∆r 2
v· = − (γ − 1) v · − γv
∆t ∆t
∆r
0 = −v · + v2 (2.9)
∆t

El lado izquierdo de la ecuación (2.8) es un vector en dirección ∆r/∆t y el


lado derecho es un vector en dirección v ; para que la ecuación sea válida
es necesario que esos dos vectores sean paralelos o antiparalelos, o sea que
v · ∆r/∆t = ±|v||∆r/∆t|. Al poner este valor en la ecuación (2.9) se ob-
tiene |v| = ± |∆r/∆t|. El signo − es inadmisible, porque permitirı́a que una
cantidad positiva fuera igual a una negativa. Escogemos el signo +:

¯ ¯
¯ ∆r ¯
¯
|v| = ¯ ¯ (2.10)
∆t ¯

El problema es que la combinación de (2.7) y (2.10) implica que |v| ten-


drı́a que ser mayor que c, lo que es imposible (de nuevo, la frase escrita en
bastardilla en la página 17). En conclusión: si dos eventos tienen intervalo
espacialoide, ningún observador registra que ocurren en el mismo punto del
triespacio.

Intervalos luminoides. El intervalo entre dos eventos es cero si

c|∆t| = |∆r| (2.11)

Hay dos preguntas interesantes:

a) ¿Existe acaso un observador inercial O0 para el cual los dos eventos son
simultáneos? Respondamos esta pregunta averiguando la velocidad v que
deberı́a tener O0 . Al imponer la condición ∆t0 = 0 en (1.41) se obtiene (2.6).
Sin embargo, la combinación de (2.6) y (2.11) implica que v tendrı́a que
mayor que c, lo que es imposible.

35
b) ¿Existe un observador inercial O0 para el cual los dos eventos ocurren
en el mismo punto r0 ? Al imponer la condición ∆r0 = 0 en (1.42) se obtiene
la ecuación (2.10). El problema es que la combinación de (2.10) y (2.11)
implica que v tendrı́a que ser igual c, lo que es imposible.

En conclusión, cuando el intervalo entre dos eventos es luminoide, ningún


observador registra que son simultáneos y ningún observador registra que
ocurren en el mismo punto del triespacio.

2.4 La simultaneidad es relativa


Consideremos dos eventos que aparecen simultáneos para el observador O.
Haciendo ∆t = 0 en (1.41) encontramos

γ
∆t0 = − v · ∆r (2.12)
c2

Si v · ∆r 6= 0, entonces ∆t0 6= 0, lo que constituye una propiedad de primera


importancia: dos eventos que aparecen simultáneos para O pueden aparecer
simultáneos o no simultáneos para O0 , dependiendo de la dirección de la ve-
locidad v . Aparecen simultáneos para todos los observadores O0 que tengan
v perpendicular a ∆r, y aparecen no simultáneos a todos los O0 cuya v no
sea perpendicular a ∆r. Vemos ası́ que la simultaneidad no es absoluta, sino
relativa.

Desincronización de relojes. También se puede entender la fórmula


(2.12) en términos de desincronización de relojes, valiéndonos de la nota es-
crita al pie de la página 31. Los dos relojes de O están marcando la misma
hora; por ejemplo t = 3:29 a.m. Pero los dos relojes de O0 están marcando
horas diferentes; por ejemplo, el reloj primado en el primer evento marca t01
= 3:27 a.m., y el reloj primado en el segundo evento marca t02 = 3:31 a.m.

El observador O dice que todos sus relojes (los no primados) están de acuer-
do, es decir, están sincronizados; el observador O0 también dice que todos
sus relojes (los primados) están sincronizados. Pero O registra que los relo-
jes de O0 están desincronizados, y O0 registra que los relojes de O están
desincronizados.

36
2.5 Tiempo propio
Al estudiar los intervalos temporaloides vimos que la separación espacial
aparece nula para aquel observador O0 que tiene una velocidad dada por
(2.5). Veamos ahora cuál es la separación temporal ∆t0 que registra ese
observador O0 . Utilizando el resultado (2.5) en (1.41) se obtiene ∆t0 =
1
γ(∆t − 2 v · v ∆t) = γ(1 − v 2 /c2 )∆t. Este ∆t0 se llama tiempo propio y
c
se denota por medio del sı́mbolo ∆τ. En conclusión:

∆r0 = 0 (2.13)
p
∆τ = ∆t 1 − v 2 /c2 (2.14)

< ∆t (2.15)

La ecuación (2.2) se reescribe ası́:

c2 ∆τ 2 = c2 (∆t)2 − (∆r)2 + (∆r0 )2

En el lado derecho tenemos ∆r0 = 0 y (∆r)2 > 0, y esto implica necesari-


amente que ∆τ 2 < ∆t2 : el tiempo propio es el menor de los tiempos. Las
fórmulas (2.13), (2.14) y (2.15), que son de primera importancia, dan pie a
las siguientes dos observaciones:

1) El tiempo propio τ es un concepto que se aplica únicamente a inter-


valos temporaloides. Dado un intervalo temporaloide, existe un observador
que registra que los dos eventos ocurren en el mismo tripunto y con una sep-
aración temporal ∆τ. Otros observadores registran, en general, que los dos
eventos ocurren en lugares diferentes y con una separación temporal mayor
que ∆τ : el tiempo propio es el menor de los tiempos.

2) Regresemos a la nota al pie de la página 31. En general se trata de


cuatro relojes, pero el caso del tiempo propio es especial, ya que O0 usa
solamente un reloj. Es claro que para el observador primado los dos eventos
ocurren en un punto fijo del triespacio, y los dos tiempos t0 y t0 + ∆t0 los
registra aquel reloj primado que ocupa el tripunto. Llegamos ası́ a una clave
que puede ser útil en momentos de confusión: el tiempo propio τ lo mide un
solo reloj.

37
Medición de τ . Supongamos que los relojes se construyen con dos espejos
paralelos separados una distancia δ, y un pulso de luz que se refleja una y
otra vez en los espejos, como muestra la Figura 2.1. En cada tripunto de
O0 se encuentra, fijo, un reloj de estos. De acuerdo con O0 , el tiempo que el
pulso de luz tarda en regresar a uno de los espejos es


∆t0 =
c

Suponemos que este reloj tiene sus espejos paralelos al plano z 0 x0 . Para O
el viaje del pulso de luz es como en qla lı́nea punteada de la Figura 2.2; el
¡1 ¢2
recorrido total es dos hipotenusas: 2 δ 2 + 2 v∆t , o sea que ∆t viene dado
por:
q ¡ ¢2
2 δ 2 + 12 v∆t
∆t =
c

Despejar (∆t)2 para obtener

µ ¶
2δ 2
c
(∆t)2 =
1 − v 2 /c2

∆t0
∆t = p
1 − v 2 /c2

Los dos eventos (salida y regreso del pulso) se registran de manera difer-
ente por los dos observadores. Para O los dos eventos ocurren en puntos
diferentes, o sea que los registran relojes diferentes. Para O0 los dos eventos
ocurren en el mismo punto, o sea que los registra el mismo reloj: tiempo
propio.

Partı́cula libre. Veremos en la sección 3.5 que las partı́culas masivas


tienen velocidades inferiores a c; por eso los eventos de sus trayectorias
tienen intervalos temporaloides y, en consecuencia, se les aplica el concepto
de tiempo propio τ. ¿Cómo se mide el τ de estos intervalos? Para responder
esta pregunta supongamos el más simple de los casos, que es el de una
partı́cula masiva libre. Pensamos en un reloj atado a la partı́cula, que la

38
acompaña en todo instante: el tiempo que marca este reloj es τ. Obsérvese
que este tiempo propio lo mide un sólo reloj. Hay un sistema coordenado
inercial para el cual la partı́cula está siempre en reposo; en estas coordenadas
el intervalo entre dos puntos de la trayectoria es puro tiempo, y es c2 τ 2 .
Llegamos ası́ a una fórmula de gran utilidad en el estudio de las trayectorias
de las partı́culas libres:

ds2 = c2 dτ 2 , (2.16)

siendo τ el tiempo que marca un reloj que acompaña a la partı́cula2 .

Para un observador que acompaña a una partı́cula masiva, τ es un parámetro


que sirve para caracterizar los eventos de la trayectoria. Pero otros obser-
vadores que no acompañan a la partı́cula también pueden utilizar a τ para
caracterizar los puntos de la trayectoria de la partı́cula, de la manera sigu-
iente. Sean (T, X, Y, Z) las coordenadas de los eventos de la trayectoria de
una partı́cula libre, según los registra un observador inercial cualquiera. La
idea es que cada una de las cuatro coordenadas (T, X, Y, Z) se puede con-
siderar como función de τ (que, como hemos dicho, es el tiempo que marca
un reloj atado a la partı́cula). Escribimos entonces T = T (τ ), X = X(τ ),
Y = Y (τ ) y Z = Z(τ ). Supongamos que, cuando τ = 23, la partı́cula
ocupó el evento (5, 6, 7, 8). Decimos entonces que T (23) = 5, X(23) = 6,
Y (23) = 7 y Z(23) = 8.

El fotón viaja con velocidad c, y por esta razón los eventos de su trayec-
toria tienen intervalos luminoides, para los cuales no se aplica el concepto
de tiempo propio: el concepto de tiempo propio no se aplica a partı́culas de
masa cero.

Tiempo de vida media. Un electrón solo y aislado sigue siendo electrón


indefinidamente, y por esto decimos que es estable. Otro ejemplo de partı́cu-
la estable es el protón. Pero la estabilidad es una propiedad escasa, ya que
casi todas las partı́culas tienden a desintegrarse. El tiempo de vida media se
define como el tiempo que tarda una población de partı́culas idénticas en
reducirse a la mitad3 . Nos interesa en este momento resaltar que el enuncia-
do “tiempo que tarda...” es ambiguo, porque es relativo. Deberı́a definirse el
2
Esta fórmula, que hemos encontrado para partı́cula libre, es también válida cuando
la partı́cula no es libre, como veremos en la ecuación (8.1).
3
En verdad, y debido a la incertidumbre esencial que asiste al proceso cuántico de la
desintegración, deberı́amos decir “aproximadamente la mitad”.

39
tiempo de vida media en términos absolutos, no relativos. Se ha convenido
en que “el tiempo que tarda una población en reducirse a la mitad, aprox-
imadamente” significa lo siguiente: el que registra un observador en reposo
respecto a las partı́culas. Veamos por ejemplo los piones no neutros, que el
99.98770 % de las veces se desintegran ası́:

π + → µ+ νµ
π − → µ− ν̄µ con
τ = 2.6 × 10−8 s : Vida media

El significado de τ, desde un punto de vista experimental es el siguiente.


Supongamos un conjunto de 700 piones que se encuentran en reposo re-
specto a un observador O0 ; cuando en los relojes de este observador hayan
transcurrido 2.6 × 10−8 segundos, la población de piones será 350 aproxi-
madamente. Supongamos ahora que este grupo de piones tiene una velocidad
de 0.99c respecto al laboratorio, y nos preguntamos: según el reloj del labo-
ratorio, ¿cuánto tiempo t (el que marca un reloj del laboratorio) se demora la
población de piones para pasar de 700 a 350? Para responder esta pregunta
utilizamos la ecuación (2.14):

τ 2.6 × 10−8 s
t = p = √ = 18.43 × 10−8 s
2
1 − v /c2 1 − 0.99 2

El trayecto recorrido por los piones antes de desintegrarse es vt:

v t = 0.99 ct = 54.74 m : Relatividad

Si, en vez de usar las transformaciones de Lorentz, se usan las de Galileo,


el resultado es bien diferente. De acuerdo con las ecuaciones (1.7), las can-
tidades ∆t y ∆t0 serı́an iguales, y el trayecto recorrido por los piones antes
de desintegrarse serı́a

v ∆t0 = 7.72 m : Galileo,

muy diferente a 54.74 m. En el laboratorio el experimento da 54.74 m y no


7.72 m: la relatividad especial confirmada.

40
2.6 Longitud propia
Para medir fotográficamente la longitud de un avión volando se debe tener
en cuenta que el diafragma de la cámara fotográfica se abra por muy poco
tiempo; porque si se abre durante mucho tiempo, la fotografı́a queda corrida
o borrosa, y no sirve: en general, para medir la longitud de un objeto se
deben registrar los dos extremos simultáneamente. En el caso especial en
que el avión está en reposo, los registros de los dos extremos no tienen que
ser simultáneos. Supongamos pues que el avión está en reposo en O0 , y
llamemos L0 = |∆r0 | a su longitud para O0 . Esta L0 recibe el nombre de
longitud propia. La ecuación (2.2) se escribe:

c2 (∆t0 )2 − L20 = c2 (∆t)2 − (∆r)2 (2.17)

Ahora utilizar la ecuación (1.41):

µ ¶2
1
2 2
c γ ∆t − 2 v · ∆r − L20 = c2 (∆t)2 − (∆r)2
c

Queremos que |∆r| sea L, la longitud del avión según la registra O. Tal
como acabamos de explicar, para medir esta L se deben registrar los dos
extremos en el mismo valor de t, es decir, ∆t = 0. Entonces:

µ ¶2
2 2 1
c γ v · L − L20 = −L2
c2

O sea que
γ2
L20 = L2 + 2
(v · L)2 (2.18)
c

Esta fórmula sirve en general, cualquiera que sea el ángulo formado por
el avión L y la velocidad de separación v . La estudiaremos en dos casos:
cuando L y v son perpendiculares, y cuando L y v son paralelos. Si son
perpendiculares, se cumple la ecuación v · L = 0 y en consecuencia L = L0 :
las longitudes perpendiculares a v no sufren ningún cambio. De otro lado,
si L y v son paralelos, la fórmula (2.18) da

41
p
L0 = L/ 1 − v 2 /c2 (2.19)
> L (2.20)

La ecuación (2.17) se reescribe ası́:

L20 = (∆r)2 − c2 (∆t)2 + c2 (∆t0 )2

No olvidemos que ∆t = 0 y (∆t0 )2 > 0, lo que implica necesariamente que


L20 > (∆r)2 : la longitud propia es la mayor de las longitudes.

Volumen propio. Dado que las longitudes perpendiculares a vq no sufren


cambios, y que las longitudes paralelas a v se afectan por un factor 1 − v 2 /c2 ,
la forma de los objetos tridimensionales depende del estado de movimiento
del observador que los registra: la forma es relativa. Presentemos un ejemplo
de esta deformación, suponiendo que en O0 hay, en reposo, un cubo con sus
aristas paralelas a los ejes x0 , y 0 y z 0 , respectivamente. Llamemos L0 a la lon-
gitud de las aristas, según O0 . Nos preguntamos en seguida de qué manera
registra O a este cuerpo; claramente, las aristas paralelas a los ejes y y z
son de longitud
q L0 , pero las aristas paralelas al eje x tienen una longitud
contraı́da L0 1 − v 2 /c2 . Vemos ası́ que para O no se trata de un cubo, sino
de un paralelepı́pedo
q recto rectangular -i.e.: un “cubo achatado”- de aristas
L0 , L0 , L0 1 − v 2 /c2 .

Esto repercute en qel volumen, ya que mientras el volumen es L30 para O0 ,


el volumen es L30 1 − v 2 /c2 para O. Ahora supongamos un cuerpo de
cualquier forma; es claro que O0 lo puede considerar como la yuxtaposición
de muchos cubitos, y cada uno de estos cubitos aparece deformado para
O. Lo importante es que q todos los cubitos se ven afectados por el mismo
factor de deformación 1 − v 2 /c2 , y en consecuencia la relación entre los
volúmenes es
q
V = V0 1 − u2 /c2 , (2.21)

donde V0 = L30 . En esta ecuación estamos hablando de cualquier cuerpo


tridimensional que tiene velocidad u respecto a O. La cantidad V0 es el
volumen propio, es decir, el que registra un observador para el cual el cuerpo
está en reposo.

42
Densidad propia. Consideremos una nube de partı́culas. El observador
O registra que en un punto r y en un instante t la velocidad de la nube es
u. Pensemos en un pequeño volumen V alrededor de r, que en el instante t
tiene la misma velocidad u: claramente este volumen V está acompañando
a las partı́culas. Si dentro de V hay n partı́culas, entonces la densidad de
partı́culas por unidad de volumen es n/V. Y si cada partı́cula tiene una carga
eléctrica q, entonces para el observador O la densidad de carga por unidad
de volumen es
nq
ρ(r, t) = (2.22)
V

Seguidamente estudiaremos lo que registra otro observador inercial O0 que,


en el instante t, tiene velocidad u: es claro que para este observador el
volumen mencionado en el párrafo anterior está en reposo, y en vez de ser
V, es V0 , de acuerdo con la ecuación (2.21). El volumen V0 también contiene
n partı́culas de carga q, o sea que para el nuevo observador4 la densidad de
carga por unidad de volumen es:

nq
ρ0 (r, t) = (2.23)
V0

La cantidad ρ0 recibe el nombre de densidad propia de carga por unidad de


volumen. En vista de la ecuación (2.21):

ρ0
ρ = q (2.24)
1 − u2 /c2
nq
= q (2.25)
V0 1 − u2 /c2

La ecuación (2.24) dice que ρ0 < ρ: la densidad propia es la menor de las


densidades.
4
La carga eléctrica q es la misma para todos los observadores inerciales. En efecto,
se han realizado suficientes pruebas experimentales que muestran confiablemente [8] que
q no depende de la velocidad de la partı́cula: la carga eléctrica es invariante bajo las
transformaciones de la relatividad especial.

43
2.7 Comparación de longitud propia y tiempo pro-
pio
Hemos dicho que el concepto de tiempo propio sólo se aplica a intervalos
temporaloides. De la misma manera, el concepto de longitud propia sólo se
aplica a intervalos espacialoides. Vemos ası́ que estos dos conceptos son esen-
cialmente diferentes y nunca se aplican al mismo intervalo. Hay sin embargo
cierto parecido formal entre ellos, como veremos en seguida. La ecuación
fundamental es la invariancia del intervalo (2.2):

+c2 (∆t0 )2 − (∆r0 )2 = +c2 (∆t)2 − (∆r)2 (2.26)

Los signos + y − en esta ecuación son cruciales: el tiempo propio ∆t0 es el


menor de los tiempos, porque resulta de hacer ∆r0 = 0 en esta ecuación;
ası́ mismo, la longitud propia |∆r0 | es la mayor de las longitudes, porque
resulta de hacer ∆t = 0 en (2.26). En otras palabras: ∆t > ∆τ porque O
registra los dos eventos en tripuntos diferentes; ası́ mismo, L0 > L porque
O0 registra los dos eventos en instantes diferentes.

2.8 Un caso de simultaneidad


La dilatación del tiempo, la contracción de la longitud y la relatividad de
la simultaneidad son los efectos más dramáticos de la relatividad. En las
dos últimas secciones vimos cómo se miden el tiempo propio y la longitud
propia, y es justo dedicarle también a la simultaneidad un ejemplo y una
discusión.

Sean A y B dos puntos en reposo5 en el sistema O0 , como en la Figura


2.3. En el punto medio se emite un pulso de luz. Para O0 , las dos señales
llegan a A y B en los instantes t0A y t0B , respectivamente. Pensemos en otro
observador O que se desplaza con una velocidad v respecto a O0 , y la direc-
ción de esta velocidad es hacia la izquierda. O registra que las dos señales
luminosas llegan a A y B en los instantes tA y tB , respectivamente. La
fórmula (1.39) da

v
(t0B − t0A ) + 2 (x0B − x0A )
tB − tA = p c
1 − v 2 /c2
5
A y B no son eventos, sino puntos en el espacio tridimensional.

44
Ahora, es claro que t0B = t0A , o sea que

v 0
2
(xB − x0A )
tB − tA c
= p 6= 0
1 − v 2 /c2

Vemos ası́ que la llegada de las dos señales a A y B es registrada de manera


muy diferente por los dos observadores ya que, mientras O0 afirma que son
simultáneas, para O no son simultáneas. Este análisis relativista puede pare-
cer, como todo en la relatividad, un poco complejo. Pero debemos admitir
que tiene un elemento muy simple: no hemos tenido necesidad de aclarar si
la fuente de luz se está moviendo o no, respecto a ninguno de los dos obser-
vadores. Hemos utilizado el principio de la constancia de la velocidad de la
luz (1.10), que afirma que la velocidad de la luz es independiente del estado
de movimiento de la fuente de luz. La simplicidad del análisis relativista
está ausente en el análisis prerrelativista; en efecto, en el prerrelativista es
necesario decir cómo se mueve la fuente de luz, o de lo contrario faltan datos
para resolver el problema.

2.9 La adición de velocidades


Consideremos un punto móvil, que tiene velocidad u respecto a O, y tiene
velocidad u0 respecto a O0 . De acuerdo con la fı́sica galileana (1.7) se tiene:

u = u0 + v (2.27)

Veremos enseguida que en relatividad especial la regla de adición de veloci-


v
dades no es tan simple como (2.27). La ecuación (1.39) es dt = γ(dt0 + 2 dx0 );
c
en el lado derecho se saca dt0 como factor común, para obtener

µ ¶
vu0x
dt = γ 1 + 2 dt0
c

1 γ −1 1
= 0 (2.28)
dt vu dt0
1 + 2x
c

45
Repitamos el proceso
µ 0 para¶la coordenada x. La ecuación (1.40) es dx =
0 0 dx
γ(dx + vdt ) = γ + v dt0 :
dt0

dx = γ(u0x + v)dt0 (2.29)

Ahora multiplicar lado a lado las ecuaciones (2.28) y (2.29) para obtener

u0x + v
ux = (2.30)
vu0
1 + 2x
c

Observaciones:

1. Notemos que u0x = c ⇒ ux = c: un punto matemático que tenga velocidad


c para O0 , también tendrá velocidad c para todos los otros observadores O.
Esta es una generalización del postulado (1.10) de la constancia de la ve-
locidad de la luz.

2. Si u0x ¿ c o v ¿ c, el denominador de (2.30) es aproximadamente 1,


y entonces ux ≈ u0x + v, que es la transformación de Galileo (2.27): la teorı́a
relativista abarca a la galileana.

3. Podemos expandir el lado derecho de (2.30) como un polinomio en poten-


cias de v :

ux = (u0x + v)(1 + vu0x /c2 )−1


= (u0x + v)(1 − vu0x /c2 + · · ·)
= u0x + v − vu02 2
x /c + · · ·

≈ u0x + v − vu02 2
x /c ,

es decir:
µ ¶
u02
x
ux ≈ u0x + 1 − 2 v,
c

46
y haciendo n = c/u0x :
µ ¶
1
ux ≈ u0x + 1− 2 v (2.31)
n

Esta es la célebre fórmula que Fresnel derivó en 1818, cuando estaba inves-
tigando la velocidad de la luz en medios móviles. Ya habı́amos mencionado
esta ecuación en la página 6.

La fórmula (2.30) es la ley de la adición de las velocidades paralelas u0x


y v. Todavı́a nos queda la tarea de deducir las fórmulas que expresan a
las velocidades transversas uy y uz en términos de velocidades primadas.
Para tal efecto tomamos diferenciales en ambos lados de la ecuación y = y 0 ,
dy 1
obteniéndose dy = dy 0 , es decir = dy 0 , lo que se escribe
dt dt

1
uy = dy 0
dt

Ahora usar (2.28):


p
1 − v 2 /c2 0
uy = uy
vu0
1 + 2x
c
Similarmente se deduce que
p
1 − v 2 /c2 0
uz = uz
vu0
1 + 2x
c

En resumen, la adición relativista de velocidades es ası́:

u0x + v
ux = (2.32)
vu0
1 + 2x
p c
1 − v 2 /c2 0
uy = uy (2.33)
vu0x
1+ 2
c

47
p
1 − v 2 /c2 0
uz = uz (2.34)
vu0x
1+ 2
c

Estas tres fórmulas son complicadas, y cuando rastreamos los pasos que con-
dujeron a ellas, nos damos cuenta de que (2.32) es más complicada que (2.33)
y (2.34). Para ver esto anotemos que (2.33) es complicada únicamente por
la transformación temporal (2.28). En cambio (2.32) es complicada, no sólo
por la transformación temporal (2.28), sino además por la transformación
espacial (2.29).

Las transformaciones inversas se obtienen, a partir de (2.32), (2.33) y (2.34),


cambiando v por −v e intercambiando velocidades primadas y no primadas:

ux − v
u0x = vux (2.35)
1− 2
p c
1 − v 2 /c2
u0y = vux uy (2.36)
1− 2
p c
1 − v 2 /c2
u0z = vux uz (2.37)
1− 2
c

Las ecuaciones (2.32), (2.33) y (2.34) sirven cuando la velocidad de sepa-


ración v es en dirección del eje común xx0 . Debemos ahora generalizar para
cuando v es en cualquier dirección. Claramente (2.28) se convierte en
p
1 1 − v 2 /c2 1
= , (2.38)
dt v · u0 dt0
1+ 2
c

y la adición de velocidades (2.32), (2.33) y (2.34) se generaliza ası́:

u0k + v
uk = (2.39)
v · u0
1+ 2
p c
1 − v 2 /c2 0
u⊥ = u (2.40)
v · u0 ⊥
1+ 2
c

48
2.10 La adición de aceleraciones
Tomar diferenciales en ambos lados de la ecuación (2.39):

µ ¶
v · u0 v · du0
1+ 2 du0k − (u0k + v) 2
c c 1 − v 2 /c2 0
duk = µ 0
¶ 2 = µ 0
¶2 duk
v ·u v ·u
1+ 2 1+ 2
c c

Ahora usar la ecuación (2.38):

0
duk (1 − v 2 /c2 )3/2 duk
= µ ¶ ,
dt v · u0 3 dt0
1+ 2
c

es decir:
(1 − v 2 /c2 )3/2 0
ak = µ ¶ ak (2.41)
v · u0 3
1+ 2
c

Esta es la manera como transforman las aceleraciones paralelas. Pasamos


ahora a deducir la transformación de las aceleraciones perpendiculares, toman-
do diferenciales en ambos lados de (2.40):

p ½µ ¶ ¾
1 − v 2 /c2 v · u0 0 0 v · du
0
du⊥ = µ ¶ 1+ 2 du ⊥ − u ⊥
v · u0 2 c c2
1+ 2
c

Se multiplican, lado a lado, esta ecuación y la ecuación (2.38):

½ ¾
1 − v 2 /c2 0 1 £ 0 0 0 0
¤
a⊥ = µ ¶ a⊥+ 2 v ·u a⊥−v ·a u⊥ (2.42)
v · u0 3 c
1+ 2
c

El término v · u0 a0 ⊥ − v · a0 u0 ⊥ que aparece en el lado derecho de esta


ecuación se trata de la manera siguiente:

49
v · u0 a0 ⊥ − v · a0 u0 ⊥ = v · u0 (a0 − a0 k ) − v · a0 (u0 − u0 k )
= v · u0 a0 − v · a0 u0 + v · a0 u0 k − v · u0 a0 k

El lado derecho de esta ecuación tiene cuatro términos. Los dos primeros6
suman v × (a0 × u0 ) y los dos últimos suman7 cero; entonces:

v · u0 a0 ⊥ − v · a0 u0 ⊥ = v × (a0 × u0 ),

y (2.42) queda:

½ ¾
1 − v 2 /c2 0 1 0 0
a⊥ = µ ¶ a ⊥ + 2 v × (a × u ) (2.43)
v · u0 3 c
1+ 2
c

2.11 Gráficos
Ahora estudiaremos el método gráfico de Minkowski [10]. Consideramos pun-
tos que se mueven únicamente en el eje x. Las coordenadas x y t tienen
dimensiones de metro y segundo, respectivamente. Conviene usar variables
de espacio y tiempo que tengan las mismas dimensiones, y por eso vamos
a usar la variable ct en vez de t. La variable ct significa tiempo, pero con
dimensiones de longitud. Las transformaciones de Lorentz (1.33) toman una
forma simétrica entre x y ct:

v
x − ct
x0 = p c (2.44)
1 − v 2 /c2
v
ct − x
(ct)0 = p c , (2.45)
1 − v 2 /c2

o las inversas:
6
Recordar la identidad A × (B × C) = A · C B − A · B C
7
Como u0 k y a0 k apuntan en la dirección de v , es claro que v · a0 u0 k − v · u0 a0 k es un
vector en dirección de v . La magnitud de este vector es va0k u0k − vu0k a0k = 0.

50
v
x0 + (ct)0
x= p c
1 − v 2 /c2
v (2.46)
(ct)0 + x0
ct = p c
1 − v /c2
2

Se grafica el eje ct vertical y el eje x horizontal. Un punto en reposo mantiene


constante su coordenada x, y su trayectoria se representa por medio de una
lı́nea recta vertical. Estudiemos ahora un punto móvil cuya velocidad es
u = dx/dt:
d(ct) c
=
dx u

Llamando “pend” a la pendiente de la curva, esta ecuación es

c
pend = (2.47)
u

La cantidad u es positiva si el punto viaja hacia la derecha, y negativa si va


hacia la izquierda, y en estos casos pend es positiva o negativa. Tomar valor
absoluto:
c
|pend| = (2.48)
|u|

Si se trata de una partı́cula masiva, la velocidad es infralumı́nica, y por


consiguiente |u| < c; la ecuación (2.48) dice que |pend| tiene que ser >1 en
todos los instantes. En el caso importante de un pulso de luz, la trayectoria
es una lı́nea recta con |pend| = 1: la trayectoria es la bisectriz del ángulo
formado por los ejes ct y x. La Figura 2.4 muestra cuatro trayectorias: La
lı́nea recta de 45o de inclinación es para un pulso de luz. Las otras tres curvas
representan trayectorias de partı́culas masivas: la recta vertical corresponde
a partı́cula en reposo; la recta con inclinación >45o es para partı́cula libre,
y la lı́nea curva para partı́cula forzada. Es importante notar que en esta
última trayectoria la pendiente es >1 en todos los instantes.

Minkowski escribe con grandilocuencia. A la totalidad t, x, y, z la llama el


mundo. Al principio de la relatividad (1.10) le dice el principio del mundo
absoluto, un evento (t, x, y, z) es un punto en el mundo y la trayectoria de

51
una partı́cula es una lı́nea en el mundo. Es él quien introduce en la fı́sica las
palabras luminoide, espacialoide, temporaloide y cono de la luz. La visión
geométrica de Minkowski está llena de contenido conceptual, aunque no
siempre se apreció ası́. El mismo Einstein tardó años en reconocer su impor-
tancia. En un principio consideró que el trabajo de Minkowski era redun-
dante y carecı́a de profundidad; finalmente, en 1912, llegó al convencimiento
de que la relatividad general debı́a ser planteada en términos geométricos,
y pudo apreciar el trabajo de su antiguo profesor.

La causalidad. La Figura 2.5 muestra un evento E1 y las lı́neas en el


mundo de dos pulsos de luz que pasan por E1 : uno viaja hacia la izquierda
y el otro hacia la derecha. La trayectoria del pulso que va hacia la derecha
tiene pendiente 1, y la trayectoria del pulso que va hacia la izquierda tiene
pendiente −1. La unión de las dos rectas se llama el cono de la luz del even-
to E1 . Las dos rectas que pasan por E1 cortan al mundo en cuatro partes:
izquierda, derecha, pasado y futuro. Las partes izquierda y derecha están
fuera del cono de la luz; el futuro y el pasado están dentro del cono de la
luz; también decimos que los eventos que están en las dos rectas están dentro
del cono de la luz.

Las señales energéticas son partı́culas, bien sea de masa cero como el fotón,
o de masa diferente de cero; sus trayectorias tienen |pend| ≥ 1, de donde
concluimos que las trayectorias de las señales energéticas que pasan por un
evento E1 están completamente dentro del cono de la luz de E1 . Einstein
pensaba que si un suceso (que ocurre en el evento E1 ) es causa eficiente de
otro suceso (que ocurre en el evento E2 ,) es porque hay una señal energética
que va desde E1 hasta E2 . Como esta señal está dentro del cono de la luz de
E1 , es claro que también E2 tiene que estar dentro del cono de la luz de E1 .
En conclusión: Lo que ocurre dentro del cono de la luz de E1 puede tener
una conexión causal con lo que ocurre en E1 . Lo que ocurre en la región del
futuro puede ser efecto de lo que ocurre en E1 . Lo que ocurre en la región
del pasado puede ser causa de lo que ocurre en E1 . Lo que ocurre en la
región del futuro puede ser efecto de lo que ocurre en la región del pasado.
La causalidad einsteiniana es una conexión entre el pasado y el futuro8 .

8
Bohr pensaba que la causalidad einsteiniana no es la única posible; él admitı́a la
posibilidad de que hubiera también unas correlaciones cuánticas que no están mediadas por
señales energéticas. El danés creı́a que dos sucesos en E1 y E2 pueden estar correlacionados
sin necesidad de una señal energética que viaje desde un evento hasta el otro. Bohr y
Einstein tenı́an que chocar, y ası́ lo hicieron en un debate que duró treinta años.

52
Clases de intervalos: Supongamos dos eventos cuyo intervalo es tem-
poraloide. Trazamos una recta que pase por los dos eventos; entonces, de
acuerdo con la desigualdad (2.4), esta recta tiene |pend| > 1. Ası́ mismo,
utilizando las fórmulas (2.7) y (2.11) llegamos a que la recta que une dos
eventos con intervalo espacialoide tiene |pend| < 1, y la recta que une dos
eventos con intervalo luminoide tiene |pend| = 1.

La Figura 2.6 muestra cuatro eventos A, E, T, y L. El intervalo AE es


espacialoide, el intervalo AT es temporaloide y el intervalo AL es lumi-
noide. El cono de la luz corta en cuatro partes al espaciotiempo. En general,
los eventos con intervalo espacialoide están fuera del cono de la luz, los que
tienen intervalo temporaloide están dentro del cono de la luz y los que tienen
intervalo luminoide están justo en el cono de la luz.

2.12 Más gráficos


Ya que hemos construido los ejes ct y x del mundo de O, procedemos a
dibujar los ejes ct0 y x0 del mundo de O0 : queremos trazar los ejes (ct0 , x0 )
en el plano (ct, x). Es claro que la condición x0 = 0 identifica al eje ct0 ;
haciendo x0 = 0 en (2.44) encontramos:

c
ct = x, (2.49)
v

que es una lı́nea recta con pendiente c/v > 1. Vemos ası́ que el eje ct0 se
representa por medio de una recta que pasa por el origen, y que hace con
el eje ct un ángulo <45o . El eje x0 se caracteriza por la condición t0 = 0;
haciendo t0 = 0 en (2.45) se llega a

v
ct = x (2.50)
c

Esta es la ecuación del eje x0 . El eje x0 es una recta de pendiente v/c < 1,
o sea que hace con el eje x un ángulo <45o . La Figura 2.7 muestra los ejes
(ct0 , x0 ) dibujados en el plano (ct, x), para una velocidad v/c = 3/8.

Una vez trazados los ejes primados procedemos a calibrarlos, es decir, a


marcar el 0, el 1, el 2, . . . en los ejes ct0 y x0 . Tomemos el eje x0 : ¿dónde
ponemos la marca 1? La respuesta a esta pregunta es: en aquel evento P

53
cuyas coordenadas primadas son (0, 1). Para ubicar este evento en el plano
no primado, es preciso averiguar las coordenadas no primadas de P , lo que
se hace colocando los valores ct0 = 0 y x0 = 1 en las ecuaciones (2.46); de
esta manera se llega a que las coordenadas no primadas de P son (γv/c, γ).
Marcamos el evento P y luego, con una regla graduada, medimos la distan-
cia de P al origen; replicando esa distancia sobre el eje x0 se ubica la marca
2; replicando de nuevo se ubica la marca 3, etc. Ya tenemos calibrado el eje
x0 .

Para calibrar el eje ct0 se piensa en el evento Q, cuyas coordenadas pri-


madas son (1, 0). Para ubicar este evento en el plano no primado, es preciso
averiguar las coordenadas no primadas de Q, lo que se hace colocando los
valores ct0 = 1 y x0 = 0 en las ecuaciones (2.46); de esta manera se llega a
que las coordenadas no primadas de Q son (γ, γv/c). Marcamos el evento
Q y luego, replicando sobre el eje ct0 , se localiza la marca 2; replicando de
nuevo se localiza la marca 3, etc. Ası́ se calibra el eje ct0 . La Figura 2.8
muestra claramente que la calibración de los ejes (x0 , ct0 ) es diferente a la de
los ejes (x, ct).

Para averiguar la coordenada ct0 de un evento no se traza una perpendicu-


lar al eje ct0 sino que se traza una lı́nea paralela al eje x0 : allı́ donde esta
paralela corta al eje ct0 queda marcada la coordenada ct0 del evento. De la
misma manera, para averiguar la coordenada x0 de un evento no se traza
una perpendicular al eje x0 , sino que se traza una paralela al eje ct0 . En
la Figura 2.9 hemos usado esta prescripción para marcar los eventos cuyas
coordenadas primadas son (0, 1) y (3, 2) .

Partı́culas en reposo. La Figura 2.10 muestra, en lı́neas punteadas, las


trayectorias de dos partı́culas. Una está en reposo en O0 y la otra está en
reposo en O.

Relatividad de la simultaneidad. En la Figura 2.11 aparecen tres even-


tos A, B y C. Los eventos A y B son simultáneos para O pero no son si-
multáneos para O0 . Ası́ mismo, B y C son simultáneos para O0 pero no son
simultáneos para O.

Contracción de la longitud. La Figura 2.12 muestra, en trazo grueso,


una varilla en reposo en O0 ; según este observador, ella mide 2 metros. Las
lı́neas punteadas son las lı́neas en el mundo de sus extremos. Para medir la

54
longitud de la varilla, el observador O registra los dos extremos simultánea-
mente y obtiene una longitud menor que 2.

De igual modo, la Figura 2.13 muestra, en trazo grueso, una varilla en reposo
en O; según este observador, ella mide 2 metros. Las lı́neas punteadas son
las lı́neas en el mundo de sus extremos. Para medir la longitud de la varilla,
el observador O0 registra los dos extremos simultáneamente y obtiene una
longitud menor que 2.

Dilatación del tiempo. En la Figura 2.14 aparece, en trazo punteado, la


lı́nea en el mundo de un reloj en reposo en el origen de O. Este reloj marca
un tiempo (propio) de 2. Para O0 el tiempo transcurrido es mayor que 2.

Ası́ mismo, en la Figura 2.15 aparece, en trazo punteado, la lı́nea en el


mundo de un reloj en reposo en el origen de O0 . Este reloj marca un tiempo
(propio) de 2. Para O el tiempo transcurrido es mayor que 2.

Cuando O0 viaja hacia la izquierda. O0 se dirige hacia la izquierda,


pero sin invertir la dirección del eje x0 . Es decir, los ejes x y x0 apuntan en
la misma dirección. En estos casos los ejes primados se dibujan como en la
Figura 2.16.

El eje ct0 hacia arriba, y el eje x0 hacia a la derecha. Pensemos en


el cono de la luz referido al origen de coordenadas, y las cuatro partes en
que queda cortado el espaciotiempo. Un vistazo a las Figuras 2.7 y 2.16 nos
muestra una constante: el eje ct0 siempre apunta hacia la región del futuro,
y el eje x0 siempre apunta hacia la parte de la derecha.

Relaciones relativas. En base a la Figura 2.6, es claro que existe un ob-


servador O0 (con cierta velocidad v) cuyo eje x0 pasa por E, o sea que para
este O0 los eventos E y A son simultáneos. Todos los otros observadores
con velocidad < v registran que E ocurre más tarde que A, y todos los
observadores con velocidad > v registran que E ocurre más temprano que
A. Aprendemos ası́ una cosa interesante: cualquier evento que esté fuera
del cono de la luz aparece más tarde que A para unos observadores y más
temprano que A para otros observadores. O sea que para estos eventos la
relación pasado-futuro no es absoluta, sino relativa.

De nuevo con la Figura 2.6, existe un observador O0 (con cierta velocidad

55
v) cuyo eje ct0 pasa por T , o sea que para este O0 el evento T y A ocurren
en el mismo lugar. Todos los otros observadores con velocidad < v registran
que T está a la derecha de A, y todos los observadores con velocidad > v
registran que T está a la izquierda de A. Aprendemos ası́ algo interesante:
cualquier evento que esté dentro del cono de la luz aparece a la derecha para
unos observadores y a la izquierda para otros observadores. O sea que para
estos eventos la relación izquierda-derecha no es absoluta, sino relativa.

Relaciones absolutas. Regresando al evento E del penúltimo párrafo


anotamos que no es posible conseguir, ni con la Figura 2.7, ni con la Figura
2.16, un observador inercial para el cual E aparezca a la izquierda del origen.
Es decir, los eventos que están fuera del cono de la luz tienen una relación
izquierda-derecha absoluta.

Similarmente, en referencia al evento T del penúltimo párrafo anotamos


que no es posible conseguir, ni con la Figura 2.7, ni con la Figura 2.16, un
observador inercial para el cual T ocurra antes que el origen. Aprendemos
ası́ que los eventos que están dentro del cono de la luz tienen una relación
pasado-futuro absoluta.

Los nombres izquierda, derecha, pasado y futuro que les hemos dado a las
cuatro regiones, son adecuados: los eventos de estas regiones están, respecto
al vértice del cono, absolutamente a la izquierda, absolutamente a la derecha,
absolutamente en el pasado y absolutamente en el futuro.

56
d

Figura 2.1 Un reloj se construye Figura 2.2 El mismo reloj de la


con dos espejos paralelos y un Figura 2.1, según lo registra otro
pulso de luz que se refleja en ellos observador O que se mueve re-
repetidamente. Este dibujo rep- specto al reloj.
resenta el registro hecho por un
observador O0 que está en reposo
respecto al reloj.

ct

A B
x

Figura 2.3 Para el observador Figura 2.4 Trayectorias de cu-


O0 los puntos A y B están en atro partı́culas. De izquierda a
reposo. Desde el punto medio se derecha: partı́cula masiva libre,
envı́an dos señales luminosas ha- partı́cula en reposo, pulso de luz
cia A y B. y partı́cula forzada.

57
T
L
Futuro E

Izquierda Derecha A
E1

Pasado

Figura 2.5 El cono de luz Figura 2.6 Los intervalos AE,


está comprendido entre dos pul- AT y AL son espacialoide, tem-
sos de luz; uno viaja hacia la poraloide y luminoide, respecti-
izquierda y el otro hacia la vamente
derecha.

ct ct
ct'
ct'
4
3
3

2 x'
x'
v/c

2
arctan

3
1
1 2
1 x
c
arctan v/ x
1 2 3 4

Figura 2.7 El observador O0 se Figura 2.8 Para O0 , la distancia


mueve respecto a O con veloci- OP es 1. Replicamos esta medida
dad v = 3c/8. a lo largo del eje x0 para marcar
aquellos eventos cuyas coorde-
nadas primadas son (0,2), (0,3),
(0,4), etc.

58
ct
ct'

x'
2

1
2
1 x

Figura 2.9 Para averiguar la Figura 2.10 La lı́nea puntea-


coordenada ct0 de un evento se da vertical es la trayectoria de
traza una lı́nea paralela al eje x0 : una partı́cula que está en re-
allı́ donde esta paralela corta al poso respecto al observador O.
eje ct0 queda marcada la coorde- La otra lı́nea punteada es para
nada ct0 del evento. una partı́cula que está en reposo
respecto a O0 .

x'

C 2

A B x
2

Figura 2.11 Los eventos A y B Figura 2.12 El trazo grueso rep-


son simultáneos para O; sin em- resenta una varilla en reposo en
bargo, O0 registra que B ocurre O0 ; según este observador, ella
antes que A. Ası́ mismo, B y C mide 2 metros. Para O la longi-
son simultáneos para O0 , pero O tud es menor que 2.
registra que B ocurre antes que
C.

59
ct

ct'

x'

x'
2
2
2

x
2

Figura 2.13 El trazo grueso rep- Figura 2.14 El trazo punteado


resenta una varilla en reposo en es la lı́nea en el mundo de un
O; según este observador, ella reloj en reposo en el origen de
mide 2 metros. Para O0 la lon- O. Este reloj marca un tiempo
gitud es menor que 2. (propio) de 2. Para O0 el tiempo
transcurrido es mayor que 2.

ct
ct
ct'
ct'

2 2
x

x x'

Figura 2.15 El trazo punteado Figura 2.16 El observador O0 se


es la trayectoria de un reloj en re- mueve hacia la izquierda respec-
poso en el origen de O0 . Este reloj to a O. Comparar con la Figura
marca un tiempo (propio) de 2. 2.7: en ambas gráficas el eje ct0
Para O el tiempo transcurrido es apunta hacia el futuro, y el eje
mayor que 2. x0 apunta hacia la derecha.

60
Capı́tulo 3

Mecánica

Si la relatividad ha cambiado nuestro entendimiento del espaciotiempo,


debemos estar preparados para indagar y asimilar los efectos de esos cam-
bios. Se espera que, una vez aceptadas las nuevas propiedades del espa-
ciotiempo, tengamos que introducir modificaciones en los estudios de la
dinámica, la mecánica ondulatoria, etc. Este capı́tulo explora la primera
de las repercusiones, que es el efecto de la relatividad en la dinámica. Ver-
emos que la nueva dinámica trae sutilezas teóricas y efectos sorprendentes
que la separan de la vieja mecánica1 newtoniana.

El momentum es el primero de los conceptos que la relatividad reforma. De


acuerdo con el principio de la relatividad, la ley de la conservación del mo-
mentum debe ser válida en todos los sistemas de referencia inerciales. Pero
la relatividad muestra, para nuestra sorpresa, que si se mantiene la defini-
ción de momentum p = mu con m constante, la ley de la conservación del
momentum no se cumple para todos los observadores inerciales, violándose
ası́ el principio de la relatividad. Hay tres caminos para salir de esta cri-
sis: abandonar el principio de la relatividad (no queremos abandonarlo),
o abandonar la ley de la conservación del momentum (tampoco queremos
abandonarla), o modificar la vieja definición de momentum p = mu. En la
sección 3.1 tomaremos el tercer camino; propondremos p = m(u)u, donde
m(u) es alguna función desconocida de la magnitud de la velocidad u, nos
preguntaremos cómo debe ser la función desconocida m(u) para que la con-
servación del momentum sea válida en todosp los sistemas de referencia iner-
ciales, y descubriremos que m(u) = m(0)/ 1 − u2 /c2 .

1
Cuando decimos “mecánica newtoniana” nos referimos, no sólo a la mecánica que New-
ton formuló, sino además a los aportes que los fı́sicos hicieron en los dos siglos siguientes:
las formulaciones lagrangiana y hamiltoniana, las aplicaciones a los cuerpos celestes, etc.

61
El nuevo concepto de masa conduce a uno de los hallazgos más importantes
de la relatividad, que es la asociación masa-energı́a, expresada en la ecuación
E = mc2 . Esta fórmula dice que el contenido de masa de un objeto es una
medida de su energı́a total. La sección 3.4 trae una discusión de este asunto y
luego, en la sección 3.5 mostramos que una partı́cula masiva no puede llegar
a tener la velocidad c. La sección 3.9 trata, como un caso particularmente
interesante, el movimiento circular.

3.1 La conservación del momentum


Nos proponemos estudiar [6] la colisión elástica de dos partı́culas de igual
masa. La Figura 3.1 muestra el choque según lo registra un observador O
que está en reposo respecto al centro de masa. La partı́cula A va de derecha
a izquierda y la partı́cula B de izquierda a derecha. La figura incluye las
cantidades positivas ux y uy , que tienen el siguiente significado: La partı́cu-
la B tiene una velocidad horizontal ux hacia la derecha en todo instante;
pero su velocidad vertical es uy hacia abajo antes del choque, y es uy hacia
arriba después. En forma similar, la velocidad horizontal de A es ux hacia
la izquierda en todo instante; y su velocidad vertical pasa de ser uy hacia
arriba antes del choque, a ser uy hacia abajo después.

Con una mirada a la Figura nos damos cuenta de que, para el observador
O, el momentum total es cero. Lo que más nos interesa por el momento es
que el momentum total se conserva: el momentum ganado por la partı́cula
B es igual al perdido por A . De hecho, las cantidades escritas en la Figura
fueron expresamente definidas para que, en O, se cumpla la ley de la conser-
vación del momentum. Ahora, por el Principio de la Relatividad, queremos
que la ley de la conservación del momentum también se cumpla en los otros
observadores inerciales. Nos proponemos analizar la colisión de estas dos
partı́culas desde el punto de vista de otro observador inercial O0 que se
mueve, respecto a O, con una velocidad v hacia la derecha: vamos a exigir
que en O0 se cumpla la ley de la conservación del momentum.

Uno podrı́a, de entrada, definir el momentum de una partı́cula (intentar por


ejemplo la definición newtoniana mu) y luego indagar si la conservación del
momentum se cumple en todos los observadores inerciales. Nosotros vamos
a seguir la ruta contraria: exigir que la conservación del momentum valga
en todos los sistemas de referencia inerciales y, a partir de esta exigencia,
averiguar cómo se debe definir el momentum de una partı́cula. Comence-

62
mos con una propuesta bien general; digamos que si una partı́cula tiene
velocidad u , entonces su momentum es m(u)u , donde m(u) es una función
desconocida de la magnitud de la velocidad u . Vamos a exigir que la ley
de la conservación del momentum se cumpla en todos los observadores in-
erciales. Veremos que esta exigencia es suficiente para averiguar la función
desconocida m(u) .

La Figura 3.2 muestra de qué manera el observador O0 registra el choque


de las dos partı́culas. Para la partı́cula B el momentum vertical después del
choque es m(u0B )u0By y antes del choque es −m(u0B )u0By . Entonces el mo-
q
mentum vertical ganado por B es 2m(u0B )u0By . Ahora, u0B = u0Bx 2 + u0 2 ,
By
³q ´
entonces el momentum vertical ganado por B es 2m u0Bx
2 + u0 2 0
By uBy .
³q ´
Ası́ mismo, el momentum vertical perdido por A es 2m u0Ax
2 + u0 2 0
Ay uAy .
La ley de la conservación del momentum dice que el momentum vertical
perdido por una partı́cula es igual al ganado por la otra:

³q ´ ³q ´
0 0
m u0Ax
2 + u0 2
Ay u Ay = m u0 2 + u0 2
Bx By uBy (3.1)

En este momento debemos expresar las cuatro variables u0Ax , u0Ay , u0Bx y u0By
en términos de las cantidades nos primadas ux , uy y v, y esto se hace con
las fórmulas de la adición relativista de velocidades. Téngase en cuenta que
las ecuaciones (2.35) y (2.36) no pueden usarse directamente, porque hay
una confusión en la notación: en las fórmulas (2.35) y (2.36) las ux , uy son
variables algebraicas (que pueden tomar valores positivos o negativos), en
cambio en la presente sección las ux , uy , u0Ax , u0By , ... son cantidades positivas.
Con esta advertencia en mente procedemos a usar, para la partı́cula B, las
ecuaciones (2.35) y (2.36):

ux − v
u0Bx = vux
1− 2
p c
1 − v 2 /c2
u0By = vux uy
1− 2
c

Ası́ mismo, para la partı́cula A las ecuaciones (2.35) (2.36) dan:

63
−ux − v
−u0Ax =
v(−ux )
1−
p c2
1 − v 2 /c2
u0Ay = u
v(−ux ) y
1−
c2

Al colocar estas cuatro ecuaciones en (3.1) se llega a:

q 
(ux + v)2 + (1 − v 2 /c2 )u2y
m vux

1+ 2
c
q  vux
(ux − v)2 + (1 − v 2 /c2 )u2y 1+ 2
= m  c
vux vux
1− 2 1− 2
c c

Llevemos esta ecuación al lı́mite uy → 0:

    vux
|u + v| |u − v| 1+ 2
m
x  = m x  c
vux vux vux
1+ 2 1− 2 1− 2
c c c

De todos los observadores inerciales, escojamos aquel que tiene v = ux :

µ ¶
2v 1 + v 2 /c2
m = m(0)
1 + v 2 /c2 1 − v 2 /c2
m(0)
= s µ ¶2
2v/c
1−
1 + v 2 /c2

Esta es la respuesta que buscábamos. Para simplificar su escritura hagamos


2v
estos dos cambios en la notación: m(0) → m0 y →u :
1 + v 2 /c2

m0
m(u) = q (3.2)
1 − u2 /c2

64
Esta es la ecuación más importante de la mecánica en la teorı́a especial de
la relatividad. La masa de una partı́cula no es una constante, sino que es
función de la velocidad u de la partı́cula; he aquı́ una modificación esencial
en el concepto de masa.

Nota: Releamos las palabras que siguen a la ecuación (3.1). Si en vez de


usar la adición relativista de velocidades hubiéramos empleado la adición
galileana (2.27) ¿adónde habrı́amos llegado? Para responder esta pregunta
apliquemos la fórmula (2.27) a las partı́culas A y B, con lo que llegamos a:
−u0Ax = −ux − v , u0Bx = ux − v , u0Ay = uy y u0By = uy . Al poner estas
cuatro ecuaciones en la fórmula (3.1) se obtiene

³q ´ ³q ´
m (ux + v)2 + u2y =m (ux − v)2 + u2y

Si esta ecuación ha de cumplirse para valores arbitrarios de ux , uy y v, se con-


cluye que m no puede ser una función, sino que tiene que ser una constante.
De esta manera hemos llegado a un viejo resultado de la fı́sica newtoniana:
cuando se usan las transformaciones de Galileo, y se define p = mu con m
constante, entonces la ley de la conservación del momentum es válida para
todos los observadores inerciales.

3.2 Las nuevas cantidades dinámicas


En la fı́sica newtoniana el momentum, la fuerza, el trabajo R y la energı́a
cinética se definen ası́: p = mu, F = dp/dt, Trabajo = F · dr, Energı́a
cinética = el trabajo que se realiza para llevar a la partı́cula desde el reposo
hasta velocidad u. La dinámica relativista conserva estas definiciones, pero
todas con la nueva masa m(u). En general, siempre que escribamos m, debe
entenderse m(u):

p = mu (3.3)
m0 u
= q (3.4)
1 − u2 /c2

dp
F = (3.5)
dt

65
Z Z Z Z
dp dr
Trabajo = F · dr = · dr = dp · = d(mu) · u ,
dt dt

o sea que
Z
Trabajo = (m du · u + dm u2 ) (3.6)

De otro lado, elevando al cuadrado ambos lados de la ecuación (3.2) se


obtiene:
³ u · u´
m2 1 − 2 = m20
c

Tomar diferenciales en ambos lados:

u · du
2m dm − 2m dm u2 /c2 − 2m2 = 0,
c2

de donde:

m u · du + dm u2 = c2 dm

Esto en la ecuación (3.6) da:

Z
2
Trabajo = c dm (3.7)

Esta fórmula establece una nueva interpretación del trabajo: en la relatividad


el trabajo es el cambio de masa. La energı́a cinética K (que es, por definición,
la energı́a que hay que invertir para llevar una partı́cula desde el reposo hasta
velocidad u) es un trabajo muy especial: el que se necesita para cambiar la
masa desde m0 hasta m:

Z m
K = c2 dm
m0

K = mc2 − m0 c2 (3.8)

66
De la ecuación (3.8) se sigue que

K + m0 c2 = mc2 (3.9)

La energı́a mecánica total de la partı́cula, que representamos mediante la


letra E , es la suma K + m0 c2 :

E = m0 c2 + K (3.10)

= mc2 (3.11)

¿Por qué llamar energı́a a la cantidad mc2 ? A primera vista parece apresura-
do llamar energı́a a una cantidad recién encontrada; ya tendremos ocasión
de justificar este nombre en la sección 3.3.

Si usamos la ecuación (3.2) en la (3.11) escribimos:

m0 c2
E=q (3.12)
1 − u2 /c2

Esta ha sido una presentación rápida de las cuatro cantidades dinámicas m,


p, K, y E , tal como quedan redefinidas en la relatividad especial. Las Fig-
uras 3.3, 3.4, 3.5 y 3.6 muestran cualitativamente estas curvas einsteinianas
marcadas con la letra e ; se deben comparar con las curvas newtonianas que
aparecen marcadas con la letra n.

Claramente las cuatro cantidades dinámicas E, K, p, u son redundantes,


si m0 está dada: conocida una cualquiera de ellas se puede averiguar las
otras tres. Hallemos por ejemplo algunas de esas relaciones.

Para expresar u en términos de p, podemos elevar al cuadrado cada uno


de los lados de la ecuación (3.4), y despejar u2 /c2 :

m20 c2
u2 /c2 = 1 − (3.13)
m20 c2 + p2

67
Para expresar u en términos de E, podemos elevar al cuadrado cada uno de
los lados de la ecuación (3.12), y despejar u2 /c2 :

m20 c4
u2 /c2 = 1 − (3.14)
E2

Para expresar E en términos de p, igualamos los lados derechos de las ecua-


ciones (3.13) y (3.14):

E 2 = m20 c4 + p2 c2 (3.15)

En forma similar se encuentran todas las conexiones entre las cuatro vari-
ables:

p m0 c2
E = m0 c2 + K = (m0 c2 )2 + p2 c2 = p
1 − u2 /c2
p m0 c2
K = E − m0 c2 = (m0 c2 )2 + p2 c2 − m0 c2 = p − m0 c2
1− u2 /c2
1p 2 1p m0 u
p = E − (m0 c2 )2 = (m0 c2 + K)2 − (m0 c2 )2 = p
c c 1 − u2 /c2
s s
µ ¶2 µ ¶−2
m0 c2 K c
u = c 1− =c 1− 1+ 2
=s µ ¶
E m0 c m0 c 2
1+
p

Masa cero: Para partı́culas de masa cero, como el fotón, el momentum se


denota por medio de la letra k, y su magnitud es k. Las fórmulas anteriores
se simplifican considerablemente:

k = E/c para masa cero. (3.16)

p
Bajas velocidades: El factor 1/ 1 − u2 /c2 se puede expandir usando la
fórmula del binomio de Newton:

68
µ ¶− 12
p 1 u2 1 u2 3 u4
1/ 1 − u2 /c2 = r = 1− 2 = 1+ + +···
u2 c 2 c2 8 c4
1−
c2

Si la velocidad es suficientemente baja podemos despreciar los términos del


u4 p 1 u2
orden de 4 . En este caso 1/ 1 − u2 /c2 → 1 + . Con este resultado
c 2 c2
llegamos a:

1
K → m0 u2
2
µ ¶
u2
m → m0 1 + 2 → m0
2c
µ ¶
u2
p → m0 u 1 + 2 → m0 u
2c
µ ¶
2 u2
E → m0 c 1+ 2 → m0 c2
2c

3.3 La energı́a en la relatividad especial


El momentum newtoniano es m0 u, y el relativista es mu. La redefinición
m0 u → mu se hace con el propósito expreso de que la ley de la conservación
del momentum se cumpla para todos los observadores inerciales. De la mis-
ma manera, la energı́a relativista se define como en (3.10) para que la ley de
la conservación de la energı́a se cumpla absolutamente. Esta presentación
podrı́a parecer extraña, pero es sana: en vez de probar que el momentum y
la energı́a se conservan absolutamente, vamos a definir momentum y energı́a
de una manera que garantice que las dos leyes de conservación sean absolu-
tamente válidas. En la sección 3.1 vimos que el momentum se conserva abso-
lutamente si se define como p = mu ; el propósito de esta sección es probar
que la energı́a se conserva absolutamente si se define como E = m0 c2 + K .

Estudiemos [6] la colisión de dos objetos que tienen la misma masa en reposo
m0 . Pensemos que uno de los objetos es una piedra y el otro es de algún ma-
terial blando como barro; los objetos se escogen ası́ para que la colisión sea
completamente inelástica según un observador O que está en reposo respec-
to al centro de masa. La Figura 3.7 muestra, según O, las situaciones antes
y después del choque: los dos cuerpos, llamados A y B, tienen velocidad u

69
antes del choque. Como resultado del choque queda, al final, un sólo cuerpo,
en reposo, cuya masa en reposo es M0 . Nótese que como este cuerpo final
queda en reposo para O, este observador registra que la energı́a cinética se
ha perdido por completo: para O la colisión es completamente inelástica.

Ahora consideremos otro observador O0 que se mueve, respecto a O, con


velocidad u hacia la derecha. Es claro que para O0 la partı́cula A está en re-
poso antes del choque; la partı́cula B tiene una velocidad que llamaremos u0 .
La Figura 3.8 muestra las situaciones para O0 , antes y después del choque:
claramente el cuerpo final M0 tiene velocidad u.

Veamos cuál es, según O0 , el momentum total antes del choque:

m0 u0
mu0 = q ,
2
1 − u0 /c2

y el momentum después, también según O0 :

M0 u
Mu = q
1 − u2 /c2

Para O0 la ley de la conservación del momentum dice que

M0 u m u0
q = q 0
2
1 − u2 /c2 1 − u0 /c2
q
u0 1 − u2 /c2
M0 = m0 q (3.17)
u 2
1 − u0 /c2

Queremos expresar u0 en términos de u, para que en la ecuación (3.17)


aparezca una sola velocidad u. Notemos que el objeto B tiene velocidad u
según O, y tiene velocidad u0 respecto a O0 ; como estas u y u0 se refieren
al mismo cuerpo, deben satisfacer la ecuación (2.35). Haciendo u0x = −u0 ,
ux = −u y v = u, la ecuación (2.35) es:

(−u) − u
(−u0 ) = , de donde
u(−u)
1−
c2

70
2u
u0 =
1 + u2 /c2

Al poner este valor de u0 en la ecuación (3.17), se llega a

2m0
M0 = q (3.18)
1 − u2 /c2

Este resultado es novedoso: ya que M0 6= 2m0 , la masa en reposo total no


se conserva. El cambio de la masa en reposo es:

 
1
M0 − 2m0 = 2m0  q − 1 (3.19)
2 2
1 − u /c

Calculemos ahora el cambio en la energı́a cinética, de acuerdo con un obser-


vador inercial cualquiera O00 que se mueve, respecto a O , con una velocidad
arbitraria ω. Para el observador O00 los cuerpos A y B tienen velocidades
u00A y u00B , y el cuerpo final de masa M0 tiene velocidad U 00 . Para la trans-
formación entre los observadores O y O00 usamos la fórmula de adición de
velocidades (2.35):

u−ω −u − ω 0−ω
u00A = uω ; u00B = uω ; U 00 = = −ω (3.20)
1− 2 1+ 2 1−0
c c

Calculemos, según O00 , cuánto es la energı́a cinética perdida en la colisión.


Utilizamos la ecuación (3.8) para calcular la energı́a cinética antes y después
del choque:

00 00 00
Kantes = KA + KB

= (m00A c2 − m0 c2 ) + (m00B c2 − m0 c2 )
   
m0 c2 m0 c2
= q − m0 c2  +  q − m0 c2 
00 2 2 00 2 2
1 − uA /c 1 − uB /c

71
 
1
00
Kdespués = M 00 c2 − M0 c2 = M0 c2  q − 1
00 2 2
1−U /c

Entonces el cambio de energı́a cinética ∆K 00 = Kdespués


00 00
− Kantes es:

 
1
00
Kdespués 00
− Kantes = M0 c2  q − 1
1 − U 00 2 /c2
    (3.21)
m0 c2 m0 c2
− q − m0 c2  −  q − m0 c2 
00 2 2 00 2 2
1 − uA /c 1 − uB /c

Al poner las ecuaciones (3.20) en la ecuación (3.21) se obtiene

 
1
Kdespués − Kantes = −2m0 c2  q − 1 (3.22)
2 2
1 − u /c

Nótese que en el lado derecho de esta ecuación no aparece la velocidad ω del


observador O00 , lo que quiere decir que el cambio en la energı́a cinética es
el mismo para todos los observadores inerciales: es absoluto; por esta razón
hemos borrado la doble prima en K 00 . Si multiplicamos ambos lados de la
ecuación (3.19) por c2 encontramos:

 
1
(M0 − 2m0 ) c2 = 2m0 c2  q − 1 (3.23)
2 2
1 − u /c

Ahora, al sumar lado a lado las ecuaciones (3.22) y (3.23) se obtiene:

Kdespués − Kantes + (M0 − 2m0 )c2 = 0

2m0 c2 + Kantes = M0 c2 + Kdespués

72
Escribamos la última ecuación sugestivamente:

(m0 c2 + KA, antes ) + (m0 c2 + KB, antes ) = M0 c2 + Kdespués (3.24)

Consideremos un conjunto de cuerpos que chocan. En cualquier instante


el conjunto consta de cuerpos con masas en reposo m0,1 , m0,2 , m0,3 , · · · y
energı́as cinéticas K1 , K2 , K3 , · · · . La fórmula (3.24) dice que la cantidad

X
(m0,i c2 + Ki ) (3.25)
i

es una constante del movimiento. Queremos recalcar que la velocidad ω del


observador O00 , no aparece en (3.24), o sea que la ley de conservación (3.24)
no es relativa, sino absoluta. En otras palabras, (3.24) cumple el principio de
la relatividad (1.10), y podemos afirmar que la cantidad conservada (3.25)
debe ser importante. La llamamos energı́a total o también energı́a mecánica.
La energı́a total de una partı́cula es su energı́a cinética más su masa en reposo
multiplicada por c2 . Ası́ justificamos, a posteriori, que a la cantidad (3.10)
le hubiéramos dado el nombre de energı́a.

3.4 E = mc2
La palabra inercia se usa para denotar aquella oposición que presentan los
cuerpos cuando se intenta acelerarlos. De una manera gráfica podemos de-
cir que la inercia de un cuerpo corresponde a la presión que sentimos en
las manos cuando lo empujamos; al empujar una naranja o un camión sen-
timos muy diferentes grados de presión en nuestras manos, y decimos en
consecuencia que el camión tiene más inercia que una naranja. Siguiendo
una tradición de muchos siglos, la cantidad fı́sica asociada a la inercia de un
cuerpo es la masa.

Respecto al choque inelástico que estudiamos en la sección anterior, el au-


mento de masa en reposo M0 −2m0 es un aumento de la energı́a total interna.
En efecto, M0 − 2m0 es igual a la energı́a cinética perdida; en el choque esta
energı́a cinética se ha convertido en movimiento rotacional y vibracional de
las moléculas, es decir, calor. Todo este calor es energı́a interna, es masa, es
inercia. Un cuerpo puede contener, albergar, muchas clases de energı́a: masa

73
en reposo de las partı́culas que lo componen, energı́a cinética de ellas y toda
clase de energı́as de interacción entre ellas. La suma de todas estas energı́as
internas se manifiesta como masa; la masa del cuerpo es una medida de la
suma de todas esas energı́as internas.

La relación entre masa y energı́a, dada por la ecuación (3.11), fue, en pal-
abras de Einstein, “el pensamiento más feliz de mi vida”. El artı́culo en el
que publicó este resultado [3] tiene una extensión de menos de tres páginas,
y él lo presenta como una continuación del artı́culo principal [2] de la rel-
atividad. Para deducir la relación entre masa y energı́a, calcula la energı́a
cinética de un cuerpo que emite dos pulsos de luz. Esta es, claramente, una
referencia a la masa inercial del cuerpo; habrı́an de pasar seis años para
que se diera cuenta de que cuando un cuerpo sufre un cambio en su masa
inercial, también sufre un cambio en su masa gravitacional, y que ambos
cambios tienen exactamente la misma magnitud.

Conviene recalcar que aunque la masa y la energı́a están conectadas por


una relación tan simple como E = mc2 , esto no significa que masa y energı́a
sean conceptos idénticos. De hecho, puede haber la segunda sin que haya la
primera: el fotón tiene energı́a, mas no masa.

Afirmamos arriba que la masa de un sistema fı́sico es una medida de su


energı́a interna. En términos de mecánica cuántica, la masa es mayor cuan-
do el sistema ocupa un estado excitado que cuando ocupa el estado básico.
Para ilustrar lo que estamos mencionando, supongamos una molécula for-
mada por dos átomos idénticos; si los dos átomos están en el mismo estado
cuántico, podemos afirmar que tienen la misma masa y por consiguiente el
centro de masa de la molécula está en el punto medio de la lı́nea que los une;
pero si uno de los átomos está en un estado excitado y el otro no, el primero
tiene mayor masa que el segundo y en consecuencia el centro de masa de la
molécula no queda en el punto medio de la lı́nea que los une.

Energı́a de enlace. Cuando Einstein publicó su ecuación E = mc2 , di-


jo claramente que “la radiación transporta inercia”. Decenios de experi-
mentación en fı́sica nuclear y en partı́culas elementales habrı́an de corrob-
orar la validez de esta afirmación. Para verlo con claridad introducimos a
continuación el concepto de energı́a de enlace, valiéndonos de un ejemplo de
la fı́sica nuclear. El deuterón es una partı́cula formada por un protón y un
neutrón. Las masas en reposo de estas tres partı́culas son

74
mp = 938.27 MeV/c2 (3.26)
mn = 939.57 MeV/c2 (3.27)
md = 1875.61 MeV/c2 (3.28)

Rápidamente nos damos cuenta de que mp + mn 6= md . La energı́a de enlace


es, en este caso, (mp + mn )c2 − md c2 = 2.23 MeV. Cuando un fotón in-
cide sobre un deuterón, puede desintegrarlo, produciéndose un protón y un
neutrón. Para que esto ocurra, la energı́a del fotón debe ser igual o mayor
que 2.23 MeV. Ası́ mismo, un protón y un neutrón libres pueden formar
un deuterón; cuando esto ocurre se emite un fotón de energı́a 2.23 MeV.
Lo que hemos mencionado para el deuterón también ocurre fácilmente con
otros núcleos livianos:

núcleo liviano 1 + núcleo liviano 2 → núcleo 3 + fotón (3.29)

Ya que el fotón porta energı́a, es claro que la masa en reposo del núcleo 3
tiene que ser menor que la suma de las masas en reposo de los núcleos 1 y
2. El proceso general (3.29) se llama fusión nuclear y es lo que ocurre en el
Sol, donde dos hidrógenos se pueden fusionar para producir un fotón y un
átomo de helio. De otro lado, en los núcleos pesados es frecuente la reacción:

núcleo pesado → núcleo1 + núcleo 2 + fotón (3.30)

Ya que el fotón porta energı́a, la masa en reposo del núcleo pesado tiene
que ser mayor que la suma de las masas en reposo de los núcleos 1 y 2.
El proceso general (3.30) se llama fisión nuclear, y es lo que ocurre en las
plantas de energı́a nuclear.

3.5 La velocidad lı́mite


p
La ecuación K = m0 c2 / 1 − u2 /c2 − m0 c2 que aparece en la página 68 dice
claramente que K → ∞ cuando u → c . En palabras, para llevar un objeto
masivo desde el reposo hasta que tenga la velocidad de la luz, es necesario
añadirle una cantidad infinita de energı́a. Como es imposible usar una canti-
dad infinita de energı́a, concluimos que ningún objeto masivo se puede llevar

75
hasta la velocidad de la luz. Un sistema de referencia es un cuerpo de reglas
y relojes y, por consiguiente, no puede ser llevado desde el reposo hasta c .
Esta es la razón por la que escribimos la frase en bastardilla en la página
17.

Debemos tener en cuenta que el espaciotiempo de la relatividad especial


tiene un intervalo estático; en efecto, dados un ∆t y un ∆r, el intervalo
(2.1) es constante, no cambia en el tiempo. Cuando se estudien condiciones
que se salen del marco de la relatividad especial, no puede sorprendernos que
ocurran cosas diferentes a las que hemos discutido. Por ejemplo, si el espacio
está explotando, como afirma la teorı́a del big-bang, el intervalo entre dos
eventos fijos no es constante, y en consecuencia[?] algunas galaxias pueden
tener, respecto a nosotros, velocidades mayores que c.

3.6 Las transformaciones de p , E , m , F


Consideremos una partı́cula de masa en reposo m0 sobre la cual se ejerce
una fuerza. Las cantidades fı́sicas que registra O son p , E , m , F , y las de O0
son p0 , E 0 , m0 , F0 . Nos proponemos encontrar las ecuaciones que expresan
las cantidades primadas en términos de las no primadas. Antes de ejecutar
esta tarea es conveniente que demostremos la fórmula:

vu0x
1 1+
p =p c2
p (3.31)
2
1 − u /c 2 1 − u /c 1 − v 2 /c2
0 2 2

Esta ecuación será utilizada varias veces a lo largo de esta sección. Para
deducir la ecuación (3.31) elevamos al cuadrado cada uno de los lados de las
ecuaciones (2.32) , (2.33) y (2.34), obteniéndose:
¡ ¢ ¡ ¢
(u0 + v)2 1 − v 2 /c2 u0y2 1 − v 2 /c2 u0z2
u2x =µ x ¶ ; u2y = µ ¶ ; u2z = µ ¶
vu0x 2 vu0x 2 vu0x 2
1+ 2 1+ 2 1+ 2
c c c

Ahora sumamos, lado a lado, estas tres ecuaciones:

1 £ 0 ¡ ¢¡ 02 ¢¤
u2x + u2y + u2z = µ 0
2 2 2
¶2 (ux + v) + 1 − v /c uy + u0z2
vu
1 + 2x
c

76
En el lado izquierdo identificamos u2x + u2y + u2z = u2 ; en el lado derecho
identificamos u0y2 + u0z2 = u0 2 − u0x2 :
¡ ¢¡ ¢
2 (u0x + v)2 + 1 − v 2 /c2 u0 2 − u0x2
u = µ ¶
vu0 2
1 + 2x
c
µ 0 ¶2
v 2 u0 2 vux
v 2 + u0 2 − 2 + + 2vu0x
c c
= µ ¶
vu0x 2
1+ 2
c

Observemos los dos últimos términos del numerador; si sumamos c2 se com-


pleta el cuadrado:
µ ¶
v 2 u0 2 2 2 vu0x 2
v2 + u0 2 − 2 −c +c 1+ 2
2 c c
u = µ 0
¶2
vu
1 + 2x
c
v 2 u0 2
v 2 + u0 2 − 2 − c2
= c + c2
µ ¶
vu0x 2
1+ 2
c

v 2 u0 2
−v 2 − u0 2 + 2 + c2
c2 − u2 = c
µ ¶
vu0x 2
1+ 2
c
c2 (1 − v 2 /c2 )(1 − u0 2 /c2 )
= µ ¶
vu0x 2
1+ 2
c

Ahora dividir ambos lados por c2 :

(1 − v 2 /c2 )(1 − u0 2 /c2 )


1 − u2 /c2 = µ ¶ ,
vu0x 2
1+ 2
c

77
y de aquı́ se sigue la fórmula (3.31), que es lo que querı́amos demostrar. Ya es-
tamos en condición de calcular la transformación del momentum. Comence-
mos con px que es
m0 ux
px = p
1 − u2 /c2

En el numerador usamos la ecuación (2.32) y en el denominador usamos la


ecuación (3.31):

à !
1 m0 u0x m0 c2 v
px = p p +p
1 − v 2 /c2 02
1 − u /c2 1 − u /c 2
02 2 c

vE 0
p0x + 2
= p c
1 − v 2 /c2

Con procedimientos similares se encuentra que py = p0y y que pz = p0z .


Ataquemos ahora la transformación de la energı́a:

m0 c2
E=p
1 − u2 /c2

En el denominador usamos la ecuación (3.31):

à !
1 m0 c2 m0 u0x
E = p p +v p
1 − v 2 /c2 1 − u02 /c2 1 − u02 /c2

E 0 + vp0x
= p
1 − v 2 /c2

Reunamos las transformaciones obtenidas hasta el momento:

E = γ (E 0 + vp0x ) (3.32)
³ v ´
px = γ p0x + 2 E 0 (3.33)
c
0
py = py , pz = p0z (3.34)

78
A partir de estas cuatro ecuaciones se obtienen las transformaciones inversas
cambiando v por −v e intercambiando variables primadas con no primadas:

E 0 = γ (E − vpx )
³ v ´
p0x = γ px − 2 E (3.35)
c
p0y = py , p0z = pz

Dedujimos las transformaciones de E y p estudiando una partı́cula cualquiera,


de masa m0 . Debemos anotar, sin embargo, que estas transformaciones
tienen validez general, ya que se aplican a cualquier sistema fı́sico. Pensemos
que las últimas ocho ecuaciones son las fórmulas de transformación de la en-
ergı́a y el momentum de cualquier sistema (una nube, un planeta, etc.). Las
cuatro ecuaciones (3.35) son como las cuatro ecuaciones (1.33), si se admite
la correspondencia E/c ↔ ct, px ↔ x, py ↔ y, pz ↔ z. Más concisamente:

µ ¶
E
,p ↔ (ct , r) (3.36)
c

La asociación (3.36) se dice, en palabras, ası́: (E/c , p) transforma como


(ct , r); ası́ se definen los vectores, asunto que trataremos en detalle en el
capı́tulo 5, dedicado a los tensores de la relatividad especial. De otro lado,
estamos a un paso de definir el momentum del fotón y deducir las fórmulas
de la aberración de la luz y del efecto Doppler; pero aplazamos esta tarea
hasta la sección 5.8.

La transformación de la masa se obtiene muy fácilmente si reescribimos


la ecuación (3.32) de la manera siguiente:

mc2 = γ (m0 c2 + m0 vu0x ) ,

de donde:
µ ¶
vu0x
m = γ 1+ 2 m0 (3.37)
c
³ vux ´
m0 = γ 1 − 2 m (3.38)
c

79
Nos queda por calcular la transformación de la fuerza. Comencemos con Fx .
dpx
Escribimos Fx = y usamos la ecuación (2.28):
dt

γ −1 d
Fx = px
vu0x dt0
1+ 2
c

Ahora utilizamos la fórmula (3.33):

µ ¶
1 dp0x v dE 0
Fx = +
vu0 dt0 c2 dt0
1 + 2x
c

dp0x
En el paréntesis del lado derecho reconocemos que = Fx0 y que E 0 =
dt0
m0 c2 ; entonces
1 0 dm0
Fx = (F + v )
vu0x x dt0
1+ 2
c
dm0 1
Ahora, la ecuación (3.47) dice que 0
= 2 F0 · u0 , o sea que
dt c

1 v
Fx = 0 (Fx0 + 2 F0 · u0 )
vu c
1 + 2x
c

Repitamos este análisis para Fy :

γ −1 d
Fy = py
vu0x dt0
1+ 2
c

dpy0 γ −1
Pero py = p0y y = Fy0 , entonces Fy = F 0 , y para Fz un
dt0 vu0x y
1+ 2
c
resultado similar. En conclusión:

80
v 0 0
Fx0 + u ·F
Fx = c2 (3.39)
vu0
1 + 2x
c
γ −1
Fy = F0 (3.40)
vux0 y
1+ 2
c
γ −1
Fz = F0 (3.41)
vux0 z
1+ 2
c

Estas ecuaciones dicen claramente que F0 = 0 ⇔ F = 0: si una partı́cu-


la aparece en equilibrio (en otras palabras, la partı́cula es libre) para un
observador, también aparece en equilibrio para todos los otros observadores
inerciales. Además F0 6= 0 ⇔ F 6= 0: si una partı́cula no aparece en equilibrio
para un observador, entonces todos los otros observadores inerciales regis-
tran que la partı́cula no está en equilibrio. En otras palabras: la condición
de equilibrio es absoluta, y la situación de desequilibrio también es absoluta.
Las recı́procas de las últimas tres ecuaciones son

v
Fx − u·F
Fx0 = c2 (3.42)
vux
1− 2
c
γ −1
Fy0 = vux Fy (3.43)
1− 2
c
γ −1
Fz0 = vux Fz (3.44)
1− 2
c
¦¦¦¦¦¦¦¦¦¦¦¦¦

Ya hemos sentado las bases de la nueva mecánica, relativista. En este mo-


mento el capı́tulo cambia el rumbo que traı́a, para dedicarse al estudio de
ejemplos y casos particulares. Comenzamos con el estudio de una partı́cu-
la cargada que viaja en una región donde hay un potencial electrostático;
luego planteamos el problema general de la aceleración relativista y final-
mente aplicamos este estudio al caso importante de la partı́cula cargada que,
por la acción de un campo magnético, describe una trayectoria circular. Es

81
bien sabido que las cargas eléctricas aceleradas emiten radiación electro-
magnética, y todo estudio riguroso deberı́a tener en cuenta esta pérdida de
momentum y energı́a. El análisis detallado de esta radiación es intrincado
y, de seguirlo, podrı́a distraernos de nuestro propósito principal, que es de-
scribir la ideas esenciales de la mecánica relativistas. Por este motivo, para
simplificar los cálculos, nos olvidaremos de la radiación. Sabemos que de esta
manera se cometen errores esenciales, pero lo hacemos en aras de enfatizar
los aspectos relativistas de la mecánica.

3.7 Masa y potencial electrostático


Estudiemos el movimiento de una partı́cula cargada que se mueve en una
región donde hay un potencial electrostático V . Para simplificar el análisis
supongamos que el movimiento de la partı́cula es en la dirección x. El campo
eléctrico es −dV /dx, la fuerza es −q dV /dx y el trabajo que realiza el campo
cuando la partı́cula se desplaza dx es (−q dV /dx) dx = −q dV. Escribamos
el trabajo total cuando la partı́cula pasa de un punto donde el potencial es
Vi , a otro punto donde el potencial es Vf :

Z Vf
Trabajo = −q dV = −q(Vf − Vi ) ≡ −q∆V (3.45)
Vi

Obsérvese que si q es positiva y ∆V es negativo, entonces el trabajo es posi-


tivo: la carga positiva gana velocidad a medida que desciende en el potencial
electrostático. Gana energı́a cinética, es decir gana masa. La masa que gana
la partı́cula es −q∆V /c2 .

¿Es la masa ganada −q∆V grande o pequeña? Para responder esta pre-
gunta debemos comparar −q∆V con alguna otra masa, y lo más natural es
compararla con m0 . El problema es altamente relativista si −q∆V À m0 c2 ,
y el problema no es relativista si −qV ¿ m0 c2 .

Por ejemplo, en el caso del electrón se tiene m0 c2 = 0.511 MeV; el régi-


men altamente relativista es e∆V À 0.5 MeV, es decir: ∆V À 0.5 MV.
Esto significa que para llevar un electrón al régimen altamente relativista
se necesita que la diferencia ∆V sea mucho mayor que 0.5 megavoltios.
Ası́ mismo, cuando ∆V sea mucho menor que 0.5 megavoltios, podremos
confiadamente pensar que el régimen no es relativista. De aquı́ se saca una
enseñanza: Cuando la energı́a cinética de una partı́cula es mucho mayor

82
que su masa en reposo, el régimen es altamente relativista. Y si la energı́a
cinética es mucho menor que la masa en reposo, el régimen no es relativista,
es decir, no se notan lo efectos relativistas.

Apliquemos el criterio establecido en el último párrafo al caso del electrón


en el átomo de hidrógeno. Las energı́as tı́picas del átomo son electronvoltios;
esto quiere decir que la energı́a cinética es del orden de 1 eV. Para comparar
esta energı́a cinética con la masa en reposo formamos el cociente ası́:

eV
≈ 10−5
0.5 MeV

Como 10−5 es bastante menor que 1, podemos afirmar que en el átomo de


hidrógeno no son prominentes los efectos relativistas. Por eso la solución
no relativista que Schroedinger le dio a este átomo en 1926 funciona bien.
Debemos apuntar, sin embargo, que los efectos relativistas en este átomo,
aunque pequeños, pueden notarse con instrumentos de alta precisión.

3.8 La aceleración
Averiguar la trayectoria de una partı́cula es llegar a una expresión del vector
posición r como función del tiempo t . Claramente, u = dr/dt y a = du/dt,
o sea que para averiguar la trayectoria se puede partir de la aceleración a , e
integrar dos veces. Ahora, para partir de la aceleración es necesario conocer
la fuerza F. En conclusión, para averiguar la trayectoria de una partı́cula
es necesario precisar cómo se averigua a cuando se conoce F. Usamos las
ecuaciones (3.3) y (3.5) para escribir:

d du dm
F = (mu) = m +u
dt dt dt
dm
= ma +u (3.46)
dt

Esta fórmula dice que, cuando la masa varı́a con el tiempo, la fuerza no
es simplemente ma. Es interesante anotar que la ecuación (3.46) es válida
tanto en la mecánica newtoniana (un cometa pierde agua por evaporación
cuando se acerca al Sol, y en consecuencia dm/dt 6= 0) como en la mecánica
relativista (cuando la partı́cula gana u su masa aumenta y en consecuencia

83
dm/dt 6= 0); el hecho, según (3.46), de que a no sea en general paralela a
F, no es un resultado exclusivo de la relatividad especial, sino que ya era
posible en la mecánica newtoniana. Para calcular dm/dt en el caso relativista
usamos las ecuaciones (3.10) y (3.11):

dm 1 dE 1 d 1 dK
= 2 = 2 (m0 c2 + K) = 2
dt c dt c dt c dt

Ahora, dK es un diferencial de trabajo F · dr:

dm 1 dr
= 2

dt c dt
1
= F·u (3.47)
c2

Colocando esta ecuación en (3.46) escribimos:

F·u
F = ma + u, es decir: (3.48)
c2
F F·u
a = − u (3.49)
m mc2

Vemos ası́ que en la relatividad especial la aceleración no es, en general,


paralela a la fuerza. Se presentan sin embargo dos situaciones excepcionales
en las que fuerza y aceleración sı́ son paralelas: cuando F es paralela a u, y
cuando F es perpendicular a u. Si F es paralela a u la ecuación (3.49) da:

F F uu
a = −
m mc2
¡ ¢F
= 1 − u2 /c2
m
¡ ¢ F
3
= 1 − u2 /c2 2 para F k u (3.50)
m0

Ahora, si F y u son perpendiculares, la ecuación (3.49) da:

F
a =
m

84
¡ ¢ F
= 1 − u2 /c2 para F ⊥ u (3.51)
m0

La fórmula (3.50) se usa en el caso de los aceleradores lineales. La fórmula


(3.51) se usa en los ciclotrones y, en general, siempre que una carga eléctrica
se mueva en un lugar donde hay un campo magnético uniforme.

3.9 Movimiento circular


Estudiemos el movimiento de una partı́cula en un plano en coordenadas
polares (r, θ). El vector unitario 1r apunta en dirección de r, y el vector 1θ
es perpendicular a r. Es bien sabido [?] que:

dr dθ
u = 1r + 1θ r
dt dt
à µ ¶2 ! µ ¶
d2 r dθ dr dθ d2 θ
a = 1r −r + 1θ 2r +r 2
dt2 dt dt dt dt

Si colocamos este resultado en la ecuación general (3.49) se obtiene

à µ ¶2 ! µ ¶
d2 r dθ dr dθ d2 θ F F·u
1r −r + 1θ 2r +r 2 = − u (3.52)
dt2 dt dt dt dt m mc2

Pensemos ahora que se presentan estas condiciones: E = 0, B es uniforme


y una partı́cula ingresa con una velocidad u que es perpendicular a B. La
u
fuerza sobre la partı́cula es q × B. Esta fuerza es perpendicular a u y la
c
ecuación (3.49) dice que la aceleración también es perpendicular a u. En
conclusión, la fuerza ocasiona un cambio constante en la dirección de u sin
que cambie u, resultando ası́ un movimiento circular uniforme. Es claro que
dr d2 r d2 θ
= 2 = 2 = 0, y la ecuación (3.52) queda:
dt dt dt
µ ¶2
dθ q
−1r r = u×B
dt mc
µ ¶2
dθ |q|Bu
r =
dt mc

85

Ahora, r = u, entonces
dt

u2 |q|Bu
=
r mc
muc
r = (3.53)
|q|B

Partı́cula preparada en un filtro de velocidades. La fórmula (3.53)


se puede escribir:
m0 c u
r= q (3.54)
|q|B
1 − u2 /c2

Esta fórmula es útil si u es dado. Tal es el caso cuando, antes de entrar en el


campo B, la partı́cula es preparada en un filtro de velocidades. Sabemos [?]
que un filtro de velocidades se construye con campos E1 y B1 perpendicu-
lares. Una partı́cula de carga q y velocidad u experimenta una fuerza dada
1 1
por q(E1 + u1 × B1 ). Esta fuerza es cero si E1 + u1 × B1 = 0, es decir,
c c
si u1 × B1 = −E1 . Las únicas partı́culas cargadas que siguen derecho, sin
desviarse, son aquellas que ingresan al filtro con una velocidad cuya mag-
nitud es c E1 /B1 y cuya dirección es perpendicular a E1 y a B1 . Pensemos
en una partı́cula que emerge de este filtro de velocidades y luego entra en
la región donde existe el campo B. Hacemos entonces u = cE1 /B1 en la
ecuación (3.54):

m0 c2 E1 /B1
r= p : Cálculo relativista (3.55)
|q|B 1 − (E1 /B1 )2

En este momento nos preguntamos cuál serı́a el radio si hiciéramos el cálculo


de acuerdo con la fı́sica prerrelativista. Para contestar esta pregunta basta
que tomemos en la ecuación (3.55) la aproximación u2 /c2 ¿ 1, es decir,
(E1 /B1 )2 ¿ 1:

m0 c2 E1
r= : Cálculo prerrelativista (3.56)
|q|BB1

86
Partı́cula preparada en un acelerador. De acuerdo con la fórmula
(3.53):
pc
r= (3.57)
|q|B
p
De otro lado, traigamos de la página 68 la fórmula pc = (m0 c2 + K)2 − (m0 c2 )2 .
Si usamos este valor de pc en la ecuación (3.57) encontramos

1 p
r= (m0 c2 + K)2 − (m0 c2 )2 (3.58)
|q|B

Esta fórmula es útil cuando K es dado. Tal es el caso si, antes de entrar en el
campo B, la partı́cula es preparada en un acelerador. Supongamos que una
partı́cula de carga q es acelerada a través de una diferencia de potencial ∆V ;
de acuerdo con la ecuación (3.45) se tiene K = −q∆V = |q∆V |, entonces:

1 p
r = (m0 c2 + |q∆V |)2 − (m0 c2 )2
|q|B
p s
2m0 c2 |q∆V | |q∆V |
= 1+ (3.59)
|q|B 2m0 c2

Nos preguntamos de nuevo cuál habrı́a sido r si hubiéramos hecho el cálculo


usando la fı́sica prerrelativista. Basta que en la ecuación (3.59) se haga la
|q∆V |
aproximación u2 /c2 ¿ 1, es decir, ¿1:
m0 c2
p
2m0 c2 |q∆V |
r= : Cálculo prerrelativista (3.60)
|q|B

Ejemplo. Considere un filtro de velocidades construido con un campo


magnético de 2000 gauss y un campo eléctrico de 1800 statvolt/cm. Un
electrón emerge de este filtro y entra en una región donde hay un campo
magnético de 1500 gauss (al entrar en esta región la velocidad del electrón es
perpendicular al campo de 1500 gauss). Calcule el radio del cı́rculo descrito
por el electrón de dos maneras: usando la teorı́a de la relatividad y usando
la fı́sica prerrelativista.

Las cantidades fı́sicas de este problema son:

87
m0 c2 = 0.511 MeV, |q| = 4.8 × 10−10 esu
(3.61)
E1 = 1800 statvolt/cm, B1 = 2000 gauss, B = 1500 gauss

La fórmula (3.55) da, en este caso,

0.511 MeV 1800/2000


r = −10
s µ ¶
4.8 × 10 × 1500 dina 1800 2
1−
2000

Ahora, eV = 1.6 × 10−12 ergio, o sea que

eV/dina = 1.6 × 10−12 cm (3.62)

r = 2.35 cm Cálculo relativista. (3.63)

Para el cálculo prerrelativista usamos la ecuación (3.56), y se obtiene:

r = 1.02 cm Cálculo prerrelativista. (3.64)

La comparación entre las ecuaciones (3.63) y (3.64) muestra que el resultado


relativista es mayor que el prerrelativista. La causa de esto no es difı́cil
de rastrear; en efecto, la diferencia entre los dos cálculos está en la raı́z
cuadrada en el denominador de la ecuación (3.55), que es justamente el
que causa el crecimiento de la masa de una partı́cula en la teorı́a de la
relatividad. Se esperaba que el resultado del cálculo relativista fuera mayor
que el prerrelativista, porque en el primero la partı́cula es más masiva que
en el segundo, y esto debe notarse como una ampliación del cı́rculo.

Ejemplo. Un protón se acelera desde el reposo a través de una diferencia


de potencial de 5 MV y luego ingresa en una región donde hay un campo
magnético de 30000 gauss. Calcular el radio del cı́rculo de acuerdo con la
teorı́a de la relatividad, y luego usando la fı́sica prerrelativista. La masa del
protón es 938 MeV/c2 .

Las cantidades fı́sicas de este problema son:

88
m0 c2 = 938 MeV, |q| = 4.8 × 10−10 esu
B = 30000 gauss, |q∆V | = 5 MeV

Con estas cantidades la fórmula (3.59) es:

p r
2 × 938 × 5 × (MeV)2 5
r = 1+
4.8 × 10−10 × 30000 dina 2 × 938

Usar la fórmula (3.62):


r = 10.76 1 + 0.0027 cm = 10.77 cm (3.65)

El cálculo prerrelativista se hace con la ecuación (3.60). El resultado da


como en la ecuación (3.65), pero sin la raı́z cuadrada:

r = 10.76 cm : Cálculo prerrelativista. (3.66)

De nuevo, el resultado (3.65) es mayor que (3.66) porque la partı́cula tiene


mayor masa en la relatividad especial.

uy
ux
B uy ux

A
uy
ux
ux
uy

Figura 3.1 El choque de dos partı́culas según lo registra un observador O que


está en reposo respecto al centro de masa. La partı́cula A va de derecha a izquierda
y la partı́cula B de izquierda a derecha. ux y uy son cantidades positivas.

89
u'By
u'Bx
u'Bx
u'By

u'Ay
u'Ax
u'Ax
u'Ay

Figura 3.2 El mismo choque de


la Figura 3.1, según lo registra
otro observador O0 que viaja ha-
cia la derecha con velocidad v.

m e p e

u u
c c

Figura 3.3 La masa como fun- Figura 3.4 El momentum como


ción de la velocidad. La versión función de la velocidad. La ver-
newtoniana tiene la marca n, y sión newtoniana tiene la marca
la einsteiniana tiene la marca e. n, y la einsteiniana tiene la mar-
ca e.

90
K E e
e

u u
c c

Figura 3.5 Energı́a cinética en Figura 3.6 La energı́a total co-


función de la velocidad. La ver- mo función de la velocidad. La
sión newtoniana tiene la marca versión newtoniana tiene la mar-
n, y la einsteiniana tiene la mar- ca n, y la einsteiniana tiene la
ca e. marca e.

Antes Después

mo mo
u u M0, reposo
A B

Figura 3.7 El choque de dos partı́culas de masas iguales, de acuerdo con un ob-
servador O que está en reposo respecto al centro de masa. Antes del choque las
partı́culas tienen velocidad u . El choque deja como resultado un cuerpo final en
reposo de masa M0 . Claramente la energı́a cinética final es cero: para O la colisión
es completamente inelástica.

Antes Después

Reposo
u' u M0
A B

Figura 3.8 El mismo choque de la Figura 3.7, pero ahora desde el punto de vista de
un observador O0 que se mueve hacia la derecha con velocidad u . Para O0 , antes del
choque el cuerpo A está en reposo y el cuerpo B tiene velocidad u0 hacia la izquierda.
Después del choque el cuerpo final M0 tiene velocidad u hacia la izquierda.

91
92
Capı́tulo 4

El campo electromagnético

En los capı́tulos anteriores discutimos algunas consecuencias del principio


de la relatividad. De un lado, nos vimos poco menos que obligados a gen-
eralizar los conceptos newtonianos de masa, momentum, energı́a, etc. Y de
otro lado, cuando dos observadores inerciales toman medidas de longitud,
tiempo, fuerza, etc., el principio de la relatividad nos mostró de qué manera
se establece una comparación entre las dos mediciones. El capı́tulo presente
se refiere a la segunda clase de consecuencias: estudiaremos cómo se com-
paran los campos eléctrico y magnético que registra un observador, con los
registros de otro observador. El tema es de primera importancia, como lo
demuestra el hecho de que el mismo Einstein, en el primer párrafo del artı́cu-
lo [2] en que publica su relatividad especial, presenta ası́ la motivación, la
idea central de su trabajo: las leyes del electromagnetismo deben ser, en el
fondo, las mismas para todos los observadores inerciales1 .

Concentraremos nuestra atención en la transformación del campo electro-


magnético, y presentaremos dos ejemplos interesantes: la carga móvil y el
alambre que porta una corriente. Finalmente veremos que la electrodinámica
cumple el principio de la relatividad, es decir, que las ecuaciones de Maxwell
y la ley de fuerza de Lorentz son covariantes bajo las transformaciones de
Lorentz.

4.1 Transformación de los campos E y B


De acuerdo con el observador O, las componentes del campo electromagnético
son E, B. El mismo campo electromagnético tiene, para O0 , componentes
1
El artı́culo lleva por tı́tulo Sobre la electrodinámica de cuerpos en movimiento. La
palabra cuerpo quiere decir observador inercial.

93
E0 , B0 . Nos proponemos encontrar la transformación entre E, B y E0 , B0 ;
es decir, vamos a encontrar las fórmulas que nos permiten escribir las com-
ponentes E0 , B0 en términos de las componentes E, B.

Para hallar las fórmulas de la transformación del campo electromagnético


asumiremos que las ecuaciones de Maxwell representan fielmente a las leyes
fı́sicas del electromagnetismo. De acuerdo con el principio de la relatividad
(1.10), la forma de estas ecuaciones debe ser la misma para todos los obser-
vadores inerciales. Tomemos dos de las ecuaciones de Maxwell:

1 ∂E
= ∇×B (4.1)
c ∂t
1 ∂B
= −∇ × E (4.2)
c ∂t

Ası́ son para el observador O. Siguiendo el principio de la relatividad, afir-


mamos que para O0 :

1 ∂E0
= ∇0 × B0 (4.3)
c ∂t0
1 ∂B0
= −∇0 × E0 (4.4)
c ∂t0

La parte y de la ecuación (4.1) es:

1
∂t Ey = ∂z Bx − ∂x Bz (4.5)
c

Ası́ mismo, la parte z de (4.2) y la parte z de (4.1) son:

1
∂t Bz = ∂y Ex − ∂x Ey (4.6)
c
1
∂t Ez = ∂x By − ∂y Bx (4.7)
c

Las ecuaciones de O0 que corresponden a (4.5), (4.6) y (4.7) son:

1
∂t0 Ey0 = ∂z 0 Bx0 − ∂x0 Bz0 (4.8)
c

94
1
∂t0 Bz0 = ∂y0 Ex0 − ∂x0 Ey0 (4.9)
c
1
∂t0 Ez0 = ∂x0 By0 − ∂y0 Bx0 (4.10)
c

Ahora ponemos las cuatro derivadas (1.44) en las ecuaciones (4.5)-(4.7) para
obtener:

1 ³ v ´ ³ v ´
∂t0 γ Ey − Bz = ∂z 0 Bx − ∂x0 γ Bz − Ey (4.11)
c c c
1 ³ v ´ ³ v ´
∂t0 γ Bz − Ey = ∂y0 Ex − ∂x0 γ Ey − Bz (4.12)
c c c
1 ³ v ´ ³ v ´
∂t0 γ Ez + By = ∂x0 γ By + Ez − ∂y0 Bx (4.13)
c c c

Al comparar las ecuaciones (4.8) y (4.11) vemos que Ey0 debe ser proporcional
v
a γ(Ey − Bz ), que Bx0 debe ser proporcional a Bx , y que Bz0 debe ser
c
v
proporcional a γ(Bz − Ey ). Llamemos f al factor de proporcionalidad.
c
Esta f debe ser independiente de t, x, y, z, pero puede, en principio, ser
función de v:
³ v ´
Ey0 = f (v)γ Ey − Bz (4.14)
c
Bx0 = f (v)Bx (4.15)
³ v ´
Bz0 = f (v)γ Bz − Ey (4.16)
c

De la misma manera, la comparación de las ecuaciones (4.9) y (4.12) da:

³ v ´
Bz0 = g(v)γ Bz − Ey (4.17)
c
Ex0 = g(v)Ex (4.18)
³ v ´
Ey0 = g(v)γ Ey − Ez , (4.19)
c

donde g(v) es algún factor de proporcionalidad. Finalmente, introduciendo


otro factor h(v), la comparación de las ecuaciones (4.10) y (4.13) da:

95
³ v ´
Ez0 = h(v)γ Ez + By (4.20)
c
³ v ´
By0 = h(v)γ By + Ez (4.21)
c
Bx0 = h(v)Bx (4.22)

Las ecuaciones (4.16) y (4.17) dicen que g = f , y las ecuaciones (4.15) y


(4.22) dicen que h = f . De este modo vemos que las seis componentes del
campo electromagnético transforman ası́ :

Ex0 = f (v)Ex (4.23)


³ v ´
Ey0 = f (v)γ Ey − Bz (4.24)
c
³ v ´
Ez0 = f (v)γ Ez + By (4.25)
c

Bx0 = f (v)Bx (4.26)


³ v ´
By0 = f (v)γ By + Ez (4.27)
c
³ v ´
Bz0 = f (v)γ Bz − Ey (4.28)
c

Nos queda por averiguar la función desconocida f (v). Anticipándonos al re-


sultado final, afirmamos que f (v) es igual a 1. Para probar esto seguiremos
tres pasos: primero probaremos que f (v) = f (−v), luego probaremos que
f (v) = ±1, y finalmente escogeremos el signo superior +.

Supongamos por un momento que Ey = 0; en este caso la ecuación (4.28)


da:

Bz0 = f (v)γBz (4.29)

Ahora pensemos en un tercer observador O00 que se mueve, respecto a O,


con velocidad v en dirección −x. En vista de la ecuación (4.29):

Bz00 = f (−v)γBz (4.30)

96
Claramente Bz0 y Bz00 deben ser iguales, entonces la comparación de las ecua-
ciones (4.29) y (4.30) da:

f (−v) = f (v) (4.31)

Pasemos ahora a escribir las recı́procas de las ecuaciones (4.24) y (4.28). Para
tal efecto intercambiamos variables primadas con no primadas y cambiamos
v por −v:

³ v 0´
Ey = f (−v)γ Ey0 + B
c z
³ v 0´
Bz = f (−v)γ Bz0 + E ,
c y

y en vista de (4.31):

³ v 0´
Ey = f (v)γ Ey0 + B
c z
³ v 0´
Bz = f (v)γ Bz0 + E
c y

Entonces, colocando estas expresiones de Ey y Bz en el lado derecho de


(4.24) encontramos:

h³ v ´ v³ 0 v ´i
Ey0 = f 2 γ 2 Ey0 + Bz0 − Bz + Ey0
c c c
µ ¶
v2
= f 2 γ 2 1 − 2 Ey0 ,
c

o sea que f 2 = 1:

f = ±1 (4.32)

Las ecuaciones (4.23) y (4.32) dicen que Ex0 = ±Ex . El signo inferior, −,
expresa una inversión del campo, que es increı́ble. Entonces en la ecuación
(4.32) debemos escoger el signo superior, f = 1, y las ecuaciones (4.23)-
(4.28) son, finalmente:

97
Ex0 = Ex (4.33)
³ v ´
Ey0 = γ Ey − Bz (4.34)
c
³ v ´
0
Ez = γ Ez + By (4.35)
c

Bx0 = Bx (4.36)
³ v ´
By0 = γ By + Ez (4.37)
c
³ v ´
Bz0 = γ Bz − Ey (4.38)
c

Estas seis ecuaciones de transformación se pueden escribir de un modo más


general, ası́:

v
E0 = E + (γ − 1)E⊥ + γ ×B (4.39)
c
v
B0 = B + (γ − 1)B⊥ − γ × E (4.40)
c

La ecuación (4.39) dice que el campo E0 se construye con dos aportes: de un


v
lado, el campo E, y del otro lado el campo inducido (γ − 1)E⊥ + γ × B.
c
Ası́ mismo, la ecuación (4.40) dice que el campo B0 se construye con dos
aportes: de un lado, el campo B, y del otro lado el campo inducido (γ −
v
1)B⊥ − γ × E . Fijemos nuestra atención en los campos inducidos.
c
Lo primero que debemos notar es que el campo inducido depende crucial-
mente de la velocidad v, ya que es cero cuando v es cero, y es una función
monótonamente creciente de v. Por esto debemos acostumbrarnos a pensar
que el campo inducido es inducido por v: es el movimiento de O0 lo que hace
aparecer un campo inducido en O0 . Pero no basta que O0 se esté moviendo
respecto a O. Se requiere además que en O haya campos perpendiculares
B⊥ o E⊥ , según se lee en las ecuaciones (4.39) y (4.40). Son los campos
perpendiculares en O los que inducen campos en O0 . Los campos paralelos
Ek y Bk no inducen campos en O0 .

Las seis ecuaciones (4.33)-(4.38) expresan a los campos primados en términos


de los no primados. Las ecuaciones recı́procas se obtienen intercambiando
variables primadas y no primadas, y cambiando v por −v:

98
Ex = Ex0 (4.41)
³ v 0 ´
Ey = γ Ey0 + B (4.42)
c z
³ v 0´
Ez = γ Ez0 − B (4.43)
c y

Bx = Bx0 (4.44)
³ v 0´
By = γ By0 − E (4.45)
c z
³ v 0´
Bz = γ Bz0 + E (4.46)
c y

Escribimos también las recı́procas de las ecuaciones (4.39) y (4.40):

v
E = E0 + (γ − 1)E0⊥ − γ × B0 (4.47)
c
v
B = B0 + (γ − 1)B0⊥ + γ × E0 (4.48)
c

4.2 Dos cantidades invariantes


En esta sección nos proponemos demostrar que las cantidades E·B y E 2 −B 2
son invariantes, es decir, que:

E · B = E0 · B0 (4.49)
E 2 − B 2 = E 02 − B 02 (4.50)

Para probar la ecuación (4.49) comenzamos escribiendo el producto E0 ·B0 en


la forma Ex0 Bx0 +Ey0 By0 +Ez0 Bz0 . Ahora procedemos a expresar esta cantidad en
términos de variables no primadas, para lo cual utilizamos las seis ecuaciones
(4.33)-(4.38):

E0 · B0 = Ex0 Bx0 + Ey0 By0 + Ez0 Bz0


³ v ´³ v ´
= Ex Bx + γ 2 Ey − Bz By + Ez
c c

99
³ v ´³ v ´
+γ 2 Ez + By Bz − Ey
c c

= Ex Bx + Ey By + Ez Bz

= E·B

De la misma manera se prueba la ecuación (4.50): comenzamos escribiendo


E 02 − B 02 en la forma Ex02 + Ey02 + Ez02 − Bx02 − By02 − Bz02 , y luego procedemos
a expresar esta cantidad en términos de variables no primadas, para lo cual
utilizamos las seis ecuaciones (4.33)-(4.38):

E 02 − B 02 = Ex02 + Ey02 + Ez02 − Bx02 − By02 − Bz02

³ v ´2 ³ v ´2
= Ex2 + γ 2 Ey − Bz + γ 2 Ez + By
c c
³ v ´2 ³ v ´2
−Bx02 − γ 2 By + Ez − γ 2 Bz − Ey
c c

= E2 − B2

Usaremos las cantidades E = |E| y B = |B|; es claro que E y B son mayores


o iguales a cero. La ecuación (4.50) tiene varias consecuencias interesantes:

E < B ⇐⇒ E 0 < B 0 (4.51)


B < E ⇐⇒ B 0 < E 0 (4.52)
E = B ⇐⇒ E 0 = B 0 (4.53)

Estas tres implicaciones, en palabras, rezan: Si uno de los campos (bien sea
el eléctrico o el magnético) es menor que el otro en un sistema de referencia,
lo será también en todos los otros sistemas de referencia. Si los dos campos
son de igual magnitud para un observador, serán de igual magnitud para
todos los observadores.

100
La existencia de dos cantidades invariantes, E·B y E 2 −B 2 , no es accidental,
sino que responde a la existencia de simetrı́as de fondo, como veremos en la
sección 6.6.

4.3 El campo electromagnético total

Supongamos que para el observador O0 el campo electromagnético aparece


puramente eléctrico, es decir, B0 = 0. ¿Cómo aparece el campo electro-
magnético para otro observador O que se mueve, respecto a O0 , con veloci-
dad −v ? La respuesta se obtiene haciendo B0 = 0 en las fórmulas (4.47) y
(4.48):

E = E0k + γE0⊥ (4.54)


v
B = γ × E0⊥ (4.55)
c

La ecuación (4.55) muestra que para O existe, en general, campo magnético.


Vemos ası́ que un campo electromagnético que es puramente eléctrico para
un observador aparece, a otros observadores, en general, como una mezcla de
campos eléctrico y magnético. Del mismo modo, cuando un campo electro-
magnético es puramente magnético para un observador, otros observadores
registran un campo magnético y además un campo eléctrico.

Esto nos recuerda los primeros párrafos del Capı́tulo 2, donde considerábamos
dos eventos con separación puramente espacial o puramente temporal, para
un observador. Apuntábamos en esa ocasión que para otros observadores
los eventos aparecen, en general, con separaciones espacial y temporal. Y
concluı́amos entonces que el espacio y el tiempo no son entidades inde-
pendientes, sino que forman un todo. Del mismo modo nosotros, ahora
hablando del campo electromagnético, afirmamos que los campos eléctrico y
magnético no son independientes uno del otro, sino que forman un todo elec-
tromagnético que es irreductible. Cada observador inercial puede establecer
un corte, un lindero, entre su campo eléctrico y su campo magnético, pero
el lindero que establece O es diferente al que establece O0 .

101
4.4 Una carga con velocidad uniforme
Para mostrar una aplicación de la transformación (4.41)-(4.46), queremos re-
solver un problema clásico de electromagnetismo, que consiste en averiguar
los campos eléctrico y magnético que produce una carga que tiene velocidad
rectilı́nea uniforme u . Este problema se puede resolver [9] por medio de los
potenciales de Liénard-Wiechert, en los que se tiene en cuenta que la señal
electromagnética toma cierto tiempo para viajar desde la partı́cula hasta el
punto de observación, lo que hace necesario que se usen tiempos retardados.
Este modo de atacar el problema es complicado. En esta sección lo resolver-
emos muy fácilmente, utilizando nuestros conocimientos de relatividad. La
estrategia es resolver inicialmente el problema de acuerdo con un observador
inercial O0 en reposo respecto a la partı́cula; una vez obtenidos E0 , B0 , uti-
lizamos las seis ecuaciones (4.41)-(4.46) para averiguar los campos E, B que
registra otro observador que se mueve, respecto al anterior, con velocidad
constante −u .

Para O0 el fenómeno es muy simple. Como la carga está en reposo, no hay


campo magnético B0 , y el campo eléctrico E0 es el de Coulomb:

B0 = 0 (4.56)
q
E0 = 1r0
r02

Aquı́, 1r0 es un vector unitario que apunta en la dirección de r0 . Claramente


r0 qr0
1r0 = 0 y el campo eléctrico es E0 = 03 . Las tres componentes cartesianas
r r
de este campo son:

qx0 qy 0 qz 0
Ex0 = ; Ey0 = ; Ez0 = (4.57)
r03 r03 r03

Tal como hemos indicado, O0 se mueve respecto a O con velocidad u . Nótese


que esta u está jugando el papel que siempre le hemos asignado a v , lo que
quiere decir que el γ de la ecuación (1.32) ahora quiere decir

1
γ=p (4.58)
1 − u2 /c2

102
En este momento suponemos que el eje x está orientado paralelo a la ve-
locidad u de la partı́cula, y podemos colocar los campos primados (4.56) y
(4.57) en las seis ecuaciones (4.41)-(4.46) para obtener:

qx0
Ex = Bx = 0
r03
γqy 0 quγ z 0
Ey = 03 By = −
r c r03
γqz 0 quγ y 0
Ez = 03 Bz =
r c r03

Estos son los campos para el observador O. Debemos, sin embargo, pulir
estas expresiones para que contengan únicamente variables no primadas,
utilizando las transformaciones de Lorentz (1.33). Al ejecutar esta tarea se
debe recordar que r03 = (x02 + y 02 + z 02 )3/2 = [γ 2 (x − ut)2 + y 2 + z 2 ]3/2 :

qγ(x − ut)
Ex =
− ut)2 + y 2 + z 2 ]3/2
[γ 2 (x
qγy
Ey = 2 (4.59)
[γ (x − ut)2 + y 2 + z 2 ]3/2
qγz
Ez = 2
[γ (x − ut)2 + y 2 + z 2 ]3/2

Bx = 0
quγ
z
By = − 2 c
[γ (x − ut)2 + y 2 + z 2 ]3/2 (4.60)
quγ
y
By = 2 c
[γ (x − ut)2 + y 2 + z 2 ]3/2

La Figura 4.1 muestra el campo E para u = 0; nótese que E es radial e


isotrópico. La Figura 4.2 es para u 6= 0: el campo E es radial (respecto a la
posición de la partı́cula) pero no es isotrópico.

El flujo de energı́a. La densidad de energı́a por unidad de volumen es


1 ¡ ¢
(campo eléctrico)2 + (campo magnético)2 de donde vemos que tanto

103
para O0 como para O, hay energı́a electromagnética. Ahora, como para O0
la carga está en reposo, la energı́a electromagnética también está en reposo.
Sin embargo, para O la partı́cula se mueve y este observador deberı́a registrar
que la energı́a electromagnética fluye. La cantidad adecuada para describir
el flujo de la energı́a electromagnética es el vector de Poynting:

c
S= E×B (4.61)

S es la cantidad de energı́a electromagnética que, por unidad de tiempo,


cruza la unidad de área perpendicular. Utilizando las seis ecuaciones (4.59)
y (4.60) obtenemos:

q 2 uγ 2 (y 2 + z 2 )1x − (x − ut)(y1y + z1z )


S=
4π [γ 2 (x − ut)2 + y 2 + z 2 ]3

Podemos especializar esta fórmula en z = 0:

q 2 uγ 2 y 2 1x − (x − ut)y1y
S= (4.62)
4π [γ 2 (x − ut)2 + y 2 ]3

4.5 Un alambre recto con corriente


A continuación vamos a estudiar [6] lo que ocurre con un alambre recto que
porta una corriente, desde el punto de vista de la relatividad. Llegaremos a
un resultado interesante: si el alambre aparece neutro para un observador,
entonces aparece cargado para otros observadores.

Para comprender este efecto es importante que nos demos cuenta del modo
como están repartidas las partı́culas cargadas dentro de un metal. Los iones
positivos forman una red aproximadamente inmóvil, y algunos electrones
forman un fluido que viaja, que se cuela a través de la malla rı́gida, cuan-
do hay una diferencia de potencial. La Figura 4.3 muestra un modelo para
entender la corriente en un alambre recto, de acuerdo con un observador O
que se encuentra en reposo respecto a los iones positivos. Los electrones se
mueven hacia la derecha con una velocidad u, o sea que la corriente eléctrica
va hacia la izquierda.

104
Supongamos que para O el alambre es neutro. Esto quiere decir que las
cargas positivas y negativas son equidistantes. Sin embargo, el fenómeno
debe aparecer diferente a otro observador O0 que se mueve con velocidad u
hacia la derecha, según muestra la Figura 4.4. En esta figura aparecen, en
lı́neas punteadas, las trayectorias de los iones y de los electrones. Nótese que
para O0 la distancia entre electrones es mayor que la distancia entre iones
positivos. Esto quiere decir que, para O0 , la densidad de carga positiva por
unidad de longitud es mayor que la densidad negativa: el alambre que es
neutro para O es cargado para O0 .

Estudio formal. Veamos de qué manera las ecuaciones de la teorı́a de la


relatividad dan cuenta del fenómeno que acabamos de describir cualitativa-
mente. Llamemos d0+ y d − a las densidades de carga positiva y negativa,
según el observador O. Nótese el subı́ndice cero en la densidad positiva,
acentuando que para O las cargas positivas están en reposo. Claramente,

d0+ > 0 , d − < 0 (4.63)

Para el observador O0 los electrones están en reposo y forman una densidad


de carga d0− , y los iones positivos tienen una velocidad u y forman una
densidad de carga d + . Claramente,

d0− < 0 , d + > 0 (4.64)

Para O la densidad neta es:

d = d0+ + d − (4.65)

mientras que la densidad neta para O0 es

d0 = d + + d0− (4.66)

Ahora, de acuerdo con2 la ecuación (2.24):


2
Aquı́ también γ está dada por la ecuación (4.58).

105
d + = γd0+ (4.67)
d − = γd0− , (4.68)

entonces las ecuaciones (4.65) y (4.66) son:

d = d0+ + γd0− (4.69)


d0 = γd0+ + d0− (4.70)

Nótese que

d0 = d + (γ − 1)(d0+ − d0− ) (4.71)

Recordemos, de acuerdo con las fórmulas (4.63) y (4.64), que d0+ y −d0−
son cantidades positivas, entonces la ecuación (4.71) dice que d0 > d: la
densidad de carga por unidad de longitud es mayor para O0 que para O. Si
d = 0, entonces la ecuación (4.69) da d0− = −d0+ /γ, y las ecuaciones (4.68)
y (4.71) se convierten en:

d − = −d0+ (4.72)
d0 = (γ − γ −1 )d0+ (4.73)

Los campos. Pasemos ahora a calcular los campos eléctrico y magnético.


Pensemos en el problema general de un alambre recto que tiene cierta carga
por unidad de longitud; es bien sabido que el campo eléctrico a una distancia
R del alambre está dado por:

2 × carga por unidad de longitud


campo eléctrico = (4.74)
R

y si el alambre porta una corriente se usa la ley de Biot-Savart:

2 × corriente
campo magnético = (4.75)
cR

Apliquemos las fórmulas (4.74) y (4.75) al observador O:

106
E = 0 (4.76)
2ud −
B = − ,
cR

donde hemos puesto el signo − para que la magnitud B resulte positiva. En


vista de la ecuación (4.72):

2ud0+
B= (4.77)
cR

También podemos usar las fórmulas (4.74) y (4.75) para el observador O0 :

2d0
E0 =
R
2ud +
B0 = ,
cR

y en vista de las ecuaciones (4.73) y (4.67):

2(γ − γ −1 )d0+
E0 = (4.78)
R
+
2γud0
B0 = (4.79)
cR

Finalmente, conviene anotar que las ecuaciones (4.76), (4.77), (4.78) y (4.79)
satisfacen las reglas de transformación (4.34) y (4.38). Esta es una pequeña
prueba de consistencia de nuestra teorı́a relativista del electromagnetismo.

Circuitos. Hemos estudiado un alambre recto que, para O, es neutro y


porta una corriente eléctrica hacia la izquierda; para O0 el alambre aparece
cargado positivamente. Ası́ mismo, si para O la corriente es hacia la izquier-
da, entonces para O0 el alambre aparece cargado negativamente. Pensemos
ahora en un circuito rectangular que porta una corriente eléctrica, como en
la Figura 4.5. Para O0 , el lado CD está cargado positivamente y el lado AB
negativamente, dando como resultado [?] un momento dipolar eléctrico que
apunta hacia arriba. El observador O0 puede legı́timamente concluir que los
circuitos eléctricos que se mueven tienen momento dipolar eléctrico.

107
4.6 Anulando el campo menor
Hemos visto que los valores de los campos eléctrico y magnético dependen
del estado de movimiento del observador. Nos preguntamos ahora si para
algún observador se vuelve cero alguno de los dos campos. Si para algún
observador el campo eléctrico (magnético) es cero, decimos que el campo
eléctrico (magnético) es anulable.

Rápidamente nos damos cuenta de qué condiciones se deben cumplir para


que un campo sea anulable. Supongamos por ejemplo que el campo magnético
es anulable y llamemos O0 al observador que registra que el campo magnético
es cero: B0 = 0. Esta ecuación implica que E0 · B0 = 0 y que B 0 < E 0 . Pero,
de acuerdo con (4.49) y (4.52), estas dos propiedades son invariantes, de
donde podemos concluir que, para cualquier observador, el producto escalar
de los dos campos es cero y el campo magnético es menor que el eléctrico.
Un resultado similar se obtiene cuando el campo eléctrico es anulable.

También abordaremos el asunto importante de identificar al observador O0


para el cual uno de los dos campos es nulo. Para identificar a O0 basta decir
cuál es la velocidad v que O0 tiene respecto a O .

Anulación del campo magnético. Suponiendo que para O0 el campo


magnético se anula, podemos escribir B0 = 0 y la ecuación (4.40) queda ası́:

v
B + (γ − 1)B⊥ − γ ×E = 0 (4.80)
c

En ambos lados de esta ecuación multiplicamos escalarmente con v :

v
v · B + (γ − 1)v · B⊥ − γv · ×E = 0
c

Esta ecuación es v · B + 0 − 0 = 0, o sea que v es perpendicular a B.


Entonces B⊥ = B, y la ecuación (4.80) se simplifica:

v
B = ×E (4.81)
c
vE
B = sen α (4.82)
c

108
v B
sen α = (4.83)
c E

Aquı́ α es el ángulo entre E y v . La Figura 4.6 muestra los campos E y B


perpendiculares, y además al vector v que es perpendicular a B. Claramente
existe un número infinito de vectores v que satisfacen la ecuación (4.83).
Esto quiere decir que cuando B < E y E es ortogonal a B, hay un número
infinito de observadores inerciales para los cuales el campo magnético se
anula.

Anulación del campo eléctrico. La anulación del campo eléctrico es


muy parecida a la del campo magnético. Suponiendo que para O0 el campo
eléctrico se anula, podemos escribir E0 = 0 y la ecuación (4.39) queda ası́:

v
E + (γ − 1)E⊥ + γ ×E = 0 (4.84)
c

En ambos lados de esta ecuación multiplicamos escalarmente con v :

v
v · E + (γ − 1)v · E⊥ + γv · ×B = 0
c

Esta ecuación es v · E + 0 − 0 = 0, o sea que v es perpendicular a E.


Entonces E⊥ = E, y la ecuación (4.80) se simplifica:

v
E = − ×B (4.85)
c
vB
E = sen β (4.86)
c
v E
sen β = (4.87)
c B

Aquı́ β es el ángulo entre B y v . La Figura 4.7 muestra los campos E y B


perpendiculares, y además al vector v que es perpendicular a E. Claramente
existe un número infinito de vectores v que satisfacen la ecuación (4.87).
Esto quiere decir que cuando E < B y E es ortogonal a B, hay un número
infinito de observadores inerciales para los cuales el campo eléctrico se anula.

109
Conclusión. La anulación de un campo puede darse cuando se cumplen
estas dos condiciones: que sean perpendiculares entre sı́ y que no tengan la
misma magnitud; de los dos campos, el menor es anulable y el otro no. Si E
es anulable, v tiene que ser perpendicular a E ; ası́ mismo, si B es anulable,
v tiene que ser perpendicular a B . En resumen, v debe ser perpendicular
al campo menor.

La luz no es anulable. Una de las peculiaridades de la luz es que, en todo


punto r y en cualquier instante t, los campos eléctrico y magnético tienen
la misma magnitud. Como B ≮ E, el campo magnético no es anulable, y
como E ≮ B, el campo eléctrico tampoco es anulable.

4.7 La corriente eléctrica


Estudiábamos en la página 43 una nube de partı́culas cargadas, y llamábamos
u a la trivelocidad promedio de una pequeña porción de la nube. El trivector
J se define ası́:

J = ρu , (4.88)

y en vista de (2.25):
nqu
J = p (4.89)
V0 1 − u2 /c2

La magnitud de J es la cantidad de carga que, por unidad de tiempo, cruza


una unidad de área perpendicular a u. Llamemos r al vector posición del
pequeño volumen de nube que estamos estudiando. Claramente u = dr/dt,
y en consecuencia la ecuación (4.89) queda ası́:

nq
J = p dr (4.90)
V0 dt 1 − u2 /c2

De otro lado, multiplicando ambos lados de la ecuación (2.25) por c llegamos


a
nq
ρc = q cdt (4.91)
V0 dt 1 − u2 /c2
En los denominadores de las dos últimas ecuaciones reconocemos el tiempo
propio dτ :

110
nq nq
ρc = cdt , J = dr
V0 dτ V0 dτ
nq
Notemos que en estas expresiones el quebrado es un escalar. Esto es
V0 dτ
importante porque indica que las cuatro cantidades (cρ, J) transforman, bajo
un cambio de coordenadas, ası́ como transforman los cuatro diferenciales
(cdt, dr). Más concretamente, podemos utilizar las ecuaciones (1.34) para
escribir
v
ρ0 + 2 Jx0
ρ = p c (4.92)
1 − v 2 /c2
J 0 + vρ0
Jx = px (4.93)
1 − v 2 /c2
Jy = Jy0 (4.94)
Jz = Jz0 (4.95)

4.8 Covariancia de la electrodinámica


Tenemos confianza en que las ecuaciones de Maxwell y la ley de Fuerza
de Lorentz representan leyes de la naturaleza. Entonces, de acuerdo con el
principio de la relatividad (1.10), las ecuaciones de Maxwell y la ley de fuerza
de Lorentz deben ser covariantes cuando se pasa de un observador inercial
a otro. En esta sección probaremos tal covariancia. Comenzaremos con las
ecuaciones de Maxwell, que son:

1 ∂B
∇×E+ = 0 (4.96)
c ∂t
1 ∂E 4π
∇×B− = J (4.97)
c ∂t c
∇·B = 0 (4.98)

∇ · E = 4πρ, (4.99)

y luego seguiremos con la fuerza de Lorentz:


³ u ´
F=q E+ ×B (4.100)
c

111
Covariancia de las ecuaciones de Maxwell. Para el observador O0 las
ecuaciones de Maxwell son:

1 ∂B0
∇0 × E0 + = 0 (4.101)
c ∂t0
1 ∂E0 4π 0
∇0 × B0 − = J (4.102)
c ∂t0 c
∇0 · B0 = 0 (4.103)
∇0 · E0 = 4πρ0 (4.104)

Para probar la covariancia debemos demostrar que las ecuaciones (4.96)-


(4.99) implican las ecuaciones (4.101)-(4.104). Comencemos separando, en
(4.96) y (4.97), las partes que son paralelas y perpendiculares a v :
µ ¶
1 ∂B
∇×E+ = 0 (4.105)
c ∂t ⊥
µ ¶
1 ∂E 4π
∇×B− − J = 0 (4.106)
c ∂t c ⊥
µ ¶
1 ∂B
∇×E+ = 0 (4.107)
c ∂t k

∇·B = 0 (4.108)
µ ¶
1 ∂E 4π
∇×B− − J = 0 (4.109)
c ∂t c k

∇ · E = 4πρ (4.110)

Para realizar los cálculos concretamente, usamos coordenadas cartesianas y


llamamos x a la dirección de v . Las ocho ecuaciones (4.105)-(4.110) son:

1
∂z Ex − ∂x Ez + ∂t By = 0 (4.111)
c
1
∂x Ey − ∂y Ex + ∂t Bz = 0 (4.112)
c
1 4π
∂z Bx − ∂x Bz − ∂t Ey = Jy (4.113)
c c

112
1 4π
∂x By − ∂y Bx − ∂t Ez = Jz (4.114)
c c

1
∂y Ez − ∂z Ey + ∂t Bx = 0 (4.115)
c
∂x Bx + ∂y By + ∂z Bz = 0 (4.116)
1 4π
∂y Bz − ∂z By − ∂t Ex = Jx (4.117)
c c
∂x Ex + ∂y Ey + ∂z Ez = 4πρ (4.118)

Las ocho ecuaciones primadas correspondientes son:

1
∂z 0 Ex0 − ∂x0 Ez0 + ∂t0 By0 = 0 (4.119)
c
1
∂x0 Ey0 − ∂y0 Ex0 + ∂t0 Bz0 = 0 (4.120)
c
1 4π 0
∂z 0 Bx0 − ∂x0 Bz0 − ∂t0 Ey0 = J (4.121)
c c y
1 4π 0
∂x0 By0 − ∂y0 Bx0 − ∂t0 Ez0 = J (4.122)
c c z

1
∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = 0 (4.123)
c
∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0 = 0 (4.124)
1 4π 0
∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 = J (4.125)
c c x
∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0 = 4πρ0 (4.126)

En las ocho ecuaciones (4.111)-(4.118) vamos a cambiar todas las variables


no primadas por variables primadas, utilizando: las cuatro ecuaciones (1.44),
las seis ecuaciones (4.41)-(4.46), y las cuatro ecuaciones (4.92)-(4.95). Se ob-
tienen estas ocho ecuaciones que proceden, una a una, de las ocho ecuaciones
(4.111)-(4.118):

1
∂z 0 Ex0 − ∂x0 Ez0 + ∂t0 By0 = 0 (4.127)
c

113
1
∂x0 Ey0 − ∂y0 Ex0 + ∂t0 Bz0 = 0 (4.128)
c
1 4π 0
∂z 0 Bx0 − ∂x0 Bz0 − ∂t0 Ey0 = J (4.129)
c c y
1 4π 0
∂x0 By0 − ∂y0 Bx0 − ∂t0 Ez0 = J (4.130)
c c z

1 v ¡ ¢
∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = ∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0 (4.131)
c c
1 c ¡ ¢
∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = ∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0 (4.132)
c v
1 v¡ ¢
∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 + ∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0
c c (4.133)
4π 0 v
= Jx + 4πρ0
c c
1 c ¡ ¢
∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 + ∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0
c v (4.134)
4π 0 c
= J + 4πρ0
c x v
Obsérvese que las ecuaciones (4.119) y (4.127) son iguales, que (4.120) y
(4.128) son iguales, que (4.121) y (4.129) son iguales y que (4.122) y (4.130)
son iguales. Obsérvese que (4.123) y (4.131) no son iguales y que (4.124) y
(4.132) no son iguales. Pero el conjunto de las dos ecuaciones (4.131), (4.132)
implica el conjunto de las dos ecuaciones (4.123), (4.124). Ası́ mismo (4.125)
y (4.133) no son iguales; (4.126) y (4.134) no son iguales. Pero el conjunto de
las dos ecuaciones (4.133), (4.134) implica el conjunto de las dos ecuaciones
(4.125), (4.126).

En conclusión, las ecuaciones de Maxwell no primadas implican el conjunto


de las ecuaciones primadas. O sea que las ecuaciones de Maxwell son co-
variantes bajo el grupo de las transformaciones de la relatividad especial,
satisfaciéndose ası́ el principio de la relatividad.

Covariancia de la fuerza de Lorentz. Ahora pasamos a demostrar la


covariancia de la fuerza de Lorentz, ecuación (4.100). Para el observador O0
se debe cumplir que:
µ ¶
0 0 u0 0
F =q E + ×B (4.135)
c

114
Podemos desplegar las tres partes de esta ecuación:

µ ¶
1 0 0 1 0 0
Fx0 0
= q Ex + uy Bz − uz By (4.136)
c c
µ ¶
1 1
Fy0 = q Ey0 + u0z Bx0 − u0x Bz0 (4.137)
c c
µ ¶
0 0 1 0 0 1 0 0
Fz = q Ez + ux By − uy Bx (4.138)
c c

Ası́ mismo las tres partes de la ecuación (4.100) son:

µ ¶
1 1
Fx = q Ex + uy Bz − uz By (4.139)
c c
µ ¶
1 1
Fy = q Ey + uz Bx − ux Bz (4.140)
c c
µ ¶
1 1
Fz = q Ez + ux By − uy Bx (4.141)
c c

Debemos probar que las tres ecuaciones (4.136)-(4.138) implican las ecua-
ciones (4.139)-(4.141), y para tal efecto debemos expresar las tres primeras
ecuaciones en términos de variables no primadas. Utilicemos entonces las tres
ecuaciones (2.35)-(2.37), las tres3 ecuaciones (3.42)-(3.44) y las seis ecua-
ciones (4.33)-(4.38). Entonces la ecuación (4.136) se convierte en (4.139),
la ecuación (4.137) deviene (4.140) y la ecuación (4.138) se vuelve (4.141).
Queda ası́ demostrada la covariancia de la fuerza de Lorentz.

3
Al utilizar la ecuación (3.42) se debe tener en cuenta que
³ u ´
u · F = u · q E + × B = qu · E
c

115
ut

Figura 4.1 El campo eléctrico Figura 4.2 El campo eléctrico


para un observador que está en de una carga que tiene velocidad
reposo respecto a una carga pos- constante. Las lı́neas del campo
itiva. Las lı́neas del campo son son radiales, mas no isótropas.
radiales e isótropas.

ct'

x'

Figura 4.3 Un alambre rec- Figura 4.4 Lı́neas en el mun-


to que porta corriente eléctri- do de los iones positivos (tra-
ca, según un observador en re- zos punteados verticales) y de
poso respecto a los iones posi- los electrones (trazos puntead-
tivos. Los electrones se mueven os inclinados). Para O, la dis-
hacia la derecha. tancia entre electrones contigu-
os es igual a la distancia entre
iones positivos contiguos. Para
O0 , la distancia entre electrones
es mayor que la distancia entre
iones.

116
C + + + + D

A B

Figura 4.5 Un circuito eléctri-


co. Para un observador que vi-
aje hacia la derecha, el lado
CD está cargado positivamente y
el lado AB negativamente, dan-
do como resultado un momento
dipolar eléctrico que apunta ha-
cia arriba.

E
a
v
v
b
B
B

Figura 4.6 Campos E y B per- Figura 4.7 Campos E y B per-


pendiculares, con B < E . Otro pendiculares, con E < B . Otro
observador O0 tiene velocidad v observador O0 tiene velocidad v
con inclinación α . Las variables con inclinación β . Las variables
v y α se pueden ajustar de modo v y β se pueden ajustar de modo
que B 0 sea cero. que E 0 sea cero.

117
118
Capı́tulo 5

Tensores en la relatividad especial

El propósito de este capı́tulo es darle a la relatividad especial una pre-


sentación formal, tensorial. Hemos visto que el espacio y el tiempo se un-
en para formar un ente mayor, el espaciotiempo; y los campos eléctrico y
magnético no son objetos separados, sino que forman una totalidad electro-
magnética. En este capı́tulo expresaremos estas uniones, y otras también,
en una notación condensada que se adecúa a las necesidades y exigencias
de la fı́sica teórica. Debemos advertir, sin embargo, que en este tratamiento
hay algo más que notación compacta y elegante: hay, sobre todo, una visión
profunda y geométrica de la relatividad especial.

5.1 Subı́ndices y superı́ndices


Tal como hemos descrito varias veces, el observador O consta de una malla
tridimensional de relojes, uno en cada punto. Suponemos además que este
observador erige un sistema cartesiano de coordenadas, de modo que cada
evento tiene cuatro coordenadas xµ , ası́:

(x0 , x1 , x2 , x3 ) = (ct, x, y, z)

Los ı́ndices griegos, como por ejemplo µ, van de cero a tres: µ = 0, 1, 2, 3 . En


algunas escasas ocasiones desearemos ir únicamente de uno a tres, y entonces
usaremos ı́ndices latinos, como por ejemplo a = 1, 2, 3 . Siempre seguiremos
la convención de Einstein: cuando en un mismo término aparece dos veces
un ı́ndice, se supone que hay una suma sobre los cuatro (o tres) valores que
puede tomar ese ı́ndice.

Pensemos ahora en el intervalo que hay entre el origen de coordenadas

119
(0,0,0,0) y el evento (x0 , x1 , x2 , x3 ) . De acuerdo con la definición (2.1) este
intervalo viene dado por:

(∆s)2 = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 (5.1)

Si definimos la matriz

 
1 0 0 0
 
 
 0 −1 0 0 
 
ηµν =


 (5.2)
 0 0 −1 0 
 
 
0 0 0 −1

la ecuación (5.1) se escribe:

(∆s)2 = ηµν xµ xν (5.3)

Ahora definimos η µν como la inversa de ηµν :

η µλ ηλν = δ µ ν (5.4)

Claramente esta inversa es


 
1 0 0 0
 
 
 0 −1 0 0 
 
η µν =


 (5.5)
 0 0 −1 0 
 
 
0 0 0 −1

A partir de las cuatro cantidades xµ y la matriz ηµν definimos otras cu-


atro cantidades xµ de la manera siguiente:

120
xµ = ηµλ xλ (5.6)

Escribamos en detalle las cuatro componentes xµ y las cuatro componentes


xµ :

xµ = (x0 , x1 , x2 , x3 ) = (ct, x, y, z) (5.7)

xµ = (x0 , x1 , x2 , x3 ) = (ct, −x, −y, −z) (5.8)

Nótese que

xµ = η µλ xλ (5.9)

Las ecuaciones (5.6) y (5.9) dicen que ηµλ sirve para bajar un superı́ndice y
η µλ sirve para subir un subı́ndice. Ahora, a η µλ también se le puede bajar
el superı́ndice λ , para lo cual basta multiplicarlo por ηλν :

η µλ ηλν = η µ ν

Comparando esto con la ecuación (5.4) llegamos a

ηµν = δµν (5.10)

Consideremos ahora este conjunto de 16 cantidades: (−Bx , 0, Ez , −Bz , 0,


Ex , −By , 0, −Ey , Bx , −Ex , By , −Ez , 0, Bz , Ey ) , el cual organizamos en este
arreglo cuadrado:

 
0 −Ex −Ey −Ez
 
 
 Ex 0 −Bz By 
 
F µν
=


 (5.11)
 Ey Bz 0 −Bx 
 
 
Ez −By Bx 0

121
Si queremos bajar el superı́ndice µ multiplicamos por ηλµ , ası́: Fλ ν = ηλµ F µν :
  
1 0 0 0 0 −Ex −Ey −Ez
  
  
 0 −1 0 0   By 
   Ex 0 −Bz 
Fλ ν = 





 0 0 −1 0   −Bx 
   Ey Bz 0 
  
0 0 0 −1 Ez −By Bx 0

 
0 −Ex −Ey −Ez
 
 
 −Ex 0 Bz −By 
 

=  

 −Ey −Bz 0 Bx 
 
 
−Ez By −Bx 0

Si además queremos bajar el superı́ndice ν multiplicamos Fλ ν por ηρν , ası́:


Fλρ = ηρν Fλ ν = ηνρ Fλ ν = Fλ ν ηνρ . Ejecutemos pues el producto Fλ ν ηνρ :

  
0 −Ex −Ey −Ez 1 0 0 0
  
  
 −Ex 0 Bz −By   0 
  0 −1 0 
Fλρ = 





 −Ey −Bz 0 Bx   0 
  0 0 −1 
  
−Ez By −Bx 0 0 0 0 −1

 
0 Ex Ey Ez
 
 
 −Ex 0 −Bz By 
 
= 



 −Ey Bz 0 −Bx 
 
 
−Ez −By Bx 0

122
El asunto de subir y bajar ı́ndices no tiene complicación. Por ejemplo:

Aα β γ = ηνβ Aανγ
Aαβγ = η νβ Aα ν γ
∂ µ = η µν ∂ν
∂ν = ηµν ∂ µ
dxµ = ηµν dxν

Cuando un ı́ndice aparece una sola vez en un término, decimos que es libre.
Por ejemplo, en B µ Cν los ı́ndices µ y ν son libres. Si una misma letra aparece
dos veces en un término, como superı́ndice y como subı́ndice, decimos que
se trata de ı́ndices contraı́dos. Por ejemplo, en B µ Cµ los ı́ndices µ están
contraı́dos.

Reunamos las formas diferentes que conocemos de escribir la ecuación del


intervalo (5.1):

(∆s)2 = (∆x0 )2 − (∆x1 )2 − (∆x2 )2 − (∆x3 )2

= η µν ∆xµ ∆xν

= ηµν ∆xµ ∆xν

= ∆xµ ∆xµ

5.2 Los vectores


El observador O0 consta de otra malla infinita de relojes primados y erige
otro sistema de ejes cartesianos. Diremos que un evento que tiene coorde-
nadas xµ para el observador O , tiene coordenadas x0µ para el observador
O0 :

(x00 , x01 , x02 , x03 ) = (ct0 , x0 , y 0 , z 0 )

Pensamos que O0 tiene velocidad constante v respecto a O y que, en cierto

123
instante, los orı́genes de O y O0 coinciden. En el instante de la coincidencia
se cuadran en t = 0 y t0 = 0 , respectivamente, los dos relojes que están en
los orı́genes de O y O0 . Los ejes cartesianos de O y O0 se orientan de modo
que los ejes x y x0 son siempre paralelos, los y y y 0 son siempre paralelos y
también los ejes z y z 0 .

Cada una de las coordenadas primadas x0µ debe ser función de las no pri-
madas xν :

x0µ = x0µ (xν ) (5.12)

p
Llamemos β = v/c y γ = 1/ 1 − β 2 y supongamos que el desplazamiento es
a lo largo del eje común x x0 ; de acuerdo con las ecuaciones (1.33), las coor-
denadas primadas y no primadas están conectadas por las transformaciones
de Lorentz:

x00 = γ(x0 − βx1 )


x01 = γ(x1 − βx0 )
(5.13)
x02 = x2
x03 = x3

Calculemos las diez y seis derivadas ∂x0µ /∂xν ; diez de estas derivadas son
cero, y las seis no nulas son: ∂x00 /∂x0 = ∂x01 /∂x1 = γ , ∂x00 /∂x1 = ∂x01 /∂x0
= −γβ , ∂x02 /∂x2 = ∂x03 /∂x3 = 1 . Es muy importante que reconozcamos
que todas las diez y seis derivadas son constantes, propiedad1 que usare-
mos crucialmente más tarde, en el paso de (5.42) a (5.43). Por el momento
tomemos diferenciales en ambos lados de (5.12) para obtener

∂x0µ ν
dx0µ = dx (5.14)
∂xν

∂x0µ
Ahora integrar, teniendo en cuenta que es constante:
∂xν
1
Debemos dejar claro que las diez y seis derivadas son constantes no sólo en la trans-
formación particular (5.13), sino en cualquier transformación de Lorentz. En efecto, un
vistazo a las ecuaciones (1.35) nos muestra que las derivadas son constantes, en general,
para cualquier transformación de Lorentz.

124
∂x0µ ν
x0µ = x . Ası́ mismo: (5.15)
∂xν
∂xµ 0ν
xµ = x (5.16)
∂x0ν

Pensemos enseguida en un conjunto de cuatro cantidades que en las coor-


denadas no primadas aparecen como Aµ , mientras que en las coordenadas
primadas aparecen como A0µ . Nosotros no podemos asegurar de antemano
cuál es la relación entre las A0µ y las Aµ . Pero si ocurre que

∂x0µ ν
A0µ = A , (5.17)
∂xν

entonces decimos que A es un vector. Comparando (5.17) con (5.15) nos


damos cuenta de que A transforma como x, porque en ambas ecuaciones
∂x0µ
se usan los mismos coeficientes . Las cuatro cantidades xµ constituyen,
∂xν
por definición, el vector prototipo. Decimos que A es un vector porque trans-
forma como el vector prototipo (obsérvese que uno no prueba que x es un
vector). El concepto de vector aparece inseparablemente ligado al concep-
to de las transformaciones de coordenadas. Que A sea un vector no es una
propiedad intrı́nseca de A; no podemos decir que A es un vector por sı́ sólo,
sino que el carácter vectorial de A es una propiedad que tiene A en referen-
cia a la transformación de coordenadas xµ → x0µ . No cualquier conjunto de
cuatro cantidades, aunque se rotulen con ı́ndices, es un vector.

Si la velocidad del observador O0 respecto a O es v , la transformación del


vector debe ser como en las fórmulas (1.35):

µ ¶
00 0 1
A =γ A − v ·A
c
µ ¶ (5.18)
0 γ−1 γ 0
A =A+ v ·A− A v
v2 c

Las cuatro cantidades xµ se llaman las componentes contravariantes del vec-


tor x , y xµ se llaman las componentes covariantes. El concepto de vector es
más abstracto que el concepto de componentes, y decimos que el vector x se
puede representar de dos maneras; bien sea por medio de sus componentes

125
contravariantes xµ , o por medio de sus componentes covariantes xµ . Del
mismo modo, el vector A se caracteriza por medio de sus componentes con-
travariantes Aµ , o por medio de sus componentes covariantes Aµ . Ası́ como
en las fórmulas (5.7) y (5.8), escribimos ahora

Aµ = (A0 , A1 , A2 , A3 ) = (A0 , Ax , Ay , Az ) = (A0 , A) (5.19)

Aµ = (A0 , A1 , A2 , A3 ) = (A0 , −Ax , −Ay , −Az ) = (A0 , −A) (5.20)

Transformación de las componentes Aµ . Ya que sabemos que las com-


ponentes contravariantes Aµ transforman según (5.17), pasemos a averiguar
de qué manera transforman las componentes covariantes Aµ . Pero para lle-
var a efecto esa tarea es preciso deducir antes una identidad importante. Lo
primero es reescribir la ecuación (2.2) en nuestra notación compacta:

µ ν
ηµν xµ xν = ηµν x0 x0 (5.21)

Esta ecuación dice que, para calcular intervalos, todos los observadores in-
erciales usan la misma matriz ηµν . La ecuación (5.21) es, obviamente:

λ ρ
ηµν xµ xν = ηλρ x0 x0 . Utilizar (5.15):

∂x0λ ∂x0ρ µ ν
= ηλρ x x ;
∂xµ ∂xν

reunir todo en el lado izquierdo:

µ ¶
∂x0λ ∂x0ρ
ηµν − ηλρ xµ xν = 0
∂xµ ∂xν

Como esta ecuación debe ser válida para todos los eventos, la cantidad
dentro del paréntesis debe ser cero:

∂x0λ ∂x0ρ
ηλρ = ηµν (5.22)
∂xµ ∂xν

126
Ahora multiplicar ambos lados de esta ecuación por η νπ y utilizar la ecuación
(5.10):
∂x0λ νπ ∂x0ρ
η ηλρ = δµ π (5.23)
∂xµ ∂xν

Como las coordenadas xη son independientes, podemos afirmar que

∂xπ
= δµ π (5.24)
∂xµ

Ahora, de acuerdo con la regla de la derivación en cadena,

∂xπ ∂x0λ ∂xπ


= ,
∂xµ ∂xµ ∂x0λ

o sea que la ecuación (5.24) es:

∂x0λ ∂xπ
= δµ π (5.25)
∂xµ ∂x0λ

Igualemos entonces los lados izquierdos de las ecuaciones (5.23) y (5.25):

∂x0λ νπ ∂x0ρ ∂x0λ ∂xπ


η η λρ = ,
∂xµ ∂xν ∂xµ ∂x0λ

∂xµ
y multipliquemos ambos lados de esta ecuación por :
∂x0ω

∂xµ ∂x0λ νπ ∂x0ρ ∂xµ ∂x0λ ∂xπ


0ω µ
η ηλρ ν
= (5.26)
∂x ∂x ∂x ∂x0ω ∂xµ ∂x0λ

∂xµ ∂x0λ
En ambos lados de esta ecuación aparece el factor ; la regla de
∂x0ω ∂xµ
∂xµ ∂x0λ ∂x0λ
la derivación en cadena dice que = = δω λ , o sea que la
∂x0ω ∂xµ ∂x0ω
ecuación (5.26) es

127
∂x0ρ ∂xπ
δω λ η νπ ηλρ = δω λ
∂xν ∂x0λ
∂x0ρ ∂xπ
η νπ ηωρ = (5.27)
∂xν ∂x0ω

Esta es la ecuación importante que querı́amos deducir. Ahora multiplicar


ambos lados por Aπ :

∂x0ρ ν ∂xπ
ηωρ A = Aπ
∂xν ∂x0ω

En el lado izquierdo utilizamos la ecuación (5.17) para obtener:

∂xπ
ηωρ A0ρ = Aπ
∂x0ω

Ya habı́amos indicado, justo después de la ecuación (5.21), que todos los


observadores inerciales usan la misma matriz η , lo que quiere decir que O0
utiliza a η para subir y bajar ı́ndices. De aquı́ vemos que ηωρ A0ρ debe ser
A0ω , y la última ecuación es, finalmente:

∂xπ
A0ω = Aπ (5.28)
∂x0ω

Este es el modo como transforman las componentes covariantes de cualquier


vector A . Por supuesto que las componentes xµ transforman de la misma
manera:
∂xπ
x0ω = xπ (5.29)
∂x0ω

5.3 Otros tensores


Pasemos a estudiar la estructura Aµ B ν , cuando A y B son vectores. De
acuerdo con la regla de transformación (5.17), las componentes contravari-
antes de A y B transforman ası́: A0µ = (∂x0µ /∂xα )Aα y B 0ν = (∂x0ν /∂xβ )B β .
Multipliquemos lado a lado estas dos ecuaciones para obtener:

128
∂x0µ ∂x0ν α β
A0µ B 0ν = A B
∂xα ∂xβ

Los tensores de rango 2 se definen por comparación con la última ecuación:


T es un tensor de rango 2 si

∂x0µ ∂x0ν αβ
T 0µν = T (5.30)
∂xα ∂xβ

Las componentes contravariantes de T transforman como Aµ B ν ; de la mis-


ma manera, las componentes covariantes de T transforman como Aµ Bν :

0 ∂xα ∂xβ
Tµν = Tαβ , (5.31)
∂x0µ ∂x0ν

y las componentes mixtas transforman como Aµ Bν :

∂x0µ ∂xβ α
T 0µ ν = T β, (5.32)
∂xα ∂x0ν

y como Aµ B ν :

∂xα ∂x0ν
T0 µ ν = Tα β (5.33)
∂x0µ ∂xβ

Generalizamos diciendo que los tensores de rango j tienen j ı́ndices, es decir,


4j cantidades. Los tensores de rango 0 reciben el nombre de escalares, y los
de rango 1 se llaman vectores. Algunas de las componentes de un tensor C
de rango 3 transforman ası́:

∂x0µ ∂x0ν ∂x0δ αβγ


C 0 µνδ = C
∂xα ∂xβ ∂xγ

∂xα ∂xβ ∂xγ


C 0 µνδ = Cαβγ
∂x0µ ∂x0ν ∂x0δ
∂xα ∂x0ν ∂xγ
C0 µ ν δ = Cα β γ
∂x0µ ∂xβ ∂x0δ

129
Finalmente, un tensor de rango 4:

∂x0µ ∂x0ν ∂x0σ ∂xγ αβλ


A0µνσ ρ = A γ (5.34)
∂xα ∂xβ ∂xλ ∂x0ρ

En este momento es conveniente que hagamos una pausa y reconsideremos la


∂x0ν
notación que estamos usando. El uso de las derivadas recarga, sin duda,
∂xβ
la escritura, y podemos preguntarnos si vale la pena toda esta complicación.
La pregunta está justificada, ya que todas estas derivadas son constantes
en este capı́tulo y uno podrı́a reducir la notación. No queremos reducir-
la, porque nuestro deseo es que el presente capı́tulo sirva de preámbulo al
capı́tulo 9: allı́ las derivadas no serán constantes.

Las transformaciones inversas. Hasta el momento hemos presentado


la manera de averiguar las componentes primadas de un tensor en términos
de las no primadas. El camino inverso -las no primadas en términos de las
primadas- es muy fácil. Multipliquemos ambos lados de la ecuación (5.17)
∂xα
por , con lo que se llega a:
∂x0µ

∂xα 0µ ∂xα ∂x0µ ν


A = A = δ α ν Aν = Aα
∂x0µ ∂x0µ ∂xν

Hemos obtenido:

∂xµ 0ν
Aµ = A . Ası́ mismo:
∂x0ν
∂x0ν 0
Aµ = A
∂xµ ν

Esto para tensores de rango 1. Para los de rango 2:

∂xµ ∂xν 0αβ


T µν = T
∂x0α ∂x0β

∂x0α ∂x0β 0
Tµν = T
∂xµ ∂xν αβ

130
∂xµ ∂x0β 0α
Tµ ν = T β
∂x0α ∂xν

ν ∂x0α ∂xν 0 β
T µ = T
∂xµ ∂x0β α

Y los de rango 3:

∂xµ ∂xν ∂xδ 0αβγ


C µνδ = C
∂x0α ∂x0β ∂x0γ

∂x0α ∂x0β ∂x0γ 0


C µνδ = C
∂xµ ∂xν ∂xδ αβγ
∂x0α ∂xν ∂x0γ 0 β
Cµνδ = C γ
∂xµ ∂x0β ∂xδ α

La importancia del vector xµ . Gran parte de la estructura de los ten-


sores se fundamenta en el vector prototipo xµ . En efecto: 1) En la ecuación
(5.17) hemos definido los vectores, en general, por comparación con xµ y,
2) en esta sección hemos construido tensores de rangos 0, 2, y 3 a partir de
vectores. En general, un tensor de rango j > 0 transforma como transforma
el producto de j vectores.

Contracción de ı́ndices. Estudiemos la estructura Aµ Bµ , cuando A y B


son vectores. Usando las reglas de transformación (5.17) y (5.28) escribimos

∂x0µ ∂xβ α
A0µ B 0 µ = A Bβ
∂xα ∂x0µ

∂x0µ ∂xβ ∂xβ


Ahora, la regla de la derivación en cadena dice que = , en-
∂xα ∂x0µ ∂xα
tonces:
∂xβ α
A0µ B 0 µ = A Bβ = δα β Aα Bβ = Aα Bα
∂xα

O sea que

A0µ B 0 µ = Aµ Bµ (5.35)

131
En palabras, el producto Aµ Bµ es, en general, invariante y el intervalo xµ xµ
es un caso particular.

Probemos que si A es un tensor de rango 4, entonces A0µνρ ρ es un ten-


sor de rango 2. En efecto, si hacemos σ = ρ en la ecuación (5.34) obtenemos
∂x0µ ∂x0ν ∂x0ρ ∂xγ αβλ ∂x0ρ ∂xγ
A0µνρ ρ = A γ . Pero = δλ γ , entonces
∂xα ∂xβ ∂xλ ∂x0ρ ∂xλ ∂x0ρ

∂x0µ ∂x0ν αβλ


A0µνρ ρ = A λ,
∂xα ∂xβ

que es la forma como transforman los tensores de rango 2, de acuerdo con


la ecuación (5.30). En general, la contracción de dos ı́ndices en un tensor de
rango j produce un tensor de rango j − 2.

δ de Kronecker. Probemos que δµ ν es un tensor. Para tal efecto comen-


∂x0ν
zamos escribiendo δµ0 ν = y luego usamos la regla de la derivación en
∂x0µ
cadena:
ν ∂x0ν ∂x0ν ∂xα ∂x0ν ∂xβ α
δµ0 = = = δβ ,
∂x0µ ∂xα ∂x0µ ∂xα ∂x0µ

que es ciertamente el modo como transforman los tensores de rango 2, de


acuerdo con ecuación (5.33).

El tensor métrico. Probemos ahora que η es un tensor. Para tal efecto


recordemos que todos los observadores inerciales usan la misma η , o sea que,
0 en vez de η
en la ecuación (5.22), podemos escribir ηλρ λρ :

∂x0λ ∂x0ρ 0
ηµν = η ,
∂xµ ∂xν λρ

y ésta es justamente la forma como transforman los tensores de segundo


rango. Este es un tensor de primera importancia y recibe el nombre de
tensor métrico, ya que, de acuerdo con la ecuación (5.3), es el que ejecuta la
distancia entre dos eventos. Una cosa es un espacio formado por una simple
acumulación de puntos. Un espacio métrico tiene además una prescripción,

132
una regla, para establecer la distancia entre dos puntos, y el tensor métrico
es el encargado de suministrar tal regla. Por esta razón decimos que el tensor
métrico contiene toda la información acerca de la estructura geométrica de
un espacio.

El tensor de Levi-Civita. El tensor de Levi-Civita se define ası́:


 +1 si αβγδ es una permutación par de 0123
²αβγδ = −1 si αβγδ es una permutación impar de 0123 (5.36)

0 si dos ı́ndices son iguales

La prueba de que ²αβγδ es verdaderamente un tensor se encuentra fácilmente


en la literatura [11].

Cantidades simétricas y antisimétricas. Sea S µν = S νµ , y sea Aµν =


−Aνµ . En palabras, S es simétrico bajo la permutación µ À ν y A es
antisimétrico. Consideremos la contracción total S µν Aµν = −S νµ Aνµ =
−S αβ Aαβ :

S µν Aµν = −S αβ Aαβ (5.37)

Si cambiamos α → µ y β → ν, el lado derecho de (5.37) se convierte en


−S µν Aµν . La ecuación (5.37) es entonces S µν Aµν = −S µν Aµν , es decir,

S µν Aµν = 0 (5.38)

En palabras: la contracción total de una cantidad simétrica con otra anti-


simétrica da cero. Esta afirmación es verdadera en general, sin necesidad de
exigir que S y A sean tensores.

La derivada. Para la derivada se usa una notación compacta:

µ ¶ ¶ µ
∂ ∂ ∂ ∂ ∂ ∂
∂µ = = , , , = ,∇ (5.39)
∂xµ c ∂t ∂x ∂y ∂z c ∂t
µ ¶ µ ¶
∂ ∂ ∂ ∂ ∂ ∂
∂µ = = ,− ,− ,− = , −∇ (5.40)
∂xµ c ∂t ∂x ∂y ∂z c ∂t

133
El producto ∂ µ ∂µ = ∂ 0 ∂0 + ∂ a ∂a es:

1 ∂2
∂ µ ∂µ = − ∇2 (5.41)
c2 ∂t2

Probemos que si φ es un escalar, entonces ∂µ φ es un vector. Comenzamos



escribiendo ∂µ0 φ = φ y luego usamos la regla de la derivación en cadena:
∂x0µ

∂ ∂xν ∂ ∂xν
∂µ0 φ = φ = φ = ∂ν φ,
∂x0µ ∂x0µ ∂xν ∂x0µ

que es verdaderamente la manera como transforman los vectores, de acuerdo


con la ecuación (5.28).

La derivada de un tensor es un tensor; para probarlo tomemos por ejem-



plo ∂µ0 A0ν = A0ν y usemos la regla de la derivación en cadena:
∂x0µ

∂ ∂xα ∂ ∂xα
∂µ0 A0ν = A0ν
= A0ν
= ∂α A0ν ;
∂x0µ ∂x0µ ∂xα ∂x0µ

ahora usamos la ecuación (5.17):

∂xα ∂x0ν β
∂µ0 A0ν = ∂α A (5.42)
∂x0µ ∂xβ

∂x0ν
No olvidemos que las son constantes, entonces
∂xβ

∂xα ∂x0ν
∂µ0 A0ν = ∂α Aβ ; (5.43)
∂x0µ ∂xβ

pero ésta, según la ecuación (5.33), es la manera como transforman los ten-
sores de rango 2. Hemos probado ası́ que la derivada de un tensor es otro
tensor2 .
2
Más tarde, en el capı́tulo 9, vamos a abandonar las transformaciones de Lorentz para
estudiar las transformaciones generalizadas de coordenadas. En las transformaciones gen-

134
5.4 Matrices
Para los tensores de rangos 1 y 2, que son los que tienen 1 y 2 ı́ndices,
respectivamente, es muy cómoda la notación matricial. Definamos la matriz
cuadrada
∂x0µ
Λµ ν = (5.44)
∂xν

Con Λ podemos reescribir las ecuaciones (5.17) y (5.30):

A0 µ = Λµ ν Aν

F 0 µν = Λµ α F αβ Λν β = Λµ α F αβ ΛT β
ν

O más concisamente:

A0 µ = Λ Aν F 0 µν = Λ F αβ ΛT

Ocurre sin embargo que Λ resulta ser simétrica (ver (5.48)), entonces

A0 µ = Λ Aν (5.45)

F 0 µν = Λ F αβ Λ (5.46)

Calculemos la matriz Λ para el caso particular de la transformación (5.13):

 
γ −γβ 0 0
 
 
 −γβ γ 0 0 
 
Λ=


 (5.47)
 0 0 1 0 
 
 
0 0 0 1

erales los coeficientes ∂x0ν /∂xβ no son constantes, y por consiguiente el paso de (5.42) a
(5.43) es inválido: véase el paso de la ecuación (9.29) a (9.30).

135
Esta matriz corresponde a las transformaciones (5.13), en las que la veloci-

dad v es en la dirección del eje x. Para la transformación más general (1.35)


se obtiene:

 
γ −γβx −γβy −γβz
 
 
 β2 βx βy βx βz 
 −γβx 1 + (γ − 1) x2 (γ − 1) (γ − 1) 
 β β2 β2 
 
 
Λ=



 −γβ βy βx βy2 βy βz 
 y (γ − 1) 1 + (γ − 1) (γ − 1) 
 β2 β2 β2 
 
 
 βz βx βz βy βz2 
−γβz (γ − 1) (γ − 1) 1 + (γ − 1)
β2 β2 β2
(5.48)

Tal como anunciamos arriba, esta matriz es simétrica.

El diferencial de volumen: Para cualquier clase de transformación de


coordenadas (x, y, z, ...) → (u, v, w, ...) los diferenciales de volumen satis-
facen [12] la ecuación dx dy dz · ·· = J du dv dw · ··, donde J es el jacobiano
de la transformación, que es el determinante de la matriz formada con las
derivadas ∂x/∂u , ∂x/∂v, etc. En nuestro caso el jacobiano es el determi-
nante de Λ, entonces dx00 dx01 dx02 dx03 = (det Λ) dx0 dx1 dx2 dx3 .

Ocurre que el determinante de Λ es 1 para todas las transformaciones de


Lorentz. Esto se ve fácilmente en la matriz (5.47) que corresponde a una ve-
locidad v en dirección x. Para una v en cualquier dirección, la Λ viene dada
por (5.48). El lector puede verificar que el determinante de (5.48) también
es 1 . Concluimos entonces que para todas las transformaciones de Lorentz
se cumple que dx00 dx01 dx02 dx03 = dx0 dx1 dx2 dx3 , lo que cortamente se
escribe:

d4 x0 = d4 x (5.49)

En palabras: el diferencial de volumen d4 x es un escalar.

136
Una cantidad invariante: Que el determinante de la matriz Λ sea 1
tiene otra consecuencia interesante: el determinante de F µν es invariante
bajo el grupo de las transformaciones de Lorentz. Para probarlo tomemos
determinante en ambos lados de la ecuación (5.46), ası́: det F 0 = det(ΛF Λ)
= (det Λ)(det F )(det Λ)= det F :

det F 0µν = det F µν (5.50)

5.5 Ecuaciones tensoriales


En esta sección vamos a ver algunas propiedades importantes de las ecua-
ciones entre tensores.

a) La más importante es que las ecuaciones tensoriales son automáticamente


covariantes, es decir, tienen la misma forma en todos los observadores iner-
ciales. Para ver esto consideremos por ejemplo la ecuación

Aµ ν = B µ Cν (5.51)

∂xµ ∂x0β 0α
Si A, B y C son tensores, podemos reemplazar Aµ ν = A β ,
∂x0α ∂xν
∂xµ 0α ∂x0β 0
Bµ = B y C ν = C en la ecuación (5.51) para escribir
∂x0α ∂xν β

∂xµ ∂x0β 0α ∂xµ ∂x0β 0α 0


A β = B Cβ
∂x0α ∂xν ∂x0α ∂xν

∂x0σ ∂xν
Multiplicar ambos lados de esta ecuación por :
∂xµ ∂x0ρ

∂x0σ ∂xµ ∂xν ∂x0β 0α ∂x0σ ∂xµ ∂xν ∂x0β 0α 0


A β = B Cβ
∂xµ ∂x0α ∂x0ρ ∂xν ∂xµ ∂x0α ∂x0ρ ∂xν

δ σ α δ β ρ A0α β = δ σ α δ β ρ B 0α Cβ0

A0σ ρ = B 0σ Cρ0 (5.52)

137
Comparando (5.52) con (5.51) nos damos cuenta de que tienen la misma for-
ma: (5.51) es una ecuación covariante porque es la igualdad de dos tensores.
Si queremos que se cumpla el principio de la relatividad, debemos expresar
las leyes de la fı́sica mediante ecuaciones tensoriales.

b) Supongamos que una ecuación es válida en todos los sistemas iner-


ciales. Pensemos que esta ecuación tiene n elementos (factores o sumandos)
y supongamos que n − 1 de ellos son tensores; entonces el otro elemento
también tiene que ser tensor. Para mostrar que esto es cierto supongamos
que la ecuaciones (5.51) y (5.52) son verdaderas y que A y C son tensores;
probaremos que B también es tensor.

∂xµ ∂x0β 0α ∂x0β 0


Reemplazando Aµ ν = A β , y Cν = C en (5.51) escribi-
∂x0α ∂xν ∂xν β
mos:
∂xµ ∂x0β 0α ∂x0β µ 0
A β = B Cβ
∂x0α ∂xν ∂xν
∂x0σ ∂xν
Multiplicar ambos lados de esta ecuación por :
∂xµ ∂x0ρ

∂x0σ ∂xµ ∂xν ∂x0β 0α ∂x0σ ∂xν ∂x0β µ 0


A β = B Cβ
∂xµ ∂x0α ∂x0ρ ∂xν ∂xµ ∂x0ρ ∂xν
∂x0σ β
δ σ α δ β ρ A0α β = δ ρ B µ Cβ0
∂xµ
∂x0σ µ 0
A0σ ρ = B Cρ
∂xµ

Comparando la última ecuación con (5.52) vemos que

∂x0σ µ
B 0σ = B ,
∂xµ

que es la forma como transforman los vectores: B es un vector, que es lo que


nos propusimos demostrar.

c) Las transformaciones de Lorentz (5.13) han sido corroboradas miles de

138
veces durante todo un siglo. Esto quiere decir que cuando se comparan las
mediciones que O0 hace con sus reglas y relojes, con las mediciones que O
hace con sus reglas y relojes, esas dos mediciones cumplen las relaciones
(5.13).

d) Si multiplicamos ambos lados de la ecuación (5.51) por ηµσ obtenemos


Aσν = Bσ Cν . Ası́ mismo, al multiplicar ambos lados de (5.51) por η νσ
obtenemos Aµσ = B µ C σ . Finalmente, si multiplicamos ambos lados de
Aµσ = B µ C σ por ηµν se obtiene Aν σ = Bν C σ . En conclusión, todas es-
tas ecuaciones son equivalentes: Aµ ν = B µ Cν , Aµν = Bµ Cν , Aµν = B µ C ν y
Aµ ν = Bµ C ν . Vemos ası́ que dos ı́ndices libres e iguales en ambos lados de
una ecuación se pueden subir o bajar.

5.6 El principio de la relatividad


Este principio afirma que las leyes de la fı́sica deben ser las mismas en todos
los sistemas inerciales. En otras palabras, todos los observadores inerciales
son equivalentes. Este es un principio profundo, lleno de motivación filosófi-
ca y valor estético, pero debe ser traducido a términos prácticos para que
sea útil.

Admitiendo que las transformaciones de Lorentz (TL) son, verdaderamente,


las encargadas de relacionar las observaciones de dos sistemas de referen-
cia inerciales, decimos que, de acuerdo con el Principio, las leyes de la fı́sica
deben ser enunciados invariantes bajo las TL. Acabamos de ver que las ecua-
ciones tensoriales son automáticamente covariantes bajo las TL. Entonces
terminamos en esta conclusión: el principio de la relatividad se satisface si
las leyes de la fı́sica se expresan mediante ecuaciones tensoriales. El Princi-
pio no se reduce simplemente a la frase “las leyes de la fı́sica son ecuaciones
tensoriales”, pero sı́ podemos afirmar que él guı́a el trabajo de la fı́sica al
indicar el camino y el método que se debe seguir: utilizar ecuaciones tenso-
riales.

Las cantidades fı́sicas deben ser componentes de tensores. Por ejemplo el


campo eléctrico hace parte del tensor electromagnético Fµν y la energı́a de
una partı́cula hace parte del cuadrivector momentum pµ . Ahora, hemos vis-
to que los tensores de rango j tienen 4j componentes, lo que quiere decir que
los tensores tienen 1, 4, 16, 64 ··· componentes. Vemos ası́ que toda cantidad
fı́sica debe ser miembro de alguna familia de 1, 4, 16, 64 · · · miembros. Los

139
números 1, 4, 16, 64 · · · son muy importantes para la fı́sica, porque indican
los únicos tamaños que las familias pueden tener: no hay familias de 10, 15,
63 miembros.

5.7 Los tensores m0 , xµ , dτ, U µ , pµ , k µ y J µ


Durante todo este capı́tulo nos hemos dedicado básicamente a estudiar las
propiedades tensoriales del grupo de las transformaciones lineales de coorde-
nadas. Queremos ahora presentar, como ejemplos, los escalares y los tensores
más importantes en problema del movimiento de una partı́cula masiva.

La masa en reposo. m0 es la masa de una partı́cula, según la mide


un observador para el cual la partı́cula está en reposo. Esta constante es
claramente un escalar.

El vector posición. Llamamos x a un evento de la trayectoria de una


partı́cula y xµ = (ct, x, y, z) a las coordenadas del evento x. Nótese que es-
tamos cambiando la notación, ya que antes habı́amos usado x para denotar,
en general, los eventos del espaciotiempo. El lector se acostumbrará a distin-
guir por el contexto cuándo xµ son las coordenadas de un evento cualquiera
o de un evento de una lı́nea en el mundo.

p
El tiempo propio dτ . ηµν dxµ dxν es el intervalo a lo largo de la trayec-
toria de la partı́cula. En caso de que la partı́cula sea libre su velocidad es con-
stante, y en consecuencia hay un observador inercial para el cual la partı́cula
está siempre en reposo; para
p este observador el intervalo es puro tiempo, es el
tiempo propio: c2 dτ 2 = ηµν dxµ dxν . Pero si la partı́cula tiene aceleración,
un sistema de coordenadas que la acompañe permanentemente serı́a no iner-
cial y, por lo tanto, no podrı́a usarse enpla relatividad especial. Sin embargo
vamos a ver que la fórmula c2 dτ 2 = ηµν dxµ dxν sigue siendo válida si el
sı́mbolo dτ adquiere un significado ligeramente diferente del que tenı́a hace
un par de renglones. Pensamos en una porción infinitesimal de trayectoria
durante la cual la velocidad se puede considerar aproximadamente constante.
En esa porción infinitesimal de trayectoria hay un observador inercial para
el cual la partı́cula está aproximadamente en reposo. Para este observador la
porción de trayectoria es puramente temporaloide,
p y dura un tiempo propio
que llamaremos dτ . Claramente c2 dτ 2 = ηµν dxµ dxν . En conclusión, esta
fórmula es válida para partı́culas libres y aceleradas; aquı́ dτ es el tiempo

140
propio que registra un observador inercial que acompaña momentáneamente
a la partı́cula; dτ es un escalar.

La velocidad. Una vez aclarado el significado de dτ pasamos a definir la


velocidad:
dxµ
Uµ = (5.53)

Ya que dxµ y dτ son tensores, concluimos que U µ es también un tensor. Sus


componentes son:
µ ¶
µ c dt dx dy dz
U = , , ,
dτ dτ dτ dτ
p
Pero dτ = dt 1 − u2 /c2 , entonces

à !
µ c u
U = p , p (5.54)
1 − u2 /c2 1 − u2 /c2

De acuerdo con la ecuación (5.35) la cantidad U µ Uµ es escalar. Averigüemos


cuánto vale:

U µ Uµ = U 0 U0 − U a Ua = c2 (5.55)

El momentum. Ahora definimos el momentum de una partı́cula:

pµ = m0 U µ (5.56)

Obviamente es un tensor, ya que es el producto de dos tensores. Calculemos


pµ pµ = m20 U µ Uµ usando (5.55):

pµ pµ = (m0 c)2 (5.57)

Con (5.54) y (5.56) podemos escribir las componentes de pµ :

à !
µ m0 c m0 u
p = p , p
1 − u2 /c2 1 − u2 /c2

141
= (mc , mu) (5.58)

= (E/c , p) (5.59)

Utilizamos esta ecuación para calcular el producto pµ pµ :

pµ pµ = E 2 /c2 − p2 (5.60)

Al igualar los lados derechos de (5.57) y (5.60) escribimos, finalmente,

p
E= (m0 c2 )2 + (pc)2 (5.61)

Esta es la misma ecuación (3.15). Queremos presentar una última fórmula


que combina la velocidad, la energı́a y el momentum. Las ecuación (5.56)
dice que pν = m dxν /dt; pero m = E/c2 , entonces pν = (E/c2 ) (dxν /dt), o
sea que

dxν c2 ν
= p (5.62)
dt E

Esta fórmula, aunque es una mezcla inusual de vectores y cantidades no


tensoriales, mostrará su utilidad cuando veamos las corrientes en el capı́tulo
7.

El momentum del fotón. Para partı́culas de masa cero, como el fotón,


el momentum se denomina k ν . Si se trata de un pulso de luz que se propaga
en dirección del vector unitario n, escribimos k = |k| n. Las ecuaciones de
pν se simplifican considerablemente:

k µ kµ = 0 (5.63)

|k| = E/c (5.64)


E
kµ = (1, n) (5.65)
c

142
La corriente eléctrica. Ya habı́amos demostrado en la página 111 que
(ρc, J) transforma como un vector, al que llamaremos J µ :

J µ = (ρc, J) (5.66)

5.8 Aberración de la luz y efecto Doppler


Pensemos en un pulso de luz. Respecto al observador O tiene energı́a E y
se propaga en dirección del vector unitario n. Respecto a O la energı́a es E 0
y se propaga en dirección n0 . La ecuaciones (5.18) son, en este caso:
µ ¶
00 0 1
k = γ k − v ·k
c
µ ¶
γ−1 γ 0
k0 = k+ v ·k− k v
v2 c

En vista de (5.65), estas dos ecuaciones quedan ası́:


³ v · n´
E 0 = Eγ 1 − (5.67)
c
· µ ¶ ¸
0 0 γ−1 γ
E n = E n+ v ·n− v
v2 c

Para aislar la variable n0 basta dividir lado a lado estas dos ecuaciones:
µ ¶
γ−1 γ
n+ 2
v ·n− v
v c
n0 = ³ v · n´ (5.68)
γ 1−
c

Aberración: La ecuación (5.68) es general, pero debemos admitir que no


es simple. Para apreciar el significado de la aberración supongamos que v
es en dirección x y que n es paralela al plano xy y hace un ángulo θ con el
eje x. Escribimos entonces nx = cos θ, ny = sen θ. Las componentes de n0 se
averiguan fácilmente con la fórmula (5.68):

cos θ − v/c
n0x =
v cos θ
1−
c

143
1 sen θ
n0y =
γ v cos θ
1−
c

Vamos a dividir, lado a lado, estas dos ecuaciones. Al cociente n0y /n0x lo
llamamos tan θ0 :
1 sen θ
tan θ0 = (5.69)
γ cos θ − v/c

Esta es la ecuación de la aberración estelar que Bradley dedujo en el siglo


XVIII. Recuperar esta fórmula centenaria es uno de los hallazgos de la rel-
atividad.

No es difı́cil entender la causa de la aberración de la luz desde un punto


de vista ondulatorio. Recordemos que, por definición, un frente de onda es
el lugar geométrico de todos los puntos que, en cierto instante dado, tienen
la misma fase. El frente de onda es un objeto extendido en el espacio, en
cierto instante. En otras palabras, es un conjunto de eventos simultáneos
que ocupan una región extendida en el espacio. Ya hemos advertido que la
simultaneidad es relativa: un objeto extenso que aparece simultáneo a un
observador, en general no aparece simultáneo a otros observadores. En nue-
stro caso decimos que los eventos que constituyen un frente de onda para
O no son, en general, simultáneos para O0 . Vemos ası́ que los eventos de un
frente de onda para O no forman un frente de onda para O0 . De esta manera
llegamos a una conclusión importante: en una onda luminosa, los frentes de
onda para O no son frentes de onda para O0 . Cada observador inercial regis-
tra sus propios frentes de onda3 . Ahora, como la dirección de propagación de
la onda es perpendicular a los frentes de onda, concluimos que la dirección
de propagación para O es diferente a la dirección de propagación para O0 .

Doppler: Si suponemos que en la luz la energı́a es proporcional a la fre-


cuencia (E = hν, por ejemplo) la ecuación (5.67) queda:

³ v · n´
ν 0 = νγ 1 − (5.70)
c
3
Consideremos un frente de onda para O y un frente de onda para O0 ; la intersección
de esos dos planos es una lı́nea recta; los eventos de esa lı́nea son simultáneos para O y
también son simultáneos para O0 .

144
Hay tres casos particularmente claros: cuando n y v son paralelos (⇒),
cuando son antiparalelos (¿), y cuando son perpendiculares (→↑). En estos
casos la fórmula (5.70) da:

s
1 − v/c
⇒ ν0 = ν (5.71)
1 + v/c
s
0 1 + v/c
¿ ν = ν (5.72)
1 − v/c
→↑ ν 0 = γν (5.73)

La fórmula (5.71) vale cuando la luz y O0 viajan en la misma dirección,


(5.72) para direcciones opuestas y (5.73) para direcciones perpendiculares.
Las dos primeras fórmulas, conocidas como efecto Doppler longitudinal, ya
se conocı́an antes de 1905. El efecto Doppler transverso, fórmula (5.73),
era desconocido hasta 1905, y se constituye como una novedad de la teorı́a
especial de la relatividad.

145
146
Capı́tulo 6

La electrodinámica
manifiestamente covariante

La electrodinámica está formalmente contenida en las ecuaciones de Maxwell


y en la fuerza de Lorentz:

∇·B = 0 (6.1)
1 ∂B
∇×E+ = 0 (6.2)
c ∂t
∇ · E = 4πρ (6.3)
1 ∂E 4π
∇×B− = J (6.4)
c ∂t c
dp ³ u ´
= q E+ ×B (6.5)
dt c

Hemos visto que la relatividad especial le da al electromagnetismo una apari-


encia interesante, porque unifica los campos eléctrico y magnético. Sin em-
bargo, es justo advertir que la relatividad no afecta esencialmente la es-
tructura formal de la teorı́a electromagnética. Dicho en otras palabras, la
electrodinámica es covariante bajo las transformaciones entre observadores
inerciales, tal como tuvimos ocasión de probar en la sección 4.8. No olvide-
mos sin embargo que esa sección es larga y engorrosa: las cuatro ecuaciones
de Maxwell y la fuerza de Lorentz son covariantes, pero esa covariancia
es difı́cil de ver. Por este motivo decimos que la covariancia de las cinco
ecuaciones, aunque es verdadera e indudable, no es manifiesta. Conviene
formular la electrodinámica utilizando otras ecuaciones, equivalentes a las
cinco mencionadas, que sean manifiestamente covariantes. Ya vimos en la

147
sección 5.5 que las ecuaciones tensoriales son automáticamente covariantes,
entonces nuestro proyecto es este: convertir a las cinco ecuaciones en ecua-
ciones tensoriales.

6.1 El cuadripotencial Aµ
Los campos E y B son enteramente suficientes para describir el campo elec-
tromagnético. Sin embargo, para darle a la electrodinámica una escritura
manifiestamente covariante, podemos abandonar los campos E y B , ex-
presándolos en términos de otros campos φ y A , de la manera siguiente:

B = ∇×A (6.6)
1 ∂A
E = −∇φ − (6.7)
c ∂t

Sin embargo, y aquı́ viene un asunto de primera importancia, la relación


entre (E, B) y (φ, A) no es uno a uno, ya que para describir a (E, B) hay
un número infinito de opciones (φ, A) . Esto es lo que se espera, ya que
los campos (E, B) se producen como derivadas de los campos (φ, A) , o sea
que a los (φ, A) se les pueden agregar términos sin afectar sus derivadas.
En efecto, utilizando cualquier función derivable χ se pueden producir unos
nuevos campos (φ0 , A0 ) equivalentes a los viejos (φ, A) , ası́:

1 ∂χ
φ0 = φ − (6.8)
c ∂t
A0 = A + ∇χ (6.9)

Podemos rápidamente verificar que los campos (φ0 , A0 ) y los campos (φ, A)
son equivalentes, al darnos cuenta de que

∇ × A0 = ∇ × A
1 ∂A0 1 ∂A
−∇φ0 − = −∇φ − ,
c ∂t c ∂t

es decir, los campos (E, B) se pueden calcular, bien sea con (φ, A) , o con
(φ0 , A0 ) . Esto indica que para describir una realidad (E, B) no estamos

148
obligados a usar unos (φ, A) determinados, sino que tenemos una cierta lib-
ertad en la escogencia, que recibe el nombre de libertad gauge. La Figura
6.1 muestra que para describir un campo electromagnético se puede usar las
variables (E, B) o las variables (φ, A) . Pero a cada punto en el plano (E, B)
le corresponde en el plano (φ, A) , no un punto, sino un conjunto infinito de
puntos que denotamos D. La libertad gauge es poder usar cualquier punto
del conjunto D. Ahora, podemos escoger, dentro de D, un subconjunto, el
subconjunto de todos los campos (φ, A) que cumplen alguna condición que
nos parezca conveniente. Es usual escoger dentro de D el subconjunto de
campos (φ, A) que cumplen una ecuación subsidiaria que recibe el nombre
de condición de gauge. Las condiciones de gauge más conocidas son la de
Coulomb y la de Lorentz:

∇ · A = 0 es la condición de gauge de Coulomb. Una de las enseñanzas de la


relatividad especial es la unión del espacio y el tiempo, y una ecuación que
sea relativistamente válida debe tratar al espacio y al tiempo en un plano de
igualdad. Si una ecuación menciona el espacio sin mencionar el tiempo, no
puede ser covariante, y tal es el caso con la ecuación ∇ · A = 0. El hecho de
que la condición de Coulomb no sea covariante la hace inapropiada cuando
se desea formular covariantemente una teorı́a. Si queremos una formulación
manifiestamente covariante de la electrodinámica, no debemos usar el gauge
de Coulomb. Esto no quiere decir que esta condición gauge sea inútil. A ba-
jas velocidades, y en muchos problemas de fı́sica atómica y estado sólido, una
formulación relativista resulta excesiva y torpe. En esos problemas no se as-
pira a usar una formulación covariante, y el gauge de Coulomb es apropiado.

Como queremos una expresión manifiestamente covariante de la electrodinámi-


ca, debemos buscar una condición de gauge covariante. Investiguemos la
condición de gauge de Lorentz:

1 ∂φ
+∇·A=0 (6.10)
c ∂t

A primera vista esta ecuación no parece covariante, pero si definimos

Aµ = (φ, A) , (6.11)

la ecuación (6.10) se escribe muy cortamente:

149
∂µ Aµ = 0 (6.12)

Como ∂µ es un operador vectorial, la ecuación (6.12) dice que en el gauge


de Lorentz Aµ es un vector. En general, cuando se necesite una formulación
manifiestamente covariante se puede usar el gauge de Lorentz. A lo largo
de todo este capı́tulo supondremos que el potencial Aµ cumple la condición
∂µ Aµ = 0.

Queremos expresar las cinco ecuaciones (6.1)-(6.5) en términos del poten-


cial Aµ , y aquı́ encontramos una de las ventajas del nuevo tratamiento:
cuando se usa Aµ , las dos ecuaciones homogéneas de Maxwell se satisfacen
automáticamente. En efecto, es evidente que con las definiciones (6.6) y (6.7)
se cumplen automáticamente las ecuaciones homogéneas (6.1) y (6.2). Esta
es una simplificación, ya que los campos Aµ quedan regidos, no por cua-
tro ecuaciones (de Maxwell), sino por dos apenas: las inhomogéneas (6.3) y
(6.4). Esta es una enseñanza, una guı́a práctica: cuando se usa Aµ , uno no
piensa en cuatro ecuaciones de Maxwell, sino en dos.

Expresemos pues las dos ecuaciones inhomogéneas (6.3) y (6.4) y la fuerza


de Lorentz (6.5) en términos del tensor Aµ . Esto es lo que haremos en las
próximas dos secciones.

6.2 Las dos ecuaciones de Maxwell


Al colocar las definiciones (6.6) y (6.7) en las ecuaciones inhomogéneas (6.3)
y (6.4) se obtiene fácilmente

1∂
(∇ · A) + ∇2 φ = −4πρ (6.13)
c ∂t
µ ¶
1 ∂2A 2 1 ∂φ 4π
2 2
−∇ A+∇ +∇·A = J (6.14)
c ∂t c ∂t c

En estas dos ecuaciones las variables φ y A están acopladas de una manera


complicada. Pero ellas se pueden desacoplar muy fácilmente; en efecto, si
utilizamos el gauge de Lorentz (6.10) las dos ecuaciones (6.13) y (6.14)
quedan ası́:

1 ∂2φ
− ∇2 φ = 4πρ (6.15)
c2 ∂t2

150
1 ∂2A 4π
− ∇2 A = J (6.16)
c2 ∂t2 c

La ganancia es considerable: ahora las ecuaciones de movimiento de φ y A


están desacopladas y, además, tienen una simetrı́a evidente. En vista de la
fórmula (5.41) las ecuaciones (6.15) y (6.16) se escriben muy cortamente:

∂µ ∂ µ φ = 4πρ
4π (6.17)
∂µ ∂ µ A = J
c

De otro lado, la ecuación (5.66) nos enseñó que las cantidades (ρc, J) forman
un cuadrivector:

J µ = (ρc, J) , (6.18)

entonces las ecuaciones (6.11) y (6.18) en (6.17) dan:

4π ν
∂µ ∂ µ Aν = J (6.19)
c

Esta fórmula expresa las dos ecuaciones inhomogéneas de Maxwell de una


manera manifiestamente covariante. Operando con ∂ν en ambos lados de
esta ecuación se obtiene


∂ν J ν = ∂µ ∂ µ ∂ν Aν
c

Ahora, el lado derecho de esta ecuación es cero, debido a la condición (6.12),


entonces

∂ν J ν = 0 (6.20)

Esta es la ecuación de continuidad. Antes de concluir esta sección anotemos


que en ausencia de cargas y corrientes la teorı́a de Maxwell admite la existen-
cia de ondas electromagnéticas. En efecto, sino hay cargas ni corrientes, los
lados derechos de las ecuaciones (6.15) y (6.16) son cero, y en consecuencia:

151
µ ¶
1 ∂2 2
−∇ φ = 0
c2 ∂t2
µ ¶
1 ∂2 2
−∇ A = 0
c2 ∂t2

Estas son ecuaciones de ondas. Si hacemos cero los lados derechos de las
ecuaciones (6.17) se llega a

∂µ ∂ µ Aν = 0 (6.21)

Esta es la ecuación de ondas en una forma manifiestamente covariante.

6.3 La fuerza de Lorentz


Al desplegar las ecuaciones (6.6) y (6.7) en todas sus componentes llegamos
a:
Ex = −(∂ 0 A1 − ∂ 1 A0 ) Bx = −(∂ 2 A3 − ∂ 3 A2 )

Ey = −(∂ 0 A2 − ∂ 2 A0 ) By = −(∂ 3 A1 − ∂ 1 A3 ) (6.22)


Ez = −(∂ 0 A3 − ∂ 3 A0 ) Bz = −(∂ 1 A2 − ∂ 2 A1 )

Ya estamos en condición de atacar la fuerza de Lorentz. Las ecuaciones


(4.139)-(4.141) son:

dpx q
= [cEx + uy Bz − uz By ] (6.23)
dt c
dpy q
= [cEy + uz Bx − ux Bz ] (6.24)
dt c
dpz q
= [cEz + ux By − uy Bx ] (6.25)
dt c

Modifiquemos la escritura de la primera ecuación; la ecuación (5.54) dice


que c = γ −1 U 0 , uy = γ −1 U 2 , uz = γ −1 U 3 , entonces

dpx q£ 0 ¤
γ = U Ex + U 2 Bz − U 3 By
dt c

152
dpx dp1
De otro lado, γ = :
dt dτ

dp1 q£ 0 ¤
= U Ex + U 2 Bz − U 3 By
dτ c

También usamos tres de las ecuaciones (6.22) para obtener:

dp1 q£ 1 0 ¤
= (∂ A − ∂ 0 A1 )U 0 − (∂ 1 A2 − ∂ 2 A1 )U 2 − (∂ 1 A3 − ∂ 3 A1 )U 3 ,
dτ c

es decir:

dp1 q£ 1 0 ¤
= (∂ A − ∂ 0 A1 )U0 + (∂ 1 A2 − ∂ 2 A1 )U2 + (∂ 1 A3 − ∂ 3 A1 )U3
dτ c

Nótese que esta ecuación se puede escribir

dpa q
= (∂ a Aν − ∂ ν Aa )Uν (6.26)
dτ c

En esto se ha convertido la ecuación (6.23). Es fácil darse cuenta de que


también (6.24) y (6.25) corresponden a la ecuación (6.26). Ahora damos un
salto interesante; en vez de la ecuación (6.26) proponemos:

dpµ q
= (∂ µ Aν − ∂ ν Aµ )Uν (6.27)
dτ c

En conclusión: con la condición (6.12), las ecuaciones de la electrodinámica


manifiestamente covariantes son (6.19) y (6.27). La conexión entre Aµ y los
campos E y B está en (6.6) y (6.7). Las ecuaciones homogéneas (6.1) y (6.2)
no constituyen un resultado adicional (ver página 150).

Nota: El salto de las tres ecuaciones (6.26) a las cuatro ecuaciones (6.27)
es una generalización, porque agrega una cuarta ecuación, para µ = 4 :

dp0 q
= (∂ 0 Aν − ∂ ν A0 )Uν
dτ c

153
¿Qué significa esta ecuación, hemos descubierto algo nuevo, esto ya lo sabı́amos?
Para responder estas preguntas notemos que esta ecuación se puede escribir
ası́:

dp0 q 0 a
= (∂ A − ∂ a A0 )Ua
dτ c
dp0 q
γ = γ (∂ 0 Aa − ∂ a A0 )ua
dt c
dp0 q q
= (Ea )ua = E · u
dt c c

Ahora, p0 es la componente cero del cuadrivector momentum: p0 = Energı́a/c


= E/c, entonces

dE
= qE·u
dt

En el lado derecho de esta ecuación podemos sumar u × B · u = 0 :

dE u
= q [E + × B] · u
dt c
= F·u

Esta ecuación es Potencia = F · u , que es una ecuación ampliamente conoci-


da en la mecánica. En otras palabras, la ecuación (6.27) unifica la fuerza de
Lorentz con la ecuación de potencia. No es esta la primera vez, ni será la últi-
ma, en que la relatividad unifica. Lo que acabamos de ver ocurre a menudo
cuando uno quiere convertir una ecuación no covariante en otra ecuación que
sı́ sea covariante. Por lo general este proceso incluye una generalización (co-
mo el paso de (6.26) a (6.27)), y es aquı́ donde aparece información adicional,
ecuaciones adicionales. Estas ecuaciones adicionales pueden ser información
ya conocida, o pueden ser información nueva. En el primer caso la general-
ización aporta unificación, que es algo de por sı́ valioso. En el segundo caso,
la generalización aporta nueva fı́sica y abre las puertas a la observación de
fenómenos insospechados.

154
6.4 El tensor electromagnético
La teorı́a electrodinámica está escrita de modo manifiestamente covariante
en las ecuaciones (6.12), (6.19), y (6.27). Lograr esta escritura covariante
era uno de los objetivos principales de este capı́tulo; pero conviene además
que presentemos un nuevo tensor F µν que trae ventajas en el estudio de
las leyes de conservación y la formulación lagrangiana, asuntos que veremos
en los capı́tulos 7 y 8. Para comenzar anotemos que las ecuaciones (6.22) y
(6.27) sugieren decididamente que definamos la cantidad

F µν = ∂ µ Aν − ∂ ν Aµ (6.28)

La derivada ∂ µ es un operador vectorial y Aµ es un vector en el gauge de


Lorentz; entonces F µν es un tensor en el gauge de Lorentz, y se le conoce
como el tensor electromagnético. F µν es de rango 2, y por tanto tiene 16
componentes; pero es antisimétrico, entonces tiene solamente 6 componentes
libres, que son justamente las tres componentes de E y las tres componentes
de B. Las ecuaciones (6.22) muestran que

Ex = F 10 , Ey = F 20 , Ez = F 30
(6.29)
Bx = F 32 , By = F 13 , Bz = F 21

O, en forma matricial:

 
0 −Ex −Ey −Ez
 
 
 Ex 0 −Bz By 
 
F µν =


 (6.30)
 Ey Bz 0 −Bx 
 
 
Ez −By Bx 0

Ahora pasamos a expresar las ecuaciones de la electrodinámica en térmi-


nos del nuevo tensor F µν . Primero veremos las ecuaciones inhomogéneas de
Maxwell, luego las homogéneas y por último la fuerza de Lorentz.

155
Las ecuaciones inhomogéneas de Maxwell. Éstas se expresan medi-
ante (6.19):

4π ν
J = ∂µ (∂ µ Aν )
c
= ∂µ (∂ µ Aν − ∂ ν Aµ + ∂ ν Aµ )

= ∂µ (∂ µ Aν − ∂ ν Aµ ) + ∂ ν ∂µ Aµ

El último término del lado derecho es cero por la condición de Lorentz,


4π ν
entonces queda J = ∂µ (∂ µ Aν − ∂ ν Aµ ), es decir
c

4π ν
∂µ F µν = J (6.31)
c

Las ecuaciones homogéneas de Maxwell. Por la definición del tensor


F µν es claro que ∂ α F µν + ∂ ν F αµ + ∂ µ F να = ∂ α (∂ µ Aν − ∂ ν Aµ ) + ∂ ν (∂ α Aµ −
∂ µ Aα ) + ∂ µ (∂ ν Aα − ∂ α Aν ). Fácilmente vemos que el lado derecho de esta
ecuación es cero, o sea que

∂ α F µν + ∂ ν F αµ + ∂ µ F να = 0 (6.32)

En la ecuación (6.32) hacer α = 1 , µ = 2 y ν = 3 :

∂ 1 F 23 + ∂ 3 F 12 + ∂ 2 F 31 = 0

En la ecuación (6.32) hacer α = 0 , µ = 3 y ν = 2 :

∂ 0 F 32 + ∂ 2 F 03 + ∂ 3 F 20 = 0

En la ecuación (6.32) hacer α = 0 , µ = 1 y ν = 3 :

∂ 0 F 13 + ∂ 3 F 01 + ∂ 1 F 30 = 0

En la ecuación (6.32) hacer α = 0 , µ = 2 y ν = 1 :

∂ 0 F 21 + ∂ 1 F 02 + ∂ 2 F 10 = 0

156
En estas cuatro ecuaciones haremos dos cosas: primero, cambiar las com-
ponentes F µν por las entradas de la matriz (6.30) y, segundo, substituir
∂ 0 , ∂ 1 , ∂ 2 , ∂ 3 por ∂0 , −∂1 , −∂2 , −∂3 , respectivamente. Se obtiene entonces
estas cuatro ecuaciones:

∂1 Bx + ∂3 Bz + ∂2 By = 0

∂0 Bx + ∂2 Ez − ∂3 Ey = 0

∂0 By + ∂3 Ex − ∂1 Ez = 0

∂0 Bz + ∂1 Ey − ∂2 Ex = 0

Estas ecuaciones son, claramente, las dos ecuaciones homogéneas (6.1) y


(6.2). En conclusión, la ecuación (6.32) es una escritura manifiestamente
covariante de las dos ecuaciones inhomogéneas de Maxwell.

La fuerza de Lorentz. En la ecuación (6.27) reconocemos la definición


del tensor electromagnético:

dpµ q
= F µν Uν (6.33)
dτ c

El problema de partı́cula libre ocurre cuando q = 0 o cuando no hay campo


electromagnético. En ambos casos el lado derecho de esta ecuación es cero:

dpµ
= 0 Partı́cula libre (6.34)

d2 xµ
= 0 Partı́cula libre (6.35)
dτ 2

Para concluir digamos que la formulación covariante de la electrodinámica


es ası́: con la definición (6.28) y la condición (6.12), las ecuaciones de la
electrodinámica son (6.31) y (6.33). La conexión entre F µν y los campos
E y B está en (6.29). Las ecuaciones homogéneas, contenidas en (6.32) no
constituyen un resultado adicional (ver página 150).

157
6.5 La transformación de los campos
En la sección 4.1 encontramos las reglas de transformación de los campos
E y B. Recuérdese, sin embargo, que el camino seguido en esa ocasión fue
largo y dispendioso. En este momento queremos deducir de nuevo esas re-
glas con las herramientas que nos suministra la notación covariante. Como
en esta notación no se usan E, B, sino F µν , lo que hacemos primero es en-
contrar la transformada del tensor electromagnético. Para esto utilizamos
las ecuaciones (5.46) , (5.47) y (6.30), ası́:
   
γ −γβ 0 0 0 −Ex −Ey −Ez γ −γβ 0 0
   
   
 −γβ γ 0 0   By   0 
   Ex 0 −Bz   −γβ γ 0 
   
   
 0 0 1 0   −Bx   0 
   Ey Bz 0  0 0 1 
   
0 0 0 1 Ez −By Bx 0 0 0 0 1

Obtenemos esta expresión de F 0 µν :


 
0 −Ex −γ(Ey − βBz ) −γ(Ez + βBy )
 
 
 
 Ex 0 −γ(Bz − βEy ) γ(By + βEz ) 
 
F 0 µν 
= 

 γ(E − βB ) γ(B − βE ) 0 −Bx 
 y z z y 
 
 
γ(Ez + βBy ) −γ(By + βEz ) Bx 0

Comparando con
 
0 −Ex0 −Ey0 −Ez0
 
 0 
 Ex 0 −Bz0 By0 
 
F 0 µν
=

,

 E0 Bz0 0 −Bx 
0
 y 
 
Ez0 −By0 Bx0 0

identificamos:

158
Ex0 = Ex Bx0 = Bx

Ey0 = γ(Ey − βBz ) By0 = γ(By + βEz )

Ez0 = γ(Ez + βBy ) Bz0 = γ(Bz − βEy )

Estas son las mismas reglas de transformación de la sección (4.1).

6.6 Dos escalares


Con F µν y el tensor ²αβγδ de Levi-Civita (ver la ecuación (5.36)) se puede
construir otro, que se llama el tensor electromagnético dual: F αβ ≡ 12 ²αβγδ Fγδ .

   
0 −Bx −By −Bz 0 Bx By Bz
   
   
 Bx 0 Ez 
−Ey   −Bx 0 Ez −Ey 
  
F αβ =

; Fαβ = 
 


 By −Ez 0 Ex   −By −Ez 0 Ex 
   
   
Bz Ey −Ex 0 −Bz Ey −Ex 0

Con los tensores F µν y F αβ se puede construir tres cantidades escalares,


que son F αβ Fαβ , F αβ Fαβ y F αβ Fαβ . Al desarrollar estos productos ma-
triciales se obtiene

F αβ Fαβ = −4E · B : escalar


(6.36)
F αβ Fαβ = −F αβ Fαβ = 2(E 2 − B 2 ) : escalar

Estas son las dos cantidades invariantes que vimos en las ecuaciones (4.49)
y (4.50). Los escalares (6.36) son cuadráticos en los campos, es decir, son
productos de dos campos. Con productos de cuatro campos también se puede
construir un escalar (ver la ecuación (5.50)) que es el determinante de F αβ .
El resultado es

det F αβ = (E · B)2 : escalar

159
E, B

D f, A

Figura 6.1 La relación entre


(E , B) y (φ , A) no es biunı́voca:
a unos valores dados de (E , B)
les corresponde todo un conjun-
to D de valores (φ , A) .

160
Capı́tulo 7

Las leyes de conservación

Ha llegado el momento de estudiar las corrientes, el tensor energı́a-momentum


y las leyes de conservación. Para tal efecto nos valdremos de un sistema
fı́sico, la nube de partı́culas, que es suficientemente simple para admitir un
tratamiento matemático sencillo, pero tiene además una complejidad sufi-
ciente para mostrar las sutilezas de las leyes de conservación. Después de
presentar estos temas concluimos el capı́tulo con la corriente del momentum
angular.

7.1 La nube de partı́culas

Al estudiar la nube de partı́culas en la sección 4.7 suponı́amos que a un


pequeño volumen de la nube se le podı́a asignar una velocidad u. Nuestro
propósito ahora es hacer un tratamiento más refinado, atendiendo a la con-
tribución que cada partı́cula individual aporta a la densidad y a la corriente.
Pensamos en un conjunto de partı́culas en los puntos x1 (t), x2 (t), x3 (t), ...
La densidad ρpar de partı́culas y la densidad Jpar de corriente se definen ası́:

X
ρpar (x, t) = δ 3 (x − xn (t)) (7.1)
n
X dxn (t)
Jpar (x, t) = δ 3 (x − xn (t)) , (7.2)
n
dt

161
donde el ı́ndice n = 1, 2, 3, ... recorre1 todas las partı́culas de la nube2 .
∂ a
Tomemos ahora la divergencia ∇ · Jpar = J ; se obtiene:
∂xa par

Xµ ∂ ¶ a
dxn (t) ∂ dxan (t)
3 3
δ (x − xn (t)) + δ (x − xn (t)) (7.3)
n
∂xa dt ∂xa dt

dxan (t) ∂ dxan (t)


Ahora, depende únicamente de t, o sea que es cero, en-
dt ∂xa dt
tonces:

X dxa (t) ∂
n
∇ · Jpar = a
δ 3 (x − xn (t))
n
dt ∂x
X dxa (t) ∂
n
= − a
δ 3 (x − xn (t))
n
dt ∂x n
X ∂ ∂
= − δ 3 (x − xn (t)) = − ρpar
n
∂t ∂t

De donde vemos que


∂ρpar
+ ∇ · Jpar = 0 (7.4)
∂t

Esta es la célebre ecuación de continuidad (véase la ecuación (6.20)). Es muy


importante, porque trae consigo la conservación del número de partı́culas,
tal como veremos enseguida. El número N de partı́culas es:

Z
N= d3 x ρpar (x, t) (7.5)

dN
Tomar la derivada y usar la ecuación (7.4)
dt
1
La ventaja de este tratamiento, tomado de Weinberg [11], radica en el hecho de
que aunque la nube está compuesta de partı́culas en posiciones discretas, las cantidades
ρpar (x, t) y Jpar (x, t) son campos que dependen de las coordenadas continuas (x, t).
2
Los fı́sicos le dicen polvo a un conjunto de partı́culas tal que todas ellas están en
reposo respecto a algún observador inercial. Lo que queremos estudiar en este capı́tulo no
es una nube de polvo.

162
Z Z
dN ∂ρpar (x, t)
= d3 x = − d3 x ∇ · Jpar (x, t)
dt ∂t

El lado derecho es un integral de volumen que, según el teorema de Gauss,


es igual a una integral en la superficie que cubre al volumen. Si este volumen
es suficientemente grande para abarcar todas las partı́culas, la corriente J
es cero en la superficie y el integral es cero. Vemos ası́ que

dN
=0 (7.6)
dt

En conclusión, la ecuación de continuidad (7.4) implica que el número total


de partı́culas de la nube se conserva.

Es importante que escribamos la corriente en notación covariante. Si lla-


mamos x0n (t) = ct, el evento (ct, xn (t)) que ocupa la partı́cula n se puede
escribir (x0n (t), xn (t)) ; o más cortamente, xµn (t). Las ecuaciones (7.1) y (7.2)
son

X dx0n (t)
cρpar (x, t) = δ 3 (x − xn (t))
n
dt
X dxan (t)
a
Jpar (x, t) = δ 3 (x − xn (t))
n
dt

0 = cρ
Para unificar estas dos ecuaciones definimos Jpar par , de modo que

µ
Jpar = (cρpar , Jpar ) (7.7)

X dxµn (t)
µ 3
Jpar = δ (x − xn (t)) (7.8)
n
dt

µ
Vamos a probar que Jpar es un Rvector, para lo cual multiplicamos el lado
derecho de la ecuación (7.8) por dx0 δ(x0 − x0n ) = 1:

XZ dxµn (t)
µ
Jpar = dx0 δ(x0 − x0n )δ 3 (x − xn (t))
n
dt

163
XZ dxµn
= dx0 δ 4 (x − xn )
n
dt
XZ
= c δ 4 (x − xn )dxµn (7.9)
n

R
De otro lado, la función δ 4 satisface la ecuación δ 4 (x − xn )d4 x = 1, o sea
que δ 4 (x − xn )d4 x es un escalar; como d4 x es un escalar (ver la ecuación
(5.49)), concluimos que δ 4 (x − xn ) es un escalar. Hecha esta observación,
regresamos al lado derecho de la ecuación (7.9). Como dxµn y δ 4 (x − xn ) son
µ
tensores, entonces Jpar es un vector. La ecuación de continuidad (7.4) se
escribe también:
µ
∂µ Jpar (x) = 0 (7.10)

7.2 Otras corrientes


La n-ésima partı́cula de la nube tiene carga eléctrica qn y momentum pνn .
En el lado derecho de la ecuación (7.8) podemos multiplicar cada sumando
por qn o por pνn , y de esta manera se obtienen otras dos corrientes:

X dxνn (t)
ν
Jelec (x) = qn δ 3 (x − xn (t)) (7.11)
n
dt
X dxνn (t)
Jpνµ (x) = pµn (t) δ 3 (x − xn (t)) (7.12)
n
dt

dxµn (t)
En la ecuación (7.11) podemos interpretar que qn δ 3 (x − xn (t)) es
dt
la densidad de corriente eléctrica que aporta la n-ésima partı́cula para la
µ
construcción de la densidad total de corriente eléctrica Jelec . Ası́ mismo, la
ecuación (7.12) da la ν-ésima componente de la densidad de corriente de
µ
momentum µ. Nótese que, como qn es un escalar, la corriente Jelec es un
µ ν
vector; de la misma manera, como pn (t) es un vector, Jpµ es un tensor de
segundo rango.

Cada partı́cula de la nube tiene una lı́nea en el mundo, una trayectoria


en el espaciotiempo. Esa trayectoria crea varias corrientes: la eléctrica, la
de momentum µ, etc. Con los aportes de todas las partı́culas se obtienen las
corrientes totales de la nube. Lo interesante es que existen varias corrientes
ν , J ν , J ν , etc.
simultáneamente: Jpart elec pµ

164
Vamos a demostrar que corriente eléctrica3 se conserva. Al tomar la diver-
gencia en la ecuación (7.11) tenemos en cuenta que la carga q es invariante
(ver página 43), o sea que sus derivadas son cero y se llega limpiamente a
una ecuación como (7.4):

∂µ J µ (x) = 0 (7.13)

Este es un resultado importante: la corriente eléctrica satisface la ecuación de


continuidad. En consecuencia, la carga eléctrica total de la nube permanece
constante a medida que transcurre el tiempo.

7.3 El tensor de energı́a y momentum


La densidad de corriente del momentum µ que presentamos en (7.12) se
µν
escribe usualmente Tmec :

X dxνn (t)
µν
Tmec (x) = pµn (t) δ 3 (x − xn (t)) (7.14)
n
dt

o como en la ecuación (7.9):

XZ
µν
Tmec (x) =c pµn δ 4 (x − xn ) dxµn (7.15)
n

La fórmula (7.14) puede transformarse usando la ecuación (5.62):

X pµn pν
µν n
Tmec (x) = c2 δ 3 (x − xn (t)) (7.16)
n
En

Esta ecuación muestra que el tensor se construye con las propiedades mecánicas
de las partı́culas, que son los momentos pµn ; por esta razón escribimos el
µν
subı́ndice “mec” en Tmec . Veremos más tarde que hay otros tensores de
3
De ahora en adelante omitiremos el subı́ndice “elec” que aparece en (7.11), de modo
que la corriente eléctrica se llamará simplemente J ν . Ası́ la hemos llamado en capı́tulos
anteriores.

165
energı́a y momentum: para el campo electromagnético, para el campo grav-
µν
itatorio, etc. Esos otros tensores no son de naturaleza mecánica como Tmec .
µν
De otro lado, la ecuación (7.16) también dice que Tmec es simétrico:

µν νµ
Tmec (x) = Tmec (x) (7.17)


Las cuatro componentes Tmec son especialmente importantes:

X
00
Tmec (x) = En δ 3 (x − xn (t)) (7.18)
n
X
0a
Tmec (x) = c pan δ 3 (x − xn (t)) (7.19)
n

00 (x) es la densidad de energı́a y T 0a (x) es


Estas ecuaciones dicen que Tmec mec
µν
c veces la densidad de momentum en dirección a. Por esta razón Tmec (x)
recibe el nombre de tensor de energı́a y momentum.

µν µν
7.4 ∂µ Tmec =0, ∂µ Tmec 6= 0
Es importante que nos detengamos a estudiar lo que ocurrirı́a si la diver-
µν
gencia de Tmec fuera cero, es decir, si

µν µν
∂µ Tmec = Tmec ,µ = 0 (7.20)

Esta ecuación implica que

∂ 0ν ∂ aν
T = −c a Tmec
∂t mec ∂x
Z Z
∂ 0ν 3 ∂ aν 3
Tmec d x = −c T d x
∂t ∂xa mec

De acuerdo con el teorema de Gauss, el lado derecho de esta ecuación es


igual a un integral en la superficie que cubre al volumen. Pensamos que
este volumen es mayor que el volumen ocupado por la nube de partı́culas,
de manera que Tmecaν y sus derivadas valen cero en la superficie. En estas

condiciones el lado derecho de la última ecuación es cero y

166
Z
d 0ν
Tmec (x) d3 x = 0 (7.21)
dt
R 0ν 3
O sea que las cuatro cantidades Tmec d x son constantes. En vista de que
estas cuatro cantidades son la energı́a total y el momentum total, podemos
µν
afirmar que cuando ∂µ Tmec = 0 se conservan la energı́a total y el momentum
total de la nube.

Acabamos de llegar a una conclusión importante, cual es que las leyes


de conservación de momentum y energı́a están expresadas en la ecuación
µν µν
∂µ Tmec = 0. Pero ¿verdaderamente se cumple la ecuación ∂µ Tmec = 0 en
las nubes?, ¿en toda clase de nubes?, ¿en cuáles sı́ y en cuáles no? Para
responder estas preguntas vayamos en detalle a los términos que conforman
µν µν µ0 µa
la divergencia de Tmec . Esta divergencia es ∂ν Tmec = ∂0 Tmec + ∂a Tmec :

µν µ0 ∂ X µ dxan (t) 3
∂ν Tmec = ∂0 Tmec + p (t) δ (x − xn (t))
∂xa n n dt
X dxan (t) ∂ 3
µ0
= ∂0 Tmec + pµn (t) δ (x − xn (t))
n
dt ∂xa
X ∂xan ∂ 3
µ0
= ∂0 Tmec − pµn (t) δ (x − xn (t))
n
∂t ∂xan
X ∂ 3
µ0
= ∂0 Tmec − pµn (t) δ (x − xn (t)) (7.22)
n
∂t

El último término del lado derecho es de la forma

∂ 3 ∂ ∂p 3
p δ = (p δ 3 ) − δ ,
∂t ∂t ∂t

o sea que la ecuación (7.22) es

µν µ0 ∂ X µ 3 X dpµn
∂ν Tmec = ∂0 Tmec − pn δ (x − xn (t)) + δ 3 (x − xn (t))
∂t n n
dt

X dpµn
µ0 µ0
= ∂0 Tmec − ∂0 Tmec + δ 3 (x − xn (t)) ,
n
dt

167
es decir:
X dpµn
µν
∂ν Tmec (x) = δ 3 (x − xn (t)) (7.23)
n
dt

Esta ecuación establece que la energı́a y el momentum de la nube se conser-


P dpµn 3
van si se cumple la condición δ (x − xn ) = 0. Veremos que hay unas
n dt
nubes que satisfacen esta condición, y otras que no la cumplen.

a) Partı́culas libres. En este caso las partı́culas no interactúan entre sı́ ni


con el exterior; como no hay choques, las partı́culas tienen movimiento rec-
dpµn
tilı́neo uniforme, las derivadas son cero, y en consecuencia la fórmula
µν
dt
(7.23) da ∂µ Tmec = 0. Se conservan la energı́a y el momentum.

b) Choques puntuales. Pensemos ahora que la nube no interactúa con


el exterior, pero las partı́culas chocan, interactúan en forma instantánea:
varias partı́culas coinciden en un evento e intercambian energı́a y momen-
tum en un proceso instantáneo. Bajo estas condiciones regresamos al lado
dpµn
derecho de la ecuación (7.23) y notamos que las derivadas difieren de
dt
cero únicamente durante los choques. Denotando por R el punto donde
ocurre un choque, la fórmula (7.23) es:

µν
XX dpµn0
∂ν Tmec (x) = δ 3 (x − R(t))
dt
R n0

Aquı́ hay una suma sobre todos los choques R, y el ı́ndice n0 recorre única-
mente las partı́culas que intervienen en el choque en R.

X d X µ
µν
∂ν Tmec (x) = δ 3 (x − R(t)) p 0
dt 0 n
R n

P
La sumatoria pµn0 es el momentum total, sumado, de todas las partı́culas
n0
que intervienen en la colisión en R. Este momentum es constante, o sea que
d X µ µν
p 0 es cero. En este caso la ecuación (7.23) es ∂ν Tmec = 0. Se conser-
dt 0 n
n
van la energı́a y el momentum.

168
c) La nube de partı́culas cargadas. Para la partı́cula n-ésima la fuerza
de Lorentz (6.33) es:

dpµn qn µ
= F α (xn )Unα
dτn c
qn µ dxα
= F α (xn ) n
c dτn

dτn
Multiplicar ambos lados por :
dt

dpµn qn µ dxα
= F α (xn ) n ,
dt c dt

y esto en la ecuación (7.23) da:

X qn dxαn 3
µν
∂ν Tmec (x) = F µ α (xn ) δ (x − xn (t))
n
c dt
X qn dxαn 3
= F µ α (x) δ (x − xn (t))
n
c dt

1 µ X dxα
= F α (x) qn n δ 3 (x − xn (t))
c n
dt

Con (7.11) reconocemos la densidad de corriente eléctrica:

µν 1 µ
∂ν Tmec (x) = F α (x)J α (x) (7.24)
c

Los casos a), b) y c) que acabamos de reseñar indican cuáles son las condi-
µν
ciones dinámicas que se deben cumplir para que la divergencia ∂ν Tmec sea
µν
cero. La clave está en reconocer en qué casos el tensor Tmec se refiere a un
sistema fı́sico aislado.

En el caso a) la nube está aislada del exterior y del interior: la energı́a

169
y el momentum total de la nube se forman exclusivamente con las contribu-
µν
ciones mecánicas. Es decir, Tmec menciona la totalidad de un sistema fı́sico;
no puede sorprendernos que se conserven la energı́a y el momentum; no
µν
puede sorprendernos que ∂ν Tmec sea cero.

En el caso c) existe el campo electromagnético creado por las mismas partı́cu-


las cargadas que forman la nube, y este campo tiene energı́a y momen-
tum. Hay un sistema total que tiene dos subsistemas: 1) las partı́culas, que
µν
tienen una energı́a-momentum enteramente mecánica descrita por Tmec y
2) el campo electromagnético. Estos dos subsistemas interactúan, intercam-
bian momentum-energı́a, o sea que ninguno de los dos conserva energı́a-
µν
momentum. El tensor Tmec se refiere apenas a uno de los subsistemas y
µν
por eso no se espera que ∂ν Tmec sea cero. El sistema total partı́culas-campo
sı́ está aislado del exterior, y portanto la energı́a y el momentum totales
sı́ se deben conservar. Debe existir otro tensor θµν que de cuenta de la en-
µν
ergı́a-momentum del campo, de modo que la suma (Tmec + θµν ) exprese la
µν
totalidad, y en consecuencia tenga divergencia nula: ∂ν (Tmec + θµν ) = 0.

El caso c) aclara lo que ocurre cuando entre las partı́culas de la nube hay
interacciones a distancia. Las interacciones a distancia denotan la presencia
de un campo, campo que también tiene energı́a y momentum. La totalidad
partı́culas-campo debe tener un tensor total de energı́a- momentum cuya
µν µν
divergencia sea nula. Ese tensor total no es Tmec , y por eso ∂ν Tmec 6= 0. Algo
muy diferente ocurre en el caso b); allı́ no hay interacciones a distancia, no
µν µν
hay campo, Tmec sı́ expresa un sistema total y por eso ∂ν Tmec = 0.

De regreso al caso c) que nos ocupaba hace un par de párrafos, detengámonos


en el tensor energı́a-momentum del campo electromagnético. Veremos en la
ecuación (8.59) que este tensor es

1 µα ν 1 µν
θµν = F Fα + η Fαβ F αβ (7.25)
4π 16π


Tomar la derivada :
∂xν

1 µα ν 1 µα 1
θµν ,ν = F Fα ,ν + F ,ν Fα ν + 2η µν Fαβ F αβ ,ν
4π 4π 16π

1 µα ν 1 1
= F Fα ,ν + Fαν F µα,ν + Fαβ F αβ ,µ
4π 4π 8π

170
Partir en dos el segundo término del lado derecho:

1 µα ν 1 1 1
θµν ,ν = F Fα ,ν + Fαν F µα,ν + Fαν F µα,ν + Fαβ F αβ ,µ
4π 8π 8π 8π

El tercer término del lado derecho es

1 1 1 1
Fαν F µα,ν = Fβν F µβ ,ν = Fβα F µβ ,α = Fαβ F βµ,α
8π 8π 8π 8π

Entonces:

1 µα ν 1 1 1
θµν ,ν = F Fα ,ν + Fαβ F µα,β + Fαβ F βµ,α + Fαβ F αβ ,µ
4π 8π 8π 8π

1 µα ν 1
= F Fα ,ν + Fαβ (F µα,β + F βµ,α + F αβ ,µ )
4π 8π

En el lado derecho de esta ecuación usamos la ecuación de Maxwell (6.32)


para obtener:
1 µα ν
θµν ,ν = F Fα ,ν

Ahora, ya que F µν = −F νµ la ecuación de Maxwell (6.31) es

4π ν
F νµ ,µ = − J , (7.26)
c


es decir, Fα ν ,ν = − Jα . Entonces
c

1
θµν ,ν = − F µα Jα (7.27)
c

En este momento sumamos lado a lado las ecuaciones (7.24) y (7.27) para
obtener:
µν
(Tmec + θµν ),ν = 0 (7.28)

171
Más explı́citamente, usando las ecuaciones (7.16) y (7.25):
à !
X pµn pν 1 µα ν 1 µν
n
c2 δ 3 (x − xn ) + F Fα + η Fαβ F αβ =0
En 4π 16π
n ,ν
µν
La ecuación (7.28) dice que la energı́a y el momentum contenidos en Tmec +
µν
θ se conservan.

7.5 La corriente de momentum angular


En las ecuaciones (7.11) y (7.12) definimos las corrientes asociadas a q y pµ .
Las partı́culas también tienen momentum angular L y quisiéramos definir
la densidad de corriente que le corresponde. Un primer intento serı́a imitar
lo de (7.11) y (7.12):

X dxνn (t)
Ln (t) δ 3 (x − xn (t))
n
dt

Pero esta cantidad tiene un defecto grave: no es un tensor, porque L no es un


tensor. Entonces esta cantidad no puede ser una corriente en un tratamien-
to covariante. Debemos buscar otra manera de producir una corriente de
momentum angular que sı́ sea tensorial. Más especı́ficamente, buscamos un
tensor tal que una de sus componentes sea la densidad de momentum angu-
lar en dirección x, otra componente sea la densidad de momentum angular
y y otra componente sea la densidad de momentum angular z. Proponemos
este tensor:

µνδ µν
Mmec (x) = Tmec (x)xδ − Tmec
µδ
(x)xν (7.29)
X µ ν ¶
3 µ dxn δ dxδn ν
= δ (x − xn (t)) pn x − x (7.30)
n
dt dt
1 032
La densidad de momentum angular en dirección x es Mmec . Ası́ mismo,
c
1 013 1 021
Mmec es la densidad en dirección y, y Mmec es la densidad del momentum
c c
angular en dirección z. Estas identificaciones indican que la escogencia (7.29)
es adecuada.

172
7.6 Generalización
Llegó el momento de abandonar la nube de partı́culas que tanto nos ha
servido para establecer los conceptos de corrientes y conservaciones. De aho-
ra en adelante nos referiremos, en general, a cualquier tensor de energı́a y
µν
momentum T µν (x). Ejemplos concretos de este tensor son Tmec y θµν . El
T µν que mencionamos es general, y no tenemos que decidir de antemano si
T µν = T νµ o T µν 6= T νµ , ni necesitamos comprometernos con que ∂ν T µν = 0
o ∂ν T µν 6= 0, ni tenemos que decidir desde ya si T µν se refiere a una parte
o a la totalidad de un sistema fı́sico. Ası́ como en las ecuaciones (7.18) y
(7.19), la componente T 00 (x) es la densidad de energı́a y T 0a (x) es c veces
la densidad de momentum en dirección a. Asociado a la energı́a-momentum
contenidas en T µν hay un M µνδ que se define en forma similar a (7.29):

M µνδ (x) = T µν (x)xδ − T µδ (x)xν (7.31)

1
La densidad de momentum angular en dirección x es M 032 . Ası́ mismo,
c
1 013 1 021
M es la densidad en dirección y, y M es la densidad del momen-
c c
tum angular en dirección z. El tensor M µνδ es antisimétrico bajo el inter-
cambio de los ı́ndices νδ. Para saber cuántas componentes independientes
tiene, analicemos la estructura Aµ B νδ , con B νδ = −B δν . Como B νδ tiene
6 componentes independientes, entonces M µνδ tiene 24 componentes inde-
pendientes.

Leyes de conservación. La ecuación (7.20) se generaliza ası́:

∂µ T µν = T µν ,µ = 0 (7.32)

Esta ecuación expresa la conservación de la energı́a y el momentum. Veamos


ahora qué ocurrirı́a si la divergencia de M µνδ fuera cero:

∂µ M µνδ = 0 (7.33)

Esta ecuación dice que ∂0 M 0νδ = −∂a M aνδ , es decir

173
∂ 0νδ ∂
M = −c a M aνδ
∂t ∂x
Z Z
d 0νδ 3 ∂
M d x = −c M aνδ d3 x
dt ∂xa

El lado derecho de la última ecuación es un integral de volumen; de acuerdo


con el teorema de Gauss, es igual a un integral en la superficie que envuelve
al volumen. Pensemos que esta superficie cubre completamente al sistema
fı́sico, de manera que M aνδ y sus derivadas son, allı́, cero. Entonces el integral
es cero y queda
Z
d
M 0νδ (x)d3 x = 0 (7.34)
dt
R
O sea que lasZ10 cantidades M 0νδ d3 x son constantes del movimiento. En
1
particular, M 032 d3 x , que es el momentum angular total en dirección
c
x, se conserva. TambiénZ son constantesZlas componentes en dirección y y en
1 1
dirección z, que son M 013 d3 x y M 021 d3 x, respectivamente.
c c
Lo que acabamos de ver es ya rutina: una divergencia nula corresponde
a una ley de conservación. Lo interesante es aclarar bajo qué condiciones se
anula la divergencia de M µνδ , es decir, qué se necesita para que se conserve
el momentum angular. Para responder esta pregunta colocamos (7.31) en
(7.33):

0 = ∂µ (T µν xδ − T µδ xν )

= (∂µ T µν )xδ − (∂µ T µδ )xν + T µν ηµ δ − T µδ ηµ ν

= (∂µ T µν )xδ − (∂µ T µδ )xν + T δν − T νδ (7.35)

Esta ecuación se cumple si ∂µ T µν = 0 y T δν = T νδ . En conclusión, el


momentum angular se conserva cuando se cumplen estas dos condiciones:
∂µ T µν = 0 y T µν = T νµ .

Resumen: la ecuación ∂µ T µν = 0 expresa la conservación de la energı́a y


el momentum; si T µν = T νµ , la ecuación ∂µ T µν = 0 expresa la conservación
de la energı́a, el momentum y el momentum angular.

174
Buscaremos siempre tensores de energı́a-momentum que sean simétricos por
dos razones: 1) Para que que la ecuación ∂µ T µν = 0 exprese no solamente
la conservación de la energı́a-momentum, sino también la conservación del
momentum angular. 2) Para que la ecuación del campo gravitatorio no sea
inconsistente (véanse los comentarios acerca de la simetrı́a del tensor en-
ergı́a-momentum que aparecen en la página 298).

175
176
Capı́tulo 8

Dinámica lagrangiana

Cuando a una partı́cula se le imponen unas condiciones iniciales, ella sigue


cierta trayectoria. Y si, repitiendo el experimento, a la partı́cula se le im-
ponen de nuevo las mismas condiciones iniciales, ella repite la trayectoria
del primer experimento. Es como si la partı́cula estuviera obligada a seguir
esa trayectoria. ¿Qué tiene especial esa trayectoria, qué la distingue? Para
responder esta pregunta los fı́sicos han elaborado la idea de trayectorias vari-
adas: otras rutas que la partı́cula no sigue. Las trayectorias variadas no son
rutas verdaderas, sino imaginadas. Del conjunto total formado por la trayec-
toria verdadera y las imaginadas, la verdadera se distingue por la siguiente
caracterı́stica: en ella se minimiza la acción. En general, todos los sistemas
fı́sicos, al evolucionar, toman aquella ruta en la que se minimiza la acción. El
presente capı́tulo desarrolla estas ideas en una formulación manifiestamente
covariante.

8.1 Teorı́a lagrangiana para


una partı́cula
Parametrización de una curva. Continuamos con la notación habitual,
en la que xµ son las coordenadas de un evento cualquiera del espaciotiempo
y ηµν dxµ dxν es el intervalo entre dos eventos cercanos. Vamos a estudiar el
movimiento de una partı́cula masiva. Para ganar generalidad suponemos que
el movimiento es acelerado, y la partı́cula libre será un caso particular de
nuestro estudio. Pensemos, ası́ como en la la sección 5.7, que la trayectoria
total de la partı́cula está compuesta de muchos fragmentos infinitesimales.
Escojamos uno cualquiera de ellos y démonos cuenta de que existe un obser-
vador inercial respecto al cual la partı́cula está aproximadamente en reposo.
Un poco de tiempo después, y debido a la aceleración de la partı́cula, ésta

177
ya no estará en reposo respecto al primer observador inercial, el cual se ha
vuelto obsoleto y debe ser substituido por otro observador para el próximo
fragmento de trayectoria. Vemos ası́ que diferentes observadores, todos iner-
ciales, se relevan para acompañar a la partı́cula en fragmentos infinitesimales
sucesivos. Cada uno de los observadores registra un dτ dado por:

p
c dτ = ηµν dxµ dxν en la trayect. de la partı́cula (8.1)

R
y el tiempo propio se define como τ = dτ . Ya que cada dτ es un invariante,
un escalar, concluimos que τ es también un escalar.

Llamaremos trayectoria verdadera a la lı́nea en el mundo que verdadera-


mente sigue la partı́cula que estamos estudiando. Esta trayectoria es el re-
sultado de las fuerzas que sobre ella operan y de las condiciones iniciales.
A cada punto x̄ de la trayectoria verdadera le corresponde un valor de τ ;
en otras palabras, las x̄µ son funciones del parámetro escalar τ , dependen-
cia que escribimos en la forma habitual x̄µ = x̄µ (τ ). Por ejemplo, si en
τ = 3.7 las coordenadas de la partı́cula son (22, 33, 44, 55), podemos es-
cribir x̄0 (3.7) = 22, x̄1 (3.7) = 33, x̄2 (3.7) = 44, x̄3 (3.7) = 55.

Curvas variadas. Pensemos ahora en otra curva imaginaria, diferente a la


trayectoria verdadera; esta “trayectoria virtual” se construye punto a punto
de la manera siguiente: el punto x̄µ (τ ) se corre una cantidad δxµ (τ ) , o sea
que las coordenadas del nuevo punto serán x̄µ (τ ) + δxµ (τ ) . Vemos ası́ que
todos los puntos de la trayectoria verdadera y todos los puntos de la nueva
curva son funciones del mismo parámetro escalar τ .

Sean E1 y E2 dos eventos de la trayectoria verdadera, en los cuales el tiempo


propio vale τ1 y τ2 , respectivamente. Consideramos curvas virtuales arbi-
trarias, pero con la condición de que pasen por E1 y E2 . Esto quiere decir
que las variaciones δxµ deben ser cero en los extremos E1 y E2 , lo que se
escribe

δxµ (τ1 ) = δxµ (τ2 ) = 0 (8.2)

El cálculo de variaciones. Ahora pensamos que la trayectoria verdadera


se distingue de las variadas porque en la primera se minimiza el integral de
lı́nea de una función L:

178
Z τ2
δ L dτ = 0 en la trayectoria verdadera (8.3)
τ1

Si L es dada, la condición (8.3) se encarga de determinar cuál es la curva


verdadera que pasa por E1 y E2 . Si la curva verdadera es dada, la condición
(8.3) se encarga de determinar cuál es la función L. Pasemos a desarrollar
(8.3):

Z τ2
0 = δL dτ (8.4)
τ1
Z ³ ∂L
τ2
∂L dxα ´
= δxα +
δ dτ (8.5)
τ1 dxα
∂xα dτ

Z τ2 ³ dτ
∂L α ∂ L dδxα ´
= δx + dτ (8.6)
τ1 ∂xα dxα dτ

El último término del lado derecho se integra por partes, ası́:

 ¯τ2  
Z ¯ Z τ2
τ2
∂L dδx α ¯
 ∂L α ¯  d ∂L  α
dτ =  α δx ¯ −   δx dτ
τ1 dxα dτ dx ¯ τ1 dτ dxα
∂ ∂ ¯ ∂
dτ dτ τ1 dτ

En esta ecuación el primer término del lado derecho es cero debido a (8.2),
y la fórmula (8.6) queda:

 
Z τ2
 ∂L d ∂L  α
0 =  α −  δx dτ
τ1 ∂x dτ dxα

Finalmente, como esta ecuación debe ser válida para valores arbitrarios de
δxα , es necesario que el integrando sea cero:

∂L d ∂L
− = 0 (8.7)
∂x α dτ dxα

179
Estas son las célebres ecuaciones de Euler y Lagrange. El principio varia-
cional (8.3) se expresa mediante la ecuación diferencial (8.7).

En verdad, las ecuaciones de Euler-Lagrange no suelen ser muy útiles en


problemas prácticos. La importancia del método lagrangiano radica, primero,
en que las (8.7) son invariantes bajo transformaciones generales de coorde-
nadas y, segundo, por el impacto que tienen en amplias áreas de la fı́sica
teórica. Usualmente uno conoce la ecuación de la trayectoria verdadera y
desea averiguar cuál es la función L adecuada. Se propone tentativamente
una L de prueba, y seguidamente se procede a desarrollar las ecuaciones
(8.7) correspondientes; si estas ecuaciones coinciden con la ecuación conoci-
da de la trayectoria verdadera, entonces la L de prueba es buena.

Debemos tener presente que el cálculo variacional utiliza, en el fondo, los


dos primeros términos de una serie de Taylor. En efecto, esto es lo que se
entiende al pasar de la ecuación (8.4) a la (8.5). Ası́ como en toda serie de
Taylor, las derivadas se calculan en el punto de referencia (en la trayectoria
verdadera), o sea que la ecuación (8.7) se puede escribir más claramente ası́:

 
· ¸
∂L d  ∂L 
−   = 0 (8.8)
∂xα Verdadera dτ dxα

dτ Verdadera

dxα
L es en general una función de xα , y τ . Escribimos entonces L =
µ ¶ dτ
dx α
L xα , , τ . La lagrangiana L y la acción A se definen ası́:

1
L = L lagrangiana (8.9)
γ
Z τ2
A = L dτ Acción (8.10)
τ1

p
Aquı́, 1/γ = 1 − u2 /c2 , y u es la trivelocidad de la partı́cula. La acción
debe ser un escalar, lo que implica que L también es escalar. Pero la la-
grangiana L no es escalar. Hay otra manera de escribir la acción, que se
obtiene combinando las ecuaciones (2.14), (8.9) y (8.10):

180
Z t2
A = L dt (8.11)
t1

Partı́cula libre. Como una aplicación sencilla de la formulación lagrangiana


recién vista, estudiemos el caso de la partı́cula libre. De acuerdo con la
dpα dUα
ecuación (6.34) podemos escribir = m0 = 0, o sea que:
dτ dτ

dUα
= 0 (8.12)

Buscamos una función L tal que su ecuación (8.7) de Euler-Lagrange coin-


cida con (8.12). Proponemos:

µ α
¶ r
α dx dxµ dxν
L x , = ηµν (8.13)
dτ dτ dτ

Para desarrollar las ecuaciones (8.7) procedemos a calcular los términos


∂L d ∂L
y :
∂x α dτ dxα

∂L
= 0 (8.14)
∂xα
· ¸
∂L 1 ∂ dxµ dxν
= η
dxα 2L dxα µν dτ dτ
∂ ∂
dτ dτ
· ν
¸
1 µ dx dxµ ν
= ηµν η α + ηµν η α
2L dτ dτ

1 dxν
= 2ηνα (8.15)
2L dτ
1 dxα
= (8.16)
L dτ

La ecuación (8.8) exige que evaluemos (8.14) y (8.16) en la trayectoria ver-


dadera. Comencemos aclarando cuánto vale L en la trayectoria verdadera.
De acuerdo con la ecuación (8.13) podemos escribir

181
"r #
dxµ dxν
[ L ]Verdadera = ηµν
dτ dτ
Verdadera

De otro lado la ecuación (8.1) dice que


"r #
dxµ dxν
ηµν =c
dτ dτ
Verdadera

Combinando las dos últimas ecuaciones resulta [ L ]Verdadera = c, y al evaluar


(8.16) en la trayectoria verdadera se obtiene:
 
· ¸
 ∂L  1 dxα
 dxα  =
c dτ Verdadera

dτ Verdadera

La ecuación (8.8) da, finalmente,


· ¸
1 d2 xα
− = 0
c dτ 2 Verdadera

Esta ecuación coincide con (8.12), lo que nos permite concluir que la es-
cogencia (8.13) es apropiada. Con (8.9) se sigue que un lagrangiano para
partı́cula libre es
r
1 dxµ dxµ
L= (8.17)
γ dτ dτ

El método lagrangiano no determina unı́vocamente la función L. Por ejemp-


lo, cualquier múltiplo de (8.17) es también bueno para partı́cula libre. Pronto
usaremos este:
r
m0 c dxµ dxµ
L=− (8.18)
γ dτ dτ

Partı́cula en un campo Aµ . Después de estudiar la partı́cula libre, pase-


mos al próximo nivel de complejidad estudiando la partı́cula sometida a una
fuerza. Veamos el caso de una partı́cula de carga q en un campo electro-
magnético Aµ . Sabemos que la ecuación de movimiento está dada por la
fuerza de Lorentz (6.33):

182
dpα q
= F αβ Uβ (8.19)
dτ c

Seguiremos la rutina habitual, que consiste en proponer un L. Si su ecuación


(8.7) de Euler-Lagrange coincide con (8.19), entonces el L escogido es bueno.
El L buscado debe ser (8.18) más un término que exprese la interacción
partı́cula-campo:

r
m0 c dxµ dxµ
L∼− + término de interacción
γ dτ dτ

La forma prerrelativista L = T − V = T − qφ sugiere que el término de


interacción es parecido a −qφ :

r
m0 c dxµ dxµ
L∼− − qφ ,
γ dτ dτ

y en vista de (8.9):
r
dxµ dxµ
L ∼ −m0 c − qγφ
dτ dτ

E p0
Ahora, como E = mc2 = γm0 c2 , tenemos γ = = . Además
m0 c2 m0 c
φ = A0 , entonces:

r
dxµ dxµ q 0
L ∼ −m0 c − p A0
dτ dτ m0 c

Sin embargo L debe ser un escalar, lo que sugiere que intentemos cambiar
p0 A0 por pµ Aµ :
r
dxµ dxµ q µ
L = −m0 c − p Aµ (8.20)
dτ dτ m0 c

¿Es este L bueno? Para responder esta pregunta debemos averiguar si la


ecuación (8.7) de Euler-Lagrange de este L coincide con (8.19). Veremos en-
seguida que efectivamente (8.20) es una buena escogencia. Para demostrarlo
calculemos todas la derivadas que intervienen en (8.7):

183
∂L q µ
α
=− p Aµ,α (8.21)
dx m0 c

r
∂L ∂ dxµ dxµ q ∂
= − m c − pµ Aµ
dxα dxα 0 dτ dτ m0 c dxα
∂ ∂ ∂
dτ dτ dτ

El primer término del lado derecho ya fue calculado en (8.16); escribimos


entonces:

∂L m0 c dxα q ∂ dxµ
= −r − Aµ
dxα dxµ dxµ dτ c dxα dτ
∂ ∂
dτ dτ dτ dτ
m0 c dxα q
= −r − Aµ ηα µ
dxµdxµ dτ c
dτ dτ
m0 c dxα q
= −r − Aα (8.22)
dxµdxµ dτ c
dτ dτ

Ya podemos colocar (8.21) y (8.22) en (8.7):

d m c dxα q d q µ
− r 0 − Aα = − p Aµ,α (8.23)
dτ dx dxµ dτ
µ c dτ m0 c
dτ dτ

Recordemos, una vez más, lo que decı́amos respecto a la ecuación (8.8):


todos los términos en (8.23) deben calcularse en la trayectoria verdadera.
Entonces, de acuerdo con la fórmula (8.1), la raı́z cuadrada que aparece en
el lado izquierdo de (8.23) es c:

d q d q µ
pα + Aα = p Aµ,α
dτ c dτ m0 c

dpα q dxµ ∂Aα q µ


+ = U Aµ,α
dτ c dτ ∂xµ c

184
dxµ
De nuevo, la derivada debe evaluarse en la trayectoria verdadera, dando
µ

dx
= U µ:

dpα q q
+ U µ Aα,µ = U µ Aµ,α
dτ c c
dpα q¡ ¢ q
= Aµ,α − Aα,µ U µ = Fαµ U µ ,
dτ c c

que coincide con (8.19). Vemos ası́ que (8.20) es una buena escogencia.

Detengámonos un momento para mirar hacia atrás. Primero estudiamos


el problema más simple, que es partı́cula libre; para L propusimos (8.13) y
mostramos que, efectivamente, la ecuación de Euler-Lagrange coincide con
la ecuación de movimiento (8.12). Después pasamos al siguiente nivel de
complejidad, que es la partı́cula sometida a las fuerzas del campo electro-
magnético; para L propusimos (8.20) y mostramos que, efectivamente, la
ecuación de Euler-Lagrange coincide con la ecuación de movimiento (8.19).
En estos dos niveles iniciales hemos podido describir el movimiento de la
partı́cula. Queremos ahora atacar el próximo nivel, que es describir el movimien-
to del campo; es decir, las ecuaciones de evolución del campo, que son las
ecuaciones de Maxwell. El campo Aµ (x) juega el papel de coordenada gener-
alizada. Como hay infinitos eventos x que forman un continuo, hay también
un número infinito de coordenadas Aµ (x) que forman un continuo. Es nece-
sario que desarrollemos la teorı́a lagrangiana para coordenadas continuas,
asunto que atacaremos enseguida.

8.2 Teorı́a lagrangiana para


coordenadas continuas
La formulación lagrangiana no se reduce al estudio de las trayectorias de las
partı́culas, sino que además se aplica a los campos, que son aquellas canti-
dades fı́sicas que son funciones continuas del espacio y del tiempo. Llamemos
ω(t, r) al campo que queremos estudiar: ésta es una función continua de las
coordenadas (t, r) de los eventos del espaciotiempo. Para un r fijo, el campo
ω es una función únicamente de t, función a la que llamamos “la trayectoria
verdadera del campo ω en el punto fijo r”. Al compendiar todos los puntos
r del espacio se crea el concepto de “la trayectoria verdadera de ω en todo el

185
espacio”. Alrededor de ésta podemos imaginar variaciones, trayectorias que
no ocurren realmente. Pensemos ahora en una porción del espaciotiempo
comprendida entre t1 y t2 , y en un volumen V bordeado por una superfi-
cie S. Imaginemos trayectorias variadas, con unas variaciones δω(t, r) que
cumplen estas condiciones de frontera:

δω(t1 , r) = δω(t2 , r) = 0 para todo r (8.24)

δω(t, r) = 0 en S, para todo t (8.25)

El lagrangiano L es el integral de volumen de una densidad lagrangiana L:


Z
L = L d3 x (8.26)
V

L = L(ω(x), ∂µ ω(x)) (8.27)

La acción (8.11) es entonces:

Z t2 Z Z
3
A = L dt d x = L d4 x (8.28)
t1 V

El principio de Hamilton dice que δA = 0 en la trayectoria verdadera. En


vista de (8.28) escribimos:
ZZ
0 = δL dt d3 x (8.29)

ZZ µ ¶
∂L ∂L
= δω + δω,µ dt d3 x
∂ω ∂ω,µ
ZZ µ ¶
∂L ∂L ∂
= δω + δω dt d3 x (8.30)
∂ω ∂ω,µ ∂xµ

En el lado derecho reconocemos que


· ¸
∂L ∂ ∂ ∂L ∂ ∂L
µ
δω = µ
δω − δω µ ,
∂ω,µ ∂x ∂x ∂ω,µ ∂x ∂ω,µ

186
o sea que (8.30) es:

ZZ µ ¶ ZZ · ¸
∂L ∂ ∂L 3 ∂ ∂L
δω − µ dt d x = − δω dt d3 x (8.31)
∂ω ∂x ∂ω,µ ∂xµ ∂ω,µ

Llamemos LD al lado derecho de esta ecuación. Este lado derecho es una


suma de cuatro términos, según µ recorre los valores 0,1,2,3:

Z Z t2 · ¸ Z t2 Z · ¸
∂ ∂L 3 ∂ ∂L
LD = − δω dtd x − a ∂ω
δω d3 x dt
V t1 c ∂t ∂ω,0 t1 V ∂x ,a
(8.32)

En el primer término de (8.32) se ejecuta la integración temporal y (8.24)


dice que el resultado es cero. Del mismo modo, en el segundo término de
(8.32) se ejecuta la integración espacial y (8.25) dice que el resultado es cero.
Vemos ası́ que LD es cero y (8.31) queda:

ZZ µ ¶
∂ ∂L ∂L
δω µ
− dt d3 x = 0
∂x ∂ω,µ ∂ω

Como las variaciones δω son arbitrarias, la cantidad entre paréntesis debe


ser cero:
∂ ∂L ∂L
= (8.33)
∂xµ ∂ω,µ ∂ω

Esta es la ecuación de Euler-Lagrange para un campo ω.

Supongamos que se conoce la ecuación de movimiento de un campo. Para


hacer la formulación lagrangiana se comienza proponiendo una L, en base
a la cual se desarrolla la ecuación (8.33) de Euler-Lagrange. Si el resul-
tado de ese desarrollo coincide con la ecuación de movimiento del campo,
decimos que la escogencia de L fue apropiada. Ası́ se hace para formular
lagrangianamente una ecuación de movimiento dada. En otras ocasiones se
desea construir una teorı́a que tenga ciertas propiedades y se debe comenzar
proponiendo de entrada una L con la simetrı́a deseada. Aquı́ hay cierta dosis

187
de libertad; pero al proponer una densidad lagrangiana se debe verificar que
la L propuesta sea verdaderamente un escalar1 .

8.3 El tensor energı́a-momentum


La formulación lagrangiana conduce a la formulación hamiltoniana y al ten-
sor energı́a-momentum. A continuación veremos que este tensor surge natu-
ralmente en el estudio de las translaciones en el espaciotiempo. Para tal efec-
to debemos demostrar primero que bajo una translación infinitesimal δaµ el
campo ω y su derivada ∂µ ω sufren unas variaciones dadas por δω = (∂ν ω)δaν
y δ∂µ ω = (∂µ ∂ν ω)δaν .

El grupo de las translaciones en el espaciotiempo. Sean p1 y p2 dos


puntos del espacio xyz, y sea b = p2 − p1 . En estos dos puntos, el campo ω
adopta los valores ω(p1 ) y ω(p2 ). Ahora vamos a pensar en una translación
activa de un sistema fı́sico aislado: el sistema fı́sico (el campo), se translada
una cantidad b, mientras permanecen fijos los ejes coordenados y los puntos
p1 y p2 :

El valor del campo en p1 antes de la translación es ω(p1 ).

El valor del campo en p2 antes de la translación es ω(p2 ).

El valor del campo en p2 después de la translación es ω(p1 ).

El valor del campo en p2 ha sufrido un cambio:

ω(p2 ) → ω(p1 ) = ω(p2 − b). En general :

ω(r) → ω(r − b)

Para una translación infinitesimal b = −δa:

ω(r) → ω(r + δa)

En este momento hacemos una generalización a cuatro dimensiones. Cuando


1
Ya vimos que A es escalar; además la ecuación (5.49) dice que el diferencial de volumen
dt d3 x es escalar; la ecuación (8.28) dice entonces que L es escalar.

188
el sistema fı́sico se translada una cantidad constante −δaµ , el valor del campo
en el evento xµ sufre un cambio:

ω(xµ ) → ω(xµ + δaµ ) ,

∂ω
o sea que δω(x) = ω(xµ + δaµ ) − ω(xµ ) = δaν . Más cortamente:
∂xν

δω = (∂ν ω)δaν (8.34)

Esta es la fórmula que nos propusimos demostrar. Ella dice cómo varı́a el
campo bajo la translación; ahora veamos cómo varı́a la derivada del campo.
Tomar derivada ∂µ en ambos lados de(8.34):

∂µ δω = (∂µ ∂ν ω)δaν + (∂ν ω)∂µ δaν

δ∂µ ω = (∂µ ∂ν ω)δaν + (∂ν ω)∂µ δaν (8.35)

Como δaν es constante, queda finalmente:

δ∂µ ω = (∂µ ∂ν ω)δaν (8.36)

Concluye ası́ la tarea preliminar que nos habı́amos propuesto de calcular las
variaciones δω y δ∂µ ω.

El tensor canónico de energı́a y momentum. Enseguida procedemos


a calcular la variación δL ocasionada por una translación infinitesimal δaν .
Calculamos esta δL de dos maneras. La primera es:

∂L ν
δL = δa (8.37)
∂xν

y la segunda manera es con la regla de la derivación en cadena:

∂L ∂L
δL = δω + δ∂µ ω (8.38)
∂ω ∂∂µ ω

189
En el primer término del lado derecho utilizar la ecuación (8.33):

µ ¶
∂L ∂L
δL = ∂µ δω + δ∂µ ω
∂∂µ ω ∂∂µ ω

Ahora usamos (8.34) y (8.36):

·µ ¶ ¸
∂L ∂L
δL = ∂µ ∂ν ω + ∂µ ∂ν ω δaν
∂∂µ ω ∂∂µ ω
µ ¶
∂L
= ∂µ ∂ν ω δaν
∂∂µ ω
µ ¶
∂L
= ∂µ ω,ν δaν (8.39)
∂ω,µ

Igualamos los lados derechos de (8.37) y (8.39):

µ ¶
∂L
∂µ ω,ν δaν = (∂ν L) δaν
∂ω,µ

Es decir:
· µ ¶ ¸
∂L µ
∂µ ω,ν −η ν ∂µ L δaν = 0
∂ω,µ

Ahora, como las δa son arbitrarias, la cantidad entre paréntesis debe ser
cero:
µ ¶
∂L
∂µ ω,ν − η µ ν ∂µ L = 0
∂ω,µ
µ ¶
∂L µ
∂µ ω,ν − η ν L = 0 (8.40)
∂ω,µ
µ ¶
∂L ,ν µν
∂µ ω −η L = 0
∂ω,µ

190
La última ecuación se escribe

µν
∂µ Tcan = 0, (8.41)

con
µν ∂L ,ν
Tcan (x) = ω − η µν L (8.42)
∂ω,µ

Este T µ ν se llama el tensor canónico de energı́a-momentum, y por esta razón


escribimos el subı́ndice “can”.

La ecuación (7.21) nos indicó cuáles son las cuatro cantidades que se conser-
van cuando la divergencia del tensor energı́a-momentum es cero. En nuestro
caso el tensor canónico también tiene divergencia cero, y en consecuencia
las cuatro cantidades conservadas son:
Z

Tcan (x) d3 x

Las cuatro cantidades que hay dentro del integrando dan las densidades de
energı́a y de momentum:

00 ∂L
H = Tcan = ω̇ − L
∂ ω̇

− 1 0a ∂L − →
P = Tcan = − ∇ω
c ∂ ω̇

Aquı́, ω̇ = ∂ω/∂t. La conservación de energı́a-momentum es consecuencia del


aislamiento del sistema. Para un sistema que interactúa con el exterior, la L
no es como en (8.27), sino L = L(x, ω, ω,µ ). Que L dependa explı́citamente
de x agrega algunos términos en las ecuaciones que hemos escrito, y al final,
en vez de la ecuación (8.40) resulta:

µ ¶
∂L µ
∂µ ω,ν − η ν L 6= 0 ,
∂ω,µ

191
o sea que no hay divergencia nula ni conservaciones. Pero regresemos al
sistema aislado, para el cual la divergencia del tensor canónico es cero (se
conservan la energı́a y el momentum).

Tensor simétrico, tensor asimétrico. Nótese en la definición (8.42) que


los ı́ndices µ y ν intervienen disparejamente, o sea que el tensor canónico
µν
Tcan no es necesariamente simétrico bajo el intercambio de µ y ν. De he-
µν νµ
cho, en algunos problemas ocurre que Tcan = Tcan y en otros ocurre que
µν νµ
Tcan 6= Tcan . Esto es preocupante ya que, como decı́amos en la página 175,
necesitamos tensores energı́a-momentum que sean simétricos. En aquellos
µν νµ µν
problemas felices en los que Tcan = Tcan , el Tcan es satisfactorio. Pero si en
µν νµ µν
algún problema resulta que Tcan 6= Tcan , entonces Tcan es insatisfactorio y se
µν µν
necesita encontrar otro tensor θ que sı́ sea satisfactorio. El Tcan asimétrico
µν
debe ser “simetrizado”. Se trata de apoyarse en Tcan para construir otro
tensor de energı́a-momentum θµν que sea satisfactorio, es decir, que cumpla
estas dos condiciones:

∂µ θµν = 0
(8.43)
θµν = θνµ

µν
¿Cómo construir θµν a partir de Tcan ? No hay una regla que sirva para
µν
todos los casos; pero en un primer intento podemos sumarle a Tcan un nuevo
tensor, aun desconocido, que llamamos B µν :

θµν = Tcan
µν
+ B µν (8.44)

Se trata de averiguar el tensor desconocido B µν . Para tal efecto vamos a


colocar la θµν de la ecuación (8.44) en las dos ecuaciones (8.43). Al poner
µν
(8.44) en la primera de las condiciones (8.43) se obtiene ∂µ Tcan + ∂µ B µν = 0
y, en vista de (8.41) concluimos que

∂µ B µν = 0 (8.45)

Ahora, utilizando la ecuación (8.44) en la segunda de las condiciones (8.43)


µν νµ
llegamos a Tcan + B µν = Tcan + B νµ , es decir:

192
B µν − B νµ = Tcan
νµ µν
− Tcan (8.46)

µν
En conclusión: cuando Tcan resulta asimétrico, debemos construir un nuevo
tensor energı́a-momentum θ satisfactorio, es decir, un θµν que cumpla las
µν
µν
condiciones (8.43). Se propone θµν = Tcan + B µν . La incógnita B µν debe
cumplir las ecuaciones (8.45) y (8.46). La próxima sección muestra cómo se
µν
simetriza el Tcan del campo electromagnético.

8.4 Formulación lagrangiana del


campo electromagnético
El campo electromagnético nos ofrece una oportunidad para ilustrar con
un ejemplo las ideas que hemos desarrollado acerca de la formulación la-
grangiana de los campos. Comenzamos, como es costumbre, proponiendo
una densidad lagrangiana L tal que sus ecuaciones de Euler-Lagrange co-
incidan con las ecuaciones de movimiento, que en este caso son las cua-
tro ecuaciones de Maxwell (6.1-6.2). Ya vimos sin embargo, en la página
150, que la definición Fµν = Aν ,µ − Aµ,ν garantiza que las dos ecuaciones
homogéneas de Maxwell se satisfagan automáticamente. Entonces la única
tarea que debe cumplir L es reproducir a las dos ecuaciones inhomogéneas,
condensadamente escritas en la fórmula (6.31). Proponemos:

1 1
L=− Fαβ F αβ − Jα Aα (8.47)
16π c

Calculemos los términos que intervienen en la ecuación (8.33) de Euler-


Lagrange. El campo es Aσ :

∂L 1 ∂
=− F αβ Fαβ
∂Aσ,µ 16π ∂Aσ,µ
µ ¶
1 ∂Fαβ ∂F αβ
=− F αβ + Fαβ
16π ∂Aσ,µ ∂Aσ,µ
µ ¶
1 ∂Fαβ ∂Fαβ αβ
=− F αβ + F
16π ∂Aσ,µ ∂Aσ,µ
1 αβ ∂Fαβ
=− F
8π ∂Aσ,µ

193
∂L 1 αβ ∂
= − F (Aβ ,α − Aα,β )
∂Aσ,µ 8π ∂Aσ,µ
1 αβ σ µ
= − F (η β η α − η σ α η µ β )

1
= − (F µσ − F σµ )

∂L 1 µσ
= − F (8.48)
∂Aσ,µ 4π

De otro lado:
∂L 1
= − J σ,
∂Aσ c

entonces la ecuación (8.33) de Euler-Lagrange es:

1 1
− ∂µ F µσ = − J σ , (8.49)
4π c

que coincide con la ecuación (6.31) que querı́amos obtener. Vemos ası́ que
(8.47) es una buena densidad lagrangiana. Nos interesa particularmente el
campo de radiación en el vacı́o, donde Jα es cero; en este caso la ecuación
(8.47) da
1
L=− Fαβ F αβ : radiación libre (8.50)
16π

µν
El tensor canónico Tcan . Vamos a calcular el tensor canónico de energı́a-
momentum, usando la fórmula (8.42), que en nuestro caso es:

∂L
µν
Tcan = Aσ ,ν − η µν L (8.51)
∂Aσ,µ

En el lado derecho usamos (8.48) y (8.50):

µν 1 µ σ,ν 1 µν
Tcan =− F σA + η Fαβ F αβ (8.52)
4π 16π

194
Por las razones que expusimos en la página 175 es importante que inves-
µν
tiguemos si Tcan es simétrico o asimétrico; esto se resuelve calculando la
νµ µν
diferencia entre Tcan y Tcan :

νµ µν 1 µ σ,ν 1 ν σ,µ
Tcan − Tcan = F σA − F σA 6= 0 (8.53)
4π 4π

O sea que el tensor canónico es asimétrico. Vamos a remediar este defecto


µν
añadiéndole a Tcan una cantidad B µν , como en (8.44). La nueva cantidad
debe cumplir las condiciones (8.45) y (8.46). Detengámonos inicialmente en
la condición (8.46), que en vista de (8.53) es:

1 µ σ,ν 1 ν σ,µ
B µν − B νµ = F σA − F σA (8.54)
4π 4π
1 µ 1 ν
= F σ (Aσ,ν − Aν ,σ + Aν ,σ ) − F σ (Aσ,µ − Aµ,σ + Aµ,σ )
4π 4π
1 µ 1 ν
= F σ (F νσ + Aν ,σ ) − F σ (F µσ + Aµ,σ )
4π 4π
1 µ ν ,σ 1 ν µ,σ
= F σA − F σA (8.55)
4π 4π

Esto sugiere que probemos, tentativamente, la siguiente propuesta:

1 µ ν ,σ
B µν = F σA (8.56)

1 µσ 1 1
= F ∂σ Aν = ∂σ (F µσ Aν ) − (∂σ F µσ )Aν
4π 4π 4π

En el último término del lado derecho usar la ecuación (7.26):

1 1
B µν = ∂σ (F µσ Aν ) + J µ Aν (8.57)
4π c

y en el vacı́o se tiene J µ = 0:

1
B µν = ∂σ (F µσ Aν ) (8.58)

195
Esto es lo que se obtiene al imponer la condición (8.46). Debemos todavı́a
ponerle atención a la condición (8.45). El intento (8.56) es bueno si esa B µν
cumple la condición (8.45). Veamos que efectivamente la cumple, aplicando
la derivada ∂µ en ambos lados de (8.58):

1
∂µ B µν = ∂µ ∂σ (F µσ Aν )

El lado derecho es cero, porque es la contracción total de un tensor simétrico


con otro antisimétrico (véase la ecuación (5.38)). Es claro entonces que la
escogencia (8.56) es adecuada. Ya estamos en condición de colocar (8.52) y
(8.56) en (8.44):

1 µ σ,ν 1 µν 1 µ ν ,σ
θµν = − F σA + η Fαβ F αβ + F σA
4π 16π 4π
1 µν 1 µ
= η Fαβ F αβ − F σ (Aσ,ν − Aν ,σ )
16π 4π
1 µν 1 µ νσ
= η Fαβ F αβ − F σF
16π 4π

He aquı́ la respuesta final:

1 µν 1 µσ ν
θµν = η Fαβ F αβ − F F σ (8.59)
16π 4π
1 µ 1 µσ
θµ ν = η ν Fαβ F αβ − F Fνσ
16π 4π

En forma matricial, los tensores θµν y θµ ν son:

196
 1 2

2 (E + B2) (E × B)x (E × B)y (E × B)z
 
 
 1 2 
 (E + B 2 ) −Ex Ey −Ex Ez 
 (E × B)x 2 
 −Bx By −Bx Bz 
 −Ex2 − Bx2 
 
 
 
1  1 2 
θµν =  −Ex Ey (E + B 2 ) −Ey Ez 
4π 
 (E × B)y 2 

 −Bx By −Ey2 − By2 −By Bz 
 
 
 
 1 2 2 
 −Ex Ez −Ey Ez (E + B ) 
 (E × B)z 2 
 −Bx Bz −By Bz 2

2 
 −Ez − Bz

 1 2

2 (E + B2) −(E × B)x −(E × B)y −(E × B)z
 
 
 1 
 − (E 2 + B 2 ) Ex Ey Ex Ez 
 (E × B)x 2 
 +Bx By +Bx Bz 
 +Ex2 + Bx2 
 
 
 
1  1 
θµ ν =  Ex Ey − (E 2 + B 2 ) Ey Ez 
4π 
 (E × B)y 2 

 +Bx By +Ey2 + By2 +By Bz 
 
 
 
 1 2 

 (E × B)z
Ex Ez Ey Ez − (E + B 2 ) 

 2 
 +Bx Bz +By Bz 2 2 
+Ez + Bz

197
198
Capı́tulo 9

Transformaciones generales
de coordenadas

Cuando dedujimos las transformaciones de Lorentz nos dimos cuenta de que,


si querı́amos usar coordenadas cartesianas (t, x, y, z), las ecuaciones debı́an
ser lineales, y ası́ lo establecimos en la página 21. Para el estudio de la
relatividad general es necesario salirse de las ecuaciones lineales y abordar
las transformaciones generales de coordenadas. Este capı́tulo, que a eso se
dedica, pretende dar las bases matemáticas necesarias para la formulación
de la teorı́a general de la relatividad, de Einstein. Comenzamos definiendo
los espacios de Riemann. Decimos que un espacio (con coordenadas xµ ) es
riemanniano si se cumplen las siguientes tres condiciones:

• Existe una forma fundamental gµν dxµ dxν que es invariante bajo trans-
formaciones generalizadas de coordenadas.
• Todas las segundas derivadas de gµν existen y son continuas.
• El determinante de gµν no es cero.

9.1 Subı́ndices y superı́ndices


La forma fundamental gµν dxµ dxν se llama intervalo, y la denotamos (ds)2 :

(ds)2 = gµν dxµ dxν , (9.1)

donde los n2 coeficientes gµν son, en general, funciones de las coordenadas


xα . Estos coeficientes forman una matriz n×n que es simétrica. Para probar
que es simétrica notemos que si en (9.1) intercambiamos los nombres de
los ı́ndices mudos µ y ν obtenemos (ds)2 = gνµ dxν dxµ = gνµ dxµ dxν . Al

199
comparar esto con (9.1) concluimos que gµν = gνµ . Hay otra matriz muy
importante que es la identidad, que denotamos por medio del sı́mbolo δ µ ν .
Ahora definimos la matriz g µα como la inversa de gαν :

g µα gαν = δ µ ν (9.2)

A partir de las n cantidades dxν y la matriz gµν definimos otras n cantidades


dxµ de la manera siguiente:

dxµ = gµν dxν (9.3)

Ahora, si multiplicamos ambos lados de esta ecuación por g ξµ y utilizamos


la ecuación (9.2) encontramos g ξµ dxµ = δ ξ ν dxν , es decir:

dxξ = g ξµ dxµ (9.4)

Las ecuaciones (9.3) y (9.4) indican que g µν sirve para “subir” un subı́ndice
y gµν sirve para“bajar” un superı́ndice. Los ı́ndices se pueden bajar y subir
no sólo en dxα y en dxα , sino además en cualquier otra cantidad, como por
ejemplo:
Cµ = gµν C ν C µ = g µν Cν

Aα β γ = gνβ Aανγ Aαβγ = g νβ Aα ν γ

Claramente podemos usar a g µα para subir un ı́ndice en gαν , ası́: g µα gαν =


gµν = δµν :

gµν = δµν gµ ν = δµ ν

Cuando un ı́ndice aparece una sola vez en un término, decimos que es libre.
Por ejemplo, en B µ Cν los ı́ndices µ y ν son libres. Si una misma letra aparece
dos veces en un término, como superı́ndice y como subı́ndice, decimos que
se trata de ı́ndices contraı́dos. Por ejemplo, en B µ Cµ los ı́ndices µ están
contraı́dos.

Si multiplicamos ambos lados de la ecuación Aµ ν = B µ Cν por gµσ obten-


emos Aσν = Bσ Cν . Ası́ mismo, al multiplicar ambos lados de Aµ ν = B µ Cν

200
por g νσ obtenemos Aµσ = B µ C σ . Finalmente, si multiplicamos ambos lados
de Aµσ = B µ C σ por gµν se obtiene Aν σ = Bν C σ . En conclusión, todas estas
ecuaciones son equivalentes: Aµ ν = B µ Cν , Aµν = Bµ Cν , Aµν = B µ C ν y
Aµ ν = Bµ C ν . Vemos ası́ que dos ı́ndices libres e iguales en ambos lados de
una ecuación se pueden subir o bajar.

Reunamos las formas diferentes que conocemos de escribir la ecuación del


intervalo (9.1):

(ds)2 = g µν dxµ dxν = gµν dxµ dxν = dxµ dxµ

Ejemplo: En el plano podemos usar coordenadas cilı́ndricas (r, ϕ) , que


llamaremos (x1 , x2 ) . El intervalo es (ds)2 = (dx1 )2 + r2 (dx2 )2 , que escribi-
mos sugestivamente ası́:

(ds)2 = dx1 dx1 + (x1 )2 dx2 dx2 + 0 dx1 dx2 + 0 dx2 dx1

y al comparar esto con (9.1) identificamos las cuatro entradas de la matriz


gαβ :
" #
1 0
gαβ = (9.5)
0 (x1 )2

Fácilmente calculamos el inverso de esta matriz, y la llamamos g αβ :

" #
1 0
g αβ = ¡ ¢2 (9.6)
0 1/x1

Finalmente, las componentes (x1 , x2 ) se calculan usando las fórmulas (9.3)


y (9.5), para obtener (x1 , (x1 )2 x2 ) = (r, r2 ϕ)

La derivada tiene una notación muy compacta:

∂ ∂
∂µ = = gµν ∂ ν ∂µ = = g µν ∂ν
∂xµ ∂xµ

201
9.2 Transformaciones generales
Hemos dicho que xν son las coordenadas de un punto del espacio en un sis-
tema de coordenadas no primado. Ahora, si se usa otro sistema de coorde-
nadas, el mismo punto tendrá coordenadas x0ν . Cada una de las coordenadas
primadas x0µ debe ser función de las no primadas xν :

x0µ = x0µ (xν ) (9.7)

¿Son estas funciones lineales o no lineales? Para responder esta pregunta


continuemos el ejemplo de la sección anterior, pensando ahora en la trans-
formación que lleva de coordenadas cilı́ndricas (r, ϕ) a coordenadas carte-
sianas (x, y) . Llamando (x1 , x2 ) a las coordenadas cilı́ndricas y (x01 , x02 ) a
las cartesianas, podemos escribir la transformación entre los dos sistemas
coordenados:

x01 = x1 cos x2 ; x02 = x1 sen x2 (9.8)

Notemos que ∂x01 /∂x1 = cos x2 , ∂x01 /∂x2 = −x1 sen x2 , ∂x02 /∂x1 = sen x2 ,
y ∂x02 /∂x2 = x1 cos x2 . Queremos resaltar un asunto de primera importan-
cia: las derivadas ∂x0µ /∂xν no son constantes, lo que marca una diferencia
fundamental con las transformaciones lineales discutidas en la sección 5.2.
Este ejemplo pone de presente la importancia de las transformaciones no
lineales. Las transformaciones no lineales son interesantes desde un punto
de vista matemático, pero también desde un punto de vista fı́sico, asunto
que se hace evidente cuando se desea generalizar la relatividad especial, co-
mo veremos enseguida:

En la relatividad especial se trata de observadores inerciales. Si queremos


generalizar esta teorı́a debemos pensar en la transformación que lleva de un
observador inercial a otro observador acelerado. Pensemos en un observador
primado que tiene aceleración a en dirección z respecto al no primado; en
relatividad galileana y en notación standard, la transformación serı́a:

1
z 0 = z − (v0 t + at2 ) ,
2

de donde vemos que ∂z 0 /∂t = −v0 − at 6= constante. Esto muestra que aún

202
para generalizar la más simple de las relatividades, como es la de Galileo,
es preciso utilizar transformaciones no lineales, i.e., aquellas en las que las
derivadas ∂x0µ /∂xν no son constantes. Vemos ası́ plenamente justificado este
capı́tulo, dedicado a las transformaciones generales de coordenadas. En este
contexto de las transformaciones generalizadas de coordenadas se definen
los vectores:

9.3 Los vectores


Tomando diferenciales en ambos lados de la ecuación (9.7) encontramos

∂x0µ ν
dx0µ = dx (9.9)
∂xν

Una de las piezas más importantes en la teorı́a de transformaciones gener-


alizadas de coordenadas es el vector dxµ . Entre dos puntos infinitamente
próximos la diferencia de coordenadas no primadas es dxµ y la diferencia de
coordenadas primadas es dx0µ . Lo importante es que conociendo las compo-
nentes no primadas del vector (que son las dxµ ) podemos llegar a conocer las
componentes primadas del vector (que son las dx0µ ) por medio de la fórmula
(9.9).

Pensemos enseguida en un conjunto de cuatro cantidades que en las co-


ordenadas no primadas aparecen como Aµ , mientras que en las coordenadas
primadas aparecen como A0µ . Nosotros no podemos asegurar de antemano
cuál es la relación entre las A0µ y las Aµ . Pero si ocurre que

∂x0µ ν
A0µ = A , (9.10)
∂xν

entonces decimos que A es un vector.

dxµ es, por definición, el vector prototipo. Comparando (9.10) con (9.9)
nos damos cuenta de que A transforma como dx , porque en ambas ecua-
∂x0µ
ciones se usan los mismos coeficientes . Decimos que A es un vector
∂xν
porque transforma como el vector prototipo (obsérvese que uno no prueba
que dx es un vector). El concepto de vector aparece inseparablemente ligado
al concepto de las transformaciones de coordenadas. Que A sea un vector

203
no es una propiedad intrı́nseca de A; no podemos decir que A es un vector
por sı́ sólo, sino que el carácter vectorial de A es una propiedad que tiene
A en referencia a la transformación de coordenadas xµ → x0µ . No cualquier
conjunto de n cantidades, aunque se rotulen con ı́ndices, es un vector.

Invitamos al lector a regresar a la sección 5.2, y en particular al paso que se


da entre las ecuaciones (5.14) y (5.15). Ese paso es inválido en las transfor-
maciones generales, o sea que, en vez de las ecuación (5.15), debemos ahora
escribir:
∂x0µ ν
x0µ 6= x Transf. generales (9.11)
∂xν

Comparando las ecuaciones (9.9) y (9.11) nos damos cuenta de que xν no


transforma como el vector prototipo dxν . Entonces xν no es un vector bajo
el grupo de las transformaciones generales de coordenadas. Aunque sı́ es vec-
tor bajo el grupo de las transformaciones lineales. Vemos que un conjunto
de n cantidades puede ser vector respecto a un grupo de transformaciones,
y no serlo respecto a otro grupo; de esta manera confirmamos la afirmación
que hicimos arriba, en el sentido de que el carácter vectorial de una cantidad
no es una propiedad exclusiva de esa cantidad, en sı́ misma, sino que además
se refiere a un grupo de transformaciones.

El vector dx se caracteriza por sus n componentes contravariantes dx0 ,


dx1 , dx2 , dx3 · ··, pero también se puede caracterizar por sus n componentes
covariantes dx0 , dx1 , dx2 , dx3 · · · . La fórmula (9.3) dice cómo se construyen
las cantidades dxµ , y también cómo se construyen las cantidades Aµ :

Aµ = gµν Aν

Decimos entonces que todo vector A se caracteriza por sus n componentes


contravariantes A0 , A1 , A2 , A3 · ··, y también se puede caracterizar por sus
n componentes covariantes A0 , A1 , A2 , A3 · · · .

Transformación de las componentes Aµ . Hemos visto que las compo-


nentes contravariantes Aµ transforman según (9.10), y debemos averiguar
de qué manera transforman las componentes covariantes Aµ . Para tal efec-
to es preciso deducir antes una identidad importante. Hemos dicho que el
intervalo (ds)2 es un escalar, es decir, da lo mismo en todos los sistemas

204
0 dx0 µ dx0 ν .
coordenados; entonces la ecuación (9.1) dice que gµν dxµ dxν = gµν
Esta ecuación es, obviamente,

λ ρ
gµν dxµ dxν = gλρ
0
dx0 dx0 (9.12)

Entonces, utilizando la ecuación (9.9):

∂x0λ ∂x0ρ µ ν
gµν dxµ dxν = gλρ
0
dx dx ;
∂xµ ∂xν

reunir todo en el lado izquierdo:


µ 0λ 0ρ

0 ∂x ∂x
gµν − gλρ dxµ dxν = 0
∂xµ ∂xν

Como esta ecuación debe ser válida para todos los valores de dxµ , la cantidad
dentro del paréntesis debe ser cero:

0 ∂x0λ ∂x0ρ
gλρ = gµν (9.13)
∂xµ ∂xν

Ahora multiplicar ambos lados de esta ecuación por g νπ y utilizar la ecuación


(9.2):
∂x0λ νπ 0 ∂x0ρ
g gλρ = δµ π (9.14)
∂xµ ∂xν

De otro lado es claro que, como las coordenadas xπ son independientes,


entonces ∂xπ /∂xµ = δµ π . Ahora, la regla de la derivación en cadena dice
que esta ecuación es igual a:

∂x0λ ∂xπ
= δµ π (9.15)
∂xµ ∂x0λ

Igualemos entonces los lados izquierdos de las ecuaciones (9.14) y (9.15):

∂x0λ νπ 0 ∂x0ρ ∂x0λ ∂xπ


g gλρ = ,
∂xµ ∂xν ∂xµ ∂x0λ

205
∂xµ
y multipliquemos ambos lados de esta ecuación por :
∂x0ω

∂xµ ∂x0λ νπ 0 ∂x0ρ ∂xµ ∂x0λ ∂xπ


g gλρ = (9.16)
∂x0ω ∂xµ ∂xν ∂x0ω ∂xµ ∂x0λ

∂xµ ∂x0λ
En ambos lados de esta ecuación aparece el factor ; la regla de
∂x0ω ∂xµ
∂xµ ∂x0λ ∂x0λ
la derivación en cadena dice que = = δω λ , o sea que la
∂x0ω ∂xµ ∂x0ω
ecuación (9.16) es

∂x0ρ ∂xπ
δω λ g νπ gλρ
0
= δω λ
∂xν ∂x0λ
∂x0ρ ∂xπ
g νπ gωρ
0
= (9.17)
∂xν ∂x0ω

Esta es la ecuación importante que querı́amos deducir. Ahora multiplicar


ambos lados por Aπ :

0 ∂x0ρ ν ∂xπ
gωρ A = Aπ
∂xν ∂x0ω

En el lado izquierdo utilizamos la ecuación (9.10) para obtener:

0 ∂xπ
gωρ A0ρ = Aπ ,
∂x0ω

o sea que, finalmente:


∂xπ
A0ω = Aπ (9.18)
∂x0ω

Este es el modo como transforman las componentes covariantes de cualquier


vector A . Por supuesto que las componentes dxµ transforman de la misma
manera:
∂xπ
dx0ω = dxπ (9.19)
∂x0ω

206
9.4 Otros tensores
Pasemos a estudiar la estructura Aµ B ν , cuando A y B son vectores. De
acuerdo con la regla de transformación (9.10), las componentes contravari-
antes de A y B transforman ası́: A0µ = (∂x0µ /∂xα )Aα y B 0ν = (∂x0ν /∂xβ )B β .
Multipliquemos lado a lado estas dos ecuaciones para obtener:

∂x0µ ∂x0ν α β
A0µ B 0ν = A B
∂xα ∂xβ

Comparando con esta fórmula, pasamos a definir lo que es un tensor de


rango 2, de este modo: T es un tensor de rango 2 si

∂x0µ ∂x0ν αβ
T 0µν = T (9.20)
∂xα ∂xβ

Las componentes contravariantes de T transforman como Aµ B ν ; de la mis-


ma manera, las componentes covariantes de T transforman como Aµ Bν :

0 ∂xα ∂xβ
Tµν = Tαβ , (9.21)
∂x0µ ∂x0ν

y las componentes mixtas transforman como Aµ Bν :

∂x0µ ∂xβ α
T 0µ ν = T β, (9.22)
∂xα ∂x0ν

y como Aµ B ν :

∂xα ∂x0ν
T0 µ ν = Tα β (9.23)
∂x0µ ∂xβ

Generalizamos diciendo que los tensores de rango j tienen j ı́ndices. Los


tensores de rango 0 reciben el nombre de escalares, y los de rango 1 se
llaman vectores. Algunas de las componentes de un tensor C de rango 3
transforman ası́:

207
∂x0µ ∂x0ν ∂x0δ αβγ
C 0 µνδ = C
∂xα ∂xβ ∂xγ
∂xα ∂xβ ∂xγ
C 0 µνδ = Cαβγ
∂x0µ ∂x0ν ∂x0δ
∂xα ∂x0ν ∂xγ
C0 µ ν δ = Cα β γ
∂x0µ ∂xβ ∂x0δ

Finalmente, un tensor de rango 4:

∂x0µ ∂x0ν ∂x0σ ∂xγ αβλ


A0µνσ ρ = A γ (9.24)
∂xα ∂xβ ∂xλ ∂x0ρ

Las transformaciones inversas: Hasta el momento hemos presentado


la manera de averiguar las componentes primadas de un tensor en términos
de las no primadas. El camino inverso -las no primadas en términos de las
primadas- es muy fácil. Multiplicando ambos lados de la ecuación (9.10) por
∂xα
se llega a:
∂x0µ

∂xα 0µ ∂xα ∂x0µ ν ∂xα ν


A = A = A = δ α ν Aν = Aα
∂x0µ ∂x0µ ∂xν ∂xν

Reescribamos esto:

∂xµ 0ν
Aµ = A . Ası́ mismo:
∂x0ν
∂x0ν 0
Aµ = A
∂xµ ν

Esto para tensores de rango 1. Para los de rango 2:

∂xµ ∂xν 0αβ


T µν = T
∂x0α ∂x0β
∂x0α ∂x0β 0
Tµν = T (9.25)
∂xµ ∂xν αβ
∂xµ ∂x0β 0α
Tµ ν = T β
∂x0α ∂xν

208
ν ∂x0α ∂xν 0 β
T µ = T
∂xµ ∂x0β α

Y los de rango 3:

∂xµ ∂xν ∂xδ 0αβγ


C µνδ = C
∂x0α ∂x0β ∂x0γ
∂x0α ∂x0β ∂x0γ 0
C µνδ = C
∂xµ ∂xν ∂xδ αβγ
∂x0α ∂xν ∂x0γ 0 β
Cµνδ = C γ
∂xµ ∂x0β ∂xδ α

La importancia del vector dxµ : Gran parte de la estructura de los


tensores se fundamenta en el vector prototipo dxµ . En efecto: 1) En la
ecuación (9.10) hemos definido los vectores, en general, por comparación
con dxµ y, 2) en esta sección hemos construido tensores de rangos 0, 2, y 3 a
partir de vectores. En general, un tensor de rango j > 0 transforma ası́ como
transforma el producto de j vectores.

Contracción de ı́ndices: Estudiemos la estructura Aµ Bµ , cuando A y B


son vectores. Usando las reglas de transformación (9.10) y (9.18) escribimos

∂x0µ ∂xβ α
A0µ B 0 µ = A Bβ ,
∂xα ∂x0µ

∂x0µ ∂xβ
Ahora, = δα β , entonces
∂xα ∂x0µ

A0µ B 0 µ = Aµ Bµ (9.26)

En palabras, el producto Aµ Bµ es, en general, invariante. El ejemplo más


importante es el intervalo dxµ dxµ .

Probemos que si A es un tensor de rango 4, entonces A0µνρ ρ es un ten-


sor de rango 2. En efecto, si hacemos σ = ρ en la ecuación (9.24) obtenemos
∂x0µ ∂x0ν ∂x0ρ ∂xγ αβλ ∂x0ρ ∂xγ
A0µνρ ρ = A γ . Pero = δλ γ , entonces
∂xα ∂xβ ∂xλ ∂x0ρ ∂xλ ∂x0ρ

209
∂x0µ ∂x0ν αβλ
A0µνρ ρ = A λ,
∂xα ∂xβ

que es la forma como transforman los tensores de rango 2, de acuerdo con


la ecuación (9.20). En general, la contracción de dos ı́ndices en un tensor de
rango j produce un tensor de rango j − 2.

δ de Kronecker. Probemos que δµ ν es un tensor. Para tal efecto comen-


∂x0ν
zamos escribiendo δµ0 ν = y luego usamos la regla de la derivación en
∂x0µ
cadena:
ν ∂x0ν ∂x0ν ∂xα ∂x0ν ∂xβ α
δµ0 = = = δβ ,
∂x0µ ∂xα ∂x0µ ∂xα ∂x0µ

que es ciertamente el modo como transforman los tensores de rango 2, de


acuerdo con ecuación (9.23).

El tensor métrico. Al comparar las ecuaciones (9.13) y (9.25) nos damos


cuenta de que gµν transforma como un tensor. Esto significa que gµν es
un tensor. Se llama el tensor métrico y es de primera importancia porque
contiene toda la información acerca de la geometrı́a del espacio.

Tensores simétricos y antisimétricos: Con la ecuación (9.20) se prue-


ba fácilmente que si T µν es un tensor simétrico en unas coordenadas, tam-
bién será simétrico en cualquier otro sistema coordenado. Y si F µν es anti-
simétrico en unas coordenadas, también será antisimétrico en todos los otros
sistemas coordenados:

T µν = T νµ ⇔ T 0µν = T 0νµ
(9.27)
F µν = −F νµ ⇔ F 0µν = −F 0νµ

9.5 La derivada
Veamos la derivada del vector A0µ ; empezamos usando la regla de la derivación
en cadena y luego utilizamos la ecuación (9.10):

∂A0ν ∂xα ∂
= A0ν (9.28)
∂x0µ ∂x0µ ∂xα

210
∂xα ∂ ∂x0ν β
= A (9.29)
∂x0µ ∂xα ∂xβ

∂xα ∂x0ν ∂Aβ ∂xα ∂ 2 x0ν


= + Aβ
∂x0µ ∂xβ ∂xα ∂x0µ ∂xα ∂xβ

Escribamos de nuevo la última ecuación con notación ∂µ :

∂xα ∂x0ν ∂xα ∂ 2 x0ν


∂µ0 A0ν = ∂α Aβ
+ Aβ (9.30)
∂x0µ ∂xβ ∂x0µ ∂xα ∂xβ

Observemos bien el lado derecho de esta ecuación. Si el segundo término


fuera cero, quedarı́a claramente la ley de transformación de los tensores
de rango dos, de acuerdo con la ecuación (9.23). Pero en el grupo de las
transformaciones generalizadas de coordenadas ese segundo término no es
cero, de donde concluimos que la derivada de un vector no es un tensor:

En general, la derivada ∂µ
(9.31)
no es una operación covariante

Esta regla (9.31) tiene dos excepciones importantes: La primera es cuando el


tensor es de rango 0; en este caso ∂µ sı́ es covariante. En efecto, sigamos de
nuevo los pasos que llevaron de (9.28) a (9.30), pero esta vez con un escalar
φ , para obtener ∂µ φ = ∂µ0 φ0 :

La derivada de un escalar
(9.32)
sı́ es una operación covariante

La segunda excepción de la regla (9.31) ocurre con las transformaciones lin-


∂ 2 x0ν
eales. Es claro que en este caso las segundas derivadas son cero y, en
∂xα ∂xβ
consecuencia el segundo término en el lado derecho de (9.30) es cero, quedan-
do limpiamente la transformación de los tensores de rango 2, de acuerdo con
(9.23). La más importante de las transformaciones lineales es la de Lorentz
y, tal como se recuerda, allı́ la derivada de un tensor sı́ era un tensor (véase
el paso de la ecuación (5.42) a la (5.43)).

211
Existe una notación concisa para la derivada, y es a través de la coma.
El uso se aclara con los siguientes ejemplos:

∂Aµ ∂A0µ ∂F αβ
Aµ,ν = A0µ,ν = F αβ ,ν =
∂xν ∂x0ν ∂xν

Para mostrar que la derivada de un vector no es una operación covariante


hemos seguido unos cálculos similares a los de la página 134, y lo hemos
hecho ası́ para mostrar el contraste entre las transformaciones lineales y las
generales. Pero la falta de covariancia radica en un nivel más profundo: es
el diferencial dAµ el que carece de covariancia. Para ver esto en detalle, y
corriendo el riesgo de repetir un argumento que se ha presentado ya, usemos
de nuevo la regla de la derivación en cadena para calcular dA0µ , ası́:

∂A0µ 0σ ∂A0µ ∂xν ∂A0µ ν


dA0µ = dx = dx0σ
= dx
∂x0σ ∂xν ∂x0σ ∂xν

∂A0µ ν
Es decir, dA0µ = dx :
∂xν


dA0µ = (A0µ ) dxν
∂xν
µ 0µ ¶
∂ ∂x
= A dxν
π
∂xν ∂xπ

∂ 2 x0µ π ν ∂x0µ ∂Aπ ν


= A dx + dx
∂xν ∂xπ ∂xπ ∂xν
∂ 2 x0µ π ν ∂x0µ
= A dx + dAπ
∂xν ∂xπ ∂xπ

∂ 2 x0µ
Si, en el último renglón, las segundas derivadas fueran cero, quedarı́a
∂xν ∂xπ
∂x0µ
dA0µ = dAπ , que es la regla de transformación de los vectores: en
∂xµπ
tal caso dA serı́a un vector. Pero esas segundas derivadas no son cero en
las transformaciones generalizadas de coordenadas, y concluimos que en las
transformaciones generales el diferencial dAµ no es un vector: en general, el
diferencial de un tensor no es un tensor.

212
La derivada es una operación de primera importancia en la fı́sica, como lo
muestra el hecho de que las ecuaciones de movimiento son ecuaciones difer-
enciales. Nosotros quisiéramos escribir esas ecuaciones de modo tensorial,
para que sean covariantes. El problema es que la derivada ∂µ y el difer-
encial d no son operaciones covariantes y, en consecuencia, es preciso que
tengamos mucho cuidado cuando queramos utilizarlas. Debemos construir
otras operaciones que se parezcan a ∂µ y d, que sı́ sean covariantes: estas
nuevas operaciones sı́ pueden ser usadas tranquilamente en las ecuaciones de
la fı́sica. En las secciones 9.13 y 10.5 presentaremos esas nuevas operaciones
que se parecen a ∂µ y a d, y que sı́ son covariantes.

9.6 Matrices
Para los tensores de rangos 1 y 2, que son los que tienen 1 y 2 ı́ndices,
respectivamente, es muy cómoda la notación matricial. Definamos la matriz
cuadrada
∂x0µ
Λµ ν = (9.33)
∂xν

Con Λ podemos reescribir las ecuaciones (9.10) y (9.20):

A0 µ = Λµ ν Aν

F 0 µν = Λµ α F αβ Λν β = Λµ α F αβ ΛT β
ν

O más concisamente:

A0 µ = Λ Aν (9.34)

F 0 µν = Λ F αβ ΛT (9.35)

Estamos desarrollando una teorı́a general que puede aplicarse a transfor-


maciones cuadridimensionales en el espaciotiempo, como las que ocurren en
la gravitación einsteiniana. Pero nuestra teorı́a general de transformaciones
también puede usarse para resolver problemas sencillos tridimensionales, que
no involucran el tiempo, como son los simples cambios entre coordenadas
cartesianas, cilı́ndricas, parabólicas, etc. Como ejemplo veamos la transfor-
mación de coordenadas cartesianas a esféricas.

213
9.7 Coordenadas esféricas
Antes de ejecutar esta transformación, detengámonos brevemente para recor-
dar un asunto del cálculo vectorial en el triespacio (x, y, z). Un trivector
cualquiera V se puede expresar en componentes cartesianas y también en
componentes esféricas. La primera manera es V = 1̂x Vx + 1̂y Vy + 1̂z Vz y la
segunda es V = 1̂r Vr + 1̂θ Vθ + 1̂ϕ Vϕ . Igualemos estas dos expresiones:

1̂x Vx + 1̂y Vy + 1̂z Vz = 1̂r Vr + 1̂θ Vθ + 1̂ϕ Vϕ (9.36)

Las relaciones entre los vectores unitarios (1̂x , 1̂y , 1̂z ) y (1̂r , 1̂θ , 1̂ϕ ) son

1̂r = 1̂x sen θ cos ϕ + 1̂y sen θ sen ϕ + 1̂z cos θ


1̂θ = 1̂x cos θ cos ϕ + 1̂y cos θ sen ϕ − 1̂z sen θ (9.37)
1̂ϕ = −1̂x sen ϕ + 1̂y cos ϕ

Al colocar estas tres ecuaciones en el lado derecho de la ecuación (9.36)


se encuentran las relaciones que existen entre las componentes cartesianas
(Vx , Vy , Vz ) y las esféricas (Vr , Vθ , Vϕ ) :

Vx = Vr sen θ cos ϕ + Vθ cos θ cos ϕ − Vϕ sen ϕ


Vy = Vr sen θ sen ϕ + Vθ cos θ sen ϕ + Vϕ cos ϕ (9.38)
Vz = Vr cos θ − Vθ sen θ

O, en forma equivalente:

Vr = Vx sen θ cos ϕ + Vy sen θ sen ϕ + Vz cos θ


Vθ = Vx cos θ cos ϕ + Vy cos θ sen ϕ − Vz sen θ (9.39)
Vϕ = −Vx sen ϕ + Vy cos ϕ

Ya estamos en condición de ejecutar la transformación de coordenadas carte-


sianas a esféricas. Las primeras son (x0 , x1 , x2 , x3 ) = (ct, x, y, z), y las se-
gundas son (x00 , x01 , x02 , x03 ) = (ct, r, θ, ϕ). La transformación es:

214
x00 = x0
p
x01 = (x1 )2 + (x2 )2 + (x3 )2
x3 (9.40)
x02 = arc cos p
(x1 )2 + (x2 )2 + (x3 )2
x2
x03 = arctan 1
x

Procedemos a calcular las entradas de la matriz Λ, de acuerdo con (9.33),


para obtener

 
1 0 0 0
 
 
 0 sen θ cos ϕ sen θ sen ϕ cos θ 
 
 
 
Λ= sen θ  (9.41)
 0 cos θ cos ϕ cos θ sen ϕ
− 
 r r r 
 
 
 sen ϕ cos ϕ 
0 − 0
r sen θ r sen θ

El intervalo (2.1) en coordenadas cartesianas es

ds2 = c2 dt2 − dx2 − dy 2 − dz 2 (9.42)

Cartesianas
Al comparar esta ecuación con (9.1) identificamos la matrix diagonal gµν
= diag (1, −1, −1, −1, −1). La inversa de esta matriz es:

µν
gCartesianas = diag (1, −1, −1, −1, −1) (9.43)

Esta es claramente la métrica de Minkowski que utilizamos en el capı́tulo


5 de la relatividad especial. Pasamos ahora a calcular el tensor métrico en
µν
coordenadas esféricas, por medio de la fórmula (9.35), que es gEsféricas =
αβ
Λ gCartesianas ΛT . Usamos entonces (9.41) y (9.43) para ejecutar el producto
de las tres matrices, y obtenemos:

µν
gEsféricas = diag (1, −1, −r−2 , −(r sen θ)−2 ) (9.44)

215
La matriz inversa de (9.44) es:

Esféricas
gµν = diag (1, −1, −r2 , −r2 sen2 θ) (9.45)

Esta fórmula dice que

ds2 = dt2 − dr2 − r2 dθ2 − r2 sen2 θ dϕ2 , (9.46)

que es el mismo intervalo (9.42), escrito ahora en coordenadas esféricas.


Calculemos ahora las componentes de un vector cualquiera en coordenadas
esféricas. Tomaremos como ejemplo el vector densidad de la fórmula (6.18),
µ
que es JCartesianas = (ρc, Jx , Jy , Jz ). Utilizando estas componentes y la ma-
triz Λ en la ecuación (9.34) se obtienen las componentes contravariantes en
coordenadas esféricas:

  
1 0 0 0 ρc
  
  
 0 sen θ cos ϕ sen θ sen ϕ  
cos θ   J 
 
  x 
µ   
JEsféricas = sen θ   
 0 cos θ cos ϕ cos θ sen ϕ
−   
 r r  
r   Jy 
 
  
 sen ϕ cos ϕ   
0 − 0 Jz
r sen θ r sen θ
 
ρc
 
 J sen θ cos ϕ + J sen θ sen ϕ + J cos θ 
 x y z 
 
 
=  Jx cos θ cos ϕ Jy cos θ sen ϕ Jz sen θ  (9.47)
 + − 
 r r r 
 
 
Jx sen ϕ Jy cos ϕ
− +
r sen θ r sen θ

Comparando las tres últimas filas de (9.47) con las formas generales (9.39),
reconocemos las componentes Jr , Jθ y Jϕ , o sea que

216
 
ρc
 
 Jr 
 
µ  
JEsféricas =
 Jθ 
 (9.48)
 
 r 
 

r sen θ

Calculemos finalmente el tensor electromagnético en coordenadas esféricas,


µν αβ
por medio de la fórmula (9.35), que es FEsféricas = Λ FCartesianas ΛT . Usamos
entonces (9.41) y (6.30) para ejecutar el producto de las tres matrices. El
resultado es una matriz complicada que contiene las seis componentes carte-
sianas (Ex , Ey , Ez , Bx , By , Bz ). Tal matriz se simplifica considerablemente al

expresar esas seis componentes cartesianas en términos de las componentes


esféricas, para lo cual utilizamos fórmulas del tipo (9.38). Se llega a:

 
Eθ Eϕ
 0 −Er − −
 r r sen θ 

 
 Bϕ Bθ 
 Er 0 − 
 r r sen θ 
µν  
FEsféricas =  (9.49)
 Eθ Bϕ Br 
 0 − 2 
 r r r sen θ 
 
 
 Eϕ Bθ Br 
− 0
r sen θ r sen θ r2 sen θ

9.8 La relatividad especial


Este es un momento oportuno para presentar un ejemplo con transforma-
ciones tetradimensionales. Una de las más sencillas de todas, y no por eso
trivial, es la transformación de Lorentz (ct, x, y, z) → (ct0 , x0 , y 0 , z 0 ) que es-
cribimos en las ecuaciones (5.13). La matriz Λ ya fue calculada en (5.47). El
tensor métrico en las coordenadas no primadas η µν está dado por la ecuación
(9.43). La fórmula (9.35) dice que η 0 µν = Λη αβ ΛT . Ejecutamos el producto
de las tres matrices para llegar a

217
 
1 0 0 0
 
 0 −1 0 0 
 
η 0 µν =



 0 0 −1 0 
 
0 0 0 −1

En palabras: la métrica de Minkowski es invariante bajo transformaciones


de Lorentz. Esto ya lo habı́amos elaborado anteriormente, en particular en
los comentarios que siguen a la ecuación (5.21). Por lo general, las com-
ponentes de los tensores sufren grandes modificaciones cuando se hace un
cambio de unas coordenadas a otro, como puede verse comparando (6.30)
con (9.49), o comparando (9.43) con (9.44). Esta regla tiene dos excepciones
notables: 1) los escalares, por definición, no cambian bajo ninguna transfor-
mación de coordenadas, y 2) la métrica de Minkowski η es invariante bajo
las transformaciones de Lorentz.

9.9 Ecuaciones tensoriales


En esta sección veremos algunas propiedades importantes de las ecuaciones
entre tensores.

a) La más importante es que las ecuaciones tensoriales son automática-


mente covariantes, es decir, tienen la misma forma en todos los sistemas
coordenados. Para ver esto consideremos por ejemplo la ecuación

Aµ ν = B µ Cν (9.50)

∂xµ ∂x0β 0α
Si A, B y C son tensores, podemos reemplazar Aµ ν = A β ,
∂x0α ∂xν
∂xµ 0α ∂x0β 0
Bµ = B y Cν = C en la ecuación (9.50) para escribir
∂x0α ∂xν β

∂xµ ∂x0β 0α ∂xµ ∂x0β 0α 0


A β = B Cβ
∂x0α ∂xν ∂x0α ∂xν

∂x0σ ∂xν
Multiplicar ambos lados de esta ecuación por :
∂xµ ∂x0ρ

218
∂x0σ ∂xµ ∂xν ∂x0β 0α ∂x0σ ∂xµ ∂xν ∂x0β 0α 0
A β = B Cβ
∂xµ ∂x0α ∂x0ρ ∂xν ∂xµ ∂x0α ∂x0ρ ∂xν

g σ α g β ρ A0α β = g σ α g β ρ B 0α Cβ0

A0σ ρ = B 0σ Cρ0 (9.51)

Comparando (9.51) con (9.50) nos damos cuenta de que tienen la misma
forma: (9.50) es una ecuación covariante porque es la igualdad de dos ten-
sores. Las ecuaciones tensoriales son automáticamente covariantes.

b) Supongamos que una ecuación es válida en todos los sistemas coorde-


nados. Pensemos que esta ecuación tiene k elementos (factores o sumandos)
y supongamos que k − 1 de ellos son tensores; entonces el otro elemento
también tiene que ser tensor. Para mostrar que esto es cierto supongamos
que la ecuaciones (9.50) y (9.51) son verdaderas y que A y C son tensores;
probaremos que B también es tensor.

∂xµ ∂x0β 0α ∂x0β 0


Reemplazando Aµ ν = A β , y C ν = C en (9.50) escribi-
∂x0α ∂xν ∂xν β
mos:
∂xµ ∂x0β 0α ∂x0β µ 0
A β = B Cβ
∂x0α ∂xν ∂xν

∂x0σ ∂xν
Multiplicar ambos lados de esta ecuación por :
∂xµ ∂x0ρ

∂x0σ ∂xµ ∂xν ∂x0β 0α ∂x0σ ∂xν ∂x0β µ 0


A β = B Cβ
∂xµ ∂x0α ∂x0ρ ∂xν ∂xµ ∂x0ρ ∂xν
∂x0σ β
g σ α g β ρ A0α β = g ρ B µ Cβ0
∂xµ
∂x0σ µ 0
A0σ ρ = B Cρ
∂xµ

Comparando la última ecuación con (9.51) vemos que

∂x0σ µ
B 0σ = B ,
∂xµ

219
que es la forma como transforman los vectores: B es un vector, que es lo que
nos propusimos demostrar.

c) Hay dos maneras de establecer si un conjunto de n cantidades A0 , A1 ,


A2 , · · · es un vector. La primera es invocando una ecuación en la que aparez-
can esas cantidades, como en la nota b) hace un par de párrafos. La segunda
es empı́ricamente: en las coordenadas xµ se miden las cantidades A0 , A1 ,
A2 , · · · y en las coordenadas x0µ se miden las cantidades A00 , A01 , A02 , · · ·. Si
las cantidades fı́sicamente medidas Aµ y A0µ satisfacen la ecuación (9.34),
entonces Aµ es un vector. El mismo pensamiento se aplica para establecer
si un conjunto de n2 cantidades es un tensor de rango 2: bien sea invocan-
do una ecuación en la que aparezca el conjunto en cuestión, o de manera
empı́rica usando la condición (9.35).

d) Mencionábamos en la página 213 la necesidad de utilizar otras versiones


de ∂µ y d que sean covariantes.

9.10 Covariancia general


Podemos pensar que las leyes de la fı́sica se ubican por encima de los sis-
temas coordenados. Por supuesto que para utilizar numéricamente una ley
es necesario erigir antes un sistema coordenado particular, pero podemos
pensar que las leyes son, de alguna manera, independientes de los sistemas
coordenados. Más concretamente, las leyes deben expresarse por medio de
enunciados que sean invariantes bajo el grupo de las transformaciones gen-
eralizadas de coordenadas. Este es el Principio de la Covariancia General.

Acabamos de ver que las ecuaciones tensoriales son automáticamente covari-


antes bajo el grupo de las transformaciones generalizadas de coordenadas, lo
que nos lleva a concluir que el Principio se satisface si las leyes de la fı́sica se
expresan mediante ecuaciones tensoriales. El Principio indica un método y
una guı́a: al formular una teorı́a fı́sica se deben buscar ecuaciones tensoriales.

Las cantidades fı́sicas deben ser componentes de tensores. Por ejemplo el


campo eléctrico hace parte del tensor electromagnético Fµν y la energı́a de
una partı́cula hace parte del cuadrivector momentum pµ . Ahora, hemos vis-
to que los tensores de rango j tienen 4j componentes, lo que quiere decir que
los tensores tienen 1, 4, 16, 64 ··· componentes. Vemos ası́ que toda cantidad

220
fı́sica debe ser miembro de alguna familia de 1, 4, 16, 64 · · · elementos. Los
números 1, 4, 16, 64 · · · son muy importantes para la fı́sica, porque indican
los únicos tamaños que las familias pueden tener: no hay familias de 10, 15,
63 miembros.

Supongamos que queremos saber si determinada ecuación tensorial es váli-


da: si la ecuación se cumple en un sistema coordenado, entonces tiene que
cumplirse en todos los sistemas de coordenadas. O sea que que

para demostrar la validez de una ecuación


covariante basta probar que la ecuación (9.52)
se cumple en un sistema coordenado.

Si una ecuación tiene forma covariante y es válida


en un sistema coordenado, entonces es válida en (9.53)
todos los sistemas coordenados.

9.11 El elemento invariante de volumen


La fórmula (9.35) dice que g 0 µν = Λg αβ ΛT . Tomemos determinante en
ambos lados de esta ecuación:

det g 0 µν = det Λ det g αβ det ΛT = (det Λ)2 det g αβ ,

es decir:
p
| det g 0 µν |
| det Λ| = p
| det g αβ |

De otro lado, tomando determinante en ambos lados de la ecuación (9.2)


1
vemos que det g αβ = , de donde:
det gαβ

p
| det gαβ |
| det Λ| = q
0 |
| det gµν

Llamar g ≡ det gαβ y g 0 ≡ det gµν


0 . Entonces:

221
p
|g|
| det Λ| = p (9.54)
|g 0 |

| det Λ| se llama el Jacobiano de la transformación. El Teorema Principal del


Cálculo Integral dice que los volúmenes n-dimensionales dn x0 y dn x cumplen
la condición

dn x0 = | det Λ| dn x ; usar (9.54):


p
|g| n
= p d x, o sea que:
|g 0 |
p p
|g 0 | dn x0 = |g| dn x (9.55)

p
Esto es importante: |g| d4 x es un escalar, y se puede tomar como el ele-
mento diferencial de volumen. Es claro entonces que:

Z · ¸ · ¸
Algún tensor p Otro tensor
|g| d4 x = (9.56)
de rango j de rango j

9.12 El sı́mbolo de Christoffel


El sı́mbolo de Christoffel Γµ αβ se define de la manera siguiente:

1
Γµ αβ = g µν (gνα,β + gβν,α − gαβ,ν ) (9.57)
2

Lo primero que debemos notar es que el sı́mbolo de Christoffel es simétrico


bajo el intercambio de los dos subı́ndices: Γµ αβ = Γµ βα . Contemos cuántas
componentes independientes tiene Γµ αβ utilizando un argumento similar al
que empleamos en la sección 7.5 cuando querı́amos calcular el número de
componentes del tensor M αβδ . Para tal efecto comparemos la estructura de
Γµ αβ con la estructura de Aµ Bαβ , suponiendo que Bαβ = Bβα . La cantidad
Bαβ , como es de dos ı́ndices, tiene n2 componentes, pero además es simétri-
ca, entonces sólo tiene n(n + 1)/2 componentes independientes; entonces
Aµ Bαβ tiene n2 (n + 1)/2 componentes independientes. Ası́ mismo, el sı́mbo-
lo de Christoffel tiene n2 (n + 1)/2 componentes independientes. De otro

222
lado el tensor métrico gµν , por ser simétrico, tiene n(n + 1)/2 componentes
independientes, o sea que hay n2 (n + 1)/2 derivadas gµν ,α independientes.
Vemos pues que n2 (n+1)/2 es el número de sı́mbolos Γµ αβ independientes y
n2 (n+1)/2 es el número de derivadas gαβ,ν independientes. En el fondo estos
dos conjuntos son equivalentes: de un lado, (9.57) determina totalmente las
derivadas gµν ,α en términos de los sı́mbolos Γ, y de otro lado las ecuaciones
(9.65) determinan totalmente los sı́mbolos Γ en términos de las derivadas
gµν ,α : los sı́mbolos Γ son como las primeras derivadas del tensor métrico.

Si todos los sı́mbolos de Christoffel son cero,


entonces todas las primeras derivadas gµν ,α (9.58)
son cero; y viceversa.

El conjunto de los sı́mbolos Γ es como


(9.59)
el conjunto de las primeras derivadas de gµν .

Γµ αβ no es un tensor. En notación obvia:

    
ν→β ν→α
1 µν  ∂gνα 
Γµ αβ = g + α → ν  −  α → β  , y con primas:
2 ∂xβ
β→α β→ν
    
0 ν→β ν→α
1 0µν  ∂gνα 
Γ0µ αβ = g + α → ν  −  α → β  . Usar (9.21):
2 ∂x0β
β→α β→ν
µ ¶
1 0µν ∂ ∂xσ ∂xρ
= g gσρ + [ ] − [ ]
2 ∂x0β ∂x0ν ∂x0α
µ ¶
1 0µν ∂xσ ∂xρ ∂
= g gσρ + [ ] − [ ]
2 ∂x0ν ∂x0α ∂x0β
µ ¶
1 ∂ h ∂xσ ∂xρ i
+ g 0µν gσρ +[ ]−[ ]
2 ∂x0β ∂x0ν ∂x0α

Para facilitar los cálculos escribamos este último resultado ası́:

Γ0µ αβ = M + N (9.60)

223
µ ¶
1 0µν ∂xσ ∂xρ ∂
M = g gσρ + [ ] − [ ]
2 ∂x0ν ∂x0α ∂x0β
µ ¶
1 0µν ∂ h ∂xσ ∂xρ i
N = g gσρ + [ ] − [ ]
2 ∂x0β ∂x0ν ∂x0α

Desarrollemos por separado cada uno de los términos M y N . El término


M es

µ ¶
1 ∂xσ ∂xρ ∂xω
M = g 0µν gσρ,ω + [ ] − [ ]
2 ∂x0ν ∂x0α ∂x0β
µ ¶
1 ∂x0µ ∂x0ν ξη ∂xσ ∂xρ ∂xω
= g gσρ,ω +[ ]−[ ]
2 ∂xξ ∂xη ∂x0ν ∂x0α ∂x0β

1 ∂x0µ ξη ∂x0ν h ∂xσ ∂xρ ∂xω ∂xσ ∂xρ ∂xω


= ξ
g gσρ,ω η 0ν 0α 0β
+ 0β
2 ∂x ∂x ∂x ∂x ∂x ∂x ∂x0ν ∂x0α

∂xσ ∂xρ ∂xω i



∂x0α ∂x0β ∂x0ν

1 ∂x0µ ξη h ρ ω σ ∂xω σ ∂xρ i


σ ∂x ∂x ρ ∂x ω ∂x
= g gσρ,ω g η + g η − g η
2 ∂xξ ∂x0α ∂x0β ∂x0β ∂x0α ∂x0α ∂x0β

1 ∂x0µ ξη h ∂xρ ∂xω ∂xσ ∂xω ∂xσ ∂xρ i


= g gηρ,ω + gση,ω − gσρ,η
2 ∂xξ ∂x0α ∂x0β ∂x0β ∂x0α ∂x0α ∂x0β

∂x0µ ∂xρ ∂xω 1 ξη


= g (gηρ,ω + gωη,ρ − gρω,η )
∂xξ ∂x0α ∂x0β 2

Con (9.57) reconocemos Γξ ρω :

∂x0µ ∂xρ ∂xω ξ


M= Γ ρω (9.61)
∂xξ ∂x0α ∂x0β

Ahora ataquemos el término N , que es:

224
µh σ ¶
1 0µν ∂x ∂ 2 xρ ∂xρ ∂ 2 xσ i
N = g gσρ + 0α +[ ]−[ ]
2 ∂x0ν ∂x0α ∂x0β ∂x ∂x0β ∂x0ν

La operación [ ] − [ ] es un poco tediosa, pero no tiene ninguna dificultad


especial. Cuatro términos se cancelan mutuamente y al final se obtiene:

1 0µν ∂xσ ∂ 2 xρ
N = g gσρ 2
2 ∂x0ν ∂x0α ∂x0β

∂x0µ ∂x0ν ∂xσ ∂ 2 xρ


= gσρ g ξη
∂xξ ∂xη ∂x0ν ∂x0α ∂x0β
µ ¶
∂x0µ ∂x0ν ∂xσ ∂ 2 xρ
= gσρ g ξη
∂xξ ∂xη ∂x0ν ∂x0α ∂x0β

∂x0µ ∂ 2 xρ
= gσρ g ξη (gη
σ
)
∂xξ ∂x0α ∂x0β

∂x0µ ∂ 2 xρ
= (9.62)
∂xρ ∂x0α ∂x0β

Al colocar (9.61) y (9.62) en (9.60) llegamos finalmente a:

∂x0µ ∂xρ ∂xω ξ ∂x0µ ∂ 2 xρ


Γ0µ αβ = Γ ρω + (9.63)
∂xξ ∂x0α ∂x0β ∂xρ ∂x0α ∂x0β

Nos será útil una versión de Γ0µ αβ ligeramente diferente de (9.63), que se
obtiene muy fácilmente. Es claro que ∂x0µ /∂x0 α = gα µ = δα µ ; como esto es
una constante, sus derivadas son cero:

∂ ∂x0µ ∂ ∂x0µ ∂xρ ∂x0µ ∂ 2 xρ ∂xρ ∂ ∂x0µ


0= = = +
∂x0β ∂x0α ∂x0β ∂xρ ∂x0α ∂xρ ∂x0α ∂x0β ∂x0α ∂x0β ∂xρ

Aislar el primer término del lado derecho:

∂x0µ ∂ 2 xρ ∂xν ∂ ∂x0µ ∂xν ∂xσ ∂ 2 x0µ


= − = −
∂xρ ∂x0α ∂x0β ∂x0α ∂x0β ∂xν ∂x0α ∂x0β ∂xν ∂xσ

Entonces (9.63) se convierte en

225
∂x0µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x0µ
Γ0µ αβ = Γ στ − (9.64)
∂xν ∂x0α ∂x0β ∂x0α ∂x0β ∂xσ ∂xν

Si el segundo término del lado derecho fuera cero, tendrı́amos la ley de


transformación de un tensor de rango tres con un ı́ndice contravariante y
dos covariantes. Pero, en general, el segundo término del lado derecho de
(9.64) no es cero: El sı́mbolo de Christoffel Γµ αβ no es un tensor1 .

Es oportuno hacer un comentario acerca de la notación. Al escribir las


componentes de los tensores hemos sido muy cuidadosos de no poner un
superı́ndice encima de un subı́ndice; por ejemplo, nunca hemos escrito Tαµ .
Siguiendo esta costumbre, hemos escrito Γµ αβ aunque Γ no es un tensor.
Debemos aclarar, sin embargo, que en la mayorı́a de los libros aparece Γµαβ .
Esta escritura Γµαβ no debe causar confusión. De otro lado, en algunas es-
casas ocasiones es preciso usar las cantidades Γµαβ , las cuales se deben en-
tender como el resultado de multiplicar a gµξ por Γξ αβ . Se define entonces
Γµαβ ≡ gµξ Γξ αβ . Hay dos identidades útiles que se prueban con facilidad a
partir de la definición (9.57):

gαβ , γ = Γαβγ + Γβαγ (9.65)

g αβ ,γ = −g µβ Γα µγ − g µα Γβ µγ (9.66)

9.13 La derivada covariante


Decı́amos en la página 213 que necesitamos una operación derivada que
tenga carácter tensorial, es decir, que al actuar sobre un tensor produzca
un tensor. El propósito de esta sección es construir esta derivada tensorial.
Aunque Γµ αβ no es un tensor, sı́ sirve para construir la derivada covariante
que necesitamos. Comencemos escribiendo:

∂A0µ
+ Γ0µ αβ A0α = V + W , (9.67)
∂x0β

∂A0µ
donde V = y W = Γ0µ αβ A0α . Desarrollemos el término V utilizando
∂x0β
1
Sin embargo Γµ αβ sı́ es un tensor bajo el subgrupo de las transformaciones lineales,
∂ 2 x0µ
pues en éstas las segundas derivadas son cero y entonces también es cero el último
∂xσ ∂xν
término del lado derecho de (9.64).

226
la regla de la derivación en cadena:

∂xρ ∂
V = A0µ ; utilizar (9.10):
∂x0β ∂xρ

∂xρ ∂ ∂x0µ σ ∂xρ ∂x0µ ∂Aσ ∂xρ ∂ 2 x0µ σ


= A = + A (9.68)
∂x0β ∂xρ ∂xσ ∂x0β ∂xσ ∂xρ ∂x0β ∂xρ ∂xσ

Pasemos a desarrollar el término W usando la ecuación (9.10):

∂x0α ξ
W = Γ0µ αβ A0α = Γ0µ αβ A
∂xξ

Ahora utilizar la ecuación (9.64):

µ ¶
∂x0µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x0µ ∂x0α ξ
W = Γ στ − A
∂xν ∂x0α ∂x0β ∂x0α ∂x0β ∂xσ ∂xν ∂xξ
µ ¶
∂x0µ σ ∂xτ ν ν ∂x
σ ∂ 2 x0µ
= gξ Γ στ − g ξ Aξ
∂xν ∂x0β ∂x0β ∂xσ ∂xν

∂x0µ ∂xτ ν σ ∂xσ ∂ 2 x0µ ν


= Γ στ A − A (9.69)
∂xν ∂x0β ∂x0β ∂xσ ∂xν

Ya estamos en condición de poner (9.68) y (9.69) en (9.67) para obtener


finalmente:
· ¸
∂A0µ 0µ 0α ∂x0µ ∂xρ ∂Aν ν σ
+ Γ αβ A = + Γ σρ A
∂x0β ∂xν ∂x0β ∂xρ

Pero este es, según la regla (9.22), el modo como transforman los tensores
de rango 2. En conclusión,

∂Aν
+ Γν ρσ Aσ (9.70)
∂xρ

es un tensor de rango 2. Es muy importante, y se llama Derivada Covariante.


∂Aν
Aunque y Γν ρσ Aσ no son tensores, la derivada covariante sı́ lo es.
∂xσ

227
Aµ ; β = Aµ , β + Γµ βα Aα (9.71)

Aquı́ estamos usando una notación muy cómoda: la coma quiere decir deriva-
da corriente y el punto y coma quiere decir derivada covariante. La expresión
(9.71) es la derivada covariante de un vector contravariante. Para las com-
ponentes covariantes se escoge:

Aµ ; β = Aµ ,β − Γα µβ Aα (9.72)

Hemos probado que las componentes Aµ ; β transforman como un tensor de


segundo rango. De manera independiente se puede probar que las Aµ ; β tam-
bién transforman como un tensor de rango 2.

Acabamos de ver que la derivada covariante de un vector es un tensor de


rango 2. En general, la derivada covariante de un tensor de rango j es un
tensor de rango j + 1 . La derivada covariante de tensores de rango mayor
que 0 introduce un sı́mbolo de Christoffel por cada ı́ndice:

F µν ; β = F µν , β + Γµ βα F αν + Γν βα F µα (9.73)

Fµν ; β = Fµν , β − Γα µβ Fαν − Γα νβ Fµα (9.74)

F µν σ ; β = F µν σ , β + Γµ βτ F τ ν σ + Γν βτ F µτ σ − Γτ σβ F µν τ

Esta es la regla para tomar la derivada covariante de tensores de rango mayor


que 0, pero ¿qué hacer para tomar la derivada covariante de un escalar?
Para resolver esta dificultad recordemos el enunciado (9.32), según el cual la
derivada corriente de un escalar es una operación covariante; no hay motivo
de preocupación, y podemos definir la derivada covariante de un escalar
como su derivada corriente:

φ; α = φ, α

En conclusión, la derivada covariante convierte tensores en tensores, y por


eso es buena para las ecuaciones tensoriales, de acuerdo con la necesidad
que mencionábamos en la página 213 de utilizar operaciones covariantes. La
ecuación (9.73) dice que

228
(C µ Dν ) ; β = C µ ; β Dν + C µ Dν ; β (9.75)

o sea que la derivada covariante cumple la regla usual de la derivada del


producto de dos factores. En general la derivada covariante se maneja con
tranquilidad, con soltura, debido a la propiedad (9.75). La única advertencia,
muy importante, es que, a diferencia de las derivadas simples, las derivadas
covariantes no conmutan:

Aα ; ν ; µ = (Aα ; ν ) ; µ

= (Aα ; ν ) , µ + Γα τ µ Aτ ; ν − Γτ νµ Aα ; τ

= (Aα , ν + Γα τ ν Aτ ), µ + Γα τ µ (Aτ , ν + Γτ βν Aβ ) − Γτ νµ Aα ; τ

Para Aα ; µ ; ν basta intercambiar los ı́ndices ν y µ. El conmutador es:

Aα ; µ ; ν − Aα ; ν ; µ = Rα βµν Aβ , (9.76)

donde

Rα βµν = Γα βµ , ν − Γα βν , µ − Γσ βν Γα σµ + Γσ βµ Γα σν (9.77)

Ası́ mismo:

Aα ; µ ; ν − Aα ; ν ; µ = −Rβ αµν Aβ (9.78)

Antes de concluir esta sección presentamos una identidad importante:

gµν ; α = 0, g µν ;α = 0 (9.79)

En palabras, la derivada covariante del tensor métrico es cero. Esta identidad


se prueba fácilmente a partir de las ecuaciones (9.73) y (9.74).

229
9.14 El tensor de Riemann
Detengámonos un momento en la ecuación (9.78): Debido a que las can-
tidades Aµ ; α ; β , Aµ ; β ; α y Aν son tensores, podemos afirmar que Rν µαβ
también es un tensor: se llama tensor de Riemann. Que éste sea un ten-
sor significa que bajo una transformación general de coordenadas xµ → x0µ
ocurre lo siguiente:

∂x0α ∂x0β ∂x0µ ∂x0ν ρσπδ


R0 αβµν = R (9.80)
∂xρ ∂xσ ∂xπ ∂xδ

El tensor de Riemann, por su origen en las ecuaciones (9.76) y (9.78), ex-


presa la no conmutatividad de las derivadas covariantes. Una contracción de
ı́ndices produce el tensor de Ricci Rβµ , y con otra contracción se obtiene el
escalar de curvatura R:

Rβµ ≡ Rα βµα = Rµβ (9.81)

R ≡ Rµ µ (9.82)

Los tensores (9.77),(9.81) y (9.82) satisfacen cinco ecuaciones: tres alge-


braicas y dos diferenciales:

Rλµνκ = Rνκλµ (9.83)

Rλµνκ = −Rµλνκ = −Rλµκν = Rµλκν (9.84)

Rλµνκ + Rλκµν + Rλνκµ = 0 (9.85)

Rα βµν ; σ + Rα βσµ ;ν + Rα βνσ ; µ = 0 (9.86)


1
(Rµ ν − g µ ν R); µ = 0 (9.87)
2

Nos disponemos a probar la validez de las identidades algebraicas (9.83),


(9.84) y (9.85). Para tal efecto debemos bajar el ı́ndice contravariante de
Rα βµν , lo que se logra multiplicando ambos lados de la ecuación (9.77) por
gλα :

Rλµνκ = gλσ Γσ µν , κ + gλη Γσ µν Γη κσ − gλσ Γσ µκ , ν − gλη Γσ µκ Γη σν (9.88)

230
En el lado derecho de esta ecuación los dos últimos términos se obtienen
intercambiando los ı́ndices κ y ν en los dos primeros términos:

Rλµνκ = gλσ Γσ µν , κ + gλη Γσ µν Γη κσ − (ν ­ κ) (9.89)

Desarrollemos el primer término del lado derecho de esta ecuación:

1 £ ¡ ¢¤
gλσ Γσ µν , κ = gλσ g ση gηµ , ν + gνη , µ − gµν , η , κ
2
1 ¡ ¢
= gλσ g ση gηµ , ν + gνη , µ − gµν , η , κ
2
1¡ ¢
+ gηµ , ν + gνη , µ − gµν , η gλσ g ση , κ
2

Ahora, con (9.66) se prueba fácilmente que gλσ g ση , κ = −g ση (gλξ Γξ σκ +


gσξ Γξ λκ ). Entonces:

1 ¡ ¢
gλσ Γσ µν , κ = gλ η gηµ , ν + gνη , µ − gµν , η , κ
2
1 ¡ ¢
− g ση gηµ , ν + gνη , µ − gµν , η (gλξ Γξ σκ + gσξ Γξ λκ )
2
1 η¡ ¢
= gλ gηµ , ν + gνη , µ − gµν , η , κ − Γσ µν (gλξ Γξ σκ + gσξ Γξ λκ )
2
1 η¡ ¢
= gλ gηµ , ν + gνη , µ − gµν , η , κ − gσξ Γξ λκ Γσ µν − gλξ Γσ µν Γξ σκ
2

Nótese que el último término del lado derecho cancela exactamente al se-
gundo término de la ecuación (9.89). Entonces (9.89) queda finalmente ası́:

1
Rλµνκ = (gνλ , µ , κ − gκλ , µ , ν − gµν , λ , κ + gµκ , λ , ν )
2 (9.90)
σ ξ σ ξ
+ gσξ (Γ µκ Γ λν −Γ µν Γ λκ )

Por inspección, es clara la validez de las ecuaciones (9.83) y (9.84). También


es clara la validez de la ecuación (9.85). Vemos ası́ que las ecuaciones (9.83),
(9.84) y (9.85) son correctas. (9.83) y (9.84). Luego, en la sección 9.17,
tendremos ocasión de probar la validez de las otras dos identidades (9.86) y
(9.87).

231
La ecuación (9.85): En la ecuación (9.85) vamos a hacer ν = µ (no
sumar ı́ndices repetidos):

Rλµµκ + Rλκµµ + Rλµκµ = 0 (9.91)

El segundo término de esta ecuación es cero (debido a (9.84)) y la suma


del primero y el tercero da cero (debido a (9.84)). Vemos ası́ que (9.91)
no aporta nada nuevo. Se puede verificar, en general, que cuando en (9.85)
hay dos ı́ndices repetidos se obtiene una ecuación que redunda con (9.83)
y (9.84). En conclusión, la ecuación (9.85) suministra información nueva
cuando los cuatro ı́ndices toman valores diferentes. Por ejemplo, para un
espacio de dimensión 4 la única información novedosa contenida en (9.85)
es:

R0123 + R0312 + R0231 = 0 (9.92)

Rαβµν tiene n2 (n2 −1)/12 componentes independientes. En un espa-


cio de n dimensiones el tensor de Riemann tiene n2 (n2 − 1)/12 componentes
independientes. No probaremos esto en general, pero sı́ lo verificaremos en el
caso particular n = 4. En seguida vamos a comprobar que en una geometrı́a
de dimensión 4 el tensor de Riemann tiene 20 componentes independientes.

Como Rαβµν tiene cuatro ı́ndices, y cada ı́ndice adopta cuatro valores, Rαβµν
tiene 44 = 256 componentes. Demostremos que las fórmulas (9.84) reducen
a 36 el número de componentes independientes. En Rαβµν la pareja αβ es
antisimétrica, o sea que hay sólo 6 parejas αβ independientes; escogemos
estas seis:

αβ : 010203121323

Ası́ mismo hay sólo seis parejas µν independientes. Escogemos:

µν : 010203121323

Escribamos estas 36 componentes de Rαβµν que son, hasta el momento,


independientes:

232
R0101 R0102 R0103 R0112 R0113 R0123
R0201 R0202 R0203 R0212 R0213 R0223
R0301 R0302 R0303 R0312 R0313 R0323
R1201 R1202 R1203 R1212 R1213 R1223
R1301 R1302 R1303 R1312 R1313 R1323
R2301 R2302 R2303 R2312 R2313 R2323

Ahora, la ecuación (9.84) dice que este arreglo cuadrado, o matriz, es simétri-
co. Una matriz 6 × 6 simétrica sólo tiene 21 entradas independientes (por
ejemplo, las de la diagonal y las que se encuentran por encima de ésta).
Finalmente, la ecuación (9.92) reduce a 20 el número de componentes inde-
pendientes. Hemos verificado, en el caso particular n=4, que en un espacio
de n dimensiones el tensor de Riemann tiene n2 (n2 − 1)/12 componentes
independientes.

9.15 Plano y curvo


Decimos que un espacio es plano en un punto dado, si en ese punto el
tensor de Riemann vale cero; es decir, si todas las componentes del tensor
de Riemann son cero. Decimos que un espacio es curvo si no es plano: un
espacio es curvo en un punto dado, si en ese punto el tensor de Riemann no
es cero; es decir, si al menos una de las componentes del tensor de Riemann
difiere de cero.

Ejemplo. Consideremos una geometrı́a en tres dimensiones, con un inter-


valo ds2 = dr2 + r2 dθ2 + r2 sen2 θ dϕ2 . El tensor métrico es
 
1 0 0
 
g [3] µν = 
 0 r
2 0 

2 2
0 0 r sen θ

Para esta geometrı́a todas las componentes del tensor de Riemann son cero,
o sea que el espacio es plano. El diferencial de longitud es la raı́z cuadrada
del intervalo:
p
ds = dr2 + r2 dθ2 + r2 sen2 θ dϕ2

Pensemos en una circunferencia ecuatorial de radio a. Los puntos de esta

233
circunferencia tienen θ = π/2, dθ = 0, r = a, dr = 0. A lo largo de la
circunferencia el elemento
R Rde longitud es ds = adϕ, y la longitud total de la
circunferencia es ds = a dϕ = 2πa. Ahora calculemos el radio. La lı́nea
radial pasa por el centro
R de coordenadas
R y tiene θ = π/2, dθ = dϕ = 0, y la
longitud del radio es ds = dr = a. Al dividir circunferencia sobre radio
se obtiene 2πa/a = 2π, que es el mismo resultado de la geometrı́a euclidiana.

Inmersos en este espacio tridimensional plano puede haber subespacios bidi-


mensionales curvos, como el que estudiaremos enseguida. Consideremos un
espacio bidimensional con intervalo ds2 = a2 dθ2 + a2 sen2 θ dϕ2 . Para esta
geometrı́a el tensor métrico es
" #
[2]
a2 0
g µν = (9.93)
0 a2 sen2 θ

El tensor de Riemann tiene una componente que difiere de cero: R[2] 1212 =
a2 sen2 θ; por esta razón podemos afirmar que el espacio bidimensional es
curvo. El diferencial de longitud es la raı́z cuadrada del intervalo:
p
ds = a2 dθ2 + a2 sen2 θ dϕ2

Pensemos en una circunferencia ecuatorial de radio a. Los puntos de esta


circunferencia tienen θ = π/2, dθ = 0. A lo largo de la circunferencia el
elemento
R deR longitud es ds = adϕ, y la longitud total de la circunferencia
es ds = a dϕ = 2πa. Ahora calculemos el radio. La lı́nea radial pasa por
el polo norte o por el polo sur, o sea que la longitud del radio es la cuarta
parte de la longitud de la circunferencia, es decir πa/2. Al dividir circunfer-
encia sobre radio se obtiene 2πa/(πa/2) = 4, que es diferente al resultado
de la geometrı́a euclidiana. Cuando, al estudiar un espacio, descubrimos que
se puede trazar un cı́rculo tal que el cociente de circunferencia sobre radio
no es 2π, podemos asegurar que el espacio no es euclidiano y que es curvo.
Terminado este ejemplo, regresemos a las consideraciones generales sobre
curvatura en un espacio de Riemann.

Rαβ y R no son indicadores de curvatura; el único indicador de curvatu-


ra es Rα βµν . Pensemos en un espacio curvo; aunque algunas componentes
Rα βµν sean diferentes de cero, puede ocurrir que todas las Rαβ sean cero y,
en consecuencia, R también sea cero: en este caso, aunque el tensor de Ricci
y el escalar de curvatura sean cero, es espacio es curvo:

234
R = 0 ; espacio plano
Todas las Rαβ = 0 ; espacio plano (9.94)
Todas las Rα βµν = 0 ⇒ espacio plano

R 6= 0 ⇒ espacio curvo
Alguna Rαβ 6= 0 ⇒ espacio curvo (9.95)
α
Alguna R βµν 6= 0 ⇒ espacio curvo

La curvatura es una propiedad intrı́nseca de un espacio. Con la palabra in-


trı́nseca queremos decir que la curvatura no depende de cuál es el sistema
de coordenadas usado. Si el tensor de Riemann es cero en unas coordenadas,
será cero en todos los sistemas coordenados; es decir, si un espacio aparece
plano en unas coordenadas, aparecerá plano en todos los sistemas coordena-
dos: un espacio plano no se puede curvar con ningún cambio de coordenadas.
Un espacio curvo no se puede aplanar con ningún cambio de coordenadas.

La curvatura es una propiedad local. El tensor de Riemann es un campo, es


decir, una cantidad que cambia de punto a punto del espacio. Ası́ mismo,
la curvatura es una propiedad local. Un espacio puede ser curvo en unos
puntos y plano en otros.

En varias secciones de este libro nos dedicaremos a estudiar una propiedad


importante que tienen los espacios de Riemann, curvos o planos. Se escoge
un punto cualquiera E. Se puede adaptar un sistema de coordenadas de
manera que el tensor métrico, al evaluarse en E, sea diag(±1, ±1, ±1, · ·
·). Más aun, podremos escoger estas coordenadas de modo que todas las
primeras derivadas del tensor métrico, al evaluarse en E, den cero: gµν (E) =
diag(±1, ±1, ±1, · · ·), gµν ,α (E) = 0. En vista del enunciado (9.59), podemos
decir que

gµν (E) = diag(±1, ±1, ±1, · · ·), Γα µν (E) = 0 (9.96)

Al escribir (E) estamos enfatizando que las condiciones (9.96) se cumplen


únicamente en el punto E escogido. En general, en otros puntos del espacio,
el tensor métrico no será diag(±1, ±1, ±1, · · ·) ni los sı́mbolos de Christoffel
serán cero. Demostraremos que (9.96) es posible en todos los casos: si en el
punto E el espacio es curvo, o si es plano. La demostración no es difı́cil, pero
sı́ es larga, y nos tomará las secciones 9.16, 9.20, 9.21 y 11.3.

235
9.16 Coordenadas adaptadas
Teorema. Es posible [13] erigir un sistema adaptado de coordenadas tal
que, en algún punto E del espaciotiempo, todos los sı́mbolos de Christoffel
valgan cero.

Sea xµ un sistema general, cualquiera, de coordenadas, sin ninguna restric-


ción, y sea E un evento cualquiera. Vamos a construir en E un sistema de
coordenadas adaptadas, que llamaremos x̃µ , y que tiene la siguiente pecu-
liaridad: en las coordenadas x̃µ , todos los sı́mbolos de Christoffel valen cero
cuando se evalúan en E. Para demostrar el teorema propondremos un cam-
bio de coordenadas xµ → x̃µ y enseguida demostraremos que en las nuevas
coordenadas los sı́mbolos Γ̃ dan cero cuando se les evalúa en E. Empecemos
pues proponiendo este cambio de coordenadas:

1 µ
x̃µ = (xµ − xµE ) + Γ αβ (xα − xαE )(xβ − xβE ) (9.97)
2

Debemos ahora transformar los sı́mbolos de Christoffel a las nuevas coorde-


nadas x̃µ , para lo cual utilizamos la fórmula (9.64):

∂ x̃µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x̃µ


Γ̃µ αβ = Γ στ − (9.98)
∂xν ∂ x̃α ∂ x̃β ∂ x̃α ∂ x̃β ∂xσ ∂xν

Para desarollar esta fórmula se toma la derivada en ambos lados de la


ecuación (9.97):

∂ x̃µ 1
ν
= gν µ + Γµ αβ , ν (xα − xαE )(xβ − xβE ) + Γµ αβ (xα − xαE )gν β
∂x 2
2
∂ x̃µ 1
σ ν
= Γµ αβ , ν , σ (xα − xαE )(xβ − xβE ) + Γµ αβ , ν (xα − xαE )gσ β
∂x ∂x 2
+ Γµ αν , σ (xα − xαE ) + Γµ αν gσ α

Ya que debemos evaluar estas derivadas en E, hacemos xα = xαE :

¯ ¯
∂ x̃µ ¯¯ ∂ 2 x̃µ ¯¯
= gν µ = Γµ σν |E (9.99)
∂xν ¯E ∂xσ ∂xν ¯E

236
¯
¯
Cuando ponemos estos valores en (9.98) se obtiene Γ̃µ αβ ¯ = 0, que es lo
E
que querı́amos demostrar.

Veamos cómo transforman las componentes de los tensores cuando se hace


el cambio de coordenadas xµ → x̃µ . Tomemos un tensor cualquiera (llamar-
lo T µν , por ejemplo); de acuerdo con la regla general de transformaciones
(9.20) podemos escribir

∂ x̃µ ∂ x̃ν αβ
T̃ µν = T
∂xα ∂xβ

Esta fórmula dice que en un punto cualquiera, arbitrario, del espacio, T̃ µν


no es igual a T µν . Pero en el punto E las derivadas son deltas de Kronecker,
según (9.99), y en consecuencia T̃Eµν = g µ α g ν β TEαβ = TEµν . En palabras: en el
punto E, las componentes de los tensores en coordenadas xµ son iguales a las
componentes en coordenadas x̃µ . Como casos particulares de este resultado
general mencionemos el tensor métrico y el tensor de Riemann:

µν µν αβµν αβµν
g̃E = gE R̃E = RE (9.100)

Ya que en el punto E y en coordenadas adaptadas x̃µ los sı́mbolos de


Christoffel son cero, la derivada covariante (;) es igual a la derivada cor-
riente (,), lo que representa una simplificación considerable. Esto nos mueve
a trazar una estrategia general de simplificación de los procesos matemáticos.
Pensemos por ejemplo que queremos demostrar la validez de una ecuación
que tiene una derivada covariante. Si queremos demostrar la ecuación en
cualquier sistema coordenado xµ , la derivada covariante nos obliga a calcu-
lar los Γµ αβ , y esto es dispendioso. La idea es escoger un punto, llamarlo
¯ Ey
µ µ ¯
erigir un sistema de coordenadas adaptadas x̃ . Hemos visto que Γ̃ αβ ¯ = 0
E
y, en consecuencia, la derivada covariante (;) se reduce a la derivada corri-
ente (,), que es más fácil de manejar. Si logramos demostrar la ecuación
en coordenadas x̃µ , la fórmula (9.52) nos asegura que la prueba será válida
también en cualquier otro sistema de coordenadas xµ . En la próxima sección
usaremos esta estrategia para demostrar la validez de la primera identidad
de Bianchi (9.86).

Finalmente, en vista de (9.58), el teorema de esta sección dice que es posible

237
erigir un sistema adaptado de coordenadas x̃µ tal que, en algún punto E del

espaciotiempo, todas las primeras derivadas g̃αβ , µ = g̃αβ sean cero.
∂ x̃µ

9.17 Las identidades de Bianchi


Ya estamos en condición de demostrar las identidades de Bianchi (9.86) y
(9.87). Comenzaremos con la primera, (9.86). Montamos un sistema coor-
denado x̃µ adaptado al punto E. En estas nuevas coordenadas el tensor de
Riemann y el sı́mbolo de Christoffel se escriben con tilde: R̃αβµν y Γ̃αβµ . De
acuerdo con la definición (9.77) :

R̃αβµν = Γ̃αβµ , ν − Γ̃αβν , µ − Γ̃σβν Γ̃ασµ + Γ̃σβµ Γ̃ασν

Evaluar esta ecuación en el evento E, donde los sı́mbolos de Christoffel Γ̃


son cero:
¯ ³ ´¯
¯ ¯
R̃αβµν ¯ = Γ̃αβµ , ν − Γ̃αβν , µ ¯ (9.101)
E E


Tomar la derivada :
∂ x̃σ
¯ ³ ´¯
¯ ¯
R̃αβµν , σ ¯ = Γ̃αβµ , ν , σ − Γ̃αβν , µ , σ ¯ . Ası́ también:
E E
¯ ³ ´¯
¯ ¯
R̃αβσµ , ν ¯ = Γ̃αβσ , µ , ν − Γ̃αβµ , σ , ν ¯
E E
¯ ³ ´¯
¯ ¯
R̃αβνσ , µ ¯ = α α
Γ̃ βν , σ , µ − Γ̃ βσ , ν , µ ¯
E E

Sumar lado a lado estas tres ecuaciones para obtener

³ ´¯
¯
R̃αβµν , σ + R̃αβσµ , ν + R̃αβνσ , µ ¯ = 0
E

Como en estas coordenadas adaptadas las derivadas corriente y covariante


coinciden, podemos cambiar los signos (,) por los signos (;):

³ ´¯
¯
R̃αβµν ; σ + R̃αβσµ ; ν + R̃αβνσ ; µ ¯ = 0
E

238
Esta ecuación covariante es válida en un sistema de coordenadas x̃µ . La
fórmula (9.53) asegura que también es válida en cualquier otro sistema xµ :

¡ α ¢¯
R βµν ; σ + Rα βσµ ; ν + Rα βνσ ; µ ¯E = 0

La escritura enfatiza que la ecuación es válida en el punto E. Pero lo que


hicimos para E también se puede hacer para cualquier otro punto, o sea que
la ecuación es válida en todos los puntos del espacio:

Rα βµν ; σ + Rα βσµ ; ν + Rα βνσ ; µ = 0 (9.102)

Hemos probado ası́ la primera identidad de Bianchi (9.86). Demostremos


ahora la segunda. En (9.102) hacer µ = α:

Rα βαν ; σ + Rα βσα ; ν + Rα βνσ ; α = 0


↓ ↓ ↓
α
−R βνα ; σ Rσβ ; ν g αρ Rρβνσ ; α
↓ ↓
−Rβν ; σ g αρ Rνσρβ ; α

La ecuación queda entonces:

−Rβν ; σ + Rσβ ; ν + g αρ Rνσρβ ; α = 0

Multiplicar por g βν y utilizar la propiedad (9.79):

−R; σ + Rν σ ; ν + g αρ g βν Rνσρβ ; α = 0

−R; σ + Rν σ ; ν + Rα σ ; α = 0

Es decir

1
Rα σ ; α − R;σ = 0 (9.103)
2

239
1
(Rα σ − g α σ R); α = 0
2

Quedan entonces demostradas las identidades de Bianchi. Esta última iden-


tidad la queremos presentar en una forma ligeramente diferente, que nos
será útil más tarde. Multiplicando la ecuación (9.103) por g µσ escribimos
Rαµ ; α = 12 g µσ R;σ , y como Rαµ = Rµα tenemos Rµα ; α = 12 g µσ R;σ , es decir:

1
Rµν ; ν = g µν R;ν (9.104)
2

Esta fórmula es equivalente a la identidad de Bianchi. Ahora ataquemos el


problema de demostrar que

9.18 El tensor de Riemann es el único


que contiene linealmente las primeras derivadas del sı́mbolo de Christoffel
Γ. Lo demostraremos [13] siguiendo este derrotero: calcular las derivadas
Γα µν , δ , averiguar cómo transforman ( y darse cuenta de que no son ten-
sores), proponer una combinación lineal de derivadas Γα µν , δ que sı́ trans-
forma como un tensor (al que llamaremos Rρ ξη , σ ), probar que este tensor
Rρ ξη , σ es igual al tensor de Riemann Rρ ξη , σ y, finalmente, demostrar que
siempre se llega al tensor Rρ ξη , σ y no a otro.

∂xσ
Multiplicar ambos lados de (9.63) por :
∂x0µ

∂xσ 0µ ∂xρ ∂xω σ ∂ 2 xσ


Γ αβ = Γ ρω +
∂x0µ ∂x0α ∂x0β ∂x0α ∂x0β


Tomemos la derivada en ambos lados de esta ecuación:
∂x0κ

∂xσ ∂Γ0µ αβ ∂ 2 xσ 0µ ∂xρ ∂xω ∂Γσ ρω


+ Γ αβ =
∂x0µ ∂x0κ ∂x0κ ∂x0µ ∂x0α ∂x0β ∂x0κ
µ ρ ¶
σ ∂ ∂x ∂xω ∂ 3 xσ
+ Γ ρω +
∂x0κ ∂x0α ∂x0β ∂x0κ ∂x0α ∂x0β

240
∂Γσ ρω ∂xη ∂Γσ ρω
En el primer término del lado derecho hacemos = , y la
∂x0κ ∂x0κ ∂xη
ecuación queda:

∂xσ ∂Γ0µ αβ ∂ 2 xσ 0µ ∂xρ ∂xω ∂xη ∂Γσ ρω


+ Γ αβ =
∂x0µ ∂x0κ ∂x0κ ∂x0µ ∂x0α ∂x0β ∂x0κ ∂xη
µ ρ ¶
σ ∂ ∂x ∂xω ∂ 3 xσ
+ Γ ρω +
∂x0κ ∂x0α ∂x0β ∂x0κ ∂x0α ∂x0β

∂x0λ
Multiplicar ambos lados por y reordenar términos:
∂xσ

∂Γ0λ αβ ∂x0λ ∂xρ ∂xω ∂xη Γσ ρω ∂x0λ ∂ 3 xσ


= +
∂x0κ ∂xσ ∂x0α ∂x0β ∂x0κ ∂xη ∂xσ ∂x0κ ∂x0α ∂x0β
µ ¶
∂x0λ ∂ ∂xρ ∂xω ∂x0λ ∂ 2 xσ
+ Γσ ρω − Γ 0µ
αβ
∂xσ ∂x0κ ∂x0α ∂x0β ∂xσ ∂x0κ ∂x0µ

Y en notación con comas:

∂x0λ ∂xρ ∂xω ∂xη σ ∂x0λ ∂ 3 xσ


Γ 0λ αβ , κ = Γ ρω , η +
∂xσ ∂x0α ∂x0β ∂x0κ ∂xσ ∂x0κ ∂x0α ∂x0β
µ ¶
∂x0λ ∂ ∂xρ ∂xω ∂x0λ ∂ 2 xσ
+ Γσ ρω − Γ0µ
αβ
∂xσ ∂x0κ ∂x0α ∂x0β ∂xσ ∂x0κ ∂x0µ

Observemos bien esta ecuación. Si en el lado derecho hubiera únicamente


el primer término, podrı́amos decir que Γλ αβ , κ es un tensor. Pero el lado
derecho tiene más términos, y por eso las derivadas Γλ αβ , κ no son tensores.
En seguida veremos que hay una combinación lineal de estas derivadas que
sı́ es tensor.

Cambiemos ahora la notación: escribimos x̃µ en vez de xµ , y escribimos


x̃0µ en vez de x0µ :

∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ∂ x̃0λ ∂ 3 x̃σ


Γ̃ 0λ αβ , κ = Γ̃ ρω , η +
∂ x̃σ ∂ x̃0α ∂ x̃0β ∂ x̃0κ ∂ x̃σ ∂ x̃0κ ∂ x̃0α ∂ x̃0β
µ ¶
∂ x̃0λ ∂ ∂ x̃ρ ∂ x̃ω 0µ ∂ x̃0λ ∂ 2 x̃σ
+ Γ̃σρω − Γ̃ αβ ∂ x̃σ ∂ x̃0κ ∂ x̃0µ
∂ x̃σ ∂ x̃0κ ∂ x̃0α ∂ x̃0β

241
Supongamos en este momento que tanto las x̃µ como las x̃0µ son coordenadas
adaptadas al punto E. Vamos a evaluar la última ecuación en E, recordando
que en ese punto Γ̃ = Γ̃0 = 0:

¯ ¯ ¯
¯ ∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ¯ ∂ x̃0λ ∂ 3 x̃σ ¯

Γ̃ αβ , κ ¯ = ¯
Γ̃ ρω , η ¯ + ¯
E σ 0α 0β
∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ 0κ ∂ x̃σ ∂ x̃ 0κ ∂ x̃0α ∂ x̃0β ¯
E E
(9.105)

Sea G el grupo de todas las transformaciones de coordenadas, y sea G 0 el


subgrupo de las transformaciones que llevan de unas coordenadas adaptadas
a otras adaptadas. Observemos la ecuación (9.105). Si en el lado derecho
hubiera únicamente el primer término, podrı́amos decir que Γ̃ 0λ αβ , κ es un
tensor bajo el subgrupo G 0 . Pero el lado derecho tiene otro término, y por eso
Γ̃ 0λ αβ , κ no es un tensor bajo el subgrupo G 0 . En seguida veremos que hay
una combinación lineal de estas derivadas que sı́ es tensor bajo el subgrupo
G 0 . Se trata de erradicar al segundo término del lado derecho de (9.105), y
esto no es difı́cil. En efecto, notemos que el segundo término del lado derecho
de (9.105) es simétrico bajo la permutación κ ® β ; entonces, si en ambos
lados de (9.105) restamos la permutación κ ® β , debe desaparecer el térmi-
no incómodo:
³ ´¯
¯
Γ̃ 0λ αβ , κ − Γ̃ 0λ ακ , β ¯
E

µ ¶¯
∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ¯
= σ 0α 0β 0κ
Γ̃ ρω , η − σ 0α 0κ 0β
Γ̃ ρω , η ¯¯
∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ E

En el segundo término del lado derecho intercambiar los nombres de los


ı́ndices η y ω:
³ ´¯
¯
Γ̃ 0λ αβ , κ − Γ̃ 0λ ακ , β ¯
E

µ ¶¯
∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ∂ x̃0λ ∂ x̃ρ ∂ x̃η ∂ x̃ω σ ¯
= σ 0α 0β 0κ
Γ̃ ρω , η − σ 0α 0κ 0β
Γ̃ ρη , ω ¯¯
∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ E

∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η ³ σ ´¯¯


= Γ̃ ρω , η − Γ̃ ρη , ω ¯¯
σ
∂ x̃σ ∂ x̃0α ∂ x̃0β ∂ x̃0κ E

Definiendo

242
¯ ³ ´¯
¯ ¯
R̃ αβκ ¯ = Γ̃ λ αβ , κ − Γ̃ λ ακ,β ¯ ,
λ
(9.106)
E E

podemos escribir

¯ ¯
0λ ¯ ∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ¯¯
R̃ αβκ ¯ = R̃ ρωη ¯ (9.107)
E ∂ x̃σ ∂ x̃0α ∂ x̃0β ∂ x̃0κ E

Esta ecuación dice que, en el punto E, la cantidad R̃ λ αβκ transforma como


un tensor bajo el grupo G 0 . Por el momento comparemos las ecuaciones
(9.101) y (9.106) para afirmar que
¯ ¯
¯ ¯
R̃ λ αβκ ¯ = R̃ λ αβκ ¯ (9.108)
E E

En palabras: en el punto E y en coordenadas adaptadas, R̃ λ αβκ coincide


con el tensor de Riemann. λ
¯ Pero R̃ αβκ es tensor bajo G, entonces la ecuación
¯
(9.108) dice que R̃ λ αβκ ¯ también es tensor bajo G.
E

Ahora, si dos tensores son iguales en un sistema coordenado,¯ también serán


¯
¯ ¯
iguales en otro sistema coordenado, lo que se escribe R̃ λ αβκ ¯ = R̃ λ αβκ ¯
¯ ¯ E E
⇒ R λ αβκ ¯E = R λ αβκ ¯E . Anotemos finalmente que lo hecho para el pun-
to E también se puede hacer para cualquier otro punto; esto nos per-
mite afirmar que en todos los puntos del espacio se cumple la igualdad
R λ αβκ = R λ αβκ .

Nuestro interés ha sido construir un tensor que contenga linealmente las


primeras derivadas del sı́mbolo de Christoffel, y hemos encontrado que ese
tensor es el tensor de Riemann. Debemos además probar que fuera del ten-
sor de Riemann no hay otro tensor que contenga linealmente las primeras
derivadas del sı́mbolo de Christoffel. Esto es fácil. Cuando rastreamos ha-
cia atrás el camino recorrido encontramos que hay otra ruta posible: para
erradicar el término incómodo de (9.105) nosotros restamos la permutación
κ ® β ; pero el término incómodo también se puede erradicar restando la
permutación κ ® α ; en tal caso terminamos, no en R λ αβκ , sino en R λ βακ .
Claramente, esta segunda ruta produce otra componente del tensor de Rie-
mann, pero no produce un tensor diferente al de Riemann. En conclusión,
las dos rutas llegan al mismo tensor. En vista de (9.59) podemos afirmar
que

243
R λ αβκ es el único tensor en el que:
1) Aparecen las derivadas gµν ,α y gµν ,α,β (9.109)
2) Las gµν ,α,β aparecen linealmente.

Rµν y R también son únicos: Veamos que cuando se contraen dos ı́ndices
en el tensor de Riemann, siempre se produce el tensor de Ricci. Analicemos
en detalle las posibles contracciones de Rαβµν para producir un tensor de
rango dos:

Contraer α y ν : g να Rαβµν = Rβµ

Contraer α y µ : g µα Rαβµν = −g µα Rαβνµ = −Rβν

Contraer α y β : g αβ Rαβµν = 0

Contraer β y µ : g βµ Rαβµν = g βµ Rβανµ = Rαν

Contraer β y ν : g βν Rαβµν = −g βν Rβαµν = −Rαµ

Vemos ası́ que siempre se termina en el tensor de Ricci. De otro lado, es


claro que con Rµν hay una sóla contracción posible, que es R. En conclusión:

El único tensor de rango dos que se puede obtener


(9.110)
a partir de R λ αβκ es Rµν , y el único escalar es R .

9.19 Obligar al tensor métrico a que,


en cierto evento, tome algún valor
que nosotros queramos
Teorema: Es posible erigir un sistema de coordenadas x̄µ de tal manera
que el tensor métrico tome, en algún punto E del espacio, cualquier valor
que nosotros arbitrariamente queramos.

Para demostrar este teorema supongamos que tenemos un sistema de co-


ordenadas xµ , con métrica g αβ . Vamos a hacer una transformación a otro
sistema coordenado x̄µ ; pero no una transformación cualquiera, sino lineal:

x̄µ = bµ ν xν , (9.111)

244
con bµ ν constante. Derivando dos veces se encuentra:

∂ 2 x̄µ
=0 (9.112)
∂xσ ∂xν

Ahora usamos la ecuación (9.20) para calcular el tensor métrico en las nuevas
coordenadas:
∂ x̄µ ∂ x̄ν αβ
ḡ µν = g ,
∂xα ∂xβ

y utilizando (9.111):

ḡ µν = bµ α bν β g αβ (9.113)

Esta ecuación es válida en todos los puntos del espacio. En particular, en el


punto E :

ḡ µν (E) = bµ α bν β g αβ (E) (9.114)

Asignemos a las componentes ḡ µν (E) cualesquiera valores que nosotros ar-


bitrariamente queramos darles. La cuestión importante es esta: ¿Acaso esta-
mos construyendo un ḡ µν (E) contradictorio, sin consistencia interna? ¿Ten-
emos realmente plena libertad para asignar a las componentes ḡ µν (E) los val-
ores que caprichosamente queramos? La pregunta se concreta de la manera
siguiente: ¿existe el conjunto de coeficientes bµ ν capaz de llevar del g µν (E)
inicial al ḡ µν (E) caprichoso? Veremos que sı́ existe el conjunto de coeficientes
bµ ν , es decir, que los datos (que son g µν (E) y ḡ µν (E)) admiten la existencia
de los coeficientes bµ ν .

Para demostrar que los datos son compatibles con los coeficientes bµ ν , tomamos
a estos bµ ν como si fueran incógnitas, y nos preguntamos si acaso hay su-
ficientes ecuaciones para averiguar las n2 las incógnitas. Como el tensor
métrico es de dos ı́ndices, tiene n2 componentes; pero además es simétrico,
entonces sólo tiene (n2 +n)/2 componentes independientes. Esto nos permite
afirmar que (9.114) es un conjunto de (n2 + n)/2 ecuaciones independientes.
Tenemos pues (n2 + n)/2 ecuaciones y n2 incógnitas; pero n2 >(n2 + n)/2 , es

245
decir, hay más incógnitas que ecuaciones: el sistema de ecuaciones está sub-
determinado, y por consiguiente hay un número infinito de soluciones para
las incógnitas bµ α . En conclusión, sı́ es posible asignar a las componentes
ḡ µν (E) los valores que nosotros arbitrariamente queramos darles2 . Pensan-
do en una matriz b cuyas entradas son bµ α , la ecuación 9.114) se escribe
concisamente de la manera siguiente:

ḡ µν (E) = b g αβ (E) bT (9.115)

Como hay un número infinito de soluciones para la matriz b , no podemos


aspirar a deducirla. Esta matriz b se averigua por inspección directa de la
ecuación (9.115): en esta fórmula las variables ḡ µν (E) y g µν (E) son datos.

Podemos escoger las componentes de ḡ µν (E) arbitrariamente, o las de ḡ µν (E 0 ),


o las de ḡ µν (E 00 ) ... Pero no podemos escoger arbitrariamente las de ḡ µν (E)
y las de ḡ µν (E 0 ) y las de ḡ µν (E 00 )...Esto es claro, ya que para obtener ḡ µν (E)
se necesita hacer una transformación de coordenadas (un conjunto de coefi-
cientes bµ ν ) y para obtener ḡ µν (E 0 ) se necesita otra transformación.

Escribamos de qué manera quedan el tensor métrico y el de Riemann de-


spués de esta transformación de coordenadas, siguiendo las fórmulas (9.113)
y (9.80):

ḡ µν = bµ ρ bν σ g ρσ R̄αβµν = bα ρ bβ σ bµ δ bν π Rρσδπ (9.116)

9.20 Dos transformaciones sucesivas


Ahora vamos a considerar dos transformaciones: xµ → x̃µ → x̄µ . La primera
transformación sigue al teorema de la sección 9.16 y la segunda sigue al teo-
rema de la sección 9.19. Más precisamente: en las coordenadas xµ el tensor
métrico es g µν y los sı́mbolos de Christoffel son Γα µν . En coordenadas x̃µ
el tensor métrico es g̃ µν y los sı́mbolos de Christoffel, evaluados en E , son
cero. En coordenadas x̄µ el tensor métrico es ḡ µν y los sı́mbolos de Christof-
fel, evaluados en E , siguen siendo cero. El tensor ḡ µν , evaluado en E , tiene
cualesquiera componentes que nosotros queramos.
2
Algo similar ocurre en la teorı́a newtoniana de la gravitación. El potencial gravitacional
Φ puede ser subido o bajado a nuestro amaño para que Φ adopte, en un punto dado,
cualquier valor que nosotros queramos darle.

246
Uno podrı́a poner en duda que en las últimas coordenadas x̄ los sı́mbo-
los de Christoffel Γ̄ (E) sigan siendo cero. Esta duda es justificada porque,
sabido que los Γ̃(E) se volvieron cero en la primera transformación, ¿cómo
garantizamos que siguen siendo cero después de la segunda transformación
de coordenadas? En otras palabras: ¿cómo garantizamos que las x̄ sean coor-
denadas adaptadas? Pues ası́ ocurre, verdaderamente; en efecto, utilizando
la fórmula (9.64) para escribir la transformación x̃ → x̄ encontramos:

∂ x̄µ ∂ x̃σ ∂ x̃τ ν ∂ x̃ν ∂ x̃σ ∂ 2 x̄µ


Γ̄µ αβ = Γ̃ στ −
∂ x̃ν ∂ x̄α ∂ x̄β ∂ x̄α ∂ x̄β ∂ x̃σ ∂ x̃ν

Esta ecuación es válida en todo el espacio, y Γ̄µ αβ no es, en general, cero;


pero en E sı́ es cero. En efecto, en E ambos términos del lado derecho son
cero: el primer término porque Γ̃ν στ (E) = 0, y el segundo término por
(9.112). En conclusión, en el punto E no sólo Γ̃ = 0 , también Γ̄ = 0 .

La segunda transformación x̃ → x̄ es, de acuerdo con las fórmulas (9.111) y


(9.116), ası́:

x̄µ = bµ ρ x̃ρ , ḡ µν = bµ ρ bν σ g̃ ρσ , R̄αβµν = bα ρ bβ σ bµ δ bν π R̃ρσδπ ,

y en vista de (9.97) y (9.100):

1 µ ρ
x̄µ = bµ ρ (xρ − xρE ) + b ρ Γ δπ (xδ − xδE )(xπ − xπE ) (9.117)
2
ḡ µν = bµ ρ bν σ g ρσ (9.118)

R̄αβµν = bα ρ bβ σ bµ δ bν π Rρσδπ (9.119)

Hagamos una breve recopilación de la doble transformación:

Se escoge un punto E . Se conoce la métrica g µν en las coordenadas ini-


ciales xµ . Uno quiere que la métrica final, evaluada en el punto E , sea
ḡ µν (E) . O sea que E , g µν y ḡ µν (E) son datos. La pregunta es ¿cómo son las
coordenadas finales x̄µ y cómo son las componentes de los tensores en es-
tas coordenadas finales? Para resolver esta pregunta se siguen los siguientes

247
pasos: Se escribe la ecuación (9.115) y, por inspección, se averigua la matriz
b . Conocidos los coeficientes bα ρ , uno ejecuta las tres ecuaciones (9.117)-
(9.119). Debe resaltarse que estas tres ecuaciones son válidas en todos los
puntos del espacio. Finalmente, nótese que en estas ecuaciones no aparecen
cantidades del tipo x̃µ , g̃ µν ni R̃αβµν , que corresponden a las coordenadas in-
termedias; en otras palabras, estas ecuaciones muestran una transformación
directa xµ → x̄µ , sin vestigios de la transformación intermedia xµ → x̃µ .

9.21 Un ejemplo

A continuación traemos un ejemplo de la doble transformación. En la sección


13.1 tendremos ocasión de estudiar un problema de primera importancia,
que es el campo gravitatorio ocasionado por una masa puntual M . Veremos
que el tensor métrico está dado por la matriz (13.14); en esa expresión la
variable s , que se llama el radio de Schwarzschild, quiere decir 2GM/c2 . O
sea que aunque s tiene unidades de longitud, representa a la masa M , de
modo que el lı́mite del espacio plano, que corresponde a M = 0 , se obtiene
haciendo s = 0 en la ecuación (13.14), lo que da como resultado la ecuación
(9.44). También veremos, en la sección 13.2, las componentes no nulas de
los sı́mbolos de Christoffel y del tensor de Riemann.

En las coordenadas iniciales xµ = (ct, r, θ, ϕ) el evento E tiene coordenadas


xµE = (ctE , rE , θE , ϕE ) y el tensor métrico está dado por (13.14). Este tensor,
evaluado en E , es:

 
(1 − s/rE )−1 0 0 0
 
 
 0 −(1 − s/rE ) 0 0 
 
g (E) = 
µν



 0 0 −2
−rE 0 
 
 
0 0 0 −(rE sen θE )−2
(9.120)

De otro lado, queremos que en las coordenadas finales x̄µ el tensor métrico,
al evaluarse en E , sea (9.44):

248
 
1 0 0 0
 
 
 0 −1 0 0 
 
ḡ (E) = 
µν


 (9.121)
 0 0 −r−2 0 
 E 
 
0 0 0 −(rE sen θE )−2

Para averiguar la matriz b debemos poner las matrices (9.120) y (9.121) en


la ecuación (9.115). Al hacerlo nos damos cuenta, por simple inspección, de
que una b posible es la siguiente matriz diagonal:

à !
p 1
b = bT = diag 1 − s/rE , p ,1,1 (9.122)
1 − s/rE

Conocida la matriz b , es muy fácil calcular las componentes R̄αβµν del tensor
de Riemann en las coordenadas finales x̄µ . Para tal efecto se ponen las vie-
jas componentes Rρσδπ (de la sección 13.2) y la matriz (9.122) en la fórmula
(9.119), obteniéndose:
s
R̄0101 = R̄1010 = −R̄1001 = −R̄0110 =
r3
s(1 − s/rE )
R̄0202 = R̄2020 = −R̄2002 = −R̄0220 = −
2r5 (1 − s/r)
s(1 − s/rE )
R̄0303 = R̄3030 = −R̄3003 = −R̄0330 = − 5
2r (1 − s/r) sin2 θ
s(1 − s/r)
R̄1212 = R̄2121 = −R̄2112 = −R̄1221 =
2r5 (1 − s/rE )
s(1 − s/r)
R̄1313 = R̄3131 = −R̄3113 = −R̄1331 =
2r5 (1 − s/rE ) sin2 θ
s
R̄2323 = R̄3232 = −R̄3223 = −R̄2332 = − 7 2
r sin θ
Para calcular el tensor métrico ḡ µν en las coordenadas finales x̄µ debemos
colocar las matrices (13.14) y (9.122) en la fórmula (9.118) para obtener:

249
 
1 − s/rE
 1 − s/r 0 0 0 
 
 
 
 1 − s/r 
 0 − 0 0 
ḡ µν
=
 1 − s/rE 
 (9.123)
 
 
 0 0 −r−2 0 
 
 
0 0 0 −(r sen θ)−2

Es interesante apuntar que pudimos calcular los R̄αβµν y los ḡ µν sin necesi-
dad de averiguar antes las coordenadas finales x̄µ . No sobra, sin embargo,
que presentemos estas coordenadas finales. Para calcularlas se utilizan los
términos de Christoffel de la sección 13.2 y la matriz (9.122) en la fórmula
(9.117), llegándose a:
p
x̄0 = 1 − s/rE (ct − ctE )

1 h s(1 − s/r)(ct − ctE )2 s(r − rE )2


x̄1 = p 2(r − rE ) + 2
− 2
2 1 − s/rE 2r 2r (1 − s/r)
i
− r(1 − s/r)(θ − θE )2 − r(1 − s/r)(sen θ)2 (ϕ − ϕE )2

1 1
x̄2 = θ − θE + (r − rE )(θ − θE ) − sen θ cos θ(ϕ − ϕE )2
r 2
1
x̄3 = ϕ − ϕE + (r − rE )(ϕ − ϕE ) + cot θ (θ − θE )(ϕ − ϕE )
r

El espacio no es plano en el evento E . En el evento E ocurren dos


cosas interesantes: 1) la métrica (9.121) es la misma (9.44) del espaciotiempo
plano; y 2) los sı́mbolos de Christoffel son cero, como ocurre en el espaci-
otiempo plano. En vista de estas dos propiedades uno podrı́a precipitarse a
afirmar que en E el espaciotiempo es plano, pero esta afirmación es falsa, ya
que el espaciotiempo descrito por (9.123) no es plano ni en E ni en ningún
otro evento. Ya hemos visto que lo que indica si un espacio es plano o curvo
es el tensor de Riemann: acabamos de demostrar que algunas componentes
de este tensor difieren de cero, y por eso el espaciotiempo descrito por (9.123)
es curvo.

El ejemplo que acabamos de estudiar, aunque se refiere a un espacio particu-


lar de dimensión 4, pone de presente una propiedad general: en todo espacio

250
de Riemann, de cualquier dimensión n, es posible construir un sistema de
coordenadas adaptadas a un punto (llamémoslo E), de modo que en E la
métrica y los sı́mbolos de Christoffel sean como los de un espacio plano. A
primera vista se podrı́a creer que el espacio se ha aplanado en E , pero ese
pensamiento es erróneo: la curvatura o planitud del espacio en E es una
propiedad intrı́nseca de la geometrı́a, tal como habı́amos mencionado en la
página 235.

Damos por terminada la tarea que nos habı́amos planteado en la página


235: demostrar que es posible adaptar al punto E un sistema de coorde-
nadas de modo que se cumplan las dos condiciones (9.96). Esto nos dota de
herramientas suficientes para construir una teorı́a general de la relatividad,
asunto que nos ocupará a partir del capı́tulo 11.

251
252
Capı́tulo 10

Las geodésicas

Pensemos en dos puntos P1 y P2 en la superficie de una esfera. Existe un


número infinito de curvas que pasan por ambos puntos, a lo largo de las
cuales se puede medir la distancia P1 P2 . Nos preguntamos ahora en cuál de
las curvas la distancia P1 P2 resulta mı́nima, y la respuesta es bien conocida:
en el arco menor del cı́rculo máximo que pasa por ambos puntos.

El cálculo elemental nos enseña que una función se minimiza cuando se


anula una primera derivada, es decir, cuando la función es estacionaria. En
nuestro caso decimos que a lo largo del arco menor la distancia es esta-
cionaria: el cálculo de la distancia arroja el mismo resultado bien sea que se
ejecute a lo largo del arco menor o a lo largo de cualquier otra curva, muy
cercana al arco menor, que pase por P1 y P2 .

Para cualquier geometrı́a, en general, la geodésica se define como aquella


curva en la que la distancia total es estacionaria (en vez de estacionaria se
puede usar también la palabra extremal). Este es un concepto variacional que
se refiere a la geodésica y a todas las curvas arbitrarias cercanas a ella. Nos
proponemos desarrollar el cálculo variacional para encontrar la geodésica.

10.1 La ecuación diferencial


de las geodésicas
Consideremos un espacio de Riemann con coordenadas xµ e intervalo ds2 =
gµν dxµ dxν . Sean E1 y E2 dos puntos en ese espacio. Pensemos ahora en una
curva
R E2 pque pasa por estos dos puntos y llamemos longitud total al integral
E1 gµν dxµ dxν ejecutado a lo largo de esa curva. Sin embargo, esta curva
no es la única que pasa por E1 y E2 ya que, en efecto, hay un número

253
infinito de curvas, y cada una tiene su propia longitud. Dentro del infinito
número de curvas que conectan a E1 con E2 hay una muy especial, llamada
la geodésica, en la que se extremaliza la longitud total:

Z E2 p
δ gµν dxµ dxν = 0 en la geodésica. (10.1)
E1

p
Hemos cometido una ligereza al tomar la raı́z cuadrada gµν dxµ dxν , cosa
que sólo puede hacerse cuando el intervalo no es negativo. Por el momento
vamos a suponer que los intervalos son positivos y aplazamos para la sección
10.2 el estudio de los intervalos nulos y negativos.

Parametrización. Llamamos (dλ)2 al intervalo a lo largo de la geodésica:

·q ¸
dλ = µ
gµν (x) dx dxν (10.2)
Geodésica

R
La integral λ = E1 dλ es la longitud parcial de la geodésica desde E1 hasta
un punto cualquiera de ella. El parámetro λ es propiedad de la geodésica y
sirve para caracterizar los puntos que a ella pertenecen. Más explı́citamente,
denotando por x̄ a los puntos de la geodésica, escribimos x̄ = x̄(λ) ; las co-
ordenadas de x̄ también son funciones de λ, es decir, x̄µ = x̄µ (λ) . Pensemos
ahora en otra curva diferente a la geodésica, que se construye punto a punto
de la manera siguiente: el punto x̄(λ) se corre una cantidad δx(λ) , o sea
que las coordenadas del nuevo punto serán x̄µ (λ) + δxµ (λ) . Vemos ası́ que
todos los puntos de la geodésica y todos los puntos de la nueva curva son
funciones del parámetro escalar λ . Las variaciones δxµ son infinitesimales
y arbitrarias, pero deben ajustarse a la condición de que la curva variada
x̄µ + δxµ también pase por E1 y E2 :

δxµ = 0 en E1 y en E2 (10.3)

Las ecuaciones de Euler-Lagrange. El problema variacional contenido


en la ecuación (10.1) es matemáticamente igual al de la ecuación (8.3), si se
hace el cambio L → L, con la lagrangiana L definida ası́:

r
dxµ dxν
L ≡ gµν (10.4)
dλ dλ

254
Nos ahorramos los pasos que llevan de (8.3) a (8.8), y simplemente escribimos
las ecuaciones de Euler-Lagrange (8.8) con L en vez de L:

 
· ¸
∂L d  ∂L 
−   = 0 (10.5)
∂xα Geodésica dλ dxα

dλ Geodésica

Los parecidos con el Capı́tulo 8 no cesan aquı́. En efecto, el lector podrá re-
conocer que el problema que queremos atacar es muy parecido al que re-
solvimos en los pasos que llevan de la ecuación (8.13) a la (8.16). Pero hay
una diferencia importante: en esa ocasión la métrica ηµν era constante, en
cambio en el problema que ahora nos ocupa ocurre que gµν es variable.
Concretamente, en vez de (8.14) debemos ahora escribir

∂L 1 dxµ dxν
= gµν ,α
∂xα 2L dλ dλ

La análoga de (8.15) es

∂L 1 dxν
α = gνα
dx L dλ

Pongamos ahora las dos últimas ecuaciones en (10.5):

· ¸ · ¸
1 dxµ dxν d 1 dxν
gµν ,α − gνα =0 (10.6)
2L dλ dλ Geod dλ L dλ Geod

Ahora, la ecuación (10.2) afirma que [ L ]Geod = 1, entonces (10.6) es:

µ ¶
1 dxµ dxν d dxν
gµν ,α − gνα =0
2 dλ dλ dλ dλ

Procedemos a transformar la apariencia de esta ecuación:

1 dxµ dxν d ³ dxµ ´


0 = gµν ,α − gµα
2 dλ dλ dλ dλ

255
1 dxµ dxν ³ d ´ dxµ d2 xµ
= gµν ,α − gµα − gµα
2 dλ dλ dλ dλ dλ2
h1 i dxµ dxν d2 xµ
= gµν ,α − gµα,ν − gµα
2 dλ dλ dλ2

Multiplicar ambos lados por g σα :

d2 xσ 1 ¡ ¢ dxµ dxν
0 = 2
+ g σα 2gαµ , ν − gµν , α
dλ 2 dλ dλ

d2 xσ 1 σα ¡ ¢ dxµ dxν
= + g gαµ , ν + gνα , µ − gµν , α + gαµ , ν − g να , µ
dλ2 2 dλ dλ

d2 xσ σ dxµ dxν 1 σα ¡ ¢ dxµ dxν


= + Γ µν + g gαµ , ν − gαν , µ (10.7)
dλ2 dλ dλ 2 dλ dλ
¡ ¢
Se observa que gαµ , ν − gαν , µ es antisimétrico bajo la permutación µ À ν,
mientras que dxµ dxν es simétrico; entonces, de acuerdo con la ecuación
(5.38), la contracción total es cero. Vemos ası́ que el último término del lado
derecho de la ecuación (10.7) es cero, o sea que:

d2 xσ σ dxµ dxν
+ Γ µν = 0 (10.8)
dλ2 dλ dλ

Esta es la ecuación diferencial de las geodésicas. Ella es, en el fondo, la


ecuación de Euler-Lagrange asociada a la L de (10.4). Conviene apuntar
que aunque en el lado izquierdo de (10.8) ninguno de los dos términos es
tensor, la suma sı́ da el tensor cero. En otras palabras, (10.8) es una ecuación
tensorial, lo que significa que es covariante bajo el grupo de las transforma-
ciones generales de coordenadas.

10.2 Parámetros afines


λ recibe el nombre de parámetro afı́n. La definición inicial (10.2) aclara cuál
es el significado de dλ2 : es el intervalo a lo largo de la geodésica. En la
ecuación diferencial de las geodésicas (10.8) aparece λ como el parámetro
importante, la variable independiente. En este momento damos un giro a

256
la presentación, para definir al parámetro afı́n en base a la ecuación de
las geodésicas: si la ecuación de una geodésica es (10.8), entonces λ es un
parámetro afı́n de esa geodésica. Ahora, si λ es un parámetro afı́n de una
geodésica, entonces aλ + b también es parámetro afı́n (a y b constantes). En
efecto, llamando λ0 = aλ + b, la ecuación (10.8) se convierte en

d2 xσ σ dxµ dxν
+ Γ µν = 0
dλ02 dλ0 dλ0

Como esta ecuación es de la forma (10.8), podemos afirmar que λ0 = aλ + b


también es un parámetro afı́n.

Hagamos una pausa para ver un ejemplo útil de lo que puede ser un parámetro
afı́n. En el caso particular del espaciotiempo, consideremos el tiempo propio
dτ de una partı́cula masiva. De acuerdo con la ecuación (8.1):

ds2 = c2 dτ 2 (10.9)

Si esta partı́cula sigue una trayectoria geodésica, entonces ds2 = dλ2 . Hay
dos parámetros afines importantes, que son s y τ :

d2 xσ σ dxµ dxν
+ Γ µν = 0 partı́cula masiva (10.10)
ds2 ds ds

d2 xσ σ dxµ dxν
+ Γ µν = 0 partı́cula masiva (10.11)
dτ 2 dτ dτ

Después de definir el parámetro afı́n en base a la ecuación de la geodésica,


estamos en condición de abordar el asunto de los intervalos nulos y nega-
tivos. Recordemos que justo antes de escribir la ecuación (10.1) supusimos
que el intervalo ds2 era positivo y, basados en esa suposición, dedujimos la
ecuación de las geodésicas (10.8). A primera vista podrı́amos afirmar que
(10.8) es válida únicamente para geodésicas de intervalos positivos, pero
tal afirmación es apresurada: (10.8) es, en general, la ecuación de todas las
geodésicas, sean éstas de intervalos positivos, nulos o negativos. Decimos
que, en general

ds2 = ² dλ2 , (10.12)

257
donde ² = 0, ±1. El valor ² = 0 es para intervalos nulos, mientras que ² = ±1
para intervalos positivos o negativos. En todos los casos dλ2 es una canti-
dad positiva. Para intervalos positivos, es claro que dλ2 es directamente el
intervalo, y para intervalos negativos dλ2 es el negativo del intervalo. Para
intervalos nulos no hay una regla general que se aplique a todos los casos;
lo que usualmente ocurre es que la misma ecuación de la geodésica indica
cuál es el parámetro afı́n λ que se debe emplear; el lector interesado puede
dirigirse a la ecuación (13.45), donde encontrará un ejemplo de cómo las
geodésicas ayudan a determinar el parámetro afı́n.

El intervalo entre dos puntos cualesquiera del espacio es gµν dxµ dxν = ds2 . Si
esos dos puntos pertenecen a la geodésica, ds2 = ²dλ2 , o sea que gµν dxµ dxν =
²dλ2 . De aquı́ se sigue que

dxµ dxν
gµν =² (10.13)
dλ dλ

Esta es la ecuación del intervalo entre dos puntos de la geodésica.

10.3 Constantes del movimiento


dxσ
Si llamamos V σ ≡ , la ecuación de las geodésicas (10.8) es:

d σ
V = −Γσ µν V µ V ν (10.14)

Multiplicar ambos lados de esta ecuación por gασ :

d σ
gασ V = −gασ Γσ µν V µ V ν

d d
(gασ V σ ) − V σ gασ = −gασ Γσ µν V µ V ν
dλ dλ

Es decir:

d d
(gασ V σ ) = V σ gασ − gασ Γσ µν V µ V ν
dλ dλ

258
dxη
= Vσ gασ,η − gασ Γσ µν V µ V ν

1
= V σ V η gασ,η − gασ g σρ (gρµ,ν + gνρ,µ − gµν ,ρ ) V µ V ν
2
1
= V σ V η gασ,η − (gαµ,ν + gνα,µ − gµν ,α ) V µ V ν
2
1 1
= gµν ,α V µ V ν + (gαµ,ν − gνα,µ ) V µ V ν
2 2

Obsérvese que el último término del lado derecho es la contracción total


de un factor simétrico con otro antisimétrico, y por (5.38) es cero. Queda
entonces

d 1
(gασ V σ ) = gµν , α V µ V ν
dλ 2

Esta ecuación dice claramente que

dxσ
gµν ,α = 0 ⇒ gασ es constante (10.15)

Este es el modo de identificar las “constantes del movimiento”: si la métrica


es independiente de la coordenada xα , entonces gασ dxσ /dλ es una constante
del movimiento. Decimos que una coordenada xα es cı́clica si xα no aparece
en el tensor métrico gµν . La fórmula (10.15) dice, entonces, que a toda coor-
denada cı́clica le corresponde una constante del movimiento. De otro lado,
un vistazo a la definición (10.4) muestra que las coordenadas cı́clicas tam-
poco aparecen en la lagrangiana, o sea que a toda coordenada xα que no
aparezca en la lagrangiana se le asocia una constante del movimiento. En
mecánica clásica se usa exactamente el mismo enunciado.

Es importante que se reconozca que gασ dxσ /dλ = constante proviene de


las ecuaciones (10.8), lo que significa que, en total, las n ecuaciones (10.8)
y la ecuación gασ dxσ /dλ = constante forman un conjunto redundante.

259
10.4 Las ecuaciones algebraicas
de las geodésicas
En el caso general disponemos de la ecuación del intervalo (10.13) y de las n
ecuaciones diferenciales (10.8). Como las (10.8) son ecuaciones de segundo
grado, su solución puede presentar dificultades. En comparación, la (10.13)
tiene derivadas de primer grado, y por esto puede ser más tratable que las
(10.8). Como recomendación general, uno debe utilizar la (10.13). Se presen-
tan ocasionalmente casos felices, en los que hay constantes del movimiento;
en estas situaciones, además de las (10.8) y de las (10.13), uno dispone de
una o varias ecuaciones (10.15). A continuación veremos algunos ejemplos;
en todos ellos el parámetro afı́n λ será erradicado por completo, o sea que
podremos escribir la ecuación de la lı́nea geodésica sin que aparezca λ.

Ejemplo: Averiguar las ecuaciones algebraicas de las geodésicas de la sigu-


iente geometrı́a: ds2 = dr2 + r2 dθ2 .

Para la geometrı́a dada el intervalo es positivo y podemos escoger el parámetro


afı́n λ igual a s. Es decir, ² = 1. El tensor métrico es

· ¸
1 0
gµν = (10.16)
0 r2

La constante del movimiento: La métrica es claramente independiente de la



variable θ, entonces, de acuerdo con (10.15), la cantidad gθθ = gθθ θ̇ = r2 θ̇

es constante del movimiento. La llamaremos K:

K = r2 θ̇ (10.17)

= Constante (10.18)
r4
θ̇−2 = (10.19)
K2

µ ¶2
dr
La ecuación del intervalo: Como ² = 1 , la ecuación (10.13) es +

µ ¶2
2 dθ
r = 1 , que ahora escribimos cortamente ası́:

260
µ ¶2
dr
+ r2 θ̇2 = 1 (10.20)

Truco:
dr dr dθ dr
= = θ̇ (10.21)
dλ dθ dλ dθ
µ ¶2
dr
Entonces (10.20) queda θ̇2 + r2 θ̇2 = 1 , de donde:

µ ¶2
dr
+ r2 = θ̇−2 (10.22)

Desenlace: Al colocar la ecuación (10.19) en (10.22) obtenemos:

³ dr ´2 r4
+ r2 = (10.23)
dθ K2

Todavı́a queda la tarea de resolver esta ecuación, asunto que se facilita si la


dr K dr/r2
reescribimos de la manera siguiente: dθ = p = p .
r4 /K 2 − r2 1 − (K/r)2
Entonces, llamando z = K/r:

dz
dθ = − √
1 − z2

Integrar desde z = 1:

Z θ Z z
dz
dθ = − √
θ0 1 1 − z2

θ − θ0 = arc cos(z)

O sea que

r cos(θ − θ0 ) = K (10.24)

261
Esta es la ecuación de la lı́nea recta que está a una distancia K del origen y
que forma un ángulo π/2 + θ0 con el eje x.

Recopilación:

1. En una geometrı́a de n dimensiones hay n ecuaciones diferenciales del


tipo (10.8). Estas ecuaciones tienen dos desventajas: primero, desarrollar-
las puede ser laborioso, porque hay que calcular todos los sı́mbolos de
Christoffel; y, segundo, por ser ecuaciones diferenciales de segundo grado,
ellas pueden ser difı́ciles de resolver o manipular.

2. Además de las n ecuaciones diferenciales del tipo (10.8), tenemos la


ecuación del intervalo (10.13). Esta ecuación del intervalo tiene dos ven-
tajas: primero, ella usualmente hace parte de los datos de un problema y,
segundo, es una ecuación diferencial de primer grado, lo que la hace com-
parativamente fácil de integrar y manipular.

3. Si hay constantes del movimiento, la solución del problema se facili-


ta enormemente, porque además de (10.8) y (10.13) disponemos de las
ecuaciones adicionales (10.15). En estos casos podemos aspirar a que la
solución final, como (10.24), no contenga a la variable λ . En algún mo-
mento del análisis es preciso erradicar al parámetro incómodo λ. En el
ejercicio que acabamos de resolver, pudimos desembarazarnos de dλ uti-
lizando combinadamente: a) la constante del movimiento y, b) el truco
dr/dλ = (dr/dθ)(dθ/dλ). Aquı́ vemos la utilidad de las constantes del
movimiento: usándolas hemos logrado averiguar las lı́neas geodésicas sin
emplear directamente las ecuaciones (10.8) de las geodésicas.

4. Es preciso aclarar que aunque no hemos usado las (10.8) directamente,


sı́ las hemos usado indirectamente, ya que la identificación de las constantes
del movimiento (10.15) se ejecuta a través de la ecuación diferencial de las
geodésicas (10.14). De otro lado, la ecuación diferencial de las geodésicas no
es independiente de la ecuación del intervalo; en efecto, para la construcción
de (10.8) es preciso usar los sı́mbolos de Christoffel, los cuales provienen del
tensor métrico, el cual proviene de la ecuación del intervalo ds2 = gµν dxµ dxν .

5. Se dispone de un conjunto de elementos de información: la ecuación


diferencial de las geodésicas, la ecuación del intervalo, y las constantes del
movimiento. Este conjunto de elementos de información es redundante, por

262
las anotaciones consignadas en el numeral 4.

6. Las geodésicas existen en el espacio antes de que nosotros tracemos sobre


éste algún sistema de coordenadas. Ası́ mismo, las constantes del movimien-
to existen o no existen, independientes del sistema coordenado usado. Otro
asunto es si somos capaces de darnos cuenta de si en cierto espacio hay
constantes del movimiento. Para apreciar esto regresemos al caso feliz re-
cién visto, que es el de un espacio plano bidimensional. Si en vez de (r, θ)
usáramos coordenadas (x, y), el intervalo se escribirı́a ds2 = dx2 + dy 2 y el
tensor métrico no serı́a (10.16) sino:

· ¸
1 0
0 1

Es claro que el nuevo tensor métrico es independiente de x y de y, y por


consiguiente hay dos constantes del movimiento. Cuando se usan coorde-
nadas cartesianas (x, y) nos damos cuenta de que hay dos constantes del
movimiento; cuando usamos coordenadas cilı́ndricas (r, θ) nos damos cuenta
de que hay una constante, pero no nos damos cuenta fácilmente de que hay
una segunda constante del movimiento.

Para que nos demos cuenta de la existencia de alguna constante del movimien-
to se debe escoger un sistema coordenado adecuado. Si en un espacio hay
m constantes del movimiento, existe un sistema coordenado x̄µ en el que el
tensor métrico ḡµν es independiente de m coordenadas. Si el espacio es de
dimensión n entonces, obviamente, m ≤ n. Si m = n, el espacio es plano;
en efecto, en este caso existe un sistema coordenado x̄µ en el que el tensor
métrico ḡµν es independiente de todas las coordenadas; este tensor métrico
es constante ⇒ su tensor de Riemann es cero ⇒ el espacio es plano.

Ejemplo: Averiguar las ecuaciones algebraicas de las geodésicas de la sigu-


iente geometrı́a: ds2 = a2 dθ2 + a2 sen2 θ dϕ2 .

La constante del movimiento: Para la geometrı́a dada el intervalo es pos-


itivo y podemos simplemente escoger el parámetro afı́n λ igual a s. Es decir,
² = 1. La métrica, dada en la ecuación (9.93), es claramente independiente de

la variable ϕ. Entonces, de acuerdo con (10.15), la cantidad gϕϕ = gϕϕ ϕ̇

2 2
= a ϕ̇ sen θ es constante del movimiento. Introducimos una constante κ:

263
1
a ϕ̇ sen2 θ = √ , de donde:
κ

(a ϕ̇)−2 = κ sen4 θ (10.25)

La ecuación del intervalo: Como ² = 1, la ecuación (10.13) es

³ dθ ´2 ³ dϕ ´2
a2 + a2 sen2 θ = 1
dλ dλ
³ dθ ´2
a2 + a2 sen2 θ ϕ̇2 = 1 (10.26)

Truco:
dθ dθ dϕ dθ
= = ϕ̇ (10.27)
dλ dϕ dλ dϕ

Entonces (10.26) queda ası́:

³ dθ ´2
a2 ϕ̇2 + a2 sen2 θ ϕ̇2 = 1 , de donde:

µ ¶2

+ sen2 θ = (a ϕ̇)−2 (10.28)

Desenlace: Al colocar la ecuación (10.25) en (10.28) obtenemos:

dθ p
= ± sen θ κ sen2 θ − 1 . Integrar:

Z Z

± dϕ = √
sen θ κ sen2 θ − 1

Las tablas de integrales [14] traen esta integral para κ > 1:

cos θ
tan(ϕ + ϕ0 ) = ∓ √
κ sen2 θ − 1

No es difı́cil convertir esta fórmula en algo más manejable. Para tal efecto

264
dibujemos esta fórmula en un triángulo rectángulo, de tal manera que uno
de los ángulos agudos sea ϕ + ϕ√0 , el cateto opuesto cos θ, el cateto adyacente

κ sen2 θ − 1 y la hipotenusa κ − 1 sen θ. De ese dibujo leemos el seno del
ángulo ϕ + ϕ0 :

cos θ
sen(ϕ + ϕ0 ) = √
κ − 1 sen θ

y expandimos sen(ϕ + ϕ0 ) = sen ϕ0 cos ϕ + cos ϕ0 sen ϕ:

cos θ
sen ϕ0 cos ϕ + cos ϕ0 sen ϕ = √
κ − 1 sen θ

1
sen ϕ0 (a sen θ cos ϕ) + cos ϕ0 (a sen θ sen ϕ) = √ (a cos θ)
κ−1

Hasta el momento las coordenadas (θ, ϕ) son signos abstractos, carentes de


significado. Sin embargo, si pensamos que ellas son coordenadas esféricas,
entonces las tres expresiones entre paréntesis en la última ecuación repre-
sentan las coordenadas cartesianas X, Y y Z de los puntos que pertenecen
a una superficie esférica de radio a:

1
sen ϕ0 X + cos ϕ0 Y = √ Z
κ−1

Esta ecuación es de la forma

AX + B Y + C Z = 0

Aquı́ reconocemos claramente la ecuación de un plano que pasa por el cen-


tro de la esfera, es decir, X, Y y Z son las coordenadas de los puntos que
pertenecen a ese plano; pero como esos puntos también pertenecen a la su-
perficie esférica, ellos configuran la intersección entre el plano y la superficie
esférica. Ahora, esa intersección es un cı́rculo máximo. Conclusión: a través
de dos puntos cualesquiera de la esfera pasa un cı́rculo máximo; este cı́rculo
tiene dos arcos, que son las geodésicas.

265
El problema inverso. Consideremos el siguiente problema para un es-
dy
pacio bidimensional en coordenadas (x, y): dada la pendiente p(x) =
dx
de una geodésica, averiguar una métrica. Para resolver este problema basta
seguir de atrás hacia adelante alguno de los dos ejemplos recién vistos. No
es difı́cil verificar que una solución es:
³ ´
ds2 = a f 2 (x) − f (x) p2 (x) (dx)2 + f (x) (dy)2 , (10.29)

es decir:
 ³ ´ 
a f 2 (x) − f (x) p2 (x) 0
 
gµν =   (10.30)
0 f (x)

Aquı́, a es una constante y f (x) es cualquier función de x. No aspiramos a


encontrar la fórmula general de la métrica que corresponde a la pendiente
p(x) dada. La propuesta (10.30) es particular: una métrica diagonal e in-
dependiente de la coordenada y. En esta métrica, a−1/2 es la constante del
movimiento asociada a la coordenada y. Para probar que (10.30) verdader-
amente soluciona el problema, encontremos las geodésicas de (10.30):

Reescribir la ecuación (10.29): Combinando las ecuaciones (10.13) y (10.29)


escribimos

³ ´ µ ¶2 µ ¶2
2 2 dx dy
a f (x) − f (x) p (x) + f (x) = ² (10.31)
dλ dλ

La constante del movimiento: La métrica (10.30) es claramente independi-


dy
ente de la variable y, entonces, de acuerdo con (10.15), la cantidad gyy

= gyy ẏ = f (x) ẏ es constante del movimiento. Introducimos una constante
a:
p
f (x) ẏ = ²/a , de donde:

²(ẏ)−2 = a f 2 (10.32)

La ecuación del intervalo: La ecuación (10.31) es

266
³ ´ µ ¶2
2 2 dx
a f (x) − f (x) p (x) + f (x) (ẏ)2 = ² (10.33)

Truco:
dx dx dy dx
= = ẏ
dλ dy dλ dy

Entonces la ecuación (10.33) queda ası́:

³ ´ µ ¶2
2 2 dx
a f − f p (x) ẏ 2 + f ẏ 2 = ² , de donde:
dy
³ ´ µ ¶2
2 2 dx
a f − f p (x) + f = ²ẏ −2
dy

Desenlace: En el lado derecho de la última ecuación usamos la ecuación


(10.32), para obtener:

³ ´ µ ¶2
2 2 dx
a f − f p (x) + f = af 2 , es decir:
dy
µ ¶2
dx a f2 − f
=³ ´ ,
dy a f 2 − f p2 (x)
µ ¶
dx 2 1
o sea que = 2 , que es la hipótesis inicial de este problema.
dy p (x)
Concluimos entonces que la métrica de la fórmula (10.29) es verdaderamente
una solución.

10.5 Derivada a lo largo de una curva


Apuntábamos en la página 213 que el diferencial d no es una operación co-
variante. Ha llegado el momento de definir otra operación, que denotaremos
con la letra mayúscula D, que sı́ es covariante. Consideremos una curva
cualquiera, no necesariamente geodésica, cuyos puntos están caracterizados
por medio del parámetro escalar Λ (no hemos querido llamarlo λ, porque el
sı́mbolo λ lo reservamos exclusivamente para denotar el parámetro afı́n de
las geodésicas). Supongamos que en la región del espacio donde ella está,

267
también hay un campo vectorial Aµ . Un concepto importante es la rata de
cambio del campo a medida que se recorren los diferentes puntos de la cur-
va. Queremos asignarle a este concepto una cantidad matemática, y como
estamos en el contexto de las transformaciones de coordenadas, deseamos
que tal cantidad sea un tensor bajo el grupo de las transformaciones general-
izadas de coordenadas. Nuestro primer intento serı́a proponer dAµ /dΛ, pero
esta cantidad no es un tensor. Motivados por dAµ /dΛ, pasamos a definir un
tensor que se llama la derivada a lo largo de una curva:

DAµ dxν
= Aµ ; ν (10.34)
DΛ dΛ

Nótese que este es verdaderamente un tensor (un vector), porque es pro-


ducto de los tensores Aµ ; ν , dxν y dΛ . Ahora, Aµ ; ν = Aµ , ν + Γµ αν Aα ,
entonces

DAµ ∂Aµ dxν µ α dx


ν
= + Γ αν A
DΛ ∂xν dΛ dΛ
dAµ dxν
= + Γµ αν Aα (10.35)
dΛ dΛ

En las ecuaciones (10.34) y (10.35), y en lo que sigue, se entiende que xν


son las coordenadas de un punto genérico de la curva. Al vector (10.35) se
le puede tomar de nuevo la derivada a lo largo de la curva:

µ ¶
D2 Aµ D DAµ
=
DΛ2 DΛ DΛ
µ ¶ µ ¶
d DAµ DAσ dxρ
= + Γµ σρ
dΛ DΛ DΛ dΛ

Coloquemos (10.35) en la última ecuación:

D2 Aµ d2 Aµ d Γµ αβ α dxβ µ dAα dxβ µ


2 β
α d x
= + A + Γ αβ + Γ αβ A
DΛ2 dΛ2 dΛ dΛ dΛ dΛ dΛ2
dAσ dxρ dxβ dxρ
+ Γµ σρ + Γµ σρ Γσ αβ Aα
dΛ dΛ dΛ dΛ

268
d2 Aµ µ
ν
α dx dx
β
µ dAα dxβ
= + Γ αβ , ν A + 2Γ αβ
dΛ2 dΛ dΛ dΛ dΛ
d2 xβ β
α dx dx
ρ
+ Γµ αβ Aα + Γ µ
σρ Γ σ
αβ A
dΛ2 dΛ dΛ

Esta expresión vale para cualquier curva. Ahora pensemos que la curva es
una geodésica. Escojamos que Λ sea el parámetro afı́n λ:

D2 Aµ d2 Aµ µ
ν
α dx dx
β
µ dAα dxβ
= + Γ αβ , ν A + 2Γ αβ
Dλ2 dλ2 dλ dλ dλ dλ
(10.36)
d2 xβ β
α dx dx
ρ
+ Γµ αβ Aα + Γµ
σρ Γ σ
αβ A
dλ2 dλ dλ

Como es una geodésica, se cumple la ecuación (10.8):

d2 xβ β dxκ dxλ
= −Γ κλ
dλ2 dλ dλ

y usamos esto en el penúltimo término de la ecuación (10.36):

D2 Aµ d2 Aµ µ
ν
α dx dx
β
µ dAα dxβ
= + Γ αβ , ν A + 2Γ αβ
Dλ2 dλ2 dλ dλ dλ dλ
(10.37)
dxκ dxλ dxβ dxρ
− Γµ αβ Γβ κλ Aα + Γµ σρ Γσ αβ Aα
dλ dλ dλ dλ

10.6 Rαβµν y la curvatura


En esta sección veremos por qué Rαβµν se llama el tensor de curvatu-
ra. Comenzaremos estudiando la rata a la que se separan o acercan dos
geodésicas y de allı́ extraeremos el verdadero significado de la curvatura de
un espacio. Se hará evidente que Rαβµν es el que indica si el espacio es plano
o curvo.

Desviación geodésica. La noción de curvatura se capta fácilmente al


analizar lo que ocurre con dos geodésicas. Es razonable suponer que en un
espacio plano las dos curvas se separan (o se acercan) a ritmo constante.

269
Pero en un espacio curvo el ritmo de separación (o de acercamiento) no es
constante. Para determinar si un espacio es curvo en una región, uno puede
estudiar dos geodésicas y determinar si se juntan (o se separan) “acelerada-
mente”.

Pensemos en dos geodésicas, llamando xµ a los puntos de una de ellas y X µ


a los puntos de la otra. Para ambas geodésicas usamos el mismo parámetro
λ, de modo que las xµ son funciones de λ, ası́: xµ = xµ (λ), y también
X µ = X µ (λ). A continuación definimos las funciones ξ µ (λ) de la manera
siguiente:

ξ µ (λ) = X µ (λ) − xµ (λ) (10.38)

Usemos la fórmula (10.8) para escribir las ecuaciones de las dos geodésicas:

d2 xµ dxα dxβ
+ Γµ αβ (x) = 0 (10.39)
dλ2 dλ dλ
d2 X µ dX α dX β
+ Γµ αβ (X) = 0 (10.40)
dλ2 dλ dλ

Ponemos (10.38) en (10.40):

µ ¶µ ¶
d2 xµ d2 ξ µ dxα dξ α dxβ dξ β
+ + Γµ αβ (x + ξ) + + = 0 (10.41)
dλ2 dλ2 dλ dλ dλ dλ

La cantidad Γµ αβ (x + ξ) se expande en serie de Taylor:

∂ µ
Γµ αβ (x + ξ) = Γµ αβ (x) + Γ αβ (x)ξ σ + · · ·
∂xσ

Ahora suponemos que las dos geodésicas son muy cercanas, de modo que en
la serie de Taylor tomamos únicamente los dos primeros términos:

Γµ αβ (x + ξ) ' Γµ αβ (x) + Γµ αβ , σ (x)ξ σ

Colocamos esto en (10.41) y expandimos conservando términos hasta primer


orden en ξ:

270
d2 xµ d2 ξ µ µ dxα dxβ µ
α
σ dx dx
β
+ + Γ αβ + Γ αβ ,σ ξ
dλ2 dλ2 dλ dλ dλ dλ
(10.42)
µ dξ α dxβ
+ 2Γ αβ = 0
dλ dλ

Ahora restamos, lado a lado, la ecuación (10.42) menos la ecuación (10.39):

d2 ξ µ µ
α
σ dx dx
β
µ dξ α dxβ
= − Γ αβ , σ ξ − 2 Γ αβ (10.43)
dλ2 dλ dλ dλ dλ

D2 ξ µ
Queremos calcular . Para esto colocamos (10.43) en (10.37), tras lo
Dλ2
cual se obtiene:

D2 ξ µ µ µ ω µ ω µ
β
σ dx dx
α
= −(Γ βα , σ − Γ βσ , α + Γ βα Γ ωσ − Γ βσ Γ ωα ) ξ
Dλ2 dλ dλ

En la expresión dentro del paréntesis reconocemos la definición (9.77) del


tensor de Riemann:

D2 ξ µ dxβ dxα
= −Rµ βασ ξ σ ; usar (9.84):
Dλ2 dλ dλ
dxβ dxα
= Rµ βσα ξ σ
dλ dλ
D2 ξ µ dxα dxβ
= Rµ ασβ ξ σ (10.44)
Dλ2 dλ dλ

Anotamos arriba que la curvatura de un espacio se manifiesta en la “acel-


D2 ξ µ
eración” a la que se separan (o se acercan) dos geodésicas. La ecuación
Dλ2
(10.44) dice claramente que la curvatura (la “aceleración”) es una función
del tensor de Riemann Rµ ασβ . En aquellos lugares donde Rµ ασβ = 0 el es-
pacio es plano, y en los lugares donde Rµ ασβ 6= 0 el espacio es curvo. Por
esta razón Rµ ασβ se llama el tensor de curvatura.

271
272
Capı́tulo 11

El principio de equivalencia

La idea central de la teorı́a de la gravitación de Einstein es la siguiente: la


gravitación afecta al tensor métrico gµν . El intervalo entre dos eventos cer-
canos, dado por ds2 = gµν dxµ dxν , depende del tensor métrico, y como éste
depende del campo gravitacional, podemos afirmar que las distancias ds2
dependen del campo gravitatorio. En otras palabras, la presencia del campo
afecta las distancias entre los eventos.

Para captar esta idea pensemos en el espacio que ocupa el sistema solar.
El campo gravitatorio en cada punto de ese espacio, y en cada instante,
está determinado por las trayectorias del Sol, los planetas y todos los otros
objetos del sistema solar. Este campo gravitacional tiene una magnitud que
depende de la constante G de la gravitación universal. Imaginemos ahora
un proceso matemático (no fı́sico) que consiste en “prender” o “apagar” la
gravitación. Apagarla es anular paulatinamente la constante G → 0, y pren-
derla es el proceso opuesto. A medida que el campo se va apagando, gµν se
modifica gradualmente y, cuando G llega al valor 0, el tensor gµν llega al
valor que tiene en el espaciotiempo plano de la relatividad especial. Después
de apagar la gravitación comencemos a prenderla de nuevo: a medida que
G crece el campo se instala en el espaciotiempo, y eso se manifiesta como
una modificación paulatina de los gµν . No olvidemos que el intervalo entre
dos eventos, dado por ds2 = gµν dxµ dxν , depende explı́citamente de gµν , y
en consecuencia ds2 va variando a medida que G se prende o se apaga. Este
ejemplo imaginario aclara la idea importante que queremos establecer: el
campo gravitatorio afecta los intervalos ds2 , es decir, la gravitación se man-
ifiesta como un hecho geométrico.

Una vez captada la idea central, se plantean los dos problemas básicos de la
relatividad general: de qué manera la gravitación afecta las ecuaciones que

273
expresan las leyes fundamentales de la fı́sica y, de otro lado, de qué manera
los astros, las nubes de galaxias, la energı́a en general, determinan al ten-
sor métrico. En este capı́tulo atacamos el primer problema y reservamos el
segundo problema para el próximo capı́tulo.

11.1 El postulado de las geodésicas


La gravitación influye sobre la geometrı́a del espaciotiempo, y esta geometrı́a
influye en los fenómenos fı́sicos. En otras palabras, la gravitación influye en
los fenómenos a través de la geometrı́a del espaciotiempo. La gravitación
se manifiesta en los fenómenos de una manera indirecta: lo que ella hace
es alterar las propiedades geométricas del espacio y el tiempo, y estas al-
teraciones afectan el desarrollo de los fenómenos.

Se dice que una partı́cula está en caı́da libre cuando está sometida única-
mente a la interacción gravitatoria. ¿De qué manera el campo gravitatorio
afecta la trayectoria de una partı́cula en caı́da libre? La respuesta de esta
pregunta se encuentra en el Postulado de las Geodésicas, según el cual las
partı́culas en caı́da libre siguen lı́neas geodésicas en el espaciotiempo.

En la dinámica newtoniana el campo gravitacional afecta la trayectoria de


la partı́cula, y esta influencia se describe mediante la ecuación a = F/m; eso
lo conocemos muy bien: la fuerza gravitacional produce una aceleración en
la partı́cula. Pero la dinámica einsteiniana no utiliza el concepto de fuerza:
el campo gravitatorio afecta al sı́mbolo de Christoffel Γµ αβ y éste1 a su vez
influye en la ecuación de las geodésicas. En vez del concepto newtoniano de
fuerza gravitacional, la teorı́a de Einstein propone que la influencia gravi-
tatoria se expresa geométricamente: eso es “geometrizar” la fuerza gravita-
cional.

Una vez que se acepta el postulado de las geodésicas, hay serias razones
para pensar que el espaciotiempo es probablemente curvo, y que la grav-
itación es la causa de la curvatura. Supongamos que una partı́cula se suelta
desde el piso 14 de un edificio, y que en el mismo instante se suelta otra desde
el piso 15. Llamemos r1 y r2 a las posiciones de las partı́culas en cualquier
instante t. Si suponemos que no hay atmósfera, debemos admitir que están
1
Tomemos por ejemplo el sı́mbolo Γr θθ en coordenadas (ct, r, θ, ϕ). En el espaciotiempo
vacı́o, plano, de la relatividad especial, se tiene Γr θθ = −r. Sin embargo, si hay una masa
M en el origen de coordenadas, se tiene Γr θθ = −r + 2GM/c2 . Véase la sección 13.2.

274
en caı́da libre. Las aceleraciones de las dos partı́culas se pueden averiguar
usando la fı́sica newtoniana, y están dadas por GM/r12 y GM/r22 , o sea
que la aceleración de una respecto a la otra es GM (1/r12 − 1/r22 ) 6= 0: La
aceleración relativa entre las partı́culas en caı́da libre no es cero. Entonces,
de acuerdo con el postulado de las geodésicas, la aceleración relativa entre
las geodésicas no es cero: he aquı́ la desviación geodésica que estudiamos en
la sección 10.6. Vimos en esa sección que la desviación geodésica es el indi-
cador de curvatura, lo que nos lleva a la conclusión final: las dos partı́culas
se mueven en un espaciotiempo curvo. Lo más razonable es pensar que la
Tierra ocasiona esa curvatura. Cualquier proyecto teórico que adopte el pos-
tulado geodésico se compromete con la posibilidad de que el espaciotiempo
sea curvo, y que esta curvatura se debe al campo gravitacional.

11.2 El principio de Galileo


Hemos dicho que un cuerpo está en caı́da libre cuando sobre él actúa única-
mente la fuerza gravitacional. Los planetas, por ejemplo, están en caı́da
libre; ası́ mismo, si la atmósfera no existiera, un cuerpo que se soltara desde
lo alto de un edificio caerı́a libremente. Modernamente entendemos estos
fenómenos a la luz del principio de Galileo, que afirma que todos los cuerpos
en caı́da libre caen de igual manera. En la mecánica newtoniana el principio
de Galileo se organiza al combinar la segunda ley de Newton y la ley de la
gravitación universal, que escribimos a continuación en la forma tradicional:

F = mi a, F = Gmg Mg /r2 (11.1)

Es importante advertir que la masa inercial mi es la que aparece en la


segunda ley de Newton, mientras la masa gravitacional mg figura en la
fuerza gravitacional. Para la caı́da libre igualamos las dos ecuaciones (11.1),
obteniendo:
mg GMg
a= (11.2)
mi r2

El principio de la caı́da de los cuerpos afirma que, para Mg y r dados, la


aceleración a es la misma para todos los cuerpos; en vista de la ecuación
(11.2) podemos afirmar entonces que el cociente mg G/mi es igual para todos
los cuerpos. La constante gravitacional G se define de manera que mg y mi
sean numéricamente iguales:

275
mi = mg

De muchas maneras se puede someter el enunciado mi = mg a la prueba


experimental. La más inmediata es dejar caer objetos de diferentes substan-
cias para ver si en todos los casos se obtiene
p mi =pmg . Otra forma es con
péndulos simples; como el perı́odo es mi /mg 2π L/g, se pueden hacer
pruebas con diferentes materiales (aluminio, vidrio, madera, hielo, etc) para
ver si mi = mg en todos los casos. Con experimentos en los que intervienen
fuerzas ficticias también se puede cuestionar si mi es verdaderamente igual
a mg para objetos de diferente composición quı́mica. Esto fue lo que hizo
Eötvös a fines del siglo XIX, obteniendo |mg /mi −1| < 10−9 , y experimentos
más recientes llegan a |mg /mi − 1| < 10−11 . Conviene recalcar que cuando
se determina que mi = mg para un objeto dado no se logra gran cosa ya
que, como hemos anotado, el valor de la constante gravitacional G se ajusta
precisamente para que eso ocurra. Lo importante es que mi = mg resulte
válido para todo objeto, cualquiera que sea su composición quı́mica.

Pensemos en un conjunto C de partı́culas en caı́da libre que coinciden en


algún evento E, y supongamos adicionalmente que entre ellas no hay inter-
acción ni choques. De acuerdo con el principio de Galileo, en el evento E
todas las partı́culas de C tienen la misma aceleración y en consecuencia la
aceleración relativa entre cualesquiera dos partı́culas de C es cero. Más aún,
si un observador registra que todas las partı́culas de C tienen aceleración
cero respecto a él, entonces ese observador también está en caı́da libre en E.

11.3 Coordenadas geodésicas


El proceso de dos transformaciones sucesivas que vimos en la sección 9.20
tiene un caso especial, y es cuando se desea que el tensor métrico final,
evaluado en E , sea el de Minkowski ηµν :

Corolario: Es posible [13] erigir unas coordenadas tales que en un evento


E: a) la métrica sea ηαβ , y b) todos los sı́mbolos de Christoffel sean cero.

El sistema coordenado en el que se satisfacen las condiciones de este coro-


lario se llama coordenadas geodésicas. Estas coordenadas son expresamente
construidas para el evento E . Por supuesto que las coordenadas geodésicas
abarcan todo el espaciotiempo, pero son construidas deliberadamente para
que en el evento E la métrica tome el valor ηµν y los sı́mbolos de Christoffel

276
se vuelvan cero. El tensor métrico, en cualquier evento del espaciotiempo,
será una matriz 4 × 4 complicada, pero esta matriz se vuelve ηµν en el even-
to E; ası́ mismo, los sı́mbolos de Christoffel, en otros eventos, no son en
general cero, pero se vuelven cero en el evento E. En todo el espaciotiempo
el sistema coordenado geodésico es, en general, curvilı́neo y no ortogonal;
pero en E ocurre algo [15] especial: las coordenadas geodésicas se cruzan
ortogonalmente, formando un sistema de ejes cartesianos.

El corolario pone de manifiesto que la métrica gµν tiene cierto grado de


arbitrariedad. No es muy importante el valor que adopta gµν en un evento
dado (valor que podemos hacer igual a ηµν con una simple transformación de
coordenadas). Tampoco son muy importantes sus primeras derivadas gµν ,α
(que se pueden anular en cualquier punto con una transformación de coorde-
nadas, como vimos al final de la sección 9.16). Lo que sı́ es muy importante es
el conjunto de las segundas derivadas gµν ,α,β , pues es en ellas donde radica
la información acerca de la curvatura. En efecto, ya hemos visto que con las
segundas derivadas de la métrica se construye el tensor de Riemann, que es
el que representa a la curvatura. Decimos entonces, en paralelo con nuestros
comentarios en la página 235, que en un espacio curvo es imposible [16], con
un cambio de coordenadas, volver cero todas las segundas derivadas de la
métrica. Cuando un espacio es curvo, no existe ningún sistema coordena-
do en el que todas las segundas derivadas sean cero. Y si es plano, existen
sistemas coordenados en los que todas las segundas derivadas de la métrica
son cero.

11.4 El principio de equivalencia


Ahora procedemos a combinar las ideas principales de las tres últimas sec-
ciones. Una partı́cula en caı́da libre cumple la ecuación diferencial de las
geodésicas (10.11). Esta ecuación es válida en todos los sistemas coordena-
dos, y ahora nos conviene escribirla utilizando coordenadas geodésicas:

d2 x̄ α α dx̄µ dx̄ν
+ Γ̄ µν = 0
dτ 2 dτ dτ

Supongamos que esta partı́cula pasa por el evento E. Esto significa que
podemos evaluar en E todos los términos de la última ecuación, obteniendo
¯ ¯
d2 x̄ α ¯¯ α dx̄µ dx̄ν ¯¯
+ Γ̄ µν (E) = 0
dτ 2 ¯E dτ dτ ¯E

277
Pero Γ̄αµν (E) = 0, entonces
¯
d2 x̄ α ¯¯
= 0 (11.3)
dτ 2 ¯E

No olvidemos, tal como vimos en la sección 11.3, que en E las coordenadas


geodésicas se cruzan ortogonalmente formando un sistema de ejes carte-
sianos. Esto indica claramente que (11.3) es la ecuación más conocida de la
fı́sica elemental: (11.3) es la ecuación de la trayectoria de una partı́cula en
equilibrio. Vemos ası́ que para un observador que erija un sistema de coorde-
nadas geodésicas centradas en E, las partı́culas en caı́da libre que pasan por
E tienen, respecto a ese sistema de referencia, aceleración cero. Entonces,
invocando la frase escrita en bastardilla en la página 276, podemos afirmar
que ese observador también está en caı́da libre. Digámoslo ası́: un observador
en caı́da libre en E registra que las partı́culas en caı́da libre que pasan por
E tienen, respecto a ese observador, aceleración cero.

Hay dos situaciones diferentes: 1) De un lado, la partı́cula libre en la rel-


atividad especial, estudiada en coordenadas cartesianas. 2) De otro lado,
la partı́cula en caı́da libre estudiada por un observador en caı́da libre que
usa coordenadas geodésicas. Al primer problema le corresponde la ecuación
(6.35) y al segundo la ecuación (11.3). La misma ecuación se aplica a dos
situaciones diferentes. Uno podrı́a pensar que las dos situaciones, aunque
diferentes, son, de alguna manera, equivalentes.

En conclusión, un observador en caı́da libre en E que use coordenadas geodésicas,


registra que las partı́culas en caı́da libre que pasan por E cumplen la mis-
ma ecuación que satisfacı́an las partı́culas libres en ausencia de gravitación,
en la relatividad especial, en coordenadas cartesianas. Pero la ecuación de
partı́cula libre no es la única ecuación diferencial importante en la fı́sica.
También hay otras ecuaciones diferenciales importantes, como por ejem-
plo (6.31), (6.32) y (7.32). En este punto hacemos una suposición crucial:
asumir que la equivalencia recién mencionada se aplica, no sólo a la ecuación
de partı́cula libre, sino además a todas las ecuaciones tensoriales que expre-
san leyes fı́sicas en la relatividad especial en coordenadas cartesianas: para
un observador en caı́da libre en E que use coordenadas geodésicas, las ecua-
ciones que expresan las leyes de la fı́sica son las mismas que se cumplı́an
en ausencia de gravitación, en la relatividad especial, en coordenadas carte-
sianas. Este es el Principio de Equivalencia. Con el propósito de dar un

278
ejemplo de la utilización de este Principio, tomemos las tres ecuaciones ten-
soriales mencionadas (6.31), (6.32) y (7.32); de acuerdo con el Principio de
Equivalencia:

¯ ¯
µν ¯ 4π ¯ν ¯¯
F̄ ,µ ¯ = J ¯
E c E
¡ ¢¯
F̄µν ,α + F̄αµ,ν + F̄να,µ ¯E = 0
¯
¯
T̄ µν,ν ¯ = 0
E

No olvidemos que en coordenadas geodésicas, y en E, los sı́mbolos de Christof-


fel valen cero. Esto implica que en coordenadas geodésicas, y en E, la op-
eración coma (,) coincide con la operación punto y coma (;). O sea que en
las tres últimas ecuaciones podemos escribir (;) en vez de (,):

¯ ¯
µν ¯ 4π ¯ν ¯¯
F̄ ;µ ¯ = J ¯
E c E
¡ ¢¯
F̄µν ;α + F̄αµ;ν + F̄να;µ ¯E = 0
¯
µν ¯
T̄ ;ν ¯ = 0
E

Estas ecuaciones tensoriales están escritas de manera manifiestamente co-


variante; por esta razón, como son válidas en coordenadas geodésicas, tam-
bién han de ser válidas en cualquier otro sistema de coordenadas:

¯
¯ 4π ν ¯¯
F µν ;µ ¯E = J ¯
c E
¡ ¢¯
Fµν ;α + Fαµ;ν + Fνα;µ ¯E = 0
¯
T µν ;ν ¯E = 0

Estas ecuaciones son válidas en el evento E. Pero, como E no es un evento


especial, ecuaciones similares deben cumplirse en cualquier otro evento. En
consecuencia, podemos eliminar el subı́ndice E:

279
4π ν
F µν ;µ = J
c
Fµν ;α + Fαµ;ν + Fνα;µ = 0 (11.4)

T µν ;ν = 0

La regla (,) → (;) El paso de las ecuaciones (6.31)-(6.32)-(7.32) a las


ecuaciones (11.4) se hace cambiando la derivada simple (,) por la derivada
covariante (;). Esta regla, en general, dice que para escribir la ecuación difer-
encial de un campo en presencia del campo gravitatorio se siguen dos pasos:
el primero es escribir la ecuación diferencial tal como se la conoce famil-
iarmente en la relatividad especial, en coordenadas cartesianas; el segundo
paso es cambiar (,) por (;). Esta fórmula se conoce como la regla cambiar
coma por punto y coma. La regla se expresa en palabras tan simples que uno
corre el riesgo de creer, equivocadamente, que el paso de unas ecuaciones
a las otras es simple. En realidad el paso dista de ser simple, como puede
apreciarse en la siguiente observación: En las ecuaciones (6.31)-(6.32)-(7.32)
las coordenadas son cartesianas, no hay campo gravitatorio y las cantidades
xµ , F µν , J µ y T µν son tensores bajo el grupo de las transformaciones de
Lorentz. En cambio, en las ecuaciones (11.4) las coordenadas son generales,
hay campo gravitatorio y las cantidades dxµ , F µν , J µ y T µν son tensores
bajo el grupo de las transformaciones generales de coordenadas. Con es-
ta observación queremos resaltar que (,) → (;) es una regla estrictamente
simbólica, visual.

La ecuación T µν;ν = 0. Veamos en detalle los pasos que conducen de


(7.32) a la última de las ecuaciones (11.4). Ante todo, el tensor T µν de la
ecuación (7.32) representa todas las formas de energı́a-momentum (calorı́fi-
ca, potencial, masas en reposo, etc.) excepto la energı́a-momentum del cam-
po gravitatorio. Esto es claro, porque en la relatividad especial no hay cam-
po gravitacional. Ahora, al usar la regla (,) → (;) se llega a la última de
las ecuaciones (11.4). En esta última ecuación T µν significa lo mismo que
significaba en (7.32): todas las formas de energı́a-momentum, excepto la
energı́a-momentum del campo gravitatorio. Consignemos esta idea en una
frase corta que será importante en la construcción de la ecuación del campo
gravitatorio en el capı́tulo 12: si T µν es el tensor que recoge todas las for-
mas de energı́a-momentum que no son gravitatorias, este tensor cumple la
ecuación T µν;ν = 0 en presencia de un campo gravitacional.

280
11.5 El acople mı́nimo
Vamos a ver el principio de equivalencia desde otra perspectiva [11]. Para
tal efecto nos planteamos el siguiente ejercicio interesante: tomar las ecua-
ciones de la relatividad especial escritas en coordenadas cartesianas y, para
añadir los efectos de la gravitación, sumarles a esas ecuaciones algunos otros
términos que contengan altas derivadas del tensor métrico. Tomemos por
ejemplo la ecuación (6.31) para sumarle términos que contengan primeras,
segundas, terceras,... derivadas de gµν :

4π ν
F µν ,µ = J + [1g] + [2g] + [3g] + · · ·
c

El sı́mbolo [3g] quiere decir “términos que contienen linealmente la tercera


derivada del tensor métrico”. Ahora, los términos [1g] son como el sı́mbolo
de Christoffel, los términos [2g] son como el tensor de Riemann, los [3g] son
como la primera derivada del tensor de Riemann, etc.:

4π ν
F µν ,µ = J + [Christ] + [Riem] + [1Riem] + [2Riem] + · · ·
c

Aquı́, [Christ] representa a los términos que contienen al sı́mbolo de Christof-


fel, [2Riem] representa a los términos que contienen segundas derivadas del
tensor de Riemann, etc. Algunos términos de la forma [Riem] podrı́an ser
Rν αβρ F αβ Aρ , Rνβ βα F αρ Aρ , Rαβ F αβ Aν , RF να Aα , etc. Algunos términos
de la forma [1Riem] podrı́an ser R;δ F να Fα δ , Rαβ ;δ Aα Aβ Aδ Aν , etc. El prin-
cipio de equivalencia afirma que, al incluir los efectos de la gravitación,
los términos [Riem], [1Riem], [2Riem] · ·· no aparecen; dicho de otra man-
era, que esos términos aparecen multiplicados por unos coeficientes que son
cero. Los términos [1Riem], por ejemplo, aparecen del modo 0[1Riem] ; el
factor [1Riem] expresa la posibilidad, la legitimidad matemática de que la
gravitación se acople a los fenómenos fı́sicos a través de la primera derivada
del tensor de Riemann; pero el coeficiente 0 que lo acompaña dice que tal
posibilidad, estrictamente matemática, no se realiza en el mundo fı́sico.

Algunas leyes fı́sicas se expresan mediante ecuaciones diferenciales. El cam-


po gravitatorio no entra en esas ecuaciones diferenciales a través del tensor
de Riemann ni a través de ninguna de las derivadas de Rν αβρ . El acople grav-
itatorio se realiza únicamente a través del sı́mbolo de Christoffel, es decir,

281
a través de la operación punto y coma (;). A esto se le dice el acople mı́ni-
mo: sólamente a través de los sı́mbolos de Christoffel el campo gravitatorio
influye en las ecuaciones tensoriales que expresan a las leyes fı́sicas.

11.6 Ejemplos
Queremos mostrar en ejemplos concretos la manera como aparecen los sı́mbo-
los de Christoffel cuando se trata de incluir la influencia del campo gravitato-
rio. Para tal efecto, en las ecuaciones de Maxwell y las leyes de conservación
(6.31)-(6.32)-(7.13)-(7.32) cambiamos coma por punto y coma:

4π ν
F µν ;µ = J (11.5)
c
Fµν ;α + Fαµ;ν + Fνα;µ = 0 (11.6)

J µ ;µ = 0 (11.7)

T µν ;µ = 0 (11.8)

Estudiemos primero las dos ecuaciones inhomogéneas de Maxwell. Utilizan-


do (9.73) en (11.5) se llega a:

4π ν
F µν ,µ + Γµ αµ F αν + Γν µα F µα = J (11.9)
c

Ahora, Γν µα es simétrico bajo el intercambio µ ­ α, mientras que F µα es


antisimétrico; entonces, de acuerdo con (5.38), el término Γν µα F µα es cero
y la ecuación (11.9) queda ası́:

4π ν
F µν ,µ + Γµ αµ F αν = J
c

Utilizando (9.74) en (11.6) se llega a:

Fµν ,α − Γρ να Fµρ − Γρ µα Fρν + Fαµ,ν − Γρ αν Fρµ − Γρ µν Fαρ


+ Fνα,µ − Γρ νµ Fρα − Γρ αµ Fνρ = 0

282
Esta ecuación se puede reescribir ası́:

Fµν ,α + Fαµ,ν + Fνα,µ − (Γρ µα Fρν + Γρ αµ Fνρ )

− (Γρ να Fµρ + Γρ αν Fρµ ) − (Γρ µν Fαρ + Γρ νµ Fρα ) = 0 ,

es decir:

Fµν ,α + Fαµ,ν + Fνα,µ − (Γρ µα Fρν − Γρ µα Fρν )

− (Γρ να Fµρ − Γρ να Fµρ ) − (Γρ µν Fαρ − Γρ µν Fαρ ) = 0

Obsérvese que en esta ecuación son cero las cantidades contenidas en los
tres paréntesis, lo que nos permite escribir Fµν ,α + Fαµ,ν + Fνα,µ = 0. Hemos
descubierto, curiosamente, que si en la ecuación Fµν ;α + Fαµ;ν + Fνα;µ = 0
se cambia punto y coma por coma, lo que queda es también una ecuación
covariante:

Fµν ;α + Fαµ;ν + Fνα;µ = 0 ⇔ Fµν ,α + Fαµ,ν + Fνα,µ = 0 (11.10)

En otras palabras: la ecuación Fµν ;α + Fαµ;ν + Fνα;µ = 0 no contiene sı́mbo-


los de Christoffel. Ataquemos ahora la tercera ecuación (11.7) con ayuda
de (9.71); se obtiene J µ ,µ + Γµ αµ J α = 0. Finalmente desarrollemos la
ecuación (11.8); utilizamos la fórmula (9.73) y llegamos a T µν,µ + Γµ αµ T αν +
Γν αµ T µα = 0.

En resumen ası́ son las leyes de conservación y las ecuaciones de Maxwell en


presencia de un campo gravitatorio:

J µ ,µ + Γµ αµ J α = 0 (11.11)

T µν,µ + Γµ αµ T αν + Γν αµ T µα = 0 (11.12)

4π ν
F µν ,µ + Γµ αµ F αν = J (11.13)
c
Fµν ,α + Fαµ,ν + Fνα,µ = 0 (11.14)

283
Schwarzschild. Estas cuatro ecuaciones son válidas en general, cualquiera
que sea el campo gravitacional. Conviene desarrollarlas en detalle para un
caso particular. Hay un campo gravitacional muy conocido, que es el causado
por una masa puntual M que no tiene carga eléctrica ni momentum angular.
Este se conoce como la solución de Schwarzschild, y lo estudiaremos en el
capı́tulo 13. Los sı́mbolos de Christoffel de ese campo gravitacional (sección
13.2) son:

s
Γ0 01 = Γ0 10 =
2r(r − s)
s(r − s) s
Γ1 00 = Γ1 11 = −
2r3 2r(r − s)
Γ1 22 = −r + s Γ1 33 = −(r − s) sen2 θ

1
Γ2 33 = − sen θ cos θ Γ2 12 = Γ2 21 =
r
1
Γ3 13 = Γ3 31 = Γ3 23 = Γ3 32 = cot θ
r
En estas expresiones, s = 2GM/c2 es una medida de la masa M , aunque
tiene unidades de longitud. Vemos aquı́, de manera patente, que el campo
gravitacional afecta a los sı́mbolos de Christoffel. Cuando s = 0 se tiene
M = 0, el campo gravitacional se anula y el espaciotiempo se aplana; en
tal caso estos sı́mbolos regresan a la forma que tenı́an en el espaciotiempo
plano en coordenadas esféricas. No olvidemos que estamos con coordenadas
esféricas, o sea que, por ejemplo, T 12 significa T rθ , etc.

Las leyes de conservación. Utilizando los sı́mbolos de Christoffel recién


escritos, las ecuaciones de conservación (11.11) y (11.12) quedan ası́:

2 r
J µ ,µ + J + J θ cot θ = 0
r
2 s 1
T µt,µ + T tr + T tθ cot θ = − 2 T tr
r 2r 1 − s/r
2 rr
T µr,µ +T + T rθ cot θ − r T θθ − rT ϕϕ sen2 θ
r
s ³ 1 ´
= − 2 (1 − s/r) T tt − T rr − sT θθ − sT ϕϕ sen2 θ
2r 1 − s/r

284
4 rθ
T µθ,µ + T + T θθ cot θ − T ϕϕ sen θ cos θ = 0
r
4
T µϕ,µ + T rϕ + 3T θϕ cot θ = 0
r

Estas cinco ecuaciones están escritas de modo sugestivo. Toda dependencia


con s aparece en los lados derechos. Este ejemplo muestra claramente que
el campo gravitatorio influye en algunas de las ecuaciones diferenciales que
expresan a las leyes de conservación. Si M = 0 se tiene s = 0, el campo
gravitacional se anula, los lados derechos de estas ecuaciones se vuelven cero
y las ecuaciones regresan a la forma que tenı́an en el espaciotiempo plano.

Las ecuaciones de Maxwell. Acabamos de comentar que la presencia del


campo gravitatorio no influye en las dos ecuaciones homogéneas de Maxwell,
debido a que en la ecuación (11.14) no hay sı́mbolos de Christoffel. Veamos
ahora las dos ecuaciones inhomogéneas de Maxwell, contenidas en (11.13).
En esta ecuación sı́ hay sı́mbolos de Christoffel y es posible, en principio,
que a través de ellos el campo gravitatorio manifieste su presencia. En el
caso particular de Schwarzschild, utilizamos los sı́mbolos de Christoffel que
escribimos en la página 284. Colocando estos sı́mbolos en las ecuaciones
(11.13) se llega, al final, a un resultado curioso: la variable s desaparece. O
sea que el campo gravitatorio de Schwarzschild tampoco se manifiesta en las
dos ecuaciones inhomogéneas de Maxwell. En conclusión, en el espaciotiempo
de Schwarzschild el campo gravitatorio no se manifiesta en ninguna de las
ecuaciones de Maxwell.

285
286
Capı́tulo 12

La ecuación del campo gravitatorio

La ecuación de Poisson:

∇2 Φ = 4πGρ (12.1)

es la fórmula maestra de la gravitación newtoniana. En el lado izquierdo


aparecen las segundas derivadas del campo gravitatorio Φ, y al lado derecho
aparece la densidad de masa ρ, que es la fuente, la causa del campo. Si las
cantidades que intervienen en esta fórmula fueran tensores bajo el grupo
de las transformaciones generales de coordenadas, tendrı́amos una ecuación
tensorial, y nos sentirı́amos satisfechos. Pero ni ∇2 , ni Φ ni ρ son tensores, y
por eso la fórmula es insatisfactoria. Queremos construir una ecuación ten-
sorial que sea una generalización de (12.1). Más precisamente, una nueva
fórmula en la que todas las cantidades sean tensores y que contenga, como
caso particular, a la ecuación (12.1). Se espera que la nueva fórmula sea la
expresión de una nueva teorı́a gravitacional más amplia que contenga, como
caso lı́mite, a la vieja teorı́a gravitacional de Newton.

Es claro que para generalizar una ecuación no hay un camino único, sino
que se presentan varias posibilidades. En este capı́tulo seguiremos el camino
de Einstein y llegaremos a la célebre ecuación

1 8πG
Rµν − gµν R = 4 Tµν , (12.2)
2 c

donde Rµν es el tensor de Ricci, R es el escalar de curvatura, Tµν el tensor de


energı́a y momentum y G = 6.670 × 10−8 cm3 gr−1 seg−2 es la constante de la
gravitación universal. Veremos que la ecuación (12.2) surge como una gener-
alización natural de (12.1). Einstein construyó esta ecuación en un proceso

287
penoso que le tomó varios años y que concluyó [17, 18, 19, 20] en noviem-
bre de 1915. Curiosamente, Hilbert se adelantó a Einstein y publicó esta
fórmula cinco dı́as antes [21]. Por tal motivo (12.1) se llama la ecuación de
Hilbert-Einstein.

Acabamos de anotar que (12.1) admite varias generalizaciones, o sea que


(12.1) ; (12.2). Para recorrer el camino que conduce de (12.1) a (12.2) va-
mos a proponer algunos argumentos que, aunque no son rigurosos, sı́ son
razonables y convincentes. Es aquı́, en los argumentos convincentes, donde
puede apreciarse el mérito de la propuesta gravitacional de Einstein.

12.1 El lı́mite newtoniano


Si calculamos el valor numérico de Φ/c2 en la superficie del Sol o de la Tierra,
obtenemos Φ/c2 ≈ −10−6 y −10−9 , respectivamente. Esto indica que en el
sistema solar el campo gravitacional es muy débil. Además las velocidades de
los planetas y sus satélites son muy bajas en comparación con c. El régimen
de campo débil y bajas velocidades se llama el lı́mite newtoniano. Es aquı́,
en el lı́mite newtoniano, donde la vieja teorı́a gravitacional es exitosa. En
efecto, la capacidad predictiva y explicativa de esa teorı́a se ha mostrado en
múltiples problemas que atañen al movimiento de los planetas y sus lunas.
La nueva teorı́a gravitacional que nosotros construyamos debe reproducir
los resultados de la vieja teorı́a en aquellos casos que se encuentran dentro
del lı́mite newtoniano.1

12.2 Los 10 potenciales gµν


El campo gravitacional afecta las trayectorias de las partı́culas y afecta la
evolución de los otros campos. En el capı́tulo 11 vimos que la gravitación se
acopla con las trayectorias a través de las geodésicas, y se acopla con los otros
campos a través del sı́mbolo de Christoffel Γα µν . La gravitación podrı́a ser un
asunto geométrico: ella se manifiesta a través de las propiedades geométricas
del espaciotiempo. ¿Cuál de las propiedades geométricas del espaciotiempo
expresa al campo gravitacional? Tenemos a nuestra disposición muchas can-
tidades geométricas: gαβ , det(g), Γµαβ , gαβ,µ , Γµαβ,δ , Rαβµν , Rβµ , R : ¿cuál
de ellas representa al campo gravitacional? De todas las posibilidades es-
cogeremos a gαβ para representar al campo, basados en una secuencia de
1
Advertencia: Hay muchas situaciones interesantes que no están en el lı́mite newtoni-
ano, como por ejemplo el viaje de un pulso de luz. La velocidad de la luz no es baja.

288
ideas, muy laxa, que expondremos enseguida. De acuerdo con la gravitación
newtoniana, la aceleración de una partı́cula en caı́da libre es −∇Φ:

∂Φ
aceleración ∼ (12.3)
∂x

De otro lado, recordemos la hipótesis geodésica que vimos en la sección


11.1: las partı́culas que caen libremente siguen curvas geodésicas, o sea que
cumplen la ecuación (10.11):

d2 x dx dx
2
∼ Γ
dτ dτ dτ

El lado izquierdo de esta fórmula es como aceleración, entonces:

aceleración ∼ Γ

Recordemos, de acuerdo con la definición (9.57), que Γ es como las derivadas


de gµν . O sea que la última fórmula es

∂gµν
aceleración ∼ (12.4)
∂x

Finalmente conectamos los lados derechos de (12.3) y (12.4) para escribir


∂gµν ∂Φ
∼ , es decir,
∂x ∂x
gµν ∼ Φ

Esta fórmula asocia el campo gravitacional newtoniano, que es Φ, con el


tensor métrico: de esta manera se justifica la propuesta de escoger al tensor
métrico gµν como el campo gravitacional en la teorı́a que queremos construir.
La teorı́a que buscamos debe coincidir con la vieja teorı́a gravitacional en el
lı́mite newtoniano y por eso esperamos que, en ese lı́mite, gµν coincida con
Φ. Pero gµν tiene diez componentes independientes: ¿cuál de las diez es la
que coincide con Φ?

289
12.3 El potencial g00 en coordenadas cartesianas
Para responder esta pregunta regresemos al estudio de una partı́cula en
caı́da libre en coordenadas cartesianas xµ = (ct, x, y, z). La ecuación (5.54)
muestra que la componente U 0 es mucho mayor que las otras tres U a , o
sea que dxa /dτ es despreciable en comparación con dx0 /dτ , y la ecuación
(10.11) se convierte en

d2 xα dx0 dx0
≈ −Γα00
dτ 2 dτ dτ
µ ¶2
2 α dt
= −c Γ 00 (12.5)

Para desarrollar esta ecuación debemos calcular el sı́mbolo de Christoffel


Γα00 . De acuerdo con la definición (9.57):

1
Γα00 = g ασ (gσ0,0 + g0σ,0 − g00,σ )
2

En este momento suponemos, para simplificar el problema, que el campo es


estático, o sea que todas las derivadas temporales son cero: gσ0,0 = g0σ,0 =
0. En la última ecuación sólo sobreviven las derivadas espaciales g00,b :

1
Γα00 = − g αb g00,b (12.6)
2

Si el campo es débil podemos escribir

gαβ = ηαβ + hαβ , (12.7)

donde ηαβ es la métrica de Minkowski (5.2) y hαβ es una matriz 4 × 4 en


la que todas sus componentes son muy pequeñas: |hαβ | ¿ 1. La ecuación
1 1
(12.6) es entonces Γα00 = − (η αb +hαb )(η00,b +h00,b ) = − (η αb +hαb )h00,b =
2 2
1 αb
− η h00,b + términos de orden 2, que despreciaremos. La ecuación (12.5)
2
queda aproximadamente

290
µ ¶2
d2 xα c2 αb dt
= η h00,b
dτ 2 2 dτ

Escribamos esta ecuación para α = 0 y para α = a:

d2 t
= 0
dτ 2
µ ¶2
d2 r c2 dt
2
= − ∇h00 (12.8)
dτ 2 dτ

La primera de estas ecuaciones dice que

dt
= constante (12.9)

Dejemos esto allı́ un momento, mientras nos concentramos en la derivada


d/dτ . La regla de la derivación en cadena dice que d/dτ = (dt/dτ )(d/dt) ,
de donde
d2 d d dt d dt d
2
= = ,
dτ dτ dτ dτ dt dτ dt

y usando (12.9):
µ ¶2
d2 dt d2
=
dτ 2 dτ dt2

Utilizamos esto en el lado izquierdo de (12.8) para escribir

d2 r c2
= − ∇h00
dt2 2

De otro lado, la gravitación newtoniana dice que

d2 r
= −∇Φ,
dt2

Igualemos ahora los lados derechos de las dos últimas ecuaciones:

291
2
∇h00 = ∇Φ
c2

h00 = + constante
c2

La constante de integración que aparece en el lado derecho de esta ecuación


se puede averiguar en cualquier punto del espacio. Escojamos un punto
donde Φ sea cero. En ese punto la métrica gµν es igual a ηµν , y en consecuen-
cia hµν es cero. Colocando estos valores en la última ecuación descubrimos
que la constante es cero, o sea que:


h00 = (12.10)
c2

g00 = 1 + en el lı́mite newtoniano (12.11)
c2

Aprendemos ası́ que de los diez potenciales relativistas hay uno, g00 , que
está conectado al potencial newtoniano Φ de acuerdo con la última ecuación.
El análisis recién hecho establece qué es g00 , pero no da información acerca
de los otros nueve potenciales.

12.4 La ecuación de Hilbert-Einstein


Ha llegado el momento de construir una ecuación tensorial de fuentes para el
campo gravitatorio gµν . Con este propósito, vamos a apoyarnos en el ejemplo
que nos dan las dos grandes ecuaciones de fuentes de la fı́sica clásica, que son
(12.1) y (6.19). Estas dos ecuaciones tienen varios aspectos en común: al lado
derecho aparece la fuente del campo y al lado izquierdo aparecen derivadas
del campo. Demos el primer paso diciendo que buscamos una ecuación de la
forma:

Alguna función de las derivadas de gµν es ∼ ρ (12.12)

Ahora, ρc2 no es un tensor, sino solamente la componente T00 de algún


tensor Tµν de energı́a-momentum. Por el momento no tenemos una idea
clara de qué es este tensor: no estamos seguros de si Tµν contiene o excluye
los aportes del campo gravitatorio. Como queremos una ecuación tensorial
escribimos Tµν en vez de ρ en el lado derecho de (12.12). Entonces el lado
izquierdo también tiene que ser un tensor de rango 2:

292
Algún tensor de rango 2 que es derivadas de gµν es ∼ Tµν (12.13)

Las dos ecuaciones clásicas que sirven de modelo, (12.1) y (6.19), tienen
en el lado izquierdo derivadas del campo. Estas derivadas no son de grado
superior a 2, y las derivadas de grado 2 aparecen linealmente. Para seguir
el ejemplo queremos proponer ahora una ecuación de ese estilo, o sea que
en el lado izquierdo de (12.13) queremos escribir algún tensor de rango 2
con las siguientes propiedades: 1) puede tener gµν y gµν,α 2) debe tener
segundas derivadas gµν,α,β y 3) las segundas derivadas gµν,α,β deben aparecer
linealmente. Acudimos a los enunciados (9.109) y (9.110) para afirmar que
la forma más general del lado izquierdo de (12.13) es una combinación lineal
de Rµν , R y gµν :

aRµν + b0 gµν R + Λ0 gµν = κ0 Tµν ,

donde a, b0 , Λ0 y κ0 son constantes. Dividiendo ambos lados por a llegamos


a:

Rµν + bgµν R + Λgµν = κTµν , (12.14)

donde b, Λ y κ son constantes que debemos determinar. Subiendo ı́ndices en


la última ecuación se obtiene:

Rµν + bg µν R + Λg µν = κTµν (12.15)

Averiguar la constante b y precisar qué es Tµν : Si se toma la diver-


gencia covariante (punto y coma) en ambos lados de la última ecuación se
llega a:

Rµν; ν + bg µν R; ν + bg µν; ν R + Λg µν; ν = κTµν; ν

En el lado izquierdo los dos últimos términos son cero debido a la identidad
(9.79). Queda:

Rµν; ν + bg µν R; ν = κTµν; ν

Hasta el momento no hemos tenido necesidad de precisar qué es Tµν . De

293
otro lado, la constante b está todavı́a sin determinar. Resolveremos estas
dos ambigüedades con un solo movimiento. Digamos que Tµν reúne todas
las formas de energı́a-momentum que no son gravitatorias; la frase escrita
en bastardilla en la página 280 afirma que Tµν; ν = 0, de modo que la última
ecuación es:

Rµν; ν + bg µν R; ν = 0

y al comparar esto con la identidad de Bianchi (9.104) descubrimos que


b = −1/2 . La ecuación (12.14) queda ası́:

1
Rµν − gµν R + Λgµν = κTµν (12.16)
2

Hemos escrito T µν en vez de Tµν para seguir nuestra notación habitual.


Quede claro que el T µν que aparece en la ecuación (12.16) recoge todas las
formas de energı́a-momentum, excepto la contribución del campo gravita-
torio. Por supuesto que el campo gravitatorio tiene energı́a y momentum,
pero éstos no hacen parte del T µν de la ecuación (12.16).

La constante Λ: La propuesta inicial [20] de Einstein fue con Λ = 0:

1
Rµν − gµν R = κTµν (12.17)
2

En esta ecuación podemos subir el ı́ndice µ para obtener Rµν − 21 g µν R =


κT µν . Si además hacemos ν = µ escribimos Rµµ − 12 g µµ R = κT µµ . La traza
Rµµ es el escalar de curvatura R, y la traza g µµ es igual a 4. Queda entonces
R − 2R = κT µµ :

R = −κT µµ (12.18)

Con este resultado la ecuación (12.17) deviene

µ ¶
1 α
Rµν = κ Tµν − gµν T α (12.19)
2

En particular, la componente R00 es

294
µ ¶
1
R00 = κ T00 − g00 T αα (12.20)
2

La constante κ: Nos queda por determinar la constante κ, y para hacerlo


queremos obligar a la gravitación einsteiniana a que contenga a la newto-
niana. En particular, haremos que la nueva teorı́a coincida con la vieja en
el lı́mite newtoniano. Para ejecutar este proyecto obligaremos a la ecuación
(12.20) a que coincida con (12.1) cuando el campo es débil y las velocidades
son bajas: al establecer esta coincidencia quedará determinado el valor de la
incógnita κ.

De acuerdo con la ecuación (12.7), las derivadas de gαβ son iguales a las
derivadas de hαβ , y en vista del enunciado (9.59) podemos afirmar que Γ es
como las derivadas de hµν . En consecuencia los productos Γ Γ son de orden
2 en potencias de hµν y, suponiendo que este campo hµν es débil, podremos
despreciar los productos Γ Γ en el lado derecho de la definición (9.77):

Rλµνσ ≈ Γλµν,σ − Γλµσ,ν

El tensor de Ricci Rµν = Rλµνλ es, entonces,

Rµν ≈ Γλµν,λ − Γλµλ,ν

En el lado derecho usamos la definición (9.57) para escribir

1 h λρ i 1 h λρ i
Rµν = g (gρµ,ν + gνρ,µ − gµν,ρ ) − g (gρµ,λ + gλρ,µ − gµλ,ρ )
2 ,λ 2 ,ν

Usamos la fórmula (12.7) y despreciamos términos cuadráticos en hµν ; de


esta manera se llega a

1 h λρ i 1 h λρ i
Rµν = η (hρµ,ν + hνρ,µ − hµν,ρ ) − η (hρµ,λ + hλρ,µ − hµλ,ρ )
2 ,λ 2 ,ν

1 λρ
= η [hνρ,µ,λ − hµν,ρ,λ − hλρ,µ,ν + hµλ,ρ,ν ]
2

Concentrarse en la componente R00 :

295
1 λρ
R00 = η [h0ρ,0,λ − h00,ρ,λ − hλρ,0,0 + h0λ,ρ,0 ]
2

Si el campo es estático las derivadas respecto a x0 son cero (recuérdese que


en coordenadas cartesianas x0 = ct) y queda

1
R00 = − η λρ h00,ρ,λ
2

De nuevo, las derivadas respecto a x0 son cero, o sea que en el lado derecho de
esta ecuación sobreviven únicamente los ı́ndices latinos, y podemos escribir
1 1
R00 = − η ab h00,a,b , es decir R00 = ∇2 h00 , y en vista de (12.10) llegamos
2 2
finalmente a
1 2
R00 = ∇ Φ (12.21)
c2

Este es el lado izquierdo de (12.20). Ahora transformemos el lado derecho


de (12.20) que es:
µ ¶
1
κ g0µ g0ν T µν − g00 gαβ T αβ (12.22)
2

La ecuación (5.58) dice que, a bajas velocidades, p0 À pa . Entonces, de


acuerdo con (7.16), podemos afirmar que T 00 À T a0 y T 00 À T ab . Bajo
estas condiciones la expresión (12.22) es, aproximadamente,

µ ¶
1 1
κ (g00 )2 T 00 − (g00 )2 T 00 = κ(g00 )2 T 00 (12.23)
2 2

De otro lado, apuntamos en la página 166 que T 00 es la densidad de energı́a


ρc2 , entonces (12.23) es
1
κρc2 (g00 )2 (12.24)
2

Ya podemos igualar las expresiones (12.21) y (12.24):

1 2 1
2
∇ Φ = κρc2 (g00 )2
c 2

296

De nuevo, para campo débil la ecuación (12.11) da g00 = 1 + ≈ 1:
c2

1
∇2 Φ = κρc4 ,
2

y comparando con (12.1) descubrimos que κ = 8πG/c4 . La ecuación (12.17)


queda finalmente ası́:

1 8πG
Rµν − gµν R = 4 Tµν (12.25)
2 c

Esta es la ecuación de Hilbert-Einstein que querı́amos construir. De otro


lado, la ecuación (12.18) se convierte en

8πG α
R = − T α (12.26)
c4

Al poner esto en la ecuación (12.25) llegamos a


µ ¶
8πG α β 1 αβ
Rµν = 4 gµ gν − gµν g Tαβ
c 2

Obsérvese que

Tαβ = 0 ⇒ Rµν = 0 (12.27)

Ya hemos dicho que Tαβ recoge todas las formas de momentum y energı́a
diferentes a las producidas por el campo gravitatorio. Las ecuaciones Tαβ = 0
y Tαβ 6= 0, no dicen nada acerca de la energı́a-momentum del campo grav-
itatorio. Lo que sı́ podemos afirmar es que si en algún evento se cumple
Tαβ = 0, cualquier energı́a-momentum que en ese evento haya proviene, sin
duda, del campo gravitacional.

Supongamos por ejemplo que el único objeto del universo es un astro de


radio a. En la región r < a los tensores Tαβ y Rµν son, en general, diferentes
de cero. Ahora estudiemos lo que ocurre en la región r > a: 1) Si el planeta
tiene cargas o corrientes eléctricas se genera un campo electromagnético y,

297
por consiguiente, hay un Tαβ 6= 0: el tensor Rµν no es, en general, cero. 2) Si
el planeta no es fuente de campo electromagnético se cumple que Tαβ = 0 y
en consecuencia Rµν = 0 .

Debemos hacer un comentario acerca de T µν . Nótese que el lado izquier-


do de la ecuación (12.25) es simétrico bajo el intercambio de los ı́ndices µ y
ν, lo que quiere decir que Tµν también tiene que ser simétrico (Tµν tiene que
ser igual a Tνµ ). Si Tµν no es simétrico, la ecuación de Hilbert-Einstein es
inconsistente. Al enfrentar cualquier problema particular, debemos revisar
juiciosamente que el tensor de energı́a-momentum que estamos usando sea
verdaderamente simétrico. Por ejemplo, el tensor de la ecuación (8.52) es
asimétrico, y por eso no se puede usar en la ecuación de Hilbert-Einstein.
Pero el tensor de la ecuación (8.59) sı́ es simétrico, y en consecuencia es
lı́cito usarlo en la ecuación (12.25).

12.5 Las coordenadas


Antes de concluir este capı́tulo es conveniente que nos detengamos para es-
tablecer algunas nociones generales acerca de las soluciones de la ecuación
del campo gravitatorio (12.25). Cuando se trata de resolver esta ecuación en
un problema particular, es necesario escoger las coordenadas xµ que mejor
se ajustan a las condiciones particulares del problema. En principio, la es-
cogencia de las cuatro coordenadas es bastante libre y puede ser, incluso,
caprichosa, como la que propone Ohanian [13]: Para las coordenadas es-
paciales de un punto P se utilizan los rayos de luz de tres estrellas fijas
(amarilla, azul y roja) no colineales, como muestra la Figura 12.1; se adop-
tan como coordenadas espaciales los tres ángulos que se forman entre los
tres rayos que convergen en P . La coordenada temporal se establece con
otra estrella (blanca) móvil; se adopta como coordenada temporal el ángulo
formado en P por los rayos rojo y blanco. A la coordenada x0 no se le dice
tiempo sino, en general, coordenada temporal; esto es entendible, ya que x0
no viene necesariamente en segundos, sino que puede estar dada en metros,
en radianes, etc.

Tiempo universal y campo constante. Si, en un espaciotiempo dado,


es posible escoger un sistema coordenado xµ tal que todas las componentes
gµν sean2 independientes de la coordenada temporal x0 , entonces x0 se lla-
2
En tal caso x0 es una coordenada cı́clica, y se le asocia una constante del movimiento
en las curvas geodésicas (véase la sección 10.3).

298
ma tiempo universal. En tal caso, decimos que el campo gravitatorio es
estacionario (también se le dice constante). El tiempo universal es una co-
ordenada cı́clica, y en consecuencia las curvas geodésicas tienen, asociada
a x0 , una constante del movimiento. Lo del tiempo universal y el campo
constante es sólo de interés académico porque, estrictamente, debemos ad-
mitir [22] que sólo puede ser constante el campo producido por un cuerpo;
en efecto, cuando hay varios cuerpos las atracciones mutuas producen unas
aceleraciones que hacen que el campo cambie con el transcurso del tiempo.

La inversión del tiempo universal. Separemos los ı́ndices latinos en la


fórmula del intervalo (9.1):

(ds)2 = g00 dx0 dx0 + gab dxa dxb + ga0 dxa dx0 + g0a dx0 dxa (12.28)

Supongamos que x0 es un tiempo universal. La operación x0 → −x0 modifica


ası́ al intervalo:

(ds)2 → g00 dx0 dx0 + gab dxa dxb − ga0 dxa dx0 − g0a dx0 dxa (12.29)

Al comparar (12.28) y (12.29) nos damos cuenta de que, en general, (ds)2 9


(ds)2 . En palabras, el intervalo es, en general, sensible a la inversión del
tiempo universal x0 → −x0 . Pero si ga0 = g0a = 0 en la ecuación (12.29),
llegamos a (ds)2 → (ds)2 .

Campo estático. Los campos estáticos son un subconjunto de los esta-


cionarios. Si, además de que los gµν sean independientes de la coordenada
temporal, se cumple que ga0 = g0b = 0, decimos que el campo no sólo es
estacionario sino además estático. En los campos estáticos el intervalo es
insensible a la inversión del tiempo universal: (ds)2 → (ds)2 .

La diferencia entre estacionario y estático se aprecia fácilmente con un ejem-


plo. El campo producido por una estrella que no gira es estático. Si la estrella
gira alrededor de su eje, el campo es estacionario, pero no estático. En efecto,
la operación x0 → −x0 no ha de afectar el campo de una estrella quieta. Pero
si la estrella rota con velocidad angular ω , la inversión del tiempo universal
trae como consecuencia ω → − ω , y ésto a su vez debe afectar al campo
producido por la estrella. Modernamente, la distinción estacionario-estático

299
es importante en el problema de la masa puntual: si la masa rota, el campo
es estacionario (solución de Kerr); y si no rota, el campo es estático (solución
de Schwarzschild).

lla
ari
am azul

roja

Figura 12.1 Las coordenadas


de Ohanian. Las coordenadas es-
paciales de un punto P son los
tres ángulos que forman en P las
luces que provienen de tres es-
trellas (amarilla, azul y roja). La
coordenada temporal es el ángu-
lo formado en P por los rayos de
la estrella roja y de una cuarta
estrella móvil.

300
Capı́tulo 13

La solución de Schwarzschild

El problema más simple de la fı́sica clásica es el del universo vacı́o. El prob-


lema que le sigue es el estudio de los efectos causados por la presencia de
una partı́cula puntual. La gravitación newtoniana resolvió este problema con
gran éxito: trescientos años de astronomı́a han confirmado la bondad de la
solución de Newton. Más tarde, en la década de 1920, la mecánica cuántica
naciente habrı́a de resolver de nuevo este problema que se conoce bajo el
nombre de átomo de hidrógeno. El caso de la partı́cula puntual fue el prob-
lema escuela de la fı́sica newtoniana y de la mecánica cuántica. También en
la gravitación Einstein atacó el problema de la masa puntual. Y ası́ como
ocurrió con la versión newtoniana y con la versión cuántica, este viejo prob-
lema fue la escuela de la relatividad general, entrenó a los cientı́ficos en las
sutilezas de la teorı́a y les exigió métodos de cálculo especiales.

Einstein resolvió este problema en 1915, aunque no en forma exacta, sino


aproximada; en esa solución aproximada logró explicar la precesión del per-
ihelio de Mercurio y pudo predecir la desviación de un rayo de luz al pasar
cerca del Sol. Schwarzschild [23] resolvió exactamente el problema de la masa
puntual en diciembre de 1915, unas pocas semanas después de que Einstein
y Hilbert encontraran la ecuación (12.25) de los campos gravitacionales1 .

13.1 Campo isótropo estático


Nos proponemos averiguar la forma más general que puede tener un campo
gravitatorio isótropo estático. Con ese propósito vamos a desarrollar sucesi-
1
Schwarzschild, profesor de la universidad de Gotinga, resolvió el problema mientras
prestaba sus servicios como soldado en el frente oriental. Murió cinco meses después, a los
42 años de edad, por la infección de una herida.

301
vamente los casos isótropo, estacionario y estático.

Campo isótropo. En este caso el intervalo ds2 debe ser un escalar bajo
el grupo de las rotaciones en el espacio tridimensional. Para proponer o
construir un ds2 debemos acudir a cantidades escalares. ¿Cuáles son las
cantidades escalares disponibles? Con la coordenada temporal ct se producen
dos escalares, que son t y dt. De otro lado, con dos vectores A y B se consigue
una cantidad escalar mediante el producto punto A · B. Debemos encontrar
vectores para ejecutar el producto punto. Disponemos únicamente de los
vectores r y dr, y los productos punto entre ellos son r · r, r · dr y dr · dr.
En conclusión, el intervalo isótropo más general se construye con t, dt, r · r,
r · dr y dr · dr :

ds2 = {r · r, t}(dt)2 + {r · r, t}r · drdt + {r · r, t}(r · dr)2 + {r · r, t}dr · dr

En esta fórmula la escritura {r · r, t} es una manera corta de decir “alguna


función de r · r y de t ”. No se nos escapa que esta notación es ambigua
porque podrı́a sugerir, equivocadamente, que las cuatro funciones {r · r, t}
que aparecen en la fórmula son iguales. Debemos entender que las cuatro
funciones {r · r, t} son, en principio, diferentes.

Campo isótropo estacionario. Sabemos por la sección 12.5 que para


campos estacionarios las componentes gµν del tensor métrico son indepen-
dientes del tiempo universal, o sea que el intervalo ds2 se simplifica:

ds2 = {r · r}(dt)2 + {r · r}r · drdt + {r · r}(r · dr)2 + {r · r}dr · dr

Campo isótropo estático. Utilizando de nuevo la sección 12.5 debemos


imponer la condición de que las entradas g0a del tensor métrico sean cero.
Queda:

ds2 = {r · r}(dt)2 + {r · r}(r · dr)2 + {r · r}dr · dr

En coordenadas esféricas r = r 1̂r , dr = dr 1̂r + rdθ 1̂θ + r sen θdϕ 1̂ϕ . Los
productos escalares son:

r · r = r2

302
r · dr = rdr
³ ´
dr · dr = (dr)2 + r2 (dθ)2 + sen2 θ(dϕ)2

Con estas expresiones regresamos a ds2 :

³ ´
ds2 = {r}dt2 + {r}dr2 + {r} dr2 + r2 (dθ2 + sen2 θdϕ2 )

= {r}dt2 + {r}dr2 + {r}r2 (dθ2 + sen2 θdϕ2 )

Pongamos nombres a las tres funciones {r}:

ds2 = D(r)dt2 − E(r)dr2 − F (r)r2 (dθ2 + sen2 θdϕ2 )

Ahora hacemos una transformación de coordenadas (ct, r, θ, ϕ) → (ct, ρ, θ, ϕ),


donde la nueva coordenada ρ está definida por medio de la ecuación ρ2 ≡
F (r)r2 :

ds2 = A(ρ)c2 dt2 − B(ρ)dρ2 − ρ2 (dθ2 + sen2 θdϕ2 ) (13.1)

Este intervalo corresponde al tensor métrico:

 
A(ρ) 0 0 0
 
 0 −B(ρ) 0 0 
 
gµν =


 (13.2)
 0 0 −ρ2 0 
 
0 0 0 −ρ2 sen2 θ

Esta es la métrica del problema más general de campo estático isótropo. El


tensor de Ricci tiene sólo cuatro componentes no nulas:

1 ³ 00 02 0 0 0
´
R00 = − 2ρABA − ρBA − ρAA B + 4ABA
4ρAB 2
1 ³ 00 02 0 0 2 0
´
R11 = 2ρABA − ρBA − ρAA B − 4A B
4ρA2 B

303
1 ³ 0 0 2
´
R22 = − − ρBA + ρAB + 2AB − 2AB
2AB 2
R33 = sen2 θR22

Aquı́ la prima (0 ) quiere decir derivada respecto a ρ. A partir de este momen-


to supondremos que la distribución de momentum y energı́a Tµν está concen-
trada en una región finita del espacio: estamos pensando en una estrella, un
planeta, una bola de polvo, etc. Esta distribución de momentum y energı́a
tiene cierto radio. Vamos a estudiar únicamente la región exterior. Si esta
bola de polvo o estrella no es fuente de campo electromagnético podemos
afirmar, de acuerdo con la discusión de la página 298, que los tensores Tµν
y Rµν son cero. Al imponer las ecuaciones R00 = 0, R11 = 0 y R22 = 0 se
obtiene:

2ρABA00 − ρBA02 − ρAA0 B 0 = −4ABA0 (13.3)

2ρABA00 − ρBA02 − ρAA0 B 0 = 4A2 B 0 (13.4)

−ρBA0 + ρAB 0 + 2AB 2 − 2AB = 0 (13.5)

Obsérvese que los lados izquierdos de (13.3) y (13.4) son iguales; entonces
los lados derechos también tienen que ser iguales: −4ABA0 = 4A2 B 0 , o sea
que AB 0 + BA0 = 0, es decir (AB)0 = 0. Esto significa que:

A(ρ)B(ρ) = una constante (13.6)

Para averiguar el valor de esta constante recordamos que a grandes distancias


la métrica (13.2) debe coincidir con (9.45). Pues bien, al comparar (13.2) con
(9.45) vemos que, a grandes distancias, las funciones A(ρ) y B(ρ) tienden al
valor 1, y por consiguiente la constante de la ecuación (13.6) es 1:

A(ρ)B(ρ) = 1
1
B(ρ) = (13.7)
A(ρ)

Al colocar este resultado en la ecuación (13.5) se obtiene ρA0 + A = 1, es


decir

304
d
(ρA) = 1

La solución de esta ecuación es

k
A=1+ (13.8)
ρ

donde k es una constante cuyo valor debemos averiguar. Para hacerlo es-
tudiemos la situación a distancias grandes, donde esperamos que se logre el
lı́mite newtoniano. El potencial newtoniano es Φ = −GM/r y la ecuación
(12.11) dice que
2GM
A ' 1−
c2 r
k 2GM
Al comparar con (13.8) vemos que = − 2 . Esto significa que ρ es
ρ c r
proporcional a r. Lo más sencillo es escoger ρ igual a r. Con esta elección la
2GM
constante k queda determinada: k = − 2 . Las ecuaciones (13.8) y (13.7)
c
dan finalmente
1 2GM
A = = 1− 2
B c r

El intervalo (13.1) y la métrica (13.2) son:

µ ¶ µ ¶
2 2GM 2 2 2GM −1 2 2 2
ds = 1 − 2 c dt − 1 − 2 dr −r (dθ +sen2 θdϕ2 ) (13.9)
c r c r

 2GM 
1− 0 0 0
 c2 r 
 
 µ ¶ 
 
 2GM −1 
 0 − 1− 2 0 0 
gµν =
 c r 
 (13.10)
 
 
 0 0 −r2 0 
 
 
0 0 0 −r2 sen2 θ

305
Esta es la solución en la región “de afuera”, en el exterior de la distribución
esférica de energı́a y momentum. De ahora en adelante nos concentraremos
en lo que se llama el problema de Schwarzschild: cuando toda la energı́a-
momentum representada por Tµν se acumula en un punto, que es el origen de
coordenadas. En tal caso la métrica (13.10) será válida en todos los puntos
del universo, excepto en r = 0 . Ya que la cantidad 2GM/c2 aparece fre-
cuentemente, conviene darle un nombre; se llama el radio de Schwarzschild :

2GM
s ≡ (13.11)
c2

ds2 = (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 − r2 (dθ2 + sen2 θ dϕ2 ) (13.12)

 
1 − s/r 0 0 0
 
 
 
 0 − (1 − s/r)−1 0 0 
 
gµν =


 (13.13)
 
 0 0 −r2 0 
 
 
0 0 0 −r2 sen2 θ

La inversa de esta matriz es


 
(1 − s/r)−1 0 0 0
 
 
 
 0 −(1 − s/r) 0 0 
 
g µν
=


 (13.14)
 0 0 −r−2 0 
 
 
 
0 0 0 −(r sen θ)−2

Para s = M = 0 se recupera el tensor métrico (9.45) del espacio plano. Antes


de cerrar esta sección anotemos que, como la constante de la gravitación G
es muy baja, s = 2GM/c2 toma valores sorprendentemente pequeños. En
efecto, cuando M es la masa del Sol se obtiene s ' 3 km., y cuando M es
la masa de la Tierra se obtiene s ' 9 mm.

306
13.2 La geometrı́a del espaciotiempo
Con la métrica (13.13) procedemos a calcular los sı́mbolos de Christoffel
y las componentes contravariantes del tensor de Riemann. Resulta que las
cantidades no nulas son

s
Γ0 01 = Γ0 10 =
2r(r − s)
s(r − s) s
Γ1 00 = Γ1 11 = −
2r3 2r(r − s)
Γ1 22 = −r + s Γ1 33 = −(r − s) sen2 θ
1
Γ2 33 = − sen θ cos θ Γ2 12 = Γ2 21 =
r
1
Γ3 13 = Γ3 31 = Γ3 23 = Γ3 32 = cot θ
r
s
R0101 = R1010 = −R1001 = −R0110 =
r3
s
R0202 = R2020 = −R2002 = −R0220 = −
2r4 (r
− s)
s
R0303 = R3030 = −R3003 = −R0330 = − 4
2r (r − s) sen2 θ
s(r − s)
R1212 = R2121 = −R2112 = −R1221 =
2r6
s(r − s)
R1313 = R3131 = −R3113 = −R1331 =
2r6 sen2 θ
s
R2323 = R3232 = −R3223 = −R2332 = − 7
r sen2 θ

Todas las componentes del tensor de Ricci son cero, de acuerdo con (12.27),
y por consiguiente el escalar de curvatura también es cero. El espaciotiempo
es obviamente curvo, porque algunas componentes del tensor de Riemann
no son cero. Nótese, sin embargo, que si s → 0 (es decir, si M → 0) el
espaciotiempo se vuelve plano.

La larga lista de las componentes no nulas del tensor de Riemann es excesiva,


ya que muchas de ellas se obtienen de las otras, utilizando las tres identi-
dades algebraicas (9.83, 9.84, 9.85). En vez de escribir toda la lista, pudimos

307
dar únicamente R0101 , R0202 , R0303 , R1212 , R1313 y R2323 . Ası́ mismo, no
era necesario dar Γ2 21 , Γ3 31 ni Γ3 32 . De ahora en adelante, para ahorrar
espacio, no escribiremos aquellas componentes que pueden averiguarse fácil-
mente utilizando las fórmulas de las identidades algebraicas.

13.3 Subespacios
El triespacio (r, θ, ϕ). En el cuadriespacio (ct, r, θ, ϕ) podemos hacer un
corte de t constante (es decir dt = 0) y lo que queda es un espacio tridi-
mensional. Al poner dt = 0 en las ecuaciones (13.12) y (13.13) queda este
espacio tridimensional:

ds2 = − (1 − s/r)−1 dr2 − r2 (dθ2 + sen2 θdϕ2 ) (13.15)

 
− (1 − s/r)−1 0 0
 
 
gµν =
 0 −r2 0 
 (13.16)
 
0 0 −r2 sen2 θ

Las componentes covariantes no nulas del tensor de Riemann son

s s sen2 θ
Rrθrθ = , Rrϕrϕ = , Rθϕθϕ = −sr sen2 θ
2(r − s) 2(r − s)

Este triespacio es curvo, porque algunas componentes del tensor de Riemann


no son cero. Pero estas se vuelven cero (y el triespacio se aplana) cuando
M → 0 . La curvatura de este triespacio es un efecto gravitacional.

El biespacio (r, θ). En el cuadriespacio (ct, r, θ, ϕ) podemos hacer un


corte de t constante y ϕ constante (es decir dt = dϕ = 0) y lo que que-
da es un espacio bidimensional. Al poner dt = dϕ = 0 en las ecuaciones
(13.12) y (13.13) queda este espacio bidimensional:

ds2 = − (1 − s/r)−1 dr2 − r2 dθ2 (13.17)

308
 
− (1 − s/r)−1 0
gµν =   (13.18)
0 −r2

Las componentes covariantes no nulas del tensor de Riemann son:

s
Rrθrθ =
2(r − s)

Este biespacio es curvo, porque algunas componentes del tensor de Riemann


no son cero. Pero estas se vuelven cero (y el biespacio se aplana) cuando
M → 0. La curvatura de este biespacio es un efecto gravitacional.

El biespacio (θ, ϕ). Si en las ecuaciones (13.12) y (13.13) hacemos dt =


dr = 0, queda un espacio bidimensional:

ds2 = −r2 dθ2 − r2 sen2 θdϕ2 (13.19)

 
−r2 0
gµν =   (13.20)
0 −r2 sen2 θ

Las componentes covariantes no nulas del tensor de Riemann son

Rθϕθϕ = −r2 sen2 θ

Este biespacio, que es una superficie esférica, es curvo, porque algunas com-
ponentes del tensor de Riemann no son cero. Cuando M → 0 , este biespacio
no se aplana: la superficie esférica es curva con M 6= 0 y también es curva
con M = 0. La curvatura de esta superficie no es un efecto gravitacional.

El biespacio (t, r). Si en las ecuaciones (13.12) y (13.13) hacemos dθ =


dϕ = 0, queda un espacio bidimensional:

³ s´ 2 2 ³ s ´−1 2
ds2 = 1 − c dt − 1 − dr (13.21)
r r

309
 
1 − s/r 0
gµν =   (13.22)
−1
0 − (1 − s/r)

Las componentes covariantes no nulas del tensor de Riemann son:

s
Rtrtr =
r3

Este biespacio es curvo, porque algunas componentes del tensor de Riemann


no son cero. Pero estas se vuelven cero (y el biespacio se aplana) cuando
M → 0. La curvatura de este biespacio es un efecto gravitacional.

El biespacio (t, θ). Si en las ecuaciones (13.12) y (13.13) hacemos dr =


dϕ = 0, queda un espacio bidimensional:

ds2 = (1 − s/r) c2 dt2 − r2 dθ2

 
1 − s/r 0
gµν =  
0 −r2

Todas las componentes del tensor de Riemann son cero, cualquiera que sea el
valor de M . Vemos ası́ que el biespacio (t, θ) es plano con M 6= 0 y también
con M = 0.

El biespacio (r, ϕ). Si en las ecuaciones (13.12) y (13.13) hacemos dt =


dθ = 0, queda un espacio bidimensional:

ds2 = − (1 − s/r)−1 dr2 − r2 sen2 θdϕ2 (13.23)

 
− (1 − s/r)−1 0
gµν =  
0 −r2 sen2 θ

Las componentes covariantes no nulas del tensor de Riemann son

310
1 s sen2 θ
Rrϕrϕ =
2 r−s

Este biespacio es curvo, porque algunas componentes del tensor de Riemann


no son cero. Pero estas se vuelven cero (y el biespacio se aplana) cuando
M → 0. La curvatura de este biespacio es un efecto gravitacional.

Para comprender la curvatura de este biespacio podemos simplificar la es-


critura usando longitudes positivas en (13.23), y concentrarnos en aquellas
figuras que están en el plano ecuatorial, para lo cual hacemos θ = π/2:

dl2 = (1 − s/r)−1 dr2 + r2 dϕ2 (13.24)

Para segmentos radiales hacemos dϕ = 0 en (13.24), y para segmentos de


circunferencia hacemos dr = 0:

1
dl = p dr : segmento radial (13.25)
1 − s/r
dl = rdϕ : arco de circunferencia (13.26)

Calculemos el área de la corona comprendida entre los radios r y dr. La


distancia entre los dos cı́rculos está dada por (13.25), y la longitud de la
circunferencia menor se calcula pcon (13.26), y da 2πr. Entonces el área de
la corona es el producto de 1/ 1 − s/r dr con 2πr:

2πrdr
Área = p (13.27)
1 − s/r

Pero esto difiere del resultado euclidiano, que es 2πrdr. Este ejemplo muestra
que el biespacio (r, ϕ) es curvo, mientras s sea diferente de cero. Por supuesto
que para M = 0 se tiene s = 0 y el área (13.27) se convierte en el valor
euclidiano 2πrdr, que es lo que se esperaba, ya que para s = 0 el espacio se
aplana.

13.4 Relojes
Un punto en reposo tiene dr = dθ = dϕ = 0, y en consecuencia el intervalo
(13.12) queda simplemente:

311
ds2 = c2 (1 − s/r) dt2

Ahora supongamos que en ese punto se encuentra un reloj y llamemos T al


tiempo que marca ese reloj que está en reposo. El intervalo es:

ds2 = c2 dT 2

Combinando las dos últimas ecuaciones llegamos a dT 2 = (1 − s/r) dt2 , es


decir:

p
dT = dt 1 − s/r (13.28)
p
= dt 1 + 2Φ/c2 (13.29)

Aquı́, Φ = −GM/r es el potencial gravitacional newtoniano. Si el reloj que


está
p en reposo se encuentra en el infinito, la ecuación (13.28) da dT∞ =
dt 1 − s/∞ = dt. De esta manera se aclara el significado de la coordenada
t que hemos usado desde el principio: t es un tiempo universal; un reloj que
se encuentra en reposo en r = ∞ marca un tiempo t.

La fórmula del intervalo (13.12) da la longitud tridimensional dl:

q
dl = (1 − s/r)−1 dr2 + r2 dθ2 + r2 sen2 θ dϕ2

La velocidad de un punto móvil se puede definir de dos maneras, bien sea


usando dt o dT . La cantidad dl/dt es es una velocidad medida con un reloj
t lejano, que está en el infinito: dl/dt no es una medida local. La cantidad
dl/dT es una velocidad medida con un reloj local T que se encuentra en
reposo. Esta última será llamada velocidad local y le asignaremos el sı́mbolo
v, ası́: v = dl/dT .

Saquemos c2 dt2 como factor común en la fórmula del intervalo (13.12):

" µ ¶2 #
2 1 dl
ds = 1 − s/r − 2 c2 dt2 (13.30)
c dt

312
Esta fórmula da un resultado interesante para pulsos de luz, ya que si hace-
mos ds = 0 encontramos

dl p
= c 1 − s/r ,
dt

o sea que la velocidad no local de la luz, dada por dl/dt, no es c. Afortu-


nadamente la velocidad local, dada por dl/dT , sı́ es c, como veremos ensegui-
da. En vista de (13.28), podemos escribir (dl/dt)2 = (1 − s/r) (dl/dT )2 =
(1 − s/r)v 2 , y la ecuación (13.30) se convierte en:

¡ ¢
ds2 = (1 − s/r) 1 − v 2 /c2 c2 dt2 (13.31)

Haciendo ds2 = 0 en esta ecuación se llega a v = c. En palabras: la velocidad


de la luz, medida localmente con un reloj en reposo, es c.

Concentrémonos ahora en lo que ocurre con una partı́cula móvil, llaman-


do dτ , como es costumbre, al tiempo que marca un reloj que la acompaña.
Hacemos ds2 = c2 dτ 2 en (13.31) para escribir:
p
dτ = dt (1 − s/r) (1 − v 2 /c2 ) (13.32)
p
= dt (1 + 2Φ/c) (1 − v 2 /c2 ) (13.33)

Esta es una fórmula general, con tres casos particulares importantes: 1)


Cuando el reloj está en reposo, dτ = dT y la ecuación (13.32) se convierte
en (13.28). 2) Cuando el reloj está en el infinito y tiene velocidad v, la
ecuación (13.32) se convierte en (2.14). 3) Cuando el reloj está en reposo
en el infinito, τ = t. La ecuación general (13.33) muestra que el reloj τ se
atrasa respecto a t por dos causas diferentes: por tener velocidad, asunto
que ya se ha estudiado en la relatividad especial, y por estar en un campo
gravitacional. Veamos en detalle este último.

La existencia de un tiempo universal t facilita la comprensión del espaci-


otiempo de Schwarzschild, ya que podemos imaginar cortes de simultanei-
dad. La Figura 13.1 trae tres lı́neas rectas horizontales; todos los eventos
contenidos en la primera lı́nea tienen el mismo valor t = 7; asimismo, todos

313
los eventos contenidos en la segunda lı́nea tienen el mismo valor t = 8, etc. La
Figura también trae dos lı́neas rectas verticales; una representa a un tripunto
fijo (r1 , θ1 , ϕ1 ), y la otra representa a otro tripunto fijo (r2 , θ2 , ϕ2 ). Supong-
amos ahora que desde el punto (r1 , θ1 , ϕ1 ) se lanza una serie de proyectiles
hacia (r2 , θ2 , ϕ2 ), periódicamente, y todos ellos se lanzan de la misma manera
(con la misma velocidad inicial y la misma inclinación). La Figura muestra,
en lı́neas curvas, las trayectorias de esos proyectiles. Lo interesante es que,
debido a que el espaciotiempo de Schwarzschild es estático (véase la métrica
(13.13)), las trayectorias de todos los proyectiles son similares, y en conse-
cuencia todas las lı́neas curvas de la Figura 13.1 son repetitivas. Llamemos
ahora ∆t1 al tiempo universal que transcurre entre dos proyectiles sucesivos
emitidos en el primer punto, y ∆t2 al lapso entre dos proyectiles sucesivos
recibidos en el segundo punto. Como todas las lı́neas curvas de la Figura
13.1 son similares, es claro que:

∆t1 = ∆t2 (13.34)

Pensemos ahora que en los dos puntos hay dos relojes en reposo, y llamemos
T1 y T2 a los tiempos que ellos marcan. El primer reloj mide el tiempo
∆T1 que transcurre entre dos proyectiles sucesivos emitidos y el segundo
reloj mide el tiempo ∆T2 que transcurre entre dos proyectiles recibidos. La
fórmula (13.28) dice que:

p
∆T1 = ∆t1 1 − s/r1
p
∆T2 = ∆t2 1 − s/r2

Dividir lado a lado esta dos ecuaciones y utilizar la ecuación (13.34):

s
1 − s/r2
∆T2 = ∆T1 (13.35)
1 − s/r1

Nótese que r2 < r1 ⇒ ∆T2 < ∆T1 : mientras más hundido está un reloj en
el campo gravitacional, más se atrasa.

Los relojes se atrasan bien sea a causa del campo gravitatorio o a causa
de la velocidad translacional que ellos tengan. Uno podrı́a preguntarse si

314
acaso la aceleración también ocasiona algún atraso. La respuesta es no: se
han realizado experimentos con aceleraciones extremas en ciclotrones, en los
que los relojes (sistemas atómicos) no registran atrasos debidos a la acel-
eración.

Antes de concluir esta sección vamos a completar el estudio de la velocidad


local v = dl/dT , escribiendo en detalle sus tres componentes. La fórmula
del intervalo (13.12) da la longitud tridimensional dl y sus tres componentes
dlr , dlθ y dlϕ :

q
dl = (1 − s/r)−1 dr2 + r2 dθ2 + r2 sen2 θ dϕ2
dr
dlr = p (13.36)
1 − s/r
dlθ = r dθ
dlϕ = r sen θ dϕ

Al dividir estas cantidades por dT se obtienen las componentes vr , vθ y vϕ :

dl q
v = = vr2 + vθ2 + vϕ2 (13.37)
dT
dlr 1 dr
vr = = p (13.38)
dT 1 − s/r dT
dlθ dθ
vθ = = r (13.39)
dT dT
dlϕ dϕ
vϕ = = r sen θ (13.40)
dT dT

A continuación vamos a deducir una ecuación interesante que combina las


variables r, v y vϕ . Si el movimiento se desarrolla únicamente en el plano
ecuatorial, vθ = 0 y la ecuación (13.37) dice que vr2 = v 2 − vϕ2 , o sea que:

à !
vr2 v 2 vϕ2
= 1− 1− 2 + 2
c2 c c

En el segundo término del lado derecho multiplicar y dividir por (1 − s/r):

315
 " #2 
vr2 ³ s ´  1 − v 2 /c2 rvϕ /c 1
2
= 1− 1− + p
c r 1 − s/r 1 − s/r r2

Esta ecuación se escribe concisamente ası́:

³ µ ¶
vr2 s´ J2
= 1− 1− D+ 2 , (13.41)
c2 r r

donde
1 − v 2 /c2 r vϕ
D = , J = p (13.42)
1 − s/r 1 − s/r c

Las cantidades D y J son funciones de r, v y vϕ ; en general, D y J van


cambiando a medida que el punto móvil progresa en su trayectoria. Pero
hay una excepción importante: cuando la trayectoria del punto móvil es
una geodésica, las cantidades D y J se mantienen constantes, es decir, son
constantes del movimiento. Esto lo veremos pronto.

13.5 Corrimiento hacia el rojo


Consideremos de nuevo los dos relojes de la sección anterior. La frecuencia
a la que se emiten los proyectiles es ν1 = 1/∆T1 , y la frecuencia a la que
se reciben es ν2 = 1/∆T2 . Si dividimos lado a lado estas dos ecuaciones se
obtiene ν2 /ν1 = ∆T1 /∆T2 , y en vista de (13.35) se llega finalmente a:

s
1 − s/r1
ν2 = ν1 (13.43)
1 − s/r2

Si r2 < r1 entonces ν2 > ν1 : esto se llama corrimiento hacia el azul. Si


r2 > r1 entonces ν2 < ν1 , y se llama corrimiento hacia el rojo. Uno se
puede figurar, en la imaginación, que mientras la luz baja (hacia la masa
M ) se fortalece, aumenta su frecuencia y se corre hacia el azul. Ası́ mismo,
subir debilita a la luz, le disminuye su frecuencia2 y la corre hacia el rojo.
2
En óptica, cuando la luz pasa por materiales transparentes de diversos ı́ndices de
refracción, su frecuencia y su color no cambian. Pero en la relatividad einsteiniana, cuando
la luz pasa por una región donde hay campo gravitacional, su frecuencia y su color son
cambiantes.

316
Pensemos en un pulso de luz emitido en la superficie de una estrella (la
coordenada radial de este punto de emisión es r1 = R) y recibido en otro
punto cuya coordenada radial es r2 = ∞. La fórmula (13.43) da en este caso
ν∞ = νR [1 − s/R]1/2 . Expandir el binomio: ν∞ = νR [1 − s/2R + · · ·]. Si s/R
es pequeño conservamos los dos primeros términos en esta serie, obteniendo
ν∞ = νR [1 − s/2R], es decir

· ¸
GM
ν∞ = νR 1 − 2 (13.44)
c R

O sea que la frecuencia recibida en r = ∞ es menor que la emitida en la


estrella: corrimiento hacia el rojo. En el viaje desde la estrella hasta el in-
finito, la luz sube de un lugar donde el potencial gravitacional newtoniano
Φ = −GM/R es negativo, a otro donde es cero; en este ascenso la luz se de-
bilita, su frecuencia disminuye y su color tira hacia el rojo. ¿Qué podrı́amos
decir de la luz que viaja desde el infinito hacia la estrella?: el descenso la
fortalece, le aumenta la frecuencia y su color tira hacia el azul. Al subir, la
luz se enrojece. Y al bajar se azulea.

Para darnos cuenta de la magnitud del corrimiento pongamos en la fórmula


la masa y el radio del Sol: M¯ = 1.99 × 1033 g, R¯ = 6.96 × 1010 cm:

ν∞ = ν¯ (1 − 2.12 × 10−6 )

En otras palabras, (ν¯ −ν∞ )/ν¯ es cerca de dos millonésimas. Esta diferencia
es pequeña, pero se ha observado. También se ha observado el corrimiento
hacia el rojo en la luz de otras estrellas, como por ejemplo Sirio y Eridani.3

13.6 Constantes del movimiento


A continuación vamos a estudiar la caı́da libre de una partı́cula de cualquier
masa, bien sea m = 0 o m 6= 0. Tal como hemos visto, la trayectoria es una
geodésica. Lo primero es identificar las constantes del movimiento siguiendo
3
Hay tres clases de corrimiento hacia el rojo : 1) Debido a la explosión del espacio
(big bang), se corren hacia el rojo la luz de las galaxias y la radiación de fondo. 2) El
del efecto Doppler, causado por la velocidad fuente-receptor y explicado por la relatividad
especial en la sección 5.8. Finalmente, 3) el gravitacional, explicado en esta sección por la
relatividad general.

317
la regla (10.15). Como x0 y x3 no aparecen en la métrica (13.13), podemos
asegurar que g0β dxβ /dλ y g3β dxβ /dλ son constantes del movimiento:

dxβ dx0 dt dt
g0β = g00 = cg00 = c (1 − s/r)
dλ dλ dλ dλ

dxβ dx3 dϕ
g3β = g33 = −r2 sen2 θ
dλ dλ dλ

Ajustamos el parámetro afı́n de manera que la primera constante valga 1 y a


la segunda constante la llamamos −J. Escribimos entonces c(1−s/r)dt/dλ =
1 y −r2 sen2 θdϕ/dλ = −J, es decir,

dλ = c (1 − s/r) dt (13.45)


J = r2 sen2 θ (13.46)

Vamos a demostrar que el movimiento de la partı́cula se desarrolla en un


plano. Si J es cero en un instante, también será cero en todos los instantes.
Pero J es proporcional a dϕ/dλ, y podemos afirmar en consecuencia que
si dϕ/dλ es cero en un instante, también será cero en todos los instantes.
Esto es lo que ocurre si la partı́cula se mueve en un plano que pasa por los
polos norte y sur. Esta idea se generaliza afirmando que si en un instante la
partı́cula se mueve en un plano (cualquiera) que pase por el centro, entonces
ella nunca abandonará ese plano4 . Para simplificar la escritura conviene que
orientemos al eje zeta de modo que el plano del movimiento sea el plano
ecuatorial; haciendo θ = π/2, dθ = 0 en las ecuaciones (13.12) y (13.46) se
obtiene:

ds2 = (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 − r2 dϕ2 (13.47)



J = r2 (13.48)

dϕ J
= (13.49)
dλ r2
4
Recordemos la manera como se trata, en mecánica newtoniana, el problema de una
partı́cula sujeta a una fuerza central: el torque es cero ⇒ el momentum angular es constante
⇒ el movimiento se desarrolla en un plano.

318
13.7 Una tercera constante del movimiento
De las cuatro ecuaciones (10.8) de las geodésicas ya hemos ejecutado dos,
al identificar las dos constantes del movimiento de la sección anterior. Nos
falta por considerar las otras dos ecuaciones de las geodésicas:

d2 x1 1 dxµ dxν
+ Γ µν =0 (13.50)
dλ2 dλ dλ

d2 x2 2 dxµ dxν
+ Γ µν =0 (13.51)
dλ2 dλ dλ

Utilizando los sı́mbolos Γ0 µν de la página 307, y la escogencia θ = π/2,


dθ = 0, es evidente que la ecuación (13.51) se convierte en d2 θ/dλ2 = 0 , lo
cual, si bien es cierto, no es útil. Nos queda entonces la ecuación (13.50);
usando los coeficientes Γr µν de la página 307 y la condición θ = π/2, dθ = 0,
obtenemos:

µ ¶2 µ ¶2 µ ¶2
d2 r s dr c2 s(r − s) dt dϕ
2
− + − (r − s) =0
dλ 2r(r − s) dλ 2r3 dλ dλ

En el tercer término usar (13.45) y en el cuarto término usar (13.49):

µ ¶2
d2 r s dr s(r − s) ³ s ´−2 J 2 (r − s)
2
− + 1 − − =0
dλ 2r(r − s) dλ 2r3 r r4

2r dr
Multiplicar ambos lados de esta ecuación por :
r − s dλ

µ ¶3
2r dr d2 r s dr s dr 2J 2 dr
2
− + − =0
r − s dλ dλ (r − s)2 dλ (r − s)2 dλ r3 dλ

Reunir los dos primeros términos con un común denominador:

µ ¶3
dr d2 r dr
2r(r − s) −s
dλ dλ2 dλ s dr 2J 2 dr
+ − =0
(r − s)2 (r − s)2 dλ r3 dλ

319
El lado izquierdo de esta ecuación tiene tres términos. El primer término es
d r(dr/dλ)2 d r
igual a ; el segundo término es − , y el tercer término
dλ r − s dλ r − s
d J2
es . La ecuación es entonces
dλ r2
 µ ¶2 
dr
r
d 
 dλ r J2 

 − + 2=0
dλ  r − s r−s r 

o sea que la cantidad entre paréntesis es una constante, a la que llamaremos


−D:
µ ¶2
dr
1−
dλ J2
D ≡ s − (13.52)
1− r2
r
dD
= 0 (13.53)

La ecuación (13.52) se puede escribir también ası́ :

µ ¶2 ³ µ ¶
dr s´ J2
=1− 1− D+ 2 (13.54)
dλ r r

13.8 J y D en términos de r, v y vϕ
Las variables naturales de la cinemática son la posición y la velocidad. Si
nosotros conocemos la posición y la velocidad de una partı́cula en cierto in-
stante, deberı́amos ser capaces de utilizar esa información para averiguar los
valores de las constantes J y D. En esta sección nos proponemos deducir las
fórmulas correspondientes. Para ejecutar esta tarea debemos encontrar ini-
cialmente la relación que existe entre el parámetro λ y el tiempo local
p T : bas-
ta combinar las ecuaciones (13.28) y (13.45)para obtener dλ = cdT 1 − s/r.
Con este resultado las ecuaciones (13.48) y (13.52) dan:

1 dϕ
J = r2 p
c 1 − s/r dT

320
µ ¶2
1 dr
1− 2 µ ¶2
c (1 − s/r) dT r2 dϕ
D = − 2
1 − s/r c (1 − s/r) dT

Aquı́ reconocemos las velocidades locales vr , vϕ y v 2 que habı́amos definido


en las ecuaciones (13.37), (13.38) y (13.40), lo que nos permite escribir:

r vϕ
J = p (13.55)
1 − s/r c

1 − v 2 /c2
D = (13.56)
1 − s/r

Estas son las fórmulas que buscábamos. Si sabemos que una partı́cula en
caı́da libre pasa por r, y que al pasar por r tiene velocidades locales v y vϕ ,
entonces las ecuaciones (13.55) y (13.56) nos permiten averiguar los valores
de J y D.

Los valores r, v y vϕ que la partı́cula tiene en cierto instante (es decir,


las condiciones iniciales) determinan unı́vocamente la trayectoria futura y
pasada: en otros instantes la partı́cula tiene que ajustar los valores de r,
v y vϕ de modo que las cantidades J y D adopten los mismos valores que
adoptaron en el instante inicial. Esto de ajustar es lo que quiere decir que J
y D sean constantes del movimiento. Cada geodésica en el espaciotiempo de
Schwarzschild está caracterizada por dos números, que son los valores que
adoptan J y D. Una vez que la partı́cula ha escogido determinada geodésica
(es decir, determinados valores de J y D), no podrá abandonarla jamás, ya
que abandonarla serı́a como cambiar los valores iniciales de J y D.

Continuemos con el examen de las ecuaciones (13.55) y (13.56). Es claro


que ellas se combinan para producir esta otra relación, que será útil dentro
de poco:
Dr2 1 − v 2 /c2
= (13.57)
J2 vϕ2 /c2

De otro lado, las ecuaciones (13.55) y (13.56) se pueden invertir para expre-
sar v y vϕ en términos de las constantes D y J:

v2 ³ s´
= 1− 1− D (13.58)
c2 r

321
vϕ2 ³ s´ J2
= 1− (13.59)
c2 r r2

Restamos lado a lado estas dos ecuaciones para obtener:

³ µ ¶
v 2 − vϕ2 s´ J2
=1− 1− D+ 2
c2 r r

Pero v 2 − vϕ2 = vr2 , entonces

³ µ ¶
vr2 s´ J2
=1− 1− D+ 2 (13.60)
c2 r r

Obsérvese que

dr dT dt dr p 1 dr dlr vr
= = 1 − s/r = = , (13.61)
dλ dt dλ dT c(1 − s/r) dT cdT c

o sea que las ecuaciones (13.60) y (13.54) son equivalentes. Observemos


también la diferencia que existe entre las ecuaciones (13.41) y (13.60): en
la primera ecuación, las cantidades D y J son, en general, variables, mien-
tras que en la segunda ecuación las cantidades D y J son constantes del
movimiento.

A grandes distancias, la constante J tiene un significado que es familiar.


En efecto, para s/r muy pequeño la ecuación (13.55)da cJ ' rvϕ . En pal-
abras, a grandes distancias cJ tiende al momentum angular zeta por unidad
de masa.

La constante D permite también algunos comentarios. Para un pulso de


luz se tiene v = c, y en en este caso la ecuación (13.56) dice que D = 0. Para
partı́cula masiva la ecuación (13.58) es clara: dado un valor de D, la veloci-
dad local v depende únicamente de la coordenada r. Cuando la partı́cula se
acerca, r disminuye y la velocidad v tiene que aumentar. Esta ecuación es
análoga a la ecuación newtoniana que dice que la energı́a total (que es con-
stante) es la suma de la energı́a cinética y la energı́a potencial. La analogı́a
se confirma al estudiar el comportamiento de D en el lı́mite newtoniano: la
ecuación (13.56) es D = (1 − v 2 /c2 )(1 − s/r)−1 = (1 − v 2 /c2 )(1 + s/r + · · ·)

322
µ ¶
2 1 2
→ (1 − v 2 /c2 )(1 + s/r) ' 1 − (v 2 /c2 − s/r) = 1 − v + Φ . Vemos
c2 2
1
ası́ que (1 − D)c2 /2 → v 2 + Φ; en palabras, (1 − D)c2 /2 tiende a la energı́a
2
total (prerrelativista) por unidad de masa.

¿Cuáles son los valores numéricos que adoptan las constantes J y D? Es-
peramos responder esta pregunta, al menos medianamente, estudiando dos
casos bien diferentes: el del planeta Tierra y el de una partı́cula de alta ve-
locidad que pasa por las cercanı́as del origen.

La Tierra en su órbita alrededor del Sol tiene una r promedio de 1.49 × 1013
cm y una velocidad promedio de 0.98 × 10−4 c ; como el s del Sol es 2.93 km,
concluimos que J/s ' 5000 y D ' 1 + 0.00000001. Aprendemos que para los
planetas solares J/s es un número muy grande y que D es muy cercano a 1,
y mayor que 1. Pensemos ahora en una partı́cula masiva de alta velocidad,
v = 0.8c y r promedio igual a 10s; en este caso se obtiene J/s ' 8 y D ' 0.4.

13.9 Las cuatro variables t, T, τ y λ


Queremos hacer una recopilación de las relaciones que existen entre las cua-
tro variables t, T, τ y λ. Antes de hacerlo conviene que repasemos el signifi-
cado de esas variables.

t es un tiempo universal. Un reloj en reposo en r = ∞ marca un tiempo t.


El tiempo T es el que marca un reloj en reposo en un punto con coordena-
da radial r. El parámetro afı́n dλ es el que participa en las ecuaciones de
las geodésicas. Para una partı́cula masiva el intervalo ds2 es igual a c2 dτ 2 ,
donde dτ es el tiempo que marca un reloj que acompaña a la partı́cula. Se
puede verificar, con lo expuesto en las páginas anteriores, que las relaciones
entre las cuatro variables son:

dλ = c (1 − s/r) dt (13.62)
c
dλ = √ dτ (13.63)
D

dτ = D (1 − s/r) dt (13.64)
p
dT = 1 − s/r dt (13.65)

323
1
dT = p dτ (13.66)
D (1 − s/r)
1
dT = p dλ (13.67)
c 1 − s/r

13.10 La caı́da vertical


Hagamos una pausa para estudiar una trayectoria simple, que es la que de-
scribe una partı́cula masiva que se suelta desde cierta altura. Este es, sin
duda, uno de los problemas más importantes de la fı́sica, como lo demuestra
el interés que Galileo le prestó al construir las bases de la ciencia moderna.

Suponemos que la partı́cula se suelta desde una altura r0 . Este dato deberı́a
ser suficiente para determinar la constante D; en efecto, haciendo v = 0 en
la ecuación (13.56) encontramos

1
D= (13.68)
1 − s/r0

Igualando los lados derechos de las ecuaciones (13.56) y (13.68) se obtiene:

s
s/r − s/r0
v = c (13.69)
1 − s/r0

1 − v 2 /c2
r0 = s (13.70)
s/r − v 2 /c2

Pensemos en este momento en el problema recı́proco, el de una partı́cula


masiva que inicialmente está en r y que se dispara hacia arriba con una
velocidad v. A medida que asciende, su velocidad disminuye hasta que se
vuelve cero en r0 . Vemos ası́ que la ecuación (13.69) da respuesta a dos pre-
guntas: a) da la velocidad (en r) que tiene una partı́cula que se suelta en r0
y, b) da la velocidad vertical que hay que impartirle a una partı́cula para
que alcance una altura máxima r0 . Del mismo modo, la ecuación (13.70)
responde dos preguntas: a) si se sabe que una partı́cula tiene (en r) una
velocidad v hacia abajo, la ecuación nos permite averiguar desde qué altura
fue soltada, y, b) si una partı́cula se dispara (en r) hacia arriba, la ecuación
dice cuál es la altura máxima que ella alcanza.

324
La ecuación (13.69) tiene un caso interesante, y es cuando r0 = ∞:

p
v = c s/r para r0 = ∞ (13.71)

En palabras: si, con un disparo vertical, se quiere enviar una partı́cula


p al
infinito, se le debe impartir una velocidad local mayor o igual que c s/r.

Concentrémonos ahora en otro aspecto de la caı́da vertical, que es el cálculo


del tiempo que transcurre entre r0 y r. Como el movimiento se da única-
mente en la dirección radial, la constante J es cero y la ecuación (13.54)
queda ası́:
µ ¶2
dr
= 1 − (1 − s/r)D (13.72)

Utilizar la ecuación (13.63):

Ã√ !2
D dr ³ s´
=1− 1− D (13.73)
c dτ r

Al tomar raı́z cuadrada surge un ±; escogemos el signo − porque la partı́cula


está cayendo:
√ r ³
D dr s´
=− 1− 1− D,
c dτ r

es decir:
rdr
cdτ = − r ,
D−1 2
sr − r
D

y utilizando la ecuación (13.68):

rdr
cdτ = −r
s 2
sr − r
r0

325
¶ µ
r r
d
r2 r0 r0
cdτ = −√ 0 s µ ¶ (13.74)
sr0 r r 2

r0 r0

Llamar x ≡ r/r0 e integrar, asumiendo que el reloj τ comienza a marchar


cuando la partı́cula se suelta:

Z τ Z r/r0
r2 xdx
c dτ = − √ 0 √ (13.75)
0 sr0 1 x − x2

La integral del lado derecho se resuelve con ayuda de la fórmula 2.264.2


de [14], que es

Z p
xdx 1
√ = − x − x2 − arc sen(1 − 2x)
x−x 2 2

La ecuación (13.75) es entonces

s 
µ ¶2 µ ¶
r02  r r 1 2r π
cτ = √ − + arc sen 1 − + (13.76)
sr0 r0 r0 2 r0 4

También nos interesa calcular t , el tiempo coordenado, y esto es un poco


más difı́cil. Veamos: en vista de la ecuación (13.62) la ecuación (13.72) es

µ ¶2
1 dr
= 1 − (1 − s/r)D ,
(1 − s/r)2 cdt

y utilizando la fórmula (13.68):

µ ¶2
1 dr 1 − s/r
=1− ,
(1 − s/r)2 cdt 1 − s/r0

de donde despejamos cdt:

326
p
1 − s/r0 dr
cdt = − p (13.77)
(1 − s/r) s/r − s/r0

Para integrar el lado derecho de esta ecuación conviene [24] hacer el cambio
de variable η = arc cos(2r/r0 − 1) , para finalmente llegar a

¯r r ¯
¯ r0 r0 ¯
¯ − 1 ¯¯
¯ s −1+ r
ct = s ln ¯¯ r r ¯ +
¯
¯ r0 r0 ¯
¯ − 1 − − 1 ¯
s r
 s 
r ³ ´ µ ¶ µ ¶2
r0 r0 2r r0 r r
s −1  + 1 arc cos −1 + + 
s 2s r0 s r0 r0
(13.78)

Esta es verdaderamente la integración de la ecuación (13.77); para cercio-


rarse de ello basta verificar que la ecuación (13.77) se obtiene tomando
diferenciales en ambos lados de (13.78).

Observemos que el logaritmo en el lado derecho de la ecuación (13.78) di-


verge en r = s . Esto quiere decir que para llegar a r = s la partı́cula toma
una cantidad infinita de tiempo coordenado t . La Figura 13.4 muestra dos
curvas: en trazo continuo el tiempo propio τ dado por la fórmula (13.76), y
en trazo punteado el tiempo coordenado t dado por la fórmula (13.78). No-
toriamente, el tiempo propio τ es una función de buena conducta, mientras
que el tiempo coordenado t tiene un comportamiento muy preocupante. En
la sección 13.19 abordaremos de nuevo este asunto.

Finalmente, es interesante anotar que la fı́sica newtoniana da la misma re-


spuesta (13.76). En efecto, en la gravitación de Newton el potencial grav-
itacional es −GM/r = −c2 s/2r, y por consiguiente la energı́a total para
una partı́cula de masa m es −c2 sm/2r + 12 mu2 . Como esta energı́a es una
constante del movimiento podemos escribir

c2 sm 1 c2 sm
− + mu2 = − + 0,
2r 2 2r0

de donde

327
µ ¶
1 1
u2 = c2 s −
r r0

Esta ecuación newtoniana coincide con la ecuación relativista (13.73), o sea


que el tiempo newtoniano es el mismo tiempo dado por la ecuación (13.76).

13.11 Potencial efectivo


Definimos
³ µ ¶
s´ J2
V = 1− D+ 2 (13.79)
r r

de modo que la ecuación (13.60) es

vr2
= 1−V (13.80)
c2

Al tomar la derivada d/dT en ambos lados de esta ecuación se obtiene


2vr dvr dV dlr dV dV
2
=− =− = −vr , o sea que
c dT dT dT dlr dlr

dvr c2 dV
=− (13.81)
dT 2 dlr

Esta ecuación es de la forma “aceleración es menos el gradiente del po-


tencial”, y por esta razón V recibe el nombre de potencial efectivo. Como
vr2 ≥ 0, el lado derecho de la ecuación (13.80) también tiene que ser ≥ 0:
el movimiento de la partı́cula está permitido solamente en aquellas regiones
del espacio donde V ≤ 1. El gráfico de V versus r es sumamente útil. En
un mismo gráfico se traza la función V versus r y se traza una lı́nea hor-
izontal a una altura 1; la partı́cula puede moverse únicamente en aquellas
regiones donde V está por debajo de la lı́nea horizontal de altura 1. La
ecuación (13.81) corresponde a un problema ficticio unidimensional en el
que la fuerza es proporcional a −dV /dr. En aquellas regiones donde V es
una función decreciente de r, la fuerza es repulsiva; y allı́ donde V es una
función creciente, la fuerza es atractiva. Los puntos de retorno ocurren en
aquellos valores de r en los que V = 1. El movimiento circular ocurre cuando
se cumplen estas dos condiciones: V = 1 y dV /dr = 0; si d2 V /dr2 < 0, el

328
movimiento circular es inestable, y si d2 V /dr2 > 0 es estable.

La Figura 13.2 muestra las posibilidades que tiene un fotón (D = 0) que


tiene un valor de J dado por J = 2.7s ; en la gráfica, A y B son puntos de re-
torno: el movimiento es posible únicamente en las regiones r < rA y r > rB ;
en la primera región las órbitas son ligadas y en la segunda desligadas. La
Figura 13.3 es para una partı́cula masiva que tiene D = 0.5 y J = 2.7s ;
también en esta gráfica A y B son puntos de retorno: el movimiento es posi-
ble únicamente en las regiones r < rA y r > rB ; en la primera región las
órbitas son ligadas y en la segunda desligadas.

El lector seguramente reconoce el mismo método y los mismos elementos


gráficos que se usan en mecánica clásica: potencial efectivo, puntos de re-
torno, pozos de potencial, etc. Hay sin embargo una diferencia importante
entre los gráficos de la mecánica clásica y los de la solución de Schwarzschild:
en los primeros la lı́nea horizontal representa energı́a total y es de altura
variable, en cambio en los segundos la lı́nea horizontal es de altura fija 1.

Máximos y mı́nimos de V (r). Calculemos las dos primeras derivadas


del potencial efectivo, usando la ecuación (13.79):

µ ¶
dV sJ 2 Dr2 2r
= +3− (13.82)
dr r4 J2 s
µ ¶
d2 V 2sJ 2 Dr2 3r
= − 2 −6+ (13.83)
dr2 r5 J s

En los máximos y mı́nimos ocurre que dV /dr = 0. Al hacer dV /dr = 0 en


(13.82) se obtiene:
Dr2 2r
2
+3− = 0 (13.84)
J s

Las soluciones de esta ecuación son:


" r #
J2 3Ds2
r= 1± 1− (13.85)
Ds J2

Para que los máximos y mı́nimos verdaderamente existan es necesario que

329
los valores dados en la ecuación (13.85) sean cantidades reales, es decir, que
3Ds2
1− sea ≥ 0:
J2
J2
≥1 (13.86)
3Ds2

La fórmula (13.85) presenta dos valores de r. ¿En cuál de ellos ocurre un


máximo y en cuál un mı́nimo? Para responder esta pregunta debemos evalu-
ar la segunda derivada d2 V /dr2 en los puntos (13.85) y determinar si d2 V /dr2
es negativa o positiva. Al colocar (13.85) en (13.83) se obtiene:

à " r # !
d2 V 6J 2 s J2 3Ds2
= 1± 1− −1 (13.87)
dr2 r5 3Ds2 J2

Utilizando (13.86) en (13.87) vemos que con el signo superior se obtiene


d2 V /dr2 > 0, y con el signo inferior d2 V /dr2 < 0. Leamos finalmente la
ecuación (13.85) ası́:

" r #
J2 3Ds2
r = 1− 1− V es máximo (13.88)
Ds J2
" r #
J2 3Ds2
r = 1+ 1− V es mı́nimo (13.89)
Ds J2

Nótese que (13.88) es menor que (13.89): si el máximo y el mı́nimo de V


ocurren (ver condición (13.86)), el máximo se presenta en las cercanı́as del
origen, y el mı́nimo en las lejanı́as. Una curva tı́pica es ası́: V es cero en
r = s y asciende monótonamente hasta el r dado por (13.88). Allı́ comienza
a descender hasta que logra el mı́nimo en el r dado por (13.89). Allı́ comien-
za a ascender de nuevo y tiende asintóticamente al valor V = D. Es en este
último pozo de potencial donde están los planetas del sistema solar.

La ecuación (13.85) da los valores de r en términos de las constantes D


y J. También es deseable expresar estos r en términos de las velocidades
locales v y vϕ , y para tal efecto usamos la ecuación (13.57) en (13.84), con
lo que se llega al siguiente resultado:

330
r 3 1 − v 2 /c2
= + V máximo o mı́nimo (13.90)
s 2 2vϕ2 /c2

Puntos de retorno. Éstos ocurren en aquellos valores de r donde vr = 0,


es decir:

vϕ = v puntos de retorno (13.91)

Trayectoria circular. La órbita es circular si se cumplen simultánea-


mente las condiciones (13.90) y (13.91). Combinando estas dos ecuaciones
obtenemos
r 1 1
= 1+ órbita circular (13.92)
s 2 v 2 /c2

La trayectoria circular es inestable si V está en el máximo, y es estable si


V es mı́nimo. En otras palabras, inestable para d2 V /dr2 < 0, y estable para
d2 V /dr2 > 0. Investiguemos entonces bajo qué condiciones d2 V /dr2 < 0
utilizando la ecuación (13.83):

Dr2 3r
− 2
−6+ <0 inestable,
J s

y en vista de (13.57) y 13.91):

1 − v 2 /c2 3r
− −6+ <0
v 2 /c2 s
Ahora utilizar (13.92):

1 − v 2 /c2 3 1
− 2 2
−6+3+ <0
v /c 2 v 2 /c2
Despejar v/c para llegar finalmente a v/c > 1/2. Para movimiento circular
estable se obtiene v/c < 1/2. Si deseamos expresar estas desigualdades v/c ≷
1/2 en términos de r, utilizamos la ecuación (13.92), obteniéndose r ≶ 3s.
En conclusión:

v < c/2 ⇐ estable ⇒ r > 3s


(13.93)
v > c/2 ⇐ inestable ⇒ r < 3s

331
13.12 Puntos de retorno
En ocasiones lo que se conoce de la trayectoria de una partı́cula es los puntos
de retorno. En esta sección nos proponemos aprovechar esa información para
averiguar el valor de las constantes D y J 2 . En los puntos de retorno se hace
cero el lado derecho de la ecuación (13.60):

³ µ ¶
s´ J2
1− 1− D + 2 = 0,
r r

es decir:
sD 2 J2 sJ 2
r3 − r + r− = 0 (13.94)
D−1 D−1 D−1

Esta es una ecuación de tercer grado y tiene, naturalmente, tres soluciones,


que llamaremos r1 , r2 y r3 . Las tres raı́ces r1 , r2 , r3 son, en general números
complejos, y denotan puntos verdaderos de retorno cuando son números
positivos. La ecuación (13.94) se puede escribir de esta otra manera:

(r − r1 )(r − r2 )(r − r3 ) = 0 (13.95)

Al expandir todos los productos en esta ecuación se obtiene

r3 − (r1 + r2 + r3 ) r2 + (r1 r2 + r2 r3 + r3 r1 ) r − r1 r2 r3 = 0 (13.96)

Ahora comparamos uno a uno los términos de las ecuaciones (13.94) y


(13.96), para llegar a:

sD
r1 + r2 + r3 = (13.97)
D−1
J2
r1 r2 + r2 r3 + r3 r1 = (13.98)
D−1
sJ 2
r1 r2 r3 = (13.99)
D−1

332
Estas tres ecuaciones se pueden utilizar de dos maneras. La primera es ex-
presar a las raı́ces r1 , r2 y r3 en términos de las constantes D y J 2 : se
obtienen unas ecuaciones sumamente complicadas. La segunda es expresar
a las constantes D y J 2 en términos de dos raı́ces r1 y r2 :

sr1 r2
r1 r2 − s(r1 + r2 ) +
r1 + r2
D = (13.100)
r1 r2 − s(r1 + r2 ) + s2
s (r1 r2 )2
J2 = (13.101)
r1 + r2 r1 r2 − s(r1 + r2 ) + s2

Es claro que en estas expresiones la pareja r1 , r2 puede ser substituida por


r2 , r3 o por r3 , r1 . Entre las tres raı́ces r1 , r2 y r3 existe una relación muy
simple. Para deducirla dividamos ambos lados de (13.99) por s:

r1 r2 r3 J2
= (13.102)
s D−1

Igualamos los lados izquierdos de las ecuaciones (13.98) y (13.102) para


obtener:
1 1 1 1
+ + = , (13.103)
r1 r2 r3 s

o, equivalentemente:
· ¸
r3 s s −1
= 1− − (13.104)
s r1 r2

Los planetas. En el sistema solar los planetas están en la zona lejana.


La órbita de la Tierra, por ejemplo, tiene un radio promedio de 1.49 × 1013
cm. Comparando esto con s = 2.93 × 105 cm nos damos cuenta de que la
razón entre estas dos cantidades es del orden de 10−8 . Si tomamos r1 y r2
como el perihelio y el apelio de la órbita terrestre, vemos que s/r1 y s/r2 son
cantidades muy pequeñas, del orden de 10−8 . Es razonable despreciar s2 en
el denominador de (13.100) y despreciar −s(r1 + r2 ) + s2 en el denominador
de (13.101), para escribir esas ecuaciones de esta forma aproximada:

333
µ ¶
sr1 r2
D ' r1 r2 − s(r1 + r2 ) + [r1 r2 − s(r1 + r2 )]−1 (13.105)
r1 + r2
sr1 r2
J2 ' (13.106)
r1 + r2

Los factores [ ]−1 que aparecen en (13.104) y (13.105) se expanden con


la fórmula del binomio de Newton y se desprecian los términos en s2 , y
ası́ llegamos a estas dos ecuaciones:
s
D ' 1+ (13.107)
r1 + r2
r3 s s
' 1+ + (13.108)
s r1 r2

En el caso particular de la órbita terrestre los datos astronómicos son r1 =


1.47 × 1013 cm y r2 = 1.52 × 1013 cm. Entonces:
r3
' 1 + 3.95 × 10−8
s
D ' 1 + 0.98 × 10−8
J2
' 0.255 × 108
s2

Con estos resultados el potencial efectivo para la Tierra es:


³ µ ¶
s´ −8 8 s2
V (r) = 1 − 1 + 0.98 × 10 + 0.255 × 10 × 2
r r

No es fácil dibujar, en una sola página, el potencial V (r) en todo el rango


1 ≤ r/s ≤ ∞, debido a que ocurren números muy dispares. En r/s = 1 el
potencial vale cero y crece rápidamente para alcanzar el valor V = 3.8 × 106
en r/s = 3/2. Allı́ comienza a descender lentamente hasta llegar al mı́nimo:
V = 1 − 0.98 × 10−8 en r/s = 0.51 × 108 . Entonces comienza a crecer de
nuevo hasta V = 1+0.98×10−8 en r/s = ∞. Los puntos de retorno están en
r3 /s = 1+3.95×10−8 , en r1 /s = 0.50×108 y en en r2 /s = 0.52×108 . Es claro
que en la zona lejana se forma un pozo de potencial, en el que reside nuestro
planeta. Este pozo es muy pando y muy angosto. Su profundidad respecto
a la lı́nea recta de altura 1 es apenas 0.98 × 10−8 ; nos podemos formar una
idea del ancho dividiendo a r2 − r1 sobre r1 , ası́: (r2 − r1 )/r2 = 0.04: apenas
un 4 % .

334
13.13 Eliminación del parámetro afı́n λ
Las coordenadas (r, ϕ) de la partı́cula son funciones de λ. Queremos eliminar
el parámetro afı́n. Las ecuaciones (10.21) y (10.27) nos enseñaron que para
tal eliminación debemos intentar una derivación en cadena. Siguiendo esta
recomendación hacemos d/dλ = (dϕ/dλ)(d/dϕ) , y en vista de la ecuación
(13.46):
d J d
= 2 2
dλ r sen θ dϕ

Ahora, como todas las trayectorias que estamos estudiando pertenecen al


plano ecuatorial:
d J d
= 2
dλ r dϕ

Aplicar ambos lados de esta ecuación a la variable r:

dr J dr
= 2 ,
dλ r dϕ

y elevando al cuadrado:

µ ¶2 µ ¶2
dr J2 dr
= 4 (13.109)
dλ r dϕ

Igualamos los lados derechos de las ecuaciones (13.54) y (13.109), para obten-
er
µ ¶ ³ µ ¶
J 2 dr 2 s´ J2
=1− 1− D+ 2 , (13.110)
r4 dϕ r r

es decir:
s µ ¶
1 dr 1 ³ s´ J2
=± 1− 1− D+ 2 , (13.111)
r2 dϕ J r r

o también:

335
1
dr
dϕ = ± s r2 (13.112)
³ µ ¶
1 s´ J2
1− 1− D+ 2
J r r

Hemos logrado nuestro propósito, ya que esta ecuación no muestra ninguna


dependencia explı́cita con el parámetro afı́n λ, ni con ningún tiempo t, τ ni
T.

13.14 La variable u
1
Hacemos un cambio de variable usual en mecánica celeste: u ≡ , y lla-
r
mamos u0 = du/dϕ. La ecuación (13.110) es entonces

J 2 u02 = 1 − D + sDu − J 2 u2 + sJ 2 u3 (13.113)

Tomamos otra derivada respecto a ϕ:

µ ¶
00 0 sD 3s 2
(u + u)u = + u u0 (13.114)
2J 2 2

En los puntos de retorno ocurre que u0 = 0. En aquellos puntos donde u0 6= 0


podemos dividir ambos lados de (13.114) por u0 para obtener:

sD 3s 2
u00 + u = 2
+ u : Einstein (13.115)
2J 2

Comparación. En este momento es importante establecer una compara-


ción con los resultados [25] de la mecánica newtoniana:

s
u00 + u = : Newton (13.116)
2J 2

Las ecuaciones (13.115) y (13.116) son diferentes, lo que quiere decir que
las teorı́as newtoniana y einsteiniana predicen trayectorias diferentes para
las partı́culas en caı́da libre. Recuérdese en particular un resultado de la
geometrı́a analı́tica elemental según el cual u00 + u = const. positiva es la

336
ecuación general de las curvas cónicas, y u00 + u = 0 es la ecuación de la
lı́nea recta:

u00 + u = const. positiva : cónicas (13.117)

u00 + u = 0 : lı́nea recta (13.118)

Las ecuaciones (13.116) y (13.117) muestran que en la teorı́a newtoniana las


trayectorias son curvas cónicas; las ecuaciones (13.115) y (13.117) muestran
que en la teorı́a einsteiniana las trayectorias no son curvas cónicas. Para
mejor comparar las ecuaciones einsteiniana y newtoniana podemos reescribir
la ecuación (13.115) de la manera siguiente:

s s(D − 1) 3s 2
u00 + u = 2
+ + u : Einstein (13.119)
2J 2J 2 2

Observando las ecuaciones (13.116) y (13.119) nos damos cuenta de que la


diferencia entre las trayectorias newtoniana y einsteiniana procede de los dos
últimos términos del lado derecho de (13.119). En algunos casos estos dos
términos son de tamaño considerable y no pueden despreciarse. ¿Podemos
despreciar estos dos términos en el movimiento de los planetas alrededor del
Sol? En el caso de la Tierra, al usar los valores numéricos de la página 334
descubrimos que estos dos últimos términos son 108 veces más pequeños que
el primer término del lado derecho de (13.119). En el caso de Mercurio, por
estar más cercano al sol, estos dos términos, aunque pequeños, son de un
tamaño suficiente para producir diferencias observables, tal como veremos
más tarde cuando estudiemos la precesión del perihelio de Mercurio.

Antes de cerrar esta sección veamos la ecuación de la trayectoria de un


pulso de luz, haciendo D = 0 en la ecuación (13.115):

3s 2
u00 + u = u (13.120)
2

Comparando esta ecuación con (13.118) vemos que, de acuerdo con la teorı́a
einsteiniana, la trayectoria de un pulso de luz no es una lı́nea recta, asunto
de primera importancia que trataremos enseguida.

337
13.15 Deflexión de un rayo de luz
Vamos a estudiar la trayectoria de un rayo de luz que incide desde la derecha,
como muestra la Figura 13.5. La coordenada r, que inicialmente es infinita,
disminuye gradualmente hasta que alcanza un mı́nimo valor r0 . Después
de este punto la coordenada r crece monótonamente. Claramente r0 es un
punto de retorno, y por consiguiente vϕ = v = c, y la ecuación (13.55) da
(J/r0 )2 = (1 − s/r0 )−1 . En términos de u0 = 1/r0 esta ecuación se escribe:

(Ju0 )−2 = 1 − su0 (13.121)

Por tratarse de la luz, D = 0 y la ecuación (13.113) da u02 = J −2 − u2 + su3 .


Dividir ambos lados de esta ecuación por u20 y definir x ≡ u/u0 para escribir:

x02 = (Ju0 )−2 − x2 + su0 x3

Utilizar la ecuación (13.121):

x02 = 1 − su0 − x2 + su0 x3

= 1 − x2 − su0 (1 − x3 )
· µ ¶¸
2 1
= (1 − x ) 1 − su0 x +
1+x

Como x0 = dx/dϕ, la última ecuación se puede escribir de esta otra manera


equivalente:

dx
dϕ = ± s · µ ¶¸
2
1
(1 − x ) 1 − su0 x +
1+x

· µ ¶¸−1/2
dx 1
= ±√ 1 − su0 x +
1 − x2 1+x

Ahora usamos la fórmula del binomio de Newton para expandir el factor


[ ]−1/2 conservando solamente los dos primeros términos en la serie:

338
· µ ¶¸
dx 1 1
dϕ ' ± √ 1 + su0 x +
1 − x2 2 1+x

Integrar:

Z ϕ(r0 ) Z 1 · µ ¶¸
dx 1 1
dϕ = ± √ 1 + su0 x +
0 0 1 − x2 2 1+x

à à √ !!¯1
1 p 1 − x2 ¯
¯
ϕ(r0 ) = ± arc sen x − su0 1− x2 + ¯
2 1+x ¯
0
³π ´
= ± + su0
2

El doble de este ángulo es la dirección en la que el rayo emerge:

2ϕ(r0 ) = π + 2su0

Si no hubiera la masa M , entonces s serı́a cero y se tendrı́a 2ϕ(r0 ) = π .


Esto quiere decir que 2su0 es la deflexión ocasionada por M . La llamamos
α:
2s 4GM
α = 2su0 = = 2 (13.122)
r0 c r0

Usando en (13.122) los valores numéricos G/c2 = 7.425 × 10−29 cm/g, M =


M¯ = 1.99 × 1033 g, y b = R¯ = 6.96 × 1010 cm se obtiene α = 1.74
segundos. Esta cifra, predicha por Einstein [19] en 1915, ha sido confirmada
en múltiples ocasiones.

13.16 La precesión anómala del perihelio de Mer-


curio
Se sabe que la órbita mercurial no es estática, sino que su perihelio rota
alrededor del Sol. Más precisamente, podemos hablar del ángulo que barre
el planeta mientras va del perihelio al apelio. Si se tratara de una elipse
perfecta, tal ángulo serı́a π. Pero las observaciones astronómicas muestran

339
que el ángulo no es exactamente π, lo que significa que la órbita no es exac-
tamente elı́ptica, sino que el perihelio precesa. La velocidad angular de esta
precesión es 5600.73 segundos de arco cada siglo.

La gravitación newtoniana admite dos causas para la precesión. La primera


(que da cuenta de 5025 seg/siglo) se debe a que las observaciones se ha-
cen desde un sistema móvil, rotante, que es la Tierra. La segunda (que da
cuenta de 532 seg/siglo) se debe a las perturbaciones ejercidas por los otros
planetas, especialmente Venus, Tierra y Júpiter. Vemos ası́ que la teorı́a
newtoniana da cuenta de 5025 + 532 = 5557 seg/siglo.

Pero la precesión observada no es 5557 seg/siglo sino 5600.73 seg/siglo.


La diferencia, que es 5600.73 − 5557 = 43.11 parecı́a inexplicable. Y por
eso se llamó “la precesión anómala”del perihelio de Mercurio. La precesión
anómala fue un misterio durante 69 años. Los astrónomos buscaron, sin éxi-
to, una explicación de esta “anomalı́a”hasta que, por fin, Einstein la pudo
explicar [19] en el contexto de su teorı́a gravitacional.

La ecuación (13.113) es

1 − D sD
u02 = + 2 u − u2 + su3
J2 J

Escribámosla de manera factorizada:

u02 = s(u − u1 )(u − u2 )(u − u3 ) (13.123)

Las constantes u1 , u2 y u3 son las soluciones de la ecuación

s(u − u1 )(u − u2 )(u − u3 ) = 0

es decir, u1 , u2 y u3 son los puntos de retorno. Pensemos que u1 y u2 son el


perihelio y el apelio de Mercurio, y que u3 es el tercer punto de retorno, muy
cercano al centro de coordenadas. En este momento escribimos de nuevo la
ecuación (13.103) en términos de las cantidades u1 , u2 y u3 :

u1 + u2 + u3 = 1/s

340
de donde u3 = 1/s − u1 − u2 . Al poner esta expresión en (13.123) se llega a:

µ ¶
02 1
u = s(u − u1 )(u − u2 ) u − + u1 + u2
s
£ ¤
= −(u − u1 )(u − u2 ) 1 − su − s(u1 + u2 )
· ¸
s(u1 + u2 )
= −(u − u1 )(u − u2 )(1 − su) 1 −
1 − su

Como u0 = du/dϕ, esta ecuación es:

· µ ¶¸
s(u1 + u2 ) −1/2
dϕ = ±du −(u − u1 )(u − u2 )(1 − su) 1 −
1 − su

Expresar el lado derecho como el producto de tres factores:

µ ¶
−1/2 −1/2 s(u1 + u2 ) −1/2
dϕ = ±du [−(u − u1 )(u − u2 )] (1 − su) 1−
1 − su

Los dos últimos factores se expanden como potencias de su, que es una
cantidad pequeña, ası́ :

1 1
(1 − su)−1/2 = 1 + su + ... ' 1 + su
2 2

µ ¶
s(u1 + u2 ) −1/2 ¡ ¢−1/2
1− = 1 − s(u1 + u2 )(1 − su)−1
1 − su
' (1 − s(u1 + u2 ))−1/2
1
' 1 + s(u1 + u2 )
2

Entonces regresamos a la ecuación de dϕ para escribir:

µ ¶µ ¶
−1/2 1 1
dϕ = ±du [−(u − u1 )(u − u2 )] 1 + su 1 + s(u1 + u2 )
2 2

341
µ ¶
1 1 + 21 su
= ± 1 + s(u1 + u2 ) p du
2 −(u − u1 )(u − u2 )

Ya estamos en condición de integrar. Se verifica fácilmente que

Z
1 + 21 su 1 p
p du = − s −(u − u1 )(u − u2 ) −
−(u − u1 )(u − u2 ) 2
µ ¶
1 u1 + u2 − 2u
1 + s(u1 + u2 ) arc sen
4 u1 − u2

O sea que

Z ϕ(u2 ) µ ¶
1
dϕ = ± 1 + s(u1 + u2 ) ×
ϕ(u1 ) 2
· µ ¶ ¸¯
1 p 1 u1 + u2 − 2u ¯¯u2
− s −(u − u1 )(u − u2 ) − 1 + s(u1 + u2 ) arc sen ¯
2 4 u1 − u2 u1

µ ¶· µ ¶¸
1 1
ϕ(u2 ) − ϕ(u1 ) = ± 1 + s(u1 + u2 ) −π 1 + s(u1 + u2 )
2 4
µ ¶
3 1 2 2
= ∓π 1 + s(u1 + u2 ) + s (u1 + u2 )
4 8
µ ¶
3
' ∓π 1 + s(u1 + u2 )
4

Escoger el signo positivo:


2 (ϕ(u2 ) − ϕ(u1 )) = 2π + s(u1 + u2 )
2

El último término del lado derecho es la precesión anómala: el ángulo que


se corre el perihelio en cada vuelta:


∆ ≡ s(u1 + u2 )
2
3πGM
= (u1 + u2 )
c2

342
Ahora, podemos expresar a u1 y u2 en términos de la excentricidad ² y el
semieje mayor b:

1
= r1 = (1 − ²)b
u1
1
= r2 = (1 + ²)b , o sea que
u2

6πGM
∆= (13.124)
c2 b(1
− ²2 )

Pongamos en la ecuación (13.124) los datos de Mercurio:

6π(6.67 × 10−8 )(1.99 × 1033 )


∆ =
(3 × 1010 )2 (5.79 × 1012 )(1 − 0.2062 )

= 5.01 × 10−7 rad. cada vuelta

Como el perı́odo es 0.241 años = 0.00241 siglos, tenemos:

5.01 × 10−7
∆ = rad. cada siglo
0.00241
= 44.9 segundos cada siglo

¦¦¦¦¦¦¦¦¦¦¦

La solución de Schwarzschild coincide, a grandes distancias, con la grav-


itación newtoniana. Esto no puede sorprendernos, ya que al construir la
solución relativista nos hemos apoyado firmemente en el potencial gravita-
cional clásico Φ = −GM/c2 r , como puede verse en los pasos que siguen a la
ecuación (13.8). A medianas distancias comienzan a notarse las diferencias
entre las dos teorı́as gravitacionales, con efectos como la precesión del peri-
helio de Mercurio. A cortas distancias las diferencias son radicales: cuando

343
la coordenada r es igual a s aparece un horizonte, es decir, una superficie
que sólo se puede cruzar hacia adentro. Para r < s la relatividad predice
unos efectos sorprendentes: la coordenada t se vuelve espacialoide, la co-
ordenada r se vuelve temporaloide y el centro r = 0 adquiere la cualidad
de atractor inevitable. En lo que resta del capı́tulo vamos a estudiar estos
efectos curiosos.

13.17 Coordenadas temporaloides


y espacialoides
Consideremos de nuevo la trayectoria de un punto que se mueve radialmente.
Haciendo dθ = dϕ = 0 en la ecuación (13.12) escribimos:

(1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 = ds2 (13.125)

Para un pulso de luz se tiene ds2 = 0 y para partı́cula masiva hacemos


ds2 > 0 :

(1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 = 0 , m=0 (13.126)

(1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 > 0 , m 6= 0 (13.127)

En la zona exterior, r > s y la cantidad (1 − s/r) es positiva. Podemos


dividir ambos lados de la desigualdad (13.127) por (1 − s/r) sin afectar el
signo >, para llegar a:

c2 dt2 > (1 − s/r)−2 dr2 (13.128)

Esta desigualdad se cumple únicamente si dt 6= 0 . Esto quiere decir que


el progreso del movimiento, el desarrollo del fenómeno, va necesariamente
acompañado de un cambio en la coordenada t, y por esta razón t se lla-
ma coordenada temporaloide. La desigualdad (13.128) no impone ninguna
condición sobre dr, el cual puede ser positivo, negativo o cero, y por eso a r
le decimos coordenada espacialoide. En la región r > s, la ecuación (13.12)
muestra que al diferencial temporaloide dt lo acompaña el factor positivo
(1 − s/r), mientras que al diferencial espacialoide dr lo acompaña el factor

344
negativo − (1 − s/r)−1 .

Ahora veamos lo que ocurre en la zona interior, r < s : la cantidad (1 − s/r)


es negativa. Si multiplicamos ambos lados de la desigualdad (13.127) por
(1 − s/r) debemos cambiar el signo > por el signo < , ası́:

dr2 > (1 − s/r)2 c2 dt2 (13.129)

Esta desigualdad se cumple únicamente si dr 6= 0 . Esto quiere decir que


el progreso del movimiento, el desarrollo del fenómeno, va necesariamente
acompañado de un cambio en la coordenada r, y por esta razón r se lla-
ma coordenada temporaloide. La desigualdad (13.129) no impone ninguna
condición sobre dt, el cual puede ser positivo, negativo o cero, y por eso a t
le decimos coordenada espacialoide. En la región r < s, la ecuación (13.12)
muestra que al diferencial temporaloide dr lo acompaña el factor positivo
− (1 − s/r)−1 , mientras que al diferencial espacialoide dt lo acompaña el
factor negativo (1 − s/r) .

Reconocemos ası́ que al pasar del exterior al interior las coordenadas t y r in-
tercambian sus papeles: la coordenada temporaloide se vuelve espacialoide,
y la espacialoide se vuelve temporaloide. Esto trae consigo una rotación del
cono de luz, como veremos enseguida.

13.18 El cono de la luz


El cono de luz en un evento dado se construye trazando las curvas lumi-
noides, es decir, aquellas que cumplen la condición ds = 0. Acto seguido se
procede a averiguar en qué dirección está orientado este cono de luz. Con el
propósito de simplificar el análisis, concentrémonos en las coordenadas (r, θ),
de modo que podamos hacer dibujos bidimensionales. Trazamos, cruzándose
en el evento central escogido, los ejes de t y de r, el primero vertical y el
segundo horizontal. En seguida se dibuja la LÍNEA en el mundo de los even-
tos que tienen la misma coordenada espacialoide del evento central. La clave
está en identificar que el cono de luz acoge, rodea a esa LÍNEA, y eso de-
termina la orientación del cono: si la LÍNEA es vertical, entonces el cono de
luz es también vertical, está erguido; y si la LÍNEA es horizontal, entonces
el cono de luz es también horizontal, está acostado. Veamos:

345
Para la región exterior r > s la Figura 13.6 muestra el cono de luz centrado
en el evento A . La lı́nea AB es la trayectoria de un punto que mantiene
constante la coordenada espacialoide r . Como esta lı́nea es vertical, el cono
debe ser vertical, es decir, el pasado está abajo y el futuro arriba. Ningún
objeto puede viajar del futuro al pasado.

Pero en la región interior r < s el análisis trae sorpresas. La Figura 13.7


muestra el cono de luz centrado en el evento C . La lı́nea CD es la trayecto-
ria de un punto que mantiene constante la coordenada espacialoide t . Como
esta lı́nea es horizontal, el cono debe ser horizontal. Pero debemos además
aclarar si el pasado está a la izquierda y el futuro a la derecha, como en la
Figura 13.8, o si, por el contrario, el pasado está a la derecha y el futuro a la
izquierda, como en la Figura 13.9. Demostremos que la Figura 13.9 es la cor-
recta. Una partı́cula masiva que se suelta desde cierta altura sigue la curva
punteada ct de la Figura 13.4, y esa curva indica que el fenómeno progresa
de derecha a izquierda; es decir, la relación pasado-futuro es, en la Figura
13.7, la dirección derecha-izquierda: la Figura 13.9 es la correcta. Todos los
objetos viajan del pasado al futuro, y ninguno viaja del futuro al pasado: en
la región interior r < s todos los objetos se mueven hacia el centro r = 0 ,
y ninguno viaja hacia afuera. El punto r = 0 es el futuro ineludible para
todos los objetos que se encuentren en la región interior r < s .

Los objetos pueden moverse hacia atrás o hacia adelante en la coordena-


da espacialoide, pero sólo pueden moverse hacia adelante en la coordenada
temporaloide. En la región exterior r > s los objetos pueden moverse hacia
atrás o hacia adelante en la coordenada espacialoide r, pero sólo pueden
moverse hacia adelante (hacia t = ∞) en la coordenada temporaloide t .
En la región interior r < s los objetos pueden moverse hacia atrás o hacia
adelante en la coordenada espacialoide t, pero sólo pueden moverse hacia
adelante (hacia r = 0) en la coordenada temporaloide r .

Estas consideraciones ponen de manifiesto uno de los asuntos más intrig-


antes de la fı́sica teórica del siglo XX, que es la existencia de huecos negros.
Un agujero negro, en general, es una región del espacio a la que se puede
entrar, pero no salir: ningún objeto puede cruzar hacia afuera la superficie
que bordea a la región mencionada. Esa superficie recibe el nombre de hor-
izonte. El hueco negro es un corte en el espaciotiempo, es un aislamiento,
una exclusión porque, para los objetos que están dentro, la región exterior
es inaccesible. En el caso particular del espaciotiempo de Schwarzschild, el
hueco negro es el sector r < 0 y el horizonte es la superficie esférica r = s.

346
13.19 Singularidades
Uno de los resultados más curiosos en el problema del cuerpo que se suelta
desde cierta altura es que el tiempo coordenado t se vuelve infinito en el hor-
izonte r = s, como muestra la curva de trazo punteado en la Figura 13.4. Si
este fuera un efecto fı́sico verdadero, la partı́cula nunca llegarı́a al horizonte,
contradiciendo nuestras expectativas. Nos preguntamos si este es un efecto
fı́sico real, o es acaso un defecto de las coordenadas (ct, r). Para responder
la pregunta recordemos que el tiempo propio τ no exhibe ninguna discon-
tinuidad en r = s, como se ve en la curva de trazo continuo de la Figura
13.4. Hay dos tiempos, t y τ , que tienen comportamientos muy diferentes en
el horizonte. ¿Cuál de los dos tiempos es más confiable? La respuesta de esta
pregunta es enfática: τ es más confiable porque es un escalar, es decir, una
cantidad invariante. En conclusión, el hecho matemático de que t sea infinito
en el horizonte no expresa un hecho fı́sico real, sino que es el resultado de
usar unas coordenadas (ct, r) que se comportan mal en r = s; si, en vez de
t usamos un tiempo sano τ , este tiempo propio resulta perfectamente finito
en el horizonte.

Hay otro asunto que pone en evidencia el comportamiento patológico de


las coordenadas (ct, r) en el horizonte, y es que en r = s algunas compo-
nentes del tensor de Riemann Rαβµν valen infinito, tal como puede verse en
la sección 13.2. Si éste fuera un efecto fı́sico verdadero, las fuerzas de marea
serı́an infinitas en r = s, y un cuerpo extenso que atravesara el horizonte
sufrirı́a desgarrones infinitos. Nos preguntamos si éste es un efecto fı́sico re-
al, o es acaso un defecto de las coordenadas (ct, r). El caso mencionado en
el párrafo anterior nos mueve a desconfiar de las coordenadas (ct, r), y en
consecuencia nos preguntamos si existe acaso otro sistema coordenado en
el que el tensor de Riemann sea finito en el horizonte. El hecho es que este
otro sistema coordenado existe, y lo llamamos x̄ en la sección 9.21. El lec-
tor está invitado a reconocer, en la página 249, que todas las componentes
R̄αβµν del tensor de Riemann son finitas y de buena conducta en r = s; esto
quiere decir que en la superficie de Schwarzschild las fuerzas de marea y la
desviación geodésica son finitas. En conclusión, el hecho matemático de que
Rαβµν sea infinito en el horizonte no expresa un hecho fı́sico, sino que es el
resultado de usar unas coordenadas (ct, r) que se comportan mal en r = s;
si, en vez de (ct, r) usamos unas coordenadas sanas x̄, el tensor de Riemann
R̄αβµν queda perfectamente finito en el horizonte.

Las coordenadas (ct, r, θ, ϕ) se comportan mal en la superficie r = s. En

347
términos técnicos, esas coordenadas son singulares en r = s. Hagamos
una pausa para discutir el asunto de las singularidades en una geometrı́a
cualquiera, no necesariamente la de Schwarzschild. Para estudiar las propiedades
geométricas de un espacio cualquiera se debe escoger un sistema coordenado,
y éste debe describir adecuadamente la geometrı́a. Si acaso en algún punto
P de ese espacio las coordenadas no describen [16] fielmente la geometrı́a,
decimos que el sistema coordenado es singular en el punto P . Por ejemplo,
las coordenadas esféricas (θ, ϕ) presentan una singularidad en θ = 0 , porque
allı́ la coordenada ϕ es indefinida, ya que puede tomar cualquier valor entre
0 y 2π ; ası́ mismo, estas coordenadas son singulares en θ = π. La singu-
laridad de las coordenadas (θ, ϕ) en θ = 0, π se manifiesta claramente en
los mapamundis que usan proyecciones cilı́ndricas, que son aquellas en que
los paralelos aparecen como lı́neas rectas horizontales y los meridianos como
rectas verticales. La Figura 13.10 muestra uno de esos mapas. Allı́, la lı́nea
AB representa al polo norte y CD al polo sur. El error del mapa es grave:
el polo norte, que es un punto y tiene extensión cero, está representado en
el mapa por medio de la lı́nea AB , cuya longitud no es cero. Uno se pre-
gunta si este error es un defecto del mapa o es un problema intrı́nseco de la
geometrı́a, y la respuesta es inmediata: desde un punto de vista geométrico,
los polos norte y sur no tienen ninguna peculiaridad, no hay nada en la
geometrı́a intrı́nseca que haga especiales a los polos; entonces el problema
debe ser del mapamundi y la proyección cilı́ndrica falla: las coordenadas
(θ, ϕ) son singulares en los polos.

De regreso a la geometrı́a de Schwarzschild, la sección 13.2 muestra que


el tensor de Riemann diverge5 en r = 0 y en r = s . Ya hemos visto que la
singularidad en r = s es espuria, y por eso recibe el nombre de pseudosingu-
laridad. Pero los infinitos que ocurren en r = 0 tienen6 una explicación fı́sica,
y es que allı́ la densidad de masa es infinita; no nos sorprende que cuando r
tiende a cero el tensor de Riemann y las fuerzas de marea tiendan a valores
infinitos.

5
Ya hemos mencionado en la página 306 que la solución de Schwarzschild no debe ser
válida en el origen de coordenadas r=0, o sea que los Rαβµν de la sección 13.2 no se deben
evaluar en r=0. Para ser más cuidadosos deberı́amos decir que el tensor de Riemann tiende
a infinito en el origen.
6
En general, discernir si una singularidad es fı́sica o si, por el contrario, es un defecto
del sistema coordenado, es un asunto peliagudo, como también lo es, en el segundo caso,
construir otro sistema coordenado libre de singularidades [26, 27].

348
13.20 Las coordenadas de Kruskal-Szekeres
Hemos visto que en la superficie de Schwarzschild r = s las coordenadas
(ct, r, θ, ϕ) presentan varias anomalı́as indeseables: de un lado, gµν y Rαβµν
toman valores infinitos y, de otro lado, tal como muestra la Figura 13.4, la
curva de t versus r es discontinua y tiene una ası́ntota. Ya hemos mencionado
que estas dificultades no reflejan problemas intrı́nsecos de la geometrı́a, sino
que son defectos exclusivamente achacables a las coordenadas (ct, r, θ, ϕ) .
Serı́a bueno encontrar un sistema de coordenadas sano, en el que las lı́neas
en el mundo sean continuas y sin ası́ntotas, un sistema coordenado en el que
gµν y Rαβµν sean funciones regulares. Se han encontrado varias soluciones a
este problema; en efecto, se conocen varios sistemas coordenados que no pre-
sentan las anomalı́as mencionadas, entre los cuales podemos mencionar el de
Eddington-Finkelstein, el de Painlevé-Gullstrand y el de Kruskal-Szekeres.
En esta sección vamos a presentar este último sistema de coordenadas.

Se trata de ejecutar el cambio de coordenadas (ct, r, θ, ϕ) → (v, u, θ, ϕ) ,


donde las nuevas coordenadas (v, u) están definidas de la manera siguiente.
En la región r < s :

p ct
v = er/2s 1 − r/s cosh (13.130)
2s
p ct
u = er/2s 1 − r/s senh , (13.131)
2s

y en la región r > s :

p ct
v = er/2s r/s − 1 senh (13.132)
2s
p ct
u = er/2s r/s − 1 cosh (13.133)
2s

Las transformadas inversas son

ct = 2s arctanh u/v , para r < s (13.134)

ct = 2s arctanh v/u , para r > s (13.135)

(r/s − 1) er/s = u2 − v 2 , para todo r (13.136)

349
La última ecuación debe entenderse como una definición implı́cita de r en
términos de las variables v y u . Tomando diferenciales en las ecuaciones
(13.130), (13.131), (13.132) y (13.133) llegamos a estas expresiones que son
válidas para todos los valores de r :

c 1
dv = u dt + (1 − s/r)−1 v dr
2s 2s
c 1
du = v dt + (1 − s/r)−1 u dr
2s 2s

Elevamos al cuadrado cada una de estas dos ecuaciones y luego restamos


lado a lado, obteniéndose:

1 u2 − v 2 £ 2 ¤
(dv)2 − (du)2 = 2
c (1 − s/r) dt2 − (1 − s/r)−1 dr2
4s 1 − s/r

En el lado derecho podemos usar la ecuación (13.12):

1 u2 − v 2 £ 2 ¤
dv 2 − du2 = 2
ds + r2 (dθ2 + sen2 θ dϕ2 ) ,
4s 1 − s/r

de donde:

1 − s/r
ds2 = 4s2 (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 )
u2 − v 2

Finalmente usamos la ecuación (13.136):

1 − s/r
ds2 = 4s2 (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 )
(r/s − 1) e r/s

4s3 −r/s
ds2 = e (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 ) (13.137)
r

Olvidando las coordenadas angulares (θ, ϕ), la Figura 13.11 muestra el es-
paciotiempo (v, u). En este dibujo se debe entender que r significa r/s y t

350
significa t/s . La gráfica es la superposición de un conjunto de lı́neas rectas
radiales (que son regiones de t constante) y otro conjunto de hipérbolas (que
son regiones de r constante). Las rectas t = ∞ y t = −∞ parten el espaci-
otiempo en cuatro cuadrantes: el de la derecha, el de arriba, el de la izquierda
y el de abajo. Por razones que expondremos prontamente, el cuadrante de
arriba es un agujero negro.

El cono de la luz. Consideremos la trayectoria de un punto que se mueve


radialmente. Haciendo dθ = dϕ = 0 en la ecuación (13.137) escribimos

4s3 −r/s
e (dv 2 − du2 ) = ds2 (13.138)
r

Para un pulso de luz se tiene ds2 = 0 y para partı́cula masiva hacemos


ds2 > 0 :

4s3 −r/s
e (dv 2 − du2 ) = 0 , para la luz (13.139)
r
4s3 −r/s
e (dv 2 − du2 ) > 0 , partı́cula masiva (13.140)
r

La desigualdad (13.140) quiere decir dv 2 > du2 . Esta desigualdad se cumple


únicamente si dv 6= 0 . Vemos ası́ que el progreso del movimiento, el de-
sarrollo del fenómeno, va necesariamente acompañado de un cambio en la
coordenada v, y por esta razón v es una coordenada temporaloide. La de-
sigualdad dv 2 > du2 no impone ninguna condición sobre du, el cual puede
ser positivo, negativo o cero, y por eso u es una coordenada espacialoide.
La coordenada v es temporaloide en todo el espaciotiempo y la coordenada
u es espacialoide en todo el espaciotiempo. Nótese, en la ecuación (13.137),
4s3 −r/s
que al diferencial temporaloide dv lo acompaña el factor positivo e ,
r
mientras que al diferencial espacialoide du lo acompaña el factor negativo
4s3 −r/s
− e .
r
Ahora nos preguntamos cómo se dibuja, en la Figura 13.11, la trayecto-
ria de un punto que mantiene constante la coordenada espacialoide u. La
respuesta es: se traza una lı́nea vertical. Entonces el cono de luz debe tam-
bién ser vertical, con el pasado abajo y el futuro arriba. Los objetos pueden

351
moverse hacia atrás o hacia adelante en la coordenada espacialoide u , pero
sólo pueden moverse hacia adelante en la coordenada temporaloide v (sólo
se pueden mover de abajo hacia arriba en la Figura 13.11).

Los pulsos de luz satisfacen la ecuación (13.139); esta ecuación dice que
du2 = dv 2 , o sea que
du
= ±1 (13.141)
dv

Esta ecuación tiene un significado interesante, pues dice que las trayectorias
de los pulsos de luz tienen una inclinación de ±45 grados en el espacio (v, u) .
Recordando que los conos de luz están bordeados por trayectorias de pulsos
de luz, llegamos a la siguiente conclusión: en el espacio (v, u) los conos de
luz tienen una apertura angular de 90 grados, ası́ como en la relatividad es-
pecial, según la Figura 2.6. Las trayectorias de las partı́culas (masivas o no
masivas) quedan contenidas dentro del cono de luz, es decir, hacen ángulos
de ≤ 45 grados a lado y lado de la dirección vertical en la Figura 13.11. Si
dibujamos lı́neas curvas que en todo punto hacen ángulos de ≤ 45 grados
a lado y lado de la dirección vertical en la Figura 13.11, nos damos cuenta
de que, en el cuadrante de arriba, TODAS estas trayectorias avanzan hacia
valores decrecientes de r , es decir, hacia la hipérbola r = 0 , lo que significa
que este cuadrante es verdaderamente un hueco negro.

En el cuadrante derecho, algunas trayectorias de partı́culas avanzan hacia


valores crecientes de r y otras avanzan hacia valores decrecientes de r , lo que
significa que este cuadrante es el exterior del hueco negro. La frontera entre
el cuadrante derecho y el de arriba, la recta (t = ∞, r = 1) , es la superficie
de Schwarzschild, esa “membrana” que sólo se puede cruzar en una dirección.

En el cuadrante de abajo TODAS las trayectorias de partı́culas avanzan


hacia valores crecientes de r y penetran en los cuadrantes derecho e izquier-
do. Por esta razón, al cuadrante de abajo, en un juego de palabras, se le
podrı́a llamar hueco blanco. Esto del hueco blanco es una ñapa que nos da
la Figura 13.11, pero no podemos precipitarnos a afirmar la existencia real
de estos objetos en el universo [13].

352
t=8 t=8
V(r)
1
Dt2 A B

Dt1

0.5
t=7 t=7 r
1.5 s 2.5 s

Figura 13.1 Las lı́neas curvas Figura 13.2 Potencial efectivo


representan una serie de proyec- para un pulso de luz con J =
tiles que se lanzan periódica- 2.7s . Las marcas A y B denotan
mente de un punto a otro. Co- puntos de retorno.
mo todos los lanzamientos son
idénticos, las lı́neas curvas son
también iguales.

V(r)
8
t

1 A B
6 t

4 t

2
0.5
r
3s 6s s r

Figura 13.3 Potencial efectivo Figura 13.4 Un cuerpo se suelta


para partı́cula masiva con D = desde cierta altura. En trazo con-
0.5 y J = 2.7s . Las marcas A y tinuo el tiempo propio τ , y en
B denotan puntos de retorno. trazo punteado el tiempo coorde-
nado t .

353
t
Futuro
B

s r
A

r Pasado
ro
j
x

Figura 13.5 Un pulso de luz in- Figura 13.6 Fuera del hueco ne-
cide de derecha a izquierda. Su gro, el cono de luz está erguido:
trayectoria se deflecta debido a el pasado abajo y el futuro arri-
la presencia de la masa M en el ba.
origen de coordenadas.

s r
Pasado Futuro
D C
C

Figura 13.7 Dentro del hueco Figura 13.8 Dentro del hue-
negro el cono de luz está acosta- co negro. ¿Está el futuro a la
do. derecha?

A B

Futuro Pasado
C

C D

Figura 13.9 Dentro del hue- Figura 13.10 Proyección


co negro. ¿Está el futuro a la cilı́ndrica: los meridianos son
izquierda? rectas verticales y los paralelos
son rectas horizontales. La recta
AB representa el polo norte, y
recta CD representa el polo sur.

354
v

t=0
t=

8
t = -0.

t =0.5
- 1

t=
t=
r=

2
8 r=

1.3
1

-1.

55

t=
0
32

r= 7
0.
r=
t= 0.9 2
1 -1. r= 1.3
32 t=

1.2
r=

9
r=

1 .0
r=
1.2

1.0

r=
t=- .55
9

0.55 t=0

t=0
0

r=
0.9

r=
-1 0.7

r=
0
8

t= r=
t=

- 1

1 8
r=

-1 0 1 u

Figura 13.11 Coordenadas de Kruskal-Szekeres. Las regiones de t constante son


lı́neas rectas radiales. Las regiones de r constante son hipérbolas. El cuadrante
superior es un agujero negro.

355
356
Apéndice A

La constancia de la velocidad de la luz

Al mirar los tres postulados (1.10) que fundamentan a la relatividad espe-


cial, no se nos escapa que el principio de la constancia de la velocidad de la
luz (que aquı́ llamaremos cortamente PriVel) es de un carácter muy diferente
a los otros dos. En efecto, el principio de la homogeneidad del tiempo y del
espacio (PriHomo) y el principio de la relatividad (PriRel) son extensiones
esperadas de ideas que habı́an estado presentes en el pensamiento cientı́fico
desde hacı́a mucho tiempo. De un lado, a comienzos del siglo XVII, justo
antes de Newton, ya se aceptaba [28] que el espacio es infinito, homogéneo e
isótropo. De otro lado, Newton escribe: “The motions of bodies included in
a given space are the same among themselves, whether that space is at rest,
or moves uniformly forwards in a right line without any circular motion” [29].

El PriVel es inesperado y extraño. Einstein lo introduce abruptamente, sin


motivación manifiesta, en la segunda página del artı́culo en el que presen-
ta su teorı́a de la relatividad especial [2]. La aparición súbita de PriVel lo
hace particularmente difı́cil de aceptar, o entender. Aunque la evolución del
pensamiento cientı́fico no es una secuencia suave y continua de pasos cortos,
sı́ desearı́amos creer que el surgimiento de las ideas cientı́ficas tiene alguna
motivación. El PriVel carece de esta motivación.

El propósito de este capı́tulo es un intento de suministrar la motivación


deseada; en efecto demostraremos que PriVel se puede deducir a partir de
PriHomo, PriRel y de las ecuaciones de Maxwell. En la sección A.1 aplicamos
el PriRel a las ecuaciones de Maxwell. Para esto se requiere un conjunto de
reglas (transformaciones) que relacionen las coordenadas espaciotemporales
de dos observadores inerciales; la sección A.2 establece el tratamiento gen-
eral de esas transformaciones. En la sección A.3 regresamos al análisis de
la sección A.1 y probamos que la luz tiene la misma velocidad en todos los

357
sistemas inerciales.

Con esto queda cumplido el propósito de este capı́tulo, pero no podemos


perder la oportunidad de dar, muy fácilmente, otros dos pasos interesantes:
en la sección A.4 deducimos las transformaciones de Lorentz, y en la sección
A.5 deducimos las reglas de transformación del campo electromagnético.

A.1 El principio de la relatividad


Einstein comienza su artı́culo estudiando dos fenómenos: En el Fenómeno 1
hay un material que conduce la electricidad (un trozo de metal por ejemplo)
en reposo y hay un imán en las cercanı́as que se desplaza con una veloci-
dad v respecto al metal. Es claro que en el metal se produce una corriente
eléctrica que llamaremos i1 . En el Fenómeno 2 hay un imán en reposo y, en
las cercanı́as, hay un trozo de metal que se desplaza con una velocidad −v
respecto al imán. Es claro que en el metal se produce una corriente eléctri-
ca que llamaremos i2 . Si en los dos fenómenos participan imanes iguales
y conductores iguales, y si los arreglos de los dos fenómenos son similares,
podemos afirmar, sin duda, que i1 = i2 . Esto, que i1 sea igual a i2 , es el
hecho observado importante, y nos mueve a pensar que los dos fenómenos
son equivalentes. Pero la teorı́a electromagnética de Maxwell, según se la
entendı́a a finales del siglo XIX y principios del XX, no podı́a aceptar la
equivalencia de los dos fenómenos. De hecho, los fı́sicos suponı́an que las
ecuaciones de Maxwell eran válidas únicamente para un observador en re-
poso respecto al éter y que, portanto, en el Fenómeno 1 es el metal el que
está en reposo respecto al éter (está en reposo absoluto), mientras que en el
Fenómeno 2 el imán es el que está en reposo absoluto.

Para los cientı́ficos de la época los dos fenómenos mencionados eran esencial-
mente diferentes. No habı́a simetrı́a entre las dos situaciones.1 Einstein se
siente incómodo con esta asimetrı́a, y quiere resolverla. Propone entonces que
el PriRel, además de ser válido en los fenómenos de la mecánica, debe tam-
bién ser válido en los fenómenos electromagnéticos: todos los observadores
inerciales deben ser igualmente legı́timos. El viejo observador en reposo re-
specto al éter, el que estaba en “reposo absoluto”, no es más importante
que los otros. El éter no es necesario, como tampoco lo son las nociones de
1
La asimetrı́a se hacı́a patente en que, para ellos, en el Fenómeno 1 hay un campo
eléctrico (de este campo eléctrico da cuenta la ecuación de Maxwell c∇ × E = −∂B/∂t),
mientras que en el Fenómeno 2 no hay ningún campo eléctrico.

358
reposo absoluto ni espacio absoluto.

Para entender que las leyes del electromagnetismo son válidas en todos los
observadores inerciales se necesitan tres cosas: Primero, averiguar cómo es la
verdadera transformación de coordenadas (t, x, y, z) → (t0 , x0 , y 0 , z 0 ). Segun-
do, averiguar cómo es la transformación de los campos (E, B) → (E0 , B0 ). Y
tercero, que los pasos Primero y Segundo se unan de modo que las ecuaciones
de Maxwell sean covariantes. Einstein decide resolver primero el problema
(t, x, y, z) → (t0 , x0 , y 0 , z 0 ) (introduciendo un nuevo principio, el de la ve-
locidad de la luz) y deja para después el problema (E, B) → (E0 , B0 ) y la
covariancia de las ecuaciones. Nosotros ahora, en este apéndice, tomaremos
otra ruta: Supondremos que las ecuaciones de Maxwell son covariantes; con
ésto y con PriHomo demostraremos la constancia de la velocidad de la luz,
hallaremos cómo debe ser la transformación (t, x, y, z) → (t0 , x0 , y 0 , z 0 ) y de-
duciremos la transformación (E, B) → (E0 , B0 ).

Para aplicar el PriRel cuantitativamente utilizamos los dos observadores


inerciales O y O0 . Para O, dos de las ecuaciones de Maxwell en el vacı́o son:

1 ∂E
= ∇×B (A.1)
c ∂t
1 ∂B
= −∇ × E (A.2)
c ∂t

Para el observador O0 las ecuaciones correspondientes son

1 ∂E0
= ∇0 × B0 (A.3)
c0 ∂t0
1 ∂B0
= −∇0 × E0 (A.4)
c0 ∂t0

Probaremos que c0 = c, es decir, que la velocidad de la luz es la misma para


todos los observadores inerciales.

De la ecuación (A.1) tomamos la parte y , y de la ecuación (A.2) tomamos


la parte z :

1
∂t Ey = ∂z Bx − ∂x Bz (A.5)
c

359
1
∂t Bz = ∂y Ex − ∂x Ey , (A.6)
c


donde, tal como hemos hecho en otras ocasiones, ∂t quiere decir , etc.
∂t
Para O0 las ecuaciones correspondientes son:

1
∂t0 Ey0 = ∂z 0 Bx0 − ∂x0 Bz0 (A.7)
c0
1
∂t0 Bz0 = ∂y0 Ex0 − ∂x0 Ey0 (A.8)
c0

Supondremos que las ecuaciones de Maxwell expresan leyes fı́sicas, de man-


era que a ellas se aplica el PriRel. En particular, las ecuaciones (A.5) y (A.6)
deben ser equivalentes a las ecuaciones (A.7) y (A.8). Debe existir entonces
un conjunto de cuatro funciones que expresen las coordenadas primadas
(t0 , x0 , y 0 , z 0 ) en términos de las no primadas (t, x, y, z); a esto nos dedicamos
enseguida.

A.2 Transformaciones
Recordemos que las cuatro ecuaciones (1.28) se obtuvieron utilizando única-
mente los principios de la relatividad y de la homogeneidad del espacio y el
tiempo. Reescribamos este conjunto de ecuaciones

t0 = a00 t + a01 x (A.9)


0
x = a11 (x − vt) (A.10)
0
y = y (A.11)
z0 = z (A.12)

Los tres coeficientes desconocidos a00 , a01 y a11 son funciones de la velocidad
v, o sea que deberı́amos escribir, propiamente, a00 (v), a01 (v) y a11 (v). Antes
de seguir adelante, probaremos que los coeficientes a00 (v) y a11 (v) satisfacen
las siguientes condiciones:

a00 (v) > 0 (A.13)


a11 (v) > 0 (A.14)

360
a00 (−v) = a00 (v) (A.15)

Para probar estas fórmulas consideremos el plano x = 0 ; de acuerdo con las


ecuaciones (A.9) y (A.10), los eventos de este plano satisfacen las ecuaciones

t0 = a00 (v) t (A.16)


x0 = −a11 (v) vt (A.17)

Para estos eventos la condición t > 0 debe implicar que t0 > 0; entonces, en
vista de la ecuación (A.16), el coeficiente a00 (v) debe ser positivo; esto prue-
ba la ecuación (A.13). De la misma manera, para estos eventos la condición
t > 0 debe implicar que x0 < 0; entonces, en vista de la ecuación (A.17),
el coeficiente a11 (v) debe ser positivo; esto prueba la ecuación (A.14). Para
probar la ecuación (A.15) consideramos otro observador O00 que se mueve,
respecto a O, con velocidad v en la dirección −x ; en vista de la ecuación
(A.16) escribimos:

t00 = a00 (−v) t (A.18)

Ahora, t00 debe ser igual a t0 ; entonces la ecuación (A.18) es t0 = a00 (−v) t . Al
comparar esta ecuación con la ecuación (A.16) vemos que a00 (−v) = a00 (v).
Esta es la prueba de la ecuación (A.15).

A.3 La velocidad de la luz


En el capı́tulo 1 seguimos la exposición convencional: se presentan los tres
principios de la relatividad especial y a partir de ellos se deducen las trans-
formaciones de Lorentz. Luego, en la sección 4.1 y de nuevo en la sección
6.5 se dedujeron las transformaciones de los campos electromagnéticos E y
B. Tal como indicamos hace poco, en este Apéndice tomaremos otra ruta.
Asumiremos válidos el principio de la homogeneidad del espacio y el tiempo,
el principio de la relatividad y algunas de las ecuaciones de Maxwell; y a
partir de estos supuestos, deduciremos las transformaciones de Lorentz y
deduciremos las reglas de transformación de E y B .

Las cuatro ecuaciones (A.9)-(A.12) son una familia de transformaciones.


Dos miembros de esta familia son las transformaciones de Galileo y las de

361
Lorentz. La transformaciones galileanas se obtienen haciendo a00 = a11 = 1
y a01 = 0. Demostraremos que las transformaciones de Lorentz se obtienen
al aplicar el PriRel a las ecuaciones de Maxwell, es decir, explotando la
equivalencia que existe entre las ecuaciones (A.5), (A.6) y las ecuaciones
(A.7), (A.8).

Para tal efecto, las derivadas no primadas ∂t , ∂x , ∂y , ∂z se expresarán


en términos de las derivadas primadas ∂t0 , ∂x0 , ∂y0 , ∂z 0 , de modo que
las ecuaciones (A.5) y (A.6) se “conviertan” en otras ecuaciones que usan
derivadas primadas. Al comparar término a término las ecuaciones “conver-
tidas” con las ecuaciones (A.7) y (A.8), descubriremos la constancia de la
velocidad de la luz. Esto nos llevará a las transformaciones de Lorentz en
la sección A.4 y a las transformaciones del campo electromagnético en la
sección A.5.

Para escribir las derivadas no primadas en términos de las primadas us-


amos la regla de la derivación en cadena. Se ve fácilmente que, usando las
ecuaciones (A.9)-(A.12), la regla de la derivación en cadena da:

∂t = a00 ∂t0 − va11 ∂x0


∂x = a11 ∂x0 + a01 ∂t0 (A.19)
∂y = ∂y0 ∂z = ∂z 0

Colocamos estas derivadas en las ecuaciones (A.5) y (A.6) para obtener:

µ ¶ ³
1 c0 v ´
∂t0 a00 Ey + a01 c0 Bz
= ∂z 0 Bx − ∂x0 a11 Bz − Ey (A.20)
c0 c c
µ 0 ¶ ³
1 c 0 v ´
∂t 0 a B
00 z + a 01 c Ey = ∂ 0
y x E − ∂ 0 a
x 11 Ey − Bz (A.21)
c0 c c

Comparemos estas dos ecuaciones con las ecuaciones (A.7) y (A.8); los cam-
pos en la ecuación (A.7) deben ser proporcionales a los campos en la ecuación
(A.20):

µ ¶
c0
Ey0 = f a00 Ey + a01 c0 Bz (A.22)
c
Bx0 = f Bx (A.23)

362
v
Bz0 = f a11 (Bz − Ey ) (A.24)
c

Aquı́, f (v) es una función que depende solamente del parámetro v. De la


misma manera, introducimos una función g(v) para comparar la ecuación
(A.8) con la ecuación (A.21):

µ ¶
c0
Bz0 = g a00 Bz + a01 c0 Ey (A.25)
c
Ex0 = g Ex (A.26)
v
Ey0 = g a11 (Ey − Bz ) (A.27)
c

Las funciones f (v) y g(v) son desconocidas. Pasamos a probar que g(v) =
f (v). Para tal efecto notemos que los lados derechos de las ecuaciones (A.22)
y (A.27) deben ser iguales:

v c0
ga11 Ey − g a11 Bz = f a00 Ey + f a01 c0 Bz
c c

Los coeficientes de Ey deben ser iguales entre sı́, y los de Bz también deben
ser iguales entre sı́:

c0
g a11 = f a00 (A.28)
c
v
−g a11 = f a01 c0 (A.29)
c

Del mismo modo, al igualar los lados derechos de las ecuaciones (A.24) y
(A.25) obtenemos:

c0
f a11 = g a00 (A.30)
c
v
−f a11 = g a01 c0
c

Con una mirada a las ecuaciones (A.28) y (A.30) nos damos cuenta de que

363
g 2 = f 2 , es decir, g = ±f . Para descubrir cuál de los dos signos es adecuado,
se pone la condición g = ±f en la ecuación (A.28), obteniéndose

c0
a11 = ± a00
c

Sin embargo, de acuerdo con las ecuaciones (A.13) y (A.14), los coeficientes
a00 y a11 son positivos, o sea que debemos escoger el signo superior: g = +f .
Poniendo la condición g = f en las ecuaciones (A.28) y (A.29) se obtiene

c0
a11 = a00 (A.31)
c
v
− a11 = a01 c0
c

Estas dos ecuaciones implican que

v
a01 = − a00 (A.32)
c2

En vista de las ecuaciones (A.31) y (A.32) y la condición g = f , reescribi-


mos las seis ecuaciones de transformación (A.22)-(A.27) de esta manera
compacta:

Ex0 = f (v) Ex0 (A.33)

Bx0 = f (v) Bx0 (A.34)


c0 ³ v ´
Ey0 = f (v) a00 (v) Ey − Bz (A.35)
c c
c0 ³ v ´
Bz0 = f (v) a00 (v) Bz − Ey (A.36)
c c

Demostremos rápidamente que f (v) debe ser una función par de v. Para tal
efecto supongamos que Ey = 0, de modo que la ecuación (A.36) da

c0
Bz0 = f (v) a00 (v) Bz (A.37)
c

364
Ahora consideremos otro observador inercial O00 que se mueve, respecto a O,
con velocidad v en la dirección −x ; en vista de la ecuación (A.37) escribimos:

c0
Bz00 = f (−v) a00 (−v) Bz (A.38)
c

Claramente, Bz0 y Bz00 deben ser iguales, y podemos formar una nueva ecuación
con los lados derechos de las ecuaciones (A.37) y (A.38):

c0 c0
f (v) a00 (v) Bz = f (−v) a00 (−v) Bz ,
c c

o sea que, apoyándonos en la ecuación (A.15):

f (−v) = f (v) (A.39)

Para hallar el recı́proco del sistema de ecuaciones (A.35) y (A.36) inter-


cambiamos variables primadas y no primadas, y escribimos −v en vez de
v:

c ³ v 0´
Ey = f (−v) a00 (−v) Ey0 + B
c0 c0 z
c ³ v ´
Bz = f (−v) a00 (−v) 0 Bz0 + 0 Ey0 ,
c c

y usamos las ecuaciones (A.15) y (A.39):

c ³ v ´
Ey = f (v) a00 (v) Ey0 + 0 Bz0
c0 c
c ³ v 0´
0
Bz = f (v) a00 (v) 0 Bz + 0 Ey
c c

Finalmente, ponemos estas expresiones de Ey y Bz en el lado derecho de la


ecuación (A.35) para obtener:
·µ ¶ µ ¶ ¸
v2 1 1
Ey0 = f 2 a200 0
1 − 0 Ey + v 0 − Bz0 (A.40)
cc c c

365
Ya que Ey0 y Bz0 son variables independientes, los coeficientes de Ey0 en ambos
lados de la ecuación deben ser iguales, y los coeficientes de Bz0 también:

µ ¶
v2
1 = f 2 a200 1− 0 (A.41)
cc
1 1
0 = − (A.42)
c0 c

La ecuación (A.42) dice que

c0 = c (A.43)

En palabras, la velocidad de la luz es la misma en todos los sistemas de


referencia inerciales.

A.4 Las transformaciones de Lorentz


Si usamos la ecuación (A.43) en la ecuación (A.41) se obtiene

µ ¶
v2
f 2 a200 1 − 2 = 1 ,
c

1 1
y en vista de la ecuación (A.13) llegamos a a00 = p :
|f | 1 − v 2 /c2

γ
a00 = (A.44)
|f |

1
Aquı́ estamos usando el sı́mbolo convencional γ = p . Ha llegado
1 − v 2 /c2
el momento de agrupar las ecuaciones (A.31), (A.32), (A.43) y (A.44) para
reescribir las ecuaciones de transformación (A.9) y (A.10):

γ v
t0 = (t − 2 x) (A.45)
|f | c
γ
x0 = (x − vt) (A.46)
|f |

366
Ahora demostraremos que la función |f | que aparece en estas ecuaciones es 1.
Consideremos un pulso de luz que conecta los p eventos (0,0,0,0) y (t, x, y, z).
x2 + y 2 + z 2
La velocidad c es espacio sobre tiempo: c = ; de aquı́ se sigue
t
que

c2 t2 − (x2 + y 2 + z 2 ) = 0 (A.47)

Similarmente:

c02 t02 − (x02 + y 02 + z 02 ) = 0 (A.48)

Queremos escribir esta ecuación en términos de variables no primadas, y para


tal efecto ponemos las ecuaciones (A.11), (A.12), (A.43), (A.45) y (A.46) en
la ecuación (A.48), obteniéndose ası́:

1 2 2
(c t − x2 ) − y 2 − z 2 = 0
f2

Al comparar esta ecuación con la ecuación (A.47) descubrimos que f 2 = 1,


lo que significa que |f | = 1, y los denominadores de las ecuaciones (A.45) y
(A.46) se simplifican. Por último, utilicemos las ecuaciones (A.11), (A.12),
(A.45) y (A.46) para escribir la forma final de las transformaciones de
Lorentz

v
t0 = γ (t − x)
c2
x0 = γ (x − vt) (A.49)
y0 = y , z0 = z

A.5 Regreso al campo


Hemos probado que |f | = 1, es decir, que f = ±1. Debemos decidir cuál de
los dos signos es el correcto. Si insertamos la condición f = ±1 en la ecuación
(A.33) se obtiene Ex0 = ±Ex ; el signo inferior no sirve, porque implicarı́a una
inversion increı́ble Ex0 = −Ex . Por esta razón escogemos el signo superior y

367
escribimos f = 1. Ya estamos en condición de usar las ecuaciones (A.43) y
(A.44) en las transformaciones (A.33)-(A.36), para obtener:

Ex0 = Ex (A.50)
³ v ´
Ey0 = γ Ey − Bz (A.51)
c
0
Bx = Bx (A.52)
³ v ´
Bz0 = γ Bz − Ey (A.53)
c

Estas son cuatro de las seis ecuaciones de transformación que estábamos


buscando. Aún nos falta por averiguar las ecuaciones de Ez0 y By0 . Para tal
efecto anotemos rápidamente que, de acuerdo con los resultados obtenidos,
las derivadas (A.19) se han simplificado:

∂t = γ ∂t0 − vγ ∂x0
∂x = γ ∂x0 − (vγ/c2 ) ∂t0 (A.54)
∂y = ∂y0 ∂z = ∂z 0

Estas son, por supuesto, las mismas ecuaciones (1.44). La parte z de la


ecuación (A.1) es
1
∂t Ez = ∂x By − ∂y Bx , (A.55)
c

y la parte z de la ecuación (A.3) es

1
∂t0 Ez0 = ∂x0 By0 − ∂y0 Bx0 (A.56)
c

Utilizando las derivadas (A.54) en la ecuación (A.55) llegamos a:

γ ³ v ´ ³ v ´
∂t Ez + By = γ ∂x By + Ez − ∂y0 Bx
0 0
c c c

Al comparar esta ecuación con (A.56) introducimos una función h(v), de-
sconocida hasta el momento:

368
³ v ´
Ez0 = h(v) γ Ez + By
³ c
0 v ´
By = h(v) γ By + Ez
c
Bx0 = h(v)Bx

En este momento comparamos la última ecuación con (A.52), y esto nos


muestra que h(v) = 1. Escribamos finalmente las dos ecuaciones que nos
faltaban:
³ v ´
Ez0 = γ Ez + By (A.57)
c
³ v ´
By0 = γ By + Ez (A.58)
c

A.6 Conclusiones
En su artı́culo [2], Einstein propone el PriVel y el PriRel, asume el PriHo-
mo y con estas tres bases deduce las transformaciones de Lorentz. Final-
mente toma el PriRel, las ecuaciones de Maxwell y las transformaciones de
Lorentz recién obtenidas, para deducir las transformaciones del campo elec-
tromagnético. A esta estructura lógica la llamaremos la estructura standard
de la relatividad.

Pero el artı́culo de Einstein también se puede leer de atrás hacia adelante,


tal como hemos hecho en este apéndice: Se asumen el PriHomo y el PriRel;
se asume que las ecuaciones de Maxwell verdaderamente representan a las
leyes fı́sicas del electromagnetismo, y esto nos permite aplicar el PriRel a las
ecuaciones de Maxwell. A partir de aquı́ se deducen fácilmente la constancia
de la velocidad de la luz, las transformaciones de Lorentz y las transfor-
maciones del campo electromagnético. Esta será llamada la otra estructura
lógica de la relatividad.

Queremos resaltar que en la otra estructura la constancia de la velocidad


de la luz es un teorema, mientras que en la estructura standard el PriVel
es un postulado. Mientras en la standard el PriVel aparece súbitamente, sin
motivación explı́cita, en la otra estructura la constancia de la velocidad de
la luz aparece más suavemente, pues es un resultado de otras suposiciones

369
más familiares, más fáciles de aceptar.

La estructura standard se basa en el PriVel, y refiriéndose este principio


a la luz, la estructura standard está vinculada al electromagnetismo. Ahora,
años después, nosotros reconocemos que Einstein podrı́a haber basado su
relatividad, no en el PriVel, sino en esta generalización: “cualquier partı́cu-
la no masiva se mueve con una velocidad c que es la misma para todos
los observadores inerciales”. Vemos ası́ que la conexión entre la estructura
standard y el electromagnetismo no es muy fuerte. En cambio, en la otra
estructura las ecuaciones de Maxwell para el electromagnetismo juegan un
papel esencial. En la comparación entre estas dos estructuras lógicas de la
relatividad podemos avanzar algunos comentarios:

1. Si se llegara a encontrar algún defecto en la teorı́a de Maxwell, esto prob-


ablemente repercutirı́a muy fuertemente en la otra estructura, pero quizás
la estructura standard podrı́a salir ilesa. Vemos ası́ que la standard es una
estructura más robusta que la otra.

2. En la otra estructura la relatividad aparece, en cierto modo, como una


parte del electromagnetismo. En otras palabras, la relatividad le da realce
a la teorı́a de Maxwell.

3. Hemos usado la covariancia de las ecuaciones de Maxwell para construir


la otra estructura. Probablemente no sea equivocado pensar que, usando
otras teorı́as fı́sicas (QCD, por ejemplo), se podrı́an construir aún otras es-
tructuras para la relatividad.

4. La importancia del PriRel ya ha sido ampliamente reconocida durante


un siglo. Pero la existencia de otra estructura, o aún otras estructuras, nos
muestra un PriRel más fértil: cuando éste se une a una teorı́a fı́sica concreta,
dan a luz a la teorı́a de la relatividad.

5. Dar a luz a la relatividad es algo enorme, ya que ésta establece la métrica


del espaciotiempo. En efecto, la relatividad contiene las transformaciones
de Lorentz, y éstas dan pie a la métrica de Minkowski, que es la métrica
del espaciotiempo. El espaciotiempo no es una simple acumulación de even-
tos, sino que además tiene una métrica, una estructura. Vemos ası́ que la
métrica del espaciotiempo resulta, en parte, del contacto con las leyes fı́sicas,
como el electromagnetismo por ejemplo. En nuestra mente, podemos imag-
inar que el espaciotiempo es una simple yuxtaposición de puntos hasta que

370
las leyes de la naturaleza, las que rigen a los objetos fı́sicos, le imprimen a
esa yuxtaposición una estructura, una métrica, una organización.

371
372
Bibliografı́a

[1] H.A. Lorentz: Versuch einer Theorie der elektrischen und optischen
Erscheinungen in bewegten Körpern, Leiden,(1905). Traducido al inglés
como Michelson’s interference experiment, en Referencia [5]

[2] A. Einstein: Zur Elektrodynamik bewegter Körper, Annalen der


Physik, 17,(1905). Traducido al inglés como On the electrody-
namics of moving bodies, en Referencia [5]. Existe otra traduc-
ción al inglés: H.M. Schwarz, Am.J.Phys. 45, 18(1977). Internet:
http://dbserv.ihep.su/ elan/src/einstein05b/eng.pdf

[3] A. Einstein: Ist die Trägheit eines Körpers von seinem Energiegehalt
abhängig?, Annalen der Physik, 17,(1905). Traducido al inglés como
Does the inertia of a body depend upon its energy-content? en Referen-
cia [5]. Internet: http://dbserv.ihep.su/ elan/src/einstein05c/eng.pdf

[4] H.A. Lorentz: Electromagnetic phenomena in a system moving with


any velocity less than that of light, Proceedings of the Academy of Sci-
ences in Amsterdam, 6, 1904. Traducido al inglés en Referencia [5]

[5] The Principle of Relativity, Dover,New York (1952)

[6] R. Resnick: Introduction to Special Relativity, Wiley,New York (1968)

[7] J.D. Jackson: Classical Electrodynamics, Wiley,New York (1975)

[8] Referencia [7], sección 11.9

[9] Referencia [7], sección 14.1

[10] H. Minkowski: Raum und Zeit, Ponencia en la 80 Asamblea de


Cientı́ficos Naturales y Médicos Alemanes, en Colonia, el 21 de sep-
tiembre de 1908. Traducido al ingés bajo el tı́tulo Space and Time, en
Referencia [5]

373
[11] S. Weinberg: Gravitation and Cosmology: Principles and Applications
of the General Theory of Relativity, Wiley,New York (1972)

[12] G.B. Thomas: Calculus and Analytic Geometry, Addison-


Wesley,Reading (1965)

[13] H. Ohanian, R. Ruffini: Gravitation and Spacetime, Second Edition,


Norton,New York(1994)

[14] I.S. Gradshteyn, I.M. Ryzhik: Table of Integrals, Series and Prod-
ucts, Academic Press,New York(1983), fórmula 2.599.6

[15] D.C. Kay: Tensor Calculus, Schaum’s Outlines, Mc Graw Hill,New


York(1988)

[16] B.F. Schutz: A first course in general relativity, Cambridge U.


Press,Cambridge(1999)

[17] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungs-


berichte, 1915, p.2, pp. 778-786

[18] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungs-


berichte, 1915, p.2, pp. 799-801

[19] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungs-


berichte, 1915, p.2, pp. 831-839

[20] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungs-


berichte, 1915, pt.2, pp. 844-847

[21] J. Mehra: Einstein, Hilbert, and The Theory of Gravitation, Rei-


del,Dordrecht (1974)

[22] L.D. Landau, E.M. Lifshitz: Teorı́a clásica de campos, Re-


verté,Barcelona (1966)

[23] K. Schwarzschild: Ueber das Gravitationsfeld eines Massenpunk-


tes nach der Einsteinschen Theorie, Preuss.Ak.Wiss.Sitzungsber, 189-
196(1916)

[24] A.P. Lightman, W.H. Press, R.H. Price, S.A. Teukolsky:


Problem book in relativity and gravitation, Princeton U. Press,Princeton
(1975)

[25] H. Goldstein: Mecánica Clásica, Aguilar,Madrid(1963), ec. 3-34

374
[26] R. Wald: General Relativity, U. Chicago Press,Chicago (1984)

[27] R. Torretti: Relativity and Geometry, Dover, New York(1996)

[28] M. Jammer: Concepts of Space (Dover, New York, 1993), p. 110

[29] I. Newton: Mathematical Principles of Natural Philosophy (Ency-


clopaedia Britannica Inc., Chicago, 1952), Corolary V, p. 19

375
Índice Alfabético

Aµ , 148–157, 182, 193–197 observador en, 276, 278


Aberración de la luz, véase Luz Cálculo variacional, 177, 253–256
Absoluto Calor, 73
carga eléctrica, 43 Cambiar (,) → (;), véase Regla
E · B y E 2 − B 2 , 99–101, 159 Campo
equilibrio, 81 de alambre recto, 104
intervalo, 33, 199 de carga móvil, 102
izquierda-derecha, 56 eléctrico, 102, 106, 147–159
pasado-futuro, 56 electromagnético, 93–115, 147–159,
Acción, 180, 186 170–172, 182, 185–197
A, 180 en general, 185
Aceleración, 31, 49, 83, 140, 315 gravitatorio, véase Campo gravita-
Acelerador, 87, 315 torio
Acople mı́nimo, 281 inducido, 98
Adaptadas, véase Coordenadas magnético, 85–89, 102, 106, 147–159
Adición Campo gravitatorio, 273, 287
de aceleraciones, 31, 49 constante, 299
de velocidades, 31, 45 estático, 296, 299, 302, 314
Afı́n estacionario, 299, 302
conexión, véase Γµ αβ
isótropo, 301
parámetro, véase Parámetro
y caı́da libre, 274, 317
Agujero blanco, véase Schwarzschild
y geodésicas, 274, 317
Agujero negro, véase Schwarzschild
y leyes fı́sicas, 273, 278
Aislado, 15, 169
Carga eléctrica, 43, 297
Alambre recto, 104
de alambre recto, 104
Anulando E o B, 108–110
densidad, 105
Apelio, véase Schwarzschild
Arago, 5 móvil, 102
Átomo, 74 Cartesianas, véase Coordenadas
de hidrógeno, 82, 301 Causalidad, 52, 345, 351
Atraso, véase Relojes Christoffel, véase Γµ αβ
Cı́clica, véase Coordenadas
β, 124 Ciclotrón, 85, 315
Bianchi, 238, 294 Cilı́ndricas, véase Coordenadas
Big-bang, 76, 317 Cı́rculo, 311
Biot-Savart, 106 máximo, 233, 234, 253, 265
Bradley, 4, 144 Conexión afı́n, véase Γµ αβ
Cónicas, 337, 340
Caı́da libre, 274, 277 no cónicas, 337, 340

376
Cono de la luz, 52, 55, 56, 345, 351 fuerza de Lorentz, 114
Conservación las ecuaciones de las leyes, 220
de energı́a-momentum, 166–175, 189– Covariante
197, 280, 284 ecuación, 137, 139
de la energı́a, 69 ı́ndice, 125, 204
del momentum, 14, 61–65, 69 manifiestamente, 147
del momentum angular, 172–175 no manifiestamente, 147
del número de partı́culas, 163 Curvo, véase Espacio curvo
Constante cosmológica Λ, 294
Constantes del movimiento, 258–267, 299 D, 316, 320
en Schwarzschild, véase Schwarzschild Deflexión de la luz, véase Schwarzschild
Continuidad, véase Ecuación
δ de Dirac, 162–169, 172
Contracción de la longitud, 41, 44, 54
δ de Kronecker, 121, 127, 132, 210, 237
Contravariante, véase Índices
Densidad
Coordenada espacialoide, 344–346, 351
de carga, 43, 105, 110
Coordenada temporal, 298, 302
de corriente, 161
Coordenada temporaloide, 344–346, 351
de energı́a, 103, 191, 296
Coordenadas
de masa, 287
adaptadas, 236
de momentum, 191
cartesianas, 199, 214, 263, 265, 278,
de partı́culas, 161
280
lagrangiana, 186
cı́clicas, 259, 260, 263, 266, 299, 317
propia, 43
cilı́ndricas, 201, 260, 263
continuas, 185 Derecha, 55, 56
de Eddington-Finkelstein, 349 Derivada, 133, 210
de Kruskal-Szekeres, 349 covariante, 213, 226, 237, 279
de Ohanian, 298, 300 en una curva, 267
de Painlevé-Gullstrand, 349 es tensorial, 134, 211
esféricas, 214, 233, 248, 265, 302, no es tensorial, 211
348 simple, 201, 213, 237, 279
geodésicas, 276, 277 Desincronización de relojes, 36
singulares, 348 Desligada, véase Schwarzschild
Corriente Desviación
de momentum, 164 de rayo de luz, véase Luz
de partı́culas, 163 geodésica, véase Geodésica
del momentum angular, 172–175 Deuterón, 74
eléctrica, 110, 143, 164, 297, 358 Diferencial
en alambre recto, 104 D sı́ es covariante, 267
en circuito eléctrico, 107 d no es covariante, 212, 267
Corrimiento al azul, 144, 316 de volumen, 136, 221
Corrimiento al rojo Dilatación del tiempo, 37, 44, 55
big bang, 317 Dirac, véase δ de Dirac
efecto Doppler, 144, 317 Divergencia
gravitacional, 316 covariante, 280, 293
Coulomb, 149 de θµν , 170, 192, 196
Covariancia de de J µ , 164, 165
µνδ
ecuaciones de Maxwell, 111–114, 147– de Mmec , 172–175
µν
157, 359, 369 de T , 166–175, 189–197, 280
electrodinámica, 111–115, 147–159 Doppler, véase Efecto Doppler

377
E = mc2 , 62, 67, 69–75 Espacio
Ecuación tensorial, véase Ecuación co- curvo, 233, 234, 250, 269, 274, 307
variante de Minkowski, 215, 218
Ecuación de Riemann, 199, 253
covariante, 137, 139, 148, 218, 220, de Schwarzschild, véase Schwarzschild
228, 256, 278, 287 euclidiano, 233, 234
de continuidad, 151, 162, 164, 165 no euclidiano, 234, 311
de Euler-Lagrange, 180, 181, 183, plano, 233, 306
187, 194, 254 Estático, véase Campo gravitatorio
de fuentes, 287 Estacionario, 253, véase Campo gravita-
de geodésica, véase Geodésica torio
de Hilbert-Einstein, 288, 292 ηµν , 120, 215, 276
de Hilbert-Einstein inconsistente, 298 Éter, 1–11, 13, 358
de ondas, 152 Euclidiano, véase Espacio
de Poisson, 287 Euler-Lagrange, véase Ecuación de Euler-
de tercer grado, véase Schwarzschild Lagrange
del intervalo, 258, 260, 262, 264, 266 Experimento
Ecuaciones de Maxwell, 6, 93–99, 111– de Michelson-Morley, véase Michel-
114, 147–157, 358, 359, 369 son y Morley
en campo grav., 285 Extremal, 253
homogéneas, 150, 156, 193
inhomogéneas, 150, 156, 193 Fase de una onda, 144
Efecto Doppler, 79, 144, 317 Φ, 287, 305, 343
Einstein segunda derivada, 287
convención de, 119 Filtro de velocidades, 86
en 1905, 20, 74, 93, 357, 369 Fı́sica nuclear, 74
en 1912, 51 Fisión nuclear, 75
en 1915, 287, 294, 301, 339, 340 Fizeau, 2
joven, 2 F µν , 155, 193–197, 217
viejo, 74 Fotón, 68, 74, 75, 79, 142
Electrodinámica, 147–159 Frente de onda, 144
Electromagnetismo, 2, 6, 93–115 Fresnel, 4, 6, 47
Electrón, 82, 87 Fuerza, 65–69, 82
Energı́a-momentum, 166–175, 280, 294, de Lorentz, 114, 147, 152–154, 157,
304, 306 182
no gravitacional, 280, 294, 297 gravitacional, 274
Energı́a, 62, 69–75 Fusión nuclear, 75
de enlace, 74 Futuro, 52, 55, 56, 346, 351
cinética, 65–69
del campo E, B, 103 G: constante gravitacional, 273, 275, 287
Eötvös, 276 Galaxias, 76
²αβγδ , 133 Galileo, 12, 24, 26, 46, 324, 361
Eridani, 317 Γµ αβ , 222, 274, 276, 281, 288
Escalar, 111, 129, 132, 136, 178, 188, 209, Gauge, 148
222, 228, 302 condición de, 149
de curvatura R, 230, 244, 287 de Coulomb, 149
E · B y E 2 − B 2 , 99–101, 159 de Lorentz, 149, 150
Esféricas, véase Coordenadas Gauss, véase Teorema de Gauss
Espacialoide, 51, 52, 344–346, 351 Geodésica, 253, 274, 288

378
coordenadas, véase Coordenadas covariantes, 125, 204
desviación, 269, 275 griegos, 119
ecuación algebraica, 260 latinos, 119
ecuación diferencial, 253, 262, 277 libres, 123, 139, 200
estacionario, 253 Inercia, 73
extremal, 253 Inercial, véase Observador
Geodésico postulado, 274 Interacción, 182, 273, 288
Geometrı́a Intervalo, 76, 120, 123, 140, 177, 201,
de Riemann, 199–251 209, 253, 273, 302
de Schwarzschild, véase Schwarzschild espacialoide, 34, 51, 52
euclidiana, 33, 132 luminoide, 35, 39, 51, 52
intrı́nseca, 251 negativo, 257
y gravitación, 273, 288 nulo, 257
gµν , 199, 210 positivo, 254, 257
de Schwarzschild, véase Schwarzschild temporaloide, 33, 37, 51, 52
derivada covariante gµν;α , 229, 293 Invariante, 132, 136, 139, 178, 188, 209,
gµν es como Φ, 289 222
g00 = 1 + 2Φ/c2 , 290, 305 E · B y E 2 − B 2 , 99–101, 159
primera derivada gµν,α , 223, 226, 243, Izquierda, 55, 56
277, 293
segunda derivada gµν,α,β , 243, 277, J, 316, 318
293 Jackson, 26, 43, 102
altas derivadas, 281 Jacobiano, 222
Goldstein, 336 Jammer, 357
Gradshteyn, 264, 326 J µ , 143, 151, 216
Gravitación del polvo, 163
comparación Newton-Einstein, 336 eléctrica, 164
idea central, 273 Júpiter, 340
newtoniana, 275, 287, 295, 301, 336,
343 Kay, 277
y geometrı́a, 273, 288 Kerr, 300
kµ , 142
~, 144 Kronecker, véase δ de Kronecker
Hamilton, véase Principio de Hamilton Kruskal, 349
Hidrógeno, véase Átomo
Hilbert, 288, 301 L, 180
Hilbert-Einstein, 288, 292 L, 178
Homogeneidad, véase Principio de Lagrangiana, 180, 255, 259
Horizonte, véase Schwarzschild L, 186
Hueco blanco, véase Schwarzschild Λ, 135, 294
Hueco negro, véase Schwarzschild λ, 318, 335
Huygens, 3 Landau, 299
Levi-Civita, 133, 159
Identidades de Bianchi, véase Bianchi Liénard-Wiechert, 102
Índices Ligada, véase Schwarzschild
bajar o subir, 122, 128, 139, 200, Lightman, 327
201 Lı́mite newtoniano, 288, 295, 305
contraı́dos, 123, 200 Lı́nea en el mundo, 51
contravariantes, 125, 204 Local, véase Velocidad local

379
Longitud, 31, 41, 44, 54 Nube
propia, 41, 44 de partı́culas cargadas, 110, 169
Lorentz, 2, 6, 20, 149, 150 de polvo, 162
Luminoide, 35, 39, 51, 52, 345 Nuclear, 74
Luz
aberración, 4, 31, 79 Observador inercial, 7, 13, 15, 93, 140,
cono de luz, véase Cono de la luz 177, 202
difracción, 3, 4 Observador no inercial, 202, 276, véase
interferencia, 3, 4, 8–11 Caı́da libre
polarización, 3, 4 Ohanian, 236, 240, 276, 298, 300, 352
rayo de, 3, 301, 337, 338 Onda
velocidad, 4, 6–13, 46, 357, 361–366, electromagnética, 1, 6, 152
369 fase de, 144
frente de, 144
µνδ
Mmec , 172–175 Onda-corpúsculo, 1–8
Mapamundi, 348 Óptica, 3–11
Mareas, 347, 348 Órbita desligada, véase Schwarzschild
Masa, 61–85, 140 Órbita de un rayo de luz, véase Schwarzschild
gravitacional, 74, 275 Órbita ligada, véase Schwarzschild
inercial, 74, 275 Órbita mercurial, véase Schwarzschild
variable, 83 Órbita terrestre, véase Schwarzschild
Matriz
F µν , 155 Pais, 2
Λ, 135, 213 Parámetro, 39, 177, 254, 267
θµν y θµ ν , 196 afı́n, 256, 262, 263, 269, 318, 335
Mecánica Partı́cula
cuántica, 74, 82, 144, 301 caı́da libre, véase Caı́da libre
lagrangiana, 177 de m 6= 0, 257
newtoniana, 1, 2, 61, 65, 67, 69, 83, en campo grav., véase Caı́da libre
86–89, 275, 318, 327, 336, 343 en un campo Aµ , 182
Mehra, 288 forzada, 51, 140, 168, 169, 177
Mercurio, 301, 337, 339, véase Schwarzschild libre, 38, 51, 81, 140, 157, 168, 177,
Métrica, 370 181, 274
de Minkowski, 76, 120, 132, 215, 218, Pasado, 52, 55, 56, 346, 351
276, 290, 370 Perihelio, véase Schwarzschild
de Schwarzschild, véase Schwarzschild Planck, 6
Michelson y Morley, 2, 8–11, 13 Planetas, 330, 333
Minkowski, véase Métrica de Minkowski Plano, véase Espacio plano
Minkowski H., 50, 51 pµ , 141, véase Momentum
Momento dipolar eléctrico, 107 Poisson, 4, 287
Momentum, 61–73, 141 Polvo, 162
del fotón, 79, 142 Postulado geodésico, 274
Momentum angular, 172–175 Potencia, 154
Movimiento circular, 85 Potencial
Mundo, 51 efectivo, 328, 334
electrostático, 82, 87
Neutrón, 74 escalar φ, 148, 182
Newton, 3, 357 gravitatorio, véase Φ
Newtoniana, véase Mecánica pozo de, véase Pozo de potencial

380
vectorial A, 148, 182 separación espacial, 32, 54
Poynting, 104 separación temporal, 32, 36, 54
Pozo de potencial, 330, 334 Relojes, 38, 311
Precesión del perihelio de Mercurio, véase atraso gravitacional, 313
Schwarzschild atraso por aceleración, 314
Press, 327 atraso por movimiento, 37, 313
Price, 327 desincronización, 36
PriHomo, véase Ppio. de homog. de tiem- en el infinito, 313, 323
po y espacio en reposo, 313, 323
Principio de en reposo en el infinito, 313, 323
conservación de la energı́a, 69 sincronización, 16
conservación del momentum, 61–65, Resnick, 20, 62, 69, 104
69 Ricci Rβµ , 230, 244, 287, 303
covariancia general, 220 Riemann espacio de, 199, 253
equivalencia, 277 Riemann tensor de, 229–244, 277, 347,
Galileo, 275 348
Hamilton, 186 n2 (n2 − 1)/12 componentes, 232
Huygens, 3 cinco identidades, 230
la homogeneidad del tiempo y el es- es único, 240, 293
pacio, 12, 14, 357, 360, 369 es curvatura, 233, 269
la relatividad, 2, 12, 13, 94, 111, 138, Rotación
139, 357, 359, 360, 369 de masa puntual, 300
la velocidad de la luz, 2, 12, 46, 357, grupo de, 302
361–366, 369 Ruffini, 236, 240, 276, 298, 352
mundo absoluto, 51 Ryzhik, 264, 326
PriRel, véase Ppio. de relatividad
PriVel, véase Ppio. de la vel. de la luz Schroedinger, 82
Propio Schutz, 277, 348
densidad, 43 Schwarzschild, 300, 301
longitud, 41, 44 caı́da libre, 317
tiempo, 31, 37, 44, 55, 110, 140, 178, caı́da libre vertical, 324
257, 311 cono de luz, 345, 351
volumen, 42 consts. del mov., 316, 317, 333
Protón, 74, 88 tercera const. del mov., 319
Prototipo, véase Vector ecuación de tercer grado, 332
Puntos de retorno, véase Schwarzschild el subespacio (θ, ϕ), 309
el subespacio (r, θ, ϕ), 308
QCD, 370 el subespacio (r, ϕ), 310
el subespacio (r, θ), 308
Rango de un tensor, 129, 207, 209 el subespacio (t, θ), 310
Red shift, véase Corrimiento al rojo el subespacio (t, r), 309
Regla (,) → (;), 280 escalar R, 307
Relatividad especial espacio de, 248
estructura, 3, 19 futuro, 346, 351
motivación, 2, 357 geometrı́a de, 248
Relativo horizonte, 344, 346, 347
frente de onda, 144 hueco blanco, 352
izquierda-derecha, 55 hueco negro, 345–348
pasado-futuro, 55 leyes fı́sicas en, 284

381
µν
métrica de, 248 Tcan , 189–197
mareas, 347, 348 Temporaloide, 51, 52, 344–346, 351
órbita circular, 331 Tensor
µνδ
órbita desligada, 329 Mmec , 172–175
órbita de un rayo de luz, 337, 338 Aµ , 148, 182, 193–197, 203
órbita ligada, 329 Aµ Bµ es un tensor, 132, 209
órbita mercurial, 337, 339 antisimétrico, 209
órbita terrestre, 333, 337 asimétrico, 192, 195
µν
parámetro afı́n, 318, 323, 335 canónico Tcan , 189–197
pasado, 346, 351 de energı́a-momentum, 165–175, 189–
apelio mercurial, 339 197, 280
perihelio mercurial, 339 de Levi-Civita, 159
apelio terrestre, 333 de momentum angular, 172–175
perihelio terrestre, 333 del campo electromagnético, 170, 189–
planetas, 330, 333 197
potencial efectivo, 328, 334 δµ ν es un tensor, 132
pozo de potencial, 330, 334 ∂ µ ∂µ , 134
precesión perihelio mercurial, 339 ∂µ φ y ∂µ Aν son tensores, 134
pseudosingularidad, 348 ecuaciones, 137, 139
puntos de retorno, 328, 331, 332, electromagnético, 155, 193–197, 217
336, 338, 340 ²αβγδ es un tensor, 133
radio de, 248, 306 escalar, 129, 132
sı́mbolos Γµ αβ , 307 ηµν es un tensor, 132
singularidad, 347 F µν , 155, 193–197, 217
subespacios, 308 gµν , 199, 210
tensor Rµν , 307 J µ , 143, 163, 216
tensor Rα βµν , 307 kµ del fotón, 142
tiempo τ , 311, 323, 326, 347 Levi-Civita, 133
tiempo T , 311, 323 métrico, 132, 199, 210, 273
tiempo t, 311, 323, 327, 347 pµ es un tensor, 141
tiempo universal, 323 rango de un, 129, 207, 209
Serie de Taylor, 180, 270 Riemann, véase Riemann
Sı́mbolo de Christoffel, véase Γµ αβ simétrico, 166, 175, 192, 195, 209
µν
Simultaneidad, 31, 34, 36, 44, 54, 144, Tcan , 189–197
µν
313 θ , 170, 192, 196
Sincronización de relojes, 16 U µ es un tensor, 141
Singularidad, véase Schwarzschild vector, 79, 129
Sirio, 317 Tensor de Riemann, véase Riemann
Sistema fı́sico Teorı́a de la gravitación, véase Gravitación
aislado, 15, 169 Teorema
no aislado, 169 de Gauss, 163, 166
Snell, 3 de las coordenadas adaptadas, 236
Sol, 288, 306, 317, 333, 337, 339 del tensor métrico, 244
Sonido, 1, 5 principal del cálculo, 222
Stokes, 6 Teukolsky, 327
Szekeres, 349 θµν , 170, 192, 196
Thomas, 136
τ , 37, 178, 311, véase Tiempo propio Tiempo
Taylor, véase Serie de Taylor T , 311

382
τ , 311 Velocidad de una partı́cula, 17, 62, 75,
t, 311 140, 141
coordenado, véase Coordenada tem- Velocidad de un observador, 17, 62
poral Velocidad local, 312, 315, 321
de vida media, 39 Venus, 340
propio, 31, 37, 44, 55, 110, 140, 178, Vida media, 39
257, 311, 347 Virtual, 178
universal, 298, 313, 323 Volumen
inversión, 299 de nube, 110
Tierra, 4, 8–11, 288, 306, 323, 333, 337 diferencial de, 136, 221
T µν , 280, 287, 294, 304, 306 propio, 42
asimétrico, 192, 195, 298
T µν ,ν = 0, 166–175, 280 Wald, 348
T µν ;ν = 0, 280, 294 Weinberg, 133, 162, 281
simétrico, 166, 175, 192, 195, 298
Torretti, 348 Young, 4
Trabajo, 65–69, 82
Transformación
de p , E , m , F, 76
de E y B, 93–115, 158, 359, 367–369
de F µν , 158
de J µ = (cρ, J), 111
gauge, 148
Transformaciones de coordenadas, 17, 359,
360, 369
de Galileo, 12, 24, 26, 46, 65, 361
de Lorentz, 20–28, 124, 138, 139,
199, 218, 280, 366–367
familia de, 24, 361
generales, 199–251, 280
lineales, 20, 124, 199, 244
no lineales, 202
Translaciones, 188
Trayectoria de una partı́cula, 16, 39, 140,
164, 177
en campo grav., véase Caı́da libre

u = 1/r, 336
U µ , 141
Unión
de E y B, 101, 119
de espacio y tiempo, 31, 119
Unitario, véase Vector
Universal, véase Tiempo

Variacional, véase Cálculo variacional


Vector, 79, 125, 129, 203, 209
prototipo, 125, 131, 140, 203, 209
unitario, 85, 142, 143, 214

383

También podría gustarte