Elementos de Relatividad PDF

Prefacio
Este libro presenta los elementos de la teorı́a de la relatividad. El texto

se dirige especialmente a estudiantes de pregrado; pensando en ellos, he
intentado presentar la teorı́a ası́ como yo habrı́a deseado leerla cuando la
estudié por vez primera, hace años.
La primera parte del libro se dedica a la relatividad especial, y la segun-

da parte a la general. La fundamentación de la teorı́a especial, en el primer
capı́tulo, se apoya fuertemente en el experimento de Michelson y Morley.
Esta ruta es probablemente cuestionable desde un punto de vista históri-
co, pero tiene la ventaja de aprovechar las enseñanzas y sugerencias que se
derivan de ese experimento, y lo hacen pedagógicamente valioso.
Para algunos la esencia de la relatividad especial está en las transforma-

ciones de Lorentz, y la covariancia de las ecuaciones de Maxwell resulta al
final, como una virtud de las transformadas. Este punto de vista tiene ven-
tajas pedagógicas, y por eso lo he seguido en los primeros capı́tulos, que se
dedican a mostrar la estructura de la teorı́a.
Pero también se puede pensar que la esencia del proyecto relativista es el

empeño por extender el principio de la relatividad al electromagnetismo: que
las ecuaciones de Maxwell sean las mismas para todos los observadores in-
erciales; en busca de este objetivo se encuentran, como un paso intermedio,
las transformaciones de Lorentz y la constancia de la velocidad de la luz. Me
gusta este punto de vista, aunque admito que tiene dificultades didácticas.
El lector interesado puede ir al apéndice, donde se ejecutan en detalle los
pasos correspondientes.
Los capı́tulos 5 y 9 dan los fundamentos del cálculo tensorial que se usa
en la relatividad especial, y en la general, respectivamente. Si bien la teorı́a
especial puede estudiarse sin tensores, la general se entiende con el uso de-
i
cidido del cálculo tensorial.
El capı́tulo 11 es crucial, y desarrolla la idea de que la gravitación puede

entenderse como un hecho geométrico. El 12 construye la ecuación de los
campos gravitacionales, de Hilbert-Einstein, y el capı́tulo 13 está dedicado
a la solución de Schwarzschild. En este último capı́tulo se enfatiza el asunto
de las partı́culas en caı́da libre, que siguen trayectorias geodésicas. Ası́ se
justifica que se haya dedicado antes todo un capı́tulo, el 10, al estudio de las
lı́neas geodésicas.
La teorı́a de la relatividad es la gloria de la fı́sica teórica. Si hay un lec-

tor que, iniciándose en el camino de esa teorı́a, encuentra que este libro es
de alguna ayuda, yo sentiré que mi trabajo ha sido bien pagado.
Lorenzo de la Torre
Medellı́n, diciembre de 2006
ii
Índice General
Prefacio I
1. El origen de la relatividad 1
1.1. Corpúsculos y ondas . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. El éter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3. El experimento de Michelson y Morley . . . . . . . . . . . . . 8
1.4. La transformación de Galileo . . . . . . . . . . . . . . . . . . 11
1.5. La constancia de la velocidad de la luz . . . . . . . . . . . . . 12
1.6. El principio de la relatividad . . . . . . . . . . . . . . . . . . 13
1.7. Homogeneidad del espacio y el tiempo . . . . . . . . . . . . . 14
1.8. El concepto de observador . . . . . . . . . . . . . . . . . . . . 15
1.9. Transformaciones de coordenadas . . . . . . . . . . . . . . . . 17
1.10. Las transformaciones de Lorentz . . . . . . . . . . . . . . . . 20
2. Propiedades del espaciotiempo 31

2.1. Las separaciones espacial y temporal son relativas . . . . . . . 32
2.2. El intervalo es absoluto . . . . . . . . . . . . . . . . . . . . . 32
2.3. Clases de intervalos . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4. La simultaneidad es relativa . . . . . . . . . . . . . . . . . . . 36
2.5. Tiempo propio . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.6. Longitud propia . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.7. Comparación de longitud propia y tiempo propio . . . . . . . 44
2.8. Un caso de simultaneidad . . . . . . . . . . . . . . . . . . . . 44
2.9. La adición de velocidades . . . . . . . . . . . . . . . . . . . . 45
2.10. La adición de aceleraciones . . . . . . . . . . . . . . . . . . . 49
2.11. Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.12. Más gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
iii
3. Mecánica 61
3.1. La conservación del momentum . . . . . . . . . . . . . . . . . 62
3.2. Las nuevas cantidades dinámicas . . . . . . . . . . . . . . . . 65
3.3. La energı́a en la relatividad especial . . . . . . . . . . . . . . 69
3.4. E = mc2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.5. La velocidad lı́mite . . . . . . . . . . . . . . . . . . . . . . . . 75
3.6. Las transformaciones de p , E , m , F . . . . . . . . . . . . . . 76
3.7. Masa y potencial electrostático . . . . . . . . . . . . . . . . . 82
3.8. La aceleración . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.9. Movimiento circular . . . . . . . . . . . . . . . . . . . . . . . 85
4. El campo electromagnético 93
4.1. Transformación de los campos E y B . . . . . . . . . . . . . . 93
4.2. Dos cantidades invariantes . . . . . . . . . . . . . . . . . . . . 99
4.3. El campo electromagnético total . . . . . . . . . . . . . . . . 101
4.4. Una carga con velocidad uniforme . . . . . . . . . . . . . . . 102
4.5. Un alambre recto con corriente . . . . . . . . . . . . . . . . . 104
4.6. Anulando el campo menor . . . . . . . . . . . . . . . . . . . . 108
4.7. La corriente eléctrica . . . . . . . . . . . . . . . . . . . . . . . 110
4.8. Covariancia de la electrodinámica . . . . . . . . . . . . . . . 111
5. Tensores en la relatividad especial 119

5.1. Subı́ndices y superı́ndices . . . . . . . . . . . . . . . . . . . . 119
5.2. Los vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
5.3. Otros tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.4. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.5. Ecuaciones tensoriales . . . . . . . . . . . . . . . . . . . . . . 137
5.6. El principio de la relatividad . . . . . . . . . . . . . . . . . . 139
5.7. Los tensores m0 , xµ , dτ, U µ , pµ , k µ y J µ . . . . . . . . . . . 140
5.8. Aberración de la luz y efecto Doppler . . . . . . . . . . . . . 143
6. La electrodinámica
manifiestamente covariante 147
6.1. El cuadripotencial Aµ . . . . . . . . . . . . . . . . . . . . . . 148
6.2. Las dos ecuaciones de Maxwell . . . . . . . . . . . . . . . . . 150
6.3. La fuerza de Lorentz . . . . . . . . . . . . . . . . . . . . . . . 152
6.4. El tensor electromagnético . . . . . . . . . . . . . . . . . . . . 155
6.5. La transformación de los campos . . . . . . . . . . . . . . . . 158
6.6. Dos escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
iv
7. Las leyes de conservación 161
7.1. La nube de partı́culas . . . . . . . . . . . . . . . . . . . . . . 161
7.2. Otras corrientes . . . . . . . . . . . . . . . . . . . . . . . . . . 164
7.3. El tensor de energı́a y momentum . . . . . . . . . . . . . . . . 165
µν µν
7.4. ∂µ Tmec = 0 , ∂µ Tmec 6= 0 . . . . . . . . . . . . . . . . . . . . 166
7.5. La corriente de momentum angular . . . . . . . . . . . . . . . 172
7.6. Generalización . . . . . . . . . . . . . . . . . . . . . . . . . . 173
8. Dinámica lagrangiana 177

8.1. Teorı́a lagrangiana para una partı́cula . . . . . . . . . . . . . 177
8.2. Teorı́a lagrangiana para coordenadas continuas . . . . . . . . 185
8.3. El tensor energı́a-momentum . . . . . . . . . . . . . . . . . . 188
8.4. Formulación lagrangiana del campo electromagnético . . . . . 193
9. Transformaciones generales
de coordenadas 199
9.1. Subı́ndices y superı́ndices . . . . . . . . . . . . . . . . . . . . 199
9.2. Transformaciones generales . . . . . . . . . . . . . . . . . . . 202
9.3. Los vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
9.4. Otros tensores . . . . . . . . . . . . . . . . . . . . . . . . . . 207
9.5. La derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
9.6. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
9.7. Coordenadas esféricas . . . . . . . . . . . . . . . . . . . . . . 214
9.8. La relatividad especial . . . . . . . . . . . . . . . . . . . . . . 217
9.9. Ecuaciones tensoriales . . . . . . . . . . . . . . . . . . . . . . 218
9.10. Covariancia general . . . . . . . . . . . . . . . . . . . . . . . 220
9.11. El elemento invariante de volumen . . . . . . . . . . . . . . . 221
9.12. El sı́mbolo de Christoffel . . . . . . . . . . . . . . . . . . . . 222
9.13. La derivada covariante . . . . . . . . . . . . . . . . . . . . . 226
9.14. El tensor de Riemann . . . . . . . . . . . . . . . . . . . . . . 230
9.15. Plano y curvo . . . . . . . . . . . . . . . . . . . . . . . . . . 233
9.16. Coordenadas adaptadas . . . . . . . . . . . . . . . . . . . . . 236
9.17. Las identidades de Bianchi . . . . . . . . . . . . . . . . . . . 238
9.18. El tensor de Riemann es el único . . . . . . . . . . . . . . . . 240
9.19. Obligar a gµν a que tome el valor que queramos . . . . . . . 244
9.20. Dos transformaciones sucesivas . . . . . . . . . . . . . . . . . 246
9.21. Un ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
v
10. Las geodésicas 253
10.1. La ecuación diferencial . . . . . . . . . . . . . . . . . . . . . . 253
10.2. Parámetros afines . . . . . . . . . . . . . . . . . . . . . . . . . 256
10.3. Constantes del movimiento . . . . . . . . . . . . . . . . . . . 258
10.4. Las ecuaciones algebraicas . . . . . . . . . . . . . . . . . . . . 260
10.5. Derivada a lo largo de una curva . . . . . . . . . . . . . . . . 267
10.6. Rαβµν y la curvatura . . . . . . . . . . . . . . . . . . . . . . . 269
11. El principio de equivalencia 273

11.1. El postulado de las geodésicas . . . . . . . . . . . . . . . . . 274
11.2. El principio de Galileo . . . . . . . . . . . . . . . . . . . . . . 275
11.3. Coordenadas geodésicas . . . . . . . . . . . . . . . . . . . . . 276
11.4. El principio de equivalencia . . . . . . . . . . . . . . . . . . . 277
11.5. El acople mı́nimo . . . . . . . . . . . . . . . . . . . . . . . . 281
11.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
12. La ecuación del campo gravitatorio 287

12.1. El lı́mite newtoniano . . . . . . . . . . . . . . . . . . . . . . . 288
12.2. Los 10 potenciales gµν . . . . . . . . . . . . . . . . . . . . . . 288
12.3. El potencial g00 en coordenadas cartesianas . . . . . . . . . . 290
12.4. La ecuación de Hilbert-Einstein . . . . . . . . . . . . . . . . . 292
12.5. Las coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . 298
13. La solución de Schwarzschild 301

13.1. Campo isótropo estático . . . . . . . . . . . . . . . . . . . . 301
13.2. La geometrı́a del espaciotiempo . . . . . . . . . . . . . . . . 307
13.3. Subespacios . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
13.4. Relojes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311
13.5. Corrimiento hacia el rojo . . . . . . . . . . . . . . . . . . . . 316
13.6. Constantes del movimiento . . . . . . . . . . . . . . . . . . . 317
13.7. Una tercera constante del movimiento . . . . . . . . . . . . . 319
13.8. J y D en términos de r, v y vϕ . . . . . . . . . . . . . . . . . 320
13.9. Las cuatro variables t, T, τ y λ . . . . . . . . . . . . . . . . . 323
13.10. La caı́da vertical . . . . . . . . . . . . . . . . . . . . . . . . 324
13.11. Potencial efectivo . . . . . . . . . . . . . . . . . . . . . . . . 328
13.12. Puntos de retorno . . . . . . . . . . . . . . . . . . . . . . . . 332
13.13. Eliminación del parámetro afı́n λ . . . . . . . . . . . . . . . 335
13.14. La variable u . . . . . . . . . . . . . . . . . . . . . . . . . . 336
13.15. Deflexión de un rayo de luz . . . . . . . . . . . . . . . . . . 338
13.16. La precesión anómala del perihelio de Mercurio . . . . . . . 339
vi
13.17. Coordenadas temporaloides y espacialoides . . . . . . . . . . 344
13.18. El cono de la luz . . . . . . . . . . . . . . . . . . . . . . . . 345
13.19. Singularidades . . . . . . . . . . . . . . . . . . . . . . . . . . 347
13.20. Las coordenadas de Kruskal-Szekeres . . . . . . . . . . . . . 349
A. La constancia de la velocidad de la luz 357

A.1. El principio de la relatividad . . . . . . . . . . . . . . . . . . 358
A.2. Transformaciones . . . . . . . . . . . . . . . . . . . . . . . . . 360
A.3. La velocidad de la luz . . . . . . . . . . . . . . . . . . . . . . 361
A.4. Las transformaciones de Lorentz . . . . . . . . . . . . . . . . 366
A.5. Regreso al campo . . . . . . . . . . . . . . . . . . . . . . . . . 367
A.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
Bibliografı́a 373
vii
viii
Capı́tulo 1
El origen de la relatividad
En este primer capı́tulo nos proponemos construir las primeras bases de la

teorı́a especial de la relatividad. Comenzamos mostrando algunas de las di-
ficultades en que se hallaba la fı́sica a fines del siglo XIX; es allı́, en la crisis
del electromagnetismo, donde se encuentra el origen histórico de la relativi-
dad. Antes de revisar las dificultades de la fı́sica en esa época, conviene que
presentemos un recuento breve de la polémica ondas-corpúsculos que acom-
pañaba a la óptica desde siglos atrás.
Para darle fundamento a la teorı́a ondulatoria de la luz, los cientı́ficos de

los siglos XVIII y XIX se apoyaron en aquella otra onda que conocı́an bi-
en, el sonido, en un intento por sacar de allı́ los elementos conceptuales que
pudieran servirles para la luz. Ellos tenı́an muy claro que la onda acústica se
propaga en medios elásticos como el aire, el agua, los cuerpos sólidos, etc., y
que, sin el medio, la onda no puede propagarse. Para trasladar este concepto
al estudio de la luz, era necesario aceptar la existencia de un medio (al que
llamaron éter) que soportara la propagación de la onda luminosa.
El concepto del éter penetró con dificultad en la fı́sica teórica; para ajus-
tarlo al conocimiento de la época, los cientı́ficos tuvieron que admitir que él
debı́a tener un conjunto de propiedades extrañas, absurdas y contradictorias.
Aún ası́, los fı́sicos se aferraron a su creencia en el éter, ese medio curioso
que cumplı́a una doble función: de un lado, supuestamente soportaba a las
ondas electromagnéticas, y de otro lado era como una corporización del es-
pacio absoluto en que se apoyaba la mecánica newtoniana. Era importante
que la idea del éter tuviera un respaldo experimental, y el instrumental ópti-
co de fines del siglo XIX contaba ya con la precisión suficiente para medir
la velocidad v que nuestro planeta supuestamente tenı́a respecto al éter. El
experimento de Michelson y Morley dio un resultado sorpresivo: v debe ser
1
cero. Este resultado no es ilógico, pero sı́ es increı́ble.
Nuestra presentación se basa fuertemente en el experimento de Michelson

y Morley. Hemos preferido esta ruta didáctica porque el análisis del experi-
mento trae unas ventajas pedagógicas que no podemos despreciar. Tal como
veremos, el estudio de este experimento dispara una variedad de ideas sug-
estivas que se conectan con el principio de la constancia de la velocidad de
la luz y con el principio de la relatividad. No se nos escapa que nuestra
presentación es cuestionable, en cuanto los historiadores aceptan1 que el ex-
perimento no fue decisivo en las motivaciones que tuvo el joven Einstein en
aquellos años de creación de la teorı́a.
El principio de la relatividad, que dice que lo que ocurre para un observador

inercial también puede ocurrir para cualquier otro observador inercial, lo
aceptaron los cientı́ficos desde el siglo XVIII, cuando se dieron las bases de
la ciencia. Pero lo aceptaban únicamente para experiencias de mecánica, co-
mo las que se realizan con resortes, péndulos, planos inclinados, etc. Habı́a
otro conjunto de experiencias para las cuales no creı́an que valiera el prin-
cipio de la relatividad: las de la electricidad y el magnetismo. ¿Por qué los
cientı́ficos anteriores a 1905 pensaban que el Principio no se aplica a los
fenómenos electromagnéticos? Porque ellos creı́an, equivocadamente, que el
espacio y el tiempo tienen una estructura galileana. La teorı́a de la rela-
tividad encuentra la verdadera estructura y demuestra que, dentro de esta
estructura, el principio de la relatividad sı́ abarca los fenómenos del electro-
magnetismo, asuntos que estudiaremos en los capı́tulos 4 y 6.
Se puede pensar que la parte fuerte de la teorı́a de la relatividad es en-

contrar la estructura verdadera del espaciotiempo y que, después, la teorı́a
electromagnética resulta válida para todos los observadores inerciales; este
es el punto de vista que se sigue en el capı́tulo presente. Pero también se
1
Einstein conoció antes de 1905 los resultados del experimento de Michelson y Morley.
Decimos esto porque se sabe que él habı́a estudiado el artı́culo [1] de Lorentz de 1895 en
el que el fı́sico holandés discutı́a en detalle los resultados del experimento. El experimento
impresionó a muchos, pero no a Einstein. ¿Por qué no? Porque él ya sabı́a que el resul-
tado del experimento tenı́a que ser nulo, simple y llanamente porque el éter era, para él,
inexistente. El Michelson-Morley no fue lo que condujo a Einstein hacia la relatividad.
Cuando, años después, le preguntaron a Einstein sobre las motivaciones que habı́a tenido
para formular la relatividad especial, respondió que la aberración y el experimento de
Fizeau le mostraron el camino, y que ellos dos “fueron suficientes”. Estas dos palabras de
Einstein son, según Pais, “la declaración más crucial que Einstein jamás hiciera acerca de
los orı́genes de la teorı́a de la relatividad”[?].
2
puede pensar que la parte fuerte de la teorı́a es su motivación: que las leyes
electromagnéticas sean válidas para todos los observadores inerciales; y que
para darle cumplimiento a esa motivación es necesario averiguar cuál es la
estructura verdadera del espaciotiempo. Este segundo punto de vista se sigue
en el apéndice.
1.1 Corpúsculos y ondas

La óptica moderna nació en el siglo XVII, cuando los cientı́ficos lograron
controlar, en el laboratorio, los fenómenos básicos de la luz. Animados por
el espı́ritu experimental, estudiaron la propagación rectilı́nea de un rayo de
luz, la descomposición espectral, la polarización, difracción e interferencia.
Esta fase inicial de la óptica se dio dentro de un debate intenso respecto
a la naturaleza de la luz, ya que unos creı́an que la luz estaba compuesta
de corpúsculos, mientras otros preferı́an pensar a la luz como un fenómeno
ondulatorio.
La interpretación ondulatoria mostró su eficacia al explicar los fenómenos

de difracción y de interferencia en láminas delgadas. La base teórica de la
visión ondulatoria está en el principio de Huygens, según el cual todo punto
de un frente de onda origina una onda esférica secundaria, y el frente de on-
da está formado por la envolvente de las ondas secundarias emitidas por el
frente anterior. La potencia explicativa de este principio se manifestó rápida-
mente, porque condujo a una visión cuantitativa y exacta de la interferencia
y la difracción, y permitió deducir, con argumentos elementales, la ley de
refracción de Snell. La interpretación ondulatoria de la luz tuvo numerosos
adeptos, aunque se debe tener en cuenta que la palabra onda no significaba
lo mismo para todos. Huygens, por ejemplo, no concebı́a la onda como una
perturbación continua, con longitud de onda, sino más bien como pulsos de
duración finita.
Los primeros seguidores de la interpretación ondulatoria se encontraron

con un escollo que no pudieron vencer, que es la polarización de la luz. La
teorı́a ondulatoria inicial, con ondas longitudinales, no pudo explicar la po-
larización, ya que ésta pone de manifiesto unas propiedades perpendiculares
a la dirección de propagación. En cambio, los seguidores de la interpretación
corpuscular sı́ tenı́an al menos un intento de explicación, propuesto por New-
ton: “la luz tiene lados”, enunciado que hoy se interpreta como si él hubiera
querido decir que los corpúsculos luminosos son ovalados y se pueden ajustar
3
ası́ a las exigencias de las placas de polarización.
Que la teorı́a ondulatoria inicial fuera incapaz de explicar la polarización

de la luz incomodaba a muchos, y fue lo que condujo a Newton a preferir la
teorı́a corpuscular. Es justo anotar, sin embargo, que él nunca tomó partido
decidido por ninguna de las dos teorı́as de la luz, y por eso carece de funda-
mento la creencia, altamente generalizada, de que Newton fuera el padre de
la teorı́a corpuscular.
Uno de los seguidores más importantes de la interpretación corpuscular fue

Bradley quien, con una serie de observaciones astronómicas, descubrió la
aberración de la luz de las estrellas. Interpretando la luz como corpúsculos,
el inglés explicó este efecto, midió la velocidad de la luz y demostró, por
primera vez, que la Tierra se mueve anualmente alrededor del Sol. Estas ob-
servaciones astronómicas y la explicación subsecuente aportada por Bradley,
se dieron en un perı́odo dominado por la interpretación corpuscular. En efec-
to, ésta se impuso durante casi todo el siglo XVIII.
Pero en los primeros años del XIX resurgió vigorosamente la idea ondu-
latoria, debido, en parte, a la gran precisión, nunca antes vista, que se es-
taba logrando en los experimentos de interferencia y difracción. A Young
se le ocurre una idea que habrı́a de cambiar radicalmente el rumbo de la
óptica: la polarización se entiende fácilmente si las ondas de la luz no son
longitudinales, sino transversales. Fresnel toma esta idea y en poco tiempo
reconstruye toda la teorı́a de interferencia, difracción, refracción y polar-
ización a partir de ondas transversales. Renovada, la teorı́a ondulatoria fue
capaz de explicar una gran variedad de fenómenos de interferencia y difrac-
ción, y también pudo hacer predicciones, como por ejemplo esta: Si un haz
de luz que ha pasado por un agujero bien pequeño se dirige hacia un disco
opaco, como una moneda por ejemplo, entonces detrás del disco, en el eje
óptico, no todo es obscuridad, sino que en cierto lugar deberá aparecer un
punto brillante; en la zona de la sombra debe aparecer un punto brillante.
Una predicción de estas, tan puntual y precisa, no puede pasar desapercibida
a los rivales de la teorı́a ondulatoria, entre los que se contaba Poisson. Este
matemático y fı́sico francés piensa que no puede haber un punto brillante
en la región de las sombras y que, por consiguiente, la predicción debe estar
equivocada.
La teorı́a undulatoria substituyó a la corpuscular tan súbitamente, que po-

drı́amos decir que el cambio se efectuó “de un dı́a para otro”. Fresnel presen-
4
ta su teorı́a ondulatoria a la Academia Francesa en 1815. Poisson se opone a
esta teorı́a y, para atacarla, trae a cuento la predicción del punto brillante en
la sombra de la moneda. Arago recibe la objeción de Poisson como un reto
y se dispone a montar un experimento para establecer si tal punto brillante
verdaderamente existe o no; y mostró a los académicos pasmados, en una
escena memorable de la historia de la fı́sica, el puntico brillante en medio de
la sombra. La teorı́a ondulatoria fue acatada desde ese momento.
1.2 El éter
Anotamos arriba que el sonido era bien conocido y se le entendı́a, correc-
tamente, como las vibraciones longitudinales de un medio material, bien
sea gaseoso, lı́quido o sólido. También apuntamos que los primeros ópticos
partidarios de la teorı́a ondulatoria trasladaron a la luz las propiedades cono-
cidas del sonido: la luz debe de ser una vibración longitudinal. Pero, ¿qué es
lo que vibra en los fenómenos luminosos? Hoy por hoy se acepta que lo que
vibra es el campo electromagnético, y que esta ondulación puede darse en el
vacı́o, pero en la cultura de los siglos anteriores la idea del vacı́o era difı́cil
de aceptar. Que el espacio entre los astros pueda estar vacı́o era inadmisible,
porque los hombres tenı́an horror a la idea del vacı́o. Prefirieron pensar en
una substancia que rellena tal espacio, un medio a través del cual viajan
los astros y la luz: estas son las caracterı́sticas principales de lo que se ha
denominado2 el éter3 .
No hay una definición precisa4 de en qué consiste este medio transmisor de

la luz, el éter, pero podemos reseñar algunas de sus propiedades. El éter debe
invadir todo el universo, porque de lo contrario no podrı́amos recibir la luz
que proviene de las estrellas. Debe ser suficientemente rı́gido para transmitir
las ondas con una velocidad tan grande. Un medio con estas caracterı́sticas
debe causar rozamiento en los planetas, motivando ası́ un frenado, un retar-
do en sus trayectorias. Sin embargo, un frenado acumulado serı́a fácilmente
2
La palabra éter tiene varios significados. El que estamos discutiendo es el éter lu-
minı́fero. Este se debe distinguir del éter etı́lico, que es un gas usado en medicina como
antiespasmódoco y anestésico.
3
La teorı́a corpuscular se basa en la supuesta existencia de las partı́culas luminı́feras;
dado que éstas podrı́an perfectamente propagarse en el vacı́o, la teorı́a corpuscular no
necesita éter. Pero la ondulatoria es hermana del éter.
4
El Diccionario de la Real Academia Española de 1780 trae esta definición de éter: /La
esfera, ó cielo del fuego/Se toma tambien muy freqüentemente por la substancia celeste y
pura desde la atmósfera arriba, por la cual caminan los astros.
5
detectable en las observaciones astronómicas y, dado que los astrónomos no
han notado el más mı́nimo indicio de frenado, se concluye que el éter debe
ser un gas delgadı́simo, muy sutil: cuando los astros viajan en el espacio no
lo notan, porque el éter se cuela a través de ellos libremente, ası́ “como la
brisa fluye entre los árboles con poca o ninguna oposición”. Mientras la luz
sea ondas longitudinales, el éter como un gas sutil no está mal; pero, tal co-
mo hemos mencionado, la teorı́a ondulatoria pasó de ondas longitudinales a
transversales y aquı́ hay un problema, ya que los gases no transmiten ondas
transversas. Para que el éter transmita las nuevas ondas transversas de la
luz, debe ser un sólido. Y como la velocidad de la luz es tan alta, el sólido
debe ser muy elástico y muy rı́gido. En conclusión, el éter luminı́fero es una
substancia que no atrae ni es atraı́da gravitacionalmente, inmóvil, transpar-
ente, sólida, rı́gida, elástica y se cuela entre los objetos móviles sin rozarlos.
Debemos entender que un medio transmisor tan contradictorio se presta a

múltiples interpretaciones. Se propusieron toda clase de explicaciones. Fres-
nel5 dice que un medio óptico de ı́ndice de refracción n, cuando se mueve
con velocidad v, arrastra parcialmente al éter consigo y le imparte6 una ve-
locidad (1 − n−2 )v. Para Stokes el éter es completamente arrastrado por un
cuerpo en movimiento. Lorentz propone que no hay arrastre de éter, sino
que hay un parámetro temporal efectivo dado por t0 = t−vx/c2 . Planck dice
que probablemente el éter es compresible y se acumula con gran densidad
alrededor de los cuerpos grandes.
En el siglo XIX se dan los grandes avances del electromagnetismo, no sólo en

el lado experimental, sino además en el teórico. A fines de ese siglo se pro-
duce una compilación de la teorı́a electromagnética, una reunión expresada
en las cuatro ecuaciones de Maxwell. Estas ecuaciones hacen una predicción
definitiva: debe haber ondas electromagnéticas, y éstas tienen una velocidad
c que es la misma en todas las direcciones. Con esto queremos decir que la
velocidad c de un pulso de luz tiene una magnitud c que no depende de la
dirección del vector c. En pocas palabras, la velocidad de la luz es isótropa.
Pero hay un detalle crucial acerca de esta isotropı́a, y es que como las ecua-
ciones de Maxwell se consideraban válidas únicamente para un observador
inercial O en reposo respecto al éter, la velocidad de la luz se consideraba,
5
Fresnel fue quien más empeño puso en fundamentar el concepto del medio transmisor
de la onda luminosa, y se le considera el padre de la hipótesis etérea. Es él quien introduce
la idea del éter en reposo absoluto en 1818, y quien hace los esfuerzos iniciales para
someterlo a la observación experimental.
6
Véase la ecuación (2.31).
6
también, que era isótropa únicamente respecto a O: se pensaba que para
los otros observadores inerciales la velocidad de la luz no podı́a ser isótropa.
Veamos esto.
Consideremos un observador inercial O0 que se mueve con velocidad v re-

specto a O. Llamaremos c 0 a la velocidad del pulso de luz respecto a O0 .
Quizás no sea equivocado pensar que
c0 = c − v (1.1)
Esta ecuación implica que:
c02 = c2 + v 2 − 2vc cos θ , (1.2)
donde θ es el ángulo que se forma entre c y v . La Figura 1.1 muestra los

vectores c, v y c 0 , el ángulo θ, y el ángulo θ0 que se forma entre c 0 y v .
En esta figura se ve claramente que c cos θ = v + c0 cos θ0 . Remplazando este
valor en el lado derecho de (1.2) se llega a:
c02 = c2 + v 2 − 2v(v + c0 cos θ0 )
c02 + 2v cos θ0 c0 − (c2 − v 2 ) = 0
Esta última es una ecuación de segundo grado, y sus dos soluciones son
" r #
v v2
c = c − cos θ0 ±
0
1 − 2 sen2 θ0
c c
La solución con el signo inferior da una c0 negativa, y por eso es inaceptable.

Queda la solución del signo superior:
" r #
v v2
c0 = c − cos θ0 + 1 − 2 sen2 θ0 (1.3)
c c
Nótese que c0 depende explı́citamente de θ0 : la velocidad c0 de la luz es
7
anisótropa. En O se cumplen las ecuaciones de Maxwell y por consiguiente
la velocidad de la luz es isótropa. En O0 la velocidad de la luz es anisótropa, o
sea que para ese observador no se deben cumplir las ecuaciones de Maxwell.
Hemos llegado a una idea importante: si la fórmula (1.1) es válida, las ecua-
ciones de Maxwell se cumplen únicamente para un observador inercial. Este
observador es especial, privilegiado.
Serı́a interesante averiguar la velocidad v de la Tierra respecto a O. Si dec-

imos que O0 es un laboratorio fijo en la Tierra, la ecuación (1.1) podrı́a
utilizarse para medir v: la anisotropı́a de la velocidad c0 indicarı́a la mag-
nitud de v. La gran dificultad experimental se centra en el hecho de que
en (1.1) ocurre la fracción v/c que, presumiblemente, es muy pequeña. En
efecto, las velocidades involucradas con nuestro planeta son muy bajas en
comparación con c; por ejemplo, la velocidad de la Tierra respecto al Sol es
tan sólo 30 km/s, es decir, 104 veces más pequeña que c. Se necesitarı́a un
instrumental sumamente fino para averiguar la v de la Tierra a través de la
fórmula (1.1). Ocurrı́a, felizmente, que a fines del siglo XIX los instrumentos
ópticos ya habı́an alcanzado un nivel de precisión suficiente.
1.3 El experimento de Michelson y Morley

El interferómetro de Michelson está capacitado para mostrar la supuesta
anisotropı́a de la velocidad c0 . La luz incide sobre un espejo semitranspar-
ente P colocado a 45o , de modo que en P emergen dos rayos perpendiculares.
Uno de los rayos va hacia el punto A, donde hay un espejo; el otro rayo va
hacia el punto B, donde hay otro espejo. Los rayos reflejados en los espejos
A y B se reúnen finalmente en una pantalla de observación, como muestra
la Figura 1.2.
En la pantalla se observa la interferencia de las señales que provienen de

los espejos que hay en A y B. Llamemos t0P AP al tiempo total que tarda
la luz para recorrer el trayecto P AP , y t0P BP para el trayecto P BP . La
interferencia en la pantalla depende del retardo t0P AP − t0P BP de una señal
respecto a la otra. Si t0P AP − t0P BP es un número entero de perı́odos, hay in-
terferencia constructiva y la pantalla muestra mucho brillo, alta intensidad.
Y si t0P AP − t0P BP es un número impar de semiperı́odos, se observa interfer-
encia destructiva: cero intensidad y pantalla opaca. En el experimento se usa
un interferómetro cuyos brazos P A y P B tienen la misma longitud L. Si la
velocidad c0 de la luz fuera la misma en todas las direcciones, la luz demor-
8
arı́a el mismo tiempo recorriendo los trayectos P AP y P BP , y se observarı́a
interferencia constructiva en la pantalla. Pero la fórmula (1.3) afirma que c0
es anisótropa y, en consecuencia, el retardo t0P AP − t0P BP también debe ser
anisótropo: esto significa que el grado de interferencia en la pantalla debe
depender de la orientación que se le dé al interferómetro.
Veamos el análisis que hace un observador en reposo respecto a la Tier-

ra. Llamamos α al ángulo formado por v y la dirección P A, como muestra
la Figura 1.2. Para el recorrido P A hacemos θ0 = α en la fórmula (1.3):
" r #
v v2
c0 = c − cos α + 1 − 2 sen2 α
c c
El tiempo que demora la luz en este trayecto es L/c0 :
" r #−1
L v v2
t0P A = − cos α + 1 − 2 sen2 α
c c c
Para el trayecto AP hacemos θ0 = α + π en la fórmula (1.3). Para el trayecto

P B hacemos θ0 = α + π/2 y para BP se tiene θ0 = α − π/2. Llegamos a
" r #−1
L v v2
t0AP = + cos α + 1 − 2 sen2 α
c c c
" r #−1
L v v2
t0P B = + sen α + 1 − 2 cos2 α
c c c
" r #−1
L v v2
t0BP = − sen α + 1 − 2 cos2 α
c c c
El retardo t0P AP − t0P BP es la diferencia (t0P A + t0AP ) − (t0P B + t0BP ):
"r r #
2L/c v2 v2
t0P AP − t0P BP = 1 − 2 sen2 α − 1 − 2 cos2 α (1.4)
1 − v 2 /c2 c c
9
Al mirar esta ecuación, concentremos nuestra atención en tres de las vari-
ables que en ella participan: t0P AP − t0P BP corresponde al grado de interfer-
encia, α es la orientación que se le da al interferómetro y v es la velocidad de
la Tierra. Escogiendo un α y midiendo el grado de interferencia, deberı́amos
ser capaces de deducir el valor de v. El problema es que el grado de inter-
ferencia no es una cantidad fácil de medir. Por tal motivo, no es aconsejable
que se use un sólo valor de α, sino permitir que α tome todos los valores
dentro de un rango continuo. En tal caso nos interesa tomar la derivada de
t0P AP − t0P BP respecto a α:
d 0
(t − t0P BP ) =
dα P AP  
(Lv 2 /c3 ) sen 2α  1 1  (1.5)
− r + r 
1 − v /c2 2  2 2 
v v
1 − 2 sen2 α 1 − 2 cos2 α
c c
Podrı́amos utilizar esta ecuación si α cambiara a medida que pasa el tiempo,

es decir, si el interferómetro, como un todo, se hiciera rotar continuamente.
En tales circunstancias el patrón de interferencia deberı́a ir cambiando a
medida que pasa el tiempo. Michelson y Morley efectivamente montaron
el interferómetro sobre un “lago” de mercurio, lo que les permitió rotar-
lo suave y continuamente. ¿Qué esperaban ellos? Ellos esperaban que, a
medida que rotaran el espectrómetro, el patrón de interferencia fuera cam-
biando paulatinamente. Pero, para su sorpresa, el patrón de interferencia
permaneció inmutable, sin mostrar ningún cambio paulatino. Esto significa
que la derivada (1.5) tiene que ser cero para todos los valores del ángulo α.
Haciendo (1.5) igual a cero se llega a:
r r
2 v2 v2
v 1 − 2 cos2 α = −v 2 1− sen2 α (1.6)
c c2
Esta ecuación corresponde al resultado experimental. Hay dos posibilidades:

La primera es v = 0. La segunda posibilidad es v 6= 0; pero si v 6= 0 la
ecuación (1.6) es absurda; no puede ser válida, porque implica que una can-
tidad positiva iguale a una cantidad negativa.
La única implicación válida de (1.6) es v = 0. Esta conclusión dice que
10
la Tierra estarı́a en reposo respecto al éter; la Tierra serı́a ese único y priv-
ilegiado observador en el que se cumplen las ecuaciones de Maxwell, ese
observador en el que la velocidad de la luz es isótropa. Eso es increı́ble.
Como el análisis de los resultados del experimento conduce a una conclusión

increı́ble, nos vemos impulsados a pensar que alguna de las suposiciones en
que se basa el análisis está probablemente equivocada. Volviendo sobre los
pasos del estudio recién hecho, nos damos cuenta de que la suposición (1.1)
es el paso débil, el que podemos abandonar. De ahora en adelante vamos a
pensar que (1.1) es falsa. En nuestro haber tenemos un hecho experimental
y una guı́a teórica:
El hecho experimental: la velocidad de la luz es isótropa respecto a la Tierra.

La guı́a teórica: la ecuación (1.1) es falsa.
El hecho experimental trae consigo una pregunta inmediata: ¿acaso el plan-

eta Tierra es el único observador respecto al cual la velocidad de la luz es
isótropa? Nos parece prudente responder de esta manera: No vemos ninguna
razón que nos lleve a pensar que este planeta es especial; si la velocidad de
la luz es isótropa respecto al observador inercial O0 , se espera que también
sea isótropa respecto a todos los otros observadores inerciales O00 , O000 , ...etc:
todas las velocidades c, c0 , c00 , c000 , ... etc. deben ser isótropas. Demos un salto
adicional: supongamos que c = c0 = c00 = c000 ... El salto, en palabras, dice
que la velocidad de la luz es la misma para todos los observadores inerciales.
Este enunciado es El Principio de la Constancia de la Velocidad de la Luz.
De otro lado, la frase escrita en bastardilla en la página 8 señala que la

ecuación (1.1) es un impedimento; si ahora adoptamos la guı́a teórica recién
mencionada, desaparece el impedimento y se nos abre un camino interesante:
la posibilidad de que las ecuaciones de Maxwell sean válidas para todos los
observadores inerciales.
1.4 La transformación de Galileo

El siguiente conjunto de ecuaciones:
t0 = t
(1.7)
r0 = r − v t
11
recibe el nombre de la transformación de Galileo 7 . Tomando una derivada
temporal se llega a la fórmula galileana para la adición de velocidades:
u0 = u − v , (1.8)
y tomando otra derivada temporal:
a0 = a (1.9)
Estas ecuaciones son tradicionales en la fı́sica clásica. Han tenido gran pres-
tigio por dos razones: primero, porque la ecuación (1.8) es cercana a nuestra
intuición, nos parece “natural” y razonable; y segundo, porque la teorı́a de la
mecánica newtoniana es invariante bajo las transformaciones (1.7). Nótese
de paso que haciendo u = c y u 0 = c 0 , la ecuación (1.8) se convierte en
(1.1). Esto muestra que en el fondo de (1.1) está (1.8); dado que queremos
abandonar (1.1), lo que verdaderamente queremos abandonar es la transfor-
mación de Galileo (1.8). La teorı́a de la relatividad repudia la transformación
de Galileo.
Queremos substituir la transformación de Galileo por otra que esté de acuer-

do con la isotropı́a de u 0 que resulta en el experimento de Michelson y Mor-
ley. Para encontrar la nueva transformación nos basaremos en estos tres
postulados:
1) El Principio de la Constancia de la Velocidad de la Luz.

2) El Principio de la Relatividad. (1.10)
3) El Principio de la Homogeneidad del Espacio y el Tiempo.
Las próximas secciones están dedicadas a la descripción de estos tres postu-

lados.
1.5 La constancia de la velocidad de la luz

La velocidad de la luz en el vacı́o es la misma para todos los observadores
inerciales: éste es el principio de la constancia de la velocidad de la luz.
7
Ası́ la llamó Philipp Frank en 1909.
12
El sentido de este principio se puede entender con el siguiente ejemplo.
Supongamos que alguien apunta una linterna hacia el norte, la prende, y
un instante después la apaga; de este modo se forma un pulso de luz que
viaja hacia el norte. La velocidad de este pulso es 300.000 km/s. Pensemos
en un observador inercial que también viaja hacia el norte en un cohete de
alta velocidad; si este observador mide la velocidad del pulso de luz, obtiene
300.000 km/s. Pensemos en otro observador inercial que viaja hacia el sur
en un cohete de alta velocidad; si este observador mide la velocidad del pul-
so de luz, obtiene 300.000 km/s. Pensemos aún en otro observador inercial
que viaja hacia el oriente; si mide la velocidad del pulso de luz, obtiene
300.000 km/s. Todos los observadores inerciales, los lentos, los veloces, los
que viajan en esta dirección, los que viajan en esa otra dirección, todos ellos
registran que la velocidad del pulso de luz es 300.000 km/s. Cualquiera que
sea el estado de movimiento del observador inercial, él siempre registra que
la velocidad del pulso es 300.000 km/s. Si el observador persigue al pulso
con intención de darle alcance, nunca lo logra, porque el pulso se aleja con
velocidad 300.000 km/s. Y si el observador huye del pulso de luz, de nada
le vale viajar muy rápido porque el pulso siempre tendrá velocidad 300.000
km/s.
El principio que estamos discutiendo afirma que la velocidad de la luz es

independiente de la velocidad relativa entre el observador y la fuente de luz.
Si este principio es válido, el resultado del experimento de Michelson y Mor-
ley no presenta ninguna paradoja y es enteramente entendible: la luz tiene
la misma velocidad en los dos brazos del interferómetro y por consiguiente
tarda lo mismo en recorrer ambas rutas, o sea que las franjas de interferencia
no tienen por qué mostrar variaciones. No hay tal cosa como “la velocidad de
la luz respecto al éter”, éste queda devaluado y se puede incluso considerar
la posibilidad de erradicarlo de la fı́sica.
1.6 El principio de la relatividad

La experiencia de viajar en automóvil en lı́nea recta y a velocidad constante
es muy simple: no se siente nada especial. Uno puede comer, tomar café y
recoger un lápiz que se cayó, del mismo modo como se realizan esas activi-
dades en casa. En realidad las experiencias en el carro y en casa son iguales.
Estamos poniendo de manifiesto una de las observaciones más importantes
de la fı́sica, al establecer que todos los observadores inerciales son equiva-
lentes. Esto, que ningún observador inercial es preferido, es lo que afirma el
13
Principio de la Relatividad: lo que ocurre para un observador inercial tam-
bién puede ocurrir para cualquier otro observador inercial. Las leyes de la
fı́sica son las mismas para todos los sistemas inerciales.
¿Cómo se aplica este principio, de qué modo se implementa en las ecua-

ciones de la fı́sica? Para responder esta pregunta presentemos un ejemplo: la
ley de la conservación del momentum debe ser válida en todos los sistemas
inerciales. Esta ley de conservación se expresa mediante una ecuación; lo que
el principio de la relatividad afirma es que tal ecuación se cumple para todos
los observadores inerciales. Más concretamente, pensemos en el choque de
dos partı́culas, llamando pa al momentum total antes del choque, y pd al mo-
mentum total después del choque. La ley de la conservación del momentum
dice que
pa = pd (1.11)
Esto es lo que registra un observador inercial O. Ahora introducimos otro

observador inercial O0 . El nuevo observador registra que el momentum antes
del choque es p0a , y después p0d ; este observador también registra que se
conserva el momentum:
p0a = p0d (1.12)
Nótese que las ecuaciones (1.11) y (1.12) tienen la misma forma. La ecuación
que expresa la ley de conservación tiene la misma forma para todos los
observadores inerciales. Este ejemplo del choque de dos partı́culas nos ha
servido para ver la manera como se expresa, formalmente, el principio de
la relatividad: las ecuaciones que representan las leyes de la fı́sica tienen la
misma forma para todos los observadores inerciales.
1.7 Homogeneidad del espacio y el tiempo

La observación directa nos permite afirmar que la Luna da una vuelta alrede-
dor de la Tierra en 28 dı́as, y ésta da una vuelta alrededor del Sol en 365
dı́as. Si el sistema solar en pleno se trasladara a otro lugar B del universo,
allá funcionarı́a como funciona aquı́, sin ninguna modificación: la “nueva”
Luna tomarı́a 28 dı́as para darle una vuelta a la “nueva” Tierra, y ésta darı́a
una vuelta alrededor del “nuevo” Sol en 365 dı́as. Pensamos que el sistema
solar funcionarı́a lo mismo en un lugar A y en otro B. Respecto al tiempo
14
tenemos una idea similar: si el sistema solar se trasladara en pleno al futuro
o al pasado, funcionarı́a como funciona ahora, sin ninguna modificación.
Conviene anotar que las ideas recién expresadas se basan en la suposición

de que el sistema solar está aislado del exterior, o al menos suficientemente
aislado. En general, cualquier sistema aislado funcionarı́a lo mismo si se le
trasladara en el espacio, y también funcionarı́a lo mismo si se le trasladara
en el tiempo. Dicho de otra manera, todos los puntos del espacio son equiv-
alentes, y todos los instantes son equivalentes: éste es el principio de la
homogeneidad del tiempo y el espacio.
Las interacciones que se dan entre los objetos fı́sicos que pueblan el universo
hacen que en un lugar ocurran fenómenos diferentes de los que ocurren en
otro lugar: no es lo mismo pararse en la superficie de la Luna y pararse en
la superficie de la Tierra. La diferencia entre estos dos lugares no indica
que esos puntos del espacio sean inequivalentes; la diferencia proviene de las
interacciones que se dan entre los objetos fı́sicos que hay en el universo.
1.8 El concepto de observador

Las coordenadas (x, y, z) de los puntos del espacio se pueden establecer con
relojes y pulsos de luz, como explicaremos enseguida. En un punto del espa-
cio tenemos un reloj; enviamos un pulso de luz a otro punto donde hay un
espejo, y esperamos a que el pulso regrese al punto inicial. Registramos el
tiempo ∆t que toma el pulso en el viaje total de ida y vuelta, y finalmente
decimos que la distancia entre los dos puntos es 12 c∆t. De esta manera se
establecen las distancias entre todos los puntos y podemos calibrar o marcar
las escalas de los tres ejes cartesianos. Todo punto en el espacio se caracter-
iza por medio de sus tres coordenadas (x, y, z).
Ahora suponemos que en todo punto del espacio hay un reloj en reposo,
formándose ası́ una gran red tridimensional, rı́gida e infinita. A esta gran
malla rı́gida de relojes se le llama observador. Si suponemos que todos los
relojes son igualmente construidos, podemos afirmar que marchan a la mis-
ma frecuencia. A pesar de que tengan la misma frecuencia, los relojes podrı́an
estar descuadrados, es decir, podrı́a ser que marquen horas diferentes por
haber comenzado a marchar en diferentes instantes. Es preciso sincronizar-
los. Para sincronizar dos relojes, el reloj uno envı́a un pulso de luz hacia el
reloj dos, y mide el tiempo ∆t que tarda el pulso en ir y regresar. Supong-
15
amos que ∆t = 6 minutos. Más tarde, cuando en el reloj uno sean las 3:57
p.m., el reloj uno envı́a otra señal luminosa hacia el reloj dos con la siguiente
instrucción: “en el instante en que reciba esta señal, cuadre las manecillas de
su reloj en la hora 4:00 p.m.”. De esta manera se pueden sincronizar todos
los relojes de un observador inercial. En lo sucesivo, siempre que hablemos
de observador inercial, hemos de entender que sus relojes están sincroniza-
dos.
Veamos de qué manera este observador registra el vuelo de una partı́cula

puntual. A medida que transcurre el tiempo, la partı́cula visita un punto, y
otro, y otro, y los relojes de los puntos visitados registran a qué hora fueron
visitados. Luego se recogen todos los registros y se reconstruye la trayec-
toria: la partı́cula pasó por tal punto en tal instante, pasó por aquel otro
punto en este otro instante, etc. Ası́ se establece la posición de la partı́cula
como función del tiempo. Nótese que los relojes no necesitan enviar datos a
un computador central ni hay un reloj principal: el observador no es un ser
humano que usa la vista, sino que es un látice infinito con un reloj en cada
punto.
Llamemos O a un observador inercial, y O0 a otro observador inercial que

se mueve con cierta velocidad (constante) v respecto a O. Nos imaginamos
dos mallas de relojes, una para O y otra para O0 ; las dos mallas se cuelan
una a través de la otra, y cada una de ellas tiene su propio sistema de co-
ordenadas. En cada punto del espacio hay dos relojes, uno pertenece a O
y el otro pertenece O0 , de manera que el de O0 se desplaza con velocidad
v respecto al de O. Podemos pensar que hay un número infinito de obser-
vadores inerciales, y cada uno es una malla rı́gida de relojes; estas mallas
se cuelan unas entre las otras; en cada punto del espacio hay un número
infinito de relojes que pertenecen a todos los observadores inerciales. Todos
los observadores inerciales son igualmente dignos, no hay ninguno preferido,
todos registran las mismas leyes de la fı́sica: las ecuaciones que expresan las
leyes de la fı́sica tienen la misma forma para todos estos observadores.
Como todos los observadores inerciales están en un plano de igualdad, no

habiendo ninguno que sea especial, desaparecen las nociones de espacio y
tiempo absolutos. Cada observador tiene pleno derecho a medir distancias
y tiempos, y los resultados de sus mediciones son distancias verdaderas y
tiempos verdaderos. Aquı́ se establece una diferencia radical con la fı́sica
preeinsteiniana. En esa fı́sica la variable t se refiere al tiempo absoluto, ese
flujo imperturbable dentro del cual se suponı́a que las cosas del mundo fı́sico
16
están inscritas. En la relatividad especial t es lo que marca un reloj.
Nota. Antes de concluir esta sección queremos hacer un comentario ac-

erca de la velocidad que puede tener un observador inercial respecto a otro.
El lector notará, obviamente, que esta nota desubicada introduce un elemen-
to de desorden, pero aún ası́ queremos presentarla desde ya, porque pronto
nos será útil. Supongamos que deseamos acelerar una partı́cula masiva con
el propósito de que adquiera la velocidad de la luz c. Tal como veremos en
la sección 3.5, cuando estudiemos la dinámica relativista, para realizar este
proceso habrı́a que darle a la partı́cula una energı́a infinita, y por eso es
imposible: no se puede acelerar una partı́cula masiva hasta darle la veloci-
dad c. Esta afirmación está de acuerdo con el hecho de que no se observan
partı́culas masivas que viajen a la velocidad de la luz. Los laboratorios (los
laboratorios constan de objetos masivos como relojes) tienen velocidades que
son menores que c: la velocidad relativa entre dos observadores inerciales es
siempre menor que c.
1.9 Transformaciones de coordenadas

Un evento es un punto en el espaciotiempo. Un evento no es un suceso,
no es algo que ocurre, sino que es un simple punto en el cuadriespacio. En
un evento pueden ocurrir fenómenos, como por ejemplo la desintegración
de una partı́cula. Para caracterizar un evento, el observador O usa cuatro
números (t, x, y, z) de la manera siguiente; supongamos que una partı́cula
se desintegra en el evento (9,2,4,6); esto quiere decir que el fenómeno ocurre
en aquel lugar cuyas coordenadas espaciales son (2,4,6) y que el reloj que se
encuentra en ese punto marca t = 9 en el instante de la desintegración.
Ası́ como en la sección anterior, pensemos en dos observadores inerciales

O y O0 tales que el segundo se mueve respecto al primero con cierta ve-
locidad (constante) v . Un evento cualquiera, genérico, tiene coordenadas
(t, x, y, z) en el sistema O y tiene coordenadas (t0 , x0 , y 0 , z 0 ) en el sistema O0 .
Con t y t0 queremos decir que en el sitio y en el instante del evento hay dos
relojes que pertenecen a O y O0 .
(t, x, y, z) y (t0 , x0 , y 0 , z 0 ) son las coordenadas de un mismo evento para dos

observadores diferentes. Debe existir una manera de averiguar las cuatro
coordenadas (t0 , x0 , y 0 , z 0 ) cuando se conocen v y las cuatro coordenadas
(t, x, y, z). Pero, y aquı́ radica la importancia, no se trata de encontrar
17
las fórmulas de conexión para un evento particular, sino las fórmulas de
conexión para todos los eventos; en términos matemáticos, se debe recono-
cer que (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) son variables algebraicas. Las coordenadas
primadas deben ser funciones de las no primadas:
t0 = t0 (v , t, x, y, z)
x0 = x0 (v , t, x, y, z)
(1.13)
y 0 = y 0 (v , t, x, y, z)
z 0 = z 0 (v , t, x, y, z)
A cualquier conjunto de cuatro ecuaciones como (1.13) se le llama transfor-

mación de coordenadas. Hay, por supuesto, un número infinito de transfor-
maciones de coordenadas, pero sólo una es verdadera. Es decir, hay sólo una
transformación que verdaderamente corresponde a los registros de las dos
mallas infinitas de relojes (la red primada y la no primada).
En las próximas secciones concentraremos el esfuerzo en encontrar la trans-

formación verdadera. Ese es nuestro propósito a corto plazo. No podemos
olvidar, sin embargo, el propósito a largo plazo, el gran objetivo del proyec-
to relativista: que se cumpla el principio de la relatividad: que las leyes de
la fı́sica se expresen mediante ecuaciones que tengan la misma forma para
todos los observadores inerciales. Por ejemplo, para los observadores O y O0
la ecuación de Maxwell ∇ · B = 0 se escribe
∂Bx ∂By ∂Bz

+ + = 0
∂x ∂y ∂z
∂Bx0 ∂By0 ∂Bz0

+ + = 0
∂x0 ∂y 0 ∂z 0
Debemos ser capaces de pasar de una ecuación a la otra: que las dos ecua-
ciones sean equivalentes. Para que se pueda ejecutar la conversión de una
de las ecuaciones en la otra, la teorı́a de la relatividad debe suministrar:
1) La fórmula que permita averiguar las variables (Ex0 , Ey0 , Ez0 , Bx0 , By0 , Bz0 )
cuando se conocen las (Ex , Ey , Ez , Bx , By , Bz ) (a esa fórmula se le dice “la
transformación del campo electromagnético”, y la deduciremos en el capı́tu-
lo 4).
18
µ ¶
∂ ∂ ∂
2) La fórmula que permita averiguar las variables , , cuan-
µ ¶ ∂x0 ∂y 0 ∂z 0
∂ ∂ ∂
do se conocen las , , . Más precisamente, la fórmula que permite
∂x ∂y ∂z
averiguar las variables (t0 , x0 , y 0 , z 0 ) cuando se conocen las (t, x, y, z); esta
fórmula se llama “la transformación verdadera de las coordenadas”, y la de-
duciremos enseguida.
El propósito 2) de encontrar la transformación verdadera de coordenadas

es válido de por sı́; pero ese propósito cobra una gran importancia cuan-
do se inscribe dentro del principio de la relatividad 1), que pide que las
ecuaciones que expresan las leyes de la fı́sica sean las mismas para todos los
observadores inerciales (que las ecuaciones sean invariantes). La transforma-
ción verdadera de coordenadas deja invariantes las ecuaciones que describen
las leyes de la fı́sica.
Hay dos métodos para encontrar la transformación verdadera de coorde-

nadas:
Método a): Acudir a las ecuaciones que expresan las leyes de la fı́sica y
averiguar la transformación de coordenadas que las deja invariantes (esta
ruta se explora en el apéndice).
Método b): Establecer un conjunto de primeros principios, como por ejemplo

(1.10), deducir una transformación de coordenadas a partir de ellos y luego
estudiar si las ecuaciones de las leyes fı́sicas son covariantes: si lo son, en-
tonces la transformación es muy probablemente la transformación verdadera
de coordenadas.
En la próxima sección seguiremos el método b) y encontraremos:
v
t− 2 x
t0 = p c
1 − v 2 /c2
x − vt
x0 = p (1.14)
1 − v 2 /c2
y0 = y
z0 = z
19
Einstein dedujo estas transformaciones en su célebre artı́culo [2] de 1905
en el que funda la relatividad especial. Ellas son quizá las ecuaciones más
importantes de la fı́sica del siglo XX, y se conocen como las transforma-
ciones de Lorentz. El origen de este nombre es curioso, porque las ecuaciones
(1.14) ya habı́an sido obtenidas, usando el método a), por Hendrik Antoon
Lorentz [4] unos meses antes, cuando el holandés probó la covariancia de los
campos eléctrico y magnético bajo la transformación (1.14) (sin embargo,
por un error de cálculo, sólo pudo probar la covariancia hasta primer orden
en v/c). Einstein, que no conocı́a este trabajo de Lorentz, dedujo indepen-
dientemente las transformaciones (1.14). Lorentz no le dio al t0 de estas
ecuaciones la importancia que luego habrı́a de lograr en la relatividad; en
efecto, Lorentz pensaba en 1904 que mientras t es el tiempo verdadero, la
variable t0 era simplemente una cantidad auxiliar.
1.10 Las transformaciones de Lorentz

Einstein [2] se basa en los tres principios (1.10) para derivar las transforma-
ciones de Lorentz. Aquı́ seguiremos la presentación de Resnick [6] que nos
parece más ordenada y pedagógica. Ası́ como en las secciones anteriores,
suponemos que la velocidad de separación v es paralela al eje común xx0 .
Comencemos el estudio demostrando que las ecuaciones (1.13) deben ser

lineales. Para tal efecto consideremos dos eventos que son iguales en todo,
excepto en la coordenada x; en estas condiciones podemos decir que los dos
eventos son (t, x, y, z) y (t, x + δx, y, z). Asumiendo que δx es infinitesimal
nos preguntamos cuál es la separación δx0 de acuerdo con el observador O0 .
Tomando diferenciales δ en la segunda de las ecuaciones (1.13) escribimos:
∂x0 ∂x0 ∂x0 ∂x0

δx0 = δt + δx + δy + δz,
∂t ∂x ∂y ∂z
pero δt = δy = δz = 0, entonces
∂x0
δx0 = δx (1.15)
∂x
La homogeneidad del espacio nos permite afirmar que, para un δx dado, el
20
valor δx0 debe ser igual en todas las regiones del espacio, o sea que ∂x0 /∂x
debe ser independiente de x, y, z. Ası́ mismo, la homogeneidad del tiem-
po dice que δx0 debe ser igual en todas las épocas, o sea que ∂x0 /∂x es
independiente del tiempo. En conclusión, la derivada ∂x0 /∂x es una con-
stante. Consideraciones parecidas, invocando la homogeneidad del espacio
y del tiempo, nos llevan a afirmar que ∂x0 /∂t, ∂x0 /∂y, ∂x0 /∂z son también
constantes. La segunda función (1.13) debe ser:
x0 = a10 t + a11 x + a12 y + a13 z, (1.16)
con a10 , a11 , a12 , a13 constantes. Se puede repetir este razonamiento para
las otras tres funciones de (1.13), con resultados similares a (1.16):
t0 = a00 t + a01 x + a02 y + a03 z (1.17)

0
x = a10 t + a11 x + a12 y + a13 z (1.18)
0
y = a20 t + a21 x + a22 y + a23 z (1.19)
0
z = a30 t + a31 x + a32 y + a33 z (1.20)
Aquı́ los 16 coeficientes aµν son constantes. Ahora procedemos a averiguar

los valores de estos coeficientes utilizando los tres principios (1.10). Primero
vamos a averiguar los ocho coeficientes de las dos últimas ecuaciones (1.19)
y (1.20), y luego atacaremos las dos primeras ecuaciones (1.17) y (1.18).
Los puntos que pertenecen al eje x (los que tienen y = z = 0) también

pertenecen al eje x0 , es decir, tienen y 0 = z 0 = 0. Formalmente, las condi-
ciones {y = z = 0} y {y 0 = z 0 = 0} se implican mutuamente:
{y = z = 0} ⇔ {y 0 = z 0 = 0}
De aquı́ podemos concluir que a20 = a21 = a30 = a31 = 0.
Los puntos que pertenecen al plano xy (los que tienen z = 0) también

pertenecen al plano x0 y 0 , es decir, tienen z 0 = 0. Formalmente:
z=0 ⇔ z0 = 0
21
De aquı́ se deduce que a32 = 0. Un razonamiento similar (con el plano xz)
nos lleva a que a23 = 0 .
Vamos a probar que a22 = 1 al comparar estas dos situaciones:
Situación 1: En t = 0 hay una varilla en reposo respecto a O parada en

el eje y, con sus extremos en los puntos y = 0 y y = L; o sea que los dos
extremos tienen coordenadas no primadas (0, 0, 0, 0) y (0, 0, L, 0). Veamos
de qué manera el observador O0 registra este objeto: claramente se trata de
una varilla que viaja hacia la izquierda y cuyos extremos tienen, de acuerdo
con (1.19), coordenadas primadas y 0 = 0 y y 0 = a22 L.
Situación 2: En t0 = 0 hay una varilla en reposo respecto a O0 parada

en el eje y 0 , con sus extremos en los puntos y 0 = 0 y y 0 = L; o sea que los
dos extremos tienen coordenadas primadas (0, 0, 0, 0) y (0, 0, L, 0). Veamos
de qué manera el observador O registra este objeto: claramente se trata de
una varilla que viaja hacia la derecha y cuyos extremos tienen, de acuerdo
con (1.19), coordenadas no primadas y = 0 y y = L/a22 .
De acuerdo con el principio de la relatividad (1.10), la Situación 1 y la

Situación 2 son equivalentes. Entonces a22 L = L/a22 , de donde a22 = 1. Un
análisis parecido nos permitirá concluir que a33 = 1. Ya hemos averiguado
los ocho coeficientes de las ecuaciones (1.19) y (1.20), ecuaciones que ahora
se escriben:
y0 = y , z0 = z (1.21)
Nos falta estudiar las ecuaciones (1.17) y (1.18). Comencemos considerando

dos eventos (t, x, y, z) y (t, x, −y, z). Por la homogeneidad del espacio, ambos
eventos deben tener la misma coordenada temporal t0 . En vista de (1.17)
concluimos que a02 = 0. Un análisis parecido nos conduce a que a03 = 0.
Hasta el momento la ecuación (1.17) se ha convertido en
t0 = a00 t + a01 x (1.22)
Pensemos en los eventos del plano x = 0; de acuerdo con la ecuación (1.22),

los eventos de este plano cumplen la ecuación t0 = a00 t. Para estos eventos
la condición t > 0 debe implicar que t0 > 0, o sea que a00 debe ser positiva:
22
a00 > 0 (1.23)
Sean (T, X, Y, Z) las coordenadas no primadas de un evento cualquiera en

el plano x0 = 0. Haciendo x0 = 0 en (1.18) escribimos:
a10 T + a11 X + a12 Y + a13 Z = 0 (1.24)
Si hacemos T = X = 0 en (1.24) se obtiene
a12 Y + a13 Z = 0
Como esta última ecuación debe cumplirse para todos los (arbitrarios) val-
ores de Y y de Z, entonces a12 = a13 = 0. Con este resultado regresamos a
(1.24) para escribir
a10 T + a11 X = 0 (1.25)
No olvidemos que (T, X, Y, Z) pertenece al plano x0 = 0, cuyos puntos

cumplen la condición X = vT ; claramente la ecuación (1.25) dice que
a10 T + a11 v T = 0, de donde a10 = −va11 .
Hasta el momento la ecuación (1.18) se ha convertido en
x0 = a11 (x − vt) (1.26)
Demostraremos enseguida que a11 debe ser positiva. Para tal efecto consid-
eremos aquellos eventos que están a la derecha del origen de O0 ; esos eventos
cumplen las condiciones x0 > 0 y x > vt. En otras palabras, x > vt ⇒ x0 > 0.
Al poner esto en (1.26) encontramos:
a11 > 0 (1.27)
Hagamos un resumen de lo que hemos averiguado hasta el momento:
23
t0 = a00 t + a01 x
x0 = a11 (x − vt)
(1.28)
y0 = y
z0 = z
Hasta aquı́ se llega usando los principios de la relatividad y de la homogenei-

dad del espacio y del tiempo. Pero todavı́a hay tres coeficientes desconocidos
a00 , a01 , a11 , o sea que (1.28) no es una transformación particular, sino una
familia de transformaciones. Para individualizar una transformación partic-
ular es necesario dar los valores de a00 , a01 y a11 , lo que se logra imponiendo
alguna condición suplementaria.
Por ejemplo, la transformación de Galileo (1.7) pertenece a la familia de

transformaciones (1.28). Para obtener Galileo a partir de (1.28) se impone
la condición suplementaria a01 = 0, a00 = a11 = 1.
La transformación de Lorentz también pertenece a la familia de transforma-

ciones (1.28). Einstein obtiene la transformación de Lorentz usando, como
condición suplementaria, el principio de la constancia de la velocidad de la
luz. En efecto, tal como veremos enseguida, al implementar este principio
quedan unı́vocamente determinados los tres coeficientes a00 , a11 , a01 .
Supongamos que un pulso de luz sale del origen de coordenadas cuando

los orı́genes de O y O0 coinciden. Un tiempo después, este pulso llega a un
evento E. Las coordenadas no primadas de E son (t, x, y,pz), y las primadas
son (t0 , x0 , y 0 , z 0 ). Para O la velocidad del 2 2 2
p pulso es c = x + y + z /t, y
2 2 2
para O0 la velocidad del pulso es c0 = x0 + y 0 + z 0 /t0 . Pero c0 = c, por
el principio de la constancia de la velocidad de la luz:
p
x2 + y 2 + z 2
c =
p t
x + y02 + z02
0 2
c =
t0
Estas dos ecuaciones pueden escribirse ası́:
c2 t2 − (x2 + y 2 + z 2 ) = 0 (1.29)
2 2 2 2
c2 t0 − (x0 + y 0 + z 0 ) = 0 (1.30)
24
Usar ahora las cuatro ecuaciones (1.28) en (1.30) para que (1.30) quede en
términos de cantidades no primadas:
(c2 a200 − v 2 a211 )t2 − (a211 − c2 a201 )x2 − y 2 − z 2

(1.31)
+ 2 (c2 a00 a01 + va211 ) xt = 0
Vamos a comparar, término a término, las ecuaciones (1.29) y (1.31); igua-

lando los coeficientes correspondientes se llega a:
c2 a200 − v 2 a211 = c2
a211 − c2 a201 = 1
c2 a00 a01 + va211 = 0
Este es un sistema de tres ecuaciones para las tres incógnitas a00 , a01 , a211 .
Hay dos soluciones:
Primera solución:
1 v/c2 1
a211 = , a01 = p , a00 = − p
1 − v 2 /c2 1 − v 2 /c2 1 − v 2 /c2
Segunda solución:
1 v/c2 1
a211 = , a01 = − p , a00 = p
1 − v 2 /c2 1− v 2 /c2 1 − v 2 /c2
En vista de (1.23), la primera solución está descartada. Adoptamos entonces

la segunda solución, utilizando (1.27) al tomar la raı́z cuadrada de a211 :
1 v/c2
a11 = a00 = p , a01 = − p
1 − v / c2 1 − v / c2
p
He aquı́ el factor 1/ 1 − v 2 /c2 , que aparece innumerables veces en la rela-
tividad. Tradicionalmente se le conoce como γ:
25
1
γ = p (1.32)
1 − v 2 /c2
Los tres coeficientes son, entonces, a11 = a00 = γ, a01 = −γv/c2 y el resul-
tado final de las transformaciones queda:
v
t0 = γ (t − x)
c2
x0 = γ (x − vt) (1.33)
y0 = y , z0 = z
Estas son las transformaciones de Lorentz. Las hemos presentado como una
consecuencia directa de los tres postulados de la relatividad, y en este sentido
ellas son del ámbito de la fı́sica teórica. Lo importante es que ellas también
son del ámbito de la fı́sica experimental: innumerables experimentos real-
izados durante el siglo XX han confirmado, una y otra vez, y sin ninguna
excepción, que las transformaciones de Lorentz son buenas.
Anotemos que las transformaciones de Lorentz se confunden con las de

Galileo a bajas velocidades. En efecto, las ecuaciones (1.33) se convierten
en (1.7) cuando v ¿ c. Esta observación deja en claro que la relatividad
especial abarca al pensamiento newtoniano, y que este último es un caso
lı́mite del pensamiento relativista. El espaciotiempo relativista es diferente
del newtoniano para todos los valores de v, pero la diferencia es notoria
únicamente a altas velocidades.
Si queremos expresar las coordenadas no primadas en términos de las pri-

madas, podemos resolver estas cuatro ecuaciones simultáneas y despejar
t, x, y, z. Pero hay otra manera más simple, que consiste en lo siguiente: en
cada una de las cuatro ecuaciones se cambia v por −v y se intercambian
coordenadas primadas y no primadas:
v 0
t = γ (t0 + x)
c2
x = γ (x0 + vt0 ) (1.34)
y = y0 , z = z0
Generalización. Hemos asumido que O0 se mueve, respecto a O, con

una velocidad v que apunta en la dirección del eje común x x0 . Enseguida
escribimos el caso [7] general, cuando v apunta en cualquier dirección:
26
1
t0 = γ(t − 2 v · r)
µc ¶ (1.35)
0 γ−1
r =r+ v · r − γt v
v2
1
t = γ(t0 + 2 v · r0 )
µc ¶ (1.36)
0 γ−1 0 0
r=r + v · r + γt v
v2
Los diferenciales. En diferenciales, las dos primeras ecuaciones (1.33)

son:
v
∆t0 = γ(∆t − ∆x) (1.37)
c2
∆x0 = γ(∆x − v∆t) (1.38)
Y las inversas proceden de (1.34):
v
∆t = γ(∆t0 + ∆x0 ) (1.39)
c2
∆x = γ(∆x0 + v∆t0 ) (1.40)
También podemos escribir las ecuaciones (1.35) en diferenciales:
1
∆t0 = γ(∆t − 2 v · ∆r) (1.41)
µc ¶
0 γ−1
∆r = ∆r + v · ∆r − γ∆t v (1.42)
v2
Las derivadas: A partir de las transformaciones (1.33) calculamos estas

seis derivadas:
∂t0 ∂x0 ∂t0 γv

= = γ, =− 2,
∂t ∂x ∂x c
(1.43)
∂x0 ∂y 0 ∂z 0
= −γv, = =1
∂t ∂y ∂z
Ahora, la regla de la derivación en cadena dice que
27
∂ ∂t0 ∂ ∂x0 ∂ ∂y 0 ∂ ∂z 0 ∂
= 0
+ 0
+ 0
+ ,
∂t ∂t ∂t ∂t ∂x ∂t ∂y ∂t ∂z 0
entonces, utilizando las derivadas (1.43):
∂ ∂ ∂
= γ 0 − γv 0 ,
∂t ∂t ∂x
que escribimos cortamente ∂t = γ ∂t0 − γv ∂x0 . De la misma manera se cal-

culan ∂x , ∂y , y ∂z :
∂t = γ ∂t0 − γv ∂x0
γv
∂x = γ ∂x0 − 2 ∂t0 (1.44)
c
∂y = ∂y0 ∂z = ∂z 0
c c'
q q' Luz
a
v
Figura 1.1 Las velocidades c, v Figura 1.2 Interferómetro de

y c 0 tales que c = v + c 0 Michelson. En P la luz se reparte
hacia A y B. Después de refle-
jarse en los espejos, los haces se
encuentran de nuevo en P y de
allı́ salen juntos hacia el detector.
28
y
x y'
z
x'
z'
Figura 1.3 Definición de los sis-

temas coordenados. Los ejes x y
x0 coinciden, los ejes y y y 0 son
paralelos y los ejes z y z 0 tam-
bién son paralelos. La velocidad
de separación v apunta en direc-
ción x.
29
30
Capı́tulo 2
Propiedades del espaciotiempo
En este capı́tulo nos proponemos estudiar las consecuencias más directas de

las transformaciones de Lorentz. La más importante se refiere a dos eventos
que son simultáneos para un observador: para otros observadores, en gen-
eral, esos dos eventos no son simultáneos. Directamente conectado con esto
aparece otro efecto curioso: la longitud de un objeto cualquiera depende,
en general, del estado de movimiento del observador que la registra. Las
implicaciones de estos dos resultados son inmediatas. Surge un conjunto de
definiciones y efectos de primera importancia: el tiempo propio, la longitud
propia, el modo como se adicionan velocidades y como se adicionan acelera-
ciones. Estos asuntos están cobijados por la idea central de la relatividad, la
gran idea que revolucionó el pensamiento cientı́fico: el espacio y el tiempo no
son independientes uno del otro, sino que forman un todo espaciotemporal.
Consideremos dos eventos E1 y E2 . El observador O registra que estos dos

eventos tienen coordenadas (t, r) y (t + ∆t, r + ∆r), respectivamente. Para
O0 las coordenadas1 de E1 y E2 son (t0 , r0 ) y (t0 + ∆t0 , r0 + ∆r0 ). La conexión
entre ∆t, ∆r, ∆t0 y ∆r0 está dada por las fórmulas (1.41) y (1.42).
Supongamos que para O la separación entre los dos eventos es puramente es-
pacial, es decir, ∆t = 0; las ecuaciones (1.41) y (1.42) muestran que para O0
los dos eventos tienen separaciones espacial y temporal. Ası́ mismo, supong-
amos que para O la separación entre los dos eventos es puramente temporal,
es decir, ∆r = 0; las ecuaciones (1.41) y (1.42) muestran que para O0 los dos
eventos tienen separaciones espacial y temporal. Vemos ası́ que el espacio
y el tiempo no son independientes uno del otro. Cada observador inercial
puede establecer un corte, un lindero, entre su espacio y su tiempo, pero el
1
Estamos mencionando cuatro relojes: los dos relojes de O marcan t y t + ∆t, y los dos
relojes de O0 marcan t0 y t0 + ∆t0 .
31
lindero que establece O es diferente al que establece O0 .
2.1 Las separaciones espacial y temporal son rel-

ativas
Las ecuaciones (1.41) y (1.42) muestran que, en general, ∆t0 6= ∆t; por esto
decimos que la separación temporal entre dos eventos es relativa. Ası́ mismo,
en general ∆r0 6= ∆r: la separación espacial también es relativa.
El adjetivo relativo se aplica a cualquier cantidad que, registrada por difer-

entes observadores, da resultados diferentes. También decimos que una can-
tidad es absoluta cuando, al registrarla diferentes observadores, todos ob-
tienen el mismo resultado. Acabamos de probar que en la relatividad es-
pecial las separaciones espacial y temporal no son absolutas, sino relativas.
Comparando, las transformaciones de Galileo (1.7) dan t02 − t01 = t2 − t1 y
x02 −x01 6= x2 −x1 . En palabras: en Galileo la separación temporal es absoluta
y la separación espacial es relativa.
2.2 El intervalo es absoluto

A pesar de que las separaciones espacial y temporal son relativas, hay una
función de ∆t y ∆r que resulta absoluta. Definamos:
∆s2 = c2 (∆t)2 − (∆r)2 (2.1)

2
∆s0 = c2 (∆t0 )2 − (∆r0 )2
En palabras: el cuadrado de la separación temporal menos el cuadrado de la

separación espacial. Enseguida probaremos que ∆s02 = ∆s2 . Para tal efecto
se eleva al cuadrado cada uno de los lados en las ecuaciones (1.41) y (1.42),
obteniéndose:
γ2
c2 (∆t0 )2 = γ 2 c2 (∆t)2 + (v · ∆r)2 − 2γ 2 ∆t(v · ∆r)
c2
γ2
−(∆r0 )2 = −(∆r)2 − (v · ∆r)2 + 2γ 2 ∆t(v · ∆r) − γ 2 v 2 (∆t)2
c2
Ahora sumar lado a lado estas dos ecuaciones:
32
c2 (∆t0 )2 − (∆r0 )2 = c2 (∆t)2 − (∆r)2 (2.2)
Es decir,
∆s02 = ∆s2 (2.3)
A ∆s2 se le llama intervalo. El intervalo es la separación espaciotemporal.

La separación espacial es relativa; la separación temporal es relativa; la sep-
aración espaciotemporal es absoluta.
En las geometrı́as euclidianas la definición de distancia involucra únicamente

signos +. Esto tiene una consecuencia importante: la distancia entre dos
puntos diferentes es siempre positiva; o sea que que si la distancia entre dos
puntos es cero es porque se trata, no de dos puntos, sino del mismo punto.
La geometrı́a del espaciotiempo no es euclidiana, porque el intervalo tiene
un signo − que es crucial. En el espaciotiempo la cantidad ∆s2 puede ser
positiva, negativa o cero; el intervalo entre dos eventos diferentes puede ser
cero.
2.3 Clases de intervalos

Cuando ∆s2 es positivo, cero o negativo, el intervalo es temporaloide, lumi-
noide o espacialoide, respectivamente. Vamos a estudiar por separado cada
uno de estos casos.
Intervalos temporaloides. Para que ∆s2 sea positivo debe cumplirse la

siguiente desigualdad:
c|∆t| > |∆r| (2.4)
Este intervalo tiene dos propiedades interesantes:
a) Un observador inercial que recorra el espacio ∆r en el lapso ∆t, debe

registrar que los dos eventos ocurren en el mismo punto del triespacio. Es-
cribamos la velocidad de este observador inercial:
∆r
v = (2.5)
∆t
33
Para verificar que esto es cierto, notemos que al colocar el valor v = ∆r/∆t
en (1.42) se obtiene ∆r0 = 0.
b) ¿Existe acaso un observador inercial O0 para el cual los dos eventos son
simultáneos? Respondamos esta pregunta averiguando la velocidad v que
deberı́a tener O0 . Al imponer la condición ∆t0 = 0 en (1.41) se obtiene
∆r
v· = c2 (2.6)
∆t
Sin embargo, la combinación de (2.4) y (2.6) implica que v tendrı́a que ser
mayor que c, lo que es imposible (ver la frase en bastardilla en la página
17). En conclusión: si dos eventos tienen intervalo temporaloide, ningún
observador registra que son simultáneos.
Intervalos espacialoides. Para que ∆s2 sea negativo debe cumplirse la

siguiente desigualdad:
|∆r| > c|∆t| (2.7)
Este intervalo tiene dos propiedades interesantes:
a) Los observadores inerciales que cumplen la condición
∆r
v· = c2
∆t
registran que los dos eventos son simultáneos. Podemos convencernos de que
esto es cierto de la manera siguiente: al poner v · (∆r/∆t) = c2 en (1.41) se
obtiene ∆t0 = 0.
b) ¿Existe acaso un observador inercial O0 para el cual los dos eventos

ocurren en el mismo punto r0 ? Respondamos esta pregunta averiguando
la velocidad v que deberı́a tener O0 . Al imponer la condición ∆r0 = 0 en
(1.42) se obtiene
µ ¶
γ−1
∆r + v · ∆r − γ∆t v = 0
v2
34
µ ¶
∆r γ−1 ∆r
= − v · − γ v (2.8)
∆t v2 ∆t
Multiplicar escalarmente ambos lados de esta ecuación por el vector v :
µ ¶
∆r ∆r 2
v· = − (γ − 1) v · − γv
∆t ∆t
∆r
0 = −v · + v2 (2.9)
∆t
El lado izquierdo de la ecuación (2.8) es un vector en dirección ∆r/∆t y el

lado derecho es un vector en dirección v ; para que la ecuación sea válida
es necesario que esos dos vectores sean paralelos o antiparalelos, o sea que
v · ∆r/∆t = ±|v||∆r/∆t|. Al poner este valor en la ecuación (2.9) se ob-
tiene |v| = ± |∆r/∆t|. El signo − es inadmisible, porque permitirı́a que una
cantidad positiva fuera igual a una negativa. Escogemos el signo +:
¯ ¯
¯ ∆r ¯
¯
|v| = ¯ ¯ (2.10)
∆t ¯
El problema es que la combinación de (2.7) y (2.10) implica que |v| ten-

drı́a que ser mayor que c, lo que es imposible (de nuevo, la frase escrita en
bastardilla en la página 17). En conclusión: si dos eventos tienen intervalo
espacialoide, ningún observador registra que ocurren en el mismo punto del
triespacio.
Intervalos luminoides. El intervalo entre dos eventos es cero si
c|∆t| = |∆r| (2.11)
Hay dos preguntas interesantes:
a) ¿Existe acaso un observador inercial O0 para el cual los dos eventos son
simultáneos? Respondamos esta pregunta averiguando la velocidad v que
deberı́a tener O0 . Al imponer la condición ∆t0 = 0 en (1.41) se obtiene (2.6).
Sin embargo, la combinación de (2.6) y (2.11) implica que v tendrı́a que
mayor que c, lo que es imposible.
35
b) ¿Existe un observador inercial O0 para el cual los dos eventos ocurren
en el mismo punto r0 ? Al imponer la condición ∆r0 = 0 en (1.42) se obtiene
la ecuación (2.10). El problema es que la combinación de (2.10) y (2.11)
implica que v tendrı́a que ser igual c, lo que es imposible.
En conclusión, cuando el intervalo entre dos eventos es luminoide, ningún

observador registra que son simultáneos y ningún observador registra que
ocurren en el mismo punto del triespacio.
2.4 La simultaneidad es relativa

Consideremos dos eventos que aparecen simultáneos para el observador O.
Haciendo ∆t = 0 en (1.41) encontramos
γ
∆t0 = − v · ∆r (2.12)
c2
Si v · ∆r 6= 0, entonces ∆t0 6= 0, lo que constituye una propiedad de primera

importancia: dos eventos que aparecen simultáneos para O pueden aparecer
simultáneos o no simultáneos para O0 , dependiendo de la dirección de la ve-
locidad v . Aparecen simultáneos para todos los observadores O0 que tengan
v perpendicular a ∆r, y aparecen no simultáneos a todos los O0 cuya v no
sea perpendicular a ∆r. Vemos ası́ que la simultaneidad no es absoluta, sino
relativa.
Desincronización de relojes. También se puede entender la fórmula

(2.12) en términos de desincronización de relojes, valiéndonos de la nota es-
crita al pie de la página 31. Los dos relojes de O están marcando la misma
hora; por ejemplo t = 3:29 a.m. Pero los dos relojes de O0 están marcando
horas diferentes; por ejemplo, el reloj primado en el primer evento marca t01
= 3:27 a.m., y el reloj primado en el segundo evento marca t02 = 3:31 a.m.
El observador O dice que todos sus relojes (los no primados) están de acuer-
do, es decir, están sincronizados; el observador O0 también dice que todos
sus relojes (los primados) están sincronizados. Pero O registra que los relo-
jes de O0 están desincronizados, y O0 registra que los relojes de O están
desincronizados.
36
2.5 Tiempo propio
Al estudiar los intervalos temporaloides vimos que la separación espacial
aparece nula para aquel observador O0 que tiene una velocidad dada por
(2.5). Veamos ahora cuál es la separación temporal ∆t0 que registra ese
observador O0 . Utilizando el resultado (2.5) en (1.41) se obtiene ∆t0 =
1
γ(∆t − 2 v · v ∆t) = γ(1 − v 2 /c2 )∆t. Este ∆t0 se llama tiempo propio y
c
se denota por medio del sı́mbolo ∆τ. En conclusión:
∆r0 = 0 (2.13)
p
∆τ = ∆t 1 − v 2 /c2 (2.14)
< ∆t (2.15)
La ecuación (2.2) se reescribe ası́:
c2 ∆τ 2 = c2 (∆t)2 − (∆r)2 + (∆r0 )2
En el lado derecho tenemos ∆r0 = 0 y (∆r)2 > 0, y esto implica necesari-

amente que ∆τ 2 < ∆t2 : el tiempo propio es el menor de los tiempos. Las
fórmulas (2.13), (2.14) y (2.15), que son de primera importancia, dan pie a
las siguientes dos observaciones:
1) El tiempo propio τ es un concepto que se aplica únicamente a inter-

valos temporaloides. Dado un intervalo temporaloide, existe un observador
que registra que los dos eventos ocurren en el mismo tripunto y con una sep-
aración temporal ∆τ. Otros observadores registran, en general, que los dos
eventos ocurren en lugares diferentes y con una separación temporal mayor
que ∆τ : el tiempo propio es el menor de los tiempos.
2) Regresemos a la nota al pie de la página 31. En general se trata de

cuatro relojes, pero el caso del tiempo propio es especial, ya que O0 usa
solamente un reloj. Es claro que para el observador primado los dos eventos
ocurren en un punto fijo del triespacio, y los dos tiempos t0 y t0 + ∆t0 los
registra aquel reloj primado que ocupa el tripunto. Llegamos ası́ a una clave
que puede ser útil en momentos de confusión: el tiempo propio τ lo mide un
solo reloj.
37
Medición de τ . Supongamos que los relojes se construyen con dos espejos
paralelos separados una distancia δ, y un pulso de luz que se refleja una y
otra vez en los espejos, como muestra la Figura 2.1. En cada tripunto de
O0 se encuentra, fijo, un reloj de estos. De acuerdo con O0 , el tiempo que el
pulso de luz tarda en regresar a uno de los espejos es
2δ
∆t0 =
c
Suponemos que este reloj tiene sus espejos paralelos al plano z 0 x0 . Para O
el viaje del pulso de luz es como en qla lı́nea punteada de la Figura 2.2; el
¡1 ¢2
recorrido total es dos hipotenusas: 2 δ 2 + 2 v∆t , o sea que ∆t viene dado
por:
q ¡ ¢2
2 δ 2 + 12 v∆t
∆t =
c
Despejar (∆t)2 para obtener
µ ¶
2δ 2
c
(∆t)2 =
1 − v 2 /c2
∆t0
∆t = p
1 − v 2 /c2
Los dos eventos (salida y regreso del pulso) se registran de manera difer-
ente por los dos observadores. Para O los dos eventos ocurren en puntos
diferentes, o sea que los registran relojes diferentes. Para O0 los dos eventos
ocurren en el mismo punto, o sea que los registra el mismo reloj: tiempo
propio.
Partı́cula libre. Veremos en la sección 3.5 que las partı́culas masivas

tienen velocidades inferiores a c; por eso los eventos de sus trayectorias
tienen intervalos temporaloides y, en consecuencia, se les aplica el concepto
de tiempo propio τ. ¿Cómo se mide el τ de estos intervalos? Para responder
esta pregunta supongamos el más simple de los casos, que es el de una
partı́cula masiva libre. Pensamos en un reloj atado a la partı́cula, que la
38
acompaña en todo instante: el tiempo que marca este reloj es τ. Obsérvese
que este tiempo propio lo mide un sólo reloj. Hay un sistema coordenado
inercial para el cual la partı́cula está siempre en reposo; en estas coordenadas
el intervalo entre dos puntos de la trayectoria es puro tiempo, y es c2 τ 2 .
Llegamos ası́ a una fórmula de gran utilidad en el estudio de las trayectorias
de las partı́culas libres:
ds2 = c2 dτ 2 , (2.16)
siendo τ el tiempo que marca un reloj que acompaña a la partı́cula2 .
Para un observador que acompaña a una partı́cula masiva, τ es un parámetro

que sirve para caracterizar los eventos de la trayectoria. Pero otros obser-
vadores que no acompañan a la partı́cula también pueden utilizar a τ para
caracterizar los puntos de la trayectoria de la partı́cula, de la manera sigu-
iente. Sean (T, X, Y, Z) las coordenadas de los eventos de la trayectoria de
una partı́cula libre, según los registra un observador inercial cualquiera. La
idea es que cada una de las cuatro coordenadas (T, X, Y, Z) se puede con-
siderar como función de τ (que, como hemos dicho, es el tiempo que marca
un reloj atado a la partı́cula). Escribimos entonces T = T (τ ), X = X(τ ),
Y = Y (τ ) y Z = Z(τ ). Supongamos que, cuando τ = 23, la partı́cula
ocupó el evento (5, 6, 7, 8). Decimos entonces que T (23) = 5, X(23) = 6,
Y (23) = 7 y Z(23) = 8.
El fotón viaja con velocidad c, y por esta razón los eventos de su trayec-
toria tienen intervalos luminoides, para los cuales no se aplica el concepto
de tiempo propio: el concepto de tiempo propio no se aplica a partı́culas de
masa cero.
Tiempo de vida media. Un electrón solo y aislado sigue siendo electrón

indefinidamente, y por esto decimos que es estable. Otro ejemplo de partı́cu-
la estable es el protón. Pero la estabilidad es una propiedad escasa, ya que
casi todas las partı́culas tienden a desintegrarse. El tiempo de vida media se
define como el tiempo que tarda una población de partı́culas idénticas en
reducirse a la mitad3 . Nos interesa en este momento resaltar que el enuncia-
do “tiempo que tarda...” es ambiguo, porque es relativo. Deberı́a definirse el
2
Esta fórmula, que hemos encontrado para partı́cula libre, es también válida cuando
la partı́cula no es libre, como veremos en la ecuación (8.1).
3
En verdad, y debido a la incertidumbre esencial que asiste al proceso cuántico de la
desintegración, deberı́amos decir “aproximadamente la mitad”.
39
tiempo de vida media en términos absolutos, no relativos. Se ha convenido
en que “el tiempo que tarda una población en reducirse a la mitad, aprox-
imadamente” significa lo siguiente: el que registra un observador en reposo
respecto a las partı́culas. Veamos por ejemplo los piones no neutros, que el
99.98770 % de las veces se desintegran ası́:
π + → µ+ νµ
π − → µ− ν̄µ con
τ = 2.6 × 10−8 s : Vida media
El significado de τ, desde un punto de vista experimental es el siguiente.

Supongamos un conjunto de 700 piones que se encuentran en reposo re-
specto a un observador O0 ; cuando en los relojes de este observador hayan
transcurrido 2.6 × 10−8 segundos, la población de piones será 350 aproxi-
madamente. Supongamos ahora que este grupo de piones tiene una velocidad
de 0.99c respecto al laboratorio, y nos preguntamos: según el reloj del labo-
ratorio, ¿cuánto tiempo t (el que marca un reloj del laboratorio) se demora la
población de piones para pasar de 700 a 350? Para responder esta pregunta
utilizamos la ecuación (2.14):
τ 2.6 × 10−8 s
t = p = √ = 18.43 × 10−8 s
2
1 − v /c2 1 − 0.99 2
El trayecto recorrido por los piones antes de desintegrarse es vt:
v t = 0.99 ct = 54.74 m : Relatividad
Si, en vez de usar las transformaciones de Lorentz, se usan las de Galileo,

el resultado es bien diferente. De acuerdo con las ecuaciones (1.7), las can-
tidades ∆t y ∆t0 serı́an iguales, y el trayecto recorrido por los piones antes
de desintegrarse serı́a
v ∆t0 = 7.72 m : Galileo,
muy diferente a 54.74 m. En el laboratorio el experimento da 54.74 m y no

7.72 m: la relatividad especial confirmada.
40
2.6 Longitud propia
Para medir fotográficamente la longitud de un avión volando se debe tener
en cuenta que el diafragma de la cámara fotográfica se abra por muy poco
tiempo; porque si se abre durante mucho tiempo, la fotografı́a queda corrida
o borrosa, y no sirve: en general, para medir la longitud de un objeto se
deben registrar los dos extremos simultáneamente. En el caso especial en
que el avión está en reposo, los registros de los dos extremos no tienen que
ser simultáneos. Supongamos pues que el avión está en reposo en O0 , y
llamemos L0 = |∆r0 | a su longitud para O0 . Esta L0 recibe el nombre de
longitud propia. La ecuación (2.2) se escribe:
c2 (∆t0 )2 − L20 = c2 (∆t)2 − (∆r)2 (2.17)
Ahora utilizar la ecuación (1.41):
µ ¶2
1
2 2
c γ ∆t − 2 v · ∆r − L20 = c2 (∆t)2 − (∆r)2
c
Queremos que |∆r| sea L, la longitud del avión según la registra O. Tal
como acabamos de explicar, para medir esta L se deben registrar los dos
extremos en el mismo valor de t, es decir, ∆t = 0. Entonces:
µ ¶2
2 2 1
c γ v · L − L20 = −L2
c2
O sea que
γ2
L20 = L2 + 2
(v · L)2 (2.18)
c
Esta fórmula sirve en general, cualquiera que sea el ángulo formado por
el avión L y la velocidad de separación v . La estudiaremos en dos casos:
cuando L y v son perpendiculares, y cuando L y v son paralelos. Si son
perpendiculares, se cumple la ecuación v · L = 0 y en consecuencia L = L0 :
las longitudes perpendiculares a v no sufren ningún cambio. De otro lado,
si L y v son paralelos, la fórmula (2.18) da
41
p
L0 = L/ 1 − v 2 /c2 (2.19)
> L (2.20)
La ecuación (2.17) se reescribe ası́:
L20 = (∆r)2 − c2 (∆t)2 + c2 (∆t0 )2
No olvidemos que ∆t = 0 y (∆t0 )2 > 0, lo que implica necesariamente que

L20 > (∆r)2 : la longitud propia es la mayor de las longitudes.
Volumen propio. Dado que las longitudes perpendiculares a vq no sufren

cambios, y que las longitudes paralelas a v se afectan por un factor 1 − v 2 /c2 ,
la forma de los objetos tridimensionales depende del estado de movimiento
del observador que los registra: la forma es relativa. Presentemos un ejemplo
de esta deformación, suponiendo que en O0 hay, en reposo, un cubo con sus
aristas paralelas a los ejes x0 , y 0 y z 0 , respectivamente. Llamemos L0 a la lon-
gitud de las aristas, según O0 . Nos preguntamos en seguida de qué manera
registra O a este cuerpo; claramente, las aristas paralelas a los ejes y y z
son de longitud
q L0 , pero las aristas paralelas al eje x tienen una longitud
contraı́da L0 1 − v 2 /c2 . Vemos ası́ que para O no se trata de un cubo, sino
de un paralelepı́pedo
q recto rectangular -i.e.: un “cubo achatado”- de aristas
L0 , L0 , L0 1 − v 2 /c2 .
Esto repercute en qel volumen, ya que mientras el volumen es L30 para O0 ,

el volumen es L30 1 − v 2 /c2 para O. Ahora supongamos un cuerpo de
cualquier forma; es claro que O0 lo puede considerar como la yuxtaposición
de muchos cubitos, y cada uno de estos cubitos aparece deformado para
O. Lo importante es que q todos los cubitos se ven afectados por el mismo
factor de deformación 1 − v 2 /c2 , y en consecuencia la relación entre los
volúmenes es
q
V = V0 1 − u2 /c2 , (2.21)
donde V0 = L30 . En esta ecuación estamos hablando de cualquier cuerpo

tridimensional que tiene velocidad u respecto a O. La cantidad V0 es el
volumen propio, es decir, el que registra un observador para el cual el cuerpo
está en reposo.
42
Densidad propia. Consideremos una nube de partı́culas. El observador
O registra que en un punto r y en un instante t la velocidad de la nube es
u. Pensemos en un pequeño volumen V alrededor de r, que en el instante t
tiene la misma velocidad u: claramente este volumen V está acompañando
a las partı́culas. Si dentro de V hay n partı́culas, entonces la densidad de
partı́culas por unidad de volumen es n/V. Y si cada partı́cula tiene una carga
eléctrica q, entonces para el observador O la densidad de carga por unidad
de volumen es
nq
ρ(r, t) = (2.22)
V
Seguidamente estudiaremos lo que registra otro observador inercial O0 que,

en el instante t, tiene velocidad u: es claro que para este observador el
volumen mencionado en el párrafo anterior está en reposo, y en vez de ser
V, es V0 , de acuerdo con la ecuación (2.21). El volumen V0 también contiene
n partı́culas de carga q, o sea que para el nuevo observador4 la densidad de
carga por unidad de volumen es:
nq
ρ0 (r, t) = (2.23)
V0
La cantidad ρ0 recibe el nombre de densidad propia de carga por unidad de

volumen. En vista de la ecuación (2.21):
ρ0
ρ = q (2.24)
1 − u2 /c2
nq
= q (2.25)
V0 1 − u2 /c2
La ecuación (2.24) dice que ρ0 < ρ: la densidad propia es la menor de las

densidades.
4
La carga eléctrica q es la misma para todos los observadores inerciales. En efecto,
se han realizado suficientes pruebas experimentales que muestran confiablemente [8] que
q no depende de la velocidad de la partı́cula: la carga eléctrica es invariante bajo las
transformaciones de la relatividad especial.
43
2.7 Comparación de longitud propia y tiempo pro-
pio
Hemos dicho que el concepto de tiempo propio sólo se aplica a intervalos
temporaloides. De la misma manera, el concepto de longitud propia sólo se
aplica a intervalos espacialoides. Vemos ası́ que estos dos conceptos son esen-
cialmente diferentes y nunca se aplican al mismo intervalo. Hay sin embargo
cierto parecido formal entre ellos, como veremos en seguida. La ecuación
fundamental es la invariancia del intervalo (2.2):
+c2 (∆t0 )2 − (∆r0 )2 = +c2 (∆t)2 − (∆r)2 (2.26)
Los signos + y − en esta ecuación son cruciales: el tiempo propio ∆t0 es el

menor de los tiempos, porque resulta de hacer ∆r0 = 0 en esta ecuación;
ası́ mismo, la longitud propia |∆r0 | es la mayor de las longitudes, porque
resulta de hacer ∆t = 0 en (2.26). En otras palabras: ∆t > ∆τ porque O
registra los dos eventos en tripuntos diferentes; ası́ mismo, L0 > L porque
O0 registra los dos eventos en instantes diferentes.
2.8 Un caso de simultaneidad

La dilatación del tiempo, la contracción de la longitud y la relatividad de
la simultaneidad son los efectos más dramáticos de la relatividad. En las
dos últimas secciones vimos cómo se miden el tiempo propio y la longitud
propia, y es justo dedicarle también a la simultaneidad un ejemplo y una
discusión.
Sean A y B dos puntos en reposo5 en el sistema O0 , como en la Figura

2.3. En el punto medio se emite un pulso de luz. Para O0 , las dos señales
llegan a A y B en los instantes t0A y t0B , respectivamente. Pensemos en otro
observador O que se desplaza con una velocidad v respecto a O0 , y la direc-
ción de esta velocidad es hacia la izquierda. O registra que las dos señales
luminosas llegan a A y B en los instantes tA y tB , respectivamente. La
fórmula (1.39) da
v
(t0B − t0A ) + 2 (x0B − x0A )
tB − tA = p c
1 − v 2 /c2
5
A y B no son eventos, sino puntos en el espacio tridimensional.
44
Ahora, es claro que t0B = t0A , o sea que
v 0
2
(xB − x0A )
tB − tA c
= p 6= 0
1 − v 2 /c2
Vemos ası́ que la llegada de las dos señales a A y B es registrada de manera

muy diferente por los dos observadores ya que, mientras O0 afirma que son
simultáneas, para O no son simultáneas. Este análisis relativista puede pare-
cer, como todo en la relatividad, un poco complejo. Pero debemos admitir
que tiene un elemento muy simple: no hemos tenido necesidad de aclarar si
la fuente de luz se está moviendo o no, respecto a ninguno de los dos obser-
vadores. Hemos utilizado el principio de la constancia de la velocidad de la
luz (1.10), que afirma que la velocidad de la luz es independiente del estado
de movimiento de la fuente de luz. La simplicidad del análisis relativista
está ausente en el análisis prerrelativista; en efecto, en el prerrelativista es
necesario decir cómo se mueve la fuente de luz, o de lo contrario faltan datos
para resolver el problema.
2.9 La adición de velocidades

Consideremos un punto móvil, que tiene velocidad u respecto a O, y tiene
velocidad u0 respecto a O0 . De acuerdo con la fı́sica galileana (1.7) se tiene:
u = u0 + v (2.27)
Veremos enseguida que en relatividad especial la regla de adición de veloci-

v
dades no es tan simple como (2.27). La ecuación (1.39) es dt = γ(dt0 + 2 dx0 );
c
en el lado derecho se saca dt0 como factor común, para obtener
µ ¶
vu0x
dt = γ 1 + 2 dt0
c
1 γ −1 1
= 0 (2.28)
dt vu dt0
1 + 2x
c
45
Repitamos el proceso
µ 0 para¶la coordenada x. La ecuación (1.40) es dx =
0 0 dx
γ(dx + vdt ) = γ + v dt0 :
dt0
dx = γ(u0x + v)dt0 (2.29)
Ahora multiplicar lado a lado las ecuaciones (2.28) y (2.29) para obtener
u0x + v
ux = (2.30)
vu0
1 + 2x
c
Observaciones:
1. Notemos que u0x = c ⇒ ux = c: un punto matemático que tenga velocidad

c para O0 , también tendrá velocidad c para todos los otros observadores O.
Esta es una generalización del postulado (1.10) de la constancia de la ve-
locidad de la luz.
2. Si u0x ¿ c o v ¿ c, el denominador de (2.30) es aproximadamente 1,

y entonces ux ≈ u0x + v, que es la transformación de Galileo (2.27): la teorı́a
relativista abarca a la galileana.
3. Podemos expandir el lado derecho de (2.30) como un polinomio en poten-

cias de v :
ux = (u0x + v)(1 + vu0x /c2 )−1

= (u0x + v)(1 − vu0x /c2 + · · ·)
= u0x + v − vu02 2
x /c + · · ·
≈ u0x + v − vu02 2
x /c ,
es decir:
µ ¶
u02
x
ux ≈ u0x + 1 − 2 v,
c
46
y haciendo n = c/u0x :
µ ¶
1
ux ≈ u0x + 1− 2 v (2.31)
n
Esta es la célebre fórmula que Fresnel derivó en 1818, cuando estaba inves-
tigando la velocidad de la luz en medios móviles. Ya habı́amos mencionado
esta ecuación en la página 6.
La fórmula (2.30) es la ley de la adición de las velocidades paralelas u0x

y v. Todavı́a nos queda la tarea de deducir las fórmulas que expresan a
las velocidades transversas uy y uz en términos de velocidades primadas.
Para tal efecto tomamos diferenciales en ambos lados de la ecuación y = y 0 ,
dy 1
obteniéndose dy = dy 0 , es decir = dy 0 , lo que se escribe
dt dt
1
uy = dy 0
dt
Ahora usar (2.28):

p
1 − v 2 /c2 0
uy = uy
vu0
1 + 2x
c
Similarmente se deduce que
p
1 − v 2 /c2 0
uz = uz
vu0
1 + 2x
c
En resumen, la adición relativista de velocidades es ası́:
u0x + v
ux = (2.32)
vu0
1 + 2x
p c
1 − v 2 /c2 0
uy = uy (2.33)
vu0x
1+ 2
c
47
p
1 − v 2 /c2 0
uz = uz (2.34)
vu0x
1+ 2
c
Estas tres fórmulas son complicadas, y cuando rastreamos los pasos que con-
dujeron a ellas, nos damos cuenta de que (2.32) es más complicada que (2.33)
y (2.34). Para ver esto anotemos que (2.33) es complicada únicamente por
la transformación temporal (2.28). En cambio (2.32) es complicada, no sólo
por la transformación temporal (2.28), sino además por la transformación
espacial (2.29).
Las transformaciones inversas se obtienen, a partir de (2.32), (2.33) y (2.34),

cambiando v por −v e intercambiando velocidades primadas y no primadas:
ux − v
u0x = vux (2.35)
1− 2
p c
1 − v 2 /c2
u0y = vux uy (2.36)
1− 2
p c
1 − v 2 /c2
u0z = vux uz (2.37)
1− 2
c
Las ecuaciones (2.32), (2.33) y (2.34) sirven cuando la velocidad de sepa-

ración v es en dirección del eje común xx0 . Debemos ahora generalizar para
cuando v es en cualquier dirección. Claramente (2.28) se convierte en
p
1 1 − v 2 /c2 1
= , (2.38)
dt v · u0 dt0
1+ 2
c
y la adición de velocidades (2.32), (2.33) y (2.34) se generaliza ası́:
u0k + v
uk = (2.39)
v · u0
1+ 2
p c
1 − v 2 /c2 0
u⊥ = u (2.40)
v · u0 ⊥
1+ 2
c
48
2.10 La adición de aceleraciones
Tomar diferenciales en ambos lados de la ecuación (2.39):
µ ¶
v · u0 v · du0
1+ 2 du0k − (u0k + v) 2
c c 1 − v 2 /c2 0
duk = µ 0
¶ 2 = µ 0
¶2 duk
v ·u v ·u
1+ 2 1+ 2
c c
Ahora usar la ecuación (2.38):
0
duk (1 − v 2 /c2 )3/2 duk
= µ ¶ ,
dt v · u0 3 dt0
1+ 2
c
es decir:
(1 − v 2 /c2 )3/2 0
ak = µ ¶ ak (2.41)
v · u0 3
1+ 2
c
Esta es la manera como transforman las aceleraciones paralelas. Pasamos

ahora a deducir la transformación de las aceleraciones perpendiculares, toman-
do diferenciales en ambos lados de (2.40):
p ½µ ¶ ¾
1 − v 2 /c2 v · u0 0 0 v · du
0
du⊥ = µ ¶ 1+ 2 du ⊥ − u ⊥
v · u0 2 c c2
1+ 2
c
Se multiplican, lado a lado, esta ecuación y la ecuación (2.38):
½ ¾
1 − v 2 /c2 0 1 £ 0 0 0 0
¤
a⊥ = µ ¶ a⊥+ 2 v ·u a⊥−v ·a u⊥ (2.42)
v · u0 3 c
1+ 2
c
El término v · u0 a0 ⊥ − v · a0 u0 ⊥ que aparece en el lado derecho de esta

ecuación se trata de la manera siguiente:
49
v · u0 a0 ⊥ − v · a0 u0 ⊥ = v · u0 (a0 − a0 k ) − v · a0 (u0 − u0 k )
= v · u0 a0 − v · a0 u0 + v · a0 u0 k − v · u0 a0 k
El lado derecho de esta ecuación tiene cuatro términos. Los dos primeros6
suman v × (a0 × u0 ) y los dos últimos suman7 cero; entonces:
v · u0 a0 ⊥ − v · a0 u0 ⊥ = v × (a0 × u0 ),
y (2.42) queda:
½ ¾
1 − v 2 /c2 0 1 0 0
a⊥ = µ ¶ a ⊥ + 2 v × (a × u ) (2.43)
v · u0 3 c
1+ 2
c
2.11 Gráficos
Ahora estudiaremos el método gráfico de Minkowski [10]. Consideramos pun-
tos que se mueven únicamente en el eje x. Las coordenadas x y t tienen
dimensiones de metro y segundo, respectivamente. Conviene usar variables
de espacio y tiempo que tengan las mismas dimensiones, y por eso vamos
a usar la variable ct en vez de t. La variable ct significa tiempo, pero con
dimensiones de longitud. Las transformaciones de Lorentz (1.33) toman una
forma simétrica entre x y ct:
v
x − ct
x0 = p c (2.44)
1 − v 2 /c2
v
ct − x
(ct)0 = p c , (2.45)
1 − v 2 /c2
o las inversas:
6
Recordar la identidad A × (B × C) = A · C B − A · B C
7
Como u0 k y a0 k apuntan en la dirección de v , es claro que v · a0 u0 k − v · u0 a0 k es un
vector en dirección de v . La magnitud de este vector es va0k u0k − vu0k a0k = 0.
50
v
x0 + (ct)0
x= p c
1 − v 2 /c2
v (2.46)
(ct)0 + x0
ct = p c
1 − v /c2
2
Se grafica el eje ct vertical y el eje x horizontal. Un punto en reposo mantiene

constante su coordenada x, y su trayectoria se representa por medio de una
lı́nea recta vertical. Estudiemos ahora un punto móvil cuya velocidad es
u = dx/dt:
d(ct) c
=
dx u
Llamando “pend” a la pendiente de la curva, esta ecuación es
c
pend = (2.47)
u
La cantidad u es positiva si el punto viaja hacia la derecha, y negativa si va

hacia la izquierda, y en estos casos pend es positiva o negativa. Tomar valor
absoluto:
c
|pend| = (2.48)
|u|
Si se trata de una partı́cula masiva, la velocidad es infralumı́nica, y por

consiguiente |u| < c; la ecuación (2.48) dice que |pend| tiene que ser >1 en
todos los instantes. En el caso importante de un pulso de luz, la trayectoria
es una lı́nea recta con |pend| = 1: la trayectoria es la bisectriz del ángulo
formado por los ejes ct y x. La Figura 2.4 muestra cuatro trayectorias: La
lı́nea recta de 45o de inclinación es para un pulso de luz. Las otras tres curvas
representan trayectorias de partı́culas masivas: la recta vertical corresponde
a partı́cula en reposo; la recta con inclinación >45o es para partı́cula libre,
y la lı́nea curva para partı́cula forzada. Es importante notar que en esta
última trayectoria la pendiente es >1 en todos los instantes.
Minkowski escribe con grandilocuencia. A la totalidad t, x, y, z la llama el

mundo. Al principio de la relatividad (1.10) le dice el principio del mundo
absoluto, un evento (t, x, y, z) es un punto en el mundo y la trayectoria de
51
una partı́cula es una lı́nea en el mundo. Es él quien introduce en la fı́sica las
palabras luminoide, espacialoide, temporaloide y cono de la luz. La visión
geométrica de Minkowski está llena de contenido conceptual, aunque no
siempre se apreció ası́. El mismo Einstein tardó años en reconocer su impor-
tancia. En un principio consideró que el trabajo de Minkowski era redun-
dante y carecı́a de profundidad; finalmente, en 1912, llegó al convencimiento
de que la relatividad general debı́a ser planteada en términos geométricos,
y pudo apreciar el trabajo de su antiguo profesor.
La causalidad. La Figura 2.5 muestra un evento E1 y las lı́neas en el

mundo de dos pulsos de luz que pasan por E1 : uno viaja hacia la izquierda
y el otro hacia la derecha. La trayectoria del pulso que va hacia la derecha
tiene pendiente 1, y la trayectoria del pulso que va hacia la izquierda tiene
pendiente −1. La unión de las dos rectas se llama el cono de la luz del even-
to E1 . Las dos rectas que pasan por E1 cortan al mundo en cuatro partes:
izquierda, derecha, pasado y futuro. Las partes izquierda y derecha están
fuera del cono de la luz; el futuro y el pasado están dentro del cono de la
luz; también decimos que los eventos que están en las dos rectas están dentro
del cono de la luz.
Las señales energéticas son partı́culas, bien sea de masa cero como el fotón,
o de masa diferente de cero; sus trayectorias tienen |pend| ≥ 1, de donde
concluimos que las trayectorias de las señales energéticas que pasan por un
evento E1 están completamente dentro del cono de la luz de E1 . Einstein
pensaba que si un suceso (que ocurre en el evento E1 ) es causa eficiente de
otro suceso (que ocurre en el evento E2 ,) es porque hay una señal energética
que va desde E1 hasta E2 . Como esta señal está dentro del cono de la luz de
E1 , es claro que también E2 tiene que estar dentro del cono de la luz de E1 .
En conclusión: Lo que ocurre dentro del cono de la luz de E1 puede tener
una conexión causal con lo que ocurre en E1 . Lo que ocurre en la región del
futuro puede ser efecto de lo que ocurre en E1 . Lo que ocurre en la región
del pasado puede ser causa de lo que ocurre en E1 . Lo que ocurre en la
región del futuro puede ser efecto de lo que ocurre en la región del pasado.
La causalidad einsteiniana es una conexión entre el pasado y el futuro8 .
8
Bohr pensaba que la causalidad einsteiniana no es la única posible; él admitı́a la
posibilidad de que hubiera también unas correlaciones cuánticas que no están mediadas por
señales energéticas. El danés creı́a que dos sucesos en E1 y E2 pueden estar correlacionados
sin necesidad de una señal energética que viaje desde un evento hasta el otro. Bohr y
Einstein tenı́an que chocar, y ası́ lo hicieron en un debate que duró treinta años.
52
Clases de intervalos: Supongamos dos eventos cuyo intervalo es tem-
poraloide. Trazamos una recta que pase por los dos eventos; entonces, de
acuerdo con la desigualdad (2.4), esta recta tiene |pend| > 1. Ası́ mismo,
utilizando las fórmulas (2.7) y (2.11) llegamos a que la recta que une dos
eventos con intervalo espacialoide tiene |pend| < 1, y la recta que une dos
eventos con intervalo luminoide tiene |pend| = 1.
La Figura 2.6 muestra cuatro eventos A, E, T, y L. El intervalo AE es

espacialoide, el intervalo AT es temporaloide y el intervalo AL es lumi-
noide. El cono de la luz corta en cuatro partes al espaciotiempo. En general,
los eventos con intervalo espacialoide están fuera del cono de la luz, los que
tienen intervalo temporaloide están dentro del cono de la luz y los que tienen
intervalo luminoide están justo en el cono de la luz.
2.12 Más gráficos

Ya que hemos construido los ejes ct y x del mundo de O, procedemos a
dibujar los ejes ct0 y x0 del mundo de O0 : queremos trazar los ejes (ct0 , x0 )
en el plano (ct, x). Es claro que la condición x0 = 0 identifica al eje ct0 ;
haciendo x0 = 0 en (2.44) encontramos:
c
ct = x, (2.49)
v
que es una lı́nea recta con pendiente c/v > 1. Vemos ası́ que el eje ct0 se
representa por medio de una recta que pasa por el origen, y que hace con
el eje ct un ángulo <45o . El eje x0 se caracteriza por la condición t0 = 0;
haciendo t0 = 0 en (2.45) se llega a
v
ct = x (2.50)
c
Esta es la ecuación del eje x0 . El eje x0 es una recta de pendiente v/c < 1,
o sea que hace con el eje x un ángulo <45o . La Figura 2.7 muestra los ejes
(ct0 , x0 ) dibujados en el plano (ct, x), para una velocidad v/c = 3/8.
Una vez trazados los ejes primados procedemos a calibrarlos, es decir, a

marcar el 0, el 1, el 2, . . . en los ejes ct0 y x0 . Tomemos el eje x0 : ¿dónde
ponemos la marca 1? La respuesta a esta pregunta es: en aquel evento P
53
cuyas coordenadas primadas son (0, 1). Para ubicar este evento en el plano
no primado, es preciso averiguar las coordenadas no primadas de P , lo que
se hace colocando los valores ct0 = 0 y x0 = 1 en las ecuaciones (2.46); de
esta manera se llega a que las coordenadas no primadas de P son (γv/c, γ).
Marcamos el evento P y luego, con una regla graduada, medimos la distan-
cia de P al origen; replicando esa distancia sobre el eje x0 se ubica la marca
2; replicando de nuevo se ubica la marca 3, etc. Ya tenemos calibrado el eje
x0 .
Para calibrar el eje ct0 se piensa en el evento Q, cuyas coordenadas pri-

madas son (1, 0). Para ubicar este evento en el plano no primado, es preciso
averiguar las coordenadas no primadas de Q, lo que se hace colocando los
valores ct0 = 1 y x0 = 0 en las ecuaciones (2.46); de esta manera se llega a
que las coordenadas no primadas de Q son (γ, γv/c). Marcamos el evento
Q y luego, replicando sobre el eje ct0 , se localiza la marca 2; replicando de
nuevo se localiza la marca 3, etc. Ası́ se calibra el eje ct0 . La Figura 2.8
muestra claramente que la calibración de los ejes (x0 , ct0 ) es diferente a la de
los ejes (x, ct).
Para averiguar la coordenada ct0 de un evento no se traza una perpendicu-

lar al eje ct0 sino que se traza una lı́nea paralela al eje x0 : allı́ donde esta
paralela corta al eje ct0 queda marcada la coordenada ct0 del evento. De la
misma manera, para averiguar la coordenada x0 de un evento no se traza
una perpendicular al eje x0 , sino que se traza una paralela al eje ct0 . En
la Figura 2.9 hemos usado esta prescripción para marcar los eventos cuyas
coordenadas primadas son (0, 1) y (3, 2) .
Partı́culas en reposo. La Figura 2.10 muestra, en lı́neas punteadas, las

trayectorias de dos partı́culas. Una está en reposo en O0 y la otra está en
reposo en O.
Relatividad de la simultaneidad. En la Figura 2.11 aparecen tres even-

tos A, B y C. Los eventos A y B son simultáneos para O pero no son si-
multáneos para O0 . Ası́ mismo, B y C son simultáneos para O0 pero no son
simultáneos para O.
Contracción de la longitud. La Figura 2.12 muestra, en trazo grueso,

una varilla en reposo en O0 ; según este observador, ella mide 2 metros. Las
lı́neas punteadas son las lı́neas en el mundo de sus extremos. Para medir la
54
longitud de la varilla, el observador O registra los dos extremos simultánea-
mente y obtiene una longitud menor que 2.
De igual modo, la Figura 2.13 muestra, en trazo grueso, una varilla en reposo
en O; según este observador, ella mide 2 metros. Las lı́neas punteadas son
las lı́neas en el mundo de sus extremos. Para medir la longitud de la varilla,
el observador O0 registra los dos extremos simultáneamente y obtiene una
longitud menor que 2.
Dilatación del tiempo. En la Figura 2.14 aparece, en trazo punteado, la

lı́nea en el mundo de un reloj en reposo en el origen de O. Este reloj marca
un tiempo (propio) de 2. Para O0 el tiempo transcurrido es mayor que 2.
Ası́ mismo, en la Figura 2.15 aparece, en trazo punteado, la lı́nea en el

mundo de un reloj en reposo en el origen de O0 . Este reloj marca un tiempo
(propio) de 2. Para O el tiempo transcurrido es mayor que 2.
Cuando O0 viaja hacia la izquierda. O0 se dirige hacia la izquierda,

pero sin invertir la dirección del eje x0 . Es decir, los ejes x y x0 apuntan en
la misma dirección. En estos casos los ejes primados se dibujan como en la
Figura 2.16.
El eje ct0 hacia arriba, y el eje x0 hacia a la derecha. Pensemos en

el cono de la luz referido al origen de coordenadas, y las cuatro partes en
que queda cortado el espaciotiempo. Un vistazo a las Figuras 2.7 y 2.16 nos
muestra una constante: el eje ct0 siempre apunta hacia la región del futuro,
y el eje x0 siempre apunta hacia la parte de la derecha.
Relaciones relativas. En base a la Figura 2.6, es claro que existe un ob-

servador O0 (con cierta velocidad v) cuyo eje x0 pasa por E, o sea que para
este O0 los eventos E y A son simultáneos. Todos los otros observadores
con velocidad < v registran que E ocurre más tarde que A, y todos los
observadores con velocidad > v registran que E ocurre más temprano que
A. Aprendemos ası́ una cosa interesante: cualquier evento que esté fuera
del cono de la luz aparece más tarde que A para unos observadores y más
temprano que A para otros observadores. O sea que para estos eventos la
relación pasado-futuro no es absoluta, sino relativa.
De nuevo con la Figura 2.6, existe un observador O0 (con cierta velocidad
55
v) cuyo eje ct0 pasa por T , o sea que para este O0 el evento T y A ocurren
en el mismo lugar. Todos los otros observadores con velocidad < v registran
que T está a la derecha de A, y todos los observadores con velocidad > v
registran que T está a la izquierda de A. Aprendemos ası́ algo interesante:
cualquier evento que esté dentro del cono de la luz aparece a la derecha para
unos observadores y a la izquierda para otros observadores. O sea que para
estos eventos la relación izquierda-derecha no es absoluta, sino relativa.
Relaciones absolutas. Regresando al evento E del penúltimo párrafo

anotamos que no es posible conseguir, ni con la Figura 2.7, ni con la Figura
2.16, un observador inercial para el cual E aparezca a la izquierda del origen.
Es decir, los eventos que están fuera del cono de la luz tienen una relación
izquierda-derecha absoluta.
Similarmente, en referencia al evento T del penúltimo párrafo anotamos

que no es posible conseguir, ni con la Figura 2.7, ni con la Figura 2.16, un
observador inercial para el cual T ocurra antes que el origen. Aprendemos
ası́ que los eventos que están dentro del cono de la luz tienen una relación
pasado-futuro absoluta.
Los nombres izquierda, derecha, pasado y futuro que les hemos dado a las
cuatro regiones, son adecuados: los eventos de estas regiones están, respecto
al vértice del cono, absolutamente a la izquierda, absolutamente a la derecha,
absolutamente en el pasado y absolutamente en el futuro.
56
d
Figura 2.1 Un reloj se construye Figura 2.2 El mismo reloj de la

con dos espejos paralelos y un Figura 2.1, según lo registra otro
pulso de luz que se refleja en ellos observador O que se mueve re-
repetidamente. Este dibujo rep- specto al reloj.
resenta el registro hecho por un
observador O0 que está en reposo
respecto al reloj.
ct
A B
x
Figura 2.3 Para el observador Figura 2.4 Trayectorias de cu-

O0 los puntos A y B están en atro partı́culas. De izquierda a
reposo. Desde el punto medio se derecha: partı́cula masiva libre,
envı́an dos señales luminosas ha- partı́cula en reposo, pulso de luz
cia A y B. y partı́cula forzada.
57
T
L
Futuro E
Izquierda Derecha A
E1
Pasado
Figura 2.5 El cono de luz Figura 2.6 Los intervalos AE,

está comprendido entre dos pul- AT y AL son espacialoide, tem-
sos de luz; uno viaja hacia la poraloide y luminoide, respecti-
izquierda y el otro hacia la vamente
derecha.
ct ct
ct'
ct'
4
3
3
2 x'
x'
v/c
2
arctan
3
1
1 2
1 x
c
arctan v/ x
1 2 3 4
Figura 2.7 El observador O0 se Figura 2.8 Para O0 , la distancia

mueve respecto a O con veloci- OP es 1. Replicamos esta medida
dad v = 3c/8. a lo largo del eje x0 para marcar
aquellos eventos cuyas coorde-
nadas primadas son (0,2), (0,3),
(0,4), etc.
58
ct
ct'
x'
2
1
2
1 x
Figura 2.9 Para averiguar la Figura 2.10 La lı́nea puntea-

coordenada ct0 de un evento se da vertical es la trayectoria de
traza una lı́nea paralela al eje x0 : una partı́cula que está en re-
allı́ donde esta paralela corta al poso respecto al observador O.
eje ct0 queda marcada la coorde- La otra lı́nea punteada es para
nada ct0 del evento. una partı́cula que está en reposo
respecto a O0 .
x'
C 2
A B x
2
Figura 2.11 Los eventos A y B Figura 2.12 El trazo grueso rep-

son simultáneos para O; sin em- resenta una varilla en reposo en
bargo, O0 registra que B ocurre O0 ; según este observador, ella
antes que A. Ası́ mismo, B y C mide 2 metros. Para O la longi-
son simultáneos para O0 , pero O tud es menor que 2.
registra que B ocurre antes que
C.
59
ct
ct'
x'
x'
2
2
2
x
2
Figura 2.13 El trazo grueso rep- Figura 2.14 El trazo punteado

resenta una varilla en reposo en es la lı́nea en el mundo de un
O; según este observador, ella reloj en reposo en el origen de
mide 2 metros. Para O0 la lon- O. Este reloj marca un tiempo
gitud es menor que 2. (propio) de 2. Para O0 el tiempo
transcurrido es mayor que 2.
ct
ct
ct'
ct'
2 2
x
x x'
Figura 2.15 El trazo punteado Figura 2.16 El observador O0 se

es la trayectoria de un reloj en re- mueve hacia la izquierda respec-
poso en el origen de O0 . Este reloj to a O. Comparar con la Figura
marca un tiempo (propio) de 2. 2.7: en ambas gráficas el eje ct0
Para O el tiempo transcurrido es apunta hacia el futuro, y el eje
mayor que 2. x0 apunta hacia la derecha.
60
Capı́tulo 3
Mecánica
Si la relatividad ha cambiado nuestro entendimiento del espaciotiempo,

debemos estar preparados para indagar y asimilar los efectos de esos cam-
bios. Se espera que, una vez aceptadas las nuevas propiedades del espa-
ciotiempo, tengamos que introducir modificaciones en los estudios de la
dinámica, la mecánica ondulatoria, etc. Este capı́tulo explora la primera
de las repercusiones, que es el efecto de la relatividad en la dinámica. Ver-
emos que la nueva dinámica trae sutilezas teóricas y efectos sorprendentes
que la separan de la vieja mecánica1 newtoniana.
El momentum es el primero de los conceptos que la relatividad reforma. De

acuerdo con el principio de la relatividad, la ley de la conservación del mo-
mentum debe ser válida en todos los sistemas de referencia inerciales. Pero
la relatividad muestra, para nuestra sorpresa, que si se mantiene la defini-
ción de momentum p = mu con m constante, la ley de la conservación del
momentum no se cumple para todos los observadores inerciales, violándose
ası́ el principio de la relatividad. Hay tres caminos para salir de esta cri-
sis: abandonar el principio de la relatividad (no queremos abandonarlo),
o abandonar la ley de la conservación del momentum (tampoco queremos
abandonarla), o modificar la vieja definición de momentum p = mu. En la
sección 3.1 tomaremos el tercer camino; propondremos p = m(u)u, donde
m(u) es alguna función desconocida de la magnitud de la velocidad u, nos
preguntaremos cómo debe ser la función desconocida m(u) para que la con-
servación del momentum sea válida en todosp los sistemas de referencia iner-
ciales, y descubriremos que m(u) = m(0)/ 1 − u2 /c2 .
1
Cuando decimos “mecánica newtoniana” nos referimos, no sólo a la mecánica que New-
ton formuló, sino además a los aportes que los fı́sicos hicieron en los dos siglos siguientes:
las formulaciones lagrangiana y hamiltoniana, las aplicaciones a los cuerpos celestes, etc.
61
El nuevo concepto de masa conduce a uno de los hallazgos más importantes
de la relatividad, que es la asociación masa-energı́a, expresada en la ecuación
E = mc2 . Esta fórmula dice que el contenido de masa de un objeto es una
medida de su energı́a total. La sección 3.4 trae una discusión de este asunto y
luego, en la sección 3.5 mostramos que una partı́cula masiva no puede llegar
a tener la velocidad c. La sección 3.9 trata, como un caso particularmente
interesante, el movimiento circular.
3.1 La conservación del momentum

Nos proponemos estudiar [6] la colisión elástica de dos partı́culas de igual
masa. La Figura 3.1 muestra el choque según lo registra un observador O
que está en reposo respecto al centro de masa. La partı́cula A va de derecha
a izquierda y la partı́cula B de izquierda a derecha. La figura incluye las
cantidades positivas ux y uy , que tienen el siguiente significado: La partı́cu-
la B tiene una velocidad horizontal ux hacia la derecha en todo instante;
pero su velocidad vertical es uy hacia abajo antes del choque, y es uy hacia
arriba después. En forma similar, la velocidad horizontal de A es ux hacia
la izquierda en todo instante; y su velocidad vertical pasa de ser uy hacia
arriba antes del choque, a ser uy hacia abajo después.
Con una mirada a la Figura nos damos cuenta de que, para el observador
O, el momentum total es cero. Lo que más nos interesa por el momento es
que el momentum total se conserva: el momentum ganado por la partı́cula
B es igual al perdido por A . De hecho, las cantidades escritas en la Figura
fueron expresamente definidas para que, en O, se cumpla la ley de la conser-
vación del momentum. Ahora, por el Principio de la Relatividad, queremos
que la ley de la conservación del momentum también se cumpla en los otros
observadores inerciales. Nos proponemos analizar la colisión de estas dos
partı́culas desde el punto de vista de otro observador inercial O0 que se
mueve, respecto a O, con una velocidad v hacia la derecha: vamos a exigir
que en O0 se cumpla la ley de la conservación del momentum.
Uno podrı́a, de entrada, definir el momentum de una partı́cula (intentar por

ejemplo la definición newtoniana mu) y luego indagar si la conservación del
momentum se cumple en todos los observadores inerciales. Nosotros vamos
a seguir la ruta contraria: exigir que la conservación del momentum valga
en todos los sistemas de referencia inerciales y, a partir de esta exigencia,
averiguar cómo se debe definir el momentum de una partı́cula. Comence-
62
mos con una propuesta bien general; digamos que si una partı́cula tiene
velocidad u , entonces su momentum es m(u)u , donde m(u) es una función
desconocida de la magnitud de la velocidad u . Vamos a exigir que la ley
de la conservación del momentum se cumpla en todos los observadores in-
erciales. Veremos que esta exigencia es suficiente para averiguar la función
desconocida m(u) .
La Figura 3.2 muestra de qué manera el observador O0 registra el choque

de las dos partı́culas. Para la partı́cula B el momentum vertical después del
choque es m(u0B )u0By y antes del choque es −m(u0B )u0By . Entonces el mo-
q
mentum vertical ganado por B es 2m(u0B )u0By . Ahora, u0B = u0Bx 2 + u0 2 ,
By
³q ´
entonces el momentum vertical ganado por B es 2m u0Bx
2 + u0 2 0
By uBy .
³q ´
Ası́ mismo, el momentum vertical perdido por A es 2m u0Ax
2 + u0 2 0
Ay uAy .
La ley de la conservación del momentum dice que el momentum vertical
perdido por una partı́cula es igual al ganado por la otra:
³q ´ ³q ´
0 0
m u0Ax
2 + u0 2
Ay u Ay = m u0 2 + u0 2
Bx By uBy (3.1)
En este momento debemos expresar las cuatro variables u0Ax , u0Ay , u0Bx y u0By
en términos de las cantidades nos primadas ux , uy y v, y esto se hace con
las fórmulas de la adición relativista de velocidades. Téngase en cuenta que
las ecuaciones (2.35) y (2.36) no pueden usarse directamente, porque hay
una confusión en la notación: en las fórmulas (2.35) y (2.36) las ux , uy son
variables algebraicas (que pueden tomar valores positivos o negativos), en
cambio en la presente sección las ux , uy , u0Ax , u0By , ... son cantidades positivas.
Con esta advertencia en mente procedemos a usar, para la partı́cula B, las
ecuaciones (2.35) y (2.36):
ux − v
u0Bx = vux
1− 2
p c
1 − v 2 /c2
u0By = vux uy
1− 2
c
Ası́ mismo, para la partı́cula A las ecuaciones (2.35) (2.36) dan:
63
−ux − v
−u0Ax =
v(−ux )
1−
p c2
1 − v 2 /c2
u0Ay = u
v(−ux ) y
1−
c2
Al colocar estas cuatro ecuaciones en (3.1) se llega a:
q 
(ux + v)2 + (1 − v 2 /c2 )u2y
m vux

1+ 2
c
q  vux
(ux − v)2 + (1 − v 2 /c2 )u2y 1+ 2
= m  c
vux vux
1− 2 1− 2
c c
Llevemos esta ecuación al lı́mite uy → 0:
    vux
|u + v| |u − v| 1+ 2
m
x  = m x  c
vux vux vux
1+ 2 1− 2 1− 2
c c c
De todos los observadores inerciales, escojamos aquel que tiene v = ux :
µ ¶
2v 1 + v 2 /c2
m = m(0)
1 + v 2 /c2 1 − v 2 /c2
m(0)
= s µ ¶2
2v/c
1−
1 + v 2 /c2
Esta es la respuesta que buscábamos. Para simplificar su escritura hagamos

2v
estos dos cambios en la notación: m(0) → m0 y →u :
1 + v 2 /c2
m0
m(u) = q (3.2)
1 − u2 /c2
64
Esta es la ecuación más importante de la mecánica en la teorı́a especial de
la relatividad. La masa de una partı́cula no es una constante, sino que es
función de la velocidad u de la partı́cula; he aquı́ una modificación esencial
en el concepto de masa.
Nota: Releamos las palabras que siguen a la ecuación (3.1). Si en vez de

usar la adición relativista de velocidades hubiéramos empleado la adición
galileana (2.27) ¿adónde habrı́amos llegado? Para responder esta pregunta
apliquemos la fórmula (2.27) a las partı́culas A y B, con lo que llegamos a:
−u0Ax = −ux − v , u0Bx = ux − v , u0Ay = uy y u0By = uy . Al poner estas
cuatro ecuaciones en la fórmula (3.1) se obtiene
³q ´ ³q ´
m (ux + v)2 + u2y =m (ux − v)2 + u2y
Si esta ecuación ha de cumplirse para valores arbitrarios de ux , uy y v, se con-

cluye que m no puede ser una función, sino que tiene que ser una constante.
De esta manera hemos llegado a un viejo resultado de la fı́sica newtoniana:
cuando se usan las transformaciones de Galileo, y se define p = mu con m
constante, entonces la ley de la conservación del momentum es válida para
todos los observadores inerciales.
3.2 Las nuevas cantidades dinámicas

En la fı́sica newtoniana el momentum, la fuerza, el trabajo R y la energı́a
cinética se definen ası́: p = mu, F = dp/dt, Trabajo = F · dr, Energı́a
cinética = el trabajo que se realiza para llevar a la partı́cula desde el reposo
hasta velocidad u. La dinámica relativista conserva estas definiciones, pero
todas con la nueva masa m(u). En general, siempre que escribamos m, debe
entenderse m(u):
p = mu (3.3)
m0 u
= q (3.4)
1 − u2 /c2
dp
F = (3.5)
dt
65
Z Z Z Z
dp dr
Trabajo = F · dr = · dr = dp · = d(mu) · u ,
dt dt
o sea que
Z
Trabajo = (m du · u + dm u2 ) (3.6)
De otro lado, elevando al cuadrado ambos lados de la ecuación (3.2) se

obtiene:
³ u · u´
m2 1 − 2 = m20
c
Tomar diferenciales en ambos lados:
u · du
2m dm − 2m dm u2 /c2 − 2m2 = 0,
c2
de donde:
m u · du + dm u2 = c2 dm
Esto en la ecuación (3.6) da:
Z
2
Trabajo = c dm (3.7)
Esta fórmula establece una nueva interpretación del trabajo: en la relatividad

el trabajo es el cambio de masa. La energı́a cinética K (que es, por definición,
la energı́a que hay que invertir para llevar una partı́cula desde el reposo hasta
velocidad u) es un trabajo muy especial: el que se necesita para cambiar la
masa desde m0 hasta m:
Z m
K = c2 dm
m0
K = mc2 − m0 c2 (3.8)
66
De la ecuación (3.8) se sigue que
K + m0 c2 = mc2 (3.9)
La energı́a mecánica total de la partı́cula, que representamos mediante la

letra E , es la suma K + m0 c2 :
E = m0 c2 + K (3.10)
= mc2 (3.11)
¿Por qué llamar energı́a a la cantidad mc2 ? A primera vista parece apresura-
do llamar energı́a a una cantidad recién encontrada; ya tendremos ocasión
de justificar este nombre en la sección 3.3.
Si usamos la ecuación (3.2) en la (3.11) escribimos:
m0 c2
E=q (3.12)
1 − u2 /c2
Esta ha sido una presentación rápida de las cuatro cantidades dinámicas m,

p, K, y E , tal como quedan redefinidas en la relatividad especial. Las Fig-
uras 3.3, 3.4, 3.5 y 3.6 muestran cualitativamente estas curvas einsteinianas
marcadas con la letra e ; se deben comparar con las curvas newtonianas que
aparecen marcadas con la letra n.
Claramente las cuatro cantidades dinámicas E, K, p, u son redundantes,

si m0 está dada: conocida una cualquiera de ellas se puede averiguar las
otras tres. Hallemos por ejemplo algunas de esas relaciones.
Para expresar u en términos de p, podemos elevar al cuadrado cada uno

de los lados de la ecuación (3.4), y despejar u2 /c2 :
m20 c2
u2 /c2 = 1 − (3.13)
m20 c2 + p2
67
Para expresar u en términos de E, podemos elevar al cuadrado cada uno de
los lados de la ecuación (3.12), y despejar u2 /c2 :
m20 c4
u2 /c2 = 1 − (3.14)
E2
Para expresar E en términos de p, igualamos los lados derechos de las ecua-

ciones (3.13) y (3.14):
E 2 = m20 c4 + p2 c2 (3.15)
En forma similar se encuentran todas las conexiones entre las cuatro vari-
ables:
p m0 c2
E = m0 c2 + K = (m0 c2 )2 + p2 c2 = p
1 − u2 /c2
p m0 c2
K = E − m0 c2 = (m0 c2 )2 + p2 c2 − m0 c2 = p − m0 c2
1− u2 /c2
1p 2 1p m0 u
p = E − (m0 c2 )2 = (m0 c2 + K)2 − (m0 c2 )2 = p
c c 1 − u2 /c2
s s
µ ¶2 µ ¶−2
m0 c2 K c
u = c 1− =c 1− 1+ 2
=s µ ¶
E m0 c m0 c 2
1+
p
Masa cero: Para partı́culas de masa cero, como el fotón, el momentum se

denota por medio de la letra k, y su magnitud es k. Las fórmulas anteriores
se simplifican considerablemente:
k = E/c para masa cero. (3.16)
p
Bajas velocidades: El factor 1/ 1 − u2 /c2 se puede expandir usando la
fórmula del binomio de Newton:
68
µ ¶− 12
p 1 u2 1 u2 3 u4
1/ 1 − u2 /c2 = r = 1− 2 = 1+ + +···
u2 c 2 c2 8 c4
1−
c2
Si la velocidad es suficientemente baja podemos despreciar los términos del

u4 p 1 u2
orden de 4 . En este caso 1/ 1 − u2 /c2 → 1 + . Con este resultado
c 2 c2
llegamos a:
1
K → m0 u2
2
µ ¶
u2
m → m0 1 + 2 → m0
2c
µ ¶
u2
p → m0 u 1 + 2 → m0 u
2c
µ ¶
2 u2
E → m0 c 1+ 2 → m0 c2
2c
3.3 La energı́a en la relatividad especial

El momentum newtoniano es m0 u, y el relativista es mu. La redefinición
m0 u → mu se hace con el propósito expreso de que la ley de la conservación
del momentum se cumpla para todos los observadores inerciales. De la mis-
ma manera, la energı́a relativista se define como en (3.10) para que la ley de
la conservación de la energı́a se cumpla absolutamente. Esta presentación
podrı́a parecer extraña, pero es sana: en vez de probar que el momentum y
la energı́a se conservan absolutamente, vamos a definir momentum y energı́a
de una manera que garantice que las dos leyes de conservación sean absolu-
tamente válidas. En la sección 3.1 vimos que el momentum se conserva abso-
lutamente si se define como p = mu ; el propósito de esta sección es probar
que la energı́a se conserva absolutamente si se define como E = m0 c2 + K .
Estudiemos [6] la colisión de dos objetos que tienen la misma masa en reposo
m0 . Pensemos que uno de los objetos es una piedra y el otro es de algún ma-
terial blando como barro; los objetos se escogen ası́ para que la colisión sea
completamente inelástica según un observador O que está en reposo respec-
to al centro de masa. La Figura 3.7 muestra, según O, las situaciones antes
y después del choque: los dos cuerpos, llamados A y B, tienen velocidad u
69
antes del choque. Como resultado del choque queda, al final, un sólo cuerpo,
en reposo, cuya masa en reposo es M0 . Nótese que como este cuerpo final
queda en reposo para O, este observador registra que la energı́a cinética se
ha perdido por completo: para O la colisión es completamente inelástica.
Ahora consideremos otro observador O0 que se mueve, respecto a O, con

velocidad u hacia la derecha. Es claro que para O0 la partı́cula A está en re-
poso antes del choque; la partı́cula B tiene una velocidad que llamaremos u0 .
La Figura 3.8 muestra las situaciones para O0 , antes y después del choque:
claramente el cuerpo final M0 tiene velocidad u.
Veamos cuál es, según O0 , el momentum total antes del choque:
m0 u0
mu0 = q ,
2
1 − u0 /c2
y el momentum después, también según O0 :
M0 u
Mu = q
1 − u2 /c2
Para O0 la ley de la conservación del momentum dice que
M0 u m u0
q = q 0
2
1 − u2 /c2 1 − u0 /c2
q
u0 1 − u2 /c2
M0 = m0 q (3.17)
u 2
1 − u0 /c2
Queremos expresar u0 en términos de u, para que en la ecuación (3.17)

aparezca una sola velocidad u. Notemos que el objeto B tiene velocidad u
según O, y tiene velocidad u0 respecto a O0 ; como estas u y u0 se refieren
al mismo cuerpo, deben satisfacer la ecuación (2.35). Haciendo u0x = −u0 ,
ux = −u y v = u, la ecuación (2.35) es:
(−u) − u
(−u0 ) = , de donde
u(−u)
1−
c2
70
2u
u0 =
1 + u2 /c2
Al poner este valor de u0 en la ecuación (3.17), se llega a
2m0
M0 = q (3.18)
1 − u2 /c2
Este resultado es novedoso: ya que M0 6= 2m0 , la masa en reposo total no

se conserva. El cambio de la masa en reposo es:
 
1
M0 − 2m0 = 2m0  q − 1 (3.19)
2 2
1 − u /c
Calculemos ahora el cambio en la energı́a cinética, de acuerdo con un obser-

vador inercial cualquiera O00 que se mueve, respecto a O , con una velocidad
arbitraria ω. Para el observador O00 los cuerpos A y B tienen velocidades
u00A y u00B , y el cuerpo final de masa M0 tiene velocidad U 00 . Para la trans-
formación entre los observadores O y O00 usamos la fórmula de adición de
velocidades (2.35):
u−ω −u − ω 0−ω
u00A = uω ; u00B = uω ; U 00 = = −ω (3.20)
1− 2 1+ 2 1−0
c c
Calculemos, según O00 , cuánto es la energı́a cinética perdida en la colisión.

Utilizamos la ecuación (3.8) para calcular la energı́a cinética antes y después
del choque:
00 00 00
Kantes = KA + KB
= (m00A c2 − m0 c2 ) + (m00B c2 − m0 c2 )
   
m0 c2 m0 c2
= q − m0 c2  +  q − m0 c2 
00 2 2 00 2 2
1 − uA /c 1 − uB /c
71
 
1
00
Kdespués = M 00 c2 − M0 c2 = M0 c2  q − 1
00 2 2
1−U /c
Entonces el cambio de energı́a cinética ∆K 00 = Kdespués

00 00
− Kantes es:
 
1
00
Kdespués 00
− Kantes = M0 c2  q − 1
1 − U 00 2 /c2
    (3.21)
m0 c2 m0 c2
− q − m0 c2  −  q − m0 c2 
00 2 2 00 2 2
1 − uA /c 1 − uB /c
Al poner las ecuaciones (3.20) en la ecuación (3.21) se obtiene
 
1
Kdespués − Kantes = −2m0 c2  q − 1 (3.22)
2 2
1 − u /c
Nótese que en el lado derecho de esta ecuación no aparece la velocidad ω del

observador O00 , lo que quiere decir que el cambio en la energı́a cinética es
el mismo para todos los observadores inerciales: es absoluto; por esta razón
hemos borrado la doble prima en K 00 . Si multiplicamos ambos lados de la
ecuación (3.19) por c2 encontramos:
 
1
(M0 − 2m0 ) c2 = 2m0 c2  q − 1 (3.23)
2 2
1 − u /c
Ahora, al sumar lado a lado las ecuaciones (3.22) y (3.23) se obtiene:
Kdespués − Kantes + (M0 − 2m0 )c2 = 0
2m0 c2 + Kantes = M0 c2 + Kdespués
72
Escribamos la última ecuación sugestivamente:
(m0 c2 + KA, antes ) + (m0 c2 + KB, antes ) = M0 c2 + Kdespués (3.24)
Consideremos un conjunto de cuerpos que chocan. En cualquier instante

el conjunto consta de cuerpos con masas en reposo m0,1 , m0,2 , m0,3 , · · · y
energı́as cinéticas K1 , K2 , K3 , · · · . La fórmula (3.24) dice que la cantidad
X
(m0,i c2 + Ki ) (3.25)
i
es una constante del movimiento. Queremos recalcar que la velocidad ω del

observador O00 , no aparece en (3.24), o sea que la ley de conservación (3.24)
no es relativa, sino absoluta. En otras palabras, (3.24) cumple el principio de
la relatividad (1.10), y podemos afirmar que la cantidad conservada (3.25)
debe ser importante. La llamamos energı́a total o también energı́a mecánica.
La energı́a total de una partı́cula es su energı́a cinética más su masa en reposo
multiplicada por c2 . Ası́ justificamos, a posteriori, que a la cantidad (3.10)
le hubiéramos dado el nombre de energı́a.
3.4 E = mc2
La palabra inercia se usa para denotar aquella oposición que presentan los
cuerpos cuando se intenta acelerarlos. De una manera gráfica podemos de-
cir que la inercia de un cuerpo corresponde a la presión que sentimos en
las manos cuando lo empujamos; al empujar una naranja o un camión sen-
timos muy diferentes grados de presión en nuestras manos, y decimos en
consecuencia que el camión tiene más inercia que una naranja. Siguiendo
una tradición de muchos siglos, la cantidad fı́sica asociada a la inercia de un
cuerpo es la masa.
Respecto al choque inelástico que estudiamos en la sección anterior, el au-

mento de masa en reposo M0 −2m0 es un aumento de la energı́a total interna.
En efecto, M0 − 2m0 es igual a la energı́a cinética perdida; en el choque esta
energı́a cinética se ha convertido en movimiento rotacional y vibracional de
las moléculas, es decir, calor. Todo este calor es energı́a interna, es masa, es
inercia. Un cuerpo puede contener, albergar, muchas clases de energı́a: masa
73
en reposo de las partı́culas que lo componen, energı́a cinética de ellas y toda
clase de energı́as de interacción entre ellas. La suma de todas estas energı́as
internas se manifiesta como masa; la masa del cuerpo es una medida de la
suma de todas esas energı́as internas.
La relación entre masa y energı́a, dada por la ecuación (3.11), fue, en pal-
abras de Einstein, “el pensamiento más feliz de mi vida”. El artı́culo en el
que publicó este resultado [3] tiene una extensión de menos de tres páginas,
y él lo presenta como una continuación del artı́culo principal [2] de la rel-
atividad. Para deducir la relación entre masa y energı́a, calcula la energı́a
cinética de un cuerpo que emite dos pulsos de luz. Esta es, claramente, una
referencia a la masa inercial del cuerpo; habrı́an de pasar seis años para
que se diera cuenta de que cuando un cuerpo sufre un cambio en su masa
inercial, también sufre un cambio en su masa gravitacional, y que ambos
cambios tienen exactamente la misma magnitud.
Conviene recalcar que aunque la masa y la energı́a están conectadas por

una relación tan simple como E = mc2 , esto no significa que masa y energı́a
sean conceptos idénticos. De hecho, puede haber la segunda sin que haya la
primera: el fotón tiene energı́a, mas no masa.
Afirmamos arriba que la masa de un sistema fı́sico es una medida de su

energı́a interna. En términos de mecánica cuántica, la masa es mayor cuan-
do el sistema ocupa un estado excitado que cuando ocupa el estado básico.
Para ilustrar lo que estamos mencionando, supongamos una molécula for-
mada por dos átomos idénticos; si los dos átomos están en el mismo estado
cuántico, podemos afirmar que tienen la misma masa y por consiguiente el
centro de masa de la molécula está en el punto medio de la lı́nea que los une;
pero si uno de los átomos está en un estado excitado y el otro no, el primero
tiene mayor masa que el segundo y en consecuencia el centro de masa de la
molécula no queda en el punto medio de la lı́nea que los une.
Energı́a de enlace. Cuando Einstein publicó su ecuación E = mc2 , di-

jo claramente que “la radiación transporta inercia”. Decenios de experi-
mentación en fı́sica nuclear y en partı́culas elementales habrı́an de corrob-
orar la validez de esta afirmación. Para verlo con claridad introducimos a
continuación el concepto de energı́a de enlace, valiéndonos de un ejemplo de
la fı́sica nuclear. El deuterón es una partı́cula formada por un protón y un
neutrón. Las masas en reposo de estas tres partı́culas son
74
mp = 938.27 MeV/c2 (3.26)
mn = 939.57 MeV/c2 (3.27)
md = 1875.61 MeV/c2 (3.28)
Rápidamente nos damos cuenta de que mp + mn 6= md . La energı́a de enlace

es, en este caso, (mp + mn )c2 − md c2 = 2.23 MeV. Cuando un fotón in-
cide sobre un deuterón, puede desintegrarlo, produciéndose un protón y un
neutrón. Para que esto ocurra, la energı́a del fotón debe ser igual o mayor
que 2.23 MeV. Ası́ mismo, un protón y un neutrón libres pueden formar
un deuterón; cuando esto ocurre se emite un fotón de energı́a 2.23 MeV.
Lo que hemos mencionado para el deuterón también ocurre fácilmente con
otros núcleos livianos:
núcleo liviano 1 + núcleo liviano 2 → núcleo 3 + fotón (3.29)
Ya que el fotón porta energı́a, es claro que la masa en reposo del núcleo 3
tiene que ser menor que la suma de las masas en reposo de los núcleos 1 y
2. El proceso general (3.29) se llama fusión nuclear y es lo que ocurre en el
Sol, donde dos hidrógenos se pueden fusionar para producir un fotón y un
átomo de helio. De otro lado, en los núcleos pesados es frecuente la reacción:
núcleo pesado → núcleo1 + núcleo 2 + fotón (3.30)
Ya que el fotón porta energı́a, la masa en reposo del núcleo pesado tiene
que ser mayor que la suma de las masas en reposo de los núcleos 1 y 2.
El proceso general (3.30) se llama fisión nuclear, y es lo que ocurre en las
plantas de energı́a nuclear.
3.5 La velocidad lı́mite

p
La ecuación K = m0 c2 / 1 − u2 /c2 − m0 c2 que aparece en la página 68 dice
claramente que K → ∞ cuando u → c . En palabras, para llevar un objeto
masivo desde el reposo hasta que tenga la velocidad de la luz, es necesario
añadirle una cantidad infinita de energı́a. Como es imposible usar una canti-
dad infinita de energı́a, concluimos que ningún objeto masivo se puede llevar
75
hasta la velocidad de la luz. Un sistema de referencia es un cuerpo de reglas
y relojes y, por consiguiente, no puede ser llevado desde el reposo hasta c .
Esta es la razón por la que escribimos la frase en bastardilla en la página
17.
Debemos tener en cuenta que el espaciotiempo de la relatividad especial

tiene un intervalo estático; en efecto, dados un ∆t y un ∆r, el intervalo
(2.1) es constante, no cambia en el tiempo. Cuando se estudien condiciones
que se salen del marco de la relatividad especial, no puede sorprendernos que
ocurran cosas diferentes a las que hemos discutido. Por ejemplo, si el espacio
está explotando, como afirma la teorı́a del big-bang, el intervalo entre dos
eventos fijos no es constante, y en consecuencia[?] algunas galaxias pueden
tener, respecto a nosotros, velocidades mayores que c.
3.6 Las transformaciones de p , E , m , F

Consideremos una partı́cula de masa en reposo m0 sobre la cual se ejerce
una fuerza. Las cantidades fı́sicas que registra O son p , E , m , F , y las de O0
son p0 , E 0 , m0 , F0 . Nos proponemos encontrar las ecuaciones que expresan
las cantidades primadas en términos de las no primadas. Antes de ejecutar
esta tarea es conveniente que demostremos la fórmula:
vu0x
1 1+
p =p c2
p (3.31)
2
1 − u /c 2 1 − u /c 1 − v 2 /c2
0 2 2
Esta ecuación será utilizada varias veces a lo largo de esta sección. Para
deducir la ecuación (3.31) elevamos al cuadrado cada uno de los lados de las
ecuaciones (2.32) , (2.33) y (2.34), obteniéndose:
¡ ¢ ¡ ¢
(u0 + v)2 1 − v 2 /c2 u0y2 1 − v 2 /c2 u0z2
u2x =µ x ¶ ; u2y = µ ¶ ; u2z = µ ¶
vu0x 2 vu0x 2 vu0x 2
1+ 2 1+ 2 1+ 2
c c c
Ahora sumamos, lado a lado, estas tres ecuaciones:
1 £ 0 ¡ ¢¡ 02 ¢¤
u2x + u2y + u2z = µ 0
2 2 2
¶2 (ux + v) + 1 − v /c uy + u0z2
vu
1 + 2x
c
76
En el lado izquierdo identificamos u2x + u2y + u2z = u2 ; en el lado derecho
identificamos u0y2 + u0z2 = u0 2 − u0x2 :
¡ ¢¡ ¢
2 (u0x + v)2 + 1 − v 2 /c2 u0 2 − u0x2
u = µ ¶
vu0 2
1 + 2x
c
µ 0 ¶2
v 2 u0 2 vux
v 2 + u0 2 − 2 + + 2vu0x
c c
= µ ¶
vu0x 2
1+ 2
c
Observemos los dos últimos términos del numerador; si sumamos c2 se com-

pleta el cuadrado:
µ ¶
v 2 u0 2 2 2 vu0x 2
v2 + u0 2 − 2 −c +c 1+ 2
2 c c
u = µ 0
¶2
vu
1 + 2x
c
v 2 u0 2
v 2 + u0 2 − 2 − c2
= c + c2
µ ¶
vu0x 2
1+ 2
c
v 2 u0 2
−v 2 − u0 2 + 2 + c2
c2 − u2 = c
µ ¶
vu0x 2
1+ 2
c
c2 (1 − v 2 /c2 )(1 − u0 2 /c2 )
= µ ¶
vu0x 2
1+ 2
c
Ahora dividir ambos lados por c2 :
(1 − v 2 /c2 )(1 − u0 2 /c2 )

1 − u2 /c2 = µ ¶ ,
vu0x 2
1+ 2
c
77
y de aquı́ se sigue la fórmula (3.31), que es lo que querı́amos demostrar. Ya es-
tamos en condición de calcular la transformación del momentum. Comence-
mos con px que es
m0 ux
px = p
1 − u2 /c2
En el numerador usamos la ecuación (2.32) y en el denominador usamos la

ecuación (3.31):
Ã !
1 m0 u0x m0 c2 v
px = p p +p
1 − v 2 /c2 02
1 − u /c2 1 − u /c 2
02 2 c
vE 0
p0x + 2
= p c
1 − v 2 /c2
Con procedimientos similares se encuentra que py = p0y y que pz = p0z .

Ataquemos ahora la transformación de la energı́a:
m0 c2
E=p
1 − u2 /c2
En el denominador usamos la ecuación (3.31):
Ã !
1 m0 c2 m0 u0x
E = p p +v p
1 − v 2 /c2 1 − u02 /c2 1 − u02 /c2
E 0 + vp0x
= p
1 − v 2 /c2
Reunamos las transformaciones obtenidas hasta el momento:
E = γ (E 0 + vp0x ) (3.32)
³ v ´
px = γ p0x + 2 E 0 (3.33)
c
0
py = py , pz = p0z (3.34)
78
A partir de estas cuatro ecuaciones se obtienen las transformaciones inversas
cambiando v por −v e intercambiando variables primadas con no primadas:
E 0 = γ (E − vpx )
³ v ´
p0x = γ px − 2 E (3.35)
c
p0y = py , p0z = pz
Dedujimos las transformaciones de E y p estudiando una partı́cula cualquiera,

de masa m0 . Debemos anotar, sin embargo, que estas transformaciones
tienen validez general, ya que se aplican a cualquier sistema fı́sico. Pensemos
que las últimas ocho ecuaciones son las fórmulas de transformación de la en-
ergı́a y el momentum de cualquier sistema (una nube, un planeta, etc.). Las
cuatro ecuaciones (3.35) son como las cuatro ecuaciones (1.33), si se admite
la correspondencia E/c ↔ ct, px ↔ x, py ↔ y, pz ↔ z. Más concisamente:
µ ¶
E
,p ↔ (ct , r) (3.36)
c
La asociación (3.36) se dice, en palabras, ası́: (E/c , p) transforma como

(ct , r); ası́ se definen los vectores, asunto que trataremos en detalle en el
capı́tulo 5, dedicado a los tensores de la relatividad especial. De otro lado,
estamos a un paso de definir el momentum del fotón y deducir las fórmulas
de la aberración de la luz y del efecto Doppler; pero aplazamos esta tarea
hasta la sección 5.8.
La transformación de la masa se obtiene muy fácilmente si reescribimos

la ecuación (3.32) de la manera siguiente:
mc2 = γ (m0 c2 + m0 vu0x ) ,
de donde:
µ ¶
vu0x
m = γ 1+ 2 m0 (3.37)
c
³ vux ´
m0 = γ 1 − 2 m (3.38)
c
79
Nos queda por calcular la transformación de la fuerza. Comencemos con Fx .
dpx
Escribimos Fx = y usamos la ecuación (2.28):
dt
γ −1 d
Fx = px
vu0x dt0
1+ 2
c
Ahora utilizamos la fórmula (3.33):
µ ¶
1 dp0x v dE 0
Fx = +
vu0 dt0 c2 dt0
1 + 2x
c
dp0x
En el paréntesis del lado derecho reconocemos que = Fx0 y que E 0 =
dt0
m0 c2 ; entonces
1 0 dm0
Fx = (F + v )
vu0x x dt0
1+ 2
c
dm0 1
Ahora, la ecuación (3.47) dice que 0
= 2 F0 · u0 , o sea que
dt c
1 v
Fx = 0 (Fx0 + 2 F0 · u0 )
vu c
1 + 2x
c
Repitamos este análisis para Fy :
γ −1 d
Fy = py
vu0x dt0
1+ 2
c
dpy0 γ −1
Pero py = p0y y = Fy0 , entonces Fy = F 0 , y para Fz un
dt0 vu0x y
1+ 2
c
resultado similar. En conclusión:
80
v 0 0
Fx0 + u ·F
Fx = c2 (3.39)
vu0
1 + 2x
c
γ −1
Fy = F0 (3.40)
vux0 y
1+ 2
c
γ −1
Fz = F0 (3.41)
vux0 z
1+ 2
c
Estas ecuaciones dicen claramente que F0 = 0 ⇔ F = 0: si una partı́cu-

la aparece en equilibrio (en otras palabras, la partı́cula es libre) para un
observador, también aparece en equilibrio para todos los otros observadores
inerciales. Además F0 6= 0 ⇔ F 6= 0: si una partı́cula no aparece en equilibrio
para un observador, entonces todos los otros observadores inerciales regis-
tran que la partı́cula no está en equilibrio. En otras palabras: la condición
de equilibrio es absoluta, y la situación de desequilibrio también es absoluta.
Las recı́procas de las últimas tres ecuaciones son
v
Fx − u·F
Fx0 = c2 (3.42)
vux
1− 2
c
γ −1
Fy0 = vux Fy (3.43)
1− 2
c
γ −1
Fz0 = vux Fz (3.44)
1− 2
c
¦¦¦¦¦¦¦¦¦¦¦¦¦
Ya hemos sentado las bases de la nueva mecánica, relativista. En este mo-

mento el capı́tulo cambia el rumbo que traı́a, para dedicarse al estudio de
ejemplos y casos particulares. Comenzamos con el estudio de una partı́cu-
la cargada que viaja en una región donde hay un potencial electrostático;
luego planteamos el problema general de la aceleración relativista y final-
mente aplicamos este estudio al caso importante de la partı́cula cargada que,
por la acción de un campo magnético, describe una trayectoria circular. Es
81
bien sabido que las cargas eléctricas aceleradas emiten radiación electro-
magnética, y todo estudio riguroso deberı́a tener en cuenta esta pérdida de
momentum y energı́a. El análisis detallado de esta radiación es intrincado
y, de seguirlo, podrı́a distraernos de nuestro propósito principal, que es de-
scribir la ideas esenciales de la mecánica relativistas. Por este motivo, para
simplificar los cálculos, nos olvidaremos de la radiación. Sabemos que de esta
manera se cometen errores esenciales, pero lo hacemos en aras de enfatizar
los aspectos relativistas de la mecánica.
3.7 Masa y potencial electrostático

Estudiemos el movimiento de una partı́cula cargada que se mueve en una
región donde hay un potencial electrostático V . Para simplificar el análisis
supongamos que el movimiento de la partı́cula es en la dirección x. El campo
eléctrico es −dV /dx, la fuerza es −q dV /dx y el trabajo que realiza el campo
cuando la partı́cula se desplaza dx es (−q dV /dx) dx = −q dV. Escribamos
el trabajo total cuando la partı́cula pasa de un punto donde el potencial es
Vi , a otro punto donde el potencial es Vf :
Z Vf
Trabajo = −q dV = −q(Vf − Vi ) ≡ −q∆V (3.45)
Vi
Obsérvese que si q es positiva y ∆V es negativo, entonces el trabajo es posi-

tivo: la carga positiva gana velocidad a medida que desciende en el potencial
electrostático. Gana energı́a cinética, es decir gana masa. La masa que gana
la partı́cula es −q∆V /c2 .
¿Es la masa ganada −q∆V grande o pequeña? Para responder esta pre-
gunta debemos comparar −q∆V con alguna otra masa, y lo más natural es
compararla con m0 . El problema es altamente relativista si −q∆V À m0 c2 ,
y el problema no es relativista si −qV ¿ m0 c2 .
Por ejemplo, en el caso del electrón se tiene m0 c2 = 0.511 MeV; el régi-

men altamente relativista es e∆V À 0.5 MeV, es decir: ∆V À 0.5 MV.
Esto significa que para llevar un electrón al régimen altamente relativista
se necesita que la diferencia ∆V sea mucho mayor que 0.5 megavoltios.
Ası́ mismo, cuando ∆V sea mucho menor que 0.5 megavoltios, podremos
confiadamente pensar que el régimen no es relativista. De aquı́ se saca una
enseñanza: Cuando la energı́a cinética de una partı́cula es mucho mayor
82
que su masa en reposo, el régimen es altamente relativista. Y si la energı́a
cinética es mucho menor que la masa en reposo, el régimen no es relativista,
es decir, no se notan lo efectos relativistas.
Apliquemos el criterio establecido en el último párrafo al caso del electrón

en el átomo de hidrógeno. Las energı́as tı́picas del átomo son electronvoltios;
esto quiere decir que la energı́a cinética es del orden de 1 eV. Para comparar
esta energı́a cinética con la masa en reposo formamos el cociente ası́:
eV
≈ 10−5
0.5 MeV
Como 10−5 es bastante menor que 1, podemos afirmar que en el átomo de

hidrógeno no son prominentes los efectos relativistas. Por eso la solución
no relativista que Schroedinger le dio a este átomo en 1926 funciona bien.
Debemos apuntar, sin embargo, que los efectos relativistas en este átomo,
aunque pequeños, pueden notarse con instrumentos de alta precisión.
3.8 La aceleración
Averiguar la trayectoria de una partı́cula es llegar a una expresión del vector
posición r como función del tiempo t . Claramente, u = dr/dt y a = du/dt,
o sea que para averiguar la trayectoria se puede partir de la aceleración a , e
integrar dos veces. Ahora, para partir de la aceleración es necesario conocer
la fuerza F. En conclusión, para averiguar la trayectoria de una partı́cula
es necesario precisar cómo se averigua a cuando se conoce F. Usamos las
ecuaciones (3.3) y (3.5) para escribir:
d du dm
F = (mu) = m +u
dt dt dt
dm
= ma +u (3.46)
dt
Esta fórmula dice que, cuando la masa varı́a con el tiempo, la fuerza no
es simplemente ma. Es interesante anotar que la ecuación (3.46) es válida
tanto en la mecánica newtoniana (un cometa pierde agua por evaporación
cuando se acerca al Sol, y en consecuencia dm/dt 6= 0) como en la mecánica
relativista (cuando la partı́cula gana u su masa aumenta y en consecuencia
83
dm/dt 6= 0); el hecho, según (3.46), de que a no sea en general paralela a
F, no es un resultado exclusivo de la relatividad especial, sino que ya era
posible en la mecánica newtoniana. Para calcular dm/dt en el caso relativista
usamos las ecuaciones (3.10) y (3.11):
dm 1 dE 1 d 1 dK
= 2 = 2 (m0 c2 + K) = 2
dt c dt c dt c dt
Ahora, dK es un diferencial de trabajo F · dr:
dm 1 dr
= 2
F·
dt c dt
1
= F·u (3.47)
c2
Colocando esta ecuación en (3.46) escribimos:
F·u
F = ma + u, es decir: (3.48)
c2
F F·u
a = − u (3.49)
m mc2
Vemos ası́ que en la relatividad especial la aceleración no es, en general,

paralela a la fuerza. Se presentan sin embargo dos situaciones excepcionales
en las que fuerza y aceleración sı́ son paralelas: cuando F es paralela a u, y
cuando F es perpendicular a u. Si F es paralela a u la ecuación (3.49) da:
F F uu
a = −
m mc2
¡ ¢F
= 1 − u2 /c2
m
¡ ¢ F
3
= 1 − u2 /c2 2 para F k u (3.50)
m0
Ahora, si F y u son perpendiculares, la ecuación (3.49) da:
F
a =
m
84
¡ ¢ F
= 1 − u2 /c2 para F ⊥ u (3.51)
m0
La fórmula (3.50) se usa en el caso de los aceleradores lineales. La fórmula

(3.51) se usa en los ciclotrones y, en general, siempre que una carga eléctrica
se mueva en un lugar donde hay un campo magnético uniforme.
3.9 Movimiento circular

Estudiemos el movimiento de una partı́cula en un plano en coordenadas
polares (r, θ). El vector unitario 1r apunta en dirección de r, y el vector 1θ
es perpendicular a r. Es bien sabido [?] que:
dr dθ
u = 1r + 1θ r
dt dt
Ã µ ¶2 ! µ ¶
d2 r dθ dr dθ d2 θ
a = 1r −r + 1θ 2r +r 2
dt2 dt dt dt dt
Si colocamos este resultado en la ecuación general (3.49) se obtiene
Ã µ ¶2 ! µ ¶
d2 r dθ dr dθ d2 θ F F·u
1r −r + 1θ 2r +r 2 = − u (3.52)
dt2 dt dt dt dt m mc2
Pensemos ahora que se presentan estas condiciones: E = 0, B es uniforme

y una partı́cula ingresa con una velocidad u que es perpendicular a B. La
u
fuerza sobre la partı́cula es q × B. Esta fuerza es perpendicular a u y la
c
ecuación (3.49) dice que la aceleración también es perpendicular a u. En
conclusión, la fuerza ocasiona un cambio constante en la dirección de u sin
que cambie u, resultando ası́ un movimiento circular uniforme. Es claro que
dr d2 r d2 θ
= 2 = 2 = 0, y la ecuación (3.52) queda:
dt dt dt
µ ¶2
dθ q
−1r r = u×B
dt mc
µ ¶2
dθ |q|Bu
r =
dt mc
85
dθ
Ahora, r = u, entonces
dt
u2 |q|Bu
=
r mc
muc
r = (3.53)
|q|B
Partı́cula preparada en un filtro de velocidades. La fórmula (3.53)

se puede escribir:
m0 c u
r= q (3.54)
|q|B
1 − u2 /c2
Esta fórmula es útil si u es dado. Tal es el caso cuando, antes de entrar en el

campo B, la partı́cula es preparada en un filtro de velocidades. Sabemos [?]
que un filtro de velocidades se construye con campos E1 y B1 perpendicu-
lares. Una partı́cula de carga q y velocidad u experimenta una fuerza dada
1 1
por q(E1 + u1 × B1 ). Esta fuerza es cero si E1 + u1 × B1 = 0, es decir,
c c
si u1 × B1 = −E1 . Las únicas partı́culas cargadas que siguen derecho, sin
desviarse, son aquellas que ingresan al filtro con una velocidad cuya mag-
nitud es c E1 /B1 y cuya dirección es perpendicular a E1 y a B1 . Pensemos
en una partı́cula que emerge de este filtro de velocidades y luego entra en
la región donde existe el campo B. Hacemos entonces u = cE1 /B1 en la
ecuación (3.54):
m0 c2 E1 /B1
r= p : Cálculo relativista (3.55)
|q|B 1 − (E1 /B1 )2
En este momento nos preguntamos cuál serı́a el radio si hiciéramos el cálculo

de acuerdo con la fı́sica prerrelativista. Para contestar esta pregunta basta
que tomemos en la ecuación (3.55) la aproximación u2 /c2 ¿ 1, es decir,
(E1 /B1 )2 ¿ 1:
m0 c2 E1
r= : Cálculo prerrelativista (3.56)
|q|BB1
86
Partı́cula preparada en un acelerador. De acuerdo con la fórmula
(3.53):
pc
r= (3.57)
|q|B
p
De otro lado, traigamos de la página 68 la fórmula pc = (m0 c2 + K)2 − (m0 c2 )2 .
Si usamos este valor de pc en la ecuación (3.57) encontramos
1 p
r= (m0 c2 + K)2 − (m0 c2 )2 (3.58)
|q|B
Esta fórmula es útil cuando K es dado. Tal es el caso si, antes de entrar en el
campo B, la partı́cula es preparada en un acelerador. Supongamos que una
partı́cula de carga q es acelerada a través de una diferencia de potencial ∆V ;
de acuerdo con la ecuación (3.45) se tiene K = −q∆V = |q∆V |, entonces:
1 p
r = (m0 c2 + |q∆V |)2 − (m0 c2 )2
|q|B
p s
2m0 c2 |q∆V | |q∆V |
= 1+ (3.59)
|q|B 2m0 c2
Nos preguntamos de nuevo cuál habrı́a sido r si hubiéramos hecho el cálculo

usando la fı́sica prerrelativista. Basta que en la ecuación (3.59) se haga la
|q∆V |
aproximación u2 /c2 ¿ 1, es decir, ¿1:
m0 c2
p
2m0 c2 |q∆V |
r= : Cálculo prerrelativista (3.60)
|q|B
Ejemplo. Considere un filtro de velocidades construido con un campo

magnético de 2000 gauss y un campo eléctrico de 1800 statvolt/cm. Un
electrón emerge de este filtro y entra en una región donde hay un campo
magnético de 1500 gauss (al entrar en esta región la velocidad del electrón es
perpendicular al campo de 1500 gauss). Calcule el radio del cı́rculo descrito
por el electrón de dos maneras: usando la teorı́a de la relatividad y usando
la fı́sica prerrelativista.
Las cantidades fı́sicas de este problema son:
87
m0 c2 = 0.511 MeV, |q| = 4.8 × 10−10 esu
(3.61)
E1 = 1800 statvolt/cm, B1 = 2000 gauss, B = 1500 gauss
La fórmula (3.55) da, en este caso,
0.511 MeV 1800/2000

r = −10
s µ ¶
4.8 × 10 × 1500 dina 1800 2
1−
2000
Ahora, eV = 1.6 × 10−12 ergio, o sea que
eV/dina = 1.6 × 10−12 cm (3.62)
r = 2.35 cm Cálculo relativista. (3.63)
Para el cálculo prerrelativista usamos la ecuación (3.56), y se obtiene:
r = 1.02 cm Cálculo prerrelativista. (3.64)
La comparación entre las ecuaciones (3.63) y (3.64) muestra que el resultado

relativista es mayor que el prerrelativista. La causa de esto no es difı́cil
de rastrear; en efecto, la diferencia entre los dos cálculos está en la raı́z
cuadrada en el denominador de la ecuación (3.55), que es justamente el
que causa el crecimiento de la masa de una partı́cula en la teorı́a de la
relatividad. Se esperaba que el resultado del cálculo relativista fuera mayor
que el prerrelativista, porque en el primero la partı́cula es más masiva que
en el segundo, y esto debe notarse como una ampliación del cı́rculo.
Ejemplo. Un protón se acelera desde el reposo a través de una diferencia

de potencial de 5 MV y luego ingresa en una región donde hay un campo
magnético de 30000 gauss. Calcular el radio del cı́rculo de acuerdo con la
teorı́a de la relatividad, y luego usando la fı́sica prerrelativista. La masa del
protón es 938 MeV/c2 .
Las cantidades fı́sicas de este problema son:
88
m0 c2 = 938 MeV, |q| = 4.8 × 10−10 esu
B = 30000 gauss, |q∆V | = 5 MeV
Con estas cantidades la fórmula (3.59) es:
p r
2 × 938 × 5 × (MeV)2 5
r = 1+
4.8 × 10−10 × 30000 dina 2 × 938
Usar la fórmula (3.62):
√
r = 10.76 1 + 0.0027 cm = 10.77 cm (3.65)
El cálculo prerrelativista se hace con la ecuación (3.60). El resultado da

como en la ecuación (3.65), pero sin la raı́z cuadrada:
r = 10.76 cm : Cálculo prerrelativista. (3.66)
De nuevo, el resultado (3.65) es mayor que (3.66) porque la partı́cula tiene

mayor masa en la relatividad especial.
uy
ux
B uy ux
A
uy
ux
ux
uy
Figura 3.1 El choque de dos partı́culas según lo registra un observador O que

está en reposo respecto al centro de masa. La partı́cula A va de derecha a izquierda
y la partı́cula B de izquierda a derecha. ux y uy son cantidades positivas.
89
u'By
u'Bx
u'Bx
u'By
u'Ay
u'Ax
u'Ax
u'Ay
Figura 3.2 El mismo choque de

la Figura 3.1, según lo registra
otro observador O0 que viaja ha-
cia la derecha con velocidad v.
m e p e
u u
c c
Figura 3.3 La masa como fun- Figura 3.4 El momentum como

ción de la velocidad. La versión función de la velocidad. La ver-
newtoniana tiene la marca n, y sión newtoniana tiene la marca
la einsteiniana tiene la marca e. n, y la einsteiniana tiene la mar-
ca e.
90
K E e
e
u u
c c
Figura 3.5 Energı́a cinética en Figura 3.6 La energı́a total co-

función de la velocidad. La ver- mo función de la velocidad. La
sión newtoniana tiene la marca versión newtoniana tiene la mar-
n, y la einsteiniana tiene la marca n, y la einsteiniana tiene la
ca e. marca e.
Antes Después
mo mo
u u M0, reposo
A B
Figura 3.7 El choque de dos partı́culas de masas iguales, de acuerdo con un ob-
servador O que está en reposo respecto al centro de masa. Antes del choque las
partı́culas tienen velocidad u . El choque deja como resultado un cuerpo final en
reposo de masa M0 . Claramente la energı́a cinética final es cero: para O la colisión
es completamente inelástica.
Antes Después
Reposo
u' u M0
A B
Figura 3.8 El mismo choque de la Figura 3.7, pero ahora desde el punto de vista de
un observador O0 que se mueve hacia la derecha con velocidad u . Para O0 , antes del
choque el cuerpo A está en reposo y el cuerpo B tiene velocidad u0 hacia la izquierda.
Después del choque el cuerpo final M0 tiene velocidad u hacia la izquierda.
91
92
Capı́tulo 4
El campo electromagnético
En los capı́tulos anteriores discutimos algunas consecuencias del principio

de la relatividad. De un lado, nos vimos poco menos que obligados a gen-
eralizar los conceptos newtonianos de masa, momentum, energı́a, etc. Y de
otro lado, cuando dos observadores inerciales toman medidas de longitud,
tiempo, fuerza, etc., el principio de la relatividad nos mostró de qué manera
se establece una comparación entre las dos mediciones. El capı́tulo presente
se refiere a la segunda clase de consecuencias: estudiaremos cómo se com-
paran los campos eléctrico y magnético que registra un observador, con los
registros de otro observador. El tema es de primera importancia, como lo
demuestra el hecho de que el mismo Einstein, en el primer párrafo del artı́cu-
lo [2] en que publica su relatividad especial, presenta ası́ la motivación, la
idea central de su trabajo: las leyes del electromagnetismo deben ser, en el
fondo, las mismas para todos los observadores inerciales1 .
Concentraremos nuestra atención en la transformación del campo electro-

magnético, y presentaremos dos ejemplos interesantes: la carga móvil y el
alambre que porta una corriente. Finalmente veremos que la electrodinámica
cumple el principio de la relatividad, es decir, que las ecuaciones de Maxwell
y la ley de fuerza de Lorentz son covariantes bajo las transformaciones de
Lorentz.
4.1 Transformación de los campos E y B

De acuerdo con el observador O, las componentes del campo electromagnético
son E, B. El mismo campo electromagnético tiene, para O0 , componentes
1
El artı́culo lleva por tı́tulo Sobre la electrodinámica de cuerpos en movimiento. La
palabra cuerpo quiere decir observador inercial.
93
E0 , B0 . Nos proponemos encontrar la transformación entre E, B y E0 , B0 ;
es decir, vamos a encontrar las fórmulas que nos permiten escribir las com-
ponentes E0 , B0 en términos de las componentes E, B.
Para hallar las fórmulas de la transformación del campo electromagnético

asumiremos que las ecuaciones de Maxwell representan fielmente a las leyes
fı́sicas del electromagnetismo. De acuerdo con el principio de la relatividad
(1.10), la forma de estas ecuaciones debe ser la misma para todos los obser-
vadores inerciales. Tomemos dos de las ecuaciones de Maxwell:
1 ∂E
= ∇×B (4.1)
c ∂t
1 ∂B
= −∇ × E (4.2)
c ∂t
Ası́ son para el observador O. Siguiendo el principio de la relatividad, afir-

mamos que para O0 :
1 ∂E0
= ∇0 × B0 (4.3)
c ∂t0
1 ∂B0
= −∇0 × E0 (4.4)
c ∂t0
La parte y de la ecuación (4.1) es:
1
∂t Ey = ∂z Bx − ∂x Bz (4.5)
c
Ası́ mismo, la parte z de (4.2) y la parte z de (4.1) son:
1
∂t Bz = ∂y Ex − ∂x Ey (4.6)
c
1
∂t Ez = ∂x By − ∂y Bx (4.7)
c
Las ecuaciones de O0 que corresponden a (4.5), (4.6) y (4.7) son:
1
∂t0 Ey0 = ∂z 0 Bx0 − ∂x0 Bz0 (4.8)
c
94
1
∂t0 Bz0 = ∂y0 Ex0 − ∂x0 Ey0 (4.9)
c
1
∂t0 Ez0 = ∂x0 By0 − ∂y0 Bx0 (4.10)
c
Ahora ponemos las cuatro derivadas (1.44) en las ecuaciones (4.5)-(4.7) para
obtener:
1 ³ v ´ ³ v ´
∂t0 γ Ey − Bz = ∂z 0 Bx − ∂x0 γ Bz − Ey (4.11)
c c c
1 ³ v ´ ³ v ´
∂t0 γ Bz − Ey = ∂y0 Ex − ∂x0 γ Ey − Bz (4.12)
c c c
1 ³ v ´ ³ v ´
∂t0 γ Ez + By = ∂x0 γ By + Ez − ∂y0 Bx (4.13)
c c c
Al comparar las ecuaciones (4.8) y (4.11) vemos que Ey0 debe ser proporcional
v
a γ(Ey − Bz ), que Bx0 debe ser proporcional a Bx , y que Bz0 debe ser
c
v
proporcional a γ(Bz − Ey ). Llamemos f al factor de proporcionalidad.
c
Esta f debe ser independiente de t, x, y, z, pero puede, en principio, ser
función de v:
³ v ´
Ey0 = f (v)γ Ey − Bz (4.14)
c
Bx0 = f (v)Bx (4.15)
³ v ´
Bz0 = f (v)γ Bz − Ey (4.16)
c
De la misma manera, la comparación de las ecuaciones (4.9) y (4.12) da:
³ v ´
Bz0 = g(v)γ Bz − Ey (4.17)
c
Ex0 = g(v)Ex (4.18)
³ v ´
Ey0 = g(v)γ Ey − Ez , (4.19)
c
donde g(v) es algún factor de proporcionalidad. Finalmente, introduciendo

otro factor h(v), la comparación de las ecuaciones (4.10) y (4.13) da:
95
³ v ´
Ez0 = h(v)γ Ez + By (4.20)
c
³ v ´
By0 = h(v)γ By + Ez (4.21)
c
Bx0 = h(v)Bx (4.22)
Las ecuaciones (4.16) y (4.17) dicen que g = f , y las ecuaciones (4.15) y

(4.22) dicen que h = f . De este modo vemos que las seis componentes del
campo electromagnético transforman ası́ :
Ex0 = f (v)Ex (4.23)

³ v ´
Ey0 = f (v)γ Ey − Bz (4.24)
c
³ v ´
Ez0 = f (v)γ Ez + By (4.25)
c
Bx0 = f (v)Bx (4.26)

³ v ´
By0 = f (v)γ By + Ez (4.27)
c
³ v ´
Bz0 = f (v)γ Bz − Ey (4.28)
c
Nos queda por averiguar la función desconocida f (v). Anticipándonos al re-

sultado final, afirmamos que f (v) es igual a 1. Para probar esto seguiremos
tres pasos: primero probaremos que f (v) = f (−v), luego probaremos que
f (v) = ±1, y finalmente escogeremos el signo superior +.
Supongamos por un momento que Ey = 0; en este caso la ecuación (4.28)

da:
Bz0 = f (v)γBz (4.29)
Ahora pensemos en un tercer observador O00 que se mueve, respecto a O,

con velocidad v en dirección −x. En vista de la ecuación (4.29):
Bz00 = f (−v)γBz (4.30)
96
Claramente Bz0 y Bz00 deben ser iguales, entonces la comparación de las ecua-
ciones (4.29) y (4.30) da:
f (−v) = f (v) (4.31)
Pasemos ahora a escribir las recı́procas de las ecuaciones (4.24) y (4.28). Para
tal efecto intercambiamos variables primadas con no primadas y cambiamos
v por −v:
³ v 0´
Ey = f (−v)γ Ey0 + B
c z
³ v 0´
Bz = f (−v)γ Bz0 + E ,
c y
y en vista de (4.31):
³ v 0´
Ey = f (v)γ Ey0 + B
c z
³ v 0´
Bz = f (v)γ Bz0 + E
c y
Entonces, colocando estas expresiones de Ey y Bz en el lado derecho de

(4.24) encontramos:
h³ v ´ v³ 0 v ´i
Ey0 = f 2 γ 2 Ey0 + Bz0 − Bz + Ey0
c c c
µ ¶
v2
= f 2 γ 2 1 − 2 Ey0 ,
c
o sea que f 2 = 1:
f = ±1 (4.32)
Las ecuaciones (4.23) y (4.32) dicen que Ex0 = ±Ex . El signo inferior, −,
expresa una inversión del campo, que es increı́ble. Entonces en la ecuación
(4.32) debemos escoger el signo superior, f = 1, y las ecuaciones (4.23)-
(4.28) son, finalmente:
97
Ex0 = Ex (4.33)
³ v ´
Ey0 = γ Ey − Bz (4.34)
c
³ v ´
0
Ez = γ Ez + By (4.35)
c
Bx0 = Bx (4.36)
³ v ´
By0 = γ By + Ez (4.37)
c
³ v ´
Bz0 = γ Bz − Ey (4.38)
c
Estas seis ecuaciones de transformación se pueden escribir de un modo más

general, ası́:
v
E0 = E + (γ − 1)E⊥ + γ ×B (4.39)
c
v
B0 = B + (γ − 1)B⊥ − γ × E (4.40)
c
La ecuación (4.39) dice que el campo E0 se construye con dos aportes: de un

v
lado, el campo E, y del otro lado el campo inducido (γ − 1)E⊥ + γ × B.
c
Ası́ mismo, la ecuación (4.40) dice que el campo B0 se construye con dos
aportes: de un lado, el campo B, y del otro lado el campo inducido (γ −
v
1)B⊥ − γ × E . Fijemos nuestra atención en los campos inducidos.
c
Lo primero que debemos notar es que el campo inducido depende crucial-
mente de la velocidad v, ya que es cero cuando v es cero, y es una función
monótonamente creciente de v. Por esto debemos acostumbrarnos a pensar
que el campo inducido es inducido por v: es el movimiento de O0 lo que hace
aparecer un campo inducido en O0 . Pero no basta que O0 se esté moviendo
respecto a O. Se requiere además que en O haya campos perpendiculares
B⊥ o E⊥ , según se lee en las ecuaciones (4.39) y (4.40). Son los campos
perpendiculares en O los que inducen campos en O0 . Los campos paralelos
Ek y Bk no inducen campos en O0 .
Las seis ecuaciones (4.33)-(4.38) expresan a los campos primados en términos

de los no primados. Las ecuaciones recı́procas se obtienen intercambiando
variables primadas y no primadas, y cambiando v por −v:
98
Ex = Ex0 (4.41)
³ v 0 ´
Ey = γ Ey0 + B (4.42)
c z
³ v 0´
Ez = γ Ez0 − B (4.43)
c y
Bx = Bx0 (4.44)
³ v 0´
By = γ By0 − E (4.45)
c z
³ v 0´
Bz = γ Bz0 + E (4.46)
c y
Escribimos también las recı́procas de las ecuaciones (4.39) y (4.40):
v
E = E0 + (γ − 1)E0⊥ − γ × B0 (4.47)
c
v
B = B0 + (γ − 1)B0⊥ + γ × E0 (4.48)
c
4.2 Dos cantidades invariantes

En esta sección nos proponemos demostrar que las cantidades E·B y E 2 −B 2
son invariantes, es decir, que:
E · B = E0 · B0 (4.49)
E 2 − B 2 = E 02 − B 02 (4.50)
Para probar la ecuación (4.49) comenzamos escribiendo el producto E0 ·B0 en

la forma Ex0 Bx0 +Ey0 By0 +Ez0 Bz0 . Ahora procedemos a expresar esta cantidad en
términos de variables no primadas, para lo cual utilizamos las seis ecuaciones
(4.33)-(4.38):
E0 · B0 = Ex0 Bx0 + Ey0 By0 + Ez0 Bz0

³ v ´³ v ´
= Ex Bx + γ 2 Ey − Bz By + Ez
c c
99
³ v ´³ v ´
+γ 2 Ez + By Bz − Ey
c c
= Ex Bx + Ey By + Ez Bz
= E·B
De la misma manera se prueba la ecuación (4.50): comenzamos escribiendo

E 02 − B 02 en la forma Ex02 + Ey02 + Ez02 − Bx02 − By02 − Bz02 , y luego procedemos
a expresar esta cantidad en términos de variables no primadas, para lo cual
utilizamos las seis ecuaciones (4.33)-(4.38):
E 02 − B 02 = Ex02 + Ey02 + Ez02 − Bx02 − By02 − Bz02
³ v ´2 ³ v ´2
= Ex2 + γ 2 Ey − Bz + γ 2 Ez + By
c c
³ v ´2 ³ v ´2
−Bx02 − γ 2 By + Ez − γ 2 Bz − Ey
c c
= E2 − B2
Usaremos las cantidades E = |E| y B = |B|; es claro que E y B son mayores

o iguales a cero. La ecuación (4.50) tiene varias consecuencias interesantes:
E < B ⇐⇒ E 0 < B 0 (4.51)

B < E ⇐⇒ B 0 < E 0 (4.52)
E = B ⇐⇒ E 0 = B 0 (4.53)
Estas tres implicaciones, en palabras, rezan: Si uno de los campos (bien sea
el eléctrico o el magnético) es menor que el otro en un sistema de referencia,
lo será también en todos los otros sistemas de referencia. Si los dos campos
son de igual magnitud para un observador, serán de igual magnitud para
todos los observadores.
100
La existencia de dos cantidades invariantes, E·B y E 2 −B 2 , no es accidental,
sino que responde a la existencia de simetrı́as de fondo, como veremos en la
sección 6.6.
4.3 El campo electromagnético total
Supongamos que para el observador O0 el campo electromagnético aparece

puramente eléctrico, es decir, B0 = 0. ¿Cómo aparece el campo electro-
magnético para otro observador O que se mueve, respecto a O0 , con veloci-
dad −v ? La respuesta se obtiene haciendo B0 = 0 en las fórmulas (4.47) y
(4.48):
E = E0k + γE0⊥ (4.54)

v
B = γ × E0⊥ (4.55)
c
La ecuación (4.55) muestra que para O existe, en general, campo magnético.

Vemos ası́ que un campo electromagnético que es puramente eléctrico para
un observador aparece, a otros observadores, en general, como una mezcla de
campos eléctrico y magnético. Del mismo modo, cuando un campo electro-
magnético es puramente magnético para un observador, otros observadores
registran un campo magnético y además un campo eléctrico.
Esto nos recuerda los primeros párrafos del Capı́tulo 2, donde considerábamos
dos eventos con separación puramente espacial o puramente temporal, para
un observador. Apuntábamos en esa ocasión que para otros observadores
los eventos aparecen, en general, con separaciones espacial y temporal. Y
concluı́amos entonces que el espacio y el tiempo no son entidades inde-
pendientes, sino que forman un todo. Del mismo modo nosotros, ahora
hablando del campo electromagnético, afirmamos que los campos eléctrico y
magnético no son independientes uno del otro, sino que forman un todo elec-
tromagnético que es irreductible. Cada observador inercial puede establecer
un corte, un lindero, entre su campo eléctrico y su campo magnético, pero
el lindero que establece O es diferente al que establece O0 .
101
4.4 Una carga con velocidad uniforme
Para mostrar una aplicación de la transformación (4.41)-(4.46), queremos re-
solver un problema clásico de electromagnetismo, que consiste en averiguar
los campos eléctrico y magnético que produce una carga que tiene velocidad
rectilı́nea uniforme u . Este problema se puede resolver [9] por medio de los
potenciales de Liénard-Wiechert, en los que se tiene en cuenta que la señal
electromagnética toma cierto tiempo para viajar desde la partı́cula hasta el
punto de observación, lo que hace necesario que se usen tiempos retardados.
Este modo de atacar el problema es complicado. En esta sección lo resolver-
emos muy fácilmente, utilizando nuestros conocimientos de relatividad. La
estrategia es resolver inicialmente el problema de acuerdo con un observador
inercial O0 en reposo respecto a la partı́cula; una vez obtenidos E0 , B0 , uti-
lizamos las seis ecuaciones (4.41)-(4.46) para averiguar los campos E, B que
registra otro observador que se mueve, respecto al anterior, con velocidad
constante −u .
Para O0 el fenómeno es muy simple. Como la carga está en reposo, no hay

campo magnético B0 , y el campo eléctrico E0 es el de Coulomb:
B0 = 0 (4.56)
q
E0 = 1r0
r02
Aquı́, 1r0 es un vector unitario que apunta en la dirección de r0 . Claramente

r0 qr0
1r0 = 0 y el campo eléctrico es E0 = 03 . Las tres componentes cartesianas
r r
de este campo son:
qx0 qy 0 qz 0
Ex0 = ; Ey0 = ; Ez0 = (4.57)
r03 r03 r03
Tal como hemos indicado, O0 se mueve respecto a O con velocidad u . Nótese

que esta u está jugando el papel que siempre le hemos asignado a v , lo que
quiere decir que el γ de la ecuación (1.32) ahora quiere decir
1
γ=p (4.58)
1 − u2 /c2
102
En este momento suponemos que el eje x está orientado paralelo a la ve-
locidad u de la partı́cula, y podemos colocar los campos primados (4.56) y
(4.57) en las seis ecuaciones (4.41)-(4.46) para obtener:
qx0
Ex = Bx = 0
r03
γqy 0 quγ z 0
Ey = 03 By = −
r c r03
γqz 0 quγ y 0
Ez = 03 Bz =
r c r03
Estos son los campos para el observador O. Debemos, sin embargo, pulir
estas expresiones para que contengan únicamente variables no primadas,
utilizando las transformaciones de Lorentz (1.33). Al ejecutar esta tarea se
debe recordar que r03 = (x02 + y 02 + z 02 )3/2 = [γ 2 (x − ut)2 + y 2 + z 2 ]3/2 :
qγ(x − ut)
Ex =
− ut)2 + y 2 + z 2 ]3/2
[γ 2 (x
qγy
Ey = 2 (4.59)
[γ (x − ut)2 + y 2 + z 2 ]3/2
qγz
Ez = 2
[γ (x − ut)2 + y 2 + z 2 ]3/2
Bx = 0
quγ
z
By = − 2 c
[γ (x − ut)2 + y 2 + z 2 ]3/2 (4.60)
quγ
y
By = 2 c
[γ (x − ut)2 + y 2 + z 2 ]3/2
La Figura 4.1 muestra el campo E para u = 0; nótese que E es radial e

isotrópico. La Figura 4.2 es para u 6= 0: el campo E es radial (respecto a la
posición de la partı́cula) pero no es isotrópico.
El flujo de energı́a. La densidad de energı́a por unidad de volumen es

1 ¡ ¢
(campo eléctrico)2 + (campo magnético)2 de donde vemos que tanto
8π
103
para O0 como para O, hay energı́a electromagnética. Ahora, como para O0
la carga está en reposo, la energı́a electromagnética también está en reposo.
Sin embargo, para O la partı́cula se mueve y este observador deberı́a registrar
que la energı́a electromagnética fluye. La cantidad adecuada para describir
el flujo de la energı́a electromagnética es el vector de Poynting:
c
S= E×B (4.61)
4π
S es la cantidad de energı́a electromagnética que, por unidad de tiempo,

cruza la unidad de área perpendicular. Utilizando las seis ecuaciones (4.59)
y (4.60) obtenemos:
q 2 uγ 2 (y 2 + z 2 )1x − (x − ut)(y1y + z1z )

S=
4π [γ 2 (x − ut)2 + y 2 + z 2 ]3
Podemos especializar esta fórmula en z = 0:
q 2 uγ 2 y 2 1x − (x − ut)y1y
S= (4.62)
4π [γ 2 (x − ut)2 + y 2 ]3
4.5 Un alambre recto con corriente

A continuación vamos a estudiar [6] lo que ocurre con un alambre recto que
porta una corriente, desde el punto de vista de la relatividad. Llegaremos a
un resultado interesante: si el alambre aparece neutro para un observador,
entonces aparece cargado para otros observadores.
Para comprender este efecto es importante que nos demos cuenta del modo
como están repartidas las partı́culas cargadas dentro de un metal. Los iones
positivos forman una red aproximadamente inmóvil, y algunos electrones
forman un fluido que viaja, que se cuela a través de la malla rı́gida, cuan-
do hay una diferencia de potencial. La Figura 4.3 muestra un modelo para
entender la corriente en un alambre recto, de acuerdo con un observador O
que se encuentra en reposo respecto a los iones positivos. Los electrones se
mueven hacia la derecha con una velocidad u, o sea que la corriente eléctrica
va hacia la izquierda.
104
Supongamos que para O el alambre es neutro. Esto quiere decir que las
cargas positivas y negativas son equidistantes. Sin embargo, el fenómeno
debe aparecer diferente a otro observador O0 que se mueve con velocidad u
hacia la derecha, según muestra la Figura 4.4. En esta figura aparecen, en
lı́neas punteadas, las trayectorias de los iones y de los electrones. Nótese que
para O0 la distancia entre electrones es mayor que la distancia entre iones
positivos. Esto quiere decir que, para O0 , la densidad de carga positiva por
unidad de longitud es mayor que la densidad negativa: el alambre que es
neutro para O es cargado para O0 .
Estudio formal. Veamos de qué manera las ecuaciones de la teorı́a de la

relatividad dan cuenta del fenómeno que acabamos de describir cualitativa-
mente. Llamemos d0+ y d − a las densidades de carga positiva y negativa,
según el observador O. Nótese el subı́ndice cero en la densidad positiva,
acentuando que para O las cargas positivas están en reposo. Claramente,
d0+ > 0 , d − < 0 (4.63)
Para el observador O0 los electrones están en reposo y forman una densidad

de carga d0− , y los iones positivos tienen una velocidad u y forman una
densidad de carga d + . Claramente,
d0− < 0 , d + > 0 (4.64)
Para O la densidad neta es:
d = d0+ + d − (4.65)
mientras que la densidad neta para O0 es
d0 = d + + d0− (4.66)
Ahora, de acuerdo con2 la ecuación (2.24):

2
Aquı́ también γ está dada por la ecuación (4.58).
105
d + = γd0+ (4.67)
d − = γd0− , (4.68)
entonces las ecuaciones (4.65) y (4.66) son:
d = d0+ + γd0− (4.69)

d0 = γd0+ + d0− (4.70)
Nótese que
d0 = d + (γ − 1)(d0+ − d0− ) (4.71)
Recordemos, de acuerdo con las fórmulas (4.63) y (4.64), que d0+ y −d0−
son cantidades positivas, entonces la ecuación (4.71) dice que d0 > d: la
densidad de carga por unidad de longitud es mayor para O0 que para O. Si
d = 0, entonces la ecuación (4.69) da d0− = −d0+ /γ, y las ecuaciones (4.68)
y (4.71) se convierten en:
d − = −d0+ (4.72)
d0 = (γ − γ −1 )d0+ (4.73)
Los campos. Pasemos ahora a calcular los campos eléctrico y magnético.

Pensemos en el problema general de un alambre recto que tiene cierta carga
por unidad de longitud; es bien sabido que el campo eléctrico a una distancia
R del alambre está dado por:
2 × carga por unidad de longitud

campo eléctrico = (4.74)
R
y si el alambre porta una corriente se usa la ley de Biot-Savart:
2 × corriente
campo magnético = (4.75)
cR
Apliquemos las fórmulas (4.74) y (4.75) al observador O:
106
E = 0 (4.76)
2ud −
B = − ,
cR
donde hemos puesto el signo − para que la magnitud B resulte positiva. En

vista de la ecuación (4.72):
2ud0+
B= (4.77)
cR
También podemos usar las fórmulas (4.74) y (4.75) para el observador O0 :
2d0
E0 =
R
2ud +
B0 = ,
cR
y en vista de las ecuaciones (4.73) y (4.67):
2(γ − γ −1 )d0+
E0 = (4.78)
R
+
2γud0
B0 = (4.79)
cR
Finalmente, conviene anotar que las ecuaciones (4.76), (4.77), (4.78) y (4.79)
satisfacen las reglas de transformación (4.34) y (4.38). Esta es una pequeña
prueba de consistencia de nuestra teorı́a relativista del electromagnetismo.
Circuitos. Hemos estudiado un alambre recto que, para O, es neutro y

porta una corriente eléctrica hacia la izquierda; para O0 el alambre aparece
cargado positivamente. Ası́ mismo, si para O la corriente es hacia la izquier-
da, entonces para O0 el alambre aparece cargado negativamente. Pensemos
ahora en un circuito rectangular que porta una corriente eléctrica, como en
la Figura 4.5. Para O0 , el lado CD está cargado positivamente y el lado AB
negativamente, dando como resultado [?] un momento dipolar eléctrico que
apunta hacia arriba. El observador O0 puede legı́timamente concluir que los
circuitos eléctricos que se mueven tienen momento dipolar eléctrico.
107
4.6 Anulando el campo menor
Hemos visto que los valores de los campos eléctrico y magnético dependen
del estado de movimiento del observador. Nos preguntamos ahora si para
algún observador se vuelve cero alguno de los dos campos. Si para algún
observador el campo eléctrico (magnético) es cero, decimos que el campo
eléctrico (magnético) es anulable.
Rápidamente nos damos cuenta de qué condiciones se deben cumplir para

que un campo sea anulable. Supongamos por ejemplo que el campo magnético
es anulable y llamemos O0 al observador que registra que el campo magnético
es cero: B0 = 0. Esta ecuación implica que E0 · B0 = 0 y que B 0 < E 0 . Pero,
de acuerdo con (4.49) y (4.52), estas dos propiedades son invariantes, de
donde podemos concluir que, para cualquier observador, el producto escalar
de los dos campos es cero y el campo magnético es menor que el eléctrico.
Un resultado similar se obtiene cuando el campo eléctrico es anulable.
También abordaremos el asunto importante de identificar al observador O0

para el cual uno de los dos campos es nulo. Para identificar a O0 basta decir
cuál es la velocidad v que O0 tiene respecto a O .
Anulación del campo magnético. Suponiendo que para O0 el campo

magnético se anula, podemos escribir B0 = 0 y la ecuación (4.40) queda ası́:
v
B + (γ − 1)B⊥ − γ ×E = 0 (4.80)
c
En ambos lados de esta ecuación multiplicamos escalarmente con v :
v
v · B + (γ − 1)v · B⊥ − γv · ×E = 0
c
Esta ecuación es v · B + 0 − 0 = 0, o sea que v es perpendicular a B.

Entonces B⊥ = B, y la ecuación (4.80) se simplifica:
v
B = ×E (4.81)
c
vE
B = sen α (4.82)
c
108
v B
sen α = (4.83)
c E
Aquı́ α es el ángulo entre E y v . La Figura 4.6 muestra los campos E y B

perpendiculares, y además al vector v que es perpendicular a B. Claramente
existe un número infinito de vectores v que satisfacen la ecuación (4.83).
Esto quiere decir que cuando B < E y E es ortogonal a B, hay un número
infinito de observadores inerciales para los cuales el campo magnético se
anula.
Anulación del campo eléctrico. La anulación del campo eléctrico es

muy parecida a la del campo magnético. Suponiendo que para O0 el campo
eléctrico se anula, podemos escribir E0 = 0 y la ecuación (4.39) queda ası́:
v
E + (γ − 1)E⊥ + γ ×E = 0 (4.84)
c
En ambos lados de esta ecuación multiplicamos escalarmente con v :
v
v · E + (γ − 1)v · E⊥ + γv · ×B = 0
c
Esta ecuación es v · E + 0 − 0 = 0, o sea que v es perpendicular a E.

Entonces E⊥ = E, y la ecuación (4.80) se simplifica:
v
E = − ×B (4.85)
c
vB
E = sen β (4.86)
c
v E
sen β = (4.87)
c B
Aquı́ β es el ángulo entre B y v . La Figura 4.7 muestra los campos E y B

perpendiculares, y además al vector v que es perpendicular a E. Claramente
existe un número infinito de vectores v que satisfacen la ecuación (4.87).
Esto quiere decir que cuando E < B y E es ortogonal a B, hay un número
infinito de observadores inerciales para los cuales el campo eléctrico se anula.
109
Conclusión. La anulación de un campo puede darse cuando se cumplen
estas dos condiciones: que sean perpendiculares entre sı́ y que no tengan la
misma magnitud; de los dos campos, el menor es anulable y el otro no. Si E
es anulable, v tiene que ser perpendicular a E ; ası́ mismo, si B es anulable,
v tiene que ser perpendicular a B . En resumen, v debe ser perpendicular
al campo menor.
La luz no es anulable. Una de las peculiaridades de la luz es que, en todo

punto r y en cualquier instante t, los campos eléctrico y magnético tienen
la misma magnitud. Como B ≮ E, el campo magnético no es anulable, y
como E ≮ B, el campo eléctrico tampoco es anulable.
4.7 La corriente eléctrica

Estudiábamos en la página 43 una nube de partı́culas cargadas, y llamábamos
u a la trivelocidad promedio de una pequeña porción de la nube. El trivector
J se define ası́:
J = ρu , (4.88)
nqu
J = p (4.89)
V0 1 − u2 /c2
La magnitud de J es la cantidad de carga que, por unidad de tiempo, cruza

una unidad de área perpendicular a u. Llamemos r al vector posición del
pequeño volumen de nube que estamos estudiando. Claramente u = dr/dt,
y en consecuencia la ecuación (4.89) queda ası́:
nq
J = p dr (4.90)
V0 dt 1 − u2 /c2
De otro lado, multiplicando ambos lados de la ecuación (2.25) por c llegamos

a
nq
ρc = q cdt (4.91)
V0 dt 1 − u2 /c2
En los denominadores de las dos últimas ecuaciones reconocemos el tiempo
propio dτ :
110
nq nq
ρc = cdt , J = dr
V0 dτ V0 dτ
nq
Notemos que en estas expresiones el quebrado es un escalar. Esto es
V0 dτ
importante porque indica que las cuatro cantidades (cρ, J) transforman, bajo
un cambio de coordenadas, ası́ como transforman los cuatro diferenciales
(cdt, dr). Más concretamente, podemos utilizar las ecuaciones (1.34) para
escribir
v
ρ0 + 2 Jx0
ρ = p c (4.92)
1 − v 2 /c2
J 0 + vρ0
Jx = px (4.93)
1 − v 2 /c2
Jy = Jy0 (4.94)
Jz = Jz0 (4.95)
4.8 Covariancia de la electrodinámica

Tenemos confianza en que las ecuaciones de Maxwell y la ley de Fuerza
de Lorentz representan leyes de la naturaleza. Entonces, de acuerdo con el
principio de la relatividad (1.10), las ecuaciones de Maxwell y la ley de fuerza
de Lorentz deben ser covariantes cuando se pasa de un observador inercial
a otro. En esta sección probaremos tal covariancia. Comenzaremos con las
ecuaciones de Maxwell, que son:
1 ∂B
∇×E+ = 0 (4.96)
c ∂t
1 ∂E 4π
∇×B− = J (4.97)
c ∂t c
∇·B = 0 (4.98)
∇ · E = 4πρ, (4.99)
y luego seguiremos con la fuerza de Lorentz:

³ u ´
F=q E+ ×B (4.100)
c
111
Covariancia de las ecuaciones de Maxwell. Para el observador O0 las
ecuaciones de Maxwell son:
1 ∂B0
∇0 × E0 + = 0 (4.101)
c ∂t0
1 ∂E0 4π 0
∇0 × B0 − = J (4.102)
c ∂t0 c
∇0 · B0 = 0 (4.103)
∇0 · E0 = 4πρ0 (4.104)
Para probar la covariancia debemos demostrar que las ecuaciones (4.96)-

(4.99) implican las ecuaciones (4.101)-(4.104). Comencemos separando, en
(4.96) y (4.97), las partes que son paralelas y perpendiculares a v :
µ ¶
1 ∂B
∇×E+ = 0 (4.105)
c ∂t ⊥
µ ¶
1 ∂E 4π
∇×B− − J = 0 (4.106)
c ∂t c ⊥
µ ¶
1 ∂B
∇×E+ = 0 (4.107)
c ∂t k
∇·B = 0 (4.108)
µ ¶
1 ∂E 4π
∇×B− − J = 0 (4.109)
c ∂t c k
∇ · E = 4πρ (4.110)
Para realizar los cálculos concretamente, usamos coordenadas cartesianas y

llamamos x a la dirección de v . Las ocho ecuaciones (4.105)-(4.110) son:
1
∂z Ex − ∂x Ez + ∂t By = 0 (4.111)
c
1
∂x Ey − ∂y Ex + ∂t Bz = 0 (4.112)
c
1 4π
∂z Bx − ∂x Bz − ∂t Ey = Jy (4.113)
c c
112
1 4π
∂x By − ∂y Bx − ∂t Ez = Jz (4.114)
c c
1
∂y Ez − ∂z Ey + ∂t Bx = 0 (4.115)
c
∂x Bx + ∂y By + ∂z Bz = 0 (4.116)
1 4π
∂y Bz − ∂z By − ∂t Ex = Jx (4.117)
c c
∂x Ex + ∂y Ey + ∂z Ez = 4πρ (4.118)
Las ocho ecuaciones primadas correspondientes son:
1
∂z 0 Ex0 − ∂x0 Ez0 + ∂t0 By0 = 0 (4.119)
c
1
∂x0 Ey0 − ∂y0 Ex0 + ∂t0 Bz0 = 0 (4.120)
c
1 4π 0
∂z 0 Bx0 − ∂x0 Bz0 − ∂t0 Ey0 = J (4.121)
c c y
1 4π 0
∂x0 By0 − ∂y0 Bx0 − ∂t0 Ez0 = J (4.122)
c c z
1
∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = 0 (4.123)
c
∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0 = 0 (4.124)
1 4π 0
∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 = J (4.125)
c c x
∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0 = 4πρ0 (4.126)
En las ocho ecuaciones (4.111)-(4.118) vamos a cambiar todas las variables

no primadas por variables primadas, utilizando: las cuatro ecuaciones (1.44),
las seis ecuaciones (4.41)-(4.46), y las cuatro ecuaciones (4.92)-(4.95). Se ob-
tienen estas ocho ecuaciones que proceden, una a una, de las ocho ecuaciones
(4.111)-(4.118):
1
∂z 0 Ex0 − ∂x0 Ez0 + ∂t0 By0 = 0 (4.127)
c
113
1
∂x0 Ey0 − ∂y0 Ex0 + ∂t0 Bz0 = 0 (4.128)
c
1 4π 0
∂z 0 Bx0 − ∂x0 Bz0 − ∂t0 Ey0 = J (4.129)
c c y
1 4π 0
∂x0 By0 − ∂y0 Bx0 − ∂t0 Ez0 = J (4.130)
c c z
1 v ¡ ¢
∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = ∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0 (4.131)
c c
1 c ¡ ¢
∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = ∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0 (4.132)
c v
1 v¡ ¢
∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 + ∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0
c c (4.133)
4π 0 v
= Jx + 4πρ0
c c
1 c ¡ ¢
∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 + ∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0
c v (4.134)
4π 0 c
= J + 4πρ0
c x v
Obsérvese que las ecuaciones (4.119) y (4.127) son iguales, que (4.120) y
(4.128) son iguales, que (4.121) y (4.129) son iguales y que (4.122) y (4.130)
son iguales. Obsérvese que (4.123) y (4.131) no son iguales y que (4.124) y
(4.132) no son iguales. Pero el conjunto de las dos ecuaciones (4.131), (4.132)
implica el conjunto de las dos ecuaciones (4.123), (4.124). Ası́ mismo (4.125)
y (4.133) no son iguales; (4.126) y (4.134) no son iguales. Pero el conjunto de
las dos ecuaciones (4.133), (4.134) implica el conjunto de las dos ecuaciones
(4.125), (4.126).
En conclusión, las ecuaciones de Maxwell no primadas implican el conjunto

de las ecuaciones primadas. O sea que las ecuaciones de Maxwell son co-
variantes bajo el grupo de las transformaciones de la relatividad especial,
satisfaciéndose ası́ el principio de la relatividad.
Covariancia de la fuerza de Lorentz. Ahora pasamos a demostrar la

covariancia de la fuerza de Lorentz, ecuación (4.100). Para el observador O0
se debe cumplir que:
µ ¶
0 0 u0 0
F =q E + ×B (4.135)
c
114
Podemos desplegar las tres partes de esta ecuación:
µ ¶
1 0 0 1 0 0
Fx0 0
= q Ex + uy Bz − uz By (4.136)
c c
µ ¶
1 1
Fy0 = q Ey0 + u0z Bx0 − u0x Bz0 (4.137)
c c
µ ¶
0 0 1 0 0 1 0 0
Fz = q Ez + ux By − uy Bx (4.138)
c c
Ası́ mismo las tres partes de la ecuación (4.100) son:
µ ¶
1 1
Fx = q Ex + uy Bz − uz By (4.139)
c c
µ ¶
1 1
Fy = q Ey + uz Bx − ux Bz (4.140)
c c
µ ¶
1 1
Fz = q Ez + ux By − uy Bx (4.141)
c c
Debemos probar que las tres ecuaciones (4.136)-(4.138) implican las ecua-
ciones (4.139)-(4.141), y para tal efecto debemos expresar las tres primeras
ecuaciones en términos de variables no primadas. Utilicemos entonces las tres
ecuaciones (2.35)-(2.37), las tres3 ecuaciones (3.42)-(3.44) y las seis ecua-
ciones (4.33)-(4.38). Entonces la ecuación (4.136) se convierte en (4.139),
la ecuación (4.137) deviene (4.140) y la ecuación (4.138) se vuelve (4.141).
Queda ası́ demostrada la covariancia de la fuerza de Lorentz.
3
Al utilizar la ecuación (3.42) se debe tener en cuenta que
³ u ´
u · F = u · q E + × B = qu · E
c
115
ut
Figura 4.1 El campo eléctrico Figura 4.2 El campo eléctrico

para un observador que está en de una carga que tiene velocidad
reposo respecto a una carga pos- constante. Las lı́neas del campo
itiva. Las lı́neas del campo son son radiales, mas no isótropas.
radiales e isótropas.
ct'
x'
Figura 4.3 Un alambre rec- Figura 4.4 Lı́neas en el mun-

to que porta corriente eléctri- do de los iones positivos (tra-
ca, según un observador en re- zos punteados verticales) y de
poso respecto a los iones posi- los electrones (trazos puntead-
tivos. Los electrones se mueven os inclinados). Para O, la dis-
hacia la derecha. tancia entre electrones contigu-
os es igual a la distancia entre
iones positivos contiguos. Para
O0 , la distancia entre electrones
es mayor que la distancia entre
iones.
116
C + + + + D
A B
Figura 4.5 Un circuito eléctri-

co. Para un observador que vi-
aje hacia la derecha, el lado
CD está cargado positivamente y
el lado AB negativamente, dan-
do como resultado un momento
dipolar eléctrico que apunta ha-
cia arriba.
E
a
v
v
b
B
B
Figura 4.6 Campos E y B per- Figura 4.7 Campos E y B per-

pendiculares, con B < E . Otro pendiculares, con E < B . Otro
observador O0 tiene velocidad v observador O0 tiene velocidad v
con inclinación α . Las variables con inclinación β . Las variables
v y α se pueden ajustar de modo v y β se pueden ajustar de modo
que B 0 sea cero. que E 0 sea cero.
117
118
Capı́tulo 5
Tensores en la relatividad especial
El propósito de este capı́tulo es darle a la relatividad especial una pre-

sentación formal, tensorial. Hemos visto que el espacio y el tiempo se un-
en para formar un ente mayor, el espaciotiempo; y los campos eléctrico y
magnético no son objetos separados, sino que forman una totalidad electro-
magnética. En este capı́tulo expresaremos estas uniones, y otras también,
en una notación condensada que se adecúa a las necesidades y exigencias
de la fı́sica teórica. Debemos advertir, sin embargo, que en este tratamiento
hay algo más que notación compacta y elegante: hay, sobre todo, una visión
profunda y geométrica de la relatividad especial.
5.1 Subı́ndices y superı́ndices

Tal como hemos descrito varias veces, el observador O consta de una malla
tridimensional de relojes, uno en cada punto. Suponemos además que este
observador erige un sistema cartesiano de coordenadas, de modo que cada
evento tiene cuatro coordenadas xµ , ası́:
(x0 , x1 , x2 , x3 ) = (ct, x, y, z)
Los ı́ndices griegos, como por ejemplo µ, van de cero a tres: µ = 0, 1, 2, 3 . En

algunas escasas ocasiones desearemos ir únicamente de uno a tres, y entonces
usaremos ı́ndices latinos, como por ejemplo a = 1, 2, 3 . Siempre seguiremos
la convención de Einstein: cuando en un mismo término aparece dos veces
un ı́ndice, se supone que hay una suma sobre los cuatro (o tres) valores que
puede tomar ese ı́ndice.
Pensemos ahora en el intervalo que hay entre el origen de coordenadas
119
(0,0,0,0) y el evento (x0 , x1 , x2 , x3 ) . De acuerdo con la definición (2.1) este
intervalo viene dado por:
(∆s)2 = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 (5.1)
Si definimos la matriz
 
1 0 0 0
 
 
 0 −1 0 0 
 
ηµν =


 (5.2)
 0 0 −1 0 
 
 
0 0 0 −1
la ecuación (5.1) se escribe:
(∆s)2 = ηµν xµ xν (5.3)
Ahora definimos η µν como la inversa de ηµν :
η µλ ηλν = δ µ ν (5.4)
Claramente esta inversa es

 
1 0 0 0
 
 
 0 −1 0 0 
 
η µν =


 (5.5)
 0 0 −1 0 
 
 
0 0 0 −1
A partir de las cuatro cantidades xµ y la matriz ηµν definimos otras cu-

atro cantidades xµ de la manera siguiente:
120
xµ = ηµλ xλ (5.6)
Escribamos en detalle las cuatro componentes xµ y las cuatro componentes

xµ :
xµ = (x0 , x1 , x2 , x3 ) = (ct, x, y, z) (5.7)
xµ = (x0 , x1 , x2 , x3 ) = (ct, −x, −y, −z) (5.8)
Nótese que
xµ = η µλ xλ (5.9)
Las ecuaciones (5.6) y (5.9) dicen que ηµλ sirve para bajar un superı́ndice y
η µλ sirve para subir un subı́ndice. Ahora, a η µλ también se le puede bajar
el superı́ndice λ , para lo cual basta multiplicarlo por ηλν :
η µλ ηλν = η µ ν
Comparando esto con la ecuación (5.4) llegamos a
ηµν = δµν (5.10)
Consideremos ahora este conjunto de 16 cantidades: (−Bx , 0, Ez , −Bz , 0,

Ex , −By , 0, −Ey , Bx , −Ex , By , −Ez , 0, Bz , Ey ) , el cual organizamos en este
arreglo cuadrado:
 
0 −Ex −Ey −Ez
 
 
 Ex 0 −Bz By 
 
F µν
=


 (5.11)
 Ey Bz 0 −Bx 
 
 
Ez −By Bx 0
121
Si queremos bajar el superı́ndice µ multiplicamos por ηλµ , ası́: Fλ ν = ηλµ F µν :
  
1 0 0 0 0 −Ex −Ey −Ez
  
  
 0 −1 0 0   By 
   Ex 0 −Bz 
Fλ ν = 





 0 0 −1 0   −Bx 
   Ey Bz 0 
  
0 0 0 −1 Ez −By Bx 0
 
0 −Ex −Ey −Ez
 
 
 −Ex 0 Bz −By 
 

=  

 −Ey −Bz 0 Bx 
 
 
−Ez By −Bx 0
Si además queremos bajar el superı́ndice ν multiplicamos Fλ ν por ηρν , ası́:

Fλρ = ηρν Fλ ν = ηνρ Fλ ν = Fλ ν ηνρ . Ejecutemos pues el producto Fλ ν ηνρ :
  
0 −Ex −Ey −Ez 1 0 0 0
  
  
 −Ex 0 Bz −By   0 
  0 −1 0 
Fλρ = 





 −Ey −Bz 0 Bx   0 
  0 0 −1 
  
−Ez By −Bx 0 0 0 0 −1
 
0 Ex Ey Ez
 
 
 −Ex 0 −Bz By 
 
= 



 −Ey Bz 0 −Bx 
 
 
−Ez −By Bx 0
122
El asunto de subir y bajar ı́ndices no tiene complicación. Por ejemplo:
Aα β γ = ηνβ Aανγ
Aαβγ = η νβ Aα ν γ
∂ µ = η µν ∂ν
∂ν = ηµν ∂ µ
dxµ = ηµν dxν
Cuando un ı́ndice aparece una sola vez en un término, decimos que es libre.
Por ejemplo, en B µ Cν los ı́ndices µ y ν son libres. Si una misma letra aparece
dos veces en un término, como superı́ndice y como subı́ndice, decimos que
se trata de ı́ndices contraı́dos. Por ejemplo, en B µ Cµ los ı́ndices µ están
contraı́dos.
Reunamos las formas diferentes que conocemos de escribir la ecuación del

intervalo (5.1):
(∆s)2 = (∆x0 )2 − (∆x1 )2 − (∆x2 )2 − (∆x3 )2
= η µν ∆xµ ∆xν
= ηµν ∆xµ ∆xν
= ∆xµ ∆xµ
5.2 Los vectores

El observador O0 consta de otra malla infinita de relojes primados y erige
otro sistema de ejes cartesianos. Diremos que un evento que tiene coorde-
nadas xµ para el observador O , tiene coordenadas x0µ para el observador
O0 :
(x00 , x01 , x02 , x03 ) = (ct0 , x0 , y 0 , z 0 )
Pensamos que O0 tiene velocidad constante v respecto a O y que, en cierto
123
instante, los orı́genes de O y O0 coinciden. En el instante de la coincidencia
se cuadran en t = 0 y t0 = 0 , respectivamente, los dos relojes que están en
los orı́genes de O y O0 . Los ejes cartesianos de O y O0 se orientan de modo
que los ejes x y x0 son siempre paralelos, los y y y 0 son siempre paralelos y
también los ejes z y z 0 .
Cada una de las coordenadas primadas x0µ debe ser función de las no pri-
madas xν :
x0µ = x0µ (xν ) (5.12)
p
Llamemos β = v/c y γ = 1/ 1 − β 2 y supongamos que el desplazamiento es
a lo largo del eje común x x0 ; de acuerdo con las ecuaciones (1.33), las coor-
denadas primadas y no primadas están conectadas por las transformaciones
de Lorentz:
x00 = γ(x0 − βx1 )

x01 = γ(x1 − βx0 )
(5.13)
x02 = x2
x03 = x3
Calculemos las diez y seis derivadas ∂x0µ /∂xν ; diez de estas derivadas son
cero, y las seis no nulas son: ∂x00 /∂x0 = ∂x01 /∂x1 = γ , ∂x00 /∂x1 = ∂x01 /∂x0
= −γβ , ∂x02 /∂x2 = ∂x03 /∂x3 = 1 . Es muy importante que reconozcamos
que todas las diez y seis derivadas son constantes, propiedad1 que usare-
mos crucialmente más tarde, en el paso de (5.42) a (5.43). Por el momento
tomemos diferenciales en ambos lados de (5.12) para obtener
∂x0µ ν
dx0µ = dx (5.14)
∂xν
∂x0µ
Ahora integrar, teniendo en cuenta que es constante:
∂xν
1
Debemos dejar claro que las diez y seis derivadas son constantes no sólo en la trans-
formación particular (5.13), sino en cualquier transformación de Lorentz. En efecto, un
vistazo a las ecuaciones (1.35) nos muestra que las derivadas son constantes, en general,
para cualquier transformación de Lorentz.
124
∂x0µ ν
x0µ = x . Ası́ mismo: (5.15)
∂xν
∂xµ 0ν
xµ = x (5.16)
∂x0ν
Pensemos enseguida en un conjunto de cuatro cantidades que en las coor-

denadas no primadas aparecen como Aµ , mientras que en las coordenadas
primadas aparecen como A0µ . Nosotros no podemos asegurar de antemano
cuál es la relación entre las A0µ y las Aµ . Pero si ocurre que
∂x0µ ν
A0µ = A , (5.17)
∂xν
entonces decimos que A es un vector. Comparando (5.17) con (5.15) nos

damos cuenta de que A transforma como x, porque en ambas ecuaciones
∂x0µ
se usan los mismos coeficientes . Las cuatro cantidades xµ constituyen,
∂xν
por definición, el vector prototipo. Decimos que A es un vector porque trans-
forma como el vector prototipo (obsérvese que uno no prueba que x es un
vector). El concepto de vector aparece inseparablemente ligado al concep-
to de las transformaciones de coordenadas. Que A sea un vector no es una
propiedad intrı́nseca de A; no podemos decir que A es un vector por sı́ sólo,
sino que el carácter vectorial de A es una propiedad que tiene A en referen-
cia a la transformación de coordenadas xµ → x0µ . No cualquier conjunto de
cuatro cantidades, aunque se rotulen con ı́ndices, es un vector.
Si la velocidad del observador O0 respecto a O es v , la transformación del

vector debe ser como en las fórmulas (1.35):
µ ¶
00 0 1
A =γ A − v ·A
c
µ ¶ (5.18)
0 γ−1 γ 0
A =A+ v ·A− A v
v2 c
Las cuatro cantidades xµ se llaman las componentes contravariantes del vec-

tor x , y xµ se llaman las componentes covariantes. El concepto de vector es
más abstracto que el concepto de componentes, y decimos que el vector x se
puede representar de dos maneras; bien sea por medio de sus componentes
125
contravariantes xµ , o por medio de sus componentes covariantes xµ . Del
mismo modo, el vector A se caracteriza por medio de sus componentes con-
travariantes Aµ , o por medio de sus componentes covariantes Aµ . Ası́ como
en las fórmulas (5.7) y (5.8), escribimos ahora
Aµ = (A0 , A1 , A2 , A3 ) = (A0 , Ax , Ay , Az ) = (A0 , A) (5.19)
Aµ = (A0 , A1 , A2 , A3 ) = (A0 , −Ax , −Ay , −Az ) = (A0 , −A) (5.20)
Transformación de las componentes Aµ . Ya que sabemos que las com-

ponentes contravariantes Aµ transforman según (5.17), pasemos a averiguar
de qué manera transforman las componentes covariantes Aµ . Pero para lle-
var a efecto esa tarea es preciso deducir antes una identidad importante. Lo
primero es reescribir la ecuación (2.2) en nuestra notación compacta:
µ ν
ηµν xµ xν = ηµν x0 x0 (5.21)
Esta ecuación dice que, para calcular intervalos, todos los observadores in-
erciales usan la misma matriz ηµν . La ecuación (5.21) es, obviamente:
λ ρ
ηµν xµ xν = ηλρ x0 x0 . Utilizar (5.15):
∂x0λ ∂x0ρ µ ν
= ηλρ x x ;
∂xµ ∂xν
reunir todo en el lado izquierdo:
µ ¶
∂x0λ ∂x0ρ
ηµν − ηλρ xµ xν = 0
∂xµ ∂xν
Como esta ecuación debe ser válida para todos los eventos, la cantidad
dentro del paréntesis debe ser cero:
∂x0λ ∂x0ρ
ηλρ = ηµν (5.22)
∂xµ ∂xν
126
Ahora multiplicar ambos lados de esta ecuación por η νπ y utilizar la ecuación
(5.10):
∂x0λ νπ ∂x0ρ
η ηλρ = δµ π (5.23)
∂xµ ∂xν
Como las coordenadas xη son independientes, podemos afirmar que
∂xπ
= δµ π (5.24)
∂xµ
Ahora, de acuerdo con la regla de la derivación en cadena,
∂xπ ∂x0λ ∂xπ

= ,
∂xµ ∂xµ ∂x0λ
o sea que la ecuación (5.24) es:
∂x0λ ∂xπ
= δµ π (5.25)
∂xµ ∂x0λ
Igualemos entonces los lados izquierdos de las ecuaciones (5.23) y (5.25):
∂x0λ νπ ∂x0ρ ∂x0λ ∂xπ

η η λρ = ,
∂xµ ∂xν ∂xµ ∂x0λ
∂xµ
y multipliquemos ambos lados de esta ecuación por :
∂x0ω
∂xµ ∂x0λ νπ ∂x0ρ ∂xµ ∂x0λ ∂xπ

0ω µ
η ηλρ ν
= (5.26)
∂x ∂x ∂x ∂x0ω ∂xµ ∂x0λ
∂xµ ∂x0λ
En ambos lados de esta ecuación aparece el factor ; la regla de
∂x0ω ∂xµ
∂xµ ∂x0λ ∂x0λ
la derivación en cadena dice que = = δω λ , o sea que la
∂x0ω ∂xµ ∂x0ω
ecuación (5.26) es
127
∂x0ρ ∂xπ
δω λ η νπ ηλρ = δω λ
∂xν ∂x0λ
∂x0ρ ∂xπ
η νπ ηωρ = (5.27)
∂xν ∂x0ω
Esta es la ecuación importante que querı́amos deducir. Ahora multiplicar

ambos lados por Aπ :
∂x0ρ ν ∂xπ
ηωρ A = Aπ
∂xν ∂x0ω
En el lado izquierdo utilizamos la ecuación (5.17) para obtener:
∂xπ
ηωρ A0ρ = Aπ
∂x0ω
Ya habı́amos indicado, justo después de la ecuación (5.21), que todos los

observadores inerciales usan la misma matriz η , lo que quiere decir que O0
utiliza a η para subir y bajar ı́ndices. De aquı́ vemos que ηωρ A0ρ debe ser
A0ω , y la última ecuación es, finalmente:
∂xπ
A0ω = Aπ (5.28)
∂x0ω
Este es el modo como transforman las componentes covariantes de cualquier

vector A . Por supuesto que las componentes xµ transforman de la misma
manera:
∂xπ
x0ω = xπ (5.29)
∂x0ω
5.3 Otros tensores

Pasemos a estudiar la estructura Aµ B ν , cuando A y B son vectores. De
acuerdo con la regla de transformación (5.17), las componentes contravari-
antes de A y B transforman ası́: A0µ = (∂x0µ /∂xα )Aα y B 0ν = (∂x0ν /∂xβ )B β .
Multipliquemos lado a lado estas dos ecuaciones para obtener:
128
∂x0µ ∂x0ν α β
A0µ B 0ν = A B
∂xα ∂xβ
Los tensores de rango 2 se definen por comparación con la última ecuación:

T es un tensor de rango 2 si
∂x0µ ∂x0ν αβ
T 0µν = T (5.30)
∂xα ∂xβ
Las componentes contravariantes de T transforman como Aµ B ν ; de la mis-

ma manera, las componentes covariantes de T transforman como Aµ Bν :
0 ∂xα ∂xβ
Tµν = Tαβ , (5.31)
∂x0µ ∂x0ν
y las componentes mixtas transforman como Aµ Bν :
∂x0µ ∂xβ α
T 0µ ν = T β, (5.32)
∂xα ∂x0ν
y como Aµ B ν :
∂xα ∂x0ν
T0 µ ν = Tα β (5.33)
∂x0µ ∂xβ
Generalizamos diciendo que los tensores de rango j tienen j ı́ndices, es decir,

4j cantidades. Los tensores de rango 0 reciben el nombre de escalares, y los
de rango 1 se llaman vectores. Algunas de las componentes de un tensor C
de rango 3 transforman ası́:
∂x0µ ∂x0ν ∂x0δ αβγ

C 0 µνδ = C
∂xα ∂xβ ∂xγ

C 0 µνδ = Cαβγ
∂x0µ ∂x0ν ∂x0δ
∂xα ∂x0ν ∂xγ
C0 µ ν δ = Cα β γ
∂x0µ ∂xβ ∂x0δ
129
Finalmente, un tensor de rango 4:
∂x0µ ∂x0ν ∂x0σ ∂xγ αβλ

A0µνσ ρ = A γ (5.34)
∂xα ∂xβ ∂xλ ∂x0ρ
En este momento es conveniente que hagamos una pausa y reconsideremos la

∂x0ν
notación que estamos usando. El uso de las derivadas recarga, sin duda,
∂xβ
la escritura, y podemos preguntarnos si vale la pena toda esta complicación.
La pregunta está justificada, ya que todas estas derivadas son constantes
en este capı́tulo y uno podrı́a reducir la notación. No queremos reducir-
la, porque nuestro deseo es que el presente capı́tulo sirva de preámbulo al
capı́tulo 9: allı́ las derivadas no serán constantes.
Las transformaciones inversas. Hasta el momento hemos presentado

la manera de averiguar las componentes primadas de un tensor en términos
de las no primadas. El camino inverso -las no primadas en términos de las
primadas- es muy fácil. Multipliquemos ambos lados de la ecuación (5.17)
∂xα
por , con lo que se llega a:
∂x0µ
∂xα 0µ ∂xα ∂x0µ ν

A = A = δ α ν Aν = Aα
∂x0µ ∂x0µ ∂xν
Hemos obtenido:
∂xµ 0ν
Aµ = A . Ası́ mismo:
∂x0ν
∂x0ν 0
Aµ = A
∂xµ ν
Esto para tensores de rango 1. Para los de rango 2:
∂xµ ∂xν 0αβ

T µν = T
∂x0α ∂x0β
∂x0α ∂x0β 0
Tµν = T
∂xµ ∂xν αβ
130
∂xµ ∂x0β 0α
Tµ ν = T β
∂x0α ∂xν
ν ∂x0α ∂xν 0 β
T µ = T
∂xµ ∂x0β α
Y los de rango 3:
∂xµ ∂xν ∂xδ 0αβγ

C µνδ = C
∂x0α ∂x0β ∂x0γ
∂x0α ∂x0β ∂x0γ 0

C µνδ = C
∂xµ ∂xν ∂xδ αβγ
∂x0α ∂xν ∂x0γ 0 β
Cµνδ = C γ
∂xµ ∂x0β ∂xδ α
La importancia del vector xµ . Gran parte de la estructura de los ten-

sores se fundamenta en el vector prototipo xµ . En efecto: 1) En la ecuación
(5.17) hemos definido los vectores, en general, por comparación con xµ y,
2) en esta sección hemos construido tensores de rangos 0, 2, y 3 a partir de
vectores. En general, un tensor de rango j > 0 transforma como transforma
el producto de j vectores.
Contracción de ı́ndices. Estudiemos la estructura Aµ Bµ , cuando A y B

son vectores. Usando las reglas de transformación (5.17) y (5.28) escribimos
∂x0µ ∂xβ α
A0µ B 0 µ = A Bβ
∂xα ∂x0µ
∂x0µ ∂xβ ∂xβ

Ahora, la regla de la derivación en cadena dice que = , en-
∂xα ∂x0µ ∂xα
tonces:
∂xβ α
A0µ B 0 µ = A Bβ = δα β Aα Bβ = Aα Bα
∂xα
O sea que
A0µ B 0 µ = Aµ Bµ (5.35)
131
En palabras, el producto Aµ Bµ es, en general, invariante y el intervalo xµ xµ
es un caso particular.
Probemos que si A es un tensor de rango 4, entonces A0µνρ ρ es un ten-

sor de rango 2. En efecto, si hacemos σ = ρ en la ecuación (5.34) obtenemos
∂x0µ ∂x0ν ∂x0ρ ∂xγ αβλ ∂x0ρ ∂xγ
A0µνρ ρ = A γ . Pero = δλ γ , entonces
∂xα ∂xβ ∂xλ ∂x0ρ ∂xλ ∂x0ρ
∂x0µ ∂x0ν αβλ

A0µνρ ρ = A λ,
∂xα ∂xβ
que es la forma como transforman los tensores de rango 2, de acuerdo con

la ecuación (5.30). En general, la contracción de dos ı́ndices en un tensor de
rango j produce un tensor de rango j − 2.
δ de Kronecker. Probemos que δµ ν es un tensor. Para tal efecto comen-

∂x0ν
zamos escribiendo δµ0 ν = y luego usamos la regla de la derivación en
∂x0µ
cadena:
ν ∂x0ν ∂x0ν ∂xα ∂x0ν ∂xβ α
δµ0 = = = δβ ,
∂x0µ ∂xα ∂x0µ ∂xα ∂x0µ
que es ciertamente el modo como transforman los tensores de rango 2, de

acuerdo con ecuación (5.33).
El tensor métrico. Probemos ahora que η es un tensor. Para tal efecto

recordemos que todos los observadores inerciales usan la misma η , o sea que,
0 en vez de η
en la ecuación (5.22), podemos escribir ηλρ λρ :
∂x0λ ∂x0ρ 0
ηµν = η ,
∂xµ ∂xν λρ
y ésta es justamente la forma como transforman los tensores de segundo

rango. Este es un tensor de primera importancia y recibe el nombre de
tensor métrico, ya que, de acuerdo con la ecuación (5.3), es el que ejecuta la
distancia entre dos eventos. Una cosa es un espacio formado por una simple
acumulación de puntos. Un espacio métrico tiene además una prescripción,
132
una regla, para establecer la distancia entre dos puntos, y el tensor métrico
es el encargado de suministrar tal regla. Por esta razón decimos que el tensor
métrico contiene toda la información acerca de la estructura geométrica de
un espacio.
El tensor de Levi-Civita. El tensor de Levi-Civita se define ası́:

 +1 si αβγδ es una permutación par de 0123
²αβγδ = −1 si αβγδ es una permutación impar de 0123 (5.36)

0 si dos ı́ndices son iguales
La prueba de que ²αβγδ es verdaderamente un tensor se encuentra fácilmente

en la literatura [11].
Cantidades simétricas y antisimétricas. Sea S µν = S νµ , y sea Aµν =

−Aνµ . En palabras, S es simétrico bajo la permutación µ À ν y A es
antisimétrico. Consideremos la contracción total S µν Aµν = −S νµ Aνµ =
−S αβ Aαβ :
S µν Aµν = −S αβ Aαβ (5.37)
Si cambiamos α → µ y β → ν, el lado derecho de (5.37) se convierte en

−S µν Aµν . La ecuación (5.37) es entonces S µν Aµν = −S µν Aµν , es decir,
S µν Aµν = 0 (5.38)
En palabras: la contracción total de una cantidad simétrica con otra anti-

simétrica da cero. Esta afirmación es verdadera en general, sin necesidad de
exigir que S y A sean tensores.
La derivada. Para la derivada se usa una notación compacta:
µ ¶ ¶ µ
∂ ∂ ∂ ∂ ∂ ∂
∂µ = = , , , = ,∇ (5.39)
∂xµ c ∂t ∂x ∂y ∂z c ∂t
µ ¶ µ ¶
∂ ∂ ∂ ∂ ∂ ∂
∂µ = = ,− ,− ,− = , −∇ (5.40)
∂xµ c ∂t ∂x ∂y ∂z c ∂t
133
El producto ∂ µ ∂µ = ∂ 0 ∂0 + ∂ a ∂a es:
1 ∂2
∂ µ ∂µ = − ∇2 (5.41)
c2 ∂t2
Probemos que si φ es un escalar, entonces ∂µ φ es un vector. Comenzamos

∂
escribiendo ∂µ0 φ = φ y luego usamos la regla de la derivación en cadena:
∂x0µ
∂ ∂xν ∂ ∂xν
∂µ0 φ = φ = φ = ∂ν φ,
∂x0µ ∂x0µ ∂xν ∂x0µ
que es verdaderamente la manera como transforman los vectores, de acuerdo

con la ecuación (5.28).
La derivada de un tensor es un tensor; para probarlo tomemos por ejem-

∂
plo ∂µ0 A0ν = A0ν y usemos la regla de la derivación en cadena:
∂x0µ
∂ ∂xα ∂ ∂xα
∂µ0 A0ν = A0ν
= A0ν
= ∂α A0ν ;
∂x0µ ∂x0µ ∂xα ∂x0µ
ahora usamos la ecuación (5.17):
∂xα ∂x0ν β
∂µ0 A0ν = ∂α A (5.42)
∂x0µ ∂xβ
∂x0ν
No olvidemos que las son constantes, entonces
∂xβ
∂xα ∂x0ν
∂µ0 A0ν = ∂α Aβ ; (5.43)
∂x0µ ∂xβ
pero ésta, según la ecuación (5.33), es la manera como transforman los ten-
sores de rango 2. Hemos probado ası́ que la derivada de un tensor es otro
tensor2 .
2
Más tarde, en el capı́tulo 9, vamos a abandonar las transformaciones de Lorentz para
estudiar las transformaciones generalizadas de coordenadas. En las transformaciones gen-
134
5.4 Matrices
Para los tensores de rangos 1 y 2, que son los que tienen 1 y 2 ı́ndices,
respectivamente, es muy cómoda la notación matricial. Definamos la matriz
cuadrada
∂x0µ
Λµ ν = (5.44)
∂xν
Con Λ podemos reescribir las ecuaciones (5.17) y (5.30):
A0 µ = Λµ ν Aν
F 0 µν = Λµ α F αβ Λν β = Λµ α F αβ ΛT β
ν
O más concisamente:
A0 µ = Λ Aν F 0 µν = Λ F αβ ΛT
Ocurre sin embargo que Λ resulta ser simétrica (ver (5.48)), entonces
A0 µ = Λ Aν (5.45)
F 0 µν = Λ F αβ Λ (5.46)
Calculemos la matriz Λ para el caso particular de la transformación (5.13):
 
γ −γβ 0 0
 
 
 −γβ γ 0 0 
 
Λ=


 (5.47)
 0 0 1 0 
 
 
0 0 0 1
erales los coeficientes ∂x0ν /∂xβ no son constantes, y por consiguiente el paso de (5.42) a
(5.43) es inválido: véase el paso de la ecuación (9.29) a (9.30).
135
Esta matriz corresponde a las transformaciones (5.13), en las que la veloci-
dad v es en la dirección del eje x. Para la transformación más general (1.35)

se obtiene:
 
γ −γβx −γβy −γβz
 
 
 β2 βx βy βx βz 
 −γβx 1 + (γ − 1) x2 (γ − 1) (γ − 1) 
 β β2 β2 
 
 
Λ=



 −γβ βy βx βy2 βy βz 
 y (γ − 1) 1 + (γ − 1) (γ − 1) 
 β2 β2 β2 
 
 
 βz βx βz βy βz2 
−γβz (γ − 1) (γ − 1) 1 + (γ − 1)
β2 β2 β2
(5.48)
Tal como anunciamos arriba, esta matriz es simétrica.
El diferencial de volumen: Para cualquier clase de transformación de

coordenadas (x, y, z, ...) → (u, v, w, ...) los diferenciales de volumen satis-
facen [12] la ecuación dx dy dz · ·· = J du dv dw · ··, donde J es el jacobiano
de la transformación, que es el determinante de la matriz formada con las
derivadas ∂x/∂u , ∂x/∂v, etc. En nuestro caso el jacobiano es el determi-
nante de Λ, entonces dx00 dx01 dx02 dx03 = (det Λ) dx0 dx1 dx2 dx3 .
Ocurre que el determinante de Λ es 1 para todas las transformaciones de

Lorentz. Esto se ve fácilmente en la matriz (5.47) que corresponde a una ve-
locidad v en dirección x. Para una v en cualquier dirección, la Λ viene dada
por (5.48). El lector puede verificar que el determinante de (5.48) también
es 1 . Concluimos entonces que para todas las transformaciones de Lorentz
se cumple que dx00 dx01 dx02 dx03 = dx0 dx1 dx2 dx3 , lo que cortamente se
escribe:
d4 x0 = d4 x (5.49)
En palabras: el diferencial de volumen d4 x es un escalar.
136
Una cantidad invariante: Que el determinante de la matriz Λ sea 1
tiene otra consecuencia interesante: el determinante de F µν es invariante
bajo el grupo de las transformaciones de Lorentz. Para probarlo tomemos
determinante en ambos lados de la ecuación (5.46), ası́: det F 0 = det(ΛF Λ)
= (det Λ)(det F )(det Λ)= det F :
det F 0µν = det F µν (5.50)
5.5 Ecuaciones tensoriales

En esta sección vamos a ver algunas propiedades importantes de las ecua-
ciones entre tensores.
a) La más importante es que las ecuaciones tensoriales son automáticamente

covariantes, es decir, tienen la misma forma en todos los observadores iner-
ciales. Para ver esto consideremos por ejemplo la ecuación
Aµ ν = B µ Cν (5.51)
∂xµ ∂x0β 0α
Si A, B y C son tensores, podemos reemplazar Aµ ν = A β ,
∂x0α ∂xν
∂xµ 0α ∂x0β 0
Bµ = B y C ν = C en la ecuación (5.51) para escribir
∂x0α ∂xν β
∂xµ ∂x0β 0α ∂xµ ∂x0β 0α 0

A β = B Cβ
∂x0α ∂xν ∂x0α ∂xν
∂x0σ ∂xν
Multiplicar ambos lados de esta ecuación por :
∂xµ ∂x0ρ
∂x0σ ∂xµ ∂xν ∂x0β 0α ∂x0σ ∂xµ ∂xν ∂x0β 0α 0

A β = B Cβ
∂xµ ∂x0α ∂x0ρ ∂xν ∂xµ ∂x0α ∂x0ρ ∂xν
δ σ α δ β ρ A0α β = δ σ α δ β ρ B 0α Cβ0
A0σ ρ = B 0σ Cρ0 (5.52)
137
Comparando (5.52) con (5.51) nos damos cuenta de que tienen la misma for-
ma: (5.51) es una ecuación covariante porque es la igualdad de dos tensores.
Si queremos que se cumpla el principio de la relatividad, debemos expresar
las leyes de la fı́sica mediante ecuaciones tensoriales.
b) Supongamos que una ecuación es válida en todos los sistemas iner-

ciales. Pensemos que esta ecuación tiene n elementos (factores o sumandos)
y supongamos que n − 1 de ellos son tensores; entonces el otro elemento
también tiene que ser tensor. Para mostrar que esto es cierto supongamos
que la ecuaciones (5.51) y (5.52) son verdaderas y que A y C son tensores;
probaremos que B también es tensor.
∂xµ ∂x0β 0α ∂x0β 0

Reemplazando Aµ ν = A β , y Cν = C en (5.51) escribi-
∂x0α ∂xν ∂xν β
mos:
∂xµ ∂x0β 0α ∂x0β µ 0
A β = B Cβ
∂x0α ∂xν ∂xν
∂x0σ ∂xν
∂xµ ∂x0ρ
∂x0σ ∂xµ ∂xν ∂x0β 0α ∂x0σ ∂xν ∂x0β µ 0

A β = B Cβ
∂xµ ∂x0α ∂x0ρ ∂xν ∂xµ ∂x0ρ ∂xν
∂x0σ β
δ σ α δ β ρ A0α β = δ ρ B µ Cβ0
∂xµ
∂x0σ µ 0
A0σ ρ = B Cρ
∂xµ
Comparando la última ecuación con (5.52) vemos que
∂x0σ µ
B 0σ = B ,
∂xµ
que es la forma como transforman los vectores: B es un vector, que es lo que

nos propusimos demostrar.
c) Las transformaciones de Lorentz (5.13) han sido corroboradas miles de
138
veces durante todo un siglo. Esto quiere decir que cuando se comparan las
mediciones que O0 hace con sus reglas y relojes, con las mediciones que O
hace con sus reglas y relojes, esas dos mediciones cumplen las relaciones
(5.13).
d) Si multiplicamos ambos lados de la ecuación (5.51) por ηµσ obtenemos

Aσν = Bσ Cν . Ası́ mismo, al multiplicar ambos lados de (5.51) por η νσ
obtenemos Aµσ = B µ C σ . Finalmente, si multiplicamos ambos lados de
Aµσ = B µ C σ por ηµν se obtiene Aν σ = Bν C σ . En conclusión, todas es-
tas ecuaciones son equivalentes: Aµ ν = B µ Cν , Aµν = Bµ Cν , Aµν = B µ C ν y
Aµ ν = Bµ C ν . Vemos ası́ que dos ı́ndices libres e iguales en ambos lados de
una ecuación se pueden subir o bajar.
5.6 El principio de la relatividad

Este principio afirma que las leyes de la fı́sica deben ser las mismas en todos
los sistemas inerciales. En otras palabras, todos los observadores inerciales
son equivalentes. Este es un principio profundo, lleno de motivación filosófi-
ca y valor estético, pero debe ser traducido a términos prácticos para que
sea útil.
Admitiendo que las transformaciones de Lorentz (TL) son, verdaderamente,

las encargadas de relacionar las observaciones de dos sistemas de referen-
cia inerciales, decimos que, de acuerdo con el Principio, las leyes de la fı́sica
deben ser enunciados invariantes bajo las TL. Acabamos de ver que las ecua-
ciones tensoriales son automáticamente covariantes bajo las TL. Entonces
terminamos en esta conclusión: el principio de la relatividad se satisface si
las leyes de la fı́sica se expresan mediante ecuaciones tensoriales. El Princi-
pio no se reduce simplemente a la frase “las leyes de la fı́sica son ecuaciones
tensoriales”, pero sı́ podemos afirmar que él guı́a el trabajo de la fı́sica al
indicar el camino y el método que se debe seguir: utilizar ecuaciones tenso-
riales.
Las cantidades fı́sicas deben ser componentes de tensores. Por ejemplo el

campo eléctrico hace parte del tensor electromagnético Fµν y la energı́a de
una partı́cula hace parte del cuadrivector momentum pµ . Ahora, hemos vis-
to que los tensores de rango j tienen 4j componentes, lo que quiere decir que
los tensores tienen 1, 4, 16, 64 ··· componentes. Vemos ası́ que toda cantidad
fı́sica debe ser miembro de alguna familia de 1, 4, 16, 64 · · · miembros. Los
139
números 1, 4, 16, 64 · · · son muy importantes para la fı́sica, porque indican
los únicos tamaños que las familias pueden tener: no hay familias de 10, 15,
63 miembros.
5.7 Los tensores m0 , xµ , dτ, U µ , pµ , k µ y J µ

Durante todo este capı́tulo nos hemos dedicado básicamente a estudiar las
propiedades tensoriales del grupo de las transformaciones lineales de coorde-
nadas. Queremos ahora presentar, como ejemplos, los escalares y los tensores
más importantes en problema del movimiento de una partı́cula masiva.
La masa en reposo. m0 es la masa de una partı́cula, según la mide

un observador para el cual la partı́cula está en reposo. Esta constante es
claramente un escalar.
El vector posición. Llamamos x a un evento de la trayectoria de una

partı́cula y xµ = (ct, x, y, z) a las coordenadas del evento x. Nótese que es-
tamos cambiando la notación, ya que antes habı́amos usado x para denotar,
en general, los eventos del espaciotiempo. El lector se acostumbrará a distin-
guir por el contexto cuándo xµ son las coordenadas de un evento cualquiera
o de un evento de una lı́nea en el mundo.
p
El tiempo propio dτ . ηµν dxµ dxν es el intervalo a lo largo de la trayec-
toria de la partı́cula. En caso de que la partı́cula sea libre su velocidad es con-
stante, y en consecuencia hay un observador inercial para el cual la partı́cula
está siempre en reposo; para
p este observador el intervalo es puro tiempo, es el
tiempo propio: c2 dτ 2 = ηµν dxµ dxν . Pero si la partı́cula tiene aceleración,
un sistema de coordenadas que la acompañe permanentemente serı́a no iner-
cial y, por lo tanto, no podrı́a usarse enpla relatividad especial. Sin embargo
vamos a ver que la fórmula c2 dτ 2 = ηµν dxµ dxν sigue siendo válida si el
sı́mbolo dτ adquiere un significado ligeramente diferente del que tenı́a hace
un par de renglones. Pensamos en una porción infinitesimal de trayectoria
durante la cual la velocidad se puede considerar aproximadamente constante.
En esa porción infinitesimal de trayectoria hay un observador inercial para
el cual la partı́cula está aproximadamente en reposo. Para este observador la
porción de trayectoria es puramente temporaloide,
p y dura un tiempo propio
que llamaremos dτ . Claramente c2 dτ 2 = ηµν dxµ dxν . En conclusión, esta
fórmula es válida para partı́culas libres y aceleradas; aquı́ dτ es el tiempo
140
propio que registra un observador inercial que acompaña momentáneamente
a la partı́cula; dτ es un escalar.
La velocidad. Una vez aclarado el significado de dτ pasamos a definir la

velocidad:
dxµ
Uµ = (5.53)
dτ
Ya que dxµ y dτ son tensores, concluimos que U µ es también un tensor. Sus

componentes son:
µ ¶
µ c dt dx dy dz
U = , , ,
dτ dτ dτ dτ
p
Pero dτ = dt 1 − u2 /c2 , entonces
Ã !
µ c u
U = p , p (5.54)
1 − u2 /c2 1 − u2 /c2
De acuerdo con la ecuación (5.35) la cantidad U µ Uµ es escalar. Averigüemos

cuánto vale:
U µ Uµ = U 0 U0 − U a Ua = c2 (5.55)
El momentum. Ahora definimos el momentum de una partı́cula:
pµ = m0 U µ (5.56)
Obviamente es un tensor, ya que es el producto de dos tensores. Calculemos

pµ pµ = m20 U µ Uµ usando (5.55):
pµ pµ = (m0 c)2 (5.57)
Con (5.54) y (5.56) podemos escribir las componentes de pµ :
Ã !
µ m0 c m0 u
p = p , p
1 − u2 /c2 1 − u2 /c2
141
= (mc , mu) (5.58)
= (E/c , p) (5.59)
Utilizamos esta ecuación para calcular el producto pµ pµ :
pµ pµ = E 2 /c2 − p2 (5.60)
Al igualar los lados derechos de (5.57) y (5.60) escribimos, finalmente,
p
E= (m0 c2 )2 + (pc)2 (5.61)
Esta es la misma ecuación (3.15). Queremos presentar una última fórmula

que combina la velocidad, la energı́a y el momentum. Las ecuación (5.56)
dice que pν = m dxν /dt; pero m = E/c2 , entonces pν = (E/c2 ) (dxν /dt), o
sea que
dxν c2 ν
= p (5.62)
dt E
Esta fórmula, aunque es una mezcla inusual de vectores y cantidades no

tensoriales, mostrará su utilidad cuando veamos las corrientes en el capı́tulo
7.
El momentum del fotón. Para partı́culas de masa cero, como el fotón,

el momentum se denomina k ν . Si se trata de un pulso de luz que se propaga
en dirección del vector unitario n, escribimos k = |k| n. Las ecuaciones de
pν se simplifican considerablemente:
k µ kµ = 0 (5.63)
|k| = E/c (5.64)

E
kµ = (1, n) (5.65)
c
142
La corriente eléctrica. Ya habı́amos demostrado en la página 111 que
(ρc, J) transforma como un vector, al que llamaremos J µ :
J µ = (ρc, J) (5.66)
5.8 Aberración de la luz y efecto Doppler

Pensemos en un pulso de luz. Respecto al observador O tiene energı́a E y
se propaga en dirección del vector unitario n. Respecto a O la energı́a es E 0
y se propaga en dirección n0 . La ecuaciones (5.18) son, en este caso:
µ ¶
00 0 1
k = γ k − v ·k
c
µ ¶
γ−1 γ 0
k0 = k+ v ·k− k v
v2 c
En vista de (5.65), estas dos ecuaciones quedan ası́:

³ v · n´
E 0 = Eγ 1 − (5.67)
c
· µ ¶ ¸
0 0 γ−1 γ
E n = E n+ v ·n− v
v2 c
Para aislar la variable n0 basta dividir lado a lado estas dos ecuaciones:
µ ¶
γ−1 γ
n+ 2
v ·n− v
v c
n0 = ³ v · n´ (5.68)
γ 1−
c
Aberración: La ecuación (5.68) es general, pero debemos admitir que no

es simple. Para apreciar el significado de la aberración supongamos que v
es en dirección x y que n es paralela al plano xy y hace un ángulo θ con el
eje x. Escribimos entonces nx = cos θ, ny = sen θ. Las componentes de n0 se
averiguan fácilmente con la fórmula (5.68):
cos θ − v/c
n0x =
v cos θ
1−
c
143
1 sen θ
n0y =
γ v cos θ
1−
c
Vamos a dividir, lado a lado, estas dos ecuaciones. Al cociente n0y /n0x lo
llamamos tan θ0 :
1 sen θ
tan θ0 = (5.69)
γ cos θ − v/c
Esta es la ecuación de la aberración estelar que Bradley dedujo en el siglo

XVIII. Recuperar esta fórmula centenaria es uno de los hallazgos de la rel-
atividad.
No es difı́cil entender la causa de la aberración de la luz desde un punto

de vista ondulatorio. Recordemos que, por definición, un frente de onda es
el lugar geométrico de todos los puntos que, en cierto instante dado, tienen
la misma fase. El frente de onda es un objeto extendido en el espacio, en
cierto instante. En otras palabras, es un conjunto de eventos simultáneos
que ocupan una región extendida en el espacio. Ya hemos advertido que la
simultaneidad es relativa: un objeto extenso que aparece simultáneo a un
observador, en general no aparece simultáneo a otros observadores. En nue-
stro caso decimos que los eventos que constituyen un frente de onda para
O no son, en general, simultáneos para O0 . Vemos ası́ que los eventos de un
frente de onda para O no forman un frente de onda para O0 . De esta manera
llegamos a una conclusión importante: en una onda luminosa, los frentes de
onda para O no son frentes de onda para O0 . Cada observador inercial regis-
tra sus propios frentes de onda3 . Ahora, como la dirección de propagación de
la onda es perpendicular a los frentes de onda, concluimos que la dirección
de propagación para O es diferente a la dirección de propagación para O0 .
Doppler: Si suponemos que en la luz la energı́a es proporcional a la fre-

cuencia (E = hν, por ejemplo) la ecuación (5.67) queda:
³ v · n´
ν 0 = νγ 1 − (5.70)
c
3
Consideremos un frente de onda para O y un frente de onda para O0 ; la intersección
de esos dos planos es una lı́nea recta; los eventos de esa lı́nea son simultáneos para O y
también son simultáneos para O0 .
144
Hay tres casos particularmente claros: cuando n y v son paralelos (⇒),
cuando son antiparalelos (¿), y cuando son perpendiculares (→↑). En estos
casos la fórmula (5.70) da:
s
1 − v/c
⇒ ν0 = ν (5.71)
1 + v/c
s
0 1 + v/c
¿ ν = ν (5.72)
1 − v/c
→↑ ν 0 = γν (5.73)
La fórmula (5.71) vale cuando la luz y O0 viajan en la misma dirección,

(5.72) para direcciones opuestas y (5.73) para direcciones perpendiculares.
Las dos primeras fórmulas, conocidas como efecto Doppler longitudinal, ya
se conocı́an antes de 1905. El efecto Doppler transverso, fórmula (5.73),
era desconocido hasta 1905, y se constituye como una novedad de la teorı́a
especial de la relatividad.
145
146
Capı́tulo 6
La electrodinámica
manifiestamente covariante
La electrodinámica está formalmente contenida en las ecuaciones de Maxwell

y en la fuerza de Lorentz:
∇·B = 0 (6.1)
1 ∂B
∇×E+ = 0 (6.2)
c ∂t
∇ · E = 4πρ (6.3)
1 ∂E 4π
∇×B− = J (6.4)
c ∂t c
dp ³ u ´
= q E+ ×B (6.5)
dt c
Hemos visto que la relatividad especial le da al electromagnetismo una apari-

encia interesante, porque unifica los campos eléctrico y magnético. Sin em-
bargo, es justo advertir que la relatividad no afecta esencialmente la es-
tructura formal de la teorı́a electromagnética. Dicho en otras palabras, la
electrodinámica es covariante bajo las transformaciones entre observadores
inerciales, tal como tuvimos ocasión de probar en la sección 4.8. No olvide-
mos sin embargo que esa sección es larga y engorrosa: las cuatro ecuaciones
de Maxwell y la fuerza de Lorentz son covariantes, pero esa covariancia
es difı́cil de ver. Por este motivo decimos que la covariancia de las cinco
ecuaciones, aunque es verdadera e indudable, no es manifiesta. Conviene
formular la electrodinámica utilizando otras ecuaciones, equivalentes a las
cinco mencionadas, que sean manifiestamente covariantes. Ya vimos en la
147
sección 5.5 que las ecuaciones tensoriales son automáticamente covariantes,
entonces nuestro proyecto es este: convertir a las cinco ecuaciones en ecua-
ciones tensoriales.
6.1 El cuadripotencial Aµ
Los campos E y B son enteramente suficientes para describir el campo elec-
tromagnético. Sin embargo, para darle a la electrodinámica una escritura
manifiestamente covariante, podemos abandonar los campos E y B , ex-
presándolos en términos de otros campos φ y A , de la manera siguiente:
B = ∇×A (6.6)
1 ∂A
E = −∇φ − (6.7)
c ∂t
Sin embargo, y aquı́ viene un asunto de primera importancia, la relación

entre (E, B) y (φ, A) no es uno a uno, ya que para describir a (E, B) hay
un número infinito de opciones (φ, A) . Esto es lo que se espera, ya que
los campos (E, B) se producen como derivadas de los campos (φ, A) , o sea
que a los (φ, A) se les pueden agregar términos sin afectar sus derivadas.
En efecto, utilizando cualquier función derivable χ se pueden producir unos
nuevos campos (φ0 , A0 ) equivalentes a los viejos (φ, A) , ası́:
1 ∂χ
φ0 = φ − (6.8)
c ∂t
A0 = A + ∇χ (6.9)
Podemos rápidamente verificar que los campos (φ0 , A0 ) y los campos (φ, A)
son equivalentes, al darnos cuenta de que
∇ × A0 = ∇ × A
1 ∂A0 1 ∂A
−∇φ0 − = −∇φ − ,
c ∂t c ∂t
es decir, los campos (E, B) se pueden calcular, bien sea con (φ, A) , o con
(φ0 , A0 ) . Esto indica que para describir una realidad (E, B) no estamos
148
obligados a usar unos (φ, A) determinados, sino que tenemos una cierta lib-
ertad en la escogencia, que recibe el nombre de libertad gauge. La Figura
6.1 muestra que para describir un campo electromagnético se puede usar las
variables (E, B) o las variables (φ, A) . Pero a cada punto en el plano (E, B)
le corresponde en el plano (φ, A) , no un punto, sino un conjunto infinito de
puntos que denotamos D. La libertad gauge es poder usar cualquier punto
del conjunto D. Ahora, podemos escoger, dentro de D, un subconjunto, el
subconjunto de todos los campos (φ, A) que cumplen alguna condición que
nos parezca conveniente. Es usual escoger dentro de D el subconjunto de
campos (φ, A) que cumplen una ecuación subsidiaria que recibe el nombre
de condición de gauge. Las condiciones de gauge más conocidas son la de
Coulomb y la de Lorentz:
∇ · A = 0 es la condición de gauge de Coulomb. Una de las enseñanzas de la

relatividad especial es la unión del espacio y el tiempo, y una ecuación que
sea relativistamente válida debe tratar al espacio y al tiempo en un plano de
igualdad. Si una ecuación menciona el espacio sin mencionar el tiempo, no
puede ser covariante, y tal es el caso con la ecuación ∇ · A = 0. El hecho de
que la condición de Coulomb no sea covariante la hace inapropiada cuando
se desea formular covariantemente una teorı́a. Si queremos una formulación
manifiestamente covariante de la electrodinámica, no debemos usar el gauge
de Coulomb. Esto no quiere decir que esta condición gauge sea inútil. A ba-
jas velocidades, y en muchos problemas de fı́sica atómica y estado sólido, una
formulación relativista resulta excesiva y torpe. En esos problemas no se as-
pira a usar una formulación covariante, y el gauge de Coulomb es apropiado.
Como queremos una expresión manifiestamente covariante de la electrodinámi-

ca, debemos buscar una condición de gauge covariante. Investiguemos la
condición de gauge de Lorentz:
1 ∂φ
+∇·A=0 (6.10)
c ∂t
A primera vista esta ecuación no parece covariante, pero si definimos
Aµ = (φ, A) , (6.11)
la ecuación (6.10) se escribe muy cortamente:
149
∂µ Aµ = 0 (6.12)
Como ∂µ es un operador vectorial, la ecuación (6.12) dice que en el gauge

de Lorentz Aµ es un vector. En general, cuando se necesite una formulación
manifiestamente covariante se puede usar el gauge de Lorentz. A lo largo
de todo este capı́tulo supondremos que el potencial Aµ cumple la condición
∂µ Aµ = 0.
Queremos expresar las cinco ecuaciones (6.1)-(6.5) en términos del poten-

cial Aµ , y aquı́ encontramos una de las ventajas del nuevo tratamiento:
cuando se usa Aµ , las dos ecuaciones homogéneas de Maxwell se satisfacen
automáticamente. En efecto, es evidente que con las definiciones (6.6) y (6.7)
se cumplen automáticamente las ecuaciones homogéneas (6.1) y (6.2). Esta
es una simplificación, ya que los campos Aµ quedan regidos, no por cua-
tro ecuaciones (de Maxwell), sino por dos apenas: las inhomogéneas (6.3) y
(6.4). Esta es una enseñanza, una guı́a práctica: cuando se usa Aµ , uno no
piensa en cuatro ecuaciones de Maxwell, sino en dos.
Expresemos pues las dos ecuaciones inhomogéneas (6.3) y (6.4) y la fuerza

de Lorentz (6.5) en términos del tensor Aµ . Esto es lo que haremos en las
próximas dos secciones.
6.2 Las dos ecuaciones de Maxwell

Al colocar las definiciones (6.6) y (6.7) en las ecuaciones inhomogéneas (6.3)
y (6.4) se obtiene fácilmente
1∂
(∇ · A) + ∇2 φ = −4πρ (6.13)
c ∂t
µ ¶
1 ∂2A 2 1 ∂φ 4π
2 2
−∇ A+∇ +∇·A = J (6.14)
c ∂t c ∂t c
En estas dos ecuaciones las variables φ y A están acopladas de una manera

complicada. Pero ellas se pueden desacoplar muy fácilmente; en efecto, si
utilizamos el gauge de Lorentz (6.10) las dos ecuaciones (6.13) y (6.14)
quedan ası́:
1 ∂2φ
− ∇2 φ = 4πρ (6.15)
c2 ∂t2
150
1 ∂2A 4π
− ∇2 A = J (6.16)
c2 ∂t2 c
La ganancia es considerable: ahora las ecuaciones de movimiento de φ y A

están desacopladas y, además, tienen una simetrı́a evidente. En vista de la
fórmula (5.41) las ecuaciones (6.15) y (6.16) se escriben muy cortamente:
∂µ ∂ µ φ = 4πρ
4π (6.17)
∂µ ∂ µ A = J
c
De otro lado, la ecuación (5.66) nos enseñó que las cantidades (ρc, J) forman
un cuadrivector:
J µ = (ρc, J) , (6.18)
entonces las ecuaciones (6.11) y (6.18) en (6.17) dan:
4π ν
∂µ ∂ µ Aν = J (6.19)
c
Esta fórmula expresa las dos ecuaciones inhomogéneas de Maxwell de una

manera manifiestamente covariante. Operando con ∂ν en ambos lados de
esta ecuación se obtiene
4π
∂ν J ν = ∂µ ∂ µ ∂ν Aν
c
Ahora, el lado derecho de esta ecuación es cero, debido a la condición (6.12),

entonces
∂ν J ν = 0 (6.20)
Esta es la ecuación de continuidad. Antes de concluir esta sección anotemos

que en ausencia de cargas y corrientes la teorı́a de Maxwell admite la existen-
cia de ondas electromagnéticas. En efecto, sino hay cargas ni corrientes, los
lados derechos de las ecuaciones (6.15) y (6.16) son cero, y en consecuencia:
151
µ ¶
1 ∂2 2
−∇ φ = 0
c2 ∂t2
µ ¶
1 ∂2 2
−∇ A = 0
c2 ∂t2
Estas son ecuaciones de ondas. Si hacemos cero los lados derechos de las
ecuaciones (6.17) se llega a
∂µ ∂ µ Aν = 0 (6.21)
Esta es la ecuación de ondas en una forma manifiestamente covariante.
6.3 La fuerza de Lorentz

Al desplegar las ecuaciones (6.6) y (6.7) en todas sus componentes llegamos
a:
Ex = −(∂ 0 A1 − ∂ 1 A0 ) Bx = −(∂ 2 A3 − ∂ 3 A2 )
Ey = −(∂ 0 A2 − ∂ 2 A0 ) By = −(∂ 3 A1 − ∂ 1 A3 ) (6.22)

Ez = −(∂ 0 A3 − ∂ 3 A0 ) Bz = −(∂ 1 A2 − ∂ 2 A1 )
Ya estamos en condición de atacar la fuerza de Lorentz. Las ecuaciones

(4.139)-(4.141) son:
dpx q
= [cEx + uy Bz − uz By ] (6.23)
dt c
dpy q
= [cEy + uz Bx − ux Bz ] (6.24)
dt c
dpz q
= [cEz + ux By − uy Bx ] (6.25)
dt c
Modifiquemos la escritura de la primera ecuación; la ecuación (5.54) dice

que c = γ −1 U 0 , uy = γ −1 U 2 , uz = γ −1 U 3 , entonces
dpx q£ 0 ¤
γ = U Ex + U 2 Bz − U 3 By
dt c
152
dpx dp1
De otro lado, γ = :
dt dτ
dp1 q£ 0 ¤
= U Ex + U 2 Bz − U 3 By
dτ c
También usamos tres de las ecuaciones (6.22) para obtener:
dp1 q£ 1 0 ¤
= (∂ A − ∂ 0 A1 )U 0 − (∂ 1 A2 − ∂ 2 A1 )U 2 − (∂ 1 A3 − ∂ 3 A1 )U 3 ,
dτ c
es decir:
dp1 q£ 1 0 ¤
= (∂ A − ∂ 0 A1 )U0 + (∂ 1 A2 − ∂ 2 A1 )U2 + (∂ 1 A3 − ∂ 3 A1 )U3
dτ c
Nótese que esta ecuación se puede escribir
dpa q
= (∂ a Aν − ∂ ν Aa )Uν (6.26)
dτ c
En esto se ha convertido la ecuación (6.23). Es fácil darse cuenta de que

también (6.24) y (6.25) corresponden a la ecuación (6.26). Ahora damos un
salto interesante; en vez de la ecuación (6.26) proponemos:
dpµ q
= (∂ µ Aν − ∂ ν Aµ )Uν (6.27)
dτ c
En conclusión: con la condición (6.12), las ecuaciones de la electrodinámica

manifiestamente covariantes son (6.19) y (6.27). La conexión entre Aµ y los
campos E y B está en (6.6) y (6.7). Las ecuaciones homogéneas (6.1) y (6.2)
no constituyen un resultado adicional (ver página 150).
Nota: El salto de las tres ecuaciones (6.26) a las cuatro ecuaciones (6.27)
es una generalización, porque agrega una cuarta ecuación, para µ = 4 :
dp0 q
= (∂ 0 Aν − ∂ ν A0 )Uν
dτ c
153
¿Qué significa esta ecuación, hemos descubierto algo nuevo, esto ya lo sabı́amos?
Para responder estas preguntas notemos que esta ecuación se puede escribir
ası́:
dp0 q 0 a
= (∂ A − ∂ a A0 )Ua
dτ c
dp0 q
γ = γ (∂ 0 Aa − ∂ a A0 )ua
dt c
dp0 q q
= (Ea )ua = E · u
dt c c
Ahora, p0 es la componente cero del cuadrivector momentum: p0 = Energı́a/c

= E/c, entonces
dE
= qE·u
dt
En el lado derecho de esta ecuación podemos sumar u × B · u = 0 :
dE u
= q [E + × B] · u
dt c
= F·u
Esta ecuación es Potencia = F · u , que es una ecuación ampliamente conoci-

da en la mecánica. En otras palabras, la ecuación (6.27) unifica la fuerza de
Lorentz con la ecuación de potencia. No es esta la primera vez, ni será la últi-
ma, en que la relatividad unifica. Lo que acabamos de ver ocurre a menudo
cuando uno quiere convertir una ecuación no covariante en otra ecuación que
sı́ sea covariante. Por lo general este proceso incluye una generalización (co-
mo el paso de (6.26) a (6.27)), y es aquı́ donde aparece información adicional,
ecuaciones adicionales. Estas ecuaciones adicionales pueden ser información
ya conocida, o pueden ser información nueva. En el primer caso la general-
ización aporta unificación, que es algo de por sı́ valioso. En el segundo caso,
la generalización aporta nueva fı́sica y abre las puertas a la observación de
fenómenos insospechados.
154
6.4 El tensor electromagnético
La teorı́a electrodinámica está escrita de modo manifiestamente covariante
en las ecuaciones (6.12), (6.19), y (6.27). Lograr esta escritura covariante
era uno de los objetivos principales de este capı́tulo; pero conviene además
que presentemos un nuevo tensor F µν que trae ventajas en el estudio de
las leyes de conservación y la formulación lagrangiana, asuntos que veremos
en los capı́tulos 7 y 8. Para comenzar anotemos que las ecuaciones (6.22) y
(6.27) sugieren decididamente que definamos la cantidad
F µν = ∂ µ Aν − ∂ ν Aµ (6.28)
La derivada ∂ µ es un operador vectorial y Aµ es un vector en el gauge de

Lorentz; entonces F µν es un tensor en el gauge de Lorentz, y se le conoce
como el tensor electromagnético. F µν es de rango 2, y por tanto tiene 16
componentes; pero es antisimétrico, entonces tiene solamente 6 componentes
libres, que son justamente las tres componentes de E y las tres componentes
de B. Las ecuaciones (6.22) muestran que
Ex = F 10 , Ey = F 20 , Ez = F 30
(6.29)
Bx = F 32 , By = F 13 , Bz = F 21
O, en forma matricial:
 
0 −Ex −Ey −Ez
 
 
 Ex 0 −Bz By 
 
F µν =


 (6.30)
 Ey Bz 0 −Bx 
 
 
Ez −By Bx 0
Ahora pasamos a expresar las ecuaciones de la electrodinámica en térmi-

nos del nuevo tensor F µν . Primero veremos las ecuaciones inhomogéneas de
Maxwell, luego las homogéneas y por último la fuerza de Lorentz.
155
Las ecuaciones inhomogéneas de Maxwell. Éstas se expresan medi-
ante (6.19):
4π ν
J = ∂µ (∂ µ Aν )
c
= ∂µ (∂ µ Aν − ∂ ν Aµ + ∂ ν Aµ )
= ∂µ (∂ µ Aν − ∂ ν Aµ ) + ∂ ν ∂µ Aµ
El último término del lado derecho es cero por la condición de Lorentz,

4π ν
entonces queda J = ∂µ (∂ µ Aν − ∂ ν Aµ ), es decir
c
4π ν
∂µ F µν = J (6.31)
c
Las ecuaciones homogéneas de Maxwell. Por la definición del tensor

F µν es claro que ∂ α F µν + ∂ ν F αµ + ∂ µ F να = ∂ α (∂ µ Aν − ∂ ν Aµ ) + ∂ ν (∂ α Aµ −
∂ µ Aα ) + ∂ µ (∂ ν Aα − ∂ α Aν ). Fácilmente vemos que el lado derecho de esta
ecuación es cero, o sea que
∂ α F µν + ∂ ν F αµ + ∂ µ F να = 0 (6.32)
En la ecuación (6.32) hacer α = 1 , µ = 2 y ν = 3 :
∂ 1 F 23 + ∂ 3 F 12 + ∂ 2 F 31 = 0
∂ 0 F 32 + ∂ 2 F 03 + ∂ 3 F 20 = 0
∂ 0 F 13 + ∂ 3 F 01 + ∂ 1 F 30 = 0
∂ 0 F 21 + ∂ 1 F 02 + ∂ 2 F 10 = 0
156
En estas cuatro ecuaciones haremos dos cosas: primero, cambiar las com-
ponentes F µν por las entradas de la matriz (6.30) y, segundo, substituir
∂ 0 , ∂ 1 , ∂ 2 , ∂ 3 por ∂0 , −∂1 , −∂2 , −∂3 , respectivamente. Se obtiene entonces
estas cuatro ecuaciones:
∂1 Bx + ∂3 Bz + ∂2 By = 0
∂0 Bx + ∂2 Ez − ∂3 Ey = 0
∂0 By + ∂3 Ex − ∂1 Ez = 0
∂0 Bz + ∂1 Ey − ∂2 Ex = 0
Estas ecuaciones son, claramente, las dos ecuaciones homogéneas (6.1) y

(6.2). En conclusión, la ecuación (6.32) es una escritura manifiestamente
covariante de las dos ecuaciones inhomogéneas de Maxwell.
La fuerza de Lorentz. En la ecuación (6.27) reconocemos la definición

del tensor electromagnético:
dpµ q
= F µν Uν (6.33)
dτ c
El problema de partı́cula libre ocurre cuando q = 0 o cuando no hay campo

electromagnético. En ambos casos el lado derecho de esta ecuación es cero:
dpµ
= 0 Partı́cula libre (6.34)
dτ
d2 xµ
= 0 Partı́cula libre (6.35)
dτ 2
Para concluir digamos que la formulación covariante de la electrodinámica

es ası́: con la definición (6.28) y la condición (6.12), las ecuaciones de la
electrodinámica son (6.31) y (6.33). La conexión entre F µν y los campos
E y B está en (6.29). Las ecuaciones homogéneas, contenidas en (6.32) no
constituyen un resultado adicional (ver página 150).
157
6.5 La transformación de los campos
En la sección 4.1 encontramos las reglas de transformación de los campos
E y B. Recuérdese, sin embargo, que el camino seguido en esa ocasión fue
largo y dispendioso. En este momento queremos deducir de nuevo esas re-
glas con las herramientas que nos suministra la notación covariante. Como
en esta notación no se usan E, B, sino F µν , lo que hacemos primero es en-
contrar la transformada del tensor electromagnético. Para esto utilizamos
las ecuaciones (5.46) , (5.47) y (6.30), ası́:
   
γ −γβ 0 0 0 −Ex −Ey −Ez γ −γβ 0 0
   
   
 −γβ γ 0 0   By   0 
   Ex 0 −Bz   −γβ γ 0 
   
   
 0 0 1 0   −Bx   0 
   Ey Bz 0  0 0 1 
   
0 0 0 1 Ez −By Bx 0 0 0 0 1
Obtenemos esta expresión de F 0 µν :

 
0 −Ex −γ(Ey − βBz ) −γ(Ez + βBy )
 
 
 
 Ex 0 −γ(Bz − βEy ) γ(By + βEz ) 
 
F 0 µν 
= 

 γ(E − βB ) γ(B − βE ) 0 −Bx 
 y z z y 
 
 
γ(Ez + βBy ) −γ(By + βEz ) Bx 0
Comparando con
 
0 −Ex0 −Ey0 −Ez0
 
 0 
 Ex 0 −Bz0 By0 
 
F 0 µν
=

,

 E0 Bz0 0 −Bx 
0
 y 
 
Ez0 −By0 Bx0 0
identificamos:
158
Ex0 = Ex Bx0 = Bx
Ey0 = γ(Ey − βBz ) By0 = γ(By + βEz )
Ez0 = γ(Ez + βBy ) Bz0 = γ(Bz − βEy )
Estas son las mismas reglas de transformación de la sección (4.1).
6.6 Dos escalares

Con F µν y el tensor ²αβγδ de Levi-Civita (ver la ecuación (5.36)) se puede
construir otro, que se llama el tensor electromagnético dual: F αβ ≡ 12 ²αβγδ Fγδ .
   
0 −Bx −By −Bz 0 Bx By Bz
   
   
 Bx 0 Ez 
−Ey   −Bx 0 Ez −Ey 
  
F αβ =

; Fαβ = 
 


 By −Ez 0 Ex   −By −Ez 0 Ex 
   
   
Bz Ey −Ex 0 −Bz Ey −Ex 0
Con los tensores F µν y F αβ se puede construir tres cantidades escalares,

que son F αβ Fαβ , F αβ Fαβ y F αβ Fαβ . Al desarrollar estos productos ma-
triciales se obtiene
F αβ Fαβ = −4E · B : escalar

(6.36)
F αβ Fαβ = −F αβ Fαβ = 2(E 2 − B 2 ) : escalar
Estas son las dos cantidades invariantes que vimos en las ecuaciones (4.49)
y (4.50). Los escalares (6.36) son cuadráticos en los campos, es decir, son
productos de dos campos. Con productos de cuatro campos también se puede
construir un escalar (ver la ecuación (5.50)) que es el determinante de F αβ .
El resultado es
det F αβ = (E · B)2 : escalar
159
E, B
D f, A
Figura 6.1 La relación entre

(E , B) y (φ , A) no es biunı́voca:
a unos valores dados de (E , B)
les corresponde todo un conjun-
to D de valores (φ , A) .
160
Capı́tulo 7
Las leyes de conservación
Ha llegado el momento de estudiar las corrientes, el tensor energı́a-momentum

y las leyes de conservación. Para tal efecto nos valdremos de un sistema
fı́sico, la nube de partı́culas, que es suficientemente simple para admitir un
tratamiento matemático sencillo, pero tiene además una complejidad sufi-
ciente para mostrar las sutilezas de las leyes de conservación. Después de
presentar estos temas concluimos el capı́tulo con la corriente del momentum
angular.
7.1 La nube de partı́culas
Al estudiar la nube de partı́culas en la sección 4.7 suponı́amos que a un

pequeño volumen de la nube se le podı́a asignar una velocidad u. Nuestro
propósito ahora es hacer un tratamiento más refinado, atendiendo a la con-
tribución que cada partı́cula individual aporta a la densidad y a la corriente.
Pensamos en un conjunto de partı́culas en los puntos x1 (t), x2 (t), x3 (t), ...
La densidad ρpar de partı́culas y la densidad Jpar de corriente se definen ası́:
X
ρpar (x, t) = δ 3 (x − xn (t)) (7.1)
n
X dxn (t)
Jpar (x, t) = δ 3 (x − xn (t)) , (7.2)
n
dt
161
donde el ı́ndice n = 1, 2, 3, ... recorre1 todas las partı́culas de la nube2 .
∂ a
Tomemos ahora la divergencia ∇ · Jpar = J ; se obtiene:
∂xa par
Xµ ∂ ¶ a
dxn (t) ∂ dxan (t)
3 3
δ (x − xn (t)) + δ (x − xn (t)) (7.3)
n
∂xa dt ∂xa dt
dxan (t) ∂ dxan (t)

Ahora, depende únicamente de t, o sea que es cero, en-
dt ∂xa dt
tonces:
X dxa (t) ∂
n
∇ · Jpar = a
δ 3 (x − xn (t))
n
dt ∂x
X dxa (t) ∂
n
= − a
δ 3 (x − xn (t))
n
dt ∂x n
X ∂ ∂
= − δ 3 (x − xn (t)) = − ρpar
n
∂t ∂t
De donde vemos que

∂ρpar
+ ∇ · Jpar = 0 (7.4)
∂t
Esta es la célebre ecuación de continuidad (véase la ecuación (6.20)). Es muy

importante, porque trae consigo la conservación del número de partı́culas,
tal como veremos enseguida. El número N de partı́culas es:
Z
N= d3 x ρpar (x, t) (7.5)
dN
Tomar la derivada y usar la ecuación (7.4)
dt
1
La ventaja de este tratamiento, tomado de Weinberg [11], radica en el hecho de
que aunque la nube está compuesta de partı́culas en posiciones discretas, las cantidades
ρpar (x, t) y Jpar (x, t) son campos que dependen de las coordenadas continuas (x, t).
2
Los fı́sicos le dicen polvo a un conjunto de partı́culas tal que todas ellas están en
reposo respecto a algún observador inercial. Lo que queremos estudiar en este capı́tulo no
es una nube de polvo.
162
Z Z
dN ∂ρpar (x, t)
= d3 x = − d3 x ∇ · Jpar (x, t)
dt ∂t
El lado derecho es un integral de volumen que, según el teorema de Gauss,

es igual a una integral en la superficie que cubre al volumen. Si este volumen
es suficientemente grande para abarcar todas las partı́culas, la corriente J
es cero en la superficie y el integral es cero. Vemos ası́ que
dN
=0 (7.6)
dt
En conclusión, la ecuación de continuidad (7.4) implica que el número total

de partı́culas de la nube se conserva.
Es importante que escribamos la corriente en notación covariante. Si lla-

mamos x0n (t) = ct, el evento (ct, xn (t)) que ocupa la partı́cula n se puede
escribir (x0n (t), xn (t)) ; o más cortamente, xµn (t). Las ecuaciones (7.1) y (7.2)
son
X dx0n (t)
cρpar (x, t) = δ 3 (x − xn (t))
n
dt
X dxan (t)
a
Jpar (x, t) = δ 3 (x − xn (t))
n
dt
0 = cρ
Para unificar estas dos ecuaciones definimos Jpar par , de modo que
µ
Jpar = (cρpar , Jpar ) (7.7)
X dxµn (t)
µ 3
Jpar = δ (x − xn (t)) (7.8)
n
dt
µ
Vamos a probar que Jpar es un Rvector, para lo cual multiplicamos el lado
derecho de la ecuación (7.8) por dx0 δ(x0 − x0n ) = 1:
XZ dxµn (t)
µ
Jpar = dx0 δ(x0 − x0n )δ 3 (x − xn (t))
n
dt
163
XZ dxµn
= dx0 δ 4 (x − xn )
n
dt
XZ
= c δ 4 (x − xn )dxµn (7.9)
n
R
De otro lado, la función δ 4 satisface la ecuación δ 4 (x − xn )d4 x = 1, o sea
que δ 4 (x − xn )d4 x es un escalar; como d4 x es un escalar (ver la ecuación
(5.49)), concluimos que δ 4 (x − xn ) es un escalar. Hecha esta observación,
regresamos al lado derecho de la ecuación (7.9). Como dxµn y δ 4 (x − xn ) son
µ
tensores, entonces Jpar es un vector. La ecuación de continuidad (7.4) se
escribe también:
µ
∂µ Jpar (x) = 0 (7.10)
7.2 Otras corrientes

La n-ésima partı́cula de la nube tiene carga eléctrica qn y momentum pνn .
En el lado derecho de la ecuación (7.8) podemos multiplicar cada sumando
por qn o por pνn , y de esta manera se obtienen otras dos corrientes:
X dxνn (t)
ν
Jelec (x) = qn δ 3 (x − xn (t)) (7.11)
n
dt
X dxνn (t)
Jpνµ (x) = pµn (t) δ 3 (x − xn (t)) (7.12)
n
dt
dxµn (t)
En la ecuación (7.11) podemos interpretar que qn δ 3 (x − xn (t)) es
dt
la densidad de corriente eléctrica que aporta la n-ésima partı́cula para la
µ
construcción de la densidad total de corriente eléctrica Jelec . Ası́ mismo, la
ecuación (7.12) da la ν-ésima componente de la densidad de corriente de
µ
momentum µ. Nótese que, como qn es un escalar, la corriente Jelec es un
µ ν
vector; de la misma manera, como pn (t) es un vector, Jpµ es un tensor de
segundo rango.
Cada partı́cula de la nube tiene una lı́nea en el mundo, una trayectoria

en el espaciotiempo. Esa trayectoria crea varias corrientes: la eléctrica, la
de momentum µ, etc. Con los aportes de todas las partı́culas se obtienen las
corrientes totales de la nube. Lo interesante es que existen varias corrientes
ν , J ν , J ν , etc.
simultáneamente: Jpart elec pµ
164
Vamos a demostrar que corriente eléctrica3 se conserva. Al tomar la diver-
gencia en la ecuación (7.11) tenemos en cuenta que la carga q es invariante
(ver página 43), o sea que sus derivadas son cero y se llega limpiamente a
una ecuación como (7.4):
∂µ J µ (x) = 0 (7.13)
Este es un resultado importante: la corriente eléctrica satisface la ecuación de

continuidad. En consecuencia, la carga eléctrica total de la nube permanece
constante a medida que transcurre el tiempo.
7.3 El tensor de energı́a y momentum

La densidad de corriente del momentum µ que presentamos en (7.12) se
µν
escribe usualmente Tmec :
X dxνn (t)
µν
Tmec (x) = pµn (t) δ 3 (x − xn (t)) (7.14)
n
dt
o como en la ecuación (7.9):
XZ
µν
Tmec (x) =c pµn δ 4 (x − xn ) dxµn (7.15)
n
La fórmula (7.14) puede transformarse usando la ecuación (5.62):
X pµn pν
µν n
Tmec (x) = c2 δ 3 (x − xn (t)) (7.16)
n
En
Esta ecuación muestra que el tensor se construye con las propiedades mecánicas
de las partı́culas, que son los momentos pµn ; por esta razón escribimos el
µν
subı́ndice “mec” en Tmec . Veremos más tarde que hay otros tensores de
3
De ahora en adelante omitiremos el subı́ndice “elec” que aparece en (7.11), de modo
que la corriente eléctrica se llamará simplemente J ν . Ası́ la hemos llamado en capı́tulos
anteriores.
165
energı́a y momentum: para el campo electromagnético, para el campo grav-
µν
itatorio, etc. Esos otros tensores no son de naturaleza mecánica como Tmec .
µν
De otro lado, la ecuación (7.16) también dice que Tmec es simétrico:
µν νµ
Tmec (x) = Tmec (x) (7.17)
0µ
Las cuatro componentes Tmec son especialmente importantes:
X
00
Tmec (x) = En δ 3 (x − xn (t)) (7.18)
n
X
0a
Tmec (x) = c pan δ 3 (x − xn (t)) (7.19)
n
00 (x) es la densidad de energı́a y T 0a (x) es

Estas ecuaciones dicen que Tmec mec
µν
c veces la densidad de momentum en dirección a. Por esta razón Tmec (x)
recibe el nombre de tensor de energı́a y momentum.
µν µν
7.4 ∂µ Tmec =0, ∂µ Tmec 6= 0
Es importante que nos detengamos a estudiar lo que ocurrirı́a si la diver-
µν
gencia de Tmec fuera cero, es decir, si
µν µν
∂µ Tmec = Tmec ,µ = 0 (7.20)
Esta ecuación implica que
∂ 0ν ∂ aν
T = −c a Tmec
∂t mec ∂x
Z Z
∂ 0ν 3 ∂ aν 3
Tmec d x = −c T d x
∂t ∂xa mec
De acuerdo con el teorema de Gauss, el lado derecho de esta ecuación es

igual a un integral en la superficie que cubre al volumen. Pensamos que
este volumen es mayor que el volumen ocupado por la nube de partı́culas,
de manera que Tmecaν y sus derivadas valen cero en la superficie. En estas
condiciones el lado derecho de la última ecuación es cero y
166
Z
d 0ν
Tmec (x) d3 x = 0 (7.21)
dt
R 0ν 3
O sea que las cuatro cantidades Tmec d x son constantes. En vista de que
estas cuatro cantidades son la energı́a total y el momentum total, podemos
µν
afirmar que cuando ∂µ Tmec = 0 se conservan la energı́a total y el momentum
total de la nube.
Acabamos de llegar a una conclusión importante, cual es que las leyes

de conservación de momentum y energı́a están expresadas en la ecuación
µν µν
∂µ Tmec = 0. Pero ¿verdaderamente se cumple la ecuación ∂µ Tmec = 0 en
las nubes?, ¿en toda clase de nubes?, ¿en cuáles sı́ y en cuáles no? Para
responder estas preguntas vayamos en detalle a los términos que conforman
µν µν µ0 µa
la divergencia de Tmec . Esta divergencia es ∂ν Tmec = ∂0 Tmec + ∂a Tmec :
µν µ0 ∂ X µ dxan (t) 3
∂ν Tmec = ∂0 Tmec + p (t) δ (x − xn (t))
∂xa n n dt
X dxan (t) ∂ 3
µ0
= ∂0 Tmec + pµn (t) δ (x − xn (t))
n
dt ∂xa
X ∂xan ∂ 3
µ0
= ∂0 Tmec − pµn (t) δ (x − xn (t))
n
∂t ∂xan
X ∂ 3
µ0
= ∂0 Tmec − pµn (t) δ (x − xn (t)) (7.22)
n
∂t
El último término del lado derecho es de la forma
∂ 3 ∂ ∂p 3
p δ = (p δ 3 ) − δ ,
∂t ∂t ∂t
o sea que la ecuación (7.22) es
µν µ0 ∂ X µ 3 X dpµn
∂ν Tmec = ∂0 Tmec − pn δ (x − xn (t)) + δ 3 (x − xn (t))
∂t n n
dt
X dpµn
µ0 µ0
= ∂0 Tmec − ∂0 Tmec + δ 3 (x − xn (t)) ,
n
dt
167
es decir:
X dpµn
µν
∂ν Tmec (x) = δ 3 (x − xn (t)) (7.23)
n
dt
Esta ecuación establece que la energı́a y el momentum de la nube se conser-

P dpµn 3
van si se cumple la condición δ (x − xn ) = 0. Veremos que hay unas
n dt
nubes que satisfacen esta condición, y otras que no la cumplen.
a) Partı́culas libres. En este caso las partı́culas no interactúan entre sı́ ni

con el exterior; como no hay choques, las partı́culas tienen movimiento rec-
dpµn
tilı́neo uniforme, las derivadas son cero, y en consecuencia la fórmula
µν
dt
(7.23) da ∂µ Tmec = 0. Se conservan la energı́a y el momentum.
b) Choques puntuales. Pensemos ahora que la nube no interactúa con

el exterior, pero las partı́culas chocan, interactúan en forma instantánea:
varias partı́culas coinciden en un evento e intercambian energı́a y momen-
tum en un proceso instantáneo. Bajo estas condiciones regresamos al lado
dpµn
derecho de la ecuación (7.23) y notamos que las derivadas difieren de
dt
cero únicamente durante los choques. Denotando por R el punto donde
ocurre un choque, la fórmula (7.23) es:
µν
XX dpµn0
∂ν Tmec (x) = δ 3 (x − R(t))
dt
R n0
Aquı́ hay una suma sobre todos los choques R, y el ı́ndice n0 recorre única-
mente las partı́culas que intervienen en el choque en R.
X d X µ
µν
∂ν Tmec (x) = δ 3 (x − R(t)) p 0
dt 0 n
R n
P
La sumatoria pµn0 es el momentum total, sumado, de todas las partı́culas
n0
que intervienen en la colisión en R. Este momentum es constante, o sea que
d X µ µν
p 0 es cero. En este caso la ecuación (7.23) es ∂ν Tmec = 0. Se conser-
dt 0 n
n
van la energı́a y el momentum.
168
c) La nube de partı́culas cargadas. Para la partı́cula n-ésima la fuerza
de Lorentz (6.33) es:
dpµn qn µ
= F α (xn )Unα
dτn c
qn µ dxα
= F α (xn ) n
c dτn
dτn
Multiplicar ambos lados por :
dt
dpµn qn µ dxα
= F α (xn ) n ,
dt c dt
y esto en la ecuación (7.23) da:
X qn dxαn 3
µν
∂ν Tmec (x) = F µ α (xn ) δ (x − xn (t))
n
c dt
X qn dxαn 3
= F µ α (x) δ (x − xn (t))
n
c dt
1 µ X dxα
= F α (x) qn n δ 3 (x − xn (t))
c n
dt
Con (7.11) reconocemos la densidad de corriente eléctrica:
µν 1 µ
∂ν Tmec (x) = F α (x)J α (x) (7.24)
c
Los casos a), b) y c) que acabamos de reseñar indican cuáles son las condi-
µν
ciones dinámicas que se deben cumplir para que la divergencia ∂ν Tmec sea
µν
cero. La clave está en reconocer en qué casos el tensor Tmec se refiere a un
sistema fı́sico aislado.
En el caso a) la nube está aislada del exterior y del interior: la energı́a
169
y el momentum total de la nube se forman exclusivamente con las contribu-
µν
ciones mecánicas. Es decir, Tmec menciona la totalidad de un sistema fı́sico;
no puede sorprendernos que se conserven la energı́a y el momentum; no
µν
puede sorprendernos que ∂ν Tmec sea cero.
En el caso c) existe el campo electromagnético creado por las mismas partı́cu-

las cargadas que forman la nube, y este campo tiene energı́a y momen-
tum. Hay un sistema total que tiene dos subsistemas: 1) las partı́culas, que
µν
tienen una energı́a-momentum enteramente mecánica descrita por Tmec y
2) el campo electromagnético. Estos dos subsistemas interactúan, intercam-
bian momentum-energı́a, o sea que ninguno de los dos conserva energı́a-
µν
momentum. El tensor Tmec se refiere apenas a uno de los subsistemas y
µν
por eso no se espera que ∂ν Tmec sea cero. El sistema total partı́culas-campo
sı́ está aislado del exterior, y portanto la energı́a y el momentum totales
sı́ se deben conservar. Debe existir otro tensor θµν que de cuenta de la en-
µν
ergı́a-momentum del campo, de modo que la suma (Tmec + θµν ) exprese la
µν
totalidad, y en consecuencia tenga divergencia nula: ∂ν (Tmec + θµν ) = 0.
El caso c) aclara lo que ocurre cuando entre las partı́culas de la nube hay
interacciones a distancia. Las interacciones a distancia denotan la presencia
de un campo, campo que también tiene energı́a y momentum. La totalidad
partı́culas-campo debe tener un tensor total de energı́a- momentum cuya
µν µν
divergencia sea nula. Ese tensor total no es Tmec , y por eso ∂ν Tmec 6= 0. Algo
muy diferente ocurre en el caso b); allı́ no hay interacciones a distancia, no
µν µν
hay campo, Tmec sı́ expresa un sistema total y por eso ∂ν Tmec = 0.
De regreso al caso c) que nos ocupaba hace un par de párrafos, detengámonos

en el tensor energı́a-momentum del campo electromagnético. Veremos en la
ecuación (8.59) que este tensor es
1 µα ν 1 µν
θµν = F Fα + η Fαβ F αβ (7.25)
4π 16π
∂
Tomar la derivada :
∂xν
1 µα ν 1 µα 1
θµν ,ν = F Fα ,ν + F ,ν Fα ν + 2η µν Fαβ F αβ ,ν
4π 4π 16π
1 µα ν 1 1
= F Fα ,ν + Fαν F µα,ν + Fαβ F αβ ,µ
4π 4π 8π
170
Partir en dos el segundo término del lado derecho:
1 µα ν 1 1 1
θµν ,ν = F Fα ,ν + Fαν F µα,ν + Fαν F µα,ν + Fαβ F αβ ,µ
4π 8π 8π 8π
El tercer término del lado derecho es
1 1 1 1
Fαν F µα,ν = Fβν F µβ ,ν = Fβα F µβ ,α = Fαβ F βµ,α
8π 8π 8π 8π
Entonces:
1 µα ν 1 1 1
θµν ,ν = F Fα ,ν + Fαβ F µα,β + Fαβ F βµ,α + Fαβ F αβ ,µ
4π 8π 8π 8π
1 µα ν 1
= F Fα ,ν + Fαβ (F µα,β + F βµ,α + F αβ ,µ )
4π 8π
En el lado derecho de esta ecuación usamos la ecuación de Maxwell (6.32)

para obtener:
1 µα ν
θµν ,ν = F Fα ,ν
4π
Ahora, ya que F µν = −F νµ la ecuación de Maxwell (6.31) es
4π ν
F νµ ,µ = − J , (7.26)
c
4π
es decir, Fα ν ,ν = − Jα . Entonces
c
1
θµν ,ν = − F µα Jα (7.27)
c
En este momento sumamos lado a lado las ecuaciones (7.24) y (7.27) para
obtener:
µν
(Tmec + θµν ),ν = 0 (7.28)
171
Más explı́citamente, usando las ecuaciones (7.16) y (7.25):
Ã !
X pµn pν 1 µα ν 1 µν
n
c2 δ 3 (x − xn ) + F Fα + η Fαβ F αβ =0
En 4π 16π
n ,ν
µν
La ecuación (7.28) dice que la energı́a y el momentum contenidos en Tmec +
µν
θ se conservan.
7.5 La corriente de momentum angular

En las ecuaciones (7.11) y (7.12) definimos las corrientes asociadas a q y pµ .
Las partı́culas también tienen momentum angular L y quisiéramos definir
la densidad de corriente que le corresponde. Un primer intento serı́a imitar
lo de (7.11) y (7.12):
X dxνn (t)
Ln (t) δ 3 (x − xn (t))
n
dt
Pero esta cantidad tiene un defecto grave: no es un tensor, porque L no es un

tensor. Entonces esta cantidad no puede ser una corriente en un tratamien-
to covariante. Debemos buscar otra manera de producir una corriente de
momentum angular que sı́ sea tensorial. Más especı́ficamente, buscamos un
tensor tal que una de sus componentes sea la densidad de momentum angu-
lar en dirección x, otra componente sea la densidad de momentum angular
y y otra componente sea la densidad de momentum angular z. Proponemos
este tensor:
µνδ µν
Mmec (x) = Tmec (x)xδ − Tmec
µδ
(x)xν (7.29)
X µ ν ¶
3 µ dxn δ dxδn ν
= δ (x − xn (t)) pn x − x (7.30)
n
dt dt
1 032
La densidad de momentum angular en dirección x es Mmec . Ası́ mismo,
c
1 013 1 021
Mmec es la densidad en dirección y, y Mmec es la densidad del momentum
c c
angular en dirección z. Estas identificaciones indican que la escogencia (7.29)
es adecuada.
172
7.6 Generalización
Llegó el momento de abandonar la nube de partı́culas que tanto nos ha
servido para establecer los conceptos de corrientes y conservaciones. De aho-
ra en adelante nos referiremos, en general, a cualquier tensor de energı́a y
µν
momentum T µν (x). Ejemplos concretos de este tensor son Tmec y θµν . El
T µν que mencionamos es general, y no tenemos que decidir de antemano si
T µν = T νµ o T µν 6= T νµ , ni necesitamos comprometernos con que ∂ν T µν = 0
o ∂ν T µν 6= 0, ni tenemos que decidir desde ya si T µν se refiere a una parte
o a la totalidad de un sistema fı́sico. Ası́ como en las ecuaciones (7.18) y
(7.19), la componente T 00 (x) es la densidad de energı́a y T 0a (x) es c veces
la densidad de momentum en dirección a. Asociado a la energı́a-momentum
contenidas en T µν hay un M µνδ que se define en forma similar a (7.29):
M µνδ (x) = T µν (x)xδ − T µδ (x)xν (7.31)
1
La densidad de momentum angular en dirección x es M 032 . Ası́ mismo,
c
1 013 1 021
M es la densidad en dirección y, y M es la densidad del momen-
c c
tum angular en dirección z. El tensor M µνδ es antisimétrico bajo el inter-
cambio de los ı́ndices νδ. Para saber cuántas componentes independientes
tiene, analicemos la estructura Aµ B νδ , con B νδ = −B δν . Como B νδ tiene
6 componentes independientes, entonces M µνδ tiene 24 componentes inde-
pendientes.
Leyes de conservación. La ecuación (7.20) se generaliza ası́:
∂µ T µν = T µν ,µ = 0 (7.32)
Esta ecuación expresa la conservación de la energı́a y el momentum. Veamos

ahora qué ocurrirı́a si la divergencia de M µνδ fuera cero:
∂µ M µνδ = 0 (7.33)
Esta ecuación dice que ∂0 M 0νδ = −∂a M aνδ , es decir
173
∂ 0νδ ∂
M = −c a M aνδ
∂t ∂x
Z Z
d 0νδ 3 ∂
M d x = −c M aνδ d3 x
dt ∂xa
El lado derecho de la última ecuación es un integral de volumen; de acuerdo

con el teorema de Gauss, es igual a un integral en la superficie que envuelve
al volumen. Pensemos que esta superficie cubre completamente al sistema
fı́sico, de manera que M aνδ y sus derivadas son, allı́, cero. Entonces el integral
es cero y queda
Z
d
M 0νδ (x)d3 x = 0 (7.34)
dt
R
O sea que lasZ10 cantidades M 0νδ d3 x son constantes del movimiento. En
1
particular, M 032 d3 x , que es el momentum angular total en dirección
c
x, se conserva. TambiénZ son constantesZlas componentes en dirección y y en
1 1
dirección z, que son M 013 d3 x y M 021 d3 x, respectivamente.
c c
Lo que acabamos de ver es ya rutina: una divergencia nula corresponde
a una ley de conservación. Lo interesante es aclarar bajo qué condiciones se
anula la divergencia de M µνδ , es decir, qué se necesita para que se conserve
el momentum angular. Para responder esta pregunta colocamos (7.31) en
(7.33):
0 = ∂µ (T µν xδ − T µδ xν )
= (∂µ T µν )xδ − (∂µ T µδ )xν + T µν ηµ δ − T µδ ηµ ν
= (∂µ T µν )xδ − (∂µ T µδ )xν + T δν − T νδ (7.35)
Esta ecuación se cumple si ∂µ T µν = 0 y T δν = T νδ . En conclusión, el

momentum angular se conserva cuando se cumplen estas dos condiciones:
∂µ T µν = 0 y T µν = T νµ .
Resumen: la ecuación ∂µ T µν = 0 expresa la conservación de la energı́a y

el momentum; si T µν = T νµ , la ecuación ∂µ T µν = 0 expresa la conservación
de la energı́a, el momentum y el momentum angular.
174
Buscaremos siempre tensores de energı́a-momentum que sean simétricos por
dos razones: 1) Para que que la ecuación ∂µ T µν = 0 exprese no solamente
la conservación de la energı́a-momentum, sino también la conservación del
momentum angular. 2) Para que la ecuación del campo gravitatorio no sea
inconsistente (véanse los comentarios acerca de la simetrı́a del tensor en-
ergı́a-momentum que aparecen en la página 298).
175
176
Capı́tulo 8
Dinámica lagrangiana
Cuando a una partı́cula se le imponen unas condiciones iniciales, ella sigue

cierta trayectoria. Y si, repitiendo el experimento, a la partı́cula se le im-
ponen de nuevo las mismas condiciones iniciales, ella repite la trayectoria
del primer experimento. Es como si la partı́cula estuviera obligada a seguir
esa trayectoria. ¿Qué tiene especial esa trayectoria, qué la distingue? Para
responder esta pregunta los fı́sicos han elaborado la idea de trayectorias vari-
adas: otras rutas que la partı́cula no sigue. Las trayectorias variadas no son
rutas verdaderas, sino imaginadas. Del conjunto total formado por la trayec-
toria verdadera y las imaginadas, la verdadera se distingue por la siguiente
caracterı́stica: en ella se minimiza la acción. En general, todos los sistemas
fı́sicos, al evolucionar, toman aquella ruta en la que se minimiza la acción. El
presente capı́tulo desarrolla estas ideas en una formulación manifiestamente
covariante.
8.1 Teorı́a lagrangiana para

una partı́cula
Parametrización de una curva. Continuamos con la notación habitual,
en la que xµ son las coordenadas de un evento cualquiera del espaciotiempo
y ηµν dxµ dxν es el intervalo entre dos eventos cercanos. Vamos a estudiar el
movimiento de una partı́cula masiva. Para ganar generalidad suponemos que
el movimiento es acelerado, y la partı́cula libre será un caso particular de
nuestro estudio. Pensemos, ası́ como en la la sección 5.7, que la trayectoria
total de la partı́cula está compuesta de muchos fragmentos infinitesimales.
Escojamos uno cualquiera de ellos y démonos cuenta de que existe un obser-
vador inercial respecto al cual la partı́cula está aproximadamente en reposo.
Un poco de tiempo después, y debido a la aceleración de la partı́cula, ésta
177
ya no estará en reposo respecto al primer observador inercial, el cual se ha
vuelto obsoleto y debe ser substituido por otro observador para el próximo
fragmento de trayectoria. Vemos ası́ que diferentes observadores, todos iner-
ciales, se relevan para acompañar a la partı́cula en fragmentos infinitesimales
sucesivos. Cada uno de los observadores registra un dτ dado por:
p
c dτ = ηµν dxµ dxν en la trayect. de la partı́cula (8.1)
R
y el tiempo propio se define como τ = dτ . Ya que cada dτ es un invariante,
un escalar, concluimos que τ es también un escalar.
Llamaremos trayectoria verdadera a la lı́nea en el mundo que verdadera-

mente sigue la partı́cula que estamos estudiando. Esta trayectoria es el re-
sultado de las fuerzas que sobre ella operan y de las condiciones iniciales.
A cada punto x̄ de la trayectoria verdadera le corresponde un valor de τ ;
en otras palabras, las x̄µ son funciones del parámetro escalar τ , dependen-
cia que escribimos en la forma habitual x̄µ = x̄µ (τ ). Por ejemplo, si en
τ = 3.7 las coordenadas de la partı́cula son (22, 33, 44, 55), podemos es-
cribir x̄0 (3.7) = 22, x̄1 (3.7) = 33, x̄2 (3.7) = 44, x̄3 (3.7) = 55.
Curvas variadas. Pensemos ahora en otra curva imaginaria, diferente a la

trayectoria verdadera; esta “trayectoria virtual” se construye punto a punto
de la manera siguiente: el punto x̄µ (τ ) se corre una cantidad δxµ (τ ) , o sea
que las coordenadas del nuevo punto serán x̄µ (τ ) + δxµ (τ ) . Vemos ası́ que
todos los puntos de la trayectoria verdadera y todos los puntos de la nueva
curva son funciones del mismo parámetro escalar τ .
Sean E1 y E2 dos eventos de la trayectoria verdadera, en los cuales el tiempo

propio vale τ1 y τ2 , respectivamente. Consideramos curvas virtuales arbi-
trarias, pero con la condición de que pasen por E1 y E2 . Esto quiere decir
que las variaciones δxµ deben ser cero en los extremos E1 y E2 , lo que se
escribe
δxµ (τ1 ) = δxµ (τ2 ) = 0 (8.2)
El cálculo de variaciones. Ahora pensamos que la trayectoria verdadera

se distingue de las variadas porque en la primera se minimiza el integral de
lı́nea de una función L:
178
Z τ2
δ L dτ = 0 en la trayectoria verdadera (8.3)
τ1
Si L es dada, la condición (8.3) se encarga de determinar cuál es la curva

verdadera que pasa por E1 y E2 . Si la curva verdadera es dada, la condición
(8.3) se encarga de determinar cuál es la función L. Pasemos a desarrollar
(8.3):
Z τ2
0 = δL dτ (8.4)
τ1
Z ³ ∂L
τ2
∂L dxα ´
= δxα +
δ dτ (8.5)
τ1 dxα
∂xα dτ
∂
Z τ2 ³ dτ
∂L α ∂ L dδxα ´
= δx + dτ (8.6)
τ1 ∂xα dxα dτ
∂
dτ
El último término del lado derecho se integra por partes, ası́:
 ¯τ2  
Z ¯ Z τ2
τ2
∂L dδx α ¯
 ∂L α ¯  d ∂L  α
dτ =  α δx ¯ −   δx dτ
τ1 dxα dτ dx ¯ τ1 dτ dxα
∂ ∂ ¯ ∂
dτ dτ τ1 dτ
En esta ecuación el primer término del lado derecho es cero debido a (8.2),
y la fórmula (8.6) queda:
 
Z τ2
 ∂L d ∂L  α
0 =  α −  δx dτ
τ1 ∂x dτ dxα
∂
dτ
Finalmente, como esta ecuación debe ser válida para valores arbitrarios de
δxα , es necesario que el integrando sea cero:
∂L d ∂L
− = 0 (8.7)
∂x α dτ dxα
∂
dτ
179
Estas son las célebres ecuaciones de Euler y Lagrange. El principio varia-
cional (8.3) se expresa mediante la ecuación diferencial (8.7).
En verdad, las ecuaciones de Euler-Lagrange no suelen ser muy útiles en

problemas prácticos. La importancia del método lagrangiano radica, primero,
en que las (8.7) son invariantes bajo transformaciones generales de coorde-
nadas y, segundo, por el impacto que tienen en amplias áreas de la fı́sica
teórica. Usualmente uno conoce la ecuación de la trayectoria verdadera y
desea averiguar cuál es la función L adecuada. Se propone tentativamente
una L de prueba, y seguidamente se procede a desarrollar las ecuaciones
(8.7) correspondientes; si estas ecuaciones coinciden con la ecuación conoci-
da de la trayectoria verdadera, entonces la L de prueba es buena.
Debemos tener presente que el cálculo variacional utiliza, en el fondo, los

dos primeros términos de una serie de Taylor. En efecto, esto es lo que se
entiende al pasar de la ecuación (8.4) a la (8.5). Ası́ como en toda serie de
Taylor, las derivadas se calculan en el punto de referencia (en la trayectoria
verdadera), o sea que la ecuación (8.7) se puede escribir más claramente ası́:
 
· ¸
∂L d  ∂L 
−   = 0 (8.8)
∂xα Verdadera dτ dxα
∂
dτ Verdadera
dxα
L es en general una función de xα , y τ . Escribimos entonces L =
µ ¶ dτ
dx α
L xα , , τ . La lagrangiana L y la acción A se definen ası́:
dτ
1
L = L lagrangiana (8.9)
γ
Z τ2
A = L dτ Acción (8.10)
τ1
p
Aquı́, 1/γ = 1 − u2 /c2 , y u es la trivelocidad de la partı́cula. La acción
debe ser un escalar, lo que implica que L también es escalar. Pero la la-
grangiana L no es escalar. Hay otra manera de escribir la acción, que se
obtiene combinando las ecuaciones (2.14), (8.9) y (8.10):
180
Z t2
A = L dt (8.11)
t1
Partı́cula libre. Como una aplicación sencilla de la formulación lagrangiana

recién vista, estudiemos el caso de la partı́cula libre. De acuerdo con la
dpα dUα
ecuación (6.34) podemos escribir = m0 = 0, o sea que:
dτ dτ
dUα
= 0 (8.12)
dτ
Buscamos una función L tal que su ecuación (8.7) de Euler-Lagrange coin-

cida con (8.12). Proponemos:
µ α
¶ r
α dx dxµ dxν
L x , = ηµν (8.13)
dτ dτ dτ
Para desarrollar las ecuaciones (8.7) procedemos a calcular los términos

∂L d ∂L
y :
∂x α dτ dxα
∂
dτ
∂L
= 0 (8.14)
∂xα
· ¸
∂L 1 ∂ dxµ dxν
= η
dxα 2L dxα µν dτ dτ
∂ ∂
dτ dτ
· ν
¸
1 µ dx dxµ ν
= ηµν η α + ηµν η α
2L dτ dτ
1 dxν
= 2ηνα (8.15)
2L dτ
1 dxα
= (8.16)
L dτ
La ecuación (8.8) exige que evaluemos (8.14) y (8.16) en la trayectoria ver-

dadera. Comencemos aclarando cuánto vale L en la trayectoria verdadera.
De acuerdo con la ecuación (8.13) podemos escribir
181
"r #
dxµ dxν
[ L ]Verdadera = ηµν
dτ dτ
Verdadera
De otro lado la ecuación (8.1) dice que

"r #
dxµ dxν
ηµν =c
dτ dτ
Verdadera
Combinando las dos últimas ecuaciones resulta [ L ]Verdadera = c, y al evaluar

(8.16) en la trayectoria verdadera se obtiene:
 
· ¸
 ∂L  1 dxα
 dxα  =
c dτ Verdadera
∂
dτ Verdadera
La ecuación (8.8) da, finalmente,

· ¸
1 d2 xα
− = 0
c dτ 2 Verdadera
Esta ecuación coincide con (8.12), lo que nos permite concluir que la es-
cogencia (8.13) es apropiada. Con (8.9) se sigue que un lagrangiano para
partı́cula libre es
r
1 dxµ dxµ
L= (8.17)
γ dτ dτ
El método lagrangiano no determina unı́vocamente la función L. Por ejemp-

lo, cualquier múltiplo de (8.17) es también bueno para partı́cula libre. Pronto
usaremos este:
r
m0 c dxµ dxµ
L=− (8.18)
γ dτ dτ
Partı́cula en un campo Aµ . Después de estudiar la partı́cula libre, pase-

mos al próximo nivel de complejidad estudiando la partı́cula sometida a una
fuerza. Veamos el caso de una partı́cula de carga q en un campo electro-
magnético Aµ . Sabemos que la ecuación de movimiento está dada por la
fuerza de Lorentz (6.33):
182
dpα q
= F αβ Uβ (8.19)
dτ c
Seguiremos la rutina habitual, que consiste en proponer un L. Si su ecuación

(8.7) de Euler-Lagrange coincide con (8.19), entonces el L escogido es bueno.
El L buscado debe ser (8.18) más un término que exprese la interacción
partı́cula-campo:
r
m0 c dxµ dxµ
L∼− + término de interacción
γ dτ dτ
La forma prerrelativista L = T − V = T − qφ sugiere que el término de

interacción es parecido a −qφ :
r
m0 c dxµ dxµ
L∼− − qφ ,
γ dτ dτ
r
dxµ dxµ
L ∼ −m0 c − qγφ
dτ dτ
E p0
Ahora, como E = mc2 = γm0 c2 , tenemos γ = = . Además
m0 c2 m0 c
φ = A0 , entonces:
r
dxµ dxµ q 0
L ∼ −m0 c − p A0
dτ dτ m0 c
Sin embargo L debe ser un escalar, lo que sugiere que intentemos cambiar
p0 A0 por pµ Aµ :
r
dxµ dxµ q µ
L = −m0 c − p Aµ (8.20)
dτ dτ m0 c
¿Es este L bueno? Para responder esta pregunta debemos averiguar si la

ecuación (8.7) de Euler-Lagrange de este L coincide con (8.19). Veremos en-
seguida que efectivamente (8.20) es una buena escogencia. Para demostrarlo
calculemos todas la derivadas que intervienen en (8.7):
183
∂L q µ
α
=− p Aµ,α (8.21)
dx m0 c
r
∂L ∂ dxµ dxµ q ∂
= − m c − pµ Aµ
dxα dxα 0 dτ dτ m0 c dxα
∂ ∂ ∂
dτ dτ dτ
El primer término del lado derecho ya fue calculado en (8.16); escribimos

entonces:
∂L m0 c dxα q ∂ dxµ
= −r − Aµ
dxα dxµ dxµ dτ c dxα dτ
∂ ∂
dτ dτ dτ dτ
m0 c dxα q
= −r − Aµ ηα µ
dxµdxµ dτ c
dτ dτ
m0 c dxα q
= −r − Aα (8.22)
dxµdxµ dτ c
dτ dτ
Ya podemos colocar (8.21) y (8.22) en (8.7):
d m c dxα q d q µ
− r 0 − Aα = − p Aµ,α (8.23)
dτ dx dxµ dτ
µ c dτ m0 c
dτ dτ
Recordemos, una vez más, lo que decı́amos respecto a la ecuación (8.8):

todos los términos en (8.23) deben calcularse en la trayectoria verdadera.
Entonces, de acuerdo con la fórmula (8.1), la raı́z cuadrada que aparece en
el lado izquierdo de (8.23) es c:
d q d q µ
pα + Aα = p Aµ,α
dτ c dτ m0 c
dpα q dxµ ∂Aα q µ

+ = U Aµ,α
dτ c dτ ∂xµ c
184
dxµ
De nuevo, la derivada debe evaluarse en la trayectoria verdadera, dando
µ
dτ
dx
= U µ:
dτ
dpα q q
+ U µ Aα,µ = U µ Aµ,α
dτ c c
dpα q¡ ¢ q
= Aµ,α − Aα,µ U µ = Fαµ U µ ,
dτ c c
que coincide con (8.19). Vemos ası́ que (8.20) es una buena escogencia.
Detengámonos un momento para mirar hacia atrás. Primero estudiamos

el problema más simple, que es partı́cula libre; para L propusimos (8.13) y
mostramos que, efectivamente, la ecuación de Euler-Lagrange coincide con
la ecuación de movimiento (8.12). Después pasamos al siguiente nivel de
complejidad, que es la partı́cula sometida a las fuerzas del campo electro-
magnético; para L propusimos (8.20) y mostramos que, efectivamente, la
ecuación de Euler-Lagrange coincide con la ecuación de movimiento (8.19).
En estos dos niveles iniciales hemos podido describir el movimiento de la
partı́cula. Queremos ahora atacar el próximo nivel, que es describir el movimien-
to del campo; es decir, las ecuaciones de evolución del campo, que son las
ecuaciones de Maxwell. El campo Aµ (x) juega el papel de coordenada gener-
alizada. Como hay infinitos eventos x que forman un continuo, hay también
un número infinito de coordenadas Aµ (x) que forman un continuo. Es nece-
sario que desarrollemos la teorı́a lagrangiana para coordenadas continuas,
asunto que atacaremos enseguida.
8.2 Teorı́a lagrangiana para

coordenadas continuas
La formulación lagrangiana no se reduce al estudio de las trayectorias de las
partı́culas, sino que además se aplica a los campos, que son aquellas canti-
dades fı́sicas que son funciones continuas del espacio y del tiempo. Llamemos
ω(t, r) al campo que queremos estudiar: ésta es una función continua de las
coordenadas (t, r) de los eventos del espaciotiempo. Para un r fijo, el campo
ω es una función únicamente de t, función a la que llamamos “la trayectoria
verdadera del campo ω en el punto fijo r”. Al compendiar todos los puntos
r del espacio se crea el concepto de “la trayectoria verdadera de ω en todo el
185
espacio”. Alrededor de ésta podemos imaginar variaciones, trayectorias que
no ocurren realmente. Pensemos ahora en una porción del espaciotiempo
comprendida entre t1 y t2 , y en un volumen V bordeado por una superfi-
cie S. Imaginemos trayectorias variadas, con unas variaciones δω(t, r) que
cumplen estas condiciones de frontera:
δω(t1 , r) = δω(t2 , r) = 0 para todo r (8.24)
δω(t, r) = 0 en S, para todo t (8.25)
El lagrangiano L es el integral de volumen de una densidad lagrangiana L:

Z
L = L d3 x (8.26)
V
L = L(ω(x), ∂µ ω(x)) (8.27)
La acción (8.11) es entonces:
Z t2 Z Z
3
A = L dt d x = L d4 x (8.28)
t1 V
El principio de Hamilton dice que δA = 0 en la trayectoria verdadera. En

vista de (8.28) escribimos:
ZZ
0 = δL dt d3 x (8.29)
ZZ µ ¶
∂L ∂L
= δω + δω,µ dt d3 x
∂ω ∂ω,µ
ZZ µ ¶
∂L ∂L ∂
= δω + δω dt d3 x (8.30)
∂ω ∂ω,µ ∂xµ
En el lado derecho reconocemos que

· ¸
∂L ∂ ∂ ∂L ∂ ∂L
µ
δω = µ
δω − δω µ ,
∂ω,µ ∂x ∂x ∂ω,µ ∂x ∂ω,µ
186
o sea que (8.30) es:
ZZ µ ¶ ZZ · ¸
∂L ∂ ∂L 3 ∂ ∂L
δω − µ dt d x = − δω dt d3 x (8.31)
∂ω ∂x ∂ω,µ ∂xµ ∂ω,µ
Llamemos LD al lado derecho de esta ecuación. Este lado derecho es una

suma de cuatro términos, según µ recorre los valores 0,1,2,3:
Z Z t2 · ¸ Z t2 Z · ¸
∂ ∂L 3 ∂ ∂L
LD = − δω dtd x − a ∂ω
δω d3 x dt
V t1 c ∂t ∂ω,0 t1 V ∂x ,a
(8.32)
En el primer término de (8.32) se ejecuta la integración temporal y (8.24)

dice que el resultado es cero. Del mismo modo, en el segundo término de
(8.32) se ejecuta la integración espacial y (8.25) dice que el resultado es cero.
Vemos ası́ que LD es cero y (8.31) queda:
ZZ µ ¶
∂ ∂L ∂L
δω µ
− dt d3 x = 0
∂x ∂ω,µ ∂ω
Como las variaciones δω son arbitrarias, la cantidad entre paréntesis debe

ser cero:
∂ ∂L ∂L
= (8.33)
∂xµ ∂ω,µ ∂ω
Esta es la ecuación de Euler-Lagrange para un campo ω.
Supongamos que se conoce la ecuación de movimiento de un campo. Para

hacer la formulación lagrangiana se comienza proponiendo una L, en base
a la cual se desarrolla la ecuación (8.33) de Euler-Lagrange. Si el resul-
tado de ese desarrollo coincide con la ecuación de movimiento del campo,
decimos que la escogencia de L fue apropiada. Ası́ se hace para formular
lagrangianamente una ecuación de movimiento dada. En otras ocasiones se
desea construir una teorı́a que tenga ciertas propiedades y se debe comenzar
proponiendo de entrada una L con la simetrı́a deseada. Aquı́ hay cierta dosis
187
de libertad; pero al proponer una densidad lagrangiana se debe verificar que
la L propuesta sea verdaderamente un escalar1 .
8.3 El tensor energı́a-momentum

La formulación lagrangiana conduce a la formulación hamiltoniana y al ten-
sor energı́a-momentum. A continuación veremos que este tensor surge natu-
ralmente en el estudio de las translaciones en el espaciotiempo. Para tal efec-
to debemos demostrar primero que bajo una translación infinitesimal δaµ el
campo ω y su derivada ∂µ ω sufren unas variaciones dadas por δω = (∂ν ω)δaν
y δ∂µ ω = (∂µ ∂ν ω)δaν .
El grupo de las translaciones en el espaciotiempo. Sean p1 y p2 dos

puntos del espacio xyz, y sea b = p2 − p1 . En estos dos puntos, el campo ω
adopta los valores ω(p1 ) y ω(p2 ). Ahora vamos a pensar en una translación
activa de un sistema fı́sico aislado: el sistema fı́sico (el campo), se translada
una cantidad b, mientras permanecen fijos los ejes coordenados y los puntos
p1 y p2 :
El valor del campo en p1 antes de la translación es ω(p1 ).
El valor del campo en p2 antes de la translación es ω(p2 ).
El valor del campo en p2 después de la translación es ω(p1 ).
El valor del campo en p2 ha sufrido un cambio:
ω(p2 ) → ω(p1 ) = ω(p2 − b). En general :
ω(r) → ω(r − b)
Para una translación infinitesimal b = −δa:
ω(r) → ω(r + δa)
En este momento hacemos una generalización a cuatro dimensiones. Cuando

1
Ya vimos que A es escalar; además la ecuación (5.49) dice que el diferencial de volumen
dt d3 x es escalar; la ecuación (8.28) dice entonces que L es escalar.
188
el sistema fı́sico se translada una cantidad constante −δaµ , el valor del campo
en el evento xµ sufre un cambio:
ω(xµ ) → ω(xµ + δaµ ) ,
∂ω
o sea que δω(x) = ω(xµ + δaµ ) − ω(xµ ) = δaν . Más cortamente:
∂xν
δω = (∂ν ω)δaν (8.34)
Esta es la fórmula que nos propusimos demostrar. Ella dice cómo varı́a el
campo bajo la translación; ahora veamos cómo varı́a la derivada del campo.
Tomar derivada ∂µ en ambos lados de(8.34):
∂µ δω = (∂µ ∂ν ω)δaν + (∂ν ω)∂µ δaν
δ∂µ ω = (∂µ ∂ν ω)δaν + (∂ν ω)∂µ δaν (8.35)
Como δaν es constante, queda finalmente:
δ∂µ ω = (∂µ ∂ν ω)δaν (8.36)
Concluye ası́ la tarea preliminar que nos habı́amos propuesto de calcular las
variaciones δω y δ∂µ ω.
El tensor canónico de energı́a y momentum. Enseguida procedemos

a calcular la variación δL ocasionada por una translación infinitesimal δaν .
Calculamos esta δL de dos maneras. La primera es:
∂L ν
δL = δa (8.37)
∂xν
y la segunda manera es con la regla de la derivación en cadena:
∂L ∂L
δL = δω + δ∂µ ω (8.38)
∂ω ∂∂µ ω
189
En el primer término del lado derecho utilizar la ecuación (8.33):
µ ¶
∂L ∂L
δL = ∂µ δω + δ∂µ ω
∂∂µ ω ∂∂µ ω
Ahora usamos (8.34) y (8.36):
·µ ¶ ¸
∂L ∂L
δL = ∂µ ∂ν ω + ∂µ ∂ν ω δaν
∂∂µ ω ∂∂µ ω
µ ¶
∂L
= ∂µ ∂ν ω δaν
∂∂µ ω
µ ¶
∂L
= ∂µ ω,ν δaν (8.39)
∂ω,µ
Igualamos los lados derechos de (8.37) y (8.39):
µ ¶
∂L
∂µ ω,ν δaν = (∂ν L) δaν
∂ω,µ
Es decir:
· µ ¶ ¸
∂L µ
∂µ ω,ν −η ν ∂µ L δaν = 0
∂ω,µ
Ahora, como las δa son arbitrarias, la cantidad entre paréntesis debe ser
cero:
µ ¶
∂L
∂µ ω,ν − η µ ν ∂µ L = 0
∂ω,µ
µ ¶
∂L µ
∂µ ω,ν − η ν L = 0 (8.40)
∂ω,µ
µ ¶
∂L ,ν µν
∂µ ω −η L = 0
∂ω,µ
190
La última ecuación se escribe
µν
∂µ Tcan = 0, (8.41)
con
µν ∂L ,ν
Tcan (x) = ω − η µν L (8.42)
∂ω,µ
Este T µ ν se llama el tensor canónico de energı́a-momentum, y por esta razón

escribimos el subı́ndice “can”.
La ecuación (7.21) nos indicó cuáles son las cuatro cantidades que se conser-
van cuando la divergencia del tensor energı́a-momentum es cero. En nuestro
caso el tensor canónico también tiene divergencia cero, y en consecuencia
las cuatro cantidades conservadas son:
Z
0ν
Tcan (x) d3 x
Las cuatro cantidades que hay dentro del integrando dan las densidades de
energı́a y de momentum:
00 ∂L
H = Tcan = ω̇ − L
∂ ω̇
→
− 1 0a ∂L − →
P = Tcan = − ∇ω
c ∂ ω̇
Aquı́, ω̇ = ∂ω/∂t. La conservación de energı́a-momentum es consecuencia del

aislamiento del sistema. Para un sistema que interactúa con el exterior, la L
no es como en (8.27), sino L = L(x, ω, ω,µ ). Que L dependa explı́citamente
de x agrega algunos términos en las ecuaciones que hemos escrito, y al final,
en vez de la ecuación (8.40) resulta:
µ ¶
∂L µ
∂µ ω,ν − η ν L 6= 0 ,
∂ω,µ
191
o sea que no hay divergencia nula ni conservaciones. Pero regresemos al
sistema aislado, para el cual la divergencia del tensor canónico es cero (se
conservan la energı́a y el momentum).
Tensor simétrico, tensor asimétrico. Nótese en la definición (8.42) que

los ı́ndices µ y ν intervienen disparejamente, o sea que el tensor canónico
µν
Tcan no es necesariamente simétrico bajo el intercambio de µ y ν. De he-
µν νµ
cho, en algunos problemas ocurre que Tcan = Tcan y en otros ocurre que
µν νµ
Tcan 6= Tcan . Esto es preocupante ya que, como decı́amos en la página 175,
necesitamos tensores energı́a-momentum que sean simétricos. En aquellos
µν νµ µν
problemas felices en los que Tcan = Tcan , el Tcan es satisfactorio. Pero si en
µν νµ µν
algún problema resulta que Tcan 6= Tcan , entonces Tcan es insatisfactorio y se
µν µν
necesita encontrar otro tensor θ que sı́ sea satisfactorio. El Tcan asimétrico
µν
debe ser “simetrizado”. Se trata de apoyarse en Tcan para construir otro
tensor de energı́a-momentum θµν que sea satisfactorio, es decir, que cumpla
estas dos condiciones:
∂µ θµν = 0
(8.43)
θµν = θνµ
µν
¿Cómo construir θµν a partir de Tcan ? No hay una regla que sirva para
µν
todos los casos; pero en un primer intento podemos sumarle a Tcan un nuevo
tensor, aun desconocido, que llamamos B µν :
θµν = Tcan
µν
+ B µν (8.44)
Se trata de averiguar el tensor desconocido B µν . Para tal efecto vamos a

colocar la θµν de la ecuación (8.44) en las dos ecuaciones (8.43). Al poner
µν
(8.44) en la primera de las condiciones (8.43) se obtiene ∂µ Tcan + ∂µ B µν = 0
y, en vista de (8.41) concluimos que
∂µ B µν = 0 (8.45)
Ahora, utilizando la ecuación (8.44) en la segunda de las condiciones (8.43)

µν νµ
llegamos a Tcan + B µν = Tcan + B νµ , es decir:
192
B µν − B νµ = Tcan
νµ µν
− Tcan (8.46)
µν
En conclusión: cuando Tcan resulta asimétrico, debemos construir un nuevo
tensor energı́a-momentum θ satisfactorio, es decir, un θµν que cumpla las
µν
µν
condiciones (8.43). Se propone θµν = Tcan + B µν . La incógnita B µν debe
cumplir las ecuaciones (8.45) y (8.46). La próxima sección muestra cómo se
µν
simetriza el Tcan del campo electromagnético.
8.4 Formulación lagrangiana del

campo electromagnético
El campo electromagnético nos ofrece una oportunidad para ilustrar con
un ejemplo las ideas que hemos desarrollado acerca de la formulación la-
grangiana de los campos. Comenzamos, como es costumbre, proponiendo
una densidad lagrangiana L tal que sus ecuaciones de Euler-Lagrange co-
incidan con las ecuaciones de movimiento, que en este caso son las cua-
tro ecuaciones de Maxwell (6.1-6.2). Ya vimos sin embargo, en la página
150, que la definición Fµν = Aν ,µ − Aµ,ν garantiza que las dos ecuaciones
homogéneas de Maxwell se satisfagan automáticamente. Entonces la única
tarea que debe cumplir L es reproducir a las dos ecuaciones inhomogéneas,
condensadamente escritas en la fórmula (6.31). Proponemos:
1 1
L=− Fαβ F αβ − Jα Aα (8.47)
16π c
Calculemos los términos que intervienen en la ecuación (8.33) de Euler-

Lagrange. El campo es Aσ :
∂L 1 ∂
=− F αβ Fαβ
∂Aσ,µ 16π ∂Aσ,µ
µ ¶
1 ∂Fαβ ∂F αβ
=− F αβ + Fαβ
16π ∂Aσ,µ ∂Aσ,µ
µ ¶
1 ∂Fαβ ∂Fαβ αβ
=− F αβ + F
16π ∂Aσ,µ ∂Aσ,µ
1 αβ ∂Fαβ
=− F
8π ∂Aσ,µ
193
∂L 1 αβ ∂
= − F (Aβ ,α − Aα,β )
∂Aσ,µ 8π ∂Aσ,µ
1 αβ σ µ
= − F (η β η α − η σ α η µ β )
8π
1
= − (F µσ − F σµ )
8π
∂L 1 µσ
= − F (8.48)
∂Aσ,µ 4π
De otro lado:
∂L 1
= − J σ,
∂Aσ c
entonces la ecuación (8.33) de Euler-Lagrange es:
1 1
− ∂µ F µσ = − J σ , (8.49)
4π c
que coincide con la ecuación (6.31) que querı́amos obtener. Vemos ası́ que
(8.47) es una buena densidad lagrangiana. Nos interesa particularmente el
campo de radiación en el vacı́o, donde Jα es cero; en este caso la ecuación
(8.47) da
1
L=− Fαβ F αβ : radiación libre (8.50)
16π
µν
El tensor canónico Tcan . Vamos a calcular el tensor canónico de energı́a-
momentum, usando la fórmula (8.42), que en nuestro caso es:
∂L
µν
Tcan = Aσ ,ν − η µν L (8.51)
∂Aσ,µ
En el lado derecho usamos (8.48) y (8.50):
µν 1 µ σ,ν 1 µν
Tcan =− F σA + η Fαβ F αβ (8.52)
4π 16π
194
Por las razones que expusimos en la página 175 es importante que inves-
µν
tiguemos si Tcan es simétrico o asimétrico; esto se resuelve calculando la
νµ µν
diferencia entre Tcan y Tcan :
νµ µν 1 µ σ,ν 1 ν σ,µ
Tcan − Tcan = F σA − F σA 6= 0 (8.53)
4π 4π
O sea que el tensor canónico es asimétrico. Vamos a remediar este defecto

µν
añadiéndole a Tcan una cantidad B µν , como en (8.44). La nueva cantidad
debe cumplir las condiciones (8.45) y (8.46). Detengámonos inicialmente en
la condición (8.46), que en vista de (8.53) es:
1 µ σ,ν 1 ν σ,µ
B µν − B νµ = F σA − F σA (8.54)
4π 4π
1 µ 1 ν
= F σ (Aσ,ν − Aν ,σ + Aν ,σ ) − F σ (Aσ,µ − Aµ,σ + Aµ,σ )
4π 4π
1 µ 1 ν
= F σ (F νσ + Aν ,σ ) − F σ (F µσ + Aµ,σ )
4π 4π
1 µ ν ,σ 1 ν µ,σ
= F σA − F σA (8.55)
4π 4π
Esto sugiere que probemos, tentativamente, la siguiente propuesta:
1 µ ν ,σ
B µν = F σA (8.56)
4π
1 µσ 1 1
= F ∂σ Aν = ∂σ (F µσ Aν ) − (∂σ F µσ )Aν
4π 4π 4π
En el último término del lado derecho usar la ecuación (7.26):
1 1
B µν = ∂σ (F µσ Aν ) + J µ Aν (8.57)
4π c
y en el vacı́o se tiene J µ = 0:
1
B µν = ∂σ (F µσ Aν ) (8.58)
4π
195
Esto es lo que se obtiene al imponer la condición (8.46). Debemos todavı́a
ponerle atención a la condición (8.45). El intento (8.56) es bueno si esa B µν
cumple la condición (8.45). Veamos que efectivamente la cumple, aplicando
la derivada ∂µ en ambos lados de (8.58):
1
∂µ B µν = ∂µ ∂σ (F µσ Aν )
4π
El lado derecho es cero, porque es la contracción total de un tensor simétrico

con otro antisimétrico (véase la ecuación (5.38)). Es claro entonces que la
escogencia (8.56) es adecuada. Ya estamos en condición de colocar (8.52) y
(8.56) en (8.44):
1 µ σ,ν 1 µν 1 µ ν ,σ
θµν = − F σA + η Fαβ F αβ + F σA
4π 16π 4π
1 µν 1 µ
= η Fαβ F αβ − F σ (Aσ,ν − Aν ,σ )
16π 4π
1 µν 1 µ νσ
= η Fαβ F αβ − F σF
16π 4π
He aquı́ la respuesta final:
1 µν 1 µσ ν
θµν = η Fαβ F αβ − F F σ (8.59)
16π 4π
1 µ 1 µσ
θµ ν = η ν Fαβ F αβ − F Fνσ
16π 4π
En forma matricial, los tensores θµν y θµ ν son:
196
 1 2

2 (E + B2) (E × B)x (E × B)y (E × B)z
 
 
 1 2 
 (E + B 2 ) −Ex Ey −Ex Ez 
 (E × B)x 2 
 −Bx By −Bx Bz 
 −Ex2 − Bx2 
 
 
 
1  1 2 
θµν =  −Ex Ey (E + B 2 ) −Ey Ez 
4π 
 (E × B)y 2 

 −Bx By −Ey2 − By2 −By Bz 
 
 
 
 1 2 2 
 −Ex Ez −Ey Ez (E + B ) 
 (E × B)z 2 
 −Bx Bz −By Bz 2

2 
 −Ez − Bz
 1 2

2 (E + B2) −(E × B)x −(E × B)y −(E × B)z
 
 
 1 
 − (E 2 + B 2 ) Ex Ey Ex Ez 
 (E × B)x 2 
 +Bx By +Bx Bz 
 +Ex2 + Bx2 
 
 
 
1  1 
θµ ν =  Ex Ey − (E 2 + B 2 ) Ey Ez 
4π 
 (E × B)y 2 

 +Bx By +Ey2 + By2 +By Bz 
 
 
 
 1 2 

 (E × B)z
Ex Ez Ey Ez − (E + B 2 ) 

 2 
 +Bx Bz +By Bz 2 2 
+Ez + Bz
197
198
Capı́tulo 9
Transformaciones generales
de coordenadas
Cuando dedujimos las transformaciones de Lorentz nos dimos cuenta de que,

si querı́amos usar coordenadas cartesianas (t, x, y, z), las ecuaciones debı́an
ser lineales, y ası́ lo establecimos en la página 21. Para el estudio de la
relatividad general es necesario salirse de las ecuaciones lineales y abordar
las transformaciones generales de coordenadas. Este capı́tulo, que a eso se
dedica, pretende dar las bases matemáticas necesarias para la formulación
de la teorı́a general de la relatividad, de Einstein. Comenzamos definiendo
los espacios de Riemann. Decimos que un espacio (con coordenadas xµ ) es
riemanniano si se cumplen las siguientes tres condiciones:
• Existe una forma fundamental gµν dxµ dxν que es invariante bajo trans-
formaciones generalizadas de coordenadas.
• Todas las segundas derivadas de gµν existen y son continuas.
• El determinante de gµν no es cero.
9.1 Subı́ndices y superı́ndices

La forma fundamental gµν dxµ dxν se llama intervalo, y la denotamos (ds)2 :
(ds)2 = gµν dxµ dxν , (9.1)
donde los n2 coeficientes gµν son, en general, funciones de las coordenadas

xα . Estos coeficientes forman una matriz n×n que es simétrica. Para probar
que es simétrica notemos que si en (9.1) intercambiamos los nombres de
los ı́ndices mudos µ y ν obtenemos (ds)2 = gνµ dxν dxµ = gνµ dxµ dxν . Al
199
comparar esto con (9.1) concluimos que gµν = gνµ . Hay otra matriz muy
importante que es la identidad, que denotamos por medio del sı́mbolo δ µ ν .
Ahora definimos la matriz g µα como la inversa de gαν :
g µα gαν = δ µ ν (9.2)
A partir de las n cantidades dxν y la matriz gµν definimos otras n cantidades

dxµ de la manera siguiente:
dxµ = gµν dxν (9.3)
Ahora, si multiplicamos ambos lados de esta ecuación por g ξµ y utilizamos

la ecuación (9.2) encontramos g ξµ dxµ = δ ξ ν dxν , es decir:
dxξ = g ξµ dxµ (9.4)
Las ecuaciones (9.3) y (9.4) indican que g µν sirve para “subir” un subı́ndice
y gµν sirve para“bajar” un superı́ndice. Los ı́ndices se pueden bajar y subir
no sólo en dxα y en dxα , sino además en cualquier otra cantidad, como por
ejemplo:
Cµ = gµν C ν C µ = g µν Cν
Aα β γ = gνβ Aανγ Aαβγ = g νβ Aα ν γ
Claramente podemos usar a g µα para subir un ı́ndice en gαν , ası́: g µα gαν =

gµν = δµν :
gµν = δµν gµ ν = δµ ν
Cuando un ı́ndice aparece una sola vez en un término, decimos que es libre.
Por ejemplo, en B µ Cν los ı́ndices µ y ν son libres. Si una misma letra aparece
dos veces en un término, como superı́ndice y como subı́ndice, decimos que
se trata de ı́ndices contraı́dos. Por ejemplo, en B µ Cµ los ı́ndices µ están
contraı́dos.
Si multiplicamos ambos lados de la ecuación Aµ ν = B µ Cν por gµσ obten-

emos Aσν = Bσ Cν . Ası́ mismo, al multiplicar ambos lados de Aµ ν = B µ Cν
200
por g νσ obtenemos Aµσ = B µ C σ . Finalmente, si multiplicamos ambos lados
de Aµσ = B µ C σ por gµν se obtiene Aν σ = Bν C σ . En conclusión, todas estas
ecuaciones son equivalentes: Aµ ν = B µ Cν , Aµν = Bµ Cν , Aµν = B µ C ν y
Aµ ν = Bµ C ν . Vemos ası́ que dos ı́ndices libres e iguales en ambos lados de
una ecuación se pueden subir o bajar.
Reunamos las formas diferentes que conocemos de escribir la ecuación del

intervalo (9.1):
(ds)2 = g µν dxµ dxν = gµν dxµ dxν = dxµ dxµ
Ejemplo: En el plano podemos usar coordenadas cilı́ndricas (r, ϕ) , que

llamaremos (x1 , x2 ) . El intervalo es (ds)2 = (dx1 )2 + r2 (dx2 )2 , que escribi-
mos sugestivamente ası́:
(ds)2 = dx1 dx1 + (x1 )2 dx2 dx2 + 0 dx1 dx2 + 0 dx2 dx1
y al comparar esto con (9.1) identificamos las cuatro entradas de la matriz

gαβ :
" #
1 0
gαβ = (9.5)
0 (x1 )2
Fácilmente calculamos el inverso de esta matriz, y la llamamos g αβ :
" #
1 0
g αβ = ¡ ¢2 (9.6)
0 1/x1
Finalmente, las componentes (x1 , x2 ) se calculan usando las fórmulas (9.3)

y (9.5), para obtener (x1 , (x1 )2 x2 ) = (r, r2 ϕ)
La derivada tiene una notación muy compacta:
∂ ∂
∂µ = = gµν ∂ ν ∂µ = = g µν ∂ν
∂xµ ∂xµ
201
9.2 Transformaciones generales
Hemos dicho que xν son las coordenadas de un punto del espacio en un sis-
tema de coordenadas no primado. Ahora, si se usa otro sistema de coorde-
nadas, el mismo punto tendrá coordenadas x0ν . Cada una de las coordenadas
primadas x0µ debe ser función de las no primadas xν :
x0µ = x0µ (xν ) (9.7)
¿Son estas funciones lineales o no lineales? Para responder esta pregunta

continuemos el ejemplo de la sección anterior, pensando ahora en la trans-
formación que lleva de coordenadas cilı́ndricas (r, ϕ) a coordenadas carte-
sianas (x, y) . Llamando (x1 , x2 ) a las coordenadas cilı́ndricas y (x01 , x02 ) a
las cartesianas, podemos escribir la transformación entre los dos sistemas
coordenados:
x01 = x1 cos x2 ; x02 = x1 sen x2 (9.8)
Notemos que ∂x01 /∂x1 = cos x2 , ∂x01 /∂x2 = −x1 sen x2 , ∂x02 /∂x1 = sen x2 ,
y ∂x02 /∂x2 = x1 cos x2 . Queremos resaltar un asunto de primera importan-
cia: las derivadas ∂x0µ /∂xν no son constantes, lo que marca una diferencia
fundamental con las transformaciones lineales discutidas en la sección 5.2.
Este ejemplo pone de presente la importancia de las transformaciones no
lineales. Las transformaciones no lineales son interesantes desde un punto
de vista matemático, pero también desde un punto de vista fı́sico, asunto
que se hace evidente cuando se desea generalizar la relatividad especial, co-
mo veremos enseguida:
En la relatividad especial se trata de observadores inerciales. Si queremos

generalizar esta teorı́a debemos pensar en la transformación que lleva de un
observador inercial a otro observador acelerado. Pensemos en un observador
primado que tiene aceleración a en dirección z respecto al no primado; en
relatividad galileana y en notación standard, la transformación serı́a:
1
z 0 = z − (v0 t + at2 ) ,
2
de donde vemos que ∂z 0 /∂t = −v0 − at 6= constante. Esto muestra que aún
202
para generalizar la más simple de las relatividades, como es la de Galileo,
es preciso utilizar transformaciones no lineales, i.e., aquellas en las que las
derivadas ∂x0µ /∂xν no son constantes. Vemos ası́ plenamente justificado este
capı́tulo, dedicado a las transformaciones generales de coordenadas. En este
contexto de las transformaciones generalizadas de coordenadas se definen
los vectores:
9.3 Los vectores

Tomando diferenciales en ambos lados de la ecuación (9.7) encontramos
∂x0µ ν
dx0µ = dx (9.9)
∂xν
Una de las piezas más importantes en la teorı́a de transformaciones gener-

alizadas de coordenadas es el vector dxµ . Entre dos puntos infinitamente
próximos la diferencia de coordenadas no primadas es dxµ y la diferencia de
coordenadas primadas es dx0µ . Lo importante es que conociendo las compo-
nentes no primadas del vector (que son las dxµ ) podemos llegar a conocer las
componentes primadas del vector (que son las dx0µ ) por medio de la fórmula
(9.9).
Pensemos enseguida en un conjunto de cuatro cantidades que en las co-

ordenadas no primadas aparecen como Aµ , mientras que en las coordenadas
primadas aparecen como A0µ . Nosotros no podemos asegurar de antemano
cuál es la relación entre las A0µ y las Aµ . Pero si ocurre que
∂x0µ ν
A0µ = A , (9.10)
∂xν
entonces decimos que A es un vector.
dxµ es, por definición, el vector prototipo. Comparando (9.10) con (9.9)
nos damos cuenta de que A transforma como dx , porque en ambas ecua-
∂x0µ
ciones se usan los mismos coeficientes . Decimos que A es un vector
∂xν
porque transforma como el vector prototipo (obsérvese que uno no prueba
que dx es un vector). El concepto de vector aparece inseparablemente ligado
al concepto de las transformaciones de coordenadas. Que A sea un vector
203
no es una propiedad intrı́nseca de A; no podemos decir que A es un vector
por sı́ sólo, sino que el carácter vectorial de A es una propiedad que tiene
A en referencia a la transformación de coordenadas xµ → x0µ . No cualquier
conjunto de n cantidades, aunque se rotulen con ı́ndices, es un vector.
Invitamos al lector a regresar a la sección 5.2, y en particular al paso que se

da entre las ecuaciones (5.14) y (5.15). Ese paso es inválido en las transfor-
maciones generales, o sea que, en vez de las ecuación (5.15), debemos ahora
escribir:
∂x0µ ν
x0µ 6= x Transf. generales (9.11)
∂xν
Comparando las ecuaciones (9.9) y (9.11) nos damos cuenta de que xν no

transforma como el vector prototipo dxν . Entonces xν no es un vector bajo
el grupo de las transformaciones generales de coordenadas. Aunque sı́ es vec-
tor bajo el grupo de las transformaciones lineales. Vemos que un conjunto
de n cantidades puede ser vector respecto a un grupo de transformaciones,
y no serlo respecto a otro grupo; de esta manera confirmamos la afirmación
que hicimos arriba, en el sentido de que el carácter vectorial de una cantidad
no es una propiedad exclusiva de esa cantidad, en sı́ misma, sino que además
se refiere a un grupo de transformaciones.
El vector dx se caracteriza por sus n componentes contravariantes dx0 ,

dx1 , dx2 , dx3 · ··, pero también se puede caracterizar por sus n componentes
covariantes dx0 , dx1 , dx2 , dx3 · · · . La fórmula (9.3) dice cómo se construyen
las cantidades dxµ , y también cómo se construyen las cantidades Aµ :
Aµ = gµν Aν
Decimos entonces que todo vector A se caracteriza por sus n componentes

contravariantes A0 , A1 , A2 , A3 · ··, y también se puede caracterizar por sus
n componentes covariantes A0 , A1 , A2 , A3 · · · .
Transformación de las componentes Aµ . Hemos visto que las compo-

nentes contravariantes Aµ transforman según (9.10), y debemos averiguar
de qué manera transforman las componentes covariantes Aµ . Para tal efec-
to es preciso deducir antes una identidad importante. Hemos dicho que el
intervalo (ds)2 es un escalar, es decir, da lo mismo en todos los sistemas
204
0 dx0 µ dx0 ν .
coordenados; entonces la ecuación (9.1) dice que gµν dxµ dxν = gµν
Esta ecuación es, obviamente,
λ ρ
gµν dxµ dxν = gλρ
0
dx0 dx0 (9.12)
Entonces, utilizando la ecuación (9.9):
∂x0λ ∂x0ρ µ ν
gµν dxµ dxν = gλρ
0
dx dx ;
∂xµ ∂xν
reunir todo en el lado izquierdo:

µ 0λ 0ρ
¶
0 ∂x ∂x
gµν − gλρ dxµ dxν = 0
∂xµ ∂xν
Como esta ecuación debe ser válida para todos los valores de dxµ , la cantidad
dentro del paréntesis debe ser cero:
0 ∂x0λ ∂x0ρ
gλρ = gµν (9.13)
∂xµ ∂xν
Ahora multiplicar ambos lados de esta ecuación por g νπ y utilizar la ecuación

(9.2):
∂x0λ νπ 0 ∂x0ρ
g gλρ = δµ π (9.14)
∂xµ ∂xν
De otro lado es claro que, como las coordenadas xπ son independientes,

entonces ∂xπ /∂xµ = δµ π . Ahora, la regla de la derivación en cadena dice
que esta ecuación es igual a:
∂x0λ ∂xπ
= δµ π (9.15)
∂xµ ∂x0λ
Igualemos entonces los lados izquierdos de las ecuaciones (9.14) y (9.15):
∂x0λ νπ 0 ∂x0ρ ∂x0λ ∂xπ

g gλρ = ,
∂xµ ∂xν ∂xµ ∂x0λ
205
∂xµ
y multipliquemos ambos lados de esta ecuación por :
∂x0ω
∂xµ ∂x0λ νπ 0 ∂x0ρ ∂xµ ∂x0λ ∂xπ

g gλρ = (9.16)
∂x0ω ∂xµ ∂xν ∂x0ω ∂xµ ∂x0λ
∂xµ ∂x0λ
En ambos lados de esta ecuación aparece el factor ; la regla de
∂x0ω ∂xµ
∂xµ ∂x0λ ∂x0λ
la derivación en cadena dice que = = δω λ , o sea que la
∂x0ω ∂xµ ∂x0ω
ecuación (9.16) es
∂x0ρ ∂xπ
δω λ g νπ gλρ
0
= δω λ
∂xν ∂x0λ
∂x0ρ ∂xπ
g νπ gωρ
0
= (9.17)
∂xν ∂x0ω
Esta es la ecuación importante que querı́amos deducir. Ahora multiplicar

ambos lados por Aπ :
0 ∂x0ρ ν ∂xπ
gωρ A = Aπ
∂xν ∂x0ω
En el lado izquierdo utilizamos la ecuación (9.10) para obtener:
0 ∂xπ
gωρ A0ρ = Aπ ,
∂x0ω
o sea que, finalmente:

∂xπ
A0ω = Aπ (9.18)
∂x0ω
Este es el modo como transforman las componentes covariantes de cualquier

vector A . Por supuesto que las componentes dxµ transforman de la misma
manera:
∂xπ
dx0ω = dxπ (9.19)
∂x0ω
206
9.4 Otros tensores
Pasemos a estudiar la estructura Aµ B ν , cuando A y B son vectores. De
acuerdo con la regla de transformación (9.10), las componentes contravari-
antes de A y B transforman ası́: A0µ = (∂x0µ /∂xα )Aα y B 0ν = (∂x0ν /∂xβ )B β .
Multipliquemos lado a lado estas dos ecuaciones para obtener:
∂x0µ ∂x0ν α β
A0µ B 0ν = A B
∂xα ∂xβ
Comparando con esta fórmula, pasamos a definir lo que es un tensor de

rango 2, de este modo: T es un tensor de rango 2 si
∂x0µ ∂x0ν αβ
T 0µν = T (9.20)
∂xα ∂xβ
Las componentes contravariantes de T transforman como Aµ B ν ; de la mis-

ma manera, las componentes covariantes de T transforman como Aµ Bν :
0 ∂xα ∂xβ
Tµν = Tαβ , (9.21)
∂x0µ ∂x0ν
y las componentes mixtas transforman como Aµ Bν :
∂x0µ ∂xβ α
T 0µ ν = T β, (9.22)
∂xα ∂x0ν
y como Aµ B ν :
∂xα ∂x0ν
T0 µ ν = Tα β (9.23)
∂x0µ ∂xβ
Generalizamos diciendo que los tensores de rango j tienen j ı́ndices. Los

tensores de rango 0 reciben el nombre de escalares, y los de rango 1 se
llaman vectores. Algunas de las componentes de un tensor C de rango 3
transforman ası́:
207
∂x0µ ∂x0ν ∂x0δ αβγ
C 0 µνδ = C
C 0 µνδ = Cαβγ
∂x0µ ∂x0ν ∂x0δ
∂xα ∂x0ν ∂xγ
C0 µ ν δ = Cα β γ
∂x0µ ∂xβ ∂x0δ
Finalmente, un tensor de rango 4:
∂x0µ ∂x0ν ∂x0σ ∂xγ αβλ

A0µνσ ρ = A γ (9.24)
∂xα ∂xβ ∂xλ ∂x0ρ
Las transformaciones inversas: Hasta el momento hemos presentado

la manera de averiguar las componentes primadas de un tensor en términos
de las no primadas. El camino inverso -las no primadas en términos de las
primadas- es muy fácil. Multiplicando ambos lados de la ecuación (9.10) por
∂xα
se llega a:
∂x0µ
∂xα 0µ ∂xα ∂x0µ ν ∂xα ν

A = A = A = δ α ν Aν = Aα
∂x0µ ∂x0µ ∂xν ∂xν
Reescribamos esto:
∂xµ 0ν
Aµ = A . Ası́ mismo:
∂x0ν
∂x0ν 0
Aµ = A
∂xµ ν
Esto para tensores de rango 1. Para los de rango 2:
∂xµ ∂xν 0αβ

T µν = T
∂x0α ∂x0β
∂x0α ∂x0β 0
Tµν = T (9.25)
∂xµ ∂xν αβ
∂xµ ∂x0β 0α
Tµ ν = T β
∂x0α ∂xν
208
ν ∂x0α ∂xν 0 β
T µ = T
∂xµ ∂x0β α
Y los de rango 3:
∂xµ ∂xν ∂xδ 0αβγ

C µνδ = C
∂x0α ∂x0β ∂x0γ
∂x0α ∂x0β ∂x0γ 0
C µνδ = C
∂xµ ∂xν ∂xδ αβγ
∂x0α ∂xν ∂x0γ 0 β
Cµνδ = C γ
∂xµ ∂x0β ∂xδ α
La importancia del vector dxµ : Gran parte de la estructura de los

tensores se fundamenta en el vector prototipo dxµ . En efecto: 1) En la
ecuación (9.10) hemos definido los vectores, en general, por comparación
con dxµ y, 2) en esta sección hemos construido tensores de rangos 0, 2, y 3 a
partir de vectores. En general, un tensor de rango j > 0 transforma ası́ como
transforma el producto de j vectores.
Contracción de ı́ndices: Estudiemos la estructura Aµ Bµ , cuando A y B

son vectores. Usando las reglas de transformación (9.10) y (9.18) escribimos
∂x0µ ∂xβ α
A0µ B 0 µ = A Bβ ,
∂xα ∂x0µ
∂x0µ ∂xβ
Ahora, = δα β , entonces
∂xα ∂x0µ
A0µ B 0 µ = Aµ Bµ (9.26)
En palabras, el producto Aµ Bµ es, en general, invariante. El ejemplo más

importante es el intervalo dxµ dxµ .
Probemos que si A es un tensor de rango 4, entonces A0µνρ ρ es un ten-

sor de rango 2. En efecto, si hacemos σ = ρ en la ecuación (9.24) obtenemos
∂x0µ ∂x0ν ∂x0ρ ∂xγ αβλ ∂x0ρ ∂xγ
A0µνρ ρ = A γ . Pero = δλ γ , entonces
∂xα ∂xβ ∂xλ ∂x0ρ ∂xλ ∂x0ρ
209
∂x0µ ∂x0ν αβλ
A0µνρ ρ = A λ,
∂xα ∂xβ
que es la forma como transforman los tensores de rango 2, de acuerdo con

la ecuación (9.20). En general, la contracción de dos ı́ndices en un tensor de
rango j produce un tensor de rango j − 2.
δ de Kronecker. Probemos que δµ ν es un tensor. Para tal efecto comen-

∂x0ν
zamos escribiendo δµ0 ν = y luego usamos la regla de la derivación en
∂x0µ
cadena:
ν ∂x0ν ∂x0ν ∂xα ∂x0ν ∂xβ α
δµ0 = = = δβ ,
∂x0µ ∂xα ∂x0µ ∂xα ∂x0µ
que es ciertamente el modo como transforman los tensores de rango 2, de

acuerdo con ecuación (9.23).
El tensor métrico. Al comparar las ecuaciones (9.13) y (9.25) nos damos

cuenta de que gµν transforma como un tensor. Esto significa que gµν es
un tensor. Se llama el tensor métrico y es de primera importancia porque
contiene toda la información acerca de la geometrı́a del espacio.
Tensores simétricos y antisimétricos: Con la ecuación (9.20) se prue-

ba fácilmente que si T µν es un tensor simétrico en unas coordenadas, tam-
bién será simétrico en cualquier otro sistema coordenado. Y si F µν es anti-
simétrico en unas coordenadas, también será antisimétrico en todos los otros
sistemas coordenados:
T µν = T νµ ⇔ T 0µν = T 0νµ
(9.27)
F µν = −F νµ ⇔ F 0µν = −F 0νµ
9.5 La derivada
Veamos la derivada del vector A0µ ; empezamos usando la regla de la derivación
en cadena y luego utilizamos la ecuación (9.10):
∂A0ν ∂xα ∂
= A0ν (9.28)
∂x0µ ∂x0µ ∂xα
210
∂xα ∂ ∂x0ν β
= A (9.29)
∂x0µ ∂xα ∂xβ
∂xα ∂x0ν ∂Aβ ∂xα ∂ 2 x0ν

= + Aβ
∂x0µ ∂xβ ∂xα ∂x0µ ∂xα ∂xβ
Escribamos de nuevo la última ecuación con notación ∂µ :
∂xα ∂x0ν ∂xα ∂ 2 x0ν

∂µ0 A0ν = ∂α Aβ
+ Aβ (9.30)
∂x0µ ∂xβ ∂x0µ ∂xα ∂xβ
Observemos bien el lado derecho de esta ecuación. Si el segundo término

fuera cero, quedarı́a claramente la ley de transformación de los tensores
de rango dos, de acuerdo con la ecuación (9.23). Pero en el grupo de las
transformaciones generalizadas de coordenadas ese segundo término no es
cero, de donde concluimos que la derivada de un vector no es un tensor:
En general, la derivada ∂µ
(9.31)
no es una operación covariante
Esta regla (9.31) tiene dos excepciones importantes: La primera es cuando el

tensor es de rango 0; en este caso ∂µ sı́ es covariante. En efecto, sigamos de
nuevo los pasos que llevaron de (9.28) a (9.30), pero esta vez con un escalar
φ , para obtener ∂µ φ = ∂µ0 φ0 :
La derivada de un escalar
(9.32)
sı́ es una operación covariante
La segunda excepción de la regla (9.31) ocurre con las transformaciones lin-

∂ 2 x0ν
eales. Es claro que en este caso las segundas derivadas son cero y, en
∂xα ∂xβ
consecuencia el segundo término en el lado derecho de (9.30) es cero, quedan-
do limpiamente la transformación de los tensores de rango 2, de acuerdo con
(9.23). La más importante de las transformaciones lineales es la de Lorentz
y, tal como se recuerda, allı́ la derivada de un tensor sı́ era un tensor (véase
el paso de la ecuación (5.42) a la (5.43)).
211
Existe una notación concisa para la derivada, y es a través de la coma.
El uso se aclara con los siguientes ejemplos:
∂Aµ ∂A0µ ∂F αβ
Aµ,ν = A0µ,ν = F αβ ,ν =
∂xν ∂x0ν ∂xν
Para mostrar que la derivada de un vector no es una operación covariante

hemos seguido unos cálculos similares a los de la página 134, y lo hemos
hecho ası́ para mostrar el contraste entre las transformaciones lineales y las
generales. Pero la falta de covariancia radica en un nivel más profundo: es
el diferencial dAµ el que carece de covariancia. Para ver esto en detalle, y
corriendo el riesgo de repetir un argumento que se ha presentado ya, usemos
de nuevo la regla de la derivación en cadena para calcular dA0µ , ası́:
∂A0µ 0σ ∂A0µ ∂xν ∂A0µ ν

dA0µ = dx = dx0σ
= dx
∂x0σ ∂xν ∂x0σ ∂xν
∂A0µ ν
Es decir, dA0µ = dx :
∂xν
∂
dA0µ = (A0µ ) dxν
∂xν
µ 0µ ¶
∂ ∂x
= A dxν
π
∂xν ∂xπ
∂ 2 x0µ π ν ∂x0µ ∂Aπ ν

= A dx + dx
∂xν ∂xπ ∂xπ ∂xν
∂ 2 x0µ π ν ∂x0µ
= A dx + dAπ
∂xν ∂xπ ∂xπ
∂ 2 x0µ
Si, en el último renglón, las segundas derivadas fueran cero, quedarı́a
∂xν ∂xπ
∂x0µ
dA0µ = dAπ , que es la regla de transformación de los vectores: en
∂xµπ
tal caso dA serı́a un vector. Pero esas segundas derivadas no son cero en
las transformaciones generalizadas de coordenadas, y concluimos que en las
transformaciones generales el diferencial dAµ no es un vector: en general, el
diferencial de un tensor no es un tensor.
212
La derivada es una operación de primera importancia en la fı́sica, como lo
muestra el hecho de que las ecuaciones de movimiento son ecuaciones difer-
enciales. Nosotros quisiéramos escribir esas ecuaciones de modo tensorial,
para que sean covariantes. El problema es que la derivada ∂µ y el difer-
encial d no son operaciones covariantes y, en consecuencia, es preciso que
tengamos mucho cuidado cuando queramos utilizarlas. Debemos construir
otras operaciones que se parezcan a ∂µ y d, que sı́ sean covariantes: estas
nuevas operaciones sı́ pueden ser usadas tranquilamente en las ecuaciones de
la fı́sica. En las secciones 9.13 y 10.5 presentaremos esas nuevas operaciones
que se parecen a ∂µ y a d, y que sı́ son covariantes.
9.6 Matrices
Para los tensores de rangos 1 y 2, que son los que tienen 1 y 2 ı́ndices,
respectivamente, es muy cómoda la notación matricial. Definamos la matriz
cuadrada
∂x0µ
Λµ ν = (9.33)
∂xν
Con Λ podemos reescribir las ecuaciones (9.10) y (9.20):
A0 µ = Λµ ν Aν
F 0 µν = Λµ α F αβ Λν β = Λµ α F αβ ΛT β
ν
O más concisamente:
A0 µ = Λ Aν (9.34)
F 0 µν = Λ F αβ ΛT (9.35)
Estamos desarrollando una teorı́a general que puede aplicarse a transfor-

maciones cuadridimensionales en el espaciotiempo, como las que ocurren en
la gravitación einsteiniana. Pero nuestra teorı́a general de transformaciones
también puede usarse para resolver problemas sencillos tridimensionales, que
no involucran el tiempo, como son los simples cambios entre coordenadas
cartesianas, cilı́ndricas, parabólicas, etc. Como ejemplo veamos la transfor-
mación de coordenadas cartesianas a esféricas.
213
9.7 Coordenadas esféricas
Antes de ejecutar esta transformación, detengámonos brevemente para recor-
dar un asunto del cálculo vectorial en el triespacio (x, y, z). Un trivector
cualquiera V se puede expresar en componentes cartesianas y también en
componentes esféricas. La primera manera es V = 1̂x Vx + 1̂y Vy + 1̂z Vz y la
segunda es V = 1̂r Vr + 1̂θ Vθ + 1̂ϕ Vϕ . Igualemos estas dos expresiones:
1̂x Vx + 1̂y Vy + 1̂z Vz = 1̂r Vr + 1̂θ Vθ + 1̂ϕ Vϕ (9.36)
Las relaciones entre los vectores unitarios (1̂x , 1̂y , 1̂z ) y (1̂r , 1̂θ , 1̂ϕ ) son
1̂r = 1̂x sen θ cos ϕ + 1̂y sen θ sen ϕ + 1̂z cos θ

1̂θ = 1̂x cos θ cos ϕ + 1̂y cos θ sen ϕ − 1̂z sen θ (9.37)
1̂ϕ = −1̂x sen ϕ + 1̂y cos ϕ
Al colocar estas tres ecuaciones en el lado derecho de la ecuación (9.36)

se encuentran las relaciones que existen entre las componentes cartesianas
(Vx , Vy , Vz ) y las esféricas (Vr , Vθ , Vϕ ) :
Vx = Vr sen θ cos ϕ + Vθ cos θ cos ϕ − Vϕ sen ϕ

Vy = Vr sen θ sen ϕ + Vθ cos θ sen ϕ + Vϕ cos ϕ (9.38)
Vz = Vr cos θ − Vθ sen θ
O, en forma equivalente:
Vr = Vx sen θ cos ϕ + Vy sen θ sen ϕ + Vz cos θ

Vθ = Vx cos θ cos ϕ + Vy cos θ sen ϕ − Vz sen θ (9.39)
Vϕ = −Vx sen ϕ + Vy cos ϕ
Ya estamos en condición de ejecutar la transformación de coordenadas carte-

sianas a esféricas. Las primeras son (x0 , x1 , x2 , x3 ) = (ct, x, y, z), y las se-
gundas son (x00 , x01 , x02 , x03 ) = (ct, r, θ, ϕ). La transformación es:
214
x00 = x0
p
x01 = (x1 )2 + (x2 )2 + (x3 )2
x3 (9.40)
x02 = arc cos p
(x1 )2 + (x2 )2 + (x3 )2
x2
x03 = arctan 1
x
Procedemos a calcular las entradas de la matriz Λ, de acuerdo con (9.33),

para obtener
 
1 0 0 0
 
 
 0 sen θ cos ϕ sen θ sen ϕ cos θ 
 
 
 
Λ= sen θ  (9.41)
 0 cos θ cos ϕ cos θ sen ϕ
− 
 r r r 
 
 
 sen ϕ cos ϕ 
0 − 0
r sen θ r sen θ
El intervalo (2.1) en coordenadas cartesianas es
ds2 = c2 dt2 − dx2 − dy 2 − dz 2 (9.42)
Cartesianas
Al comparar esta ecuación con (9.1) identificamos la matrix diagonal gµν
= diag (1, −1, −1, −1, −1). La inversa de esta matriz es:
µν
gCartesianas = diag (1, −1, −1, −1, −1) (9.43)
Esta es claramente la métrica de Minkowski que utilizamos en el capı́tulo

5 de la relatividad especial. Pasamos ahora a calcular el tensor métrico en
µν
coordenadas esféricas, por medio de la fórmula (9.35), que es gEsféricas =
αβ
Λ gCartesianas ΛT . Usamos entonces (9.41) y (9.43) para ejecutar el producto
de las tres matrices, y obtenemos:
µν
gEsféricas = diag (1, −1, −r−2 , −(r sen θ)−2 ) (9.44)
215
La matriz inversa de (9.44) es:
Esféricas
gµν = diag (1, −1, −r2 , −r2 sen2 θ) (9.45)
Esta fórmula dice que
ds2 = dt2 − dr2 − r2 dθ2 − r2 sen2 θ dϕ2 , (9.46)
que es el mismo intervalo (9.42), escrito ahora en coordenadas esféricas.

Calculemos ahora las componentes de un vector cualquiera en coordenadas
esféricas. Tomaremos como ejemplo el vector densidad de la fórmula (6.18),
µ
que es JCartesianas = (ρc, Jx , Jy , Jz ). Utilizando estas componentes y la ma-
triz Λ en la ecuación (9.34) se obtienen las componentes contravariantes en
coordenadas esféricas:
  
1 0 0 0 ρc
  
  
 0 sen θ cos ϕ sen θ sen ϕ  
cos θ   J 
 
  x 
µ   
JEsféricas = sen θ   
 0 cos θ cos ϕ cos θ sen ϕ
−   
 r r  
r   Jy 
 
  
 sen ϕ cos ϕ   
0 − 0 Jz
r sen θ r sen θ
 
ρc
 
 J sen θ cos ϕ + J sen θ sen ϕ + J cos θ 
 x y z 
 
 
=  Jx cos θ cos ϕ Jy cos θ sen ϕ Jz sen θ  (9.47)
 + − 
 r r r 
 
 
Jx sen ϕ Jy cos ϕ
− +
r sen θ r sen θ
Comparando las tres últimas filas de (9.47) con las formas generales (9.39),
reconocemos las componentes Jr , Jθ y Jϕ , o sea que
216
 
ρc
 
 Jr 
 
µ  
JEsféricas =
 Jθ 
 (9.48)
 
 r 
 
Jϕ
r sen θ
Calculemos finalmente el tensor electromagnético en coordenadas esféricas,

µν αβ
por medio de la fórmula (9.35), que es FEsféricas = Λ FCartesianas ΛT . Usamos
entonces (9.41) y (6.30) para ejecutar el producto de las tres matrices. El
resultado es una matriz complicada que contiene las seis componentes carte-
sianas (Ex , Ey , Ez , Bx , By , Bz ). Tal matriz se simplifica considerablemente al
expresar esas seis componentes cartesianas en términos de las componentes

esféricas, para lo cual utilizamos fórmulas del tipo (9.38). Se llega a:
 
Eθ Eϕ
 0 −Er − −
 r r sen θ 

 
 Bϕ Bθ 
 Er 0 − 
 r r sen θ 
µν  
FEsféricas =  (9.49)
 Eθ Bϕ Br 
 0 − 2 
 r r r sen θ 
 
 
 Eϕ Bθ Br 
− 0
r sen θ r sen θ r2 sen θ
9.8 La relatividad especial

Este es un momento oportuno para presentar un ejemplo con transforma-
ciones tetradimensionales. Una de las más sencillas de todas, y no por eso
trivial, es la transformación de Lorentz (ct, x, y, z) → (ct0 , x0 , y 0 , z 0 ) que es-
cribimos en las ecuaciones (5.13). La matriz Λ ya fue calculada en (5.47). El
tensor métrico en las coordenadas no primadas η µν está dado por la ecuación
(9.43). La fórmula (9.35) dice que η 0 µν = Λη αβ ΛT . Ejecutamos el producto
de las tres matrices para llegar a
217
 
1 0 0 0
 
 0 −1 0 0 
 
η 0 µν =



 0 0 −1 0 
 
0 0 0 −1
En palabras: la métrica de Minkowski es invariante bajo transformaciones

de Lorentz. Esto ya lo habı́amos elaborado anteriormente, en particular en
los comentarios que siguen a la ecuación (5.21). Por lo general, las com-
ponentes de los tensores sufren grandes modificaciones cuando se hace un
cambio de unas coordenadas a otro, como puede verse comparando (6.30)
con (9.49), o comparando (9.43) con (9.44). Esta regla tiene dos excepciones
notables: 1) los escalares, por definición, no cambian bajo ninguna transfor-
mación de coordenadas, y 2) la métrica de Minkowski η es invariante bajo
las transformaciones de Lorentz.
9.9 Ecuaciones tensoriales

En esta sección veremos algunas propiedades importantes de las ecuaciones
entre tensores.
a) La más importante es que las ecuaciones tensoriales son automática-

mente covariantes, es decir, tienen la misma forma en todos los sistemas
coordenados. Para ver esto consideremos por ejemplo la ecuación
Aµ ν = B µ Cν (9.50)
∂xµ ∂x0β 0α
Si A, B y C son tensores, podemos reemplazar Aµ ν = A β ,
∂x0α ∂xν
∂xµ 0α ∂x0β 0
Bµ = B y Cν = C en la ecuación (9.50) para escribir
∂x0α ∂xν β
∂xµ ∂x0β 0α ∂xµ ∂x0β 0α 0

A β = B Cβ
∂x0α ∂xν ∂x0α ∂xν
∂x0σ ∂xν
∂xµ ∂x0ρ
218
∂x0σ ∂xµ ∂xν ∂x0β 0α ∂x0σ ∂xµ ∂xν ∂x0β 0α 0
A β = B Cβ
∂xµ ∂x0α ∂x0ρ ∂xν ∂xµ ∂x0α ∂x0ρ ∂xν
g σ α g β ρ A0α β = g σ α g β ρ B 0α Cβ0
A0σ ρ = B 0σ Cρ0 (9.51)
Comparando (9.51) con (9.50) nos damos cuenta de que tienen la misma
forma: (9.50) es una ecuación covariante porque es la igualdad de dos ten-
sores. Las ecuaciones tensoriales son automáticamente covariantes.
b) Supongamos que una ecuación es válida en todos los sistemas coorde-

nados. Pensemos que esta ecuación tiene k elementos (factores o sumandos)
y supongamos que k − 1 de ellos son tensores; entonces el otro elemento
también tiene que ser tensor. Para mostrar que esto es cierto supongamos
que la ecuaciones (9.50) y (9.51) son verdaderas y que A y C son tensores;
probaremos que B también es tensor.
∂xµ ∂x0β 0α ∂x0β 0

Reemplazando Aµ ν = A β , y C ν = C en (9.50) escribi-
∂x0α ∂xν ∂xν β
mos:
∂xµ ∂x0β 0α ∂x0β µ 0
A β = B Cβ
∂x0α ∂xν ∂xν
∂x0σ ∂xν
∂xµ ∂x0ρ
∂x0σ ∂xµ ∂xν ∂x0β 0α ∂x0σ ∂xν ∂x0β µ 0

A β = B Cβ
∂xµ ∂x0α ∂x0ρ ∂xν ∂xµ ∂x0ρ ∂xν
∂x0σ β
g σ α g β ρ A0α β = g ρ B µ Cβ0
∂xµ
∂x0σ µ 0
A0σ ρ = B Cρ
∂xµ
Comparando la última ecuación con (9.51) vemos que
∂x0σ µ
B 0σ = B ,
∂xµ
219
que es la forma como transforman los vectores: B es un vector, que es lo que
nos propusimos demostrar.
c) Hay dos maneras de establecer si un conjunto de n cantidades A0 , A1 ,

A2 , · · · es un vector. La primera es invocando una ecuación en la que aparez-
can esas cantidades, como en la nota b) hace un par de párrafos. La segunda
es empı́ricamente: en las coordenadas xµ se miden las cantidades A0 , A1 ,
A2 , · · · y en las coordenadas x0µ se miden las cantidades A00 , A01 , A02 , · · ·. Si
las cantidades fı́sicamente medidas Aµ y A0µ satisfacen la ecuación (9.34),
entonces Aµ es un vector. El mismo pensamiento se aplica para establecer
si un conjunto de n2 cantidades es un tensor de rango 2: bien sea invocan-
do una ecuación en la que aparezca el conjunto en cuestión, o de manera
empı́rica usando la condición (9.35).
d) Mencionábamos en la página 213 la necesidad de utilizar otras versiones

de ∂µ y d que sean covariantes.
9.10 Covariancia general

Podemos pensar que las leyes de la fı́sica se ubican por encima de los sis-
temas coordenados. Por supuesto que para utilizar numéricamente una ley
es necesario erigir antes un sistema coordenado particular, pero podemos
pensar que las leyes son, de alguna manera, independientes de los sistemas
coordenados. Más concretamente, las leyes deben expresarse por medio de
enunciados que sean invariantes bajo el grupo de las transformaciones gen-
eralizadas de coordenadas. Este es el Principio de la Covariancia General.
Acabamos de ver que las ecuaciones tensoriales son automáticamente covari-

antes bajo el grupo de las transformaciones generalizadas de coordenadas, lo
que nos lleva a concluir que el Principio se satisface si las leyes de la fı́sica se
expresan mediante ecuaciones tensoriales. El Principio indica un método y
una guı́a: al formular una teorı́a fı́sica se deben buscar ecuaciones tensoriales.
Las cantidades fı́sicas deben ser componentes de tensores. Por ejemplo el

campo eléctrico hace parte del tensor electromagnético Fµν y la energı́a de
una partı́cula hace parte del cuadrivector momentum pµ . Ahora, hemos vis-
to que los tensores de rango j tienen 4j componentes, lo que quiere decir que
los tensores tienen 1, 4, 16, 64 ··· componentes. Vemos ası́ que toda cantidad
220
fı́sica debe ser miembro de alguna familia de 1, 4, 16, 64 · · · elementos. Los
números 1, 4, 16, 64 · · · son muy importantes para la fı́sica, porque indican
los únicos tamaños que las familias pueden tener: no hay familias de 10, 15,
63 miembros.
Supongamos que queremos saber si determinada ecuación tensorial es váli-

da: si la ecuación se cumple en un sistema coordenado, entonces tiene que
cumplirse en todos los sistemas de coordenadas. O sea que que
para demostrar la validez de una ecuación

covariante basta probar que la ecuación (9.52)
se cumple en un sistema coordenado.
Si una ecuación tiene forma covariante y es válida

en un sistema coordenado, entonces es válida en (9.53)
todos los sistemas coordenados.
9.11 El elemento invariante de volumen

La fórmula (9.35) dice que g 0 µν = Λg αβ ΛT . Tomemos determinante en
ambos lados de esta ecuación:
det g 0 µν = det Λ det g αβ det ΛT = (det Λ)2 det g αβ ,
es decir:
p
| det g 0 µν |
| det Λ| = p
| det g αβ |
De otro lado, tomando determinante en ambos lados de la ecuación (9.2)

1
vemos que det g αβ = , de donde:
det gαβ
p
| det gαβ |
| det Λ| = q
0 |
| det gµν
Llamar g ≡ det gαβ y g 0 ≡ det gµν

0 . Entonces:
221
p
|g|
| det Λ| = p (9.54)
|g 0 |
| det Λ| se llama el Jacobiano de la transformación. El Teorema Principal del

Cálculo Integral dice que los volúmenes n-dimensionales dn x0 y dn x cumplen
la condición
dn x0 = | det Λ| dn x ; usar (9.54):

p
|g| n
= p d x, o sea que:
|g 0 |
p p
|g 0 | dn x0 = |g| dn x (9.55)
p
Esto es importante: |g| d4 x es un escalar, y se puede tomar como el ele-
mento diferencial de volumen. Es claro entonces que:
Z · ¸ · ¸
Algún tensor p Otro tensor
|g| d4 x = (9.56)
de rango j de rango j
9.12 El sı́mbolo de Christoffel

El sı́mbolo de Christoffel Γµ αβ se define de la manera siguiente:
1
Γµ αβ = g µν (gνα,β + gβν,α − gαβ,ν ) (9.57)
2
Lo primero que debemos notar es que el sı́mbolo de Christoffel es simétrico

bajo el intercambio de los dos subı́ndices: Γµ αβ = Γµ βα . Contemos cuántas
componentes independientes tiene Γµ αβ utilizando un argumento similar al
que empleamos en la sección 7.5 cuando querı́amos calcular el número de
componentes del tensor M αβδ . Para tal efecto comparemos la estructura de
Γµ αβ con la estructura de Aµ Bαβ , suponiendo que Bαβ = Bβα . La cantidad
Bαβ , como es de dos ı́ndices, tiene n2 componentes, pero además es simétri-
ca, entonces sólo tiene n(n + 1)/2 componentes independientes; entonces
Aµ Bαβ tiene n2 (n + 1)/2 componentes independientes. Ası́ mismo, el sı́mbo-
lo de Christoffel tiene n2 (n + 1)/2 componentes independientes. De otro
222
lado el tensor métrico gµν , por ser simétrico, tiene n(n + 1)/2 componentes
independientes, o sea que hay n2 (n + 1)/2 derivadas gµν ,α independientes.
Vemos pues que n2 (n+1)/2 es el número de sı́mbolos Γµ αβ independientes y
n2 (n+1)/2 es el número de derivadas gαβ,ν independientes. En el fondo estos
dos conjuntos son equivalentes: de un lado, (9.57) determina totalmente las
derivadas gµν ,α en términos de los sı́mbolos Γ, y de otro lado las ecuaciones
(9.65) determinan totalmente los sı́mbolos Γ en términos de las derivadas
gµν ,α : los sı́mbolos Γ son como las primeras derivadas del tensor métrico.
Si todos los sı́mbolos de Christoffel son cero,

entonces todas las primeras derivadas gµν ,α (9.58)
son cero; y viceversa.
El conjunto de los sı́mbolos Γ es como

(9.59)
el conjunto de las primeras derivadas de gµν .
Γµ αβ no es un tensor. En notación obvia:
    
ν→β ν→α
1 µν  ∂gνα 
Γµ αβ = g + α → ν  −  α → β  , y con primas:
2 ∂xβ
β→α β→ν
    
0 ν→β ν→α
1 0µν  ∂gνα 
Γ0µ αβ = g + α → ν  −  α → β  . Usar (9.21):
2 ∂x0β
β→α β→ν
µ ¶
1 0µν ∂ ∂xσ ∂xρ
= g gσρ + [ ] − [ ]
2 ∂x0β ∂x0ν ∂x0α
µ ¶
1 0µν ∂xσ ∂xρ ∂
= g gσρ + [ ] − [ ]
2 ∂x0ν ∂x0α ∂x0β
µ ¶
1 ∂ h ∂xσ ∂xρ i
+ g 0µν gσρ +[ ]−[ ]
2 ∂x0β ∂x0ν ∂x0α
Para facilitar los cálculos escribamos este último resultado ası́:
Γ0µ αβ = M + N (9.60)
223
µ ¶
1 0µν ∂xσ ∂xρ ∂
M = g gσρ + [ ] − [ ]
2 ∂x0ν ∂x0α ∂x0β
µ ¶
1 0µν ∂ h ∂xσ ∂xρ i
N = g gσρ + [ ] − [ ]
2 ∂x0β ∂x0ν ∂x0α
Desarrollemos por separado cada uno de los términos M y N . El término

M es
µ ¶
1 ∂xσ ∂xρ ∂xω
M = g 0µν gσρ,ω + [ ] − [ ]
2 ∂x0ν ∂x0α ∂x0β
µ ¶
1 ∂x0µ ∂x0ν ξη ∂xσ ∂xρ ∂xω
= g gσρ,ω +[ ]−[ ]
2 ∂xξ ∂xη ∂x0ν ∂x0α ∂x0β
1 ∂x0µ ξη ∂x0ν h ∂xσ ∂xρ ∂xω ∂xσ ∂xρ ∂xω

= ξ
g gσρ,ω η 0ν 0α 0β
+ 0β
2 ∂x ∂x ∂x ∂x ∂x ∂x ∂x0ν ∂x0α
∂xσ ∂xρ ∂xω i

−
∂x0α ∂x0β ∂x0ν
1 ∂x0µ ξη h ρ ω σ ∂xω σ ∂xρ i

σ ∂x ∂x ρ ∂x ω ∂x
= g gσρ,ω g η + g η − g η
2 ∂xξ ∂x0α ∂x0β ∂x0β ∂x0α ∂x0α ∂x0β
1 ∂x0µ ξη h ∂xρ ∂xω ∂xσ ∂xω ∂xσ ∂xρ i

= g gηρ,ω + gση,ω − gσρ,η
2 ∂xξ ∂x0α ∂x0β ∂x0β ∂x0α ∂x0α ∂x0β
∂x0µ ∂xρ ∂xω 1 ξη

= g (gηρ,ω + gωη,ρ − gρω,η )
∂xξ ∂x0α ∂x0β 2
Con (9.57) reconocemos Γξ ρω :
∂x0µ ∂xρ ∂xω ξ

M= Γ ρω (9.61)
∂xξ ∂x0α ∂x0β
Ahora ataquemos el término N , que es:
224
µh σ ¶
1 0µν ∂x ∂ 2 xρ ∂xρ ∂ 2 xσ i
N = g gσρ + 0α +[ ]−[ ]
2 ∂x0ν ∂x0α ∂x0β ∂x ∂x0β ∂x0ν
La operación [ ] − [ ] es un poco tediosa, pero no tiene ninguna dificultad

especial. Cuatro términos se cancelan mutuamente y al final se obtiene:
1 0µν ∂xσ ∂ 2 xρ
N = g gσρ 2
2 ∂x0ν ∂x0α ∂x0β
∂x0µ ∂x0ν ∂xσ ∂ 2 xρ

= gσρ g ξη
∂xξ ∂xη ∂x0ν ∂x0α ∂x0β
µ ¶
∂x0µ ∂x0ν ∂xσ ∂ 2 xρ
= gσρ g ξη
∂xξ ∂xη ∂x0ν ∂x0α ∂x0β
∂x0µ ∂ 2 xρ
= gσρ g ξη (gη
σ
)
∂xξ ∂x0α ∂x0β
∂x0µ ∂ 2 xρ
= (9.62)
∂xρ ∂x0α ∂x0β
Al colocar (9.61) y (9.62) en (9.60) llegamos finalmente a:
∂x0µ ∂xρ ∂xω ξ ∂x0µ ∂ 2 xρ

Γ0µ αβ = Γ ρω + (9.63)
∂xξ ∂x0α ∂x0β ∂xρ ∂x0α ∂x0β
Nos será útil una versión de Γ0µ αβ ligeramente diferente de (9.63), que se
obtiene muy fácilmente. Es claro que ∂x0µ /∂x0 α = gα µ = δα µ ; como esto es
una constante, sus derivadas son cero:
∂ ∂x0µ ∂ ∂x0µ ∂xρ ∂x0µ ∂ 2 xρ ∂xρ ∂ ∂x0µ

0= = = +
∂x0β ∂x0α ∂x0β ∂xρ ∂x0α ∂xρ ∂x0α ∂x0β ∂x0α ∂x0β ∂xρ
Aislar el primer término del lado derecho:
∂x0µ ∂ 2 xρ ∂xν ∂ ∂x0µ ∂xν ∂xσ ∂ 2 x0µ

= − = −
∂xρ ∂x0α ∂x0β ∂x0α ∂x0β ∂xν ∂x0α ∂x0β ∂xν ∂xσ
Entonces (9.63) se convierte en
225
∂x0µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x0µ
Γ0µ αβ = Γ στ − (9.64)
∂xν ∂x0α ∂x0β ∂x0α ∂x0β ∂xσ ∂xν
Si el segundo término del lado derecho fuera cero, tendrı́amos la ley de

transformación de un tensor de rango tres con un ı́ndice contravariante y
dos covariantes. Pero, en general, el segundo término del lado derecho de
(9.64) no es cero: El sı́mbolo de Christoffel Γµ αβ no es un tensor1 .
Es oportuno hacer un comentario acerca de la notación. Al escribir las

componentes de los tensores hemos sido muy cuidadosos de no poner un
superı́ndice encima de un subı́ndice; por ejemplo, nunca hemos escrito Tαµ .
Siguiendo esta costumbre, hemos escrito Γµ αβ aunque Γ no es un tensor.
Debemos aclarar, sin embargo, que en la mayorı́a de los libros aparece Γµαβ .
Esta escritura Γµαβ no debe causar confusión. De otro lado, en algunas es-
casas ocasiones es preciso usar las cantidades Γµαβ , las cuales se deben en-
tender como el resultado de multiplicar a gµξ por Γξ αβ . Se define entonces
Γµαβ ≡ gµξ Γξ αβ . Hay dos identidades útiles que se prueban con facilidad a
partir de la definición (9.57):
gαβ , γ = Γαβγ + Γβαγ (9.65)
g αβ ,γ = −g µβ Γα µγ − g µα Γβ µγ (9.66)
9.13 La derivada covariante

Decı́amos en la página 213 que necesitamos una operación derivada que
tenga carácter tensorial, es decir, que al actuar sobre un tensor produzca
un tensor. El propósito de esta sección es construir esta derivada tensorial.
Aunque Γµ αβ no es un tensor, sı́ sirve para construir la derivada covariante
que necesitamos. Comencemos escribiendo:
∂A0µ
+ Γ0µ αβ A0α = V + W , (9.67)
∂x0β
∂A0µ
donde V = y W = Γ0µ αβ A0α . Desarrollemos el término V utilizando
∂x0β
1
Sin embargo Γµ αβ sı́ es un tensor bajo el subgrupo de las transformaciones lineales,
∂ 2 x0µ
pues en éstas las segundas derivadas son cero y entonces también es cero el último
∂xσ ∂xν
término del lado derecho de (9.64).
226
la regla de la derivación en cadena:
∂xρ ∂
V = A0µ ; utilizar (9.10):
∂x0β ∂xρ
∂xρ ∂ ∂x0µ σ ∂xρ ∂x0µ ∂Aσ ∂xρ ∂ 2 x0µ σ

= A = + A (9.68)
∂x0β ∂xρ ∂xσ ∂x0β ∂xσ ∂xρ ∂x0β ∂xρ ∂xσ
Pasemos a desarrollar el término W usando la ecuación (9.10):
∂x0α ξ
W = Γ0µ αβ A0α = Γ0µ αβ A
∂xξ
Ahora utilizar la ecuación (9.64):
µ ¶
∂x0µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x0µ ∂x0α ξ
W = Γ στ − A
∂xν ∂x0α ∂x0β ∂x0α ∂x0β ∂xσ ∂xν ∂xξ
µ ¶
∂x0µ σ ∂xτ ν ν ∂x
σ ∂ 2 x0µ
= gξ Γ στ − g ξ Aξ
∂xν ∂x0β ∂x0β ∂xσ ∂xν
∂x0µ ∂xτ ν σ ∂xσ ∂ 2 x0µ ν

= Γ στ A − A (9.69)
∂xν ∂x0β ∂x0β ∂xσ ∂xν
Ya estamos en condición de poner (9.68) y (9.69) en (9.67) para obtener

finalmente:
· ¸
∂A0µ 0µ 0α ∂x0µ ∂xρ ∂Aν ν σ
+ Γ αβ A = + Γ σρ A
∂x0β ∂xν ∂x0β ∂xρ
Pero este es, según la regla (9.22), el modo como transforman los tensores
de rango 2. En conclusión,
∂Aν
+ Γν ρσ Aσ (9.70)
∂xρ
es un tensor de rango 2. Es muy importante, y se llama Derivada Covariante.

∂Aν
Aunque y Γν ρσ Aσ no son tensores, la derivada covariante sı́ lo es.
∂xσ
227
Aµ ; β = Aµ , β + Γµ βα Aα (9.71)
Aquı́ estamos usando una notación muy cómoda: la coma quiere decir deriva-
da corriente y el punto y coma quiere decir derivada covariante. La expresión
(9.71) es la derivada covariante de un vector contravariante. Para las com-
ponentes covariantes se escoge:
Aµ ; β = Aµ ,β − Γα µβ Aα (9.72)
Hemos probado que las componentes Aµ ; β transforman como un tensor de

segundo rango. De manera independiente se puede probar que las Aµ ; β tam-
bién transforman como un tensor de rango 2.
Acabamos de ver que la derivada covariante de un vector es un tensor de

rango 2. En general, la derivada covariante de un tensor de rango j es un
tensor de rango j + 1 . La derivada covariante de tensores de rango mayor
que 0 introduce un sı́mbolo de Christoffel por cada ı́ndice:
F µν ; β = F µν , β + Γµ βα F αν + Γν βα F µα (9.73)
Fµν ; β = Fµν , β − Γα µβ Fαν − Γα νβ Fµα (9.74)
F µν σ ; β = F µν σ , β + Γµ βτ F τ ν σ + Γν βτ F µτ σ − Γτ σβ F µν τ
Esta es la regla para tomar la derivada covariante de tensores de rango mayor

que 0, pero ¿qué hacer para tomar la derivada covariante de un escalar?
Para resolver esta dificultad recordemos el enunciado (9.32), según el cual la
derivada corriente de un escalar es una operación covariante; no hay motivo
de preocupación, y podemos definir la derivada covariante de un escalar
como su derivada corriente:
φ; α = φ, α
En conclusión, la derivada covariante convierte tensores en tensores, y por

eso es buena para las ecuaciones tensoriales, de acuerdo con la necesidad
que mencionábamos en la página 213 de utilizar operaciones covariantes. La
ecuación (9.73) dice que
228
(C µ Dν ) ; β = C µ ; β Dν + C µ Dν ; β (9.75)
o sea que la derivada covariante cumple la regla usual de la derivada del

producto de dos factores. En general la derivada covariante se maneja con
tranquilidad, con soltura, debido a la propiedad (9.75). La única advertencia,
muy importante, es que, a diferencia de las derivadas simples, las derivadas
covariantes no conmutan:
Aα ; ν ; µ = (Aα ; ν ) ; µ
= (Aα ; ν ) , µ + Γα τ µ Aτ ; ν − Γτ νµ Aα ; τ
= (Aα , ν + Γα τ ν Aτ ), µ + Γα τ µ (Aτ , ν + Γτ βν Aβ ) − Γτ νµ Aα ; τ
Para Aα ; µ ; ν basta intercambiar los ı́ndices ν y µ. El conmutador es:
Aα ; µ ; ν − Aα ; ν ; µ = Rα βµν Aβ , (9.76)
donde
Rα βµν = Γα βµ , ν − Γα βν , µ − Γσ βν Γα σµ + Γσ βµ Γα σν (9.77)
Ası́ mismo:
Aα ; µ ; ν − Aα ; ν ; µ = −Rβ αµν Aβ (9.78)
Antes de concluir esta sección presentamos una identidad importante:
gµν ; α = 0, g µν ;α = 0 (9.79)
En palabras, la derivada covariante del tensor métrico es cero. Esta identidad

se prueba fácilmente a partir de las ecuaciones (9.73) y (9.74).
229
9.14 El tensor de Riemann
Detengámonos un momento en la ecuación (9.78): Debido a que las can-
tidades Aµ ; α ; β , Aµ ; β ; α y Aν son tensores, podemos afirmar que Rν µαβ
también es un tensor: se llama tensor de Riemann. Que éste sea un ten-
sor significa que bajo una transformación general de coordenadas xµ → x0µ
ocurre lo siguiente:
∂x0α ∂x0β ∂x0µ ∂x0ν ρσπδ

R0 αβµν = R (9.80)
∂xρ ∂xσ ∂xπ ∂xδ
El tensor de Riemann, por su origen en las ecuaciones (9.76) y (9.78), ex-

presa la no conmutatividad de las derivadas covariantes. Una contracción de
ı́ndices produce el tensor de Ricci Rβµ , y con otra contracción se obtiene el
escalar de curvatura R:
Rβµ ≡ Rα βµα = Rµβ (9.81)
R ≡ Rµ µ (9.82)
Los tensores (9.77),(9.81) y (9.82) satisfacen cinco ecuaciones: tres alge-

braicas y dos diferenciales:
Rλµνκ = Rνκλµ (9.83)
Rλµνκ = −Rµλνκ = −Rλµκν = Rµλκν (9.84)
Rλµνκ + Rλκµν + Rλνκµ = 0 (9.85)
Rα βµν ; σ + Rα βσµ ;ν + Rα βνσ ; µ = 0 (9.86)

1
(Rµ ν − g µ ν R); µ = 0 (9.87)
2
Nos disponemos a probar la validez de las identidades algebraicas (9.83),

(9.84) y (9.85). Para tal efecto debemos bajar el ı́ndice contravariante de
Rα βµν , lo que se logra multiplicando ambos lados de la ecuación (9.77) por
gλα :
Rλµνκ = gλσ Γσ µν , κ + gλη Γσ µν Γη κσ − gλσ Γσ µκ , ν − gλη Γσ µκ Γη σν (9.88)
230
En el lado derecho de esta ecuación los dos últimos términos se obtienen
intercambiando los ı́ndices κ y ν en los dos primeros términos:
Rλµνκ = gλσ Γσ µν , κ + gλη Γσ µν Γη κσ − (ν κ) (9.89)
Desarrollemos el primer término del lado derecho de esta ecuación:
1 £ ¡ ¢¤
gλσ Γσ µν , κ = gλσ g ση gηµ , ν + gνη , µ − gµν , η , κ
2
1 ¡ ¢
= gλσ g ση gηµ , ν + gνη , µ − gµν , η , κ
2
1¡ ¢
+ gηµ , ν + gνη , µ − gµν , η gλσ g ση , κ
2
Ahora, con (9.66) se prueba fácilmente que gλσ g ση , κ = −g ση (gλξ Γξ σκ +

gσξ Γξ λκ ). Entonces:
1 ¡ ¢
gλσ Γσ µν , κ = gλ η gηµ , ν + gνη , µ − gµν , η , κ
2
1 ¡ ¢
− g ση gηµ , ν + gνη , µ − gµν , η (gλξ Γξ σκ + gσξ Γξ λκ )
2
1 η¡ ¢
= gλ gηµ , ν + gνη , µ − gµν , η , κ − Γσ µν (gλξ Γξ σκ + gσξ Γξ λκ )
2
1 η¡ ¢
= gλ gηµ , ν + gνη , µ − gµν , η , κ − gσξ Γξ λκ Γσ µν − gλξ Γσ µν Γξ σκ
2
Nótese que el último término del lado derecho cancela exactamente al se-
gundo término de la ecuación (9.89). Entonces (9.89) queda finalmente ası́:
1
Rλµνκ = (gνλ , µ , κ − gκλ , µ , ν − gµν , λ , κ + gµκ , λ , ν )
2 (9.90)
σ ξ σ ξ
+ gσξ (Γ µκ Γ λν −Γ µν Γ λκ )
Por inspección, es clara la validez de las ecuaciones (9.83) y (9.84). También

es clara la validez de la ecuación (9.85). Vemos ası́ que las ecuaciones (9.83),
(9.84) y (9.85) son correctas. (9.83) y (9.84). Luego, en la sección 9.17,
tendremos ocasión de probar la validez de las otras dos identidades (9.86) y
(9.87).
231
La ecuación (9.85): En la ecuación (9.85) vamos a hacer ν = µ (no
sumar ı́ndices repetidos):
Rλµµκ + Rλκµµ + Rλµκµ = 0 (9.91)
El segundo término de esta ecuación es cero (debido a (9.84)) y la suma

del primero y el tercero da cero (debido a (9.84)). Vemos ası́ que (9.91)
no aporta nada nuevo. Se puede verificar, en general, que cuando en (9.85)
hay dos ı́ndices repetidos se obtiene una ecuación que redunda con (9.83)
y (9.84). En conclusión, la ecuación (9.85) suministra información nueva
cuando los cuatro ı́ndices toman valores diferentes. Por ejemplo, para un
espacio de dimensión 4 la única información novedosa contenida en (9.85)
es:
R0123 + R0312 + R0231 = 0 (9.92)
Rαβµν tiene n2 (n2 −1)/12 componentes independientes. En un espa-

cio de n dimensiones el tensor de Riemann tiene n2 (n2 − 1)/12 componentes
independientes. No probaremos esto en general, pero sı́ lo verificaremos en el
caso particular n = 4. En seguida vamos a comprobar que en una geometrı́a
de dimensión 4 el tensor de Riemann tiene 20 componentes independientes.
Como Rαβµν tiene cuatro ı́ndices, y cada ı́ndice adopta cuatro valores, Rαβµν
tiene 44 = 256 componentes. Demostremos que las fórmulas (9.84) reducen
a 36 el número de componentes independientes. En Rαβµν la pareja αβ es
antisimétrica, o sea que hay sólo 6 parejas αβ independientes; escogemos
estas seis:
αβ : 010203121323
Ası́ mismo hay sólo seis parejas µν independientes. Escogemos:
µν : 010203121323
Escribamos estas 36 componentes de Rαβµν que son, hasta el momento,

independientes:
232
R0101 R0102 R0103 R0112 R0113 R0123
R0201 R0202 R0203 R0212 R0213 R0223
R0301 R0302 R0303 R0312 R0313 R0323
R1201 R1202 R1203 R1212 R1213 R1223
R1301 R1302 R1303 R1312 R1313 R1323
R2301 R2302 R2303 R2312 R2313 R2323
Ahora, la ecuación (9.84) dice que este arreglo cuadrado, o matriz, es simétri-
co. Una matriz 6 × 6 simétrica sólo tiene 21 entradas independientes (por
ejemplo, las de la diagonal y las que se encuentran por encima de ésta).
Finalmente, la ecuación (9.92) reduce a 20 el número de componentes inde-
pendientes. Hemos verificado, en el caso particular n=4, que en un espacio
de n dimensiones el tensor de Riemann tiene n2 (n2 − 1)/12 componentes
independientes.
9.15 Plano y curvo

Decimos que un espacio es plano en un punto dado, si en ese punto el
tensor de Riemann vale cero; es decir, si todas las componentes del tensor
de Riemann son cero. Decimos que un espacio es curvo si no es plano: un
espacio es curvo en un punto dado, si en ese punto el tensor de Riemann no
es cero; es decir, si al menos una de las componentes del tensor de Riemann
difiere de cero.
Ejemplo. Consideremos una geometrı́a en tres dimensiones, con un inter-

valo ds2 = dr2 + r2 dθ2 + r2 sen2 θ dϕ2 . El tensor métrico es
 
1 0 0
 
g [3] µν = 
 0 r
2 0 

2 2
0 0 r sen θ
Para esta geometrı́a todas las componentes del tensor de Riemann son cero,
o sea que el espacio es plano. El diferencial de longitud es la raı́z cuadrada
del intervalo:
p
ds = dr2 + r2 dθ2 + r2 sen2 θ dϕ2
Pensemos en una circunferencia ecuatorial de radio a. Los puntos de esta
233
circunferencia tienen θ = π/2, dθ = 0, r = a, dr = 0. A lo largo de la
circunferencia el elemento
R Rde longitud es ds = adϕ, y la longitud total de la
circunferencia es ds = a dϕ = 2πa. Ahora calculemos el radio. La lı́nea
radial pasa por el centro
R de coordenadas
R y tiene θ = π/2, dθ = dϕ = 0, y la
longitud del radio es ds = dr = a. Al dividir circunferencia sobre radio
se obtiene 2πa/a = 2π, que es el mismo resultado de la geometrı́a euclidiana.
Inmersos en este espacio tridimensional plano puede haber subespacios bidi-

mensionales curvos, como el que estudiaremos enseguida. Consideremos un
espacio bidimensional con intervalo ds2 = a2 dθ2 + a2 sen2 θ dϕ2 . Para esta
geometrı́a el tensor métrico es
" #
[2]
a2 0
g µν = (9.93)
0 a2 sen2 θ
El tensor de Riemann tiene una componente que difiere de cero: R[2] 1212 =
a2 sen2 θ; por esta razón podemos afirmar que el espacio bidimensional es
curvo. El diferencial de longitud es la raı́z cuadrada del intervalo:
p
ds = a2 dθ2 + a2 sen2 θ dϕ2
Pensemos en una circunferencia ecuatorial de radio a. Los puntos de esta

circunferencia tienen θ = π/2, dθ = 0. A lo largo de la circunferencia el
elemento
R deR longitud es ds = adϕ, y la longitud total de la circunferencia
es ds = a dϕ = 2πa. Ahora calculemos el radio. La lı́nea radial pasa por
el polo norte o por el polo sur, o sea que la longitud del radio es la cuarta
parte de la longitud de la circunferencia, es decir πa/2. Al dividir circunfer-
encia sobre radio se obtiene 2πa/(πa/2) = 4, que es diferente al resultado
de la geometrı́a euclidiana. Cuando, al estudiar un espacio, descubrimos que
se puede trazar un cı́rculo tal que el cociente de circunferencia sobre radio
no es 2π, podemos asegurar que el espacio no es euclidiano y que es curvo.
Terminado este ejemplo, regresemos a las consideraciones generales sobre
curvatura en un espacio de Riemann.
Rαβ y R no son indicadores de curvatura; el único indicador de curvatu-

ra es Rα βµν . Pensemos en un espacio curvo; aunque algunas componentes
Rα βµν sean diferentes de cero, puede ocurrir que todas las Rαβ sean cero y,
en consecuencia, R también sea cero: en este caso, aunque el tensor de Ricci
y el escalar de curvatura sean cero, es espacio es curvo:
234
R = 0 ; espacio plano
Todas las Rαβ = 0 ; espacio plano (9.94)
Todas las Rα βµν = 0 ⇒ espacio plano
R 6= 0 ⇒ espacio curvo
Alguna Rαβ 6= 0 ⇒ espacio curvo (9.95)
α
Alguna R βµν 6= 0 ⇒ espacio curvo
La curvatura es una propiedad intrı́nseca de un espacio. Con la palabra in-

trı́nseca queremos decir que la curvatura no depende de cuál es el sistema
de coordenadas usado. Si el tensor de Riemann es cero en unas coordenadas,
será cero en todos los sistemas coordenados; es decir, si un espacio aparece
plano en unas coordenadas, aparecerá plano en todos los sistemas coordena-
dos: un espacio plano no se puede curvar con ningún cambio de coordenadas.
Un espacio curvo no se puede aplanar con ningún cambio de coordenadas.
La curvatura es una propiedad local. El tensor de Riemann es un campo, es

decir, una cantidad que cambia de punto a punto del espacio. Ası́ mismo,
la curvatura es una propiedad local. Un espacio puede ser curvo en unos
puntos y plano en otros.
En varias secciones de este libro nos dedicaremos a estudiar una propiedad

importante que tienen los espacios de Riemann, curvos o planos. Se escoge
un punto cualquiera E. Se puede adaptar un sistema de coordenadas de
manera que el tensor métrico, al evaluarse en E, sea diag(±1, ±1, ±1, · ·
·). Más aun, podremos escoger estas coordenadas de modo que todas las
primeras derivadas del tensor métrico, al evaluarse en E, den cero: gµν (E) =
diag(±1, ±1, ±1, · · ·), gµν ,α (E) = 0. En vista del enunciado (9.59), podemos
decir que
gµν (E) = diag(±1, ±1, ±1, · · ·), Γα µν (E) = 0 (9.96)
Al escribir (E) estamos enfatizando que las condiciones (9.96) se cumplen

únicamente en el punto E escogido. En general, en otros puntos del espacio,
el tensor métrico no será diag(±1, ±1, ±1, · · ·) ni los sı́mbolos de Christoffel
serán cero. Demostraremos que (9.96) es posible en todos los casos: si en el
punto E el espacio es curvo, o si es plano. La demostración no es difı́cil, pero
sı́ es larga, y nos tomará las secciones 9.16, 9.20, 9.21 y 11.3.
235
9.16 Coordenadas adaptadas
Teorema. Es posible [13] erigir un sistema adaptado de coordenadas tal
que, en algún punto E del espaciotiempo, todos los sı́mbolos de Christoffel
valgan cero.
Sea xµ un sistema general, cualquiera, de coordenadas, sin ninguna restric-

ción, y sea E un evento cualquiera. Vamos a construir en E un sistema de
coordenadas adaptadas, que llamaremos x̃µ , y que tiene la siguiente pecu-
liaridad: en las coordenadas x̃µ , todos los sı́mbolos de Christoffel valen cero
cuando se evalúan en E. Para demostrar el teorema propondremos un cam-
bio de coordenadas xµ → x̃µ y enseguida demostraremos que en las nuevas
coordenadas los sı́mbolos Γ̃ dan cero cuando se les evalúa en E. Empecemos
pues proponiendo este cambio de coordenadas:
1 µ
x̃µ = (xµ − xµE ) + Γ αβ (xα − xαE )(xβ − xβE ) (9.97)
2
Debemos ahora transformar los sı́mbolos de Christoffel a las nuevas coorde-

nadas x̃µ , para lo cual utilizamos la fórmula (9.64):
∂ x̃µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x̃µ

Γ̃µ αβ = Γ στ − (9.98)
∂xν ∂ x̃α ∂ x̃β ∂ x̃α ∂ x̃β ∂xσ ∂xν
Para desarollar esta fórmula se toma la derivada en ambos lados de la

ecuación (9.97):
∂ x̃µ 1
ν
= gν µ + Γµ αβ , ν (xα − xαE )(xβ − xβE ) + Γµ αβ (xα − xαE )gν β
∂x 2
2
∂ x̃µ 1
σ ν
= Γµ αβ , ν , σ (xα − xαE )(xβ − xβE ) + Γµ αβ , ν (xα − xαE )gσ β
∂x ∂x 2
+ Γµ αν , σ (xα − xαE ) + Γµ αν gσ α
Ya que debemos evaluar estas derivadas en E, hacemos xα = xαE :
¯ ¯
∂ x̃µ ¯¯ ∂ 2 x̃µ ¯¯
= gν µ = Γµ σν |E (9.99)
∂xν ¯E ∂xσ ∂xν ¯E
236
¯
¯
Cuando ponemos estos valores en (9.98) se obtiene Γ̃µ αβ ¯ = 0, que es lo
E
que querı́amos demostrar.
Veamos cómo transforman las componentes de los tensores cuando se hace

el cambio de coordenadas xµ → x̃µ . Tomemos un tensor cualquiera (llamar-
lo T µν , por ejemplo); de acuerdo con la regla general de transformaciones
(9.20) podemos escribir
∂ x̃µ ∂ x̃ν αβ
T̃ µν = T
∂xα ∂xβ
Esta fórmula dice que en un punto cualquiera, arbitrario, del espacio, T̃ µν

no es igual a T µν . Pero en el punto E las derivadas son deltas de Kronecker,
según (9.99), y en consecuencia T̃Eµν = g µ α g ν β TEαβ = TEµν . En palabras: en el
punto E, las componentes de los tensores en coordenadas xµ son iguales a las
componentes en coordenadas x̃µ . Como casos particulares de este resultado
general mencionemos el tensor métrico y el tensor de Riemann:
µν µν αβµν αβµν
g̃E = gE R̃E = RE (9.100)
Ya que en el punto E y en coordenadas adaptadas x̃µ los sı́mbolos de

Christoffel son cero, la derivada covariante (;) es igual a la derivada cor-
riente (,), lo que representa una simplificación considerable. Esto nos mueve
a trazar una estrategia general de simplificación de los procesos matemáticos.
Pensemos por ejemplo que queremos demostrar la validez de una ecuación
que tiene una derivada covariante. Si queremos demostrar la ecuación en
cualquier sistema coordenado xµ , la derivada covariante nos obliga a calcu-
lar los Γµ αβ , y esto es dispendioso. La idea es escoger un punto, llamarlo
¯ Ey
µ µ ¯
erigir un sistema de coordenadas adaptadas x̃ . Hemos visto que Γ̃ αβ ¯ = 0
E
y, en consecuencia, la derivada covariante (;) se reduce a la derivada corri-
ente (,), que es más fácil de manejar. Si logramos demostrar la ecuación
en coordenadas x̃µ , la fórmula (9.52) nos asegura que la prueba será válida
también en cualquier otro sistema de coordenadas xµ . En la próxima sección
usaremos esta estrategia para demostrar la validez de la primera identidad
de Bianchi (9.86).
Finalmente, en vista de (9.58), el teorema de esta sección dice que es posible
237
erigir un sistema adaptado de coordenadas x̃µ tal que, en algún punto E del
∂
espaciotiempo, todas las primeras derivadas g̃αβ , µ = g̃αβ sean cero.
∂ x̃µ
9.17 Las identidades de Bianchi

Ya estamos en condición de demostrar las identidades de Bianchi (9.86) y
(9.87). Comenzaremos con la primera, (9.86). Montamos un sistema coor-
denado x̃µ adaptado al punto E. En estas nuevas coordenadas el tensor de
Riemann y el sı́mbolo de Christoffel se escriben con tilde: R̃αβµν y Γ̃αβµ . De
acuerdo con la definición (9.77) :
R̃αβµν = Γ̃αβµ , ν − Γ̃αβν , µ − Γ̃σβν Γ̃ασµ + Γ̃σβµ Γ̃ασν
Evaluar esta ecuación en el evento E, donde los sı́mbolos de Christoffel Γ̃

son cero:
¯ ³ ´¯
¯ ¯
R̃αβµν ¯ = Γ̃αβµ , ν − Γ̃αβν , µ ¯ (9.101)
E E
∂
Tomar la derivada :
∂ x̃σ
¯ ³ ´¯
¯ ¯
R̃αβµν , σ ¯ = Γ̃αβµ , ν , σ − Γ̃αβν , µ , σ ¯ . Ası́ también:
E E
¯ ³ ´¯
¯ ¯
R̃αβσµ , ν ¯ = Γ̃αβσ , µ , ν − Γ̃αβµ , σ , ν ¯
E E
¯ ³ ´¯
¯ ¯
R̃αβνσ , µ ¯ = α α
Γ̃ βν , σ , µ − Γ̃ βσ , ν , µ ¯
E E
Sumar lado a lado estas tres ecuaciones para obtener
³ ´¯
¯
R̃αβµν , σ + R̃αβσµ , ν + R̃αβνσ , µ ¯ = 0
E
Como en estas coordenadas adaptadas las derivadas corriente y covariante

coinciden, podemos cambiar los signos (,) por los signos (;):
³ ´¯
¯
R̃αβµν ; σ + R̃αβσµ ; ν + R̃αβνσ ; µ ¯ = 0
E
238
Esta ecuación covariante es válida en un sistema de coordenadas x̃µ . La
fórmula (9.53) asegura que también es válida en cualquier otro sistema xµ :
¡ α ¢¯
R βµν ; σ + Rα βσµ ; ν + Rα βνσ ; µ ¯E = 0
La escritura enfatiza que la ecuación es válida en el punto E. Pero lo que

hicimos para E también se puede hacer para cualquier otro punto, o sea que
la ecuación es válida en todos los puntos del espacio:
Rα βµν ; σ + Rα βσµ ; ν + Rα βνσ ; µ = 0 (9.102)
Hemos probado ası́ la primera identidad de Bianchi (9.86). Demostremos

ahora la segunda. En (9.102) hacer µ = α:
Rα βαν ; σ + Rα βσα ; ν + Rα βνσ ; α = 0

↓ ↓ ↓
α
−R βνα ; σ Rσβ ; ν g αρ Rρβνσ ; α
↓ ↓
−Rβν ; σ g αρ Rνσρβ ; α
La ecuación queda entonces:
−Rβν ; σ + Rσβ ; ν + g αρ Rνσρβ ; α = 0
Multiplicar por g βν y utilizar la propiedad (9.79):
−R; σ + Rν σ ; ν + g αρ g βν Rνσρβ ; α = 0
−R; σ + Rν σ ; ν + Rα σ ; α = 0
Es decir
1
Rα σ ; α − R;σ = 0 (9.103)
2
239
1
(Rα σ − g α σ R); α = 0
2
Quedan entonces demostradas las identidades de Bianchi. Esta última iden-

tidad la queremos presentar en una forma ligeramente diferente, que nos
será útil más tarde. Multiplicando la ecuación (9.103) por g µσ escribimos
Rαµ ; α = 12 g µσ R;σ , y como Rαµ = Rµα tenemos Rµα ; α = 12 g µσ R;σ , es decir:
1
Rµν ; ν = g µν R;ν (9.104)
2
Esta fórmula es equivalente a la identidad de Bianchi. Ahora ataquemos el

problema de demostrar que
9.18 El tensor de Riemann es el único

que contiene linealmente las primeras derivadas del sı́mbolo de Christoffel
Γ. Lo demostraremos [13] siguiendo este derrotero: calcular las derivadas
Γα µν , δ , averiguar cómo transforman ( y darse cuenta de que no son ten-
sores), proponer una combinación lineal de derivadas Γα µν , δ que sı́ trans-
forma como un tensor (al que llamaremos Rρ ξη , σ ), probar que este tensor
Rρ ξη , σ es igual al tensor de Riemann Rρ ξη , σ y, finalmente, demostrar que
siempre se llega al tensor Rρ ξη , σ y no a otro.
∂xσ
Multiplicar ambos lados de (9.63) por :
∂x0µ
∂xσ 0µ ∂xρ ∂xω σ ∂ 2 xσ

Γ αβ = Γ ρω +
∂x0µ ∂x0α ∂x0β ∂x0α ∂x0β
∂
Tomemos la derivada en ambos lados de esta ecuación:
∂x0κ
∂xσ ∂Γ0µ αβ ∂ 2 xσ 0µ ∂xρ ∂xω ∂Γσ ρω

+ Γ αβ =
∂x0µ ∂x0κ ∂x0κ ∂x0µ ∂x0α ∂x0β ∂x0κ
µ ρ ¶
σ ∂ ∂x ∂xω ∂ 3 xσ
+ Γ ρω +
∂x0κ ∂x0α ∂x0β ∂x0κ ∂x0α ∂x0β
240
∂Γσ ρω ∂xη ∂Γσ ρω
En el primer término del lado derecho hacemos = , y la
∂x0κ ∂x0κ ∂xη
ecuación queda:
∂xσ ∂Γ0µ αβ ∂ 2 xσ 0µ ∂xρ ∂xω ∂xη ∂Γσ ρω

+ Γ αβ =
∂x0µ ∂x0κ ∂x0κ ∂x0µ ∂x0α ∂x0β ∂x0κ ∂xη
µ ρ ¶
σ ∂ ∂x ∂xω ∂ 3 xσ
+ Γ ρω +
∂x0κ ∂x0α ∂x0β ∂x0κ ∂x0α ∂x0β
∂x0λ
Multiplicar ambos lados por y reordenar términos:
∂xσ
∂Γ0λ αβ ∂x0λ ∂xρ ∂xω ∂xη Γσ ρω ∂x0λ ∂ 3 xσ

= +
∂x0κ ∂xσ ∂x0α ∂x0β ∂x0κ ∂xη ∂xσ ∂x0κ ∂x0α ∂x0β
µ ¶
∂x0λ ∂ ∂xρ ∂xω ∂x0λ ∂ 2 xσ
+ Γσ ρω − Γ 0µ
αβ
∂xσ ∂x0κ ∂x0α ∂x0β ∂xσ ∂x0κ ∂x0µ
Y en notación con comas:
∂x0λ ∂xρ ∂xω ∂xη σ ∂x0λ ∂ 3 xσ

Γ 0λ αβ , κ = Γ ρω , η +
∂xσ ∂x0α ∂x0β ∂x0κ ∂xσ ∂x0κ ∂x0α ∂x0β
µ ¶
∂x0λ ∂ ∂xρ ∂xω ∂x0λ ∂ 2 xσ
+ Γσ ρω − Γ0µ
αβ
∂xσ ∂x0κ ∂x0α ∂x0β ∂xσ ∂x0κ ∂x0µ
Observemos bien esta ecuación. Si en el lado derecho hubiera únicamente

el primer término, podrı́amos decir que Γλ αβ , κ es un tensor. Pero el lado
derecho tiene más términos, y por eso las derivadas Γλ αβ , κ no son tensores.
En seguida veremos que hay una combinación lineal de estas derivadas que
sı́ es tensor.
Cambiemos ahora la notación: escribimos x̃µ en vez de xµ , y escribimos

x̃0µ en vez de x0µ :
∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ∂ x̃0λ ∂ 3 x̃σ

Γ̃ 0λ αβ , κ = Γ̃ ρω , η +
∂ x̃σ ∂ x̃0α ∂ x̃0β ∂ x̃0κ ∂ x̃σ ∂ x̃0κ ∂ x̃0α ∂ x̃0β
µ ¶
∂ x̃0λ ∂ ∂ x̃ρ ∂ x̃ω 0µ ∂ x̃0λ ∂ 2 x̃σ
+ Γ̃σρω − Γ̃ αβ ∂ x̃σ ∂ x̃0κ ∂ x̃0µ
∂ x̃σ ∂ x̃0κ ∂ x̃0α ∂ x̃0β
241
Supongamos en este momento que tanto las x̃µ como las x̃0µ son coordenadas
adaptadas al punto E. Vamos a evaluar la última ecuación en E, recordando
que en ese punto Γ̃ = Γ̃0 = 0:
¯ ¯ ¯
¯ ∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ¯ ∂ x̃0λ ∂ 3 x̃σ ¯
0λ
Γ̃ αβ , κ ¯ = ¯
Γ̃ ρω , η ¯ + ¯
E σ 0α 0β
∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ 0κ ∂ x̃σ ∂ x̃ 0κ ∂ x̃0α ∂ x̃0β ¯
E E
(9.105)
Sea G el grupo de todas las transformaciones de coordenadas, y sea G 0 el

subgrupo de las transformaciones que llevan de unas coordenadas adaptadas
a otras adaptadas. Observemos la ecuación (9.105). Si en el lado derecho
hubiera únicamente el primer término, podrı́amos decir que Γ̃ 0λ αβ , κ es un
tensor bajo el subgrupo G 0 . Pero el lado derecho tiene otro término, y por eso
Γ̃ 0λ αβ , κ no es un tensor bajo el subgrupo G 0 . En seguida veremos que hay
una combinación lineal de estas derivadas que sı́ es tensor bajo el subgrupo
G 0 . Se trata de erradicar al segundo término del lado derecho de (9.105), y
esto no es difı́cil. En efecto, notemos que el segundo término del lado derecho
de (9.105) es simétrico bajo la permutación κ ® β ; entonces, si en ambos
lados de (9.105) restamos la permutación κ ® β , debe desaparecer el térmi-
no incómodo:
³ ´¯
¯
Γ̃ 0λ αβ , κ − Γ̃ 0λ ακ , β ¯
E
µ ¶¯
∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ¯
= σ 0α 0β 0κ
Γ̃ ρω , η − σ 0α 0κ 0β
Γ̃ ρω , η ¯¯
∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ E
En el segundo término del lado derecho intercambiar los nombres de los

ı́ndices η y ω:
³ ´¯
¯
Γ̃ 0λ αβ , κ − Γ̃ 0λ ακ , β ¯
E
µ ¶¯
∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ∂ x̃0λ ∂ x̃ρ ∂ x̃η ∂ x̃ω σ ¯
= σ 0α 0β 0κ
Γ̃ ρω , η − σ 0α 0κ 0β
Γ̃ ρη , ω ¯¯
∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ ∂ x̃ E
∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η ³ σ ´¯¯

= Γ̃ ρω , η − Γ̃ ρη , ω ¯¯
σ
∂ x̃σ ∂ x̃0α ∂ x̃0β ∂ x̃0κ E
Definiendo
242
¯ ³ ´¯
¯ ¯
R̃ αβκ ¯ = Γ̃ λ αβ , κ − Γ̃ λ ακ,β ¯ ,
λ
(9.106)
E E
podemos escribir
¯ ¯
0λ ¯ ∂ x̃0λ ∂ x̃ρ ∂ x̃ω ∂ x̃η σ ¯¯
R̃ αβκ ¯ = R̃ ρωη ¯ (9.107)
E ∂ x̃σ ∂ x̃0α ∂ x̃0β ∂ x̃0κ E
Esta ecuación dice que, en el punto E, la cantidad R̃ λ αβκ transforma como

un tensor bajo el grupo G 0 . Por el momento comparemos las ecuaciones
(9.101) y (9.106) para afirmar que
¯ ¯
¯ ¯
R̃ λ αβκ ¯ = R̃ λ αβκ ¯ (9.108)
E E
En palabras: en el punto E y en coordenadas adaptadas, R̃ λ αβκ coincide

con el tensor de Riemann. λ
¯ Pero R̃ αβκ es tensor bajo G, entonces la ecuación
¯
(9.108) dice que R̃ λ αβκ ¯ también es tensor bajo G.
E
Ahora, si dos tensores son iguales en un sistema coordenado,¯ también serán

¯
¯ ¯
iguales en otro sistema coordenado, lo que se escribe R̃ λ αβκ ¯ = R̃ λ αβκ ¯
¯ ¯ E E
⇒ R λ αβκ ¯E = R λ αβκ ¯E . Anotemos finalmente que lo hecho para el pun-
to E también se puede hacer para cualquier otro punto; esto nos per-
mite afirmar que en todos los puntos del espacio se cumple la igualdad
R λ αβκ = R λ αβκ .
Nuestro interés ha sido construir un tensor que contenga linealmente las

primeras derivadas del sı́mbolo de Christoffel, y hemos encontrado que ese
tensor es el tensor de Riemann. Debemos además probar que fuera del ten-
sor de Riemann no hay otro tensor que contenga linealmente las primeras
derivadas del sı́mbolo de Christoffel. Esto es fácil. Cuando rastreamos ha-
cia atrás el camino recorrido encontramos que hay otra ruta posible: para
erradicar el término incómodo de (9.105) nosotros restamos la permutación
κ ® β ; pero el término incómodo también se puede erradicar restando la
permutación κ ® α ; en tal caso terminamos, no en R λ αβκ , sino en R λ βακ .
Claramente, esta segunda ruta produce otra componente del tensor de Rie-
mann, pero no produce un tensor diferente al de Riemann. En conclusión,
las dos rutas llegan al mismo tensor. En vista de (9.59) podemos afirmar
que
243
R λ αβκ es el único tensor en el que:
1) Aparecen las derivadas gµν ,α y gµν ,α,β (9.109)
2) Las gµν ,α,β aparecen linealmente.
Rµν y R también son únicos: Veamos que cuando se contraen dos ı́ndices
en el tensor de Riemann, siempre se produce el tensor de Ricci. Analicemos
en detalle las posibles contracciones de Rαβµν para producir un tensor de
rango dos:
Contraer α y ν : g να Rαβµν = Rβµ
Contraer α y µ : g µα Rαβµν = −g µα Rαβνµ = −Rβν
Contraer α y β : g αβ Rαβµν = 0
Contraer β y µ : g βµ Rαβµν = g βµ Rβανµ = Rαν
Contraer β y ν : g βν Rαβµν = −g βν Rβαµν = −Rαµ
Vemos ası́ que siempre se termina en el tensor de Ricci. De otro lado, es

claro que con Rµν hay una sóla contracción posible, que es R. En conclusión:
El único tensor de rango dos que se puede obtener

(9.110)
a partir de R λ αβκ es Rµν , y el único escalar es R .
9.19 Obligar al tensor métrico a que,

en cierto evento, tome algún valor
que nosotros queramos
Teorema: Es posible erigir un sistema de coordenadas x̄µ de tal manera
que el tensor métrico tome, en algún punto E del espacio, cualquier valor
que nosotros arbitrariamente queramos.
Para demostrar este teorema supongamos que tenemos un sistema de co-

ordenadas xµ , con métrica g αβ . Vamos a hacer una transformación a otro
sistema coordenado x̄µ ; pero no una transformación cualquiera, sino lineal:
x̄µ = bµ ν xν , (9.111)
244
con bµ ν constante. Derivando dos veces se encuentra:
∂ 2 x̄µ
=0 (9.112)
∂xσ ∂xν
Ahora usamos la ecuación (9.20) para calcular el tensor métrico en las nuevas
coordenadas:
∂ x̄µ ∂ x̄ν αβ
ḡ µν = g ,
∂xα ∂xβ
y utilizando (9.111):
ḡ µν = bµ α bν β g αβ (9.113)
Esta ecuación es válida en todos los puntos del espacio. En particular, en el

punto E :
ḡ µν (E) = bµ α bν β g αβ (E) (9.114)
Asignemos a las componentes ḡ µν (E) cualesquiera valores que nosotros ar-

bitrariamente queramos darles. La cuestión importante es esta: ¿Acaso esta-
mos construyendo un ḡ µν (E) contradictorio, sin consistencia interna? ¿Ten-
emos realmente plena libertad para asignar a las componentes ḡ µν (E) los val-
ores que caprichosamente queramos? La pregunta se concreta de la manera
siguiente: ¿existe el conjunto de coeficientes bµ ν capaz de llevar del g µν (E)
inicial al ḡ µν (E) caprichoso? Veremos que sı́ existe el conjunto de coeficientes
bµ ν , es decir, que los datos (que son g µν (E) y ḡ µν (E)) admiten la existencia
de los coeficientes bµ ν .
Para demostrar que los datos son compatibles con los coeficientes bµ ν , tomamos
a estos bµ ν como si fueran incógnitas, y nos preguntamos si acaso hay su-
ficientes ecuaciones para averiguar las n2 las incógnitas. Como el tensor
métrico es de dos ı́ndices, tiene n2 componentes; pero además es simétrico,
entonces sólo tiene (n2 +n)/2 componentes independientes. Esto nos permite
afirmar que (9.114) es un conjunto de (n2 + n)/2 ecuaciones independientes.
Tenemos pues (n2 + n)/2 ecuaciones y n2 incógnitas; pero n2 >(n2 + n)/2 , es
245
decir, hay más incógnitas que ecuaciones: el sistema de ecuaciones está sub-
determinado, y por consiguiente hay un número infinito de soluciones para
las incógnitas bµ α . En conclusión, sı́ es posible asignar a las componentes
ḡ µν (E) los valores que nosotros arbitrariamente queramos darles2 . Pensan-
do en una matriz b cuyas entradas son bµ α , la ecuación 9.114) se escribe
concisamente de la manera siguiente:
ḡ µν (E) = b g αβ (E) bT (9.115)
Como hay un número infinito de soluciones para la matriz b , no podemos

aspirar a deducirla. Esta matriz b se averigua por inspección directa de la
ecuación (9.115): en esta fórmula las variables ḡ µν (E) y g µν (E) son datos.
Podemos escoger las componentes de ḡ µν (E) arbitrariamente, o las de ḡ µν (E 0 ),

o las de ḡ µν (E 00 ) ... Pero no podemos escoger arbitrariamente las de ḡ µν (E)
y las de ḡ µν (E 0 ) y las de ḡ µν (E 00 )...Esto es claro, ya que para obtener ḡ µν (E)
se necesita hacer una transformación de coordenadas (un conjunto de coefi-
cientes bµ ν ) y para obtener ḡ µν (E 0 ) se necesita otra transformación.
Escribamos de qué manera quedan el tensor métrico y el de Riemann de-

spués de esta transformación de coordenadas, siguiendo las fórmulas (9.113)
y (9.80):
ḡ µν = bµ ρ bν σ g ρσ R̄αβµν = bα ρ bβ σ bµ δ bν π Rρσδπ (9.116)
9.20 Dos transformaciones sucesivas

Ahora vamos a considerar dos transformaciones: xµ → x̃µ → x̄µ . La primera
transformación sigue al teorema de la sección 9.16 y la segunda sigue al teo-
rema de la sección 9.19. Más precisamente: en las coordenadas xµ el tensor
métrico es g µν y los sı́mbolos de Christoffel son Γα µν . En coordenadas x̃µ
el tensor métrico es g̃ µν y los sı́mbolos de Christoffel, evaluados en E , son
cero. En coordenadas x̄µ el tensor métrico es ḡ µν y los sı́mbolos de Christof-
fel, evaluados en E , siguen siendo cero. El tensor ḡ µν , evaluado en E , tiene
cualesquiera componentes que nosotros queramos.
2
Algo similar ocurre en la teorı́a newtoniana de la gravitación. El potencial gravitacional
Φ puede ser subido o bajado a nuestro amaño para que Φ adopte, en un punto dado,
cualquier valor que nosotros queramos darle.
246
Uno podrı́a poner en duda que en las últimas coordenadas x̄ los sı́mbo-
los de Christoffel Γ̄ (E) sigan siendo cero. Esta duda es justificada porque,
sabido que los Γ̃(E) se volvieron cero en la primera transformación, ¿cómo
garantizamos que siguen siendo cero después de la segunda transformación
de coordenadas? En otras palabras: ¿cómo garantizamos que las x̄ sean coor-
denadas adaptadas? Pues ası́ ocurre, verdaderamente; en efecto, utilizando
la fórmula (9.64) para escribir la transformación x̃ → x̄ encontramos:
∂ x̄µ ∂ x̃σ ∂ x̃τ ν ∂ x̃ν ∂ x̃σ ∂ 2 x̄µ

Γ̄µ αβ = Γ̃ στ −
∂ x̃ν ∂ x̄α ∂ x̄β ∂ x̄α ∂ x̄β ∂ x̃σ ∂ x̃ν
Esta ecuación es válida en todo el espacio, y Γ̄µ αβ no es, en general, cero;

pero en E sı́ es cero. En efecto, en E ambos términos del lado derecho son
cero: el primer término porque Γ̃ν στ (E) = 0, y el segundo término por
(9.112). En conclusión, en el punto E no sólo Γ̃ = 0 , también Γ̄ = 0 .
La segunda transformación x̃ → x̄ es, de acuerdo con las fórmulas (9.111) y

(9.116), ası́:
x̄µ = bµ ρ x̃ρ , ḡ µν = bµ ρ bν σ g̃ ρσ , R̄αβµν = bα ρ bβ σ bµ δ bν π R̃ρσδπ ,
y en vista de (9.97) y (9.100):
1 µ ρ
x̄µ = bµ ρ (xρ − xρE ) + b ρ Γ δπ (xδ − xδE )(xπ − xπE ) (9.117)
2
ḡ µν = bµ ρ bν σ g ρσ (9.118)
R̄αβµν = bα ρ bβ σ bµ δ bν π Rρσδπ (9.119)
Hagamos una breve recopilación de la doble transformación:
Se escoge un punto E . Se conoce la métrica g µν en las coordenadas ini-

ciales xµ . Uno quiere que la métrica final, evaluada en el punto E , sea
ḡ µν (E) . O sea que E , g µν y ḡ µν (E) son datos. La pregunta es ¿cómo son las
coordenadas finales x̄µ y cómo son las componentes de los tensores en es-
tas coordenadas finales? Para resolver esta pregunta se siguen los siguientes
247
pasos: Se escribe la ecuación (9.115) y, por inspección, se averigua la matriz
b . Conocidos los coeficientes bα ρ , uno ejecuta las tres ecuaciones (9.117)-
(9.119). Debe resaltarse que estas tres ecuaciones son válidas en todos los
puntos del espacio. Finalmente, nótese que en estas ecuaciones no aparecen
cantidades del tipo x̃µ , g̃ µν ni R̃αβµν , que corresponden a las coordenadas in-
termedias; en otras palabras, estas ecuaciones muestran una transformación
directa xµ → x̄µ , sin vestigios de la transformación intermedia xµ → x̃µ .
9.21 Un ejemplo
A continuación traemos un ejemplo de la doble transformación. En la sección

13.1 tendremos ocasión de estudiar un problema de primera importancia,
que es el campo gravitatorio ocasionado por una masa puntual M . Veremos
que el tensor métrico está dado por la matriz (13.14); en esa expresión la
variable s , que se llama el radio de Schwarzschild, quiere decir 2GM/c2 . O
sea que aunque s tiene unidades de longitud, representa a la masa M , de
modo que el lı́mite del espacio plano, que corresponde a M = 0 , se obtiene
haciendo s = 0 en la ecuación (13.14), lo que da como resultado la ecuación
(9.44). También veremos, en la sección 13.2, las componentes no nulas de
los sı́mbolos de Christoffel y del tensor de Riemann.
En las coordenadas iniciales xµ = (ct, r, θ, ϕ) el evento E tiene coordenadas

xµE = (ctE , rE , θE , ϕE ) y el tensor métrico está dado por (13.14). Este tensor,
evaluado en E , es:
 
(1 − s/rE )−1 0 0 0
 
 
 0 −(1 − s/rE ) 0 0 
 
g (E) = 
µν



 0 0 −2
−rE 0 
 
 
0 0 0 −(rE sen θE )−2
(9.120)
De otro lado, queremos que en las coordenadas finales x̄µ el tensor métrico,
al evaluarse en E , sea (9.44):
248
 
1 0 0 0
 
 
 0 −1 0 0 
 
ḡ (E) = 
µν


 (9.121)
 0 0 −r−2 0 
 E 
 
0 0 0 −(rE sen θE )−2
Para averiguar la matriz b debemos poner las matrices (9.120) y (9.121) en

la ecuación (9.115). Al hacerlo nos damos cuenta, por simple inspección, de
que una b posible es la siguiente matriz diagonal:
Ã !
p 1
b = bT = diag 1 − s/rE , p ,1,1 (9.122)
1 − s/rE
Conocida la matriz b , es muy fácil calcular las componentes R̄αβµν del tensor
de Riemann en las coordenadas finales x̄µ . Para tal efecto se ponen las vie-
jas componentes Rρσδπ (de la sección 13.2) y la matriz (9.122) en la fórmula
(9.119), obteniéndose:
s
R̄0101 = R̄1010 = −R̄1001 = −R̄0110 =
r3
s(1 − s/rE )
R̄0202 = R̄2020 = −R̄2002 = −R̄0220 = −
2r5 (1 − s/r)
s(1 − s/rE )
R̄0303 = R̄3030 = −R̄3003 = −R̄0330 = − 5
2r (1 − s/r) sin2 θ
s(1 − s/r)
R̄1212 = R̄2121 = −R̄2112 = −R̄1221 =
2r5 (1 − s/rE )
s(1 − s/r)
R̄1313 = R̄3131 = −R̄3113 = −R̄1331 =
2r5 (1 − s/rE ) sin2 θ
s
R̄2323 = R̄3232 = −R̄3223 = −R̄2332 = − 7 2
r sin θ
Para calcular el tensor métrico ḡ µν en las coordenadas finales x̄µ debemos
colocar las matrices (13.14) y (9.122) en la fórmula (9.118) para obtener:
249
 
1 − s/rE
 1 − s/r 0 0 0 
 
 
 
 1 − s/r 
 0 − 0 0 
ḡ µν
=
 1 − s/rE 
 (9.123)
 
 
 0 0 −r−2 0 
 
 
0 0 0 −(r sen θ)−2
Es interesante apuntar que pudimos calcular los R̄αβµν y los ḡ µν sin necesi-
dad de averiguar antes las coordenadas finales x̄µ . No sobra, sin embargo,
que presentemos estas coordenadas finales. Para calcularlas se utilizan los
términos de Christoffel de la sección 13.2 y la matriz (9.122) en la fórmula
(9.117), llegándose a:
p
x̄0 = 1 − s/rE (ct − ctE )
1 h s(1 − s/r)(ct − ctE )2 s(r − rE )2

x̄1 = p 2(r − rE ) + 2
− 2
2 1 − s/rE 2r 2r (1 − s/r)
i
− r(1 − s/r)(θ − θE )2 − r(1 − s/r)(sen θ)2 (ϕ − ϕE )2
1 1
x̄2 = θ − θE + (r − rE )(θ − θE ) − sen θ cos θ(ϕ − ϕE )2
r 2
1
x̄3 = ϕ − ϕE + (r − rE )(ϕ − ϕE ) + cot θ (θ − θE )(ϕ − ϕE )
r
El espacio no es plano en el evento E . En el evento E ocurren dos

cosas interesantes: 1) la métrica (9.121) es la misma (9.44) del espaciotiempo
plano; y 2) los sı́mbolos de Christoffel son cero, como ocurre en el espaci-
otiempo plano. En vista de estas dos propiedades uno podrı́a precipitarse a
afirmar que en E el espaciotiempo es plano, pero esta afirmación es falsa, ya
que el espaciotiempo descrito por (9.123) no es plano ni en E ni en ningún
otro evento. Ya hemos visto que lo que indica si un espacio es plano o curvo
es el tensor de Riemann: acabamos de demostrar que algunas componentes
de este tensor difieren de cero, y por eso el espaciotiempo descrito por (9.123)
es curvo.
El ejemplo que acabamos de estudiar, aunque se refiere a un espacio particu-

lar de dimensión 4, pone de presente una propiedad general: en todo espacio
250
de Riemann, de cualquier dimensión n, es posible construir un sistema de
coordenadas adaptadas a un punto (llamémoslo E), de modo que en E la
métrica y los sı́mbolos de Christoffel sean como los de un espacio plano. A
primera vista se podrı́a creer que el espacio se ha aplanado en E , pero ese
pensamiento es erróneo: la curvatura o planitud del espacio en E es una
propiedad intrı́nseca de la geometrı́a, tal como habı́amos mencionado en la
página 235.
Damos por terminada la tarea que nos habı́amos planteado en la página

235: demostrar que es posible adaptar al punto E un sistema de coorde-
nadas de modo que se cumplan las dos condiciones (9.96). Esto nos dota de
herramientas suficientes para construir una teorı́a general de la relatividad,
asunto que nos ocupará a partir del capı́tulo 11.
251
252
Capı́tulo 10
Las geodésicas
Pensemos en dos puntos P1 y P2 en la superficie de una esfera. Existe un

número infinito de curvas que pasan por ambos puntos, a lo largo de las
cuales se puede medir la distancia P1 P2 . Nos preguntamos ahora en cuál de
las curvas la distancia P1 P2 resulta mı́nima, y la respuesta es bien conocida:
en el arco menor del cı́rculo máximo que pasa por ambos puntos.
El cálculo elemental nos enseña que una función se minimiza cuando se

anula una primera derivada, es decir, cuando la función es estacionaria. En
nuestro caso decimos que a lo largo del arco menor la distancia es esta-
cionaria: el cálculo de la distancia arroja el mismo resultado bien sea que se
ejecute a lo largo del arco menor o a lo largo de cualquier otra curva, muy
cercana al arco menor, que pase por P1 y P2 .
Para cualquier geometrı́a, en general, la geodésica se define como aquella

curva en la que la distancia total es estacionaria (en vez de estacionaria se
puede usar también la palabra extremal). Este es un concepto variacional que
se refiere a la geodésica y a todas las curvas arbitrarias cercanas a ella. Nos
proponemos desarrollar el cálculo variacional para encontrar la geodésica.
10.1 La ecuación diferencial

de las geodésicas
Consideremos un espacio de Riemann con coordenadas xµ e intervalo ds2 =
gµν dxµ dxν . Sean E1 y E2 dos puntos en ese espacio. Pensemos ahora en una
curva
R E2 pque pasa por estos dos puntos y llamemos longitud total al integral
E1 gµν dxµ dxν ejecutado a lo largo de esa curva. Sin embargo, esta curva
no es la única que pasa por E1 y E2 ya que, en efecto, hay un número
253
infinito de curvas, y cada una tiene su propia longitud. Dentro del infinito
número de curvas que conectan a E1 con E2 hay una muy especial, llamada
la geodésica, en la que se extremaliza la longitud total:
Z E2 p
δ gµν dxµ dxν = 0 en la geodésica. (10.1)
E1
p
Hemos cometido una ligereza al tomar la raı́z cuadrada gµν dxµ dxν , cosa
que sólo puede hacerse cuando el intervalo no es negativo. Por el momento
vamos a suponer que los intervalos son positivos y aplazamos para la sección
10.2 el estudio de los intervalos nulos y negativos.
Parametrización. Llamamos (dλ)2 al intervalo a lo largo de la geodésica:
·q ¸
dλ = µ
gµν (x) dx dxν (10.2)
Geodésica
R
La integral λ = E1 dλ es la longitud parcial de la geodésica desde E1 hasta
un punto cualquiera de ella. El parámetro λ es propiedad de la geodésica y
sirve para caracterizar los puntos que a ella pertenecen. Más explı́citamente,
denotando por x̄ a los puntos de la geodésica, escribimos x̄ = x̄(λ) ; las co-
ordenadas de x̄ también son funciones de λ, es decir, x̄µ = x̄µ (λ) . Pensemos
ahora en otra curva diferente a la geodésica, que se construye punto a punto
de la manera siguiente: el punto x̄(λ) se corre una cantidad δx(λ) , o sea
que las coordenadas del nuevo punto serán x̄µ (λ) + δxµ (λ) . Vemos ası́ que
todos los puntos de la geodésica y todos los puntos de la nueva curva son
funciones del parámetro escalar λ . Las variaciones δxµ son infinitesimales
y arbitrarias, pero deben ajustarse a la condición de que la curva variada
x̄µ + δxµ también pase por E1 y E2 :
δxµ = 0 en E1 y en E2 (10.3)
Las ecuaciones de Euler-Lagrange. El problema variacional contenido

en la ecuación (10.1) es matemáticamente igual al de la ecuación (8.3), si se
hace el cambio L → L, con la lagrangiana L definida ası́:
r
dxµ dxν
L ≡ gµν (10.4)
dλ dλ
254
Nos ahorramos los pasos que llevan de (8.3) a (8.8), y simplemente escribimos
las ecuaciones de Euler-Lagrange (8.8) con L en vez de L:
 
· ¸
∂L d  ∂L 
−   = 0 (10.5)
∂xα Geodésica dλ dxα
∂
dλ Geodésica
Los parecidos con el Capı́tulo 8 no cesan aquı́. En efecto, el lector podrá re-
conocer que el problema que queremos atacar es muy parecido al que re-
solvimos en los pasos que llevan de la ecuación (8.13) a la (8.16). Pero hay
una diferencia importante: en esa ocasión la métrica ηµν era constante, en
cambio en el problema que ahora nos ocupa ocurre que gµν es variable.
Concretamente, en vez de (8.14) debemos ahora escribir
∂L 1 dxµ dxν
= gµν ,α
∂xα 2L dλ dλ
La análoga de (8.15) es
∂L 1 dxν
α = gνα
dx L dλ
∂
dλ
Pongamos ahora las dos últimas ecuaciones en (10.5):
· ¸ · ¸
1 dxµ dxν d 1 dxν
gµν ,α − gνα =0 (10.6)
2L dλ dλ Geod dλ L dλ Geod
Ahora, la ecuación (10.2) afirma que [ L ]Geod = 1, entonces (10.6) es:
µ ¶
1 dxµ dxν d dxν
gµν ,α − gνα =0
2 dλ dλ dλ dλ
Procedemos a transformar la apariencia de esta ecuación:
1 dxµ dxν d ³ dxµ ´

0 = gµν ,α − gµα
2 dλ dλ dλ dλ
255
1 dxµ dxν ³ d ´ dxµ d2 xµ
= gµν ,α − gµα − gµα
2 dλ dλ dλ dλ dλ2
h1 i dxµ dxν d2 xµ
= gµν ,α − gµα,ν − gµα
2 dλ dλ dλ2
Multiplicar ambos lados por g σα :
d2 xσ 1 ¡ ¢ dxµ dxν
0 = 2
+ g σα 2gαµ , ν − gµν , α
dλ 2 dλ dλ
d2 xσ 1 σα ¡ ¢ dxµ dxν
= + g gαµ , ν + gνα , µ − gµν , α + gαµ , ν − g να , µ
dλ2 2 dλ dλ
d2 xσ σ dxµ dxν 1 σα ¡ ¢ dxµ dxν

= + Γ µν + g gαµ , ν − gαν , µ (10.7)
dλ2 dλ dλ 2 dλ dλ
¡ ¢
Se observa que gαµ , ν − gαν , µ es antisimétrico bajo la permutación µ À ν,
mientras que dxµ dxν es simétrico; entonces, de acuerdo con la ecuación
(5.38), la contracción total es cero. Vemos ası́ que el último término del lado
derecho de la ecuación (10.7) es cero, o sea que:
d2 xσ σ dxµ dxν
+ Γ µν = 0 (10.8)
dλ2 dλ dλ
Esta es la ecuación diferencial de las geodésicas. Ella es, en el fondo, la

ecuación de Euler-Lagrange asociada a la L de (10.4). Conviene apuntar
que aunque en el lado izquierdo de (10.8) ninguno de los dos términos es
tensor, la suma sı́ da el tensor cero. En otras palabras, (10.8) es una ecuación
tensorial, lo que significa que es covariante bajo el grupo de las transforma-
ciones generales de coordenadas.
10.2 Parámetros afines

λ recibe el nombre de parámetro afı́n. La definición inicial (10.2) aclara cuál
es el significado de dλ2 : es el intervalo a lo largo de la geodésica. En la
ecuación diferencial de las geodésicas (10.8) aparece λ como el parámetro
importante, la variable independiente. En este momento damos un giro a
256
la presentación, para definir al parámetro afı́n en base a la ecuación de
las geodésicas: si la ecuación de una geodésica es (10.8), entonces λ es un
parámetro afı́n de esa geodésica. Ahora, si λ es un parámetro afı́n de una
geodésica, entonces aλ + b también es parámetro afı́n (a y b constantes). En
efecto, llamando λ0 = aλ + b, la ecuación (10.8) se convierte en
d2 xσ σ dxµ dxν
+ Γ µν = 0
dλ02 dλ0 dλ0
Como esta ecuación es de la forma (10.8), podemos afirmar que λ0 = aλ + b

también es un parámetro afı́n.
Hagamos una pausa para ver un ejemplo útil de lo que puede ser un parámetro
afı́n. En el caso particular del espaciotiempo, consideremos el tiempo propio
dτ de una partı́cula masiva. De acuerdo con la ecuación (8.1):
ds2 = c2 dτ 2 (10.9)
Si esta partı́cula sigue una trayectoria geodésica, entonces ds2 = dλ2 . Hay
dos parámetros afines importantes, que son s y τ :
d2 xσ σ dxµ dxν
+ Γ µν = 0 partı́cula masiva (10.10)
ds2 ds ds
d2 xσ σ dxµ dxν
+ Γ µν = 0 partı́cula masiva (10.11)
dτ 2 dτ dτ
Después de definir el parámetro afı́n en base a la ecuación de la geodésica,

estamos en condición de abordar el asunto de los intervalos nulos y nega-
tivos. Recordemos que justo antes de escribir la ecuación (10.1) supusimos
que el intervalo ds2 era positivo y, basados en esa suposición, dedujimos la
ecuación de las geodésicas (10.8). A primera vista podrı́amos afirmar que
(10.8) es válida únicamente para geodésicas de intervalos positivos, pero
tal afirmación es apresurada: (10.8) es, en general, la ecuación de todas las
geodésicas, sean éstas de intervalos positivos, nulos o negativos. Decimos
que, en general
ds2 = ² dλ2 , (10.12)
257
donde ² = 0, ±1. El valor ² = 0 es para intervalos nulos, mientras que ² = ±1
para intervalos positivos o negativos. En todos los casos dλ2 es una canti-
dad positiva. Para intervalos positivos, es claro que dλ2 es directamente el
intervalo, y para intervalos negativos dλ2 es el negativo del intervalo. Para
intervalos nulos no hay una regla general que se aplique a todos los casos;
lo que usualmente ocurre es que la misma ecuación de la geodésica indica
cuál es el parámetro afı́n λ que se debe emplear; el lector interesado puede
dirigirse a la ecuación (13.45), donde encontrará un ejemplo de cómo las
geodésicas ayudan a determinar el parámetro afı́n.
El intervalo entre dos puntos cualesquiera del espacio es gµν dxµ dxν = ds2 . Si
esos dos puntos pertenecen a la geodésica, ds2 = ²dλ2 , o sea que gµν dxµ dxν =
²dλ2 . De aquı́ se sigue que
dxµ dxν
gµν =² (10.13)
dλ dλ
Esta es la ecuación del intervalo entre dos puntos de la geodésica.
10.3 Constantes del movimiento

dxσ
Si llamamos V σ ≡ , la ecuación de las geodésicas (10.8) es:
dλ
d σ
V = −Γσ µν V µ V ν (10.14)
dλ
Multiplicar ambos lados de esta ecuación por gασ :
d σ
gασ V = −gασ Γσ µν V µ V ν
dλ
d d
(gασ V σ ) − V σ gασ = −gασ Γσ µν V µ V ν
dλ dλ
Es decir:
d d
(gασ V σ ) = V σ gασ − gασ Γσ µν V µ V ν
dλ dλ
258
dxη
= Vσ gασ,η − gασ Γσ µν V µ V ν
dλ
1
= V σ V η gασ,η − gασ g σρ (gρµ,ν + gνρ,µ − gµν ,ρ ) V µ V ν
2
1
= V σ V η gασ,η − (gαµ,ν + gνα,µ − gµν ,α ) V µ V ν
2
1 1
= gµν ,α V µ V ν + (gαµ,ν − gνα,µ ) V µ V ν
2 2
Obsérvese que el último término del lado derecho es la contracción total

de un factor simétrico con otro antisimétrico, y por (5.38) es cero. Queda
entonces
d 1
(gασ V σ ) = gµν , α V µ V ν
dλ 2
Esta ecuación dice claramente que
dxσ
gµν ,α = 0 ⇒ gασ es constante (10.15)
dλ
Este es el modo de identificar las “constantes del movimiento”: si la métrica

es independiente de la coordenada xα , entonces gασ dxσ /dλ es una constante
del movimiento. Decimos que una coordenada xα es cı́clica si xα no aparece
en el tensor métrico gµν . La fórmula (10.15) dice, entonces, que a toda coor-
denada cı́clica le corresponde una constante del movimiento. De otro lado,
un vistazo a la definición (10.4) muestra que las coordenadas cı́clicas tam-
poco aparecen en la lagrangiana, o sea que a toda coordenada xα que no
aparezca en la lagrangiana se le asocia una constante del movimiento. En
mecánica clásica se usa exactamente el mismo enunciado.
Es importante que se reconozca que gασ dxσ /dλ = constante proviene de

las ecuaciones (10.8), lo que significa que, en total, las n ecuaciones (10.8)
y la ecuación gασ dxσ /dλ = constante forman un conjunto redundante.
259
10.4 Las ecuaciones algebraicas
de las geodésicas
En el caso general disponemos de la ecuación del intervalo (10.13) y de las n
ecuaciones diferenciales (10.8). Como las (10.8) son ecuaciones de segundo
grado, su solución puede presentar dificultades. En comparación, la (10.13)
tiene derivadas de primer grado, y por esto puede ser más tratable que las
(10.8). Como recomendación general, uno debe utilizar la (10.13). Se presen-
tan ocasionalmente casos felices, en los que hay constantes del movimiento;
en estas situaciones, además de las (10.8) y de las (10.13), uno dispone de
una o varias ecuaciones (10.15). A continuación veremos algunos ejemplos;
en todos ellos el parámetro afı́n λ será erradicado por completo, o sea que
podremos escribir la ecuación de la lı́nea geodésica sin que aparezca λ.
Ejemplo: Averiguar las ecuaciones algebraicas de las geodésicas de la sigu-

iente geometrı́a: ds2 = dr2 + r2 dθ2 .
Para la geometrı́a dada el intervalo es positivo y podemos escoger el parámetro

afı́n λ igual a s. Es decir, ² = 1. El tensor métrico es
· ¸
1 0
gµν = (10.16)
0 r2
La constante del movimiento: La métrica es claramente independiente de la

dθ
variable θ, entonces, de acuerdo con (10.15), la cantidad gθθ = gθθ θ̇ = r2 θ̇
dλ
es constante del movimiento. La llamaremos K:
K = r2 θ̇ (10.17)
= Constante (10.18)
r4
θ̇−2 = (10.19)
K2
µ ¶2
dr
La ecuación del intervalo: Como ² = 1 , la ecuación (10.13) es +
dλ
µ ¶2
2 dθ
r = 1 , que ahora escribimos cortamente ası́:
dλ
260
µ ¶2
dr
+ r2 θ̇2 = 1 (10.20)
dλ
Truco:
dr dr dθ dr
= = θ̇ (10.21)
dλ dθ dλ dθ
µ ¶2
dr
Entonces (10.20) queda θ̇2 + r2 θ̇2 = 1 , de donde:
dθ
µ ¶2
dr
+ r2 = θ̇−2 (10.22)
dθ
Desenlace: Al colocar la ecuación (10.19) en (10.22) obtenemos:
³ dr ´2 r4
+ r2 = (10.23)
dθ K2
Todavı́a queda la tarea de resolver esta ecuación, asunto que se facilita si la

dr K dr/r2
reescribimos de la manera siguiente: dθ = p = p .
r4 /K 2 − r2 1 − (K/r)2
Entonces, llamando z = K/r:
dz
dθ = − √
1 − z2
Integrar desde z = 1:
Z θ Z z
dz
dθ = − √
θ0 1 1 − z2
θ − θ0 = arc cos(z)
O sea que
r cos(θ − θ0 ) = K (10.24)
261
Esta es la ecuación de la lı́nea recta que está a una distancia K del origen y
que forma un ángulo π/2 + θ0 con el eje x.
Recopilación:
1. En una geometrı́a de n dimensiones hay n ecuaciones diferenciales del

tipo (10.8). Estas ecuaciones tienen dos desventajas: primero, desarrollar-
las puede ser laborioso, porque hay que calcular todos los sı́mbolos de
Christoffel; y, segundo, por ser ecuaciones diferenciales de segundo grado,
ellas pueden ser difı́ciles de resolver o manipular.
2. Además de las n ecuaciones diferenciales del tipo (10.8), tenemos la

ecuación del intervalo (10.13). Esta ecuación del intervalo tiene dos ven-
tajas: primero, ella usualmente hace parte de los datos de un problema y,
segundo, es una ecuación diferencial de primer grado, lo que la hace com-
parativamente fácil de integrar y manipular.
3. Si hay constantes del movimiento, la solución del problema se facili-

ta enormemente, porque además de (10.8) y (10.13) disponemos de las
ecuaciones adicionales (10.15). En estos casos podemos aspirar a que la
solución final, como (10.24), no contenga a la variable λ . En algún mo-
mento del análisis es preciso erradicar al parámetro incómodo λ. En el
ejercicio que acabamos de resolver, pudimos desembarazarnos de dλ uti-
lizando combinadamente: a) la constante del movimiento y, b) el truco
dr/dλ = (dr/dθ)(dθ/dλ). Aquı́ vemos la utilidad de las constantes del
movimiento: usándolas hemos logrado averiguar las lı́neas geodésicas sin
emplear directamente las ecuaciones (10.8) de las geodésicas.
4. Es preciso aclarar que aunque no hemos usado las (10.8) directamente,

sı́ las hemos usado indirectamente, ya que la identificación de las constantes
del movimiento (10.15) se ejecuta a través de la ecuación diferencial de las
geodésicas (10.14). De otro lado, la ecuación diferencial de las geodésicas no
es independiente de la ecuación del intervalo; en efecto, para la construcción
de (10.8) es preciso usar los sı́mbolos de Christoffel, los cuales provienen del
tensor métrico, el cual proviene de la ecuación del intervalo ds2 = gµν dxµ dxν .
5. Se dispone de un conjunto de elementos de información: la ecuación

diferencial de las geodésicas, la ecuación del intervalo, y las constantes del
movimiento. Este conjunto de elementos de información es redundante, por
262
las anotaciones consignadas en el numeral 4.
6. Las geodésicas existen en el espacio antes de que nosotros tracemos sobre

éste algún sistema de coordenadas. Ası́ mismo, las constantes del movimien-
to existen o no existen, independientes del sistema coordenado usado. Otro
asunto es si somos capaces de darnos cuenta de si en cierto espacio hay
constantes del movimiento. Para apreciar esto regresemos al caso feliz re-
cién visto, que es el de un espacio plano bidimensional. Si en vez de (r, θ)
usáramos coordenadas (x, y), el intervalo se escribirı́a ds2 = dx2 + dy 2 y el
tensor métrico no serı́a (10.16) sino:
· ¸
1 0
0 1
Es claro que el nuevo tensor métrico es independiente de x y de y, y por

consiguiente hay dos constantes del movimiento. Cuando se usan coorde-
nadas cartesianas (x, y) nos damos cuenta de que hay dos constantes del
movimiento; cuando usamos coordenadas cilı́ndricas (r, θ) nos damos cuenta
de que hay una constante, pero no nos damos cuenta fácilmente de que hay
una segunda constante del movimiento.
Para que nos demos cuenta de la existencia de alguna constante del movimien-
to se debe escoger un sistema coordenado adecuado. Si en un espacio hay
m constantes del movimiento, existe un sistema coordenado x̄µ en el que el
tensor métrico ḡµν es independiente de m coordenadas. Si el espacio es de
dimensión n entonces, obviamente, m ≤ n. Si m = n, el espacio es plano;
en efecto, en este caso existe un sistema coordenado x̄µ en el que el tensor
métrico ḡµν es independiente de todas las coordenadas; este tensor métrico
es constante ⇒ su tensor de Riemann es cero ⇒ el espacio es plano.
Ejemplo: Averiguar las ecuaciones algebraicas de las geodésicas de la sigu-

iente geometrı́a: ds2 = a2 dθ2 + a2 sen2 θ dϕ2 .
La constante del movimiento: Para la geometrı́a dada el intervalo es pos-

itivo y podemos simplemente escoger el parámetro afı́n λ igual a s. Es decir,
² = 1. La métrica, dada en la ecuación (9.93), es claramente independiente de
dϕ
la variable ϕ. Entonces, de acuerdo con (10.15), la cantidad gϕϕ = gϕϕ ϕ̇
dλ
2 2
= a ϕ̇ sen θ es constante del movimiento. Introducimos una constante κ:
263
1
a ϕ̇ sen2 θ = √ , de donde:
κ
(a ϕ̇)−2 = κ sen4 θ (10.25)
La ecuación del intervalo: Como ² = 1, la ecuación (10.13) es
³ dθ ´2 ³ dϕ ´2
a2 + a2 sen2 θ = 1
dλ dλ
³ dθ ´2
a2 + a2 sen2 θ ϕ̇2 = 1 (10.26)
dλ
Truco:
dθ dθ dϕ dθ
= = ϕ̇ (10.27)
dλ dϕ dλ dϕ
Entonces (10.26) queda ası́:
³ dθ ´2
a2 ϕ̇2 + a2 sen2 θ ϕ̇2 = 1 , de donde:
dϕ
µ ¶2
dθ
+ sen2 θ = (a ϕ̇)−2 (10.28)
dϕ
Desenlace: Al colocar la ecuación (10.25) en (10.28) obtenemos:
dθ p
= ± sen θ κ sen2 θ − 1 . Integrar:
dϕ
Z Z
dθ
± dϕ = √
sen θ κ sen2 θ − 1
Las tablas de integrales [14] traen esta integral para κ > 1:
cos θ
tan(ϕ + ϕ0 ) = ∓ √
κ sen2 θ − 1
No es difı́cil convertir esta fórmula en algo más manejable. Para tal efecto
264
dibujemos esta fórmula en un triángulo rectángulo, de tal manera que uno
de los ángulos agudos sea ϕ + ϕ√0 , el cateto opuesto cos θ, el cateto adyacente
√
κ sen2 θ − 1 y la hipotenusa κ − 1 sen θ. De ese dibujo leemos el seno del
ángulo ϕ + ϕ0 :
cos θ
sen(ϕ + ϕ0 ) = √
κ − 1 sen θ
y expandimos sen(ϕ + ϕ0 ) = sen ϕ0 cos ϕ + cos ϕ0 sen ϕ:
cos θ
sen ϕ0 cos ϕ + cos ϕ0 sen ϕ = √
κ − 1 sen θ
1
sen ϕ0 (a sen θ cos ϕ) + cos ϕ0 (a sen θ sen ϕ) = √ (a cos θ)
κ−1
Hasta el momento las coordenadas (θ, ϕ) son signos abstractos, carentes de

significado. Sin embargo, si pensamos que ellas son coordenadas esféricas,
entonces las tres expresiones entre paréntesis en la última ecuación repre-
sentan las coordenadas cartesianas X, Y y Z de los puntos que pertenecen
a una superficie esférica de radio a:
1
sen ϕ0 X + cos ϕ0 Y = √ Z
κ−1
Esta ecuación es de la forma
AX + B Y + C Z = 0
Aquı́ reconocemos claramente la ecuación de un plano que pasa por el cen-

tro de la esfera, es decir, X, Y y Z son las coordenadas de los puntos que
pertenecen a ese plano; pero como esos puntos también pertenecen a la su-
perficie esférica, ellos configuran la intersección entre el plano y la superficie
esférica. Ahora, esa intersección es un cı́rculo máximo. Conclusión: a través
de dos puntos cualesquiera de la esfera pasa un cı́rculo máximo; este cı́rculo
tiene dos arcos, que son las geodésicas.
265
El problema inverso. Consideremos el siguiente problema para un es-
dy
pacio bidimensional en coordenadas (x, y): dada la pendiente p(x) =
dx
de una geodésica, averiguar una métrica. Para resolver este problema basta
seguir de atrás hacia adelante alguno de los dos ejemplos recién vistos. No
es difı́cil verificar que una solución es:
³ ´
ds2 = a f 2 (x) − f (x) p2 (x) (dx)2 + f (x) (dy)2 , (10.29)
es decir:
 ³ ´ 
a f 2 (x) − f (x) p2 (x) 0
 
gµν =   (10.30)
0 f (x)
Aquı́, a es una constante y f (x) es cualquier función de x. No aspiramos a

encontrar la fórmula general de la métrica que corresponde a la pendiente
p(x) dada. La propuesta (10.30) es particular: una métrica diagonal e in-
dependiente de la coordenada y. En esta métrica, a−1/2 es la constante del
movimiento asociada a la coordenada y. Para probar que (10.30) verdader-
amente soluciona el problema, encontremos las geodésicas de (10.30):
Reescribir la ecuación (10.29): Combinando las ecuaciones (10.13) y (10.29)

escribimos
³ ´ µ ¶2 µ ¶2
2 2 dx dy
a f (x) − f (x) p (x) + f (x) = ² (10.31)
dλ dλ
La constante del movimiento: La métrica (10.30) es claramente independi-

dy
ente de la variable y, entonces, de acuerdo con (10.15), la cantidad gyy
dλ
= gyy ẏ = f (x) ẏ es constante del movimiento. Introducimos una constante
a:
p
f (x) ẏ = ²/a , de donde:
²(ẏ)−2 = a f 2 (10.32)
La ecuación del intervalo: La ecuación (10.31) es
266
³ ´ µ ¶2
2 2 dx
a f (x) − f (x) p (x) + f (x) (ẏ)2 = ² (10.33)
dλ
Truco:
dx dx dy dx
= = ẏ
dλ dy dλ dy
Entonces la ecuación (10.33) queda ası́:
³ ´ µ ¶2
2 2 dx
a f − f p (x) ẏ 2 + f ẏ 2 = ² , de donde:
dy
³ ´ µ ¶2
2 2 dx
a f − f p (x) + f = ²ẏ −2
dy
Desenlace: En el lado derecho de la última ecuación usamos la ecuación

(10.32), para obtener:
³ ´ µ ¶2
2 2 dx
a f − f p (x) + f = af 2 , es decir:
dy
µ ¶2
dx a f2 − f
=³ ´ ,
dy a f 2 − f p2 (x)
µ ¶
dx 2 1
o sea que = 2 , que es la hipótesis inicial de este problema.
dy p (x)
Concluimos entonces que la métrica de la fórmula (10.29) es verdaderamente
una solución.
10.5 Derivada a lo largo de una curva

Apuntábamos en la página 213 que el diferencial d no es una operación co-
variante. Ha llegado el momento de definir otra operación, que denotaremos
con la letra mayúscula D, que sı́ es covariante. Consideremos una curva
cualquiera, no necesariamente geodésica, cuyos puntos están caracterizados
por medio del parámetro escalar Λ (no hemos querido llamarlo λ, porque el
sı́mbolo λ lo reservamos exclusivamente para denotar el parámetro afı́n de
las geodésicas). Supongamos que en la región del espacio donde ella está,
267
también hay un campo vectorial Aµ . Un concepto importante es la rata de
cambio del campo a medida que se recorren los diferentes puntos de la cur-
va. Queremos asignarle a este concepto una cantidad matemática, y como
estamos en el contexto de las transformaciones de coordenadas, deseamos
que tal cantidad sea un tensor bajo el grupo de las transformaciones general-
izadas de coordenadas. Nuestro primer intento serı́a proponer dAµ /dΛ, pero
esta cantidad no es un tensor. Motivados por dAµ /dΛ, pasamos a definir un
tensor que se llama la derivada a lo largo de una curva:
DAµ dxν
= Aµ ; ν (10.34)
DΛ dΛ
Nótese que este es verdaderamente un tensor (un vector), porque es pro-

ducto de los tensores Aµ ; ν , dxν y dΛ . Ahora, Aµ ; ν = Aµ , ν + Γµ αν Aα ,
entonces
DAµ ∂Aµ dxν µ α dx

ν
= + Γ αν A
DΛ ∂xν dΛ dΛ
dAµ dxν
= + Γµ αν Aα (10.35)
dΛ dΛ
En las ecuaciones (10.34) y (10.35), y en lo que sigue, se entiende que xν

son las coordenadas de un punto genérico de la curva. Al vector (10.35) se
le puede tomar de nuevo la derivada a lo largo de la curva:
µ ¶
D2 Aµ D DAµ
=
DΛ2 DΛ DΛ
µ ¶ µ ¶
d DAµ DAσ dxρ
= + Γµ σρ
dΛ DΛ DΛ dΛ
Coloquemos (10.35) en la última ecuación:
D2 Aµ d2 Aµ d Γµ αβ α dxβ µ dAα dxβ µ

2 β
α d x
= + A + Γ αβ + Γ αβ A
DΛ2 dΛ2 dΛ dΛ dΛ dΛ dΛ2
dAσ dxρ dxβ dxρ
+ Γµ σρ + Γµ σρ Γσ αβ Aα
dΛ dΛ dΛ dΛ
268
d2 Aµ µ
ν
α dx dx
β
µ dAα dxβ
= + Γ αβ , ν A + 2Γ αβ
dΛ2 dΛ dΛ dΛ dΛ
d2 xβ β
α dx dx
ρ
+ Γµ αβ Aα + Γ µ
σρ Γ σ
αβ A
dΛ2 dΛ dΛ
Esta expresión vale para cualquier curva. Ahora pensemos que la curva es
una geodésica. Escojamos que Λ sea el parámetro afı́n λ:
D2 Aµ d2 Aµ µ
ν
α dx dx
β
µ dAα dxβ
= + Γ αβ , ν A + 2Γ αβ
Dλ2 dλ2 dλ dλ dλ dλ
(10.36)
d2 xβ β
α dx dx
ρ
+ Γµ αβ Aα + Γµ
σρ Γ σ
αβ A
dλ2 dλ dλ
Como es una geodésica, se cumple la ecuación (10.8):
d2 xβ β dxκ dxλ
= −Γ κλ
dλ2 dλ dλ
y usamos esto en el penúltimo término de la ecuación (10.36):
D2 Aµ d2 Aµ µ
ν
α dx dx
β
µ dAα dxβ
= + Γ αβ , ν A + 2Γ αβ
Dλ2 dλ2 dλ dλ dλ dλ
(10.37)
dxκ dxλ dxβ dxρ
− Γµ αβ Γβ κλ Aα + Γµ σρ Γσ αβ Aα
dλ dλ dλ dλ
10.6 Rαβµν y la curvatura

En esta sección veremos por qué Rαβµν se llama el tensor de curvatu-
ra. Comenzaremos estudiando la rata a la que se separan o acercan dos
geodésicas y de allı́ extraeremos el verdadero significado de la curvatura de
un espacio. Se hará evidente que Rαβµν es el que indica si el espacio es plano
o curvo.
Desviación geodésica. La noción de curvatura se capta fácilmente al

analizar lo que ocurre con dos geodésicas. Es razonable suponer que en un
espacio plano las dos curvas se separan (o se acercan) a ritmo constante.
269
Pero en un espacio curvo el ritmo de separación (o de acercamiento) no es
constante. Para determinar si un espacio es curvo en una región, uno puede
estudiar dos geodésicas y determinar si se juntan (o se separan) “acelerada-
mente”.
Pensemos en dos geodésicas, llamando xµ a los puntos de una de ellas y X µ

a los puntos de la otra. Para ambas geodésicas usamos el mismo parámetro
λ, de modo que las xµ son funciones de λ, ası́: xµ = xµ (λ), y también
X µ = X µ (λ). A continuación definimos las funciones ξ µ (λ) de la manera
siguiente:
ξ µ (λ) = X µ (λ) − xµ (λ) (10.38)
Usemos la fórmula (10.8) para escribir las ecuaciones de las dos geodésicas:
d2 xµ dxα dxβ
+ Γµ αβ (x) = 0 (10.39)
dλ2 dλ dλ
d2 X µ dX α dX β
+ Γµ αβ (X) = 0 (10.40)
dλ2 dλ dλ
Ponemos (10.38) en (10.40):
µ ¶µ ¶
d2 xµ d2 ξ µ dxα dξ α dxβ dξ β
+ + Γµ αβ (x + ξ) + + = 0 (10.41)
dλ2 dλ2 dλ dλ dλ dλ
La cantidad Γµ αβ (x + ξ) se expande en serie de Taylor:
∂ µ
Γµ αβ (x + ξ) = Γµ αβ (x) + Γ αβ (x)ξ σ + · · ·
∂xσ
Ahora suponemos que las dos geodésicas son muy cercanas, de modo que en
la serie de Taylor tomamos únicamente los dos primeros términos:
Γµ αβ (x + ξ) ' Γµ αβ (x) + Γµ αβ , σ (x)ξ σ
Colocamos esto en (10.41) y expandimos conservando términos hasta primer

orden en ξ:
270
d2 xµ d2 ξ µ µ dxα dxβ µ
α
σ dx dx
β
+ + Γ αβ + Γ αβ ,σ ξ
dλ2 dλ2 dλ dλ dλ dλ
(10.42)
µ dξ α dxβ
+ 2Γ αβ = 0
dλ dλ
Ahora restamos, lado a lado, la ecuación (10.42) menos la ecuación (10.39):
d2 ξ µ µ
α
σ dx dx
β
µ dξ α dxβ
= − Γ αβ , σ ξ − 2 Γ αβ (10.43)
dλ2 dλ dλ dλ dλ
D2 ξ µ
Queremos calcular . Para esto colocamos (10.43) en (10.37), tras lo
Dλ2
cual se obtiene:
D2 ξ µ µ µ ω µ ω µ
β
σ dx dx
α
= −(Γ βα , σ − Γ βσ , α + Γ βα Γ ωσ − Γ βσ Γ ωα ) ξ
Dλ2 dλ dλ
En la expresión dentro del paréntesis reconocemos la definición (9.77) del

tensor de Riemann:
D2 ξ µ dxβ dxα
= −Rµ βασ ξ σ ; usar (9.84):
Dλ2 dλ dλ
dxβ dxα
= Rµ βσα ξ σ
dλ dλ
D2 ξ µ dxα dxβ
= Rµ ασβ ξ σ (10.44)
Dλ2 dλ dλ
Anotamos arriba que la curvatura de un espacio se manifiesta en la “acel-

D2 ξ µ
eración” a la que se separan (o se acercan) dos geodésicas. La ecuación
Dλ2
(10.44) dice claramente que la curvatura (la “aceleración”) es una función
del tensor de Riemann Rµ ασβ . En aquellos lugares donde Rµ ασβ = 0 el es-
pacio es plano, y en los lugares donde Rµ ασβ 6= 0 el espacio es curvo. Por
esta razón Rµ ασβ se llama el tensor de curvatura.
271
272
Capı́tulo 11
El principio de equivalencia
La idea central de la teorı́a de la gravitación de Einstein es la siguiente: la

gravitación afecta al tensor métrico gµν . El intervalo entre dos eventos cer-
canos, dado por ds2 = gµν dxµ dxν , depende del tensor métrico, y como éste
depende del campo gravitacional, podemos afirmar que las distancias ds2
dependen del campo gravitatorio. En otras palabras, la presencia del campo
afecta las distancias entre los eventos.
Para captar esta idea pensemos en el espacio que ocupa el sistema solar.
El campo gravitatorio en cada punto de ese espacio, y en cada instante,
está determinado por las trayectorias del Sol, los planetas y todos los otros
objetos del sistema solar. Este campo gravitacional tiene una magnitud que
depende de la constante G de la gravitación universal. Imaginemos ahora
un proceso matemático (no fı́sico) que consiste en “prender” o “apagar” la
gravitación. Apagarla es anular paulatinamente la constante G → 0, y pren-
derla es el proceso opuesto. A medida que el campo se va apagando, gµν se
modifica gradualmente y, cuando G llega al valor 0, el tensor gµν llega al
valor que tiene en el espaciotiempo plano de la relatividad especial. Después
de apagar la gravitación comencemos a prenderla de nuevo: a medida que
G crece el campo se instala en el espaciotiempo, y eso se manifiesta como
una modificación paulatina de los gµν . No olvidemos que el intervalo entre
dos eventos, dado por ds2 = gµν dxµ dxν , depende explı́citamente de gµν , y
en consecuencia ds2 va variando a medida que G se prende o se apaga. Este
ejemplo imaginario aclara la idea importante que queremos establecer: el
campo gravitatorio afecta los intervalos ds2 , es decir, la gravitación se man-
ifiesta como un hecho geométrico.
Una vez captada la idea central, se plantean los dos problemas básicos de la
relatividad general: de qué manera la gravitación afecta las ecuaciones que
273
expresan las leyes fundamentales de la fı́sica y, de otro lado, de qué manera
los astros, las nubes de galaxias, la energı́a en general, determinan al ten-
sor métrico. En este capı́tulo atacamos el primer problema y reservamos el
segundo problema para el próximo capı́tulo.
11.1 El postulado de las geodésicas

La gravitación influye sobre la geometrı́a del espaciotiempo, y esta geometrı́a
influye en los fenómenos fı́sicos. En otras palabras, la gravitación influye en
los fenómenos a través de la geometrı́a del espaciotiempo. La gravitación
se manifiesta en los fenómenos de una manera indirecta: lo que ella hace
es alterar las propiedades geométricas del espacio y el tiempo, y estas al-
teraciones afectan el desarrollo de los fenómenos.
Se dice que una partı́cula está en caı́da libre cuando está sometida única-
mente a la interacción gravitatoria. ¿De qué manera el campo gravitatorio
afecta la trayectoria de una partı́cula en caı́da libre? La respuesta de esta
pregunta se encuentra en el Postulado de las Geodésicas, según el cual las
partı́culas en caı́da libre siguen lı́neas geodésicas en el espaciotiempo.
En la dinámica newtoniana el campo gravitacional afecta la trayectoria de

la partı́cula, y esta influencia se describe mediante la ecuación a = F/m; eso
lo conocemos muy bien: la fuerza gravitacional produce una aceleración en
la partı́cula. Pero la dinámica einsteiniana no utiliza el concepto de fuerza:
el campo gravitatorio afecta al sı́mbolo de Christoffel Γµ αβ y éste1 a su vez
influye en la ecuación de las geodésicas. En vez del concepto newtoniano de
fuerza gravitacional, la teorı́a de Einstein propone que la influencia gravi-
tatoria se expresa geométricamente: eso es “geometrizar” la fuerza gravita-
cional.
Una vez que se acepta el postulado de las geodésicas, hay serias razones
para pensar que el espaciotiempo es probablemente curvo, y que la grav-
itación es la causa de la curvatura. Supongamos que una partı́cula se suelta
desde el piso 14 de un edificio, y que en el mismo instante se suelta otra desde
el piso 15. Llamemos r1 y r2 a las posiciones de las partı́culas en cualquier
instante t. Si suponemos que no hay atmósfera, debemos admitir que están
1
Tomemos por ejemplo el sı́mbolo Γr θθ en coordenadas (ct, r, θ, ϕ). En el espaciotiempo
vacı́o, plano, de la relatividad especial, se tiene Γr θθ = −r. Sin embargo, si hay una masa
M en el origen de coordenadas, se tiene Γr θθ = −r + 2GM/c2 . Véase la sección 13.2.
274
en caı́da libre. Las aceleraciones de las dos partı́culas se pueden averiguar
usando la fı́sica newtoniana, y están dadas por GM/r12 y GM/r22 , o sea
que la aceleración de una respecto a la otra es GM (1/r12 − 1/r22 ) 6= 0: La
aceleración relativa entre las partı́culas en caı́da libre no es cero. Entonces,
de acuerdo con el postulado de las geodésicas, la aceleración relativa entre
las geodésicas no es cero: he aquı́ la desviación geodésica que estudiamos en
la sección 10.6. Vimos en esa sección que la desviación geodésica es el indi-
cador de curvatura, lo que nos lleva a la conclusión final: las dos partı́culas
se mueven en un espaciotiempo curvo. Lo más razonable es pensar que la
Tierra ocasiona esa curvatura. Cualquier proyecto teórico que adopte el pos-
tulado geodésico se compromete con la posibilidad de que el espaciotiempo
sea curvo, y que esta curvatura se debe al campo gravitacional.
11.2 El principio de Galileo

Hemos dicho que un cuerpo está en caı́da libre cuando sobre él actúa única-
mente la fuerza gravitacional. Los planetas, por ejemplo, están en caı́da
libre; ası́ mismo, si la atmósfera no existiera, un cuerpo que se soltara desde
lo alto de un edificio caerı́a libremente. Modernamente entendemos estos
fenómenos a la luz del principio de Galileo, que afirma que todos los cuerpos
en caı́da libre caen de igual manera. En la mecánica newtoniana el principio
de Galileo se organiza al combinar la segunda ley de Newton y la ley de la
gravitación universal, que escribimos a continuación en la forma tradicional:
F = mi a, F = Gmg Mg /r2 (11.1)
Es importante advertir que la masa inercial mi es la que aparece en la

segunda ley de Newton, mientras la masa gravitacional mg figura en la
fuerza gravitacional. Para la caı́da libre igualamos las dos ecuaciones (11.1),
obteniendo:
mg GMg
a= (11.2)
mi r2
El principio de la caı́da de los cuerpos afirma que, para Mg y r dados, la

aceleración a es la misma para todos los cuerpos; en vista de la ecuación
(11.2) podemos afirmar entonces que el cociente mg G/mi es igual para todos
los cuerpos. La constante gravitacional G se define de manera que mg y mi
sean numéricamente iguales:
275
mi = mg
De muchas maneras se puede someter el enunciado mi = mg a la prueba

experimental. La más inmediata es dejar caer objetos de diferentes substan-
cias para ver si en todos los casos se obtiene
p mi =pmg . Otra forma es con
péndulos simples; como el perı́odo es mi /mg 2π L/g, se pueden hacer
pruebas con diferentes materiales (aluminio, vidrio, madera, hielo, etc) para
ver si mi = mg en todos los casos. Con experimentos en los que intervienen
fuerzas ficticias también se puede cuestionar si mi es verdaderamente igual
a mg para objetos de diferente composición quı́mica. Esto fue lo que hizo
Eötvös a fines del siglo XIX, obteniendo |mg /mi −1| < 10−9 , y experimentos
más recientes llegan a |mg /mi − 1| < 10−11 . Conviene recalcar que cuando
se determina que mi = mg para un objeto dado no se logra gran cosa ya
que, como hemos anotado, el valor de la constante gravitacional G se ajusta
precisamente para que eso ocurra. Lo importante es que mi = mg resulte
válido para todo objeto, cualquiera que sea su composición quı́mica.
Pensemos en un conjunto C de partı́culas en caı́da libre que coinciden en

algún evento E, y supongamos adicionalmente que entre ellas no hay inter-
acción ni choques. De acuerdo con el principio de Galileo, en el evento E
todas las partı́culas de C tienen la misma aceleración y en consecuencia la
aceleración relativa entre cualesquiera dos partı́culas de C es cero. Más aún,
si un observador registra que todas las partı́culas de C tienen aceleración
cero respecto a él, entonces ese observador también está en caı́da libre en E.
11.3 Coordenadas geodésicas

El proceso de dos transformaciones sucesivas que vimos en la sección 9.20
tiene un caso especial, y es cuando se desea que el tensor métrico final,
evaluado en E , sea el de Minkowski ηµν :
Corolario: Es posible [13] erigir unas coordenadas tales que en un evento

E: a) la métrica sea ηαβ , y b) todos los sı́mbolos de Christoffel sean cero.
El sistema coordenado en el que se satisfacen las condiciones de este coro-

lario se llama coordenadas geodésicas. Estas coordenadas son expresamente
construidas para el evento E . Por supuesto que las coordenadas geodésicas
abarcan todo el espaciotiempo, pero son construidas deliberadamente para
que en el evento E la métrica tome el valor ηµν y los sı́mbolos de Christoffel
276
se vuelvan cero. El tensor métrico, en cualquier evento del espaciotiempo,
será una matriz 4 × 4 complicada, pero esta matriz se vuelve ηµν en el even-
to E; ası́ mismo, los sı́mbolos de Christoffel, en otros eventos, no son en
general cero, pero se vuelven cero en el evento E. En todo el espaciotiempo
el sistema coordenado geodésico es, en general, curvilı́neo y no ortogonal;
pero en E ocurre algo [15] especial: las coordenadas geodésicas se cruzan
ortogonalmente, formando un sistema de ejes cartesianos.
El corolario pone de manifiesto que la métrica gµν tiene cierto grado de

arbitrariedad. No es muy importante el valor que adopta gµν en un evento
dado (valor que podemos hacer igual a ηµν con una simple transformación de
coordenadas). Tampoco son muy importantes sus primeras derivadas gµν ,α
(que se pueden anular en cualquier punto con una transformación de coorde-
nadas, como vimos al final de la sección 9.16). Lo que sı́ es muy importante es
el conjunto de las segundas derivadas gµν ,α,β , pues es en ellas donde radica
la información acerca de la curvatura. En efecto, ya hemos visto que con las
segundas derivadas de la métrica se construye el tensor de Riemann, que es
el que representa a la curvatura. Decimos entonces, en paralelo con nuestros
comentarios en la página 235, que en un espacio curvo es imposible [16], con
un cambio de coordenadas, volver cero todas las segundas derivadas de la
métrica. Cuando un espacio es curvo, no existe ningún sistema coordena-
do en el que todas las segundas derivadas sean cero. Y si es plano, existen
sistemas coordenados en los que todas las segundas derivadas de la métrica
son cero.
11.4 El principio de equivalencia

Ahora procedemos a combinar las ideas principales de las tres últimas sec-
ciones. Una partı́cula en caı́da libre cumple la ecuación diferencial de las
geodésicas (10.11). Esta ecuación es válida en todos los sistemas coordena-
dos, y ahora nos conviene escribirla utilizando coordenadas geodésicas:
d2 x̄ α α dx̄µ dx̄ν
+ Γ̄ µν = 0
dτ 2 dτ dτ
Supongamos que esta partı́cula pasa por el evento E. Esto significa que
podemos evaluar en E todos los términos de la última ecuación, obteniendo
¯ ¯
d2 x̄ α ¯¯ α dx̄µ dx̄ν ¯¯
+ Γ̄ µν (E) = 0
dτ 2 ¯E dτ dτ ¯E
277
Pero Γ̄αµν (E) = 0, entonces
¯
d2 x̄ α ¯¯
= 0 (11.3)
dτ 2 ¯E
No olvidemos, tal como vimos en la sección 11.3, que en E las coordenadas

geodésicas se cruzan ortogonalmente formando un sistema de ejes carte-
sianos. Esto indica claramente que (11.3) es la ecuación más conocida de la
fı́sica elemental: (11.3) es la ecuación de la trayectoria de una partı́cula en
equilibrio. Vemos ası́ que para un observador que erija un sistema de coorde-
nadas geodésicas centradas en E, las partı́culas en caı́da libre que pasan por
E tienen, respecto a ese sistema de referencia, aceleración cero. Entonces,
invocando la frase escrita en bastardilla en la página 276, podemos afirmar
que ese observador también está en caı́da libre. Digámoslo ası́: un observador
en caı́da libre en E registra que las partı́culas en caı́da libre que pasan por
E tienen, respecto a ese observador, aceleración cero.
Hay dos situaciones diferentes: 1) De un lado, la partı́cula libre en la rel-

atividad especial, estudiada en coordenadas cartesianas. 2) De otro lado,
la partı́cula en caı́da libre estudiada por un observador en caı́da libre que
usa coordenadas geodésicas. Al primer problema le corresponde la ecuación
(6.35) y al segundo la ecuación (11.3). La misma ecuación se aplica a dos
situaciones diferentes. Uno podrı́a pensar que las dos situaciones, aunque
diferentes, son, de alguna manera, equivalentes.
En conclusión, un observador en caı́da libre en E que use coordenadas geodésicas,

registra que las partı́culas en caı́da libre que pasan por E cumplen la mis-
ma ecuación que satisfacı́an las partı́culas libres en ausencia de gravitación,
en la relatividad especial, en coordenadas cartesianas. Pero la ecuación de
partı́cula libre no es la única ecuación diferencial importante en la fı́sica.
También hay otras ecuaciones diferenciales importantes, como por ejem-
plo (6.31), (6.32) y (7.32). En este punto hacemos una suposición crucial:
asumir que la equivalencia recién mencionada se aplica, no sólo a la ecuación
de partı́cula libre, sino además a todas las ecuaciones tensoriales que expre-
san leyes fı́sicas en la relatividad especial en coordenadas cartesianas: para
un observador en caı́da libre en E que use coordenadas geodésicas, las ecua-
ciones que expresan las leyes de la fı́sica son las mismas que se cumplı́an
en ausencia de gravitación, en la relatividad especial, en coordenadas carte-
sianas. Este es el Principio de Equivalencia. Con el propósito de dar un
278
ejemplo de la utilización de este Principio, tomemos las tres ecuaciones ten-
soriales mencionadas (6.31), (6.32) y (7.32); de acuerdo con el Principio de
Equivalencia:
¯ ¯
µν ¯ 4π ¯ν ¯¯
F̄ ,µ ¯ = J ¯
E c E
¡ ¢¯
F̄µν ,α + F̄αµ,ν + F̄να,µ ¯E = 0
¯
¯
T̄ µν,ν ¯ = 0
E
No olvidemos que en coordenadas geodésicas, y en E, los sı́mbolos de Christof-

fel valen cero. Esto implica que en coordenadas geodésicas, y en E, la op-
eración coma (,) coincide con la operación punto y coma (;). O sea que en
las tres últimas ecuaciones podemos escribir (;) en vez de (,):
¯ ¯
µν ¯ 4π ¯ν ¯¯
F̄ ;µ ¯ = J ¯
E c E
¡ ¢¯
F̄µν ;α + F̄αµ;ν + F̄να;µ ¯E = 0
¯
µν ¯
T̄ ;ν ¯ = 0
E
Estas ecuaciones tensoriales están escritas de manera manifiestamente co-

variante; por esta razón, como son válidas en coordenadas geodésicas, tam-
bién han de ser válidas en cualquier otro sistema de coordenadas:
¯
¯ 4π ν ¯¯
F µν ;µ ¯E = J ¯
c E
¡ ¢¯
Fµν ;α + Fαµ;ν + Fνα;µ ¯E = 0
¯
T µν ;ν ¯E = 0
Estas ecuaciones son válidas en el evento E. Pero, como E no es un evento

especial, ecuaciones similares deben cumplirse en cualquier otro evento. En
consecuencia, podemos eliminar el subı́ndice E:
279
4π ν
F µν ;µ = J
c
Fµν ;α + Fαµ;ν + Fνα;µ = 0 (11.4)
T µν ;ν = 0
La regla (,) → (;) El paso de las ecuaciones (6.31)-(6.32)-(7.32) a las

ecuaciones (11.4) se hace cambiando la derivada simple (,) por la derivada
covariante (;). Esta regla, en general, dice que para escribir la ecuación difer-
encial de un campo en presencia del campo gravitatorio se siguen dos pasos:
el primero es escribir la ecuación diferencial tal como se la conoce famil-
iarmente en la relatividad especial, en coordenadas cartesianas; el segundo
paso es cambiar (,) por (;). Esta fórmula se conoce como la regla cambiar
coma por punto y coma. La regla se expresa en palabras tan simples que uno
corre el riesgo de creer, equivocadamente, que el paso de unas ecuaciones
a las otras es simple. En realidad el paso dista de ser simple, como puede
apreciarse en la siguiente observación: En las ecuaciones (6.31)-(6.32)-(7.32)
las coordenadas son cartesianas, no hay campo gravitatorio y las cantidades
xµ , F µν , J µ y T µν son tensores bajo el grupo de las transformaciones de
Lorentz. En cambio, en las ecuaciones (11.4) las coordenadas son generales,
hay campo gravitatorio y las cantidades dxµ , F µν , J µ y T µν son tensores
bajo el grupo de las transformaciones generales de coordenadas. Con es-
ta observación queremos resaltar que (,) → (;) es una regla estrictamente
simbólica, visual.
La ecuación T µν;ν = 0. Veamos en detalle los pasos que conducen de

(7.32) a la última de las ecuaciones (11.4). Ante todo, el tensor T µν de la
ecuación (7.32) representa todas las formas de energı́a-momentum (calorı́fi-
ca, potencial, masas en reposo, etc.) excepto la energı́a-momentum del cam-
po gravitatorio. Esto es claro, porque en la relatividad especial no hay cam-
po gravitacional. Ahora, al usar la regla (,) → (;) se llega a la última de
las ecuaciones (11.4). En esta última ecuación T µν significa lo mismo que
significaba en (7.32): todas las formas de energı́a-momentum, excepto la
energı́a-momentum del campo gravitatorio. Consignemos esta idea en una
frase corta que será importante en la construcción de la ecuación del campo
gravitatorio en el capı́tulo 12: si T µν es el tensor que recoge todas las for-
mas de energı́a-momentum que no son gravitatorias, este tensor cumple la
ecuación T µν;ν = 0 en presencia de un campo gravitacional.
280
11.5 El acople mı́nimo
Vamos a ver el principio de equivalencia desde otra perspectiva [11]. Para
tal efecto nos planteamos el siguiente ejercicio interesante: tomar las ecua-
ciones de la relatividad especial escritas en coordenadas cartesianas y, para
añadir los efectos de la gravitación, sumarles a esas ecuaciones algunos otros
términos que contengan altas derivadas del tensor métrico. Tomemos por
ejemplo la ecuación (6.31) para sumarle términos que contengan primeras,
segundas, terceras,... derivadas de gµν :
4π ν
F µν ,µ = J + [1g] + [2g] + [3g] + · · ·
c
El sı́mbolo [3g] quiere decir “términos que contienen linealmente la tercera

derivada del tensor métrico”. Ahora, los términos [1g] son como el sı́mbolo
de Christoffel, los términos [2g] son como el tensor de Riemann, los [3g] son
como la primera derivada del tensor de Riemann, etc.:
4π ν
F µν ,µ = J + [Christ] + [Riem] + [1Riem] + [2Riem] + · · ·
c
Aquı́, [Christ] representa a los términos que contienen al sı́mbolo de Christof-

fel, [2Riem] representa a los términos que contienen segundas derivadas del
tensor de Riemann, etc. Algunos términos de la forma [Riem] podrı́an ser
Rν αβρ F αβ Aρ , Rνβ βα F αρ Aρ , Rαβ F αβ Aν , RF να Aα , etc. Algunos términos
de la forma [1Riem] podrı́an ser R;δ F να Fα δ , Rαβ ;δ Aα Aβ Aδ Aν , etc. El prin-
cipio de equivalencia afirma que, al incluir los efectos de la gravitación,
los términos [Riem], [1Riem], [2Riem] · ·· no aparecen; dicho de otra man-
era, que esos términos aparecen multiplicados por unos coeficientes que son
cero. Los términos [1Riem], por ejemplo, aparecen del modo 0[1Riem] ; el
factor [1Riem] expresa la posibilidad, la legitimidad matemática de que la
gravitación se acople a los fenómenos fı́sicos a través de la primera derivada
del tensor de Riemann; pero el coeficiente 0 que lo acompaña dice que tal
posibilidad, estrictamente matemática, no se realiza en el mundo fı́sico.
Algunas leyes fı́sicas se expresan mediante ecuaciones diferenciales. El cam-

po gravitatorio no entra en esas ecuaciones diferenciales a través del tensor
de Riemann ni a través de ninguna de las derivadas de Rν αβρ . El acople grav-
itatorio se realiza únicamente a través del sı́mbolo de Christoffel, es decir,
281
a través de la operación punto y coma (;). A esto se le dice el acople mı́ni-
mo: sólamente a través de los sı́mbolos de Christoffel el campo gravitatorio
influye en las ecuaciones tensoriales que expresan a las leyes fı́sicas.
11.6 Ejemplos
Queremos mostrar en ejemplos concretos la manera como aparecen los sı́mbo-
los de Christoffel cuando se trata de incluir la influencia del campo gravitato-
rio. Para tal efecto, en las ecuaciones de Maxwell y las leyes de conservación
(6.31)-(6.32)-(7.13)-(7.32) cambiamos coma por punto y coma:
4π ν
F µν ;µ = J (11.5)
c
Fµν ;α + Fαµ;ν + Fνα;µ = 0 (11.6)
J µ ;µ = 0 (11.7)
T µν ;µ = 0 (11.8)
Estudiemos primero las dos ecuaciones inhomogéneas de Maxwell. Utilizan-

do (9.73) en (11.5) se llega a:
4π ν
F µν ,µ + Γµ αµ F αν + Γν µα F µα = J (11.9)
c
Ahora, Γν µα es simétrico bajo el intercambio µ α, mientras que F µα es

antisimétrico; entonces, de acuerdo con (5.38), el término Γν µα F µα es cero
y la ecuación (11.9) queda ası́:
4π ν
F µν ,µ + Γµ αµ F αν = J
c
Utilizando (9.74) en (11.6) se llega a:
Fµν ,α − Γρ να Fµρ − Γρ µα Fρν + Fαµ,ν − Γρ αν Fρµ − Γρ µν Fαρ

+ Fνα,µ − Γρ νµ Fρα − Γρ αµ Fνρ = 0
282
Esta ecuación se puede reescribir ası́:
Fµν ,α + Fαµ,ν + Fνα,µ − (Γρ µα Fρν + Γρ αµ Fνρ )
− (Γρ να Fµρ + Γρ αν Fρµ ) − (Γρ µν Fαρ + Γρ νµ Fρα ) = 0 ,
es decir:
Fµν ,α + Fαµ,ν + Fνα,µ − (Γρ µα Fρν − Γρ µα Fρν )
− (Γρ να Fµρ − Γρ να Fµρ ) − (Γρ µν Fαρ − Γρ µν Fαρ ) = 0
Obsérvese que en esta ecuación son cero las cantidades contenidas en los
tres paréntesis, lo que nos permite escribir Fµν ,α + Fαµ,ν + Fνα,µ = 0. Hemos
descubierto, curiosamente, que si en la ecuación Fµν ;α + Fαµ;ν + Fνα;µ = 0
se cambia punto y coma por coma, lo que queda es también una ecuación
covariante:
Fµν ;α + Fαµ;ν + Fνα;µ = 0 ⇔ Fµν ,α + Fαµ,ν + Fνα,µ = 0 (11.10)
En otras palabras: la ecuación Fµν ;α + Fαµ;ν + Fνα;µ = 0 no contiene sı́mbo-

los de Christoffel. Ataquemos ahora la tercera ecuación (11.7) con ayuda
de (9.71); se obtiene J µ ,µ + Γµ αµ J α = 0. Finalmente desarrollemos la
ecuación (11.8); utilizamos la fórmula (9.73) y llegamos a T µν,µ + Γµ αµ T αν +
Γν αµ T µα = 0.
En resumen ası́ son las leyes de conservación y las ecuaciones de Maxwell en

presencia de un campo gravitatorio:
J µ ,µ + Γµ αµ J α = 0 (11.11)
T µν,µ + Γµ αµ T αν + Γν αµ T µα = 0 (11.12)
4π ν
F µν ,µ + Γµ αµ F αν = J (11.13)
c
Fµν ,α + Fαµ,ν + Fνα,µ = 0 (11.14)
283
Schwarzschild. Estas cuatro ecuaciones son válidas en general, cualquiera
que sea el campo gravitacional. Conviene desarrollarlas en detalle para un
caso particular. Hay un campo gravitacional muy conocido, que es el causado
por una masa puntual M que no tiene carga eléctrica ni momentum angular.
Este se conoce como la solución de Schwarzschild, y lo estudiaremos en el
capı́tulo 13. Los sı́mbolos de Christoffel de ese campo gravitacional (sección
13.2) son:
s
Γ0 01 = Γ0 10 =
2r(r − s)
s(r − s) s
Γ1 00 = Γ1 11 = −
2r3 2r(r − s)
Γ1 22 = −r + s Γ1 33 = −(r − s) sen2 θ
1
Γ2 33 = − sen θ cos θ Γ2 12 = Γ2 21 =
r
1
Γ3 13 = Γ3 31 = Γ3 23 = Γ3 32 = cot θ
r
En estas expresiones, s = 2GM/c2 es una medida de la masa M , aunque
tiene unidades de longitud. Vemos aquı́, de manera patente, que el campo
gravitacional afecta a los sı́mbolos de Christoffel. Cuando s = 0 se tiene
M = 0, el campo gravitacional se anula y el espaciotiempo se aplana; en
tal caso estos sı́mbolos regresan a la forma que tenı́an en el espaciotiempo
plano en coordenadas esféricas. No olvidemos que estamos con coordenadas
esféricas, o sea que, por ejemplo, T 12 significa T rθ , etc.
Las leyes de conservación. Utilizando los sı́mbolos de Christoffel recién

escritos, las ecuaciones de conservación (11.11) y (11.12) quedan ası́:
2 r
J µ ,µ + J + J θ cot θ = 0
r
2 s 1
T µt,µ + T tr + T tθ cot θ = − 2 T tr
r 2r 1 − s/r
2 rr
T µr,µ +T + T rθ cot θ − r T θθ − rT ϕϕ sen2 θ
r
s ³ 1 ´
= − 2 (1 − s/r) T tt − T rr − sT θθ − sT ϕϕ sen2 θ
2r 1 − s/r
284
4 rθ
T µθ,µ + T + T θθ cot θ − T ϕϕ sen θ cos θ = 0
r
4
T µϕ,µ + T rϕ + 3T θϕ cot θ = 0
r
Estas cinco ecuaciones están escritas de modo sugestivo. Toda dependencia

con s aparece en los lados derechos. Este ejemplo muestra claramente que
el campo gravitatorio influye en algunas de las ecuaciones diferenciales que
expresan a las leyes de conservación. Si M = 0 se tiene s = 0, el campo
gravitacional se anula, los lados derechos de estas ecuaciones se vuelven cero
y las ecuaciones regresan a la forma que tenı́an en el espaciotiempo plano.
Las ecuaciones de Maxwell. Acabamos de comentar que la presencia del

campo gravitatorio no influye en las dos ecuaciones homogéneas de Maxwell,
debido a que en la ecuación (11.14) no hay sı́mbolos de Christoffel. Veamos
ahora las dos ecuaciones inhomogéneas de Maxwell, contenidas en (11.13).
En esta ecuación sı́ hay sı́mbolos de Christoffel y es posible, en principio,
que a través de ellos el campo gravitatorio manifieste su presencia. En el
caso particular de Schwarzschild, utilizamos los sı́mbolos de Christoffel que
escribimos en la página 284. Colocando estos sı́mbolos en las ecuaciones
(11.13) se llega, al final, a un resultado curioso: la variable s desaparece. O
sea que el campo gravitatorio de Schwarzschild tampoco se manifiesta en las
dos ecuaciones inhomogéneas de Maxwell. En conclusión, en el espaciotiempo
de Schwarzschild el campo gravitatorio no se manifiesta en ninguna de las
ecuaciones de Maxwell.
285
286
Capı́tulo 12
La ecuación del campo gravitatorio
La ecuación de Poisson:
∇2 Φ = 4πGρ (12.1)
es la fórmula maestra de la gravitación newtoniana. En el lado izquierdo

aparecen las segundas derivadas del campo gravitatorio Φ, y al lado derecho
aparece la densidad de masa ρ, que es la fuente, la causa del campo. Si las
cantidades que intervienen en esta fórmula fueran tensores bajo el grupo
de las transformaciones generales de coordenadas, tendrı́amos una ecuación
tensorial, y nos sentirı́amos satisfechos. Pero ni ∇2 , ni Φ ni ρ son tensores, y
por eso la fórmula es insatisfactoria. Queremos construir una ecuación ten-
sorial que sea una generalización de (12.1). Más precisamente, una nueva
fórmula en la que todas las cantidades sean tensores y que contenga, como
caso particular, a la ecuación (12.1). Se espera que la nueva fórmula sea la
expresión de una nueva teorı́a gravitacional más amplia que contenga, como
caso lı́mite, a la vieja teorı́a gravitacional de Newton.
Es claro que para generalizar una ecuación no hay un camino único, sino
que se presentan varias posibilidades. En este capı́tulo seguiremos el camino
de Einstein y llegaremos a la célebre ecuación
1 8πG
Rµν − gµν R = 4 Tµν , (12.2)
2 c
donde Rµν es el tensor de Ricci, R es el escalar de curvatura, Tµν el tensor de

energı́a y momentum y G = 6.670 × 10−8 cm3 gr−1 seg−2 es la constante de la
gravitación universal. Veremos que la ecuación (12.2) surge como una gener-
alización natural de (12.1). Einstein construyó esta ecuación en un proceso
287
penoso que le tomó varios años y que concluyó [17, 18, 19, 20] en noviem-
bre de 1915. Curiosamente, Hilbert se adelantó a Einstein y publicó esta
fórmula cinco dı́as antes [21]. Por tal motivo (12.1) se llama la ecuación de
Hilbert-Einstein.
Acabamos de anotar que (12.1) admite varias generalizaciones, o sea que

(12.1) ; (12.2). Para recorrer el camino que conduce de (12.1) a (12.2) va-
mos a proponer algunos argumentos que, aunque no son rigurosos, sı́ son
razonables y convincentes. Es aquı́, en los argumentos convincentes, donde
puede apreciarse el mérito de la propuesta gravitacional de Einstein.
12.1 El lı́mite newtoniano

Si calculamos el valor numérico de Φ/c2 en la superficie del Sol o de la Tierra,
obtenemos Φ/c2 ≈ −10−6 y −10−9 , respectivamente. Esto indica que en el
sistema solar el campo gravitacional es muy débil. Además las velocidades de
los planetas y sus satélites son muy bajas en comparación con c. El régimen
de campo débil y bajas velocidades se llama el lı́mite newtoniano. Es aquı́,
en el lı́mite newtoniano, donde la vieja teorı́a gravitacional es exitosa. En
efecto, la capacidad predictiva y explicativa de esa teorı́a se ha mostrado en
múltiples problemas que atañen al movimiento de los planetas y sus lunas.
La nueva teorı́a gravitacional que nosotros construyamos debe reproducir
los resultados de la vieja teorı́a en aquellos casos que se encuentran dentro
del lı́mite newtoniano.1
12.2 Los 10 potenciales gµν

El campo gravitacional afecta las trayectorias de las partı́culas y afecta la
evolución de los otros campos. En el capı́tulo 11 vimos que la gravitación se
acopla con las trayectorias a través de las geodésicas, y se acopla con los otros
campos a través del sı́mbolo de Christoffel Γα µν . La gravitación podrı́a ser un
asunto geométrico: ella se manifiesta a través de las propiedades geométricas
del espaciotiempo. ¿Cuál de las propiedades geométricas del espaciotiempo
expresa al campo gravitacional? Tenemos a nuestra disposición muchas can-
tidades geométricas: gαβ , det(g), Γµαβ , gαβ,µ , Γµαβ,δ , Rαβµν , Rβµ , R : ¿cuál
de ellas representa al campo gravitacional? De todas las posibilidades es-
cogeremos a gαβ para representar al campo, basados en una secuencia de
1
Advertencia: Hay muchas situaciones interesantes que no están en el lı́mite newtoni-
ano, como por ejemplo el viaje de un pulso de luz. La velocidad de la luz no es baja.
288
ideas, muy laxa, que expondremos enseguida. De acuerdo con la gravitación
newtoniana, la aceleración de una partı́cula en caı́da libre es −∇Φ:
∂Φ
aceleración ∼ (12.3)
∂x
De otro lado, recordemos la hipótesis geodésica que vimos en la sección

11.1: las partı́culas que caen libremente siguen curvas geodésicas, o sea que
cumplen la ecuación (10.11):
d2 x dx dx
2
∼ Γ
dτ dτ dτ
El lado izquierdo de esta fórmula es como aceleración, entonces:
aceleración ∼ Γ
Recordemos, de acuerdo con la definición (9.57), que Γ es como las derivadas

de gµν . O sea que la última fórmula es
∂gµν
aceleración ∼ (12.4)
∂x
Finalmente conectamos los lados derechos de (12.3) y (12.4) para escribir

∂gµν ∂Φ
∼ , es decir,
∂x ∂x
gµν ∼ Φ
Esta fórmula asocia el campo gravitacional newtoniano, que es Φ, con el

tensor métrico: de esta manera se justifica la propuesta de escoger al tensor
métrico gµν como el campo gravitacional en la teorı́a que queremos construir.
La teorı́a que buscamos debe coincidir con la vieja teorı́a gravitacional en el
lı́mite newtoniano y por eso esperamos que, en ese lı́mite, gµν coincida con
Φ. Pero gµν tiene diez componentes independientes: ¿cuál de las diez es la
que coincide con Φ?
289
12.3 El potencial g00 en coordenadas cartesianas
Para responder esta pregunta regresemos al estudio de una partı́cula en
caı́da libre en coordenadas cartesianas xµ = (ct, x, y, z). La ecuación (5.54)
muestra que la componente U 0 es mucho mayor que las otras tres U a , o
sea que dxa /dτ es despreciable en comparación con dx0 /dτ , y la ecuación
(10.11) se convierte en
d2 xα dx0 dx0
≈ −Γα00
dτ 2 dτ dτ
µ ¶2
2 α dt
= −c Γ 00 (12.5)
dτ
Para desarrollar esta ecuación debemos calcular el sı́mbolo de Christoffel

Γα00 . De acuerdo con la definición (9.57):
1
Γα00 = g ασ (gσ0,0 + g0σ,0 − g00,σ )
2
En este momento suponemos, para simplificar el problema, que el campo es

estático, o sea que todas las derivadas temporales son cero: gσ0,0 = g0σ,0 =
0. En la última ecuación sólo sobreviven las derivadas espaciales g00,b :
1
Γα00 = − g αb g00,b (12.6)
2
Si el campo es débil podemos escribir
gαβ = ηαβ + hαβ , (12.7)
donde ηαβ es la métrica de Minkowski (5.2) y hαβ es una matriz 4 × 4 en

la que todas sus componentes son muy pequeñas: |hαβ | ¿ 1. La ecuación
1 1
(12.6) es entonces Γα00 = − (η αb +hαb )(η00,b +h00,b ) = − (η αb +hαb )h00,b =
2 2
1 αb
− η h00,b + términos de orden 2, que despreciaremos. La ecuación (12.5)
2
queda aproximadamente
290
µ ¶2
d2 xα c2 αb dt
= η h00,b
dτ 2 2 dτ
Escribamos esta ecuación para α = 0 y para α = a:
d2 t
= 0
dτ 2
µ ¶2
d2 r c2 dt
2
= − ∇h00 (12.8)
dτ 2 dτ
La primera de estas ecuaciones dice que
dt
= constante (12.9)
dτ
Dejemos esto allı́ un momento, mientras nos concentramos en la derivada

d/dτ . La regla de la derivación en cadena dice que d/dτ = (dt/dτ )(d/dt) ,
de donde
d2 d d dt d dt d
2
= = ,
dτ dτ dτ dτ dt dτ dt
y usando (12.9):
µ ¶2
d2 dt d2
=
dτ 2 dτ dt2
Utilizamos esto en el lado izquierdo de (12.8) para escribir
d2 r c2
= − ∇h00
dt2 2
De otro lado, la gravitación newtoniana dice que
d2 r
= −∇Φ,
dt2
Igualemos ahora los lados derechos de las dos últimas ecuaciones:
291
2
∇h00 = ∇Φ
c2
2Φ
h00 = + constante
c2
La constante de integración que aparece en el lado derecho de esta ecuación

se puede averiguar en cualquier punto del espacio. Escojamos un punto
donde Φ sea cero. En ese punto la métrica gµν es igual a ηµν , y en consecuen-
cia hµν es cero. Colocando estos valores en la última ecuación descubrimos
que la constante es cero, o sea que:
2Φ
h00 = (12.10)
c2
2Φ
g00 = 1 + en el lı́mite newtoniano (12.11)
c2
Aprendemos ası́ que de los diez potenciales relativistas hay uno, g00 , que
está conectado al potencial newtoniano Φ de acuerdo con la última ecuación.
El análisis recién hecho establece qué es g00 , pero no da información acerca
de los otros nueve potenciales.
12.4 La ecuación de Hilbert-Einstein

Ha llegado el momento de construir una ecuación tensorial de fuentes para el
campo gravitatorio gµν . Con este propósito, vamos a apoyarnos en el ejemplo
que nos dan las dos grandes ecuaciones de fuentes de la fı́sica clásica, que son
(12.1) y (6.19). Estas dos ecuaciones tienen varios aspectos en común: al lado
derecho aparece la fuente del campo y al lado izquierdo aparecen derivadas
del campo. Demos el primer paso diciendo que buscamos una ecuación de la
forma:
Alguna función de las derivadas de gµν es ∼ ρ (12.12)
Ahora, ρc2 no es un tensor, sino solamente la componente T00 de algún

tensor Tµν de energı́a-momentum. Por el momento no tenemos una idea
clara de qué es este tensor: no estamos seguros de si Tµν contiene o excluye
los aportes del campo gravitatorio. Como queremos una ecuación tensorial
escribimos Tµν en vez de ρ en el lado derecho de (12.12). Entonces el lado
izquierdo también tiene que ser un tensor de rango 2:
292
Algún tensor de rango 2 que es derivadas de gµν es ∼ Tµν (12.13)
Las dos ecuaciones clásicas que sirven de modelo, (12.1) y (6.19), tienen
en el lado izquierdo derivadas del campo. Estas derivadas no son de grado
superior a 2, y las derivadas de grado 2 aparecen linealmente. Para seguir
el ejemplo queremos proponer ahora una ecuación de ese estilo, o sea que
en el lado izquierdo de (12.13) queremos escribir algún tensor de rango 2
con las siguientes propiedades: 1) puede tener gµν y gµν,α 2) debe tener
segundas derivadas gµν,α,β y 3) las segundas derivadas gµν,α,β deben aparecer
linealmente. Acudimos a los enunciados (9.109) y (9.110) para afirmar que
la forma más general del lado izquierdo de (12.13) es una combinación lineal
de Rµν , R y gµν :
aRµν + b0 gµν R + Λ0 gµν = κ0 Tµν ,
donde a, b0 , Λ0 y κ0 son constantes. Dividiendo ambos lados por a llegamos

a:
Rµν + bgµν R + Λgµν = κTµν , (12.14)
donde b, Λ y κ son constantes que debemos determinar. Subiendo ı́ndices en

la última ecuación se obtiene:
Rµν + bg µν R + Λg µν = κTµν (12.15)
Averiguar la constante b y precisar qué es Tµν : Si se toma la diver-

gencia covariante (punto y coma) en ambos lados de la última ecuación se
llega a:
Rµν; ν + bg µν R; ν + bg µν; ν R + Λg µν; ν = κTµν; ν
En el lado izquierdo los dos últimos términos son cero debido a la identidad
(9.79). Queda:
Rµν; ν + bg µν R; ν = κTµν; ν
Hasta el momento no hemos tenido necesidad de precisar qué es Tµν . De
293
otro lado, la constante b está todavı́a sin determinar. Resolveremos estas
dos ambigüedades con un solo movimiento. Digamos que Tµν reúne todas
las formas de energı́a-momentum que no son gravitatorias; la frase escrita
en bastardilla en la página 280 afirma que Tµν; ν = 0, de modo que la última
ecuación es:
Rµν; ν + bg µν R; ν = 0
y al comparar esto con la identidad de Bianchi (9.104) descubrimos que

b = −1/2 . La ecuación (12.14) queda ası́:
1
Rµν − gµν R + Λgµν = κTµν (12.16)
2
Hemos escrito T µν en vez de Tµν para seguir nuestra notación habitual.

Quede claro que el T µν que aparece en la ecuación (12.16) recoge todas las
formas de energı́a-momentum, excepto la contribución del campo gravita-
torio. Por supuesto que el campo gravitatorio tiene energı́a y momentum,
pero éstos no hacen parte del T µν de la ecuación (12.16).
La constante Λ: La propuesta inicial [20] de Einstein fue con Λ = 0:
1
Rµν − gµν R = κTµν (12.17)
2
En esta ecuación podemos subir el ı́ndice µ para obtener Rµν − 21 g µν R =

κT µν . Si además hacemos ν = µ escribimos Rµµ − 12 g µµ R = κT µµ . La traza
Rµµ es el escalar de curvatura R, y la traza g µµ es igual a 4. Queda entonces
R − 2R = κT µµ :
R = −κT µµ (12.18)
Con este resultado la ecuación (12.17) deviene
µ ¶
1 α
Rµν = κ Tµν − gµν T α (12.19)
2
En particular, la componente R00 es
294
µ ¶
1
R00 = κ T00 − g00 T αα (12.20)
2
La constante κ: Nos queda por determinar la constante κ, y para hacerlo

queremos obligar a la gravitación einsteiniana a que contenga a la newto-
niana. En particular, haremos que la nueva teorı́a coincida con la vieja en
el lı́mite newtoniano. Para ejecutar este proyecto obligaremos a la ecuación
(12.20) a que coincida con (12.1) cuando el campo es débil y las velocidades
son bajas: al establecer esta coincidencia quedará determinado el valor de la
incógnita κ.
De acuerdo con la ecuación (12.7), las derivadas de gαβ son iguales a las
derivadas de hαβ , y en vista del enunciado (9.59) podemos afirmar que Γ es
como las derivadas de hµν . En consecuencia los productos Γ Γ son de orden
2 en potencias de hµν y, suponiendo que este campo hµν es débil, podremos
despreciar los productos Γ Γ en el lado derecho de la definición (9.77):
Rλµνσ ≈ Γλµν,σ − Γλµσ,ν
El tensor de Ricci Rµν = Rλµνλ es, entonces,
Rµν ≈ Γλµν,λ − Γλµλ,ν
En el lado derecho usamos la definición (9.57) para escribir
1 h λρ i 1 h λρ i
Rµν = g (gρµ,ν + gνρ,µ − gµν,ρ ) − g (gρµ,λ + gλρ,µ − gµλ,ρ )
2 ,λ 2 ,ν
Usamos la fórmula (12.7) y despreciamos términos cuadráticos en hµν ; de

esta manera se llega a
1 h λρ i 1 h λρ i
Rµν = η (hρµ,ν + hνρ,µ − hµν,ρ ) − η (hρµ,λ + hλρ,µ − hµλ,ρ )
2 ,λ 2 ,ν
1 λρ
= η [hνρ,µ,λ − hµν,ρ,λ − hλρ,µ,ν + hµλ,ρ,ν ]
2
Concentrarse en la componente R00 :
295
1 λρ
R00 = η [h0ρ,0,λ − h00,ρ,λ − hλρ,0,0 + h0λ,ρ,0 ]
2
Si el campo es estático las derivadas respecto a x0 son cero (recuérdese que

en coordenadas cartesianas x0 = ct) y queda
1
R00 = − η λρ h00,ρ,λ
2
De nuevo, las derivadas respecto a x0 son cero, o sea que en el lado derecho de
esta ecuación sobreviven únicamente los ı́ndices latinos, y podemos escribir
1 1
R00 = − η ab h00,a,b , es decir R00 = ∇2 h00 , y en vista de (12.10) llegamos
2 2
finalmente a
1 2
R00 = ∇ Φ (12.21)
c2
Este es el lado izquierdo de (12.20). Ahora transformemos el lado derecho

de (12.20) que es:
µ ¶
1
κ g0µ g0ν T µν − g00 gαβ T αβ (12.22)
2
La ecuación (5.58) dice que, a bajas velocidades, p0 À pa . Entonces, de

acuerdo con (7.16), podemos afirmar que T 00 À T a0 y T 00 À T ab . Bajo
estas condiciones la expresión (12.22) es, aproximadamente,
µ ¶
1 1
κ (g00 )2 T 00 − (g00 )2 T 00 = κ(g00 )2 T 00 (12.23)
2 2
De otro lado, apuntamos en la página 166 que T 00 es la densidad de energı́a

ρc2 , entonces (12.23) es
1
κρc2 (g00 )2 (12.24)
2
Ya podemos igualar las expresiones (12.21) y (12.24):
1 2 1
2
∇ Φ = κρc2 (g00 )2
c 2
296
2Φ
De nuevo, para campo débil la ecuación (12.11) da g00 = 1 + ≈ 1:
c2
1
∇2 Φ = κρc4 ,
2
y comparando con (12.1) descubrimos que κ = 8πG/c4 . La ecuación (12.17)

queda finalmente ası́:
1 8πG
Rµν − gµν R = 4 Tµν (12.25)
2 c
Esta es la ecuación de Hilbert-Einstein que querı́amos construir. De otro

lado, la ecuación (12.18) se convierte en
8πG α
R = − T α (12.26)
c4
Al poner esto en la ecuación (12.25) llegamos a

µ ¶
8πG α β 1 αβ
Rµν = 4 gµ gν − gµν g Tαβ
c 2
Obsérvese que
Tαβ = 0 ⇒ Rµν = 0 (12.27)
Ya hemos dicho que Tαβ recoge todas las formas de momentum y energı́a
diferentes a las producidas por el campo gravitatorio. Las ecuaciones Tαβ = 0
y Tαβ 6= 0, no dicen nada acerca de la energı́a-momentum del campo grav-
itatorio. Lo que sı́ podemos afirmar es que si en algún evento se cumple
Tαβ = 0, cualquier energı́a-momentum que en ese evento haya proviene, sin
duda, del campo gravitacional.
Supongamos por ejemplo que el único objeto del universo es un astro de

radio a. En la región r < a los tensores Tαβ y Rµν son, en general, diferentes
de cero. Ahora estudiemos lo que ocurre en la región r > a: 1) Si el planeta
tiene cargas o corrientes eléctricas se genera un campo electromagnético y,
297
por consiguiente, hay un Tαβ 6= 0: el tensor Rµν no es, en general, cero. 2) Si
el planeta no es fuente de campo electromagnético se cumple que Tαβ = 0 y
en consecuencia Rµν = 0 .
Debemos hacer un comentario acerca de T µν . Nótese que el lado izquier-

do de la ecuación (12.25) es simétrico bajo el intercambio de los ı́ndices µ y
ν, lo que quiere decir que Tµν también tiene que ser simétrico (Tµν tiene que
ser igual a Tνµ ). Si Tµν no es simétrico, la ecuación de Hilbert-Einstein es
inconsistente. Al enfrentar cualquier problema particular, debemos revisar
juiciosamente que el tensor de energı́a-momentum que estamos usando sea
verdaderamente simétrico. Por ejemplo, el tensor de la ecuación (8.52) es
asimétrico, y por eso no se puede usar en la ecuación de Hilbert-Einstein.
Pero el tensor de la ecuación (8.59) sı́ es simétrico, y en consecuencia es
lı́cito usarlo en la ecuación (12.25).
12.5 Las coordenadas

Antes de concluir este capı́tulo es conveniente que nos detengamos para es-
tablecer algunas nociones generales acerca de las soluciones de la ecuación
del campo gravitatorio (12.25). Cuando se trata de resolver esta ecuación en
un problema particular, es necesario escoger las coordenadas xµ que mejor
se ajustan a las condiciones particulares del problema. En principio, la es-
cogencia de las cuatro coordenadas es bastante libre y puede ser, incluso,
caprichosa, como la que propone Ohanian [13]: Para las coordenadas es-
paciales de un punto P se utilizan los rayos de luz de tres estrellas fijas
(amarilla, azul y roja) no colineales, como muestra la Figura 12.1; se adop-
tan como coordenadas espaciales los tres ángulos que se forman entre los
tres rayos que convergen en P . La coordenada temporal se establece con
otra estrella (blanca) móvil; se adopta como coordenada temporal el ángulo
formado en P por los rayos rojo y blanco. A la coordenada x0 no se le dice
tiempo sino, en general, coordenada temporal; esto es entendible, ya que x0
no viene necesariamente en segundos, sino que puede estar dada en metros,
en radianes, etc.
Tiempo universal y campo constante. Si, en un espaciotiempo dado,

es posible escoger un sistema coordenado xµ tal que todas las componentes
gµν sean2 independientes de la coordenada temporal x0 , entonces x0 se lla-
2
En tal caso x0 es una coordenada cı́clica, y se le asocia una constante del movimiento
en las curvas geodésicas (véase la sección 10.3).
298
ma tiempo universal. En tal caso, decimos que el campo gravitatorio es
estacionario (también se le dice constante). El tiempo universal es una co-
ordenada cı́clica, y en consecuencia las curvas geodésicas tienen, asociada
a x0 , una constante del movimiento. Lo del tiempo universal y el campo
constante es sólo de interés académico porque, estrictamente, debemos ad-
mitir [22] que sólo puede ser constante el campo producido por un cuerpo;
en efecto, cuando hay varios cuerpos las atracciones mutuas producen unas
aceleraciones que hacen que el campo cambie con el transcurso del tiempo.
La inversión del tiempo universal. Separemos los ı́ndices latinos en la

fórmula del intervalo (9.1):
(ds)2 = g00 dx0 dx0 + gab dxa dxb + ga0 dxa dx0 + g0a dx0 dxa (12.28)
Supongamos que x0 es un tiempo universal. La operación x0 → −x0 modifica

ası́ al intervalo:
(ds)2 → g00 dx0 dx0 + gab dxa dxb − ga0 dxa dx0 − g0a dx0 dxa (12.29)
Al comparar (12.28) y (12.29) nos damos cuenta de que, en general, (ds)2 9

(ds)2 . En palabras, el intervalo es, en general, sensible a la inversión del
tiempo universal x0 → −x0 . Pero si ga0 = g0a = 0 en la ecuación (12.29),
llegamos a (ds)2 → (ds)2 .
Campo estático. Los campos estáticos son un subconjunto de los esta-

cionarios. Si, además de que los gµν sean independientes de la coordenada
temporal, se cumple que ga0 = g0b = 0, decimos que el campo no sólo es
estacionario sino además estático. En los campos estáticos el intervalo es
insensible a la inversión del tiempo universal: (ds)2 → (ds)2 .
La diferencia entre estacionario y estático se aprecia fácilmente con un ejem-

plo. El campo producido por una estrella que no gira es estático. Si la estrella
gira alrededor de su eje, el campo es estacionario, pero no estático. En efecto,
la operación x0 → −x0 no ha de afectar el campo de una estrella quieta. Pero
si la estrella rota con velocidad angular ω , la inversión del tiempo universal
trae como consecuencia ω → − ω , y ésto a su vez debe afectar al campo
producido por la estrella. Modernamente, la distinción estacionario-estático
299
es importante en el problema de la masa puntual: si la masa rota, el campo
es estacionario (solución de Kerr); y si no rota, el campo es estático (solución
de Schwarzschild).
lla
ari
am azul
roja
Figura 12.1 Las coordenadas

de Ohanian. Las coordenadas es-
paciales de un punto P son los
tres ángulos que forman en P las
luces que provienen de tres es-
trellas (amarilla, azul y roja). La
coordenada temporal es el ángu-
lo formado en P por los rayos de
la estrella roja y de una cuarta
estrella móvil.
300
Capı́tulo 13
La solución de Schwarzschild
El problema más simple de la fı́sica clásica es el del universo vacı́o. El prob-

lema que le sigue es el estudio de los efectos causados por la presencia de
una partı́cula puntual. La gravitación newtoniana resolvió este problema con
gran éxito: trescientos años de astronomı́a han confirmado la bondad de la
solución de Newton. Más tarde, en la década de 1920, la mecánica cuántica
naciente habrı́a de resolver de nuevo este problema que se conoce bajo el
nombre de átomo de hidrógeno. El caso de la partı́cula puntual fue el prob-
lema escuela de la fı́sica newtoniana y de la mecánica cuántica. También en
la gravitación Einstein atacó el problema de la masa puntual. Y ası́ como
ocurrió con la versión newtoniana y con la versión cuántica, este viejo prob-
lema fue la escuela de la relatividad general, entrenó a los cientı́ficos en las
sutilezas de la teorı́a y les exigió métodos de cálculo especiales.
Einstein resolvió este problema en 1915, aunque no en forma exacta, sino

aproximada; en esa solución aproximada logró explicar la precesión del per-
ihelio de Mercurio y pudo predecir la desviación de un rayo de luz al pasar
cerca del Sol. Schwarzschild [23] resolvió exactamente el problema de la masa
puntual en diciembre de 1915, unas pocas semanas después de que Einstein
y Hilbert encontraran la ecuación (12.25) de los campos gravitacionales1 .
13.1 Campo isótropo estático

Nos proponemos averiguar la forma más general que puede tener un campo
gravitatorio isótropo estático. Con ese propósito vamos a desarrollar sucesi-
1
Schwarzschild, profesor de la universidad de Gotinga, resolvió el problema mientras
prestaba sus servicios como soldado en el frente oriental. Murió cinco meses después, a los
42 años de edad, por la infección de una herida.
301
vamente los casos isótropo, estacionario y estático.
Campo isótropo. En este caso el intervalo ds2 debe ser un escalar bajo
el grupo de las rotaciones en el espacio tridimensional. Para proponer o
construir un ds2 debemos acudir a cantidades escalares. ¿Cuáles son las
cantidades escalares disponibles? Con la coordenada temporal ct se producen
dos escalares, que son t y dt. De otro lado, con dos vectores A y B se consigue
una cantidad escalar mediante el producto punto A · B. Debemos encontrar
vectores para ejecutar el producto punto. Disponemos únicamente de los
vectores r y dr, y los productos punto entre ellos son r · r, r · dr y dr · dr.
En conclusión, el intervalo isótropo más general se construye con t, dt, r · r,
r · dr y dr · dr :
ds2 = {r · r, t}(dt)2 + {r · r, t}r · drdt + {r · r, t}(r · dr)2 + {r · r, t}dr · dr
En esta fórmula la escritura {r · r, t} es una manera corta de decir “alguna

función de r · r y de t ”. No se nos escapa que esta notación es ambigua
porque podrı́a sugerir, equivocadamente, que las cuatro funciones {r · r, t}
que aparecen en la fórmula son iguales. Debemos entender que las cuatro
funciones {r · r, t} son, en principio, diferentes.
Campo isótropo estacionario. Sabemos por la sección 12.5 que para

campos estacionarios las componentes gµν del tensor métrico son indepen-
dientes del tiempo universal, o sea que el intervalo ds2 se simplifica:
ds2 = {r · r}(dt)2 + {r · r}r · drdt + {r · r}(r · dr)2 + {r · r}dr · dr
Campo isótropo estático. Utilizando de nuevo la sección 12.5 debemos

imponer la condición de que las entradas g0a del tensor métrico sean cero.
Queda:
ds2 = {r · r}(dt)2 + {r · r}(r · dr)2 + {r · r}dr · dr
En coordenadas esféricas r = r 1̂r , dr = dr 1̂r + rdθ 1̂θ + r sen θdϕ 1̂ϕ . Los
productos escalares son:
r · r = r2
302
r · dr = rdr
³ ´
dr · dr = (dr)2 + r2 (dθ)2 + sen2 θ(dϕ)2
Con estas expresiones regresamos a ds2 :
³ ´
ds2 = {r}dt2 + {r}dr2 + {r} dr2 + r2 (dθ2 + sen2 θdϕ2 )
= {r}dt2 + {r}dr2 + {r}r2 (dθ2 + sen2 θdϕ2 )
Pongamos nombres a las tres funciones {r}:
ds2 = D(r)dt2 − E(r)dr2 − F (r)r2 (dθ2 + sen2 θdϕ2 )
Ahora hacemos una transformación de coordenadas (ct, r, θ, ϕ) → (ct, ρ, θ, ϕ),

donde la nueva coordenada ρ está definida por medio de la ecuación ρ2 ≡
F (r)r2 :
ds2 = A(ρ)c2 dt2 − B(ρ)dρ2 − ρ2 (dθ2 + sen2 θdϕ2 ) (13.1)
Este intervalo corresponde al tensor métrico:
 
A(ρ) 0 0 0
 
 0 −B(ρ) 0 0 
 
gµν =


 (13.2)
 0 0 −ρ2 0 
 
0 0 0 −ρ2 sen2 θ
Esta es la métrica del problema más general de campo estático isótropo. El

tensor de Ricci tiene sólo cuatro componentes no nulas:
1 ³ 00 02 0 0 0
´
R00 = − 2ρABA − ρBA − ρAA B + 4ABA
4ρAB 2
1 ³ 00 02 0 0 2 0
´
R11 = 2ρABA − ρBA − ρAA B − 4A B
4ρA2 B
303
1 ³ 0 0 2
´
R22 = − − ρBA + ρAB + 2AB − 2AB
2AB 2
R33 = sen2 θR22
Aquı́ la prima (0 ) quiere decir derivada respecto a ρ. A partir de este momen-

to supondremos que la distribución de momentum y energı́a Tµν está concen-
trada en una región finita del espacio: estamos pensando en una estrella, un
planeta, una bola de polvo, etc. Esta distribución de momentum y energı́a
tiene cierto radio. Vamos a estudiar únicamente la región exterior. Si esta
bola de polvo o estrella no es fuente de campo electromagnético podemos
afirmar, de acuerdo con la discusión de la página 298, que los tensores Tµν
y Rµν son cero. Al imponer las ecuaciones R00 = 0, R11 = 0 y R22 = 0 se
obtiene:
2ρABA00 − ρBA02 − ρAA0 B 0 = −4ABA0 (13.3)
2ρABA00 − ρBA02 − ρAA0 B 0 = 4A2 B 0 (13.4)
−ρBA0 + ρAB 0 + 2AB 2 − 2AB = 0 (13.5)
Obsérvese que los lados izquierdos de (13.3) y (13.4) son iguales; entonces
los lados derechos también tienen que ser iguales: −4ABA0 = 4A2 B 0 , o sea
que AB 0 + BA0 = 0, es decir (AB)0 = 0. Esto significa que:
A(ρ)B(ρ) = una constante (13.6)
Para averiguar el valor de esta constante recordamos que a grandes distancias

la métrica (13.2) debe coincidir con (9.45). Pues bien, al comparar (13.2) con
(9.45) vemos que, a grandes distancias, las funciones A(ρ) y B(ρ) tienden al
valor 1, y por consiguiente la constante de la ecuación (13.6) es 1:
A(ρ)B(ρ) = 1
1
B(ρ) = (13.7)
A(ρ)
Al colocar este resultado en la ecuación (13.5) se obtiene ρA0 + A = 1, es

decir
304
d
(ρA) = 1
dρ
La solución de esta ecuación es
k
A=1+ (13.8)
ρ
donde k es una constante cuyo valor debemos averiguar. Para hacerlo es-
tudiemos la situación a distancias grandes, donde esperamos que se logre el
lı́mite newtoniano. El potencial newtoniano es Φ = −GM/r y la ecuación
(12.11) dice que
2GM
A ' 1−
c2 r
k 2GM
Al comparar con (13.8) vemos que = − 2 . Esto significa que ρ es
ρ c r
proporcional a r. Lo más sencillo es escoger ρ igual a r. Con esta elección la
2GM
constante k queda determinada: k = − 2 . Las ecuaciones (13.8) y (13.7)
c
dan finalmente
1 2GM
A = = 1− 2
B c r
El intervalo (13.1) y la métrica (13.2) son:
µ ¶ µ ¶
2 2GM 2 2 2GM −1 2 2 2
ds = 1 − 2 c dt − 1 − 2 dr −r (dθ +sen2 θdϕ2 ) (13.9)
c r c r
 2GM 
1− 0 0 0
 c2 r 
 
 µ ¶ 
 
 2GM −1 
 0 − 1− 2 0 0 
gµν =
 c r 
 (13.10)
 
 
 0 0 −r2 0 
 
 
0 0 0 −r2 sen2 θ
305
Esta es la solución en la región “de afuera”, en el exterior de la distribución
esférica de energı́a y momentum. De ahora en adelante nos concentraremos
en lo que se llama el problema de Schwarzschild: cuando toda la energı́a-
momentum representada por Tµν se acumula en un punto, que es el origen de
coordenadas. En tal caso la métrica (13.10) será válida en todos los puntos
del universo, excepto en r = 0 . Ya que la cantidad 2GM/c2 aparece fre-
cuentemente, conviene darle un nombre; se llama el radio de Schwarzschild :
2GM
s ≡ (13.11)
c2
ds2 = (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 − r2 (dθ2 + sen2 θ dϕ2 ) (13.12)
 
1 − s/r 0 0 0
 
 
 
 0 − (1 − s/r)−1 0 0 
 
gµν =


 (13.13)
 
 0 0 −r2 0 
 
 
0 0 0 −r2 sen2 θ
La inversa de esta matriz es

 
(1 − s/r)−1 0 0 0
 
 
 
 0 −(1 − s/r) 0 0 
 
g µν
=


 (13.14)
 0 0 −r−2 0 
 
 
 
0 0 0 −(r sen θ)−2
Para s = M = 0 se recupera el tensor métrico (9.45) del espacio plano. Antes

de cerrar esta sección anotemos que, como la constante de la gravitación G
es muy baja, s = 2GM/c2 toma valores sorprendentemente pequeños. En
efecto, cuando M es la masa del Sol se obtiene s ' 3 km., y cuando M es
la masa de la Tierra se obtiene s ' 9 mm.
306
13.2 La geometrı́a del espaciotiempo
Con la métrica (13.13) procedemos a calcular los sı́mbolos de Christoffel
y las componentes contravariantes del tensor de Riemann. Resulta que las
cantidades no nulas son
s
Γ0 01 = Γ0 10 =
2r(r − s)
s(r − s) s
Γ1 00 = Γ1 11 = −
2r3 2r(r − s)
Γ1 22 = −r + s Γ1 33 = −(r − s) sen2 θ
1
Γ2 33 = − sen θ cos θ Γ2 12 = Γ2 21 =
r
1
Γ3 13 = Γ3 31 = Γ3 23 = Γ3 32 = cot θ
r
s
R0101 = R1010 = −R1001 = −R0110 =
r3
s
R0202 = R2020 = −R2002 = −R0220 = −
2r4 (r
− s)
s
R0303 = R3030 = −R3003 = −R0330 = − 4
2r (r − s) sen2 θ
s(r − s)
R1212 = R2121 = −R2112 = −R1221 =
2r6
s(r − s)
R1313 = R3131 = −R3113 = −R1331 =
2r6 sen2 θ
s
R2323 = R3232 = −R3223 = −R2332 = − 7
r sen2 θ
Todas las componentes del tensor de Ricci son cero, de acuerdo con (12.27),
y por consiguiente el escalar de curvatura también es cero. El espaciotiempo
es obviamente curvo, porque algunas componentes del tensor de Riemann
no son cero. Nótese, sin embargo, que si s → 0 (es decir, si M → 0) el
espaciotiempo se vuelve plano.
La larga lista de las componentes no nulas del tensor de Riemann es excesiva,

ya que muchas de ellas se obtienen de las otras, utilizando las tres identi-
dades algebraicas (9.83, 9.84, 9.85). En vez de escribir toda la lista, pudimos
307
dar únicamente R0101 , R0202 , R0303 , R1212 , R1313 y R2323 . Ası́ mismo, no
era necesario dar Γ2 21 , Γ3 31 ni Γ3 32 . De ahora en adelante, para ahorrar
espacio, no escribiremos aquellas componentes que pueden averiguarse fácil-
mente utilizando las fórmulas de las identidades algebraicas.
13.3 Subespacios
El triespacio (r, θ, ϕ). En el cuadriespacio (ct, r, θ, ϕ) podemos hacer un
corte de t constante (es decir dt = 0) y lo que queda es un espacio tridi-
mensional. Al poner dt = 0 en las ecuaciones (13.12) y (13.13) queda este
espacio tridimensional:
ds2 = − (1 − s/r)−1 dr2 − r2 (dθ2 + sen2 θdϕ2 ) (13.15)
 
− (1 − s/r)−1 0 0
 
 
gµν =
 0 −r2 0 
 (13.16)
 
0 0 −r2 sen2 θ
Las componentes covariantes no nulas del tensor de Riemann son
s s sen2 θ
Rrθrθ = , Rrϕrϕ = , Rθϕθϕ = −sr sen2 θ
2(r − s) 2(r − s)
Este triespacio es curvo, porque algunas componentes del tensor de Riemann

no son cero. Pero estas se vuelven cero (y el triespacio se aplana) cuando
M → 0 . La curvatura de este triespacio es un efecto gravitacional.
El biespacio (r, θ). En el cuadriespacio (ct, r, θ, ϕ) podemos hacer un

corte de t constante y ϕ constante (es decir dt = dϕ = 0) y lo que que-
da es un espacio bidimensional. Al poner dt = dϕ = 0 en las ecuaciones
(13.12) y (13.13) queda este espacio bidimensional:
ds2 = − (1 − s/r)−1 dr2 − r2 dθ2 (13.17)
308
 
− (1 − s/r)−1 0
gµν =   (13.18)
0 −r2
Las componentes covariantes no nulas del tensor de Riemann son:
s
Rrθrθ =
2(r − s)
Este biespacio es curvo, porque algunas componentes del tensor de Riemann

no son cero. Pero estas se vuelven cero (y el biespacio se aplana) cuando
M → 0. La curvatura de este biespacio es un efecto gravitacional.
El biespacio (θ, ϕ). Si en las ecuaciones (13.12) y (13.13) hacemos dt =

dr = 0, queda un espacio bidimensional:
ds2 = −r2 dθ2 − r2 sen2 θdϕ2 (13.19)
 
−r2 0
gµν =   (13.20)
0 −r2 sen2 θ
Rθϕθϕ = −r2 sen2 θ
Este biespacio, que es una superficie esférica, es curvo, porque algunas com-
ponentes del tensor de Riemann no son cero. Cuando M → 0 , este biespacio
no se aplana: la superficie esférica es curva con M 6= 0 y también es curva
con M = 0. La curvatura de esta superficie no es un efecto gravitacional.
El biespacio (t, r). Si en las ecuaciones (13.12) y (13.13) hacemos dθ =

dϕ = 0, queda un espacio bidimensional:
³ s´ 2 2 ³ s ´−1 2
ds2 = 1 − c dt − 1 − dr (13.21)
r r
309
 
1 − s/r 0
gµν =   (13.22)
−1
0 − (1 − s/r)
Las componentes covariantes no nulas del tensor de Riemann son:
s
Rtrtr =
r3

El biespacio (t, θ). Si en las ecuaciones (13.12) y (13.13) hacemos dr =

dϕ = 0, queda un espacio bidimensional:
ds2 = (1 − s/r) c2 dt2 − r2 dθ2
 
1 − s/r 0
gµν =  
0 −r2
Todas las componentes del tensor de Riemann son cero, cualquiera que sea el
valor de M . Vemos ası́ que el biespacio (t, θ) es plano con M 6= 0 y también
con M = 0.
El biespacio (r, ϕ). Si en las ecuaciones (13.12) y (13.13) hacemos dt =

dθ = 0, queda un espacio bidimensional:
ds2 = − (1 − s/r)−1 dr2 − r2 sen2 θdϕ2 (13.23)
 
− (1 − s/r)−1 0
gµν =  
0 −r2 sen2 θ
310
1 s sen2 θ
Rrϕrϕ =
2 r−s

Para comprender la curvatura de este biespacio podemos simplificar la es-

critura usando longitudes positivas en (13.23), y concentrarnos en aquellas
figuras que están en el plano ecuatorial, para lo cual hacemos θ = π/2:
dl2 = (1 − s/r)−1 dr2 + r2 dϕ2 (13.24)
Para segmentos radiales hacemos dϕ = 0 en (13.24), y para segmentos de

circunferencia hacemos dr = 0:
1
dl = p dr : segmento radial (13.25)
1 − s/r
dl = rdϕ : arco de circunferencia (13.26)
Calculemos el área de la corona comprendida entre los radios r y dr. La

distancia entre los dos cı́rculos está dada por (13.25), y la longitud de la
circunferencia menor se calcula pcon (13.26), y da 2πr. Entonces el área de
la corona es el producto de 1/ 1 − s/r dr con 2πr:
2πrdr
Área = p (13.27)
1 − s/r
Pero esto difiere del resultado euclidiano, que es 2πrdr. Este ejemplo muestra
que el biespacio (r, ϕ) es curvo, mientras s sea diferente de cero. Por supuesto
que para M = 0 se tiene s = 0 y el área (13.27) se convierte en el valor
euclidiano 2πrdr, que es lo que se esperaba, ya que para s = 0 el espacio se
aplana.
13.4 Relojes
Un punto en reposo tiene dr = dθ = dϕ = 0, y en consecuencia el intervalo
(13.12) queda simplemente:
311
ds2 = c2 (1 − s/r) dt2
Ahora supongamos que en ese punto se encuentra un reloj y llamemos T al

tiempo que marca ese reloj que está en reposo. El intervalo es:
ds2 = c2 dT 2
Combinando las dos últimas ecuaciones llegamos a dT 2 = (1 − s/r) dt2 , es

decir:
p
dT = dt 1 − s/r (13.28)
p
= dt 1 + 2Φ/c2 (13.29)
Aquı́, Φ = −GM/r es el potencial gravitacional newtoniano. Si el reloj que

está
p en reposo se encuentra en el infinito, la ecuación (13.28) da dT∞ =
dt 1 − s/∞ = dt. De esta manera se aclara el significado de la coordenada
t que hemos usado desde el principio: t es un tiempo universal; un reloj que
se encuentra en reposo en r = ∞ marca un tiempo t.
La fórmula del intervalo (13.12) da la longitud tridimensional dl:
q
dl = (1 − s/r)−1 dr2 + r2 dθ2 + r2 sen2 θ dϕ2
La velocidad de un punto móvil se puede definir de dos maneras, bien sea

usando dt o dT . La cantidad dl/dt es es una velocidad medida con un reloj
t lejano, que está en el infinito: dl/dt no es una medida local. La cantidad
dl/dT es una velocidad medida con un reloj local T que se encuentra en
reposo. Esta última será llamada velocidad local y le asignaremos el sı́mbolo
v, ası́: v = dl/dT .
Saquemos c2 dt2 como factor común en la fórmula del intervalo (13.12):
" µ ¶2 #
2 1 dl
ds = 1 − s/r − 2 c2 dt2 (13.30)
c dt
312
Esta fórmula da un resultado interesante para pulsos de luz, ya que si hace-
mos ds = 0 encontramos
dl p
= c 1 − s/r ,
dt
o sea que la velocidad no local de la luz, dada por dl/dt, no es c. Afortu-

nadamente la velocidad local, dada por dl/dT , sı́ es c, como veremos ensegui-
da. En vista de (13.28), podemos escribir (dl/dt)2 = (1 − s/r) (dl/dT )2 =
(1 − s/r)v 2 , y la ecuación (13.30) se convierte en:
¡ ¢
ds2 = (1 − s/r) 1 − v 2 /c2 c2 dt2 (13.31)
Haciendo ds2 = 0 en esta ecuación se llega a v = c. En palabras: la velocidad

de la luz, medida localmente con un reloj en reposo, es c.
Concentrémonos ahora en lo que ocurre con una partı́cula móvil, llaman-

do dτ , como es costumbre, al tiempo que marca un reloj que la acompaña.
Hacemos ds2 = c2 dτ 2 en (13.31) para escribir:
p
dτ = dt (1 − s/r) (1 − v 2 /c2 ) (13.32)
p
= dt (1 + 2Φ/c) (1 − v 2 /c2 ) (13.33)
Esta es una fórmula general, con tres casos particulares importantes: 1)

Cuando el reloj está en reposo, dτ = dT y la ecuación (13.32) se convierte
en (13.28). 2) Cuando el reloj está en el infinito y tiene velocidad v, la
ecuación (13.32) se convierte en (2.14). 3) Cuando el reloj está en reposo
en el infinito, τ = t. La ecuación general (13.33) muestra que el reloj τ se
atrasa respecto a t por dos causas diferentes: por tener velocidad, asunto
que ya se ha estudiado en la relatividad especial, y por estar en un campo
gravitacional. Veamos en detalle este último.
La existencia de un tiempo universal t facilita la comprensión del espaci-

otiempo de Schwarzschild, ya que podemos imaginar cortes de simultanei-
dad. La Figura 13.1 trae tres lı́neas rectas horizontales; todos los eventos
contenidos en la primera lı́nea tienen el mismo valor t = 7; asimismo, todos
313
los eventos contenidos en la segunda lı́nea tienen el mismo valor t = 8, etc. La
Figura también trae dos lı́neas rectas verticales; una representa a un tripunto
fijo (r1 , θ1 , ϕ1 ), y la otra representa a otro tripunto fijo (r2 , θ2 , ϕ2 ). Supong-
amos ahora que desde el punto (r1 , θ1 , ϕ1 ) se lanza una serie de proyectiles
hacia (r2 , θ2 , ϕ2 ), periódicamente, y todos ellos se lanzan de la misma manera
(con la misma velocidad inicial y la misma inclinación). La Figura muestra,
en lı́neas curvas, las trayectorias de esos proyectiles. Lo interesante es que,
debido a que el espaciotiempo de Schwarzschild es estático (véase la métrica
(13.13)), las trayectorias de todos los proyectiles son similares, y en conse-
cuencia todas las lı́neas curvas de la Figura 13.1 son repetitivas. Llamemos
ahora ∆t1 al tiempo universal que transcurre entre dos proyectiles sucesivos
emitidos en el primer punto, y ∆t2 al lapso entre dos proyectiles sucesivos
recibidos en el segundo punto. Como todas las lı́neas curvas de la Figura
13.1 son similares, es claro que:
∆t1 = ∆t2 (13.34)
Pensemos ahora que en los dos puntos hay dos relojes en reposo, y llamemos
T1 y T2 a los tiempos que ellos marcan. El primer reloj mide el tiempo
∆T1 que transcurre entre dos proyectiles sucesivos emitidos y el segundo
reloj mide el tiempo ∆T2 que transcurre entre dos proyectiles recibidos. La
fórmula (13.28) dice que:
p
∆T1 = ∆t1 1 − s/r1
p
∆T2 = ∆t2 1 − s/r2
Dividir lado a lado esta dos ecuaciones y utilizar la ecuación (13.34):
s
1 − s/r2
∆T2 = ∆T1 (13.35)
1 − s/r1
Nótese que r2 < r1 ⇒ ∆T2 < ∆T1 : mientras más hundido está un reloj en
el campo gravitacional, más se atrasa.
Los relojes se atrasan bien sea a causa del campo gravitatorio o a causa
de la velocidad translacional que ellos tengan. Uno podrı́a preguntarse si
314
acaso la aceleración también ocasiona algún atraso. La respuesta es no: se
han realizado experimentos con aceleraciones extremas en ciclotrones, en los
que los relojes (sistemas atómicos) no registran atrasos debidos a la acel-
eración.
Antes de concluir esta sección vamos a completar el estudio de la velocidad

local v = dl/dT , escribiendo en detalle sus tres componentes. La fórmula
del intervalo (13.12) da la longitud tridimensional dl y sus tres componentes
dlr , dlθ y dlϕ :
q
dl = (1 − s/r)−1 dr2 + r2 dθ2 + r2 sen2 θ dϕ2
dr
dlr = p (13.36)
1 − s/r
dlθ = r dθ
dlϕ = r sen θ dϕ
Al dividir estas cantidades por dT se obtienen las componentes vr , vθ y vϕ :
dl q
v = = vr2 + vθ2 + vϕ2 (13.37)
dT
dlr 1 dr
vr = = p (13.38)
dT 1 − s/r dT
dlθ dθ
vθ = = r (13.39)
dT dT
dlϕ dϕ
vϕ = = r sen θ (13.40)
dT dT
A continuación vamos a deducir una ecuación interesante que combina las

variables r, v y vϕ . Si el movimiento se desarrolla únicamente en el plano
ecuatorial, vθ = 0 y la ecuación (13.37) dice que vr2 = v 2 − vϕ2 , o sea que:
Ã !
vr2 v 2 vϕ2
= 1− 1− 2 + 2
c2 c c
En el segundo término del lado derecho multiplicar y dividir por (1 − s/r):
315
 " #2 
vr2 ³ s ´  1 − v 2 /c2 rvϕ /c 1
2
= 1− 1− + p
c r 1 − s/r 1 − s/r r2
Esta ecuación se escribe concisamente ası́:
³ µ ¶
vr2 s´ J2
= 1− 1− D+ 2 , (13.41)
c2 r r
donde
1 − v 2 /c2 r vϕ
D = , J = p (13.42)
1 − s/r 1 − s/r c
Las cantidades D y J son funciones de r, v y vϕ ; en general, D y J van

cambiando a medida que el punto móvil progresa en su trayectoria. Pero
hay una excepción importante: cuando la trayectoria del punto móvil es
una geodésica, las cantidades D y J se mantienen constantes, es decir, son
constantes del movimiento. Esto lo veremos pronto.
13.5 Corrimiento hacia el rojo

Consideremos de nuevo los dos relojes de la sección anterior. La frecuencia
a la que se emiten los proyectiles es ν1 = 1/∆T1 , y la frecuencia a la que
se reciben es ν2 = 1/∆T2 . Si dividimos lado a lado estas dos ecuaciones se
obtiene ν2 /ν1 = ∆T1 /∆T2 , y en vista de (13.35) se llega finalmente a:
s
1 − s/r1
ν2 = ν1 (13.43)
1 − s/r2
Si r2 < r1 entonces ν2 > ν1 : esto se llama corrimiento hacia el azul. Si

r2 > r1 entonces ν2 < ν1 , y se llama corrimiento hacia el rojo. Uno se
puede figurar, en la imaginación, que mientras la luz baja (hacia la masa
M ) se fortalece, aumenta su frecuencia y se corre hacia el azul. Ası́ mismo,
subir debilita a la luz, le disminuye su frecuencia2 y la corre hacia el rojo.
2
En óptica, cuando la luz pasa por materiales transparentes de diversos ı́ndices de
refracción, su frecuencia y su color no cambian. Pero en la relatividad einsteiniana, cuando
la luz pasa por una región donde hay campo gravitacional, su frecuencia y su color son
cambiantes.
316
Pensemos en un pulso de luz emitido en la superficie de una estrella (la
coordenada radial de este punto de emisión es r1 = R) y recibido en otro
punto cuya coordenada radial es r2 = ∞. La fórmula (13.43) da en este caso
ν∞ = νR [1 − s/R]1/2 . Expandir el binomio: ν∞ = νR [1 − s/2R + · · ·]. Si s/R
es pequeño conservamos los dos primeros términos en esta serie, obteniendo
ν∞ = νR [1 − s/2R], es decir
· ¸
GM
ν∞ = νR 1 − 2 (13.44)
c R
O sea que la frecuencia recibida en r = ∞ es menor que la emitida en la

estrella: corrimiento hacia el rojo. En el viaje desde la estrella hasta el in-
finito, la luz sube de un lugar donde el potencial gravitacional newtoniano
Φ = −GM/R es negativo, a otro donde es cero; en este ascenso la luz se de-
bilita, su frecuencia disminuye y su color tira hacia el rojo. ¿Qué podrı́amos
decir de la luz que viaja desde el infinito hacia la estrella?: el descenso la
fortalece, le aumenta la frecuencia y su color tira hacia el azul. Al subir, la
luz se enrojece. Y al bajar se azulea.
Para darnos cuenta de la magnitud del corrimiento pongamos en la fórmula

la masa y el radio del Sol: M¯ = 1.99 × 1033 g, R¯ = 6.96 × 1010 cm:
ν∞ = ν¯ (1 − 2.12 × 10−6 )
En otras palabras, (ν¯ −ν∞ )/ν¯ es cerca de dos millonésimas. Esta diferencia
es pequeña, pero se ha observado. También se ha observado el corrimiento
hacia el rojo en la luz de otras estrellas, como por ejemplo Sirio y Eridani.3
13.6 Constantes del movimiento

A continuación vamos a estudiar la caı́da libre de una partı́cula de cualquier
masa, bien sea m = 0 o m 6= 0. Tal como hemos visto, la trayectoria es una
geodésica. Lo primero es identificar las constantes del movimiento siguiendo
3
Hay tres clases de corrimiento hacia el rojo : 1) Debido a la explosión del espacio
(big bang), se corren hacia el rojo la luz de las galaxias y la radiación de fondo. 2) El
del efecto Doppler, causado por la velocidad fuente-receptor y explicado por la relatividad
especial en la sección 5.8. Finalmente, 3) el gravitacional, explicado en esta sección por la
relatividad general.
317
la regla (10.15). Como x0 y x3 no aparecen en la métrica (13.13), podemos
asegurar que g0β dxβ /dλ y g3β dxβ /dλ son constantes del movimiento:
dxβ dx0 dt dt
g0β = g00 = cg00 = c (1 − s/r)
dλ dλ dλ dλ
dxβ dx3 dϕ
g3β = g33 = −r2 sen2 θ
dλ dλ dλ
Ajustamos el parámetro afı́n de manera que la primera constante valga 1 y a

la segunda constante la llamamos −J. Escribimos entonces c(1−s/r)dt/dλ =
1 y −r2 sen2 θdϕ/dλ = −J, es decir,
dλ = c (1 − s/r) dt (13.45)
dϕ
J = r2 sen2 θ (13.46)
dλ
Vamos a demostrar que el movimiento de la partı́cula se desarrolla en un

plano. Si J es cero en un instante, también será cero en todos los instantes.
Pero J es proporcional a dϕ/dλ, y podemos afirmar en consecuencia que
si dϕ/dλ es cero en un instante, también será cero en todos los instantes.
Esto es lo que ocurre si la partı́cula se mueve en un plano que pasa por los
polos norte y sur. Esta idea se generaliza afirmando que si en un instante la
partı́cula se mueve en un plano (cualquiera) que pase por el centro, entonces
ella nunca abandonará ese plano4 . Para simplificar la escritura conviene que
orientemos al eje zeta de modo que el plano del movimiento sea el plano
ecuatorial; haciendo θ = π/2, dθ = 0 en las ecuaciones (13.12) y (13.46) se
obtiene:
ds2 = (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 − r2 dϕ2 (13.47)

dϕ
J = r2 (13.48)
dλ
dϕ J
= (13.49)
dλ r2
4
Recordemos la manera como se trata, en mecánica newtoniana, el problema de una
partı́cula sujeta a una fuerza central: el torque es cero ⇒ el momentum angular es constante
⇒ el movimiento se desarrolla en un plano.
318
13.7 Una tercera constante del movimiento
De las cuatro ecuaciones (10.8) de las geodésicas ya hemos ejecutado dos,
al identificar las dos constantes del movimiento de la sección anterior. Nos
falta por considerar las otras dos ecuaciones de las geodésicas:
d2 x1 1 dxµ dxν
+ Γ µν =0 (13.50)
dλ2 dλ dλ
d2 x2 2 dxµ dxν
+ Γ µν =0 (13.51)
dλ2 dλ dλ
Utilizando los sı́mbolos Γ0 µν de la página 307, y la escogencia θ = π/2,

dθ = 0, es evidente que la ecuación (13.51) se convierte en d2 θ/dλ2 = 0 , lo
cual, si bien es cierto, no es útil. Nos queda entonces la ecuación (13.50);
usando los coeficientes Γr µν de la página 307 y la condición θ = π/2, dθ = 0,
obtenemos:
µ ¶2 µ ¶2 µ ¶2
d2 r s dr c2 s(r − s) dt dϕ
2
− + − (r − s) =0
dλ 2r(r − s) dλ 2r3 dλ dλ
En el tercer término usar (13.45) y en el cuarto término usar (13.49):
µ ¶2
d2 r s dr s(r − s) ³ s ´−2 J 2 (r − s)
2
− + 1 − − =0
dλ 2r(r − s) dλ 2r3 r r4
2r dr
r − s dλ
µ ¶3
2r dr d2 r s dr s dr 2J 2 dr
2
− + − =0
r − s dλ dλ (r − s)2 dλ (r − s)2 dλ r3 dλ
Reunir los dos primeros términos con un común denominador:
µ ¶3
dr d2 r dr
2r(r − s) −s
dλ dλ2 dλ s dr 2J 2 dr
+ − =0
(r − s)2 (r − s)2 dλ r3 dλ
319
El lado izquierdo de esta ecuación tiene tres términos. El primer término es
d r(dr/dλ)2 d r
igual a ; el segundo término es − , y el tercer término
dλ r − s dλ r − s
d J2
es . La ecuación es entonces
dλ r2
 µ ¶2 
dr
r
d 
 dλ r J2 

 − + 2=0
dλ  r − s r−s r 
o sea que la cantidad entre paréntesis es una constante, a la que llamaremos

−D:
µ ¶2
dr
1−
dλ J2
D ≡ s − (13.52)
1− r2
r
dD
= 0 (13.53)
dλ
La ecuación (13.52) se puede escribir también ası́ :
µ ¶2 ³ µ ¶
dr s´ J2
=1− 1− D+ 2 (13.54)
dλ r r
13.8 J y D en términos de r, v y vϕ
Las variables naturales de la cinemática son la posición y la velocidad. Si
nosotros conocemos la posición y la velocidad de una partı́cula en cierto in-
stante, deberı́amos ser capaces de utilizar esa información para averiguar los
valores de las constantes J y D. En esta sección nos proponemos deducir las
fórmulas correspondientes. Para ejecutar esta tarea debemos encontrar ini-
cialmente la relación que existe entre el parámetro λ y el tiempo local
p T : bas-
ta combinar las ecuaciones (13.28) y (13.45)para obtener dλ = cdT 1 − s/r.
Con este resultado las ecuaciones (13.48) y (13.52) dan:
1 dϕ
J = r2 p
c 1 − s/r dT
320
µ ¶2
1 dr
1− 2 µ ¶2
c (1 − s/r) dT r2 dϕ
D = − 2
1 − s/r c (1 − s/r) dT
Aquı́ reconocemos las velocidades locales vr , vϕ y v 2 que habı́amos definido

en las ecuaciones (13.37), (13.38) y (13.40), lo que nos permite escribir:
r vϕ
J = p (13.55)
1 − s/r c
1 − v 2 /c2
D = (13.56)
1 − s/r
Estas son las fórmulas que buscábamos. Si sabemos que una partı́cula en
caı́da libre pasa por r, y que al pasar por r tiene velocidades locales v y vϕ ,
entonces las ecuaciones (13.55) y (13.56) nos permiten averiguar los valores
de J y D.
Los valores r, v y vϕ que la partı́cula tiene en cierto instante (es decir,

las condiciones iniciales) determinan unı́vocamente la trayectoria futura y
pasada: en otros instantes la partı́cula tiene que ajustar los valores de r,
v y vϕ de modo que las cantidades J y D adopten los mismos valores que
adoptaron en el instante inicial. Esto de ajustar es lo que quiere decir que J
y D sean constantes del movimiento. Cada geodésica en el espaciotiempo de
Schwarzschild está caracterizada por dos números, que son los valores que
adoptan J y D. Una vez que la partı́cula ha escogido determinada geodésica
(es decir, determinados valores de J y D), no podrá abandonarla jamás, ya
que abandonarla serı́a como cambiar los valores iniciales de J y D.
Continuemos con el examen de las ecuaciones (13.55) y (13.56). Es claro

que ellas se combinan para producir esta otra relación, que será útil dentro
de poco:
Dr2 1 − v 2 /c2
= (13.57)
J2 vϕ2 /c2
De otro lado, las ecuaciones (13.55) y (13.56) se pueden invertir para expre-
sar v y vϕ en términos de las constantes D y J:
v2 ³ s´
= 1− 1− D (13.58)
c2 r
321
vϕ2 ³ s´ J2
= 1− (13.59)
c2 r r2
Restamos lado a lado estas dos ecuaciones para obtener:
³ µ ¶
v 2 − vϕ2 s´ J2
=1− 1− D+ 2
c2 r r
Pero v 2 − vϕ2 = vr2 , entonces
³ µ ¶
vr2 s´ J2
=1− 1− D+ 2 (13.60)
c2 r r
Obsérvese que
dr dT dt dr p 1 dr dlr vr
= = 1 − s/r = = , (13.61)
dλ dt dλ dT c(1 − s/r) dT cdT c
o sea que las ecuaciones (13.60) y (13.54) son equivalentes. Observemos

también la diferencia que existe entre las ecuaciones (13.41) y (13.60): en
la primera ecuación, las cantidades D y J son, en general, variables, mien-
tras que en la segunda ecuación las cantidades D y J son constantes del
movimiento.
A grandes distancias, la constante J tiene un significado que es familiar.

En efecto, para s/r muy pequeño la ecuación (13.55)da cJ ' rvϕ . En pal-
abras, a grandes distancias cJ tiende al momentum angular zeta por unidad
de masa.
La constante D permite también algunos comentarios. Para un pulso de

luz se tiene v = c, y en en este caso la ecuación (13.56) dice que D = 0. Para
partı́cula masiva la ecuación (13.58) es clara: dado un valor de D, la veloci-
dad local v depende únicamente de la coordenada r. Cuando la partı́cula se
acerca, r disminuye y la velocidad v tiene que aumentar. Esta ecuación es
análoga a la ecuación newtoniana que dice que la energı́a total (que es con-
stante) es la suma de la energı́a cinética y la energı́a potencial. La analogı́a
se confirma al estudiar el comportamiento de D en el lı́mite newtoniano: la
ecuación (13.56) es D = (1 − v 2 /c2 )(1 − s/r)−1 = (1 − v 2 /c2 )(1 + s/r + · · ·)
322
µ ¶
2 1 2
→ (1 − v 2 /c2 )(1 + s/r) ' 1 − (v 2 /c2 − s/r) = 1 − v + Φ . Vemos
c2 2
1
ası́ que (1 − D)c2 /2 → v 2 + Φ; en palabras, (1 − D)c2 /2 tiende a la energı́a
2
total (prerrelativista) por unidad de masa.
¿Cuáles son los valores numéricos que adoptan las constantes J y D? Es-
peramos responder esta pregunta, al menos medianamente, estudiando dos
casos bien diferentes: el del planeta Tierra y el de una partı́cula de alta ve-
locidad que pasa por las cercanı́as del origen.
La Tierra en su órbita alrededor del Sol tiene una r promedio de 1.49 × 1013
cm y una velocidad promedio de 0.98 × 10−4 c ; como el s del Sol es 2.93 km,
concluimos que J/s ' 5000 y D ' 1 + 0.00000001. Aprendemos que para los
planetas solares J/s es un número muy grande y que D es muy cercano a 1,
y mayor que 1. Pensemos ahora en una partı́cula masiva de alta velocidad,
v = 0.8c y r promedio igual a 10s; en este caso se obtiene J/s ' 8 y D ' 0.4.
13.9 Las cuatro variables t, T, τ y λ

Queremos hacer una recopilación de las relaciones que existen entre las cua-
tro variables t, T, τ y λ. Antes de hacerlo conviene que repasemos el signifi-
cado de esas variables.
t es un tiempo universal. Un reloj en reposo en r = ∞ marca un tiempo t.

El tiempo T es el que marca un reloj en reposo en un punto con coordena-
da radial r. El parámetro afı́n dλ es el que participa en las ecuaciones de
las geodésicas. Para una partı́cula masiva el intervalo ds2 es igual a c2 dτ 2 ,
donde dτ es el tiempo que marca un reloj que acompaña a la partı́cula. Se
puede verificar, con lo expuesto en las páginas anteriores, que las relaciones
entre las cuatro variables son:
dλ = c (1 − s/r) dt (13.62)
c
dλ = √ dτ (13.63)
D
√
dτ = D (1 − s/r) dt (13.64)
p
dT = 1 − s/r dt (13.65)
323
1
dT = p dτ (13.66)
D (1 − s/r)
1
dT = p dλ (13.67)
c 1 − s/r
13.10 La caı́da vertical

Hagamos una pausa para estudiar una trayectoria simple, que es la que de-
scribe una partı́cula masiva que se suelta desde cierta altura. Este es, sin
duda, uno de los problemas más importantes de la fı́sica, como lo demuestra
el interés que Galileo le prestó al construir las bases de la ciencia moderna.
Suponemos que la partı́cula se suelta desde una altura r0 . Este dato deberı́a
ser suficiente para determinar la constante D; en efecto, haciendo v = 0 en
la ecuación (13.56) encontramos
1
D= (13.68)
1 − s/r0
Igualando los lados derechos de las ecuaciones (13.56) y (13.68) se obtiene:
s
s/r − s/r0
v = c (13.69)
1 − s/r0
1 − v 2 /c2
r0 = s (13.70)
s/r − v 2 /c2
Pensemos en este momento en el problema recı́proco, el de una partı́cula

masiva que inicialmente está en r y que se dispara hacia arriba con una
velocidad v. A medida que asciende, su velocidad disminuye hasta que se
vuelve cero en r0 . Vemos ası́ que la ecuación (13.69) da respuesta a dos pre-
guntas: a) da la velocidad (en r) que tiene una partı́cula que se suelta en r0
y, b) da la velocidad vertical que hay que impartirle a una partı́cula para
que alcance una altura máxima r0 . Del mismo modo, la ecuación (13.70)
responde dos preguntas: a) si se sabe que una partı́cula tiene (en r) una
velocidad v hacia abajo, la ecuación nos permite averiguar desde qué altura
fue soltada, y, b) si una partı́cula se dispara (en r) hacia arriba, la ecuación
dice cuál es la altura máxima que ella alcanza.
324
La ecuación (13.69) tiene un caso interesante, y es cuando r0 = ∞:
p
v = c s/r para r0 = ∞ (13.71)
En palabras: si, con un disparo vertical, se quiere enviar una partı́cula

p al
infinito, se le debe impartir una velocidad local mayor o igual que c s/r.
Concentrémonos ahora en otro aspecto de la caı́da vertical, que es el cálculo

del tiempo que transcurre entre r0 y r. Como el movimiento se da única-
mente en la dirección radial, la constante J es cero y la ecuación (13.54)
queda ası́:
µ ¶2
dr
= 1 − (1 − s/r)D (13.72)
dλ
Utilizar la ecuación (13.63):
Ã√ !2
D dr ³ s´
=1− 1− D (13.73)
c dτ r
Al tomar raı́z cuadrada surge un ±; escogemos el signo − porque la partı́cula

está cayendo:
√ r ³
D dr s´
=− 1− 1− D,
c dτ r
es decir:
rdr
cdτ = − r ,
D−1 2
sr − r
D
y utilizando la ecuación (13.68):
rdr
cdτ = −r
s 2
sr − r
r0
325
¶ µ
r r
d
r2 r0 r0
cdτ = −√ 0 s µ ¶ (13.74)
sr0 r r 2
−
r0 r0
Llamar x ≡ r/r0 e integrar, asumiendo que el reloj τ comienza a marchar

cuando la partı́cula se suelta:
Z τ Z r/r0
r2 xdx
c dτ = − √ 0 √ (13.75)
0 sr0 1 x − x2
La integral del lado derecho se resuelve con ayuda de la fórmula 2.264.2

de [14], que es
Z p
xdx 1
√ = − x − x2 − arc sen(1 − 2x)
x−x 2 2
La ecuación (13.75) es entonces
s 
µ ¶2 µ ¶
r02  r r 1 2r π
cτ = √ − + arc sen 1 − + (13.76)
sr0 r0 r0 2 r0 4
También nos interesa calcular t , el tiempo coordenado, y esto es un poco

más difı́cil. Veamos: en vista de la ecuación (13.62) la ecuación (13.72) es
µ ¶2
1 dr
= 1 − (1 − s/r)D ,
(1 − s/r)2 cdt
y utilizando la fórmula (13.68):
µ ¶2
1 dr 1 − s/r
=1− ,
(1 − s/r)2 cdt 1 − s/r0
de donde despejamos cdt:
326
p
1 − s/r0 dr
cdt = − p (13.77)
(1 − s/r) s/r − s/r0
Para integrar el lado derecho de esta ecuación conviene [24] hacer el cambio
de variable η = arc cos(2r/r0 − 1) , para finalmente llegar a
¯r r ¯
¯ r0 r0 ¯
¯ − 1 ¯¯
¯ s −1+ r
ct = s ln ¯¯ r r ¯ +
¯
¯ r0 r0 ¯
¯ − 1 − − 1 ¯
s r
 s 
r ³ ´ µ ¶ µ ¶2
r0 r0 2r r0 r r
s −1  + 1 arc cos −1 + + 
s 2s r0 s r0 r0
(13.78)
Esta es verdaderamente la integración de la ecuación (13.77); para cercio-

rarse de ello basta verificar que la ecuación (13.77) se obtiene tomando
diferenciales en ambos lados de (13.78).
Observemos que el logaritmo en el lado derecho de la ecuación (13.78) di-

verge en r = s . Esto quiere decir que para llegar a r = s la partı́cula toma
una cantidad infinita de tiempo coordenado t . La Figura 13.4 muestra dos
curvas: en trazo continuo el tiempo propio τ dado por la fórmula (13.76), y
en trazo punteado el tiempo coordenado t dado por la fórmula (13.78). No-
toriamente, el tiempo propio τ es una función de buena conducta, mientras
que el tiempo coordenado t tiene un comportamiento muy preocupante. En
la sección 13.19 abordaremos de nuevo este asunto.
Finalmente, es interesante anotar que la fı́sica newtoniana da la misma re-

spuesta (13.76). En efecto, en la gravitación de Newton el potencial grav-
itacional es −GM/r = −c2 s/2r, y por consiguiente la energı́a total para
una partı́cula de masa m es −c2 sm/2r + 12 mu2 . Como esta energı́a es una
constante del movimiento podemos escribir
c2 sm 1 c2 sm
− + mu2 = − + 0,
2r 2 2r0
de donde
327
µ ¶
1 1
u2 = c2 s −
r r0
Esta ecuación newtoniana coincide con la ecuación relativista (13.73), o sea

que el tiempo newtoniano es el mismo tiempo dado por la ecuación (13.76).
13.11 Potencial efectivo

Definimos
³ µ ¶
s´ J2
V = 1− D+ 2 (13.79)
r r
de modo que la ecuación (13.60) es
vr2
= 1−V (13.80)
c2
Al tomar la derivada d/dT en ambos lados de esta ecuación se obtiene

2vr dvr dV dlr dV dV
2
=− =− = −vr , o sea que
c dT dT dT dlr dlr
dvr c2 dV
=− (13.81)
dT 2 dlr
Esta ecuación es de la forma “aceleración es menos el gradiente del po-

tencial”, y por esta razón V recibe el nombre de potencial efectivo. Como
vr2 ≥ 0, el lado derecho de la ecuación (13.80) también tiene que ser ≥ 0:
el movimiento de la partı́cula está permitido solamente en aquellas regiones
del espacio donde V ≤ 1. El gráfico de V versus r es sumamente útil. En
un mismo gráfico se traza la función V versus r y se traza una lı́nea hor-
izontal a una altura 1; la partı́cula puede moverse únicamente en aquellas
regiones donde V está por debajo de la lı́nea horizontal de altura 1. La
ecuación (13.81) corresponde a un problema ficticio unidimensional en el
que la fuerza es proporcional a −dV /dr. En aquellas regiones donde V es
una función decreciente de r, la fuerza es repulsiva; y allı́ donde V es una
función creciente, la fuerza es atractiva. Los puntos de retorno ocurren en
aquellos valores de r en los que V = 1. El movimiento circular ocurre cuando
se cumplen estas dos condiciones: V = 1 y dV /dr = 0; si d2 V /dr2 < 0, el
328
movimiento circular es inestable, y si d2 V /dr2 > 0 es estable.
La Figura 13.2 muestra las posibilidades que tiene un fotón (D = 0) que

tiene un valor de J dado por J = 2.7s ; en la gráfica, A y B son puntos de re-
torno: el movimiento es posible únicamente en las regiones r < rA y r > rB ;
en la primera región las órbitas son ligadas y en la segunda desligadas. La
Figura 13.3 es para una partı́cula masiva que tiene D = 0.5 y J = 2.7s ;
también en esta gráfica A y B son puntos de retorno: el movimiento es posi-
ble únicamente en las regiones r < rA y r > rB ; en la primera región las
órbitas son ligadas y en la segunda desligadas.
El lector seguramente reconoce el mismo método y los mismos elementos

gráficos que se usan en mecánica clásica: potencial efectivo, puntos de re-
torno, pozos de potencial, etc. Hay sin embargo una diferencia importante
entre los gráficos de la mecánica clásica y los de la solución de Schwarzschild:
en los primeros la lı́nea horizontal representa energı́a total y es de altura
variable, en cambio en los segundos la lı́nea horizontal es de altura fija 1.
Máximos y mı́nimos de V (r). Calculemos las dos primeras derivadas

del potencial efectivo, usando la ecuación (13.79):
µ ¶
dV sJ 2 Dr2 2r
= +3− (13.82)
dr r4 J2 s
µ ¶
d2 V 2sJ 2 Dr2 3r
= − 2 −6+ (13.83)
dr2 r5 J s
En los máximos y mı́nimos ocurre que dV /dr = 0. Al hacer dV /dr = 0 en

(13.82) se obtiene:
Dr2 2r
2
+3− = 0 (13.84)
J s
Las soluciones de esta ecuación son:

" r #
J2 3Ds2
r= 1± 1− (13.85)
Ds J2
Para que los máximos y mı́nimos verdaderamente existan es necesario que
329
los valores dados en la ecuación (13.85) sean cantidades reales, es decir, que
3Ds2
1− sea ≥ 0:
J2
J2
≥1 (13.86)
3Ds2
La fórmula (13.85) presenta dos valores de r. ¿En cuál de ellos ocurre un

máximo y en cuál un mı́nimo? Para responder esta pregunta debemos evalu-
ar la segunda derivada d2 V /dr2 en los puntos (13.85) y determinar si d2 V /dr2
es negativa o positiva. Al colocar (13.85) en (13.83) se obtiene:
Ã " r # !
d2 V 6J 2 s J2 3Ds2
= 1± 1− −1 (13.87)
dr2 r5 3Ds2 J2
Utilizando (13.86) en (13.87) vemos que con el signo superior se obtiene

d2 V /dr2 > 0, y con el signo inferior d2 V /dr2 < 0. Leamos finalmente la
ecuación (13.85) ası́:
" r #
J2 3Ds2
r = 1− 1− V es máximo (13.88)
Ds J2
" r #
J2 3Ds2
r = 1+ 1− V es mı́nimo (13.89)
Ds J2
Nótese que (13.88) es menor que (13.89): si el máximo y el mı́nimo de V

ocurren (ver condición (13.86)), el máximo se presenta en las cercanı́as del
origen, y el mı́nimo en las lejanı́as. Una curva tı́pica es ası́: V es cero en
r = s y asciende monótonamente hasta el r dado por (13.88). Allı́ comienza
a descender hasta que logra el mı́nimo en el r dado por (13.89). Allı́ comien-
za a ascender de nuevo y tiende asintóticamente al valor V = D. Es en este
último pozo de potencial donde están los planetas del sistema solar.
La ecuación (13.85) da los valores de r en términos de las constantes D

y J. También es deseable expresar estos r en términos de las velocidades
locales v y vϕ , y para tal efecto usamos la ecuación (13.57) en (13.84), con
lo que se llega al siguiente resultado:
330
r 3 1 − v 2 /c2
= + V máximo o mı́nimo (13.90)
s 2 2vϕ2 /c2
Puntos de retorno. Éstos ocurren en aquellos valores de r donde vr = 0,

es decir:
vϕ = v puntos de retorno (13.91)
Trayectoria circular. La órbita es circular si se cumplen simultánea-

mente las condiciones (13.90) y (13.91). Combinando estas dos ecuaciones
obtenemos
r 1 1
= 1+ órbita circular (13.92)
s 2 v 2 /c2
La trayectoria circular es inestable si V está en el máximo, y es estable si

V es mı́nimo. En otras palabras, inestable para d2 V /dr2 < 0, y estable para
d2 V /dr2 > 0. Investiguemos entonces bajo qué condiciones d2 V /dr2 < 0
utilizando la ecuación (13.83):
Dr2 3r
− 2
−6+ <0 inestable,
J s
y en vista de (13.57) y 13.91):
1 − v 2 /c2 3r
− −6+ <0
v 2 /c2 s
Ahora utilizar (13.92):
1 − v 2 /c2 3 1
− 2 2
−6+3+ <0
v /c 2 v 2 /c2
Despejar v/c para llegar finalmente a v/c > 1/2. Para movimiento circular
estable se obtiene v/c < 1/2. Si deseamos expresar estas desigualdades v/c ≷
1/2 en términos de r, utilizamos la ecuación (13.92), obteniéndose r ≶ 3s.
En conclusión:
v < c/2 ⇐ estable ⇒ r > 3s

(13.93)
v > c/2 ⇐ inestable ⇒ r < 3s
331
13.12 Puntos de retorno
En ocasiones lo que se conoce de la trayectoria de una partı́cula es los puntos
de retorno. En esta sección nos proponemos aprovechar esa información para
averiguar el valor de las constantes D y J 2 . En los puntos de retorno se hace
cero el lado derecho de la ecuación (13.60):
³ µ ¶
s´ J2
1− 1− D + 2 = 0,
r r
es decir:
sD 2 J2 sJ 2
r3 − r + r− = 0 (13.94)
D−1 D−1 D−1
Esta es una ecuación de tercer grado y tiene, naturalmente, tres soluciones,

que llamaremos r1 , r2 y r3 . Las tres raı́ces r1 , r2 , r3 son, en general números
complejos, y denotan puntos verdaderos de retorno cuando son números
positivos. La ecuación (13.94) se puede escribir de esta otra manera:
(r − r1 )(r − r2 )(r − r3 ) = 0 (13.95)
Al expandir todos los productos en esta ecuación se obtiene
r3 − (r1 + r2 + r3 ) r2 + (r1 r2 + r2 r3 + r3 r1 ) r − r1 r2 r3 = 0 (13.96)
Ahora comparamos uno a uno los términos de las ecuaciones (13.94) y

(13.96), para llegar a:
sD
r1 + r2 + r3 = (13.97)
D−1
J2
r1 r2 + r2 r3 + r3 r1 = (13.98)
D−1
sJ 2
r1 r2 r3 = (13.99)
D−1
332
Estas tres ecuaciones se pueden utilizar de dos maneras. La primera es ex-
presar a las raı́ces r1 , r2 y r3 en términos de las constantes D y J 2 : se
obtienen unas ecuaciones sumamente complicadas. La segunda es expresar
a las constantes D y J 2 en términos de dos raı́ces r1 y r2 :
sr1 r2
r1 r2 − s(r1 + r2 ) +
r1 + r2
D = (13.100)
r1 r2 − s(r1 + r2 ) + s2
s (r1 r2 )2
J2 = (13.101)
r1 + r2 r1 r2 − s(r1 + r2 ) + s2
Es claro que en estas expresiones la pareja r1 , r2 puede ser substituida por

r2 , r3 o por r3 , r1 . Entre las tres raı́ces r1 , r2 y r3 existe una relación muy
simple. Para deducirla dividamos ambos lados de (13.99) por s:
r1 r2 r3 J2
= (13.102)
s D−1
Igualamos los lados izquierdos de las ecuaciones (13.98) y (13.102) para

obtener:
1 1 1 1
+ + = , (13.103)
r1 r2 r3 s
o, equivalentemente:
· ¸
r3 s s −1
= 1− − (13.104)
s r1 r2
Los planetas. En el sistema solar los planetas están en la zona lejana.

La órbita de la Tierra, por ejemplo, tiene un radio promedio de 1.49 × 1013
cm. Comparando esto con s = 2.93 × 105 cm nos damos cuenta de que la
razón entre estas dos cantidades es del orden de 10−8 . Si tomamos r1 y r2
como el perihelio y el apelio de la órbita terrestre, vemos que s/r1 y s/r2 son
cantidades muy pequeñas, del orden de 10−8 . Es razonable despreciar s2 en
el denominador de (13.100) y despreciar −s(r1 + r2 ) + s2 en el denominador
de (13.101), para escribir esas ecuaciones de esta forma aproximada:
333
µ ¶
sr1 r2
D ' r1 r2 − s(r1 + r2 ) + [r1 r2 − s(r1 + r2 )]−1 (13.105)
r1 + r2
sr1 r2
J2 ' (13.106)
r1 + r2
Los factores [ ]−1 que aparecen en (13.104) y (13.105) se expanden con

la fórmula del binomio de Newton y se desprecian los términos en s2 , y
ası́ llegamos a estas dos ecuaciones:
s
D ' 1+ (13.107)
r1 + r2
r3 s s
' 1+ + (13.108)
s r1 r2
En el caso particular de la órbita terrestre los datos astronómicos son r1 =

1.47 × 1013 cm y r2 = 1.52 × 1013 cm. Entonces:
r3
' 1 + 3.95 × 10−8
s
D ' 1 + 0.98 × 10−8
J2
' 0.255 × 108
s2
Con estos resultados el potencial efectivo para la Tierra es:

³ µ ¶
s´ −8 8 s2
V (r) = 1 − 1 + 0.98 × 10 + 0.255 × 10 × 2
r r
No es fácil dibujar, en una sola página, el potencial V (r) en todo el rango

1 ≤ r/s ≤ ∞, debido a que ocurren números muy dispares. En r/s = 1 el
potencial vale cero y crece rápidamente para alcanzar el valor V = 3.8 × 106
en r/s = 3/2. Allı́ comienza a descender lentamente hasta llegar al mı́nimo:
V = 1 − 0.98 × 10−8 en r/s = 0.51 × 108 . Entonces comienza a crecer de
nuevo hasta V = 1+0.98×10−8 en r/s = ∞. Los puntos de retorno están en
r3 /s = 1+3.95×10−8 , en r1 /s = 0.50×108 y en en r2 /s = 0.52×108 . Es claro
que en la zona lejana se forma un pozo de potencial, en el que reside nuestro
planeta. Este pozo es muy pando y muy angosto. Su profundidad respecto
a la lı́nea recta de altura 1 es apenas 0.98 × 10−8 ; nos podemos formar una
idea del ancho dividiendo a r2 − r1 sobre r1 , ası́: (r2 − r1 )/r2 = 0.04: apenas
un 4 % .
334
13.13 Eliminación del parámetro afı́n λ
Las coordenadas (r, ϕ) de la partı́cula son funciones de λ. Queremos eliminar
el parámetro afı́n. Las ecuaciones (10.21) y (10.27) nos enseñaron que para
tal eliminación debemos intentar una derivación en cadena. Siguiendo esta
recomendación hacemos d/dλ = (dϕ/dλ)(d/dϕ) , y en vista de la ecuación
(13.46):
d J d
= 2 2
dλ r sen θ dϕ
Ahora, como todas las trayectorias que estamos estudiando pertenecen al

plano ecuatorial:
d J d
= 2
dλ r dϕ
Aplicar ambos lados de esta ecuación a la variable r:
dr J dr
= 2 ,
dλ r dϕ
y elevando al cuadrado:
µ ¶2 µ ¶2
dr J2 dr
= 4 (13.109)
dλ r dϕ
Igualamos los lados derechos de las ecuaciones (13.54) y (13.109), para obten-
er
µ ¶ ³ µ ¶
J 2 dr 2 s´ J2
=1− 1− D+ 2 , (13.110)
r4 dϕ r r
es decir:
s µ ¶
1 dr 1 ³ s´ J2
=± 1− 1− D+ 2 , (13.111)
r2 dϕ J r r
o también:
335
1
dr
dϕ = ± s r2 (13.112)
³ µ ¶
1 s´ J2
1− 1− D+ 2
J r r
Hemos logrado nuestro propósito, ya que esta ecuación no muestra ninguna

dependencia explı́cita con el parámetro afı́n λ, ni con ningún tiempo t, τ ni
T.
13.14 La variable u
1
Hacemos un cambio de variable usual en mecánica celeste: u ≡ , y lla-
r
mamos u0 = du/dϕ. La ecuación (13.110) es entonces
J 2 u02 = 1 − D + sDu − J 2 u2 + sJ 2 u3 (13.113)
Tomamos otra derivada respecto a ϕ:
µ ¶
00 0 sD 3s 2
(u + u)u = + u u0 (13.114)
2J 2 2
En los puntos de retorno ocurre que u0 = 0. En aquellos puntos donde u0 6= 0

podemos dividir ambos lados de (13.114) por u0 para obtener:
sD 3s 2
u00 + u = 2
+ u : Einstein (13.115)
2J 2
Comparación. En este momento es importante establecer una compara-

ción con los resultados [25] de la mecánica newtoniana:
s
u00 + u = : Newton (13.116)
2J 2
Las ecuaciones (13.115) y (13.116) son diferentes, lo que quiere decir que
las teorı́as newtoniana y einsteiniana predicen trayectorias diferentes para
las partı́culas en caı́da libre. Recuérdese en particular un resultado de la
geometrı́a analı́tica elemental según el cual u00 + u = const. positiva es la
336
ecuación general de las curvas cónicas, y u00 + u = 0 es la ecuación de la
lı́nea recta:
u00 + u = const. positiva : cónicas (13.117)
u00 + u = 0 : lı́nea recta (13.118)
Las ecuaciones (13.116) y (13.117) muestran que en la teorı́a newtoniana las

trayectorias son curvas cónicas; las ecuaciones (13.115) y (13.117) muestran
que en la teorı́a einsteiniana las trayectorias no son curvas cónicas. Para
mejor comparar las ecuaciones einsteiniana y newtoniana podemos reescribir
la ecuación (13.115) de la manera siguiente:
s s(D − 1) 3s 2
u00 + u = 2
+ + u : Einstein (13.119)
2J 2J 2 2
Observando las ecuaciones (13.116) y (13.119) nos damos cuenta de que la

diferencia entre las trayectorias newtoniana y einsteiniana procede de los dos
últimos términos del lado derecho de (13.119). En algunos casos estos dos
términos son de tamaño considerable y no pueden despreciarse. ¿Podemos
despreciar estos dos términos en el movimiento de los planetas alrededor del
Sol? En el caso de la Tierra, al usar los valores numéricos de la página 334
descubrimos que estos dos últimos términos son 108 veces más pequeños que
el primer término del lado derecho de (13.119). En el caso de Mercurio, por
estar más cercano al sol, estos dos términos, aunque pequeños, son de un
tamaño suficiente para producir diferencias observables, tal como veremos
más tarde cuando estudiemos la precesión del perihelio de Mercurio.
Antes de cerrar esta sección veamos la ecuación de la trayectoria de un

pulso de luz, haciendo D = 0 en la ecuación (13.115):
3s 2
u00 + u = u (13.120)
2
Comparando esta ecuación con (13.118) vemos que, de acuerdo con la teorı́a
einsteiniana, la trayectoria de un pulso de luz no es una lı́nea recta, asunto
de primera importancia que trataremos enseguida.
337
13.15 Deflexión de un rayo de luz
Vamos a estudiar la trayectoria de un rayo de luz que incide desde la derecha,
como muestra la Figura 13.5. La coordenada r, que inicialmente es infinita,
disminuye gradualmente hasta que alcanza un mı́nimo valor r0 . Después
de este punto la coordenada r crece monótonamente. Claramente r0 es un
punto de retorno, y por consiguiente vϕ = v = c, y la ecuación (13.55) da
(J/r0 )2 = (1 − s/r0 )−1 . En términos de u0 = 1/r0 esta ecuación se escribe:
(Ju0 )−2 = 1 − su0 (13.121)
Por tratarse de la luz, D = 0 y la ecuación (13.113) da u02 = J −2 − u2 + su3 .

Dividir ambos lados de esta ecuación por u20 y definir x ≡ u/u0 para escribir:
x02 = (Ju0 )−2 − x2 + su0 x3
Utilizar la ecuación (13.121):
x02 = 1 − su0 − x2 + su0 x3
= 1 − x2 − su0 (1 − x3 )
· µ ¶¸
2 1
= (1 − x ) 1 − su0 x +
1+x
Como x0 = dx/dϕ, la última ecuación se puede escribir de esta otra manera

equivalente:
dx
dϕ = ± s · µ ¶¸
2
1
(1 − x ) 1 − su0 x +
1+x
· µ ¶¸−1/2
dx 1
= ±√ 1 − su0 x +
1 − x2 1+x
Ahora usamos la fórmula del binomio de Newton para expandir el factor

[ ]−1/2 conservando solamente los dos primeros términos en la serie:
338
· µ ¶¸
dx 1 1
dϕ ' ± √ 1 + su0 x +
1 − x2 2 1+x
Integrar:
Z ϕ(r0 ) Z 1 · µ ¶¸
dx 1 1
dϕ = ± √ 1 + su0 x +
0 0 1 − x2 2 1+x
Ã Ã √ !!¯1
1 p 1 − x2 ¯
¯
ϕ(r0 ) = ± arc sen x − su0 1− x2 + ¯
2 1+x ¯
0
³π ´
= ± + su0
2
El doble de este ángulo es la dirección en la que el rayo emerge:
2ϕ(r0 ) = π + 2su0
Si no hubiera la masa M , entonces s serı́a cero y se tendrı́a 2ϕ(r0 ) = π .

Esto quiere decir que 2su0 es la deflexión ocasionada por M . La llamamos
α:
2s 4GM
α = 2su0 = = 2 (13.122)
r0 c r0
Usando en (13.122) los valores numéricos G/c2 = 7.425 × 10−29 cm/g, M =

M¯ = 1.99 × 1033 g, y b = R¯ = 6.96 × 1010 cm se obtiene α = 1.74
segundos. Esta cifra, predicha por Einstein [19] en 1915, ha sido confirmada
en múltiples ocasiones.
13.16 La precesión anómala del perihelio de Mer-

curio
Se sabe que la órbita mercurial no es estática, sino que su perihelio rota
alrededor del Sol. Más precisamente, podemos hablar del ángulo que barre
el planeta mientras va del perihelio al apelio. Si se tratara de una elipse
perfecta, tal ángulo serı́a π. Pero las observaciones astronómicas muestran
339
que el ángulo no es exactamente π, lo que significa que la órbita no es exac-
tamente elı́ptica, sino que el perihelio precesa. La velocidad angular de esta
precesión es 5600.73 segundos de arco cada siglo.
La gravitación newtoniana admite dos causas para la precesión. La primera

(que da cuenta de 5025 seg/siglo) se debe a que las observaciones se ha-
cen desde un sistema móvil, rotante, que es la Tierra. La segunda (que da
cuenta de 532 seg/siglo) se debe a las perturbaciones ejercidas por los otros
planetas, especialmente Venus, Tierra y Júpiter. Vemos ası́ que la teorı́a
newtoniana da cuenta de 5025 + 532 = 5557 seg/siglo.
Pero la precesión observada no es 5557 seg/siglo sino 5600.73 seg/siglo.

La diferencia, que es 5600.73 − 5557 = 43.11 parecı́a inexplicable. Y por
eso se llamó “la precesión anómala”del perihelio de Mercurio. La precesión
anómala fue un misterio durante 69 años. Los astrónomos buscaron, sin éxi-
to, una explicación de esta “anomalı́a”hasta que, por fin, Einstein la pudo
explicar [19] en el contexto de su teorı́a gravitacional.
La ecuación (13.113) es
1 − D sD
u02 = + 2 u − u2 + su3
J2 J
Escribámosla de manera factorizada:
u02 = s(u − u1 )(u − u2 )(u − u3 ) (13.123)
Las constantes u1 , u2 y u3 son las soluciones de la ecuación
s(u − u1 )(u − u2 )(u − u3 ) = 0
es decir, u1 , u2 y u3 son los puntos de retorno. Pensemos que u1 y u2 son el

perihelio y el apelio de Mercurio, y que u3 es el tercer punto de retorno, muy
cercano al centro de coordenadas. En este momento escribimos de nuevo la
ecuación (13.103) en términos de las cantidades u1 , u2 y u3 :
u1 + u2 + u3 = 1/s
340
de donde u3 = 1/s − u1 − u2 . Al poner esta expresión en (13.123) se llega a:
µ ¶
02 1
u = s(u − u1 )(u − u2 ) u − + u1 + u2
s
£ ¤
= −(u − u1 )(u − u2 ) 1 − su − s(u1 + u2 )
· ¸
s(u1 + u2 )
= −(u − u1 )(u − u2 )(1 − su) 1 −
1 − su
Como u0 = du/dϕ, esta ecuación es:
· µ ¶¸
s(u1 + u2 ) −1/2
dϕ = ±du −(u − u1 )(u − u2 )(1 − su) 1 −
1 − su
Expresar el lado derecho como el producto de tres factores:
µ ¶
−1/2 −1/2 s(u1 + u2 ) −1/2
dϕ = ±du [−(u − u1 )(u − u2 )] (1 − su) 1−
1 − su
Los dos últimos factores se expanden como potencias de su, que es una
cantidad pequeña, ası́ :
1 1
(1 − su)−1/2 = 1 + su + ... ' 1 + su
2 2
µ ¶
s(u1 + u2 ) −1/2 ¡ ¢−1/2
1− = 1 − s(u1 + u2 )(1 − su)−1
1 − su
' (1 − s(u1 + u2 ))−1/2
1
' 1 + s(u1 + u2 )
2
Entonces regresamos a la ecuación de dϕ para escribir:
µ ¶µ ¶
−1/2 1 1
dϕ = ±du [−(u − u1 )(u − u2 )] 1 + su 1 + s(u1 + u2 )
2 2
341
µ ¶
1 1 + 21 su
= ± 1 + s(u1 + u2 ) p du
2 −(u − u1 )(u − u2 )
Ya estamos en condición de integrar. Se verifica fácilmente que
Z
1 + 21 su 1 p
p du = − s −(u − u1 )(u − u2 ) −
−(u − u1 )(u − u2 ) 2
µ ¶
1 u1 + u2 − 2u
1 + s(u1 + u2 ) arc sen
4 u1 − u2
O sea que
Z ϕ(u2 ) µ ¶
1
dϕ = ± 1 + s(u1 + u2 ) ×
ϕ(u1 ) 2
· µ ¶ ¸¯
1 p 1 u1 + u2 − 2u ¯¯u2
− s −(u − u1 )(u − u2 ) − 1 + s(u1 + u2 ) arc sen ¯
2 4 u1 − u2 u1
µ ¶· µ ¶¸
1 1
ϕ(u2 ) − ϕ(u1 ) = ± 1 + s(u1 + u2 ) −π 1 + s(u1 + u2 )
2 4
µ ¶
3 1 2 2
= ∓π 1 + s(u1 + u2 ) + s (u1 + u2 )
4 8
µ ¶
3
' ∓π 1 + s(u1 + u2 )
4
Escoger el signo positivo:
3π
2 (ϕ(u2 ) − ϕ(u1 )) = 2π + s(u1 + u2 )
2
El último término del lado derecho es la precesión anómala: el ángulo que

se corre el perihelio en cada vuelta:
3π
∆ ≡ s(u1 + u2 )
2
3πGM
= (u1 + u2 )
c2
342
Ahora, podemos expresar a u1 y u2 en términos de la excentricidad ² y el
semieje mayor b:
1
= r1 = (1 − ²)b
u1
1
= r2 = (1 + ²)b , o sea que
u2
6πGM
∆= (13.124)
c2 b(1
− ²2 )
Pongamos en la ecuación (13.124) los datos de Mercurio:
6π(6.67 × 10−8 )(1.99 × 1033 )

∆ =
(3 × 1010 )2 (5.79 × 1012 )(1 − 0.2062 )
= 5.01 × 10−7 rad. cada vuelta
Como el perı́odo es 0.241 años = 0.00241 siglos, tenemos:
5.01 × 10−7
∆ = rad. cada siglo
0.00241
= 44.9 segundos cada siglo
¦¦¦¦¦¦¦¦¦¦¦
La solución de Schwarzschild coincide, a grandes distancias, con la grav-

itación newtoniana. Esto no puede sorprendernos, ya que al construir la
solución relativista nos hemos apoyado firmemente en el potencial gravita-
cional clásico Φ = −GM/c2 r , como puede verse en los pasos que siguen a la
ecuación (13.8). A medianas distancias comienzan a notarse las diferencias
entre las dos teorı́as gravitacionales, con efectos como la precesión del peri-
helio de Mercurio. A cortas distancias las diferencias son radicales: cuando
343
la coordenada r es igual a s aparece un horizonte, es decir, una superficie
que sólo se puede cruzar hacia adentro. Para r < s la relatividad predice
unos efectos sorprendentes: la coordenada t se vuelve espacialoide, la co-
ordenada r se vuelve temporaloide y el centro r = 0 adquiere la cualidad
de atractor inevitable. En lo que resta del capı́tulo vamos a estudiar estos
efectos curiosos.
13.17 Coordenadas temporaloides

y espacialoides
Consideremos de nuevo la trayectoria de un punto que se mueve radialmente.
Haciendo dθ = dϕ = 0 en la ecuación (13.12) escribimos:
(1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 = ds2 (13.125)
Para un pulso de luz se tiene ds2 = 0 y para partı́cula masiva hacemos

ds2 > 0 :
(1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 = 0 , m=0 (13.126)
(1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 > 0 , m 6= 0 (13.127)
En la zona exterior, r > s y la cantidad (1 − s/r) es positiva. Podemos

dividir ambos lados de la desigualdad (13.127) por (1 − s/r) sin afectar el
signo >, para llegar a:
c2 dt2 > (1 − s/r)−2 dr2 (13.128)
Esta desigualdad se cumple únicamente si dt 6= 0 . Esto quiere decir que

el progreso del movimiento, el desarrollo del fenómeno, va necesariamente
acompañado de un cambio en la coordenada t, y por esta razón t se lla-
ma coordenada temporaloide. La desigualdad (13.128) no impone ninguna
condición sobre dr, el cual puede ser positivo, negativo o cero, y por eso a r
le decimos coordenada espacialoide. En la región r > s, la ecuación (13.12)
muestra que al diferencial temporaloide dt lo acompaña el factor positivo
(1 − s/r), mientras que al diferencial espacialoide dr lo acompaña el factor
344
negativo − (1 − s/r)−1 .
Ahora veamos lo que ocurre en la zona interior, r < s : la cantidad (1 − s/r)

es negativa. Si multiplicamos ambos lados de la desigualdad (13.127) por
(1 − s/r) debemos cambiar el signo > por el signo < , ası́:
dr2 > (1 − s/r)2 c2 dt2 (13.129)
Esta desigualdad se cumple únicamente si dr 6= 0 . Esto quiere decir que

el progreso del movimiento, el desarrollo del fenómeno, va necesariamente
acompañado de un cambio en la coordenada r, y por esta razón r se lla-
ma coordenada temporaloide. La desigualdad (13.129) no impone ninguna
condición sobre dt, el cual puede ser positivo, negativo o cero, y por eso a t
le decimos coordenada espacialoide. En la región r < s, la ecuación (13.12)
muestra que al diferencial temporaloide dr lo acompaña el factor positivo
− (1 − s/r)−1 , mientras que al diferencial espacialoide dt lo acompaña el
factor negativo (1 − s/r) .
Reconocemos ası́ que al pasar del exterior al interior las coordenadas t y r in-
tercambian sus papeles: la coordenada temporaloide se vuelve espacialoide,
y la espacialoide se vuelve temporaloide. Esto trae consigo una rotación del
cono de luz, como veremos enseguida.
13.18 El cono de la luz

El cono de luz en un evento dado se construye trazando las curvas lumi-
noides, es decir, aquellas que cumplen la condición ds = 0. Acto seguido se
procede a averiguar en qué dirección está orientado este cono de luz. Con el
propósito de simplificar el análisis, concentrémonos en las coordenadas (r, θ),
de modo que podamos hacer dibujos bidimensionales. Trazamos, cruzándose
en el evento central escogido, los ejes de t y de r, el primero vertical y el
segundo horizontal. En seguida se dibuja la LÍNEA en el mundo de los even-
tos que tienen la misma coordenada espacialoide del evento central. La clave
está en identificar que el cono de luz acoge, rodea a esa LÍNEA, y eso de-
termina la orientación del cono: si la LÍNEA es vertical, entonces el cono de
luz es también vertical, está erguido; y si la LÍNEA es horizontal, entonces
el cono de luz es también horizontal, está acostado. Veamos:
345
Para la región exterior r > s la Figura 13.6 muestra el cono de luz centrado
en el evento A . La lı́nea AB es la trayectoria de un punto que mantiene
constante la coordenada espacialoide r . Como esta lı́nea es vertical, el cono
debe ser vertical, es decir, el pasado está abajo y el futuro arriba. Ningún
objeto puede viajar del futuro al pasado.
Pero en la región interior r < s el análisis trae sorpresas. La Figura 13.7

muestra el cono de luz centrado en el evento C . La lı́nea CD es la trayecto-
ria de un punto que mantiene constante la coordenada espacialoide t . Como
esta lı́nea es horizontal, el cono debe ser horizontal. Pero debemos además
aclarar si el pasado está a la izquierda y el futuro a la derecha, como en la
Figura 13.8, o si, por el contrario, el pasado está a la derecha y el futuro a la
izquierda, como en la Figura 13.9. Demostremos que la Figura 13.9 es la cor-
recta. Una partı́cula masiva que se suelta desde cierta altura sigue la curva
punteada ct de la Figura 13.4, y esa curva indica que el fenómeno progresa
de derecha a izquierda; es decir, la relación pasado-futuro es, en la Figura
13.7, la dirección derecha-izquierda: la Figura 13.9 es la correcta. Todos los
objetos viajan del pasado al futuro, y ninguno viaja del futuro al pasado: en
la región interior r < s todos los objetos se mueven hacia el centro r = 0 ,
y ninguno viaja hacia afuera. El punto r = 0 es el futuro ineludible para
todos los objetos que se encuentren en la región interior r < s .
Los objetos pueden moverse hacia atrás o hacia adelante en la coordena-

da espacialoide, pero sólo pueden moverse hacia adelante en la coordenada
temporaloide. En la región exterior r > s los objetos pueden moverse hacia
atrás o hacia adelante en la coordenada espacialoide r, pero sólo pueden
moverse hacia adelante (hacia t = ∞) en la coordenada temporaloide t .
En la región interior r < s los objetos pueden moverse hacia atrás o hacia
adelante en la coordenada espacialoide t, pero sólo pueden moverse hacia
adelante (hacia r = 0) en la coordenada temporaloide r .
Estas consideraciones ponen de manifiesto uno de los asuntos más intrig-

antes de la fı́sica teórica del siglo XX, que es la existencia de huecos negros.
Un agujero negro, en general, es una región del espacio a la que se puede
entrar, pero no salir: ningún objeto puede cruzar hacia afuera la superficie
que bordea a la región mencionada. Esa superficie recibe el nombre de hor-
izonte. El hueco negro es un corte en el espaciotiempo, es un aislamiento,
una exclusión porque, para los objetos que están dentro, la región exterior
es inaccesible. En el caso particular del espaciotiempo de Schwarzschild, el
hueco negro es el sector r < 0 y el horizonte es la superficie esférica r = s.
346
13.19 Singularidades
Uno de los resultados más curiosos en el problema del cuerpo que se suelta
desde cierta altura es que el tiempo coordenado t se vuelve infinito en el hor-
izonte r = s, como muestra la curva de trazo punteado en la Figura 13.4. Si
este fuera un efecto fı́sico verdadero, la partı́cula nunca llegarı́a al horizonte,
contradiciendo nuestras expectativas. Nos preguntamos si este es un efecto
fı́sico real, o es acaso un defecto de las coordenadas (ct, r). Para responder
la pregunta recordemos que el tiempo propio τ no exhibe ninguna discon-
tinuidad en r = s, como se ve en la curva de trazo continuo de la Figura
13.4. Hay dos tiempos, t y τ , que tienen comportamientos muy diferentes en
el horizonte. ¿Cuál de los dos tiempos es más confiable? La respuesta de esta
pregunta es enfática: τ es más confiable porque es un escalar, es decir, una
cantidad invariante. En conclusión, el hecho matemático de que t sea infinito
en el horizonte no expresa un hecho fı́sico real, sino que es el resultado de
usar unas coordenadas (ct, r) que se comportan mal en r = s; si, en vez de
t usamos un tiempo sano τ , este tiempo propio resulta perfectamente finito
en el horizonte.
Hay otro asunto que pone en evidencia el comportamiento patológico de

las coordenadas (ct, r) en el horizonte, y es que en r = s algunas compo-
nentes del tensor de Riemann Rαβµν valen infinito, tal como puede verse en
la sección 13.2. Si éste fuera un efecto fı́sico verdadero, las fuerzas de marea
serı́an infinitas en r = s, y un cuerpo extenso que atravesara el horizonte
sufrirı́a desgarrones infinitos. Nos preguntamos si éste es un efecto fı́sico re-
al, o es acaso un defecto de las coordenadas (ct, r). El caso mencionado en
el párrafo anterior nos mueve a desconfiar de las coordenadas (ct, r), y en
consecuencia nos preguntamos si existe acaso otro sistema coordenado en
el que el tensor de Riemann sea finito en el horizonte. El hecho es que este
otro sistema coordenado existe, y lo llamamos x̄ en la sección 9.21. El lec-
tor está invitado a reconocer, en la página 249, que todas las componentes
R̄αβµν del tensor de Riemann son finitas y de buena conducta en r = s; esto
quiere decir que en la superficie de Schwarzschild las fuerzas de marea y la
desviación geodésica son finitas. En conclusión, el hecho matemático de que
Rαβµν sea infinito en el horizonte no expresa un hecho fı́sico, sino que es el
resultado de usar unas coordenadas (ct, r) que se comportan mal en r = s;
si, en vez de (ct, r) usamos unas coordenadas sanas x̄, el tensor de Riemann
R̄αβµν queda perfectamente finito en el horizonte.
Las coordenadas (ct, r, θ, ϕ) se comportan mal en la superficie r = s. En
347
términos técnicos, esas coordenadas son singulares en r = s. Hagamos
una pausa para discutir el asunto de las singularidades en una geometrı́a
cualquiera, no necesariamente la de Schwarzschild. Para estudiar las propiedades
geométricas de un espacio cualquiera se debe escoger un sistema coordenado,
y éste debe describir adecuadamente la geometrı́a. Si acaso en algún punto
P de ese espacio las coordenadas no describen [16] fielmente la geometrı́a,
decimos que el sistema coordenado es singular en el punto P . Por ejemplo,
las coordenadas esféricas (θ, ϕ) presentan una singularidad en θ = 0 , porque
allı́ la coordenada ϕ es indefinida, ya que puede tomar cualquier valor entre
0 y 2π ; ası́ mismo, estas coordenadas son singulares en θ = π. La singu-
laridad de las coordenadas (θ, ϕ) en θ = 0, π se manifiesta claramente en
los mapamundis que usan proyecciones cilı́ndricas, que son aquellas en que
los paralelos aparecen como lı́neas rectas horizontales y los meridianos como
rectas verticales. La Figura 13.10 muestra uno de esos mapas. Allı́, la lı́nea
AB representa al polo norte y CD al polo sur. El error del mapa es grave:
el polo norte, que es un punto y tiene extensión cero, está representado en
el mapa por medio de la lı́nea AB , cuya longitud no es cero. Uno se pre-
gunta si este error es un defecto del mapa o es un problema intrı́nseco de la
geometrı́a, y la respuesta es inmediata: desde un punto de vista geométrico,
los polos norte y sur no tienen ninguna peculiaridad, no hay nada en la
geometrı́a intrı́nseca que haga especiales a los polos; entonces el problema
debe ser del mapamundi y la proyección cilı́ndrica falla: las coordenadas
(θ, ϕ) son singulares en los polos.
De regreso a la geometrı́a de Schwarzschild, la sección 13.2 muestra que

el tensor de Riemann diverge5 en r = 0 y en r = s . Ya hemos visto que la
singularidad en r = s es espuria, y por eso recibe el nombre de pseudosingu-
laridad. Pero los infinitos que ocurren en r = 0 tienen6 una explicación fı́sica,
y es que allı́ la densidad de masa es infinita; no nos sorprende que cuando r
tiende a cero el tensor de Riemann y las fuerzas de marea tiendan a valores
infinitos.
5
Ya hemos mencionado en la página 306 que la solución de Schwarzschild no debe ser
válida en el origen de coordenadas r=0, o sea que los Rαβµν de la sección 13.2 no se deben
evaluar en r=0. Para ser más cuidadosos deberı́amos decir que el tensor de Riemann tiende
a infinito en el origen.
6
En general, discernir si una singularidad es fı́sica o si, por el contrario, es un defecto
del sistema coordenado, es un asunto peliagudo, como también lo es, en el segundo caso,
construir otro sistema coordenado libre de singularidades [26, 27].
348
13.20 Las coordenadas de Kruskal-Szekeres
Hemos visto que en la superficie de Schwarzschild r = s las coordenadas
(ct, r, θ, ϕ) presentan varias anomalı́as indeseables: de un lado, gµν y Rαβµν
toman valores infinitos y, de otro lado, tal como muestra la Figura 13.4, la
curva de t versus r es discontinua y tiene una ası́ntota. Ya hemos mencionado
que estas dificultades no reflejan problemas intrı́nsecos de la geometrı́a, sino
que son defectos exclusivamente achacables a las coordenadas (ct, r, θ, ϕ) .
Serı́a bueno encontrar un sistema de coordenadas sano, en el que las lı́neas
en el mundo sean continuas y sin ası́ntotas, un sistema coordenado en el que
gµν y Rαβµν sean funciones regulares. Se han encontrado varias soluciones a
este problema; en efecto, se conocen varios sistemas coordenados que no pre-
sentan las anomalı́as mencionadas, entre los cuales podemos mencionar el de
Eddington-Finkelstein, el de Painlevé-Gullstrand y el de Kruskal-Szekeres.
En esta sección vamos a presentar este último sistema de coordenadas.
Se trata de ejecutar el cambio de coordenadas (ct, r, θ, ϕ) → (v, u, θ, ϕ) ,

donde las nuevas coordenadas (v, u) están definidas de la manera siguiente.
En la región r < s :
p ct
v = er/2s 1 − r/s cosh (13.130)
2s
p ct
u = er/2s 1 − r/s senh , (13.131)
2s
y en la región r > s :
p ct
v = er/2s r/s − 1 senh (13.132)
2s
p ct
u = er/2s r/s − 1 cosh (13.133)
2s
Las transformadas inversas son
ct = 2s arctanh u/v , para r < s (13.134)
ct = 2s arctanh v/u , para r > s (13.135)
(r/s − 1) er/s = u2 − v 2 , para todo r (13.136)
349
La última ecuación debe entenderse como una definición implı́cita de r en
términos de las variables v y u . Tomando diferenciales en las ecuaciones
(13.130), (13.131), (13.132) y (13.133) llegamos a estas expresiones que son
válidas para todos los valores de r :
c 1
dv = u dt + (1 − s/r)−1 v dr
2s 2s
c 1
du = v dt + (1 − s/r)−1 u dr
2s 2s
Elevamos al cuadrado cada una de estas dos ecuaciones y luego restamos

lado a lado, obteniéndose:
1 u2 − v 2 £ 2 ¤
(dv)2 − (du)2 = 2
c (1 − s/r) dt2 − (1 − s/r)−1 dr2
4s 1 − s/r
En el lado derecho podemos usar la ecuación (13.12):
1 u2 − v 2 £ 2 ¤
dv 2 − du2 = 2
ds + r2 (dθ2 + sen2 θ dϕ2 ) ,
4s 1 − s/r
de donde:
1 − s/r
ds2 = 4s2 (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 )
u2 − v 2
Finalmente usamos la ecuación (13.136):
1 − s/r
ds2 = 4s2 (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 )
(r/s − 1) e r/s
4s3 −r/s
ds2 = e (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 ) (13.137)
r
Olvidando las coordenadas angulares (θ, ϕ), la Figura 13.11 muestra el es-
paciotiempo (v, u). En este dibujo se debe entender que r significa r/s y t
350
significa t/s . La gráfica es la superposición de un conjunto de lı́neas rectas
radiales (que son regiones de t constante) y otro conjunto de hipérbolas (que
son regiones de r constante). Las rectas t = ∞ y t = −∞ parten el espaci-
otiempo en cuatro cuadrantes: el de la derecha, el de arriba, el de la izquierda
y el de abajo. Por razones que expondremos prontamente, el cuadrante de
arriba es un agujero negro.
El cono de la luz. Consideremos la trayectoria de un punto que se mueve

radialmente. Haciendo dθ = dϕ = 0 en la ecuación (13.137) escribimos
4s3 −r/s
e (dv 2 − du2 ) = ds2 (13.138)
r
Para un pulso de luz se tiene ds2 = 0 y para partı́cula masiva hacemos

ds2 > 0 :
4s3 −r/s
e (dv 2 − du2 ) = 0 , para la luz (13.139)
r
4s3 −r/s
e (dv 2 − du2 ) > 0 , partı́cula masiva (13.140)
r
La desigualdad (13.140) quiere decir dv 2 > du2 . Esta desigualdad se cumple

únicamente si dv 6= 0 . Vemos ası́ que el progreso del movimiento, el de-
sarrollo del fenómeno, va necesariamente acompañado de un cambio en la
coordenada v, y por esta razón v es una coordenada temporaloide. La de-
sigualdad dv 2 > du2 no impone ninguna condición sobre du, el cual puede
ser positivo, negativo o cero, y por eso u es una coordenada espacialoide.
La coordenada v es temporaloide en todo el espaciotiempo y la coordenada
u es espacialoide en todo el espaciotiempo. Nótese, en la ecuación (13.137),
4s3 −r/s
que al diferencial temporaloide dv lo acompaña el factor positivo e ,
r
mientras que al diferencial espacialoide du lo acompaña el factor negativo
4s3 −r/s
− e .
r
Ahora nos preguntamos cómo se dibuja, en la Figura 13.11, la trayecto-
ria de un punto que mantiene constante la coordenada espacialoide u. La
respuesta es: se traza una lı́nea vertical. Entonces el cono de luz debe tam-
bién ser vertical, con el pasado abajo y el futuro arriba. Los objetos pueden
351
moverse hacia atrás o hacia adelante en la coordenada espacialoide u , pero
sólo pueden moverse hacia adelante en la coordenada temporaloide v (sólo
se pueden mover de abajo hacia arriba en la Figura 13.11).
Los pulsos de luz satisfacen la ecuación (13.139); esta ecuación dice que
du2 = dv 2 , o sea que
du
= ±1 (13.141)
dv
Esta ecuación tiene un significado interesante, pues dice que las trayectorias
de los pulsos de luz tienen una inclinación de ±45 grados en el espacio (v, u) .
Recordando que los conos de luz están bordeados por trayectorias de pulsos
de luz, llegamos a la siguiente conclusión: en el espacio (v, u) los conos de
luz tienen una apertura angular de 90 grados, ası́ como en la relatividad es-
pecial, según la Figura 2.6. Las trayectorias de las partı́culas (masivas o no
masivas) quedan contenidas dentro del cono de luz, es decir, hacen ángulos
de ≤ 45 grados a lado y lado de la dirección vertical en la Figura 13.11. Si
dibujamos lı́neas curvas que en todo punto hacen ángulos de ≤ 45 grados
a lado y lado de la dirección vertical en la Figura 13.11, nos damos cuenta
de que, en el cuadrante de arriba, TODAS estas trayectorias avanzan hacia
valores decrecientes de r , es decir, hacia la hipérbola r = 0 , lo que significa
que este cuadrante es verdaderamente un hueco negro.
En el cuadrante derecho, algunas trayectorias de partı́culas avanzan hacia

valores crecientes de r y otras avanzan hacia valores decrecientes de r , lo que
significa que este cuadrante es el exterior del hueco negro. La frontera entre
el cuadrante derecho y el de arriba, la recta (t = ∞, r = 1) , es la superficie
de Schwarzschild, esa “membrana” que sólo se puede cruzar en una dirección.
En el cuadrante de abajo TODAS las trayectorias de partı́culas avanzan

hacia valores crecientes de r y penetran en los cuadrantes derecho e izquier-
do. Por esta razón, al cuadrante de abajo, en un juego de palabras, se le
podrı́a llamar hueco blanco. Esto del hueco blanco es una ñapa que nos da
la Figura 13.11, pero no podemos precipitarnos a afirmar la existencia real
de estos objetos en el universo [13].
352
t=8 t=8
V(r)
1
Dt2 A B
Dt1
0.5
t=7 t=7 r
1.5 s 2.5 s
Figura 13.1 Las lı́neas curvas Figura 13.2 Potencial efectivo

representan una serie de proyec- para un pulso de luz con J =
tiles que se lanzan periódica- 2.7s . Las marcas A y B denotan
mente de un punto a otro. Co- puntos de retorno.
mo todos los lanzamientos son
idénticos, las lı́neas curvas son
también iguales.
V(r)
8
t
1 A B
6 t
4 t
2
0.5
r
3s 6s s r
Figura 13.3 Potencial efectivo Figura 13.4 Un cuerpo se suelta

para partı́cula masiva con D = desde cierta altura. En trazo con-
0.5 y J = 2.7s . Las marcas A y tinuo el tiempo propio τ , y en
B denotan puntos de retorno. trazo punteado el tiempo coorde-
nado t .
353
t
Futuro
B
s r
A
r Pasado
ro
j
x
Figura 13.5 Un pulso de luz in- Figura 13.6 Fuera del hueco ne-
cide de derecha a izquierda. Su gro, el cono de luz está erguido:
trayectoria se deflecta debido a el pasado abajo y el futuro arri-
la presencia de la masa M en el ba.
origen de coordenadas.
s r
Pasado Futuro
D C
C
Figura 13.7 Dentro del hueco Figura 13.8 Dentro del hue-
negro el cono de luz está acosta- co negro. ¿Está el futuro a la
do. derecha?
A B
Futuro Pasado
C
C D
Figura 13.9 Dentro del hue- Figura 13.10 Proyección

co negro. ¿Está el futuro a la cilı́ndrica: los meridianos son
izquierda? rectas verticales y los paralelos
son rectas horizontales. La recta
AB representa el polo norte, y
recta CD representa el polo sur.
354
v
t=0
t=
8
t = -0.
t =0.5
- 1
t=
t=
r=
2
8 r=
1.3
1
-1.
55
t=
0
32
r= 7
0.
r=
t= 0.9 2
1 -1. r= 1.3
32 t=
1.2
r=
9
r=
1 .0
r=
1.2
1.0
r=
t=- .55
9
0.55 t=0
t=0
0
r=
0.9
r=
-1 0.7
r=
0
8
t= r=
t=
- 1
1 8
r=
-1 0 1 u
Figura 13.11 Coordenadas de Kruskal-Szekeres. Las regiones de t constante son

lı́neas rectas radiales. Las regiones de r constante son hipérbolas. El cuadrante
superior es un agujero negro.
355
356
Apéndice A
La constancia de la velocidad de la luz
Al mirar los tres postulados (1.10) que fundamentan a la relatividad espe-

cial, no se nos escapa que el principio de la constancia de la velocidad de la
luz (que aquı́ llamaremos cortamente PriVel) es de un carácter muy diferente
a los otros dos. En efecto, el principio de la homogeneidad del tiempo y del
espacio (PriHomo) y el principio de la relatividad (PriRel) son extensiones
esperadas de ideas que habı́an estado presentes en el pensamiento cientı́fico
desde hacı́a mucho tiempo. De un lado, a comienzos del siglo XVII, justo
antes de Newton, ya se aceptaba [28] que el espacio es infinito, homogéneo e
isótropo. De otro lado, Newton escribe: “The motions of bodies included in
a given space are the same among themselves, whether that space is at rest,
or moves uniformly forwards in a right line without any circular motion” [29].
El PriVel es inesperado y extraño. Einstein lo introduce abruptamente, sin

motivación manifiesta, en la segunda página del artı́culo en el que presen-
ta su teorı́a de la relatividad especial [2]. La aparición súbita de PriVel lo
hace particularmente difı́cil de aceptar, o entender. Aunque la evolución del
pensamiento cientı́fico no es una secuencia suave y continua de pasos cortos,
sı́ desearı́amos creer que el surgimiento de las ideas cientı́ficas tiene alguna
motivación. El PriVel carece de esta motivación.
El propósito de este capı́tulo es un intento de suministrar la motivación

deseada; en efecto demostraremos que PriVel se puede deducir a partir de
PriHomo, PriRel y de las ecuaciones de Maxwell. En la sección A.1 aplicamos
el PriRel a las ecuaciones de Maxwell. Para esto se requiere un conjunto de
reglas (transformaciones) que relacionen las coordenadas espaciotemporales
de dos observadores inerciales; la sección A.2 establece el tratamiento gen-
eral de esas transformaciones. En la sección A.3 regresamos al análisis de
la sección A.1 y probamos que la luz tiene la misma velocidad en todos los
357
sistemas inerciales.
Con esto queda cumplido el propósito de este capı́tulo, pero no podemos

perder la oportunidad de dar, muy fácilmente, otros dos pasos interesantes:
en la sección A.4 deducimos las transformaciones de Lorentz, y en la sección
A.5 deducimos las reglas de transformación del campo electromagnético.
A.1 El principio de la relatividad

Einstein comienza su artı́culo estudiando dos fenómenos: En el Fenómeno 1
hay un material que conduce la electricidad (un trozo de metal por ejemplo)
en reposo y hay un imán en las cercanı́as que se desplaza con una veloci-
dad v respecto al metal. Es claro que en el metal se produce una corriente
eléctrica que llamaremos i1 . En el Fenómeno 2 hay un imán en reposo y, en
las cercanı́as, hay un trozo de metal que se desplaza con una velocidad −v
respecto al imán. Es claro que en el metal se produce una corriente eléctri-
ca que llamaremos i2 . Si en los dos fenómenos participan imanes iguales
y conductores iguales, y si los arreglos de los dos fenómenos son similares,
podemos afirmar, sin duda, que i1 = i2 . Esto, que i1 sea igual a i2 , es el
hecho observado importante, y nos mueve a pensar que los dos fenómenos
son equivalentes. Pero la teorı́a electromagnética de Maxwell, según se la
entendı́a a finales del siglo XIX y principios del XX, no podı́a aceptar la
equivalencia de los dos fenómenos. De hecho, los fı́sicos suponı́an que las
ecuaciones de Maxwell eran válidas únicamente para un observador en re-
poso respecto al éter y que, portanto, en el Fenómeno 1 es el metal el que
está en reposo respecto al éter (está en reposo absoluto), mientras que en el
Fenómeno 2 el imán es el que está en reposo absoluto.
Para los cientı́ficos de la época los dos fenómenos mencionados eran esencial-
mente diferentes. No habı́a simetrı́a entre las dos situaciones.1 Einstein se
siente incómodo con esta asimetrı́a, y quiere resolverla. Propone entonces que
el PriRel, además de ser válido en los fenómenos de la mecánica, debe tam-
bién ser válido en los fenómenos electromagnéticos: todos los observadores
inerciales deben ser igualmente legı́timos. El viejo observador en reposo re-
specto al éter, el que estaba en “reposo absoluto”, no es más importante
que los otros. El éter no es necesario, como tampoco lo son las nociones de
1
La asimetrı́a se hacı́a patente en que, para ellos, en el Fenómeno 1 hay un campo
eléctrico (de este campo eléctrico da cuenta la ecuación de Maxwell c∇ × E = −∂B/∂t),
mientras que en el Fenómeno 2 no hay ningún campo eléctrico.
358
reposo absoluto ni espacio absoluto.
Para entender que las leyes del electromagnetismo son válidas en todos los
observadores inerciales se necesitan tres cosas: Primero, averiguar cómo es la
verdadera transformación de coordenadas (t, x, y, z) → (t0 , x0 , y 0 , z 0 ). Segun-
do, averiguar cómo es la transformación de los campos (E, B) → (E0 , B0 ). Y
tercero, que los pasos Primero y Segundo se unan de modo que las ecuaciones
de Maxwell sean covariantes. Einstein decide resolver primero el problema
(t, x, y, z) → (t0 , x0 , y 0 , z 0 ) (introduciendo un nuevo principio, el de la ve-
locidad de la luz) y deja para después el problema (E, B) → (E0 , B0 ) y la
covariancia de las ecuaciones. Nosotros ahora, en este apéndice, tomaremos
otra ruta: Supondremos que las ecuaciones de Maxwell son covariantes; con
ésto y con PriHomo demostraremos la constancia de la velocidad de la luz,
hallaremos cómo debe ser la transformación (t, x, y, z) → (t0 , x0 , y 0 , z 0 ) y de-
duciremos la transformación (E, B) → (E0 , B0 ).
Para aplicar el PriRel cuantitativamente utilizamos los dos observadores

inerciales O y O0 . Para O, dos de las ecuaciones de Maxwell en el vacı́o son:
1 ∂E
= ∇×B (A.1)
c ∂t
1 ∂B
= −∇ × E (A.2)
c ∂t
Para el observador O0 las ecuaciones correspondientes son
1 ∂E0
= ∇0 × B0 (A.3)
c0 ∂t0
1 ∂B0
= −∇0 × E0 (A.4)
c0 ∂t0
Probaremos que c0 = c, es decir, que la velocidad de la luz es la misma para

todos los observadores inerciales.
De la ecuación (A.1) tomamos la parte y , y de la ecuación (A.2) tomamos

la parte z :
1
∂t Ey = ∂z Bx − ∂x Bz (A.5)
c
359
1
∂t Bz = ∂y Ex − ∂x Ey , (A.6)
c
∂
donde, tal como hemos hecho en otras ocasiones, ∂t quiere decir , etc.
∂t
Para O0 las ecuaciones correspondientes son:
1
∂t0 Ey0 = ∂z 0 Bx0 − ∂x0 Bz0 (A.7)
c0
1
∂t0 Bz0 = ∂y0 Ex0 − ∂x0 Ey0 (A.8)
c0
Supondremos que las ecuaciones de Maxwell expresan leyes fı́sicas, de man-

era que a ellas se aplica el PriRel. En particular, las ecuaciones (A.5) y (A.6)
deben ser equivalentes a las ecuaciones (A.7) y (A.8). Debe existir entonces
un conjunto de cuatro funciones que expresen las coordenadas primadas
(t0 , x0 , y 0 , z 0 ) en términos de las no primadas (t, x, y, z); a esto nos dedicamos
enseguida.
A.2 Transformaciones
Recordemos que las cuatro ecuaciones (1.28) se obtuvieron utilizando única-
mente los principios de la relatividad y de la homogeneidad del espacio y el
tiempo. Reescribamos este conjunto de ecuaciones
t0 = a00 t + a01 x (A.9)

0
x = a11 (x − vt) (A.10)
0
y = y (A.11)
z0 = z (A.12)
Los tres coeficientes desconocidos a00 , a01 y a11 son funciones de la velocidad
v, o sea que deberı́amos escribir, propiamente, a00 (v), a01 (v) y a11 (v). Antes
de seguir adelante, probaremos que los coeficientes a00 (v) y a11 (v) satisfacen
las siguientes condiciones:
a00 (v) > 0 (A.13)

a11 (v) > 0 (A.14)
360
a00 (−v) = a00 (v) (A.15)
Para probar estas fórmulas consideremos el plano x = 0 ; de acuerdo con las

ecuaciones (A.9) y (A.10), los eventos de este plano satisfacen las ecuaciones
t0 = a00 (v) t (A.16)

x0 = −a11 (v) vt (A.17)
Para estos eventos la condición t > 0 debe implicar que t0 > 0; entonces, en
vista de la ecuación (A.16), el coeficiente a00 (v) debe ser positivo; esto prue-
ba la ecuación (A.13). De la misma manera, para estos eventos la condición
t > 0 debe implicar que x0 < 0; entonces, en vista de la ecuación (A.17),
el coeficiente a11 (v) debe ser positivo; esto prueba la ecuación (A.14). Para
probar la ecuación (A.15) consideramos otro observador O00 que se mueve,
respecto a O, con velocidad v en la dirección −x ; en vista de la ecuación
(A.16) escribimos:
t00 = a00 (−v) t (A.18)
Ahora, t00 debe ser igual a t0 ; entonces la ecuación (A.18) es t0 = a00 (−v) t . Al
comparar esta ecuación con la ecuación (A.16) vemos que a00 (−v) = a00 (v).
Esta es la prueba de la ecuación (A.15).
A.3 La velocidad de la luz

En el capı́tulo 1 seguimos la exposición convencional: se presentan los tres
principios de la relatividad especial y a partir de ellos se deducen las trans-
formaciones de Lorentz. Luego, en la sección 4.1 y de nuevo en la sección
6.5 se dedujeron las transformaciones de los campos electromagnéticos E y
B. Tal como indicamos hace poco, en este Apéndice tomaremos otra ruta.
Asumiremos válidos el principio de la homogeneidad del espacio y el tiempo,
el principio de la relatividad y algunas de las ecuaciones de Maxwell; y a
partir de estos supuestos, deduciremos las transformaciones de Lorentz y
deduciremos las reglas de transformación de E y B .
Las cuatro ecuaciones (A.9)-(A.12) son una familia de transformaciones.

Dos miembros de esta familia son las transformaciones de Galileo y las de
361
Lorentz. La transformaciones galileanas se obtienen haciendo a00 = a11 = 1
y a01 = 0. Demostraremos que las transformaciones de Lorentz se obtienen
al aplicar el PriRel a las ecuaciones de Maxwell, es decir, explotando la
equivalencia que existe entre las ecuaciones (A.5), (A.6) y las ecuaciones
(A.7), (A.8).
Para tal efecto, las derivadas no primadas ∂t , ∂x , ∂y , ∂z se expresarán

en términos de las derivadas primadas ∂t0 , ∂x0 , ∂y0 , ∂z 0 , de modo que
las ecuaciones (A.5) y (A.6) se “conviertan” en otras ecuaciones que usan
derivadas primadas. Al comparar término a término las ecuaciones “conver-
tidas” con las ecuaciones (A.7) y (A.8), descubriremos la constancia de la
velocidad de la luz. Esto nos llevará a las transformaciones de Lorentz en
la sección A.4 y a las transformaciones del campo electromagnético en la
sección A.5.
Para escribir las derivadas no primadas en términos de las primadas us-

amos la regla de la derivación en cadena. Se ve fácilmente que, usando las
ecuaciones (A.9)-(A.12), la regla de la derivación en cadena da:
∂t = a00 ∂t0 − va11 ∂x0

∂x = a11 ∂x0 + a01 ∂t0 (A.19)
∂y = ∂y0 ∂z = ∂z 0
Colocamos estas derivadas en las ecuaciones (A.5) y (A.6) para obtener:
µ ¶ ³
1 c0 v ´
∂t0 a00 Ey + a01 c0 Bz
= ∂z 0 Bx − ∂x0 a11 Bz − Ey (A.20)
c0 c c
µ 0 ¶ ³
1 c 0 v ´
∂t 0 a B
00 z + a 01 c Ey = ∂ 0
y x E − ∂ 0 a
x 11 Ey − Bz (A.21)
c0 c c
Comparemos estas dos ecuaciones con las ecuaciones (A.7) y (A.8); los cam-
pos en la ecuación (A.7) deben ser proporcionales a los campos en la ecuación
(A.20):
µ ¶
c0
Ey0 = f a00 Ey + a01 c0 Bz (A.22)
c
Bx0 = f Bx (A.23)
362
v
Bz0 = f a11 (Bz − Ey ) (A.24)
c
Aquı́, f (v) es una función que depende solamente del parámetro v. De la

misma manera, introducimos una función g(v) para comparar la ecuación
(A.8) con la ecuación (A.21):
µ ¶
c0
Bz0 = g a00 Bz + a01 c0 Ey (A.25)
c
Ex0 = g Ex (A.26)
v
Ey0 = g a11 (Ey − Bz ) (A.27)
c
Las funciones f (v) y g(v) son desconocidas. Pasamos a probar que g(v) =
f (v). Para tal efecto notemos que los lados derechos de las ecuaciones (A.22)
y (A.27) deben ser iguales:
v c0
ga11 Ey − g a11 Bz = f a00 Ey + f a01 c0 Bz
c c
Los coeficientes de Ey deben ser iguales entre sı́, y los de Bz también deben
ser iguales entre sı́:
c0
g a11 = f a00 (A.28)
c
v
−g a11 = f a01 c0 (A.29)
c
Del mismo modo, al igualar los lados derechos de las ecuaciones (A.24) y
(A.25) obtenemos:
c0
f a11 = g a00 (A.30)
c
v
−f a11 = g a01 c0
c
Con una mirada a las ecuaciones (A.28) y (A.30) nos damos cuenta de que
363
g 2 = f 2 , es decir, g = ±f . Para descubrir cuál de los dos signos es adecuado,
se pone la condición g = ±f en la ecuación (A.28), obteniéndose
c0
a11 = ± a00
c
Sin embargo, de acuerdo con las ecuaciones (A.13) y (A.14), los coeficientes
a00 y a11 son positivos, o sea que debemos escoger el signo superior: g = +f .
Poniendo la condición g = f en las ecuaciones (A.28) y (A.29) se obtiene
c0
a11 = a00 (A.31)
c
v
− a11 = a01 c0
c
Estas dos ecuaciones implican que
v
a01 = − a00 (A.32)
c2
En vista de las ecuaciones (A.31) y (A.32) y la condición g = f , reescribi-

mos las seis ecuaciones de transformación (A.22)-(A.27) de esta manera
compacta:
Ex0 = f (v) Ex0 (A.33)
Bx0 = f (v) Bx0 (A.34)

c0 ³ v ´
Ey0 = f (v) a00 (v) Ey − Bz (A.35)
c c
c0 ³ v ´
Bz0 = f (v) a00 (v) Bz − Ey (A.36)
c c
Demostremos rápidamente que f (v) debe ser una función par de v. Para tal
efecto supongamos que Ey = 0, de modo que la ecuación (A.36) da
c0
Bz0 = f (v) a00 (v) Bz (A.37)
c
364
Ahora consideremos otro observador inercial O00 que se mueve, respecto a O,
con velocidad v en la dirección −x ; en vista de la ecuación (A.37) escribimos:
c0
Bz00 = f (−v) a00 (−v) Bz (A.38)
c
Claramente, Bz0 y Bz00 deben ser iguales, y podemos formar una nueva ecuación
con los lados derechos de las ecuaciones (A.37) y (A.38):
c0 c0
f (v) a00 (v) Bz = f (−v) a00 (−v) Bz ,
c c
o sea que, apoyándonos en la ecuación (A.15):
f (−v) = f (v) (A.39)
Para hallar el recı́proco del sistema de ecuaciones (A.35) y (A.36) inter-

cambiamos variables primadas y no primadas, y escribimos −v en vez de
v:
c ³ v 0´
Ey = f (−v) a00 (−v) Ey0 + B
c0 c0 z
c ³ v ´
Bz = f (−v) a00 (−v) 0 Bz0 + 0 Ey0 ,
c c
y usamos las ecuaciones (A.15) y (A.39):
c ³ v ´
Ey = f (v) a00 (v) Ey0 + 0 Bz0
c0 c
c ³ v 0´
0
Bz = f (v) a00 (v) 0 Bz + 0 Ey
c c
Finalmente, ponemos estas expresiones de Ey y Bz en el lado derecho de la

ecuación (A.35) para obtener:
·µ ¶ µ ¶ ¸
v2 1 1
Ey0 = f 2 a200 0
1 − 0 Ey + v 0 − Bz0 (A.40)
cc c c
365
Ya que Ey0 y Bz0 son variables independientes, los coeficientes de Ey0 en ambos
lados de la ecuación deben ser iguales, y los coeficientes de Bz0 también:
µ ¶
v2
1 = f 2 a200 1− 0 (A.41)
cc
1 1
0 = − (A.42)
c0 c
La ecuación (A.42) dice que
c0 = c (A.43)
En palabras, la velocidad de la luz es la misma en todos los sistemas de

referencia inerciales.
A.4 Las transformaciones de Lorentz

Si usamos la ecuación (A.43) en la ecuación (A.41) se obtiene
µ ¶
v2
f 2 a200 1 − 2 = 1 ,
c
1 1
y en vista de la ecuación (A.13) llegamos a a00 = p :
|f | 1 − v 2 /c2
γ
a00 = (A.44)
|f |
1
Aquı́ estamos usando el sı́mbolo convencional γ = p . Ha llegado
1 − v 2 /c2
el momento de agrupar las ecuaciones (A.31), (A.32), (A.43) y (A.44) para
reescribir las ecuaciones de transformación (A.9) y (A.10):
γ v
t0 = (t − 2 x) (A.45)
|f | c
γ
x0 = (x − vt) (A.46)
|f |
366
Ahora demostraremos que la función |f | que aparece en estas ecuaciones es 1.
Consideremos un pulso de luz que conecta los p eventos (0,0,0,0) y (t, x, y, z).
x2 + y 2 + z 2
La velocidad c es espacio sobre tiempo: c = ; de aquı́ se sigue
t
que
c2 t2 − (x2 + y 2 + z 2 ) = 0 (A.47)
Similarmente:
c02 t02 − (x02 + y 02 + z 02 ) = 0 (A.48)
Queremos escribir esta ecuación en términos de variables no primadas, y para

tal efecto ponemos las ecuaciones (A.11), (A.12), (A.43), (A.45) y (A.46) en
la ecuación (A.48), obteniéndose ası́:
1 2 2
(c t − x2 ) − y 2 − z 2 = 0
f2
Al comparar esta ecuación con la ecuación (A.47) descubrimos que f 2 = 1,

lo que significa que |f | = 1, y los denominadores de las ecuaciones (A.45) y
(A.46) se simplifican. Por último, utilicemos las ecuaciones (A.11), (A.12),
(A.45) y (A.46) para escribir la forma final de las transformaciones de
Lorentz
v
t0 = γ (t − x)
c2
x0 = γ (x − vt) (A.49)
y0 = y , z0 = z
A.5 Regreso al campo

Hemos probado que |f | = 1, es decir, que f = ±1. Debemos decidir cuál de
los dos signos es el correcto. Si insertamos la condición f = ±1 en la ecuación
(A.33) se obtiene Ex0 = ±Ex ; el signo inferior no sirve, porque implicarı́a una
inversion increı́ble Ex0 = −Ex . Por esta razón escogemos el signo superior y
367
escribimos f = 1. Ya estamos en condición de usar las ecuaciones (A.43) y
(A.44) en las transformaciones (A.33)-(A.36), para obtener:
Ex0 = Ex (A.50)
³ v ´
Ey0 = γ Ey − Bz (A.51)
c
0
Bx = Bx (A.52)
³ v ´
Bz0 = γ Bz − Ey (A.53)
c
Estas son cuatro de las seis ecuaciones de transformación que estábamos

buscando. Aún nos falta por averiguar las ecuaciones de Ez0 y By0 . Para tal
efecto anotemos rápidamente que, de acuerdo con los resultados obtenidos,
las derivadas (A.19) se han simplificado:
∂t = γ ∂t0 − vγ ∂x0
∂x = γ ∂x0 − (vγ/c2 ) ∂t0 (A.54)
∂y = ∂y0 ∂z = ∂z 0
Estas son, por supuesto, las mismas ecuaciones (1.44). La parte z de la

ecuación (A.1) es
1
∂t Ez = ∂x By − ∂y Bx , (A.55)
c
y la parte z de la ecuación (A.3) es
1
∂t0 Ez0 = ∂x0 By0 − ∂y0 Bx0 (A.56)
c
Utilizando las derivadas (A.54) en la ecuación (A.55) llegamos a:
γ ³ v ´ ³ v ´
∂t Ez + By = γ ∂x By + Ez − ∂y0 Bx
0 0
c c c
Al comparar esta ecuación con (A.56) introducimos una función h(v), de-
sconocida hasta el momento:
368
³ v ´
Ez0 = h(v) γ Ez + By
³ c
0 v ´
By = h(v) γ By + Ez
c
Bx0 = h(v)Bx
En este momento comparamos la última ecuación con (A.52), y esto nos

muestra que h(v) = 1. Escribamos finalmente las dos ecuaciones que nos
faltaban:
³ v ´
Ez0 = γ Ez + By (A.57)
c
³ v ´
By0 = γ By + Ez (A.58)
c
A.6 Conclusiones
En su artı́culo [2], Einstein propone el PriVel y el PriRel, asume el PriHo-
mo y con estas tres bases deduce las transformaciones de Lorentz. Final-
mente toma el PriRel, las ecuaciones de Maxwell y las transformaciones de
Lorentz recién obtenidas, para deducir las transformaciones del campo elec-
tromagnético. A esta estructura lógica la llamaremos la estructura standard
de la relatividad.
Pero el artı́culo de Einstein también se puede leer de atrás hacia adelante,

tal como hemos hecho en este apéndice: Se asumen el PriHomo y el PriRel;
se asume que las ecuaciones de Maxwell verdaderamente representan a las
leyes fı́sicas del electromagnetismo, y esto nos permite aplicar el PriRel a las
ecuaciones de Maxwell. A partir de aquı́ se deducen fácilmente la constancia
de la velocidad de la luz, las transformaciones de Lorentz y las transfor-
maciones del campo electromagnético. Esta será llamada la otra estructura
lógica de la relatividad.
Queremos resaltar que en la otra estructura la constancia de la velocidad

de la luz es un teorema, mientras que en la estructura standard el PriVel
es un postulado. Mientras en la standard el PriVel aparece súbitamente, sin
motivación explı́cita, en la otra estructura la constancia de la velocidad de
la luz aparece más suavemente, pues es un resultado de otras suposiciones
369
más familiares, más fáciles de aceptar.
La estructura standard se basa en el PriVel, y refiriéndose este principio

a la luz, la estructura standard está vinculada al electromagnetismo. Ahora,
años después, nosotros reconocemos que Einstein podrı́a haber basado su
relatividad, no en el PriVel, sino en esta generalización: “cualquier partı́cu-
la no masiva se mueve con una velocidad c que es la misma para todos
los observadores inerciales”. Vemos ası́ que la conexión entre la estructura
standard y el electromagnetismo no es muy fuerte. En cambio, en la otra
estructura las ecuaciones de Maxwell para el electromagnetismo juegan un
papel esencial. En la comparación entre estas dos estructuras lógicas de la
relatividad podemos avanzar algunos comentarios:
1. Si se llegara a encontrar algún defecto en la teorı́a de Maxwell, esto prob-

ablemente repercutirı́a muy fuertemente en la otra estructura, pero quizás
la estructura standard podrı́a salir ilesa. Vemos ası́ que la standard es una
estructura más robusta que la otra.
2. En la otra estructura la relatividad aparece, en cierto modo, como una

parte del electromagnetismo. En otras palabras, la relatividad le da realce
a la teorı́a de Maxwell.
3. Hemos usado la covariancia de las ecuaciones de Maxwell para construir

la otra estructura. Probablemente no sea equivocado pensar que, usando
otras teorı́as fı́sicas (QCD, por ejemplo), se podrı́an construir aún otras es-
tructuras para la relatividad.
4. La importancia del PriRel ya ha sido ampliamente reconocida durante

un siglo. Pero la existencia de otra estructura, o aún otras estructuras, nos
muestra un PriRel más fértil: cuando éste se une a una teorı́a fı́sica concreta,
dan a luz a la teorı́a de la relatividad.
5. Dar a luz a la relatividad es algo enorme, ya que ésta establece la métrica

del espaciotiempo. En efecto, la relatividad contiene las transformaciones
de Lorentz, y éstas dan pie a la métrica de Minkowski, que es la métrica
del espaciotiempo. El espaciotiempo no es una simple acumulación de even-
tos, sino que además tiene una métrica, una estructura. Vemos ası́ que la
métrica del espaciotiempo resulta, en parte, del contacto con las leyes fı́sicas,
como el electromagnetismo por ejemplo. En nuestra mente, podemos imag-
inar que el espaciotiempo es una simple yuxtaposición de puntos hasta que
370
las leyes de la naturaleza, las que rigen a los objetos fı́sicos, le imprimen a
esa yuxtaposición una estructura, una métrica, una organización.
371
372
Bibliografı́a
[1] H.A. Lorentz: Versuch einer Theorie der elektrischen und optischen
Erscheinungen in bewegten Körpern, Leiden,(1905). Traducido al inglés
como Michelson’s interference experiment, en Referencia [5]
[2] A. Einstein: Zur Elektrodynamik bewegter Körper, Annalen der

Physik, 17,(1905). Traducido al inglés como On the electrody-
namics of moving bodies, en Referencia [5]. Existe otra traduc-
ción al inglés: H.M. Schwarz, Am.J.Phys. 45, 18(1977). Internet:
http://dbserv.ihep.su/ elan/src/einstein05b/eng.pdf
[3] A. Einstein: Ist die Trägheit eines Körpers von seinem Energiegehalt
abhängig?, Annalen der Physik, 17,(1905). Traducido al inglés como
Does the inertia of a body depend upon its energy-content? en Referen-
cia [5]. Internet: http://dbserv.ihep.su/ elan/src/einstein05c/eng.pdf
[4] H.A. Lorentz: Electromagnetic phenomena in a system moving with

any velocity less than that of light, Proceedings of the Academy of Sci-
ences in Amsterdam, 6, 1904. Traducido al inglés en Referencia [5]
[5] The Principle of Relativity, Dover,New York (1952)
[6] R. Resnick: Introduction to Special Relativity, Wiley,New York (1968)
[7] J.D. Jackson: Classical Electrodynamics, Wiley,New York (1975)
[8] Referencia [7], sección 11.9
[9] Referencia [7], sección 14.1
[10] H. Minkowski: Raum und Zeit, Ponencia en la 80 Asamblea de

Cientı́ficos Naturales y Médicos Alemanes, en Colonia, el 21 de sep-
tiembre de 1908. Traducido al ingés bajo el tı́tulo Space and Time, en
Referencia [5]
373
[11] S. Weinberg: Gravitation and Cosmology: Principles and Applications
of the General Theory of Relativity, Wiley,New York (1972)
[12] G.B. Thomas: Calculus and Analytic Geometry, Addison-

Wesley,Reading (1965)
[13] H. Ohanian, R. Ruffini: Gravitation and Spacetime, Second Edition,

Norton,New York(1994)
[14] I.S. Gradshteyn, I.M. Ryzhik: Table of Integrals, Series and Prod-
ucts, Academic Press,New York(1983), fórmula 2.599.6
[15] D.C. Kay: Tensor Calculus, Schaum’s Outlines, Mc Graw Hill,New

York(1988)
[16] B.F. Schutz: A first course in general relativity, Cambridge U.

Press,Cambridge(1999)
[17] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungs-

berichte, 1915, p.2, pp. 778-786

berichte, 1915, p.2, pp. 799-801

berichte, 1915, p.2, pp. 831-839

berichte, 1915, pt.2, pp. 844-847
[21] J. Mehra: Einstein, Hilbert, and The Theory of Gravitation, Rei-

del,Dordrecht (1974)
[22] L.D. Landau, E.M. Lifshitz: Teorı́a clásica de campos, Re-

verté,Barcelona (1966)
[23] K. Schwarzschild: Ueber das Gravitationsfeld eines Massenpunk-

tes nach der Einsteinschen Theorie, Preuss.Ak.Wiss.Sitzungsber, 189-
196(1916)
[24] A.P. Lightman, W.H. Press, R.H. Price, S.A. Teukolsky:

Problem book in relativity and gravitation, Princeton U. Press,Princeton
(1975)
[25] H. Goldstein: Mecánica Clásica, Aguilar,Madrid(1963), ec. 3-34
374
[26] R. Wald: General Relativity, U. Chicago Press,Chicago (1984)
[27] R. Torretti: Relativity and Geometry, Dover, New York(1996)
[28] M. Jammer: Concepts of Space (Dover, New York, 1993), p. 110
[29] I. Newton: Mathematical Principles of Natural Philosophy (Ency-

clopaedia Britannica Inc., Chicago, 1952), Corolary V, p. 19
375
Índice Alfabético
Aµ , 148–157, 182, 193–197 observador en, 276, 278

Aberración de la luz, véase Luz Cálculo variacional, 177, 253–256
Absoluto Calor, 73
carga eléctrica, 43 Cambiar (,) → (;), véase Regla
E · B y E 2 − B 2 , 99–101, 159 Campo
equilibrio, 81 de alambre recto, 104
intervalo, 33, 199 de carga móvil, 102
izquierda-derecha, 56 eléctrico, 102, 106, 147–159
pasado-futuro, 56 electromagnético, 93–115, 147–159,
Acción, 180, 186 170–172, 182, 185–197
A, 180 en general, 185
Aceleración, 31, 49, 83, 140, 315 gravitatorio, véase Campo gravita-
Acelerador, 87, 315 torio
Acople mı́nimo, 281 inducido, 98
Adaptadas, véase Coordenadas magnético, 85–89, 102, 106, 147–159
Adición Campo gravitatorio, 273, 287
de aceleraciones, 31, 49 constante, 299
de velocidades, 31, 45 estático, 296, 299, 302, 314
Afı́n estacionario, 299, 302
conexión, véase Γµ αβ
isótropo, 301
parámetro, véase Parámetro
y caı́da libre, 274, 317
Agujero blanco, véase Schwarzschild
y geodésicas, 274, 317
Agujero negro, véase Schwarzschild
y leyes fı́sicas, 273, 278
Aislado, 15, 169
Carga eléctrica, 43, 297
Alambre recto, 104
de alambre recto, 104
Anulando E o B, 108–110
densidad, 105
Apelio, véase Schwarzschild
Arago, 5 móvil, 102
Átomo, 74 Cartesianas, véase Coordenadas
de hidrógeno, 82, 301 Causalidad, 52, 345, 351
Atraso, véase Relojes Christoffel, véase Γµ αβ
Cı́clica, véase Coordenadas
β, 124 Ciclotrón, 85, 315
Bianchi, 238, 294 Cilı́ndricas, véase Coordenadas
Big-bang, 76, 317 Cı́rculo, 311
Biot-Savart, 106 máximo, 233, 234, 253, 265
Bradley, 4, 144 Conexión afı́n, véase Γµ αβ
Cónicas, 337, 340
Caı́da libre, 274, 277 no cónicas, 337, 340
376
Cono de la luz, 52, 55, 56, 345, 351 fuerza de Lorentz, 114
Conservación las ecuaciones de las leyes, 220
de energı́a-momentum, 166–175, 189– Covariante
197, 280, 284 ecuación, 137, 139
de la energı́a, 69 ı́ndice, 125, 204
del momentum, 14, 61–65, 69 manifiestamente, 147
del momentum angular, 172–175 no manifiestamente, 147
del número de partı́culas, 163 Curvo, véase Espacio curvo
Constante cosmológica Λ, 294
Constantes del movimiento, 258–267, 299 D, 316, 320
en Schwarzschild, véase Schwarzschild Deflexión de la luz, véase Schwarzschild
Continuidad, véase Ecuación
δ de Dirac, 162–169, 172
Contracción de la longitud, 41, 44, 54
δ de Kronecker, 121, 127, 132, 210, 237
Contravariante, véase Índices
Densidad
Coordenada espacialoide, 344–346, 351
de carga, 43, 105, 110
Coordenada temporal, 298, 302
de corriente, 161
Coordenada temporaloide, 344–346, 351
de energı́a, 103, 191, 296
Coordenadas
de masa, 287
adaptadas, 236
de momentum, 191
cartesianas, 199, 214, 263, 265, 278,
de partı́culas, 161
280
lagrangiana, 186
cı́clicas, 259, 260, 263, 266, 299, 317
propia, 43
cilı́ndricas, 201, 260, 263
continuas, 185 Derecha, 55, 56
de Eddington-Finkelstein, 349 Derivada, 133, 210
de Kruskal-Szekeres, 349 covariante, 213, 226, 237, 279
de Ohanian, 298, 300 en una curva, 267
de Painlevé-Gullstrand, 349 es tensorial, 134, 211
esféricas, 214, 233, 248, 265, 302, no es tensorial, 211
348 simple, 201, 213, 237, 279
geodésicas, 276, 277 Desincronización de relojes, 36
singulares, 348 Desligada, véase Schwarzschild
Corriente Desviación
de momentum, 164 de rayo de luz, véase Luz
de partı́culas, 163 geodésica, véase Geodésica
del momentum angular, 172–175 Deuterón, 74
eléctrica, 110, 143, 164, 297, 358 Diferencial
en alambre recto, 104 D sı́ es covariante, 267
en circuito eléctrico, 107 d no es covariante, 212, 267
Corrimiento al azul, 144, 316 de volumen, 136, 221
Corrimiento al rojo Dilatación del tiempo, 37, 44, 55
big bang, 317 Dirac, véase δ de Dirac
efecto Doppler, 144, 317 Divergencia
gravitacional, 316 covariante, 280, 293
Coulomb, 149 de θµν , 170, 192, 196
Covariancia de de J µ , 164, 165
µνδ
ecuaciones de Maxwell, 111–114, 147– de Mmec , 172–175
µν
157, 359, 369 de T , 166–175, 189–197, 280
electrodinámica, 111–115, 147–159 Doppler, véase Efecto Doppler
377
E = mc2 , 62, 67, 69–75 Espacio
Ecuación tensorial, véase Ecuación co- curvo, 233, 234, 250, 269, 274, 307
variante de Minkowski, 215, 218
Ecuación de Riemann, 199, 253
covariante, 137, 139, 148, 218, 220, de Schwarzschild, véase Schwarzschild
228, 256, 278, 287 euclidiano, 233, 234
de continuidad, 151, 162, 164, 165 no euclidiano, 234, 311
de Euler-Lagrange, 180, 181, 183, plano, 233, 306
187, 194, 254 Estático, véase Campo gravitatorio
de fuentes, 287 Estacionario, 253, véase Campo gravita-
de geodésica, véase Geodésica torio
de Hilbert-Einstein, 288, 292 ηµν , 120, 215, 276
de Hilbert-Einstein inconsistente, 298 Éter, 1–11, 13, 358
de ondas, 152 Euclidiano, véase Espacio
de Poisson, 287 Euler-Lagrange, véase Ecuación de Euler-
de tercer grado, véase Schwarzschild Lagrange
del intervalo, 258, 260, 262, 264, 266 Experimento
Ecuaciones de Maxwell, 6, 93–99, 111– de Michelson-Morley, véase Michel-
114, 147–157, 358, 359, 369 son y Morley
en campo grav., 285 Extremal, 253
homogéneas, 150, 156, 193
inhomogéneas, 150, 156, 193 Fase de una onda, 144
Efecto Doppler, 79, 144, 317 Φ, 287, 305, 343
Einstein segunda derivada, 287
convención de, 119 Filtro de velocidades, 86
en 1905, 20, 74, 93, 357, 369 Fı́sica nuclear, 74
en 1912, 51 Fisión nuclear, 75
en 1915, 287, 294, 301, 339, 340 Fizeau, 2
joven, 2 F µν , 155, 193–197, 217
viejo, 74 Fotón, 68, 74, 75, 79, 142
Electrodinámica, 147–159 Frente de onda, 144
Electromagnetismo, 2, 6, 93–115 Fresnel, 4, 6, 47
Electrón, 82, 87 Fuerza, 65–69, 82
Energı́a-momentum, 166–175, 280, 294, de Lorentz, 114, 147, 152–154, 157,
304, 306 182
no gravitacional, 280, 294, 297 gravitacional, 274
Energı́a, 62, 69–75 Fusión nuclear, 75
de enlace, 74 Futuro, 52, 55, 56, 346, 351
cinética, 65–69
del campo E, B, 103 G: constante gravitacional, 273, 275, 287
Eötvös, 276 Galaxias, 76
²αβγδ , 133 Galileo, 12, 24, 26, 46, 324, 361
Eridani, 317 Γµ αβ , 222, 274, 276, 281, 288
Escalar, 111, 129, 132, 136, 178, 188, 209, Gauge, 148
222, 228, 302 condición de, 149
de curvatura R, 230, 244, 287 de Coulomb, 149
E · B y E 2 − B 2 , 99–101, 159 de Lorentz, 149, 150
Esféricas, véase Coordenadas Gauss, véase Teorema de Gauss
Espacialoide, 51, 52, 344–346, 351 Geodésica, 253, 274, 288
378
coordenadas, véase Coordenadas covariantes, 125, 204
desviación, 269, 275 griegos, 119
ecuación algebraica, 260 latinos, 119
ecuación diferencial, 253, 262, 277 libres, 123, 139, 200
estacionario, 253 Inercia, 73
extremal, 253 Inercial, véase Observador
Geodésico postulado, 274 Interacción, 182, 273, 288
Geometrı́a Intervalo, 76, 120, 123, 140, 177, 201,
de Riemann, 199–251 209, 253, 273, 302
de Schwarzschild, véase Schwarzschild espacialoide, 34, 51, 52
euclidiana, 33, 132 luminoide, 35, 39, 51, 52
intrı́nseca, 251 negativo, 257
y gravitación, 273, 288 nulo, 257
gµν , 199, 210 positivo, 254, 257
de Schwarzschild, véase Schwarzschild temporaloide, 33, 37, 51, 52
derivada covariante gµν;α , 229, 293 Invariante, 132, 136, 139, 178, 188, 209,
gµν es como Φ, 289 222
g00 = 1 + 2Φ/c2 , 290, 305 E · B y E 2 − B 2 , 99–101, 159
primera derivada gµν,α , 223, 226, 243, Izquierda, 55, 56
277, 293
segunda derivada gµν,α,β , 243, 277, J, 316, 318
293 Jackson, 26, 43, 102
altas derivadas, 281 Jacobiano, 222
Goldstein, 336 Jammer, 357
Gradshteyn, 264, 326 J µ , 143, 151, 216
Gravitación del polvo, 163
comparación Newton-Einstein, 336 eléctrica, 164
idea central, 273 Júpiter, 340
newtoniana, 275, 287, 295, 301, 336,
343 Kay, 277
y geometrı́a, 273, 288 Kerr, 300
kµ , 142
~, 144 Kronecker, véase δ de Kronecker
Hamilton, véase Principio de Hamilton Kruskal, 349
Hidrógeno, véase Átomo
Hilbert, 288, 301 L, 180
Hilbert-Einstein, 288, 292 L, 178
Homogeneidad, véase Principio de Lagrangiana, 180, 255, 259
Horizonte, véase Schwarzschild L, 186
Hueco blanco, véase Schwarzschild Λ, 135, 294
Hueco negro, véase Schwarzschild λ, 318, 335
Huygens, 3 Landau, 299
Levi-Civita, 133, 159
Identidades de Bianchi, véase Bianchi Liénard-Wiechert, 102
Índices Ligada, véase Schwarzschild
bajar o subir, 122, 128, 139, 200, Lightman, 327
201 Lı́mite newtoniano, 288, 295, 305
contraı́dos, 123, 200 Lı́nea en el mundo, 51
contravariantes, 125, 204 Local, véase Velocidad local
379
Longitud, 31, 41, 44, 54 Nube
propia, 41, 44 de partı́culas cargadas, 110, 169
Lorentz, 2, 6, 20, 149, 150 de polvo, 162
Luminoide, 35, 39, 51, 52, 345 Nuclear, 74
Luz
aberración, 4, 31, 79 Observador inercial, 7, 13, 15, 93, 140,
cono de luz, véase Cono de la luz 177, 202
difracción, 3, 4 Observador no inercial, 202, 276, véase
interferencia, 3, 4, 8–11 Caı́da libre
polarización, 3, 4 Ohanian, 236, 240, 276, 298, 300, 352
rayo de, 3, 301, 337, 338 Onda
velocidad, 4, 6–13, 46, 357, 361–366, electromagnética, 1, 6, 152
369 fase de, 144
frente de, 144
µνδ
Mmec , 172–175 Onda-corpúsculo, 1–8
Mapamundi, 348 Óptica, 3–11
Mareas, 347, 348 Órbita desligada, véase Schwarzschild
Masa, 61–85, 140 Órbita de un rayo de luz, véase Schwarzschild
gravitacional, 74, 275 Órbita ligada, véase Schwarzschild
inercial, 74, 275 Órbita mercurial, véase Schwarzschild
variable, 83 Órbita terrestre, véase Schwarzschild
Matriz
F µν , 155 Pais, 2
Λ, 135, 213 Parámetro, 39, 177, 254, 267
θµν y θµ ν , 196 afı́n, 256, 262, 263, 269, 318, 335
Mecánica Partı́cula
cuántica, 74, 82, 144, 301 caı́da libre, véase Caı́da libre
lagrangiana, 177 de m 6= 0, 257
newtoniana, 1, 2, 61, 65, 67, 69, 83, en campo grav., véase Caı́da libre
86–89, 275, 318, 327, 336, 343 en un campo Aµ , 182
Mehra, 288 forzada, 51, 140, 168, 169, 177
Mercurio, 301, 337, 339, véase Schwarzschild libre, 38, 51, 81, 140, 157, 168, 177,
Métrica, 370 181, 274
de Minkowski, 76, 120, 132, 215, 218, Pasado, 52, 55, 56, 346, 351
276, 290, 370 Perihelio, véase Schwarzschild
de Schwarzschild, véase Schwarzschild Planck, 6
Michelson y Morley, 2, 8–11, 13 Planetas, 330, 333
Minkowski, véase Métrica de Minkowski Plano, véase Espacio plano
Minkowski H., 50, 51 pµ , 141, véase Momentum
Momento dipolar eléctrico, 107 Poisson, 4, 287
Momentum, 61–73, 141 Polvo, 162
del fotón, 79, 142 Postulado geodésico, 274
Momentum angular, 172–175 Potencia, 154
Movimiento circular, 85 Potencial
Mundo, 51 efectivo, 328, 334
electrostático, 82, 87
Neutrón, 74 escalar φ, 148, 182
Newton, 3, 357 gravitatorio, véase Φ
Newtoniana, véase Mecánica pozo de, véase Pozo de potencial
380
vectorial A, 148, 182 separación espacial, 32, 54
Poynting, 104 separación temporal, 32, 36, 54
Pozo de potencial, 330, 334 Relojes, 38, 311
Precesión del perihelio de Mercurio, véase atraso gravitacional, 313
Schwarzschild atraso por aceleración, 314
Press, 327 atraso por movimiento, 37, 313
Price, 327 desincronización, 36
PriHomo, véase Ppio. de homog. de tiem- en el infinito, 313, 323
po y espacio en reposo, 313, 323
Principio de en reposo en el infinito, 313, 323
conservación de la energı́a, 69 sincronización, 16
conservación del momentum, 61–65, Resnick, 20, 62, 69, 104
69 Ricci Rβµ , 230, 244, 287, 303
covariancia general, 220 Riemann espacio de, 199, 253
equivalencia, 277 Riemann tensor de, 229–244, 277, 347,
Galileo, 275 348
Hamilton, 186 n2 (n2 − 1)/12 componentes, 232
Huygens, 3 cinco identidades, 230
la homogeneidad del tiempo y el es- es único, 240, 293
pacio, 12, 14, 357, 360, 369 es curvatura, 233, 269
la relatividad, 2, 12, 13, 94, 111, 138, Rotación
139, 357, 359, 360, 369 de masa puntual, 300
la velocidad de la luz, 2, 12, 46, 357, grupo de, 302
361–366, 369 Ruffini, 236, 240, 276, 298, 352
mundo absoluto, 51 Ryzhik, 264, 326
PriRel, véase Ppio. de relatividad
PriVel, véase Ppio. de la vel. de la luz Schroedinger, 82
Propio Schutz, 277, 348
densidad, 43 Schwarzschild, 300, 301
longitud, 41, 44 caı́da libre, 317
tiempo, 31, 37, 44, 55, 110, 140, 178, caı́da libre vertical, 324
257, 311 cono de luz, 345, 351
volumen, 42 consts. del mov., 316, 317, 333
Protón, 74, 88 tercera const. del mov., 319
Prototipo, véase Vector ecuación de tercer grado, 332
Puntos de retorno, véase Schwarzschild el subespacio (θ, ϕ), 309
el subespacio (r, θ, ϕ), 308
QCD, 370 el subespacio (r, ϕ), 310
el subespacio (r, θ), 308
Rango de un tensor, 129, 207, 209 el subespacio (t, θ), 310
Red shift, véase Corrimiento al rojo el subespacio (t, r), 309
Regla (,) → (;), 280 escalar R, 307
Relatividad especial espacio de, 248
estructura, 3, 19 futuro, 346, 351
motivación, 2, 357 geometrı́a de, 248
Relativo horizonte, 344, 346, 347
frente de onda, 144 hueco blanco, 352
izquierda-derecha, 55 hueco negro, 345–348
pasado-futuro, 55 leyes fı́sicas en, 284
381
µν
métrica de, 248 Tcan , 189–197
mareas, 347, 348 Temporaloide, 51, 52, 344–346, 351
órbita circular, 331 Tensor
µνδ
órbita desligada, 329 Mmec , 172–175
órbita de un rayo de luz, 337, 338 Aµ , 148, 182, 193–197, 203
órbita ligada, 329 Aµ Bµ es un tensor, 132, 209
órbita mercurial, 337, 339 antisimétrico, 209
órbita terrestre, 333, 337 asimétrico, 192, 195
µν
parámetro afı́n, 318, 323, 335 canónico Tcan , 189–197
pasado, 346, 351 de energı́a-momentum, 165–175, 189–
apelio mercurial, 339 197, 280
perihelio mercurial, 339 de Levi-Civita, 159
apelio terrestre, 333 de momentum angular, 172–175
perihelio terrestre, 333 del campo electromagnético, 170, 189–
planetas, 330, 333 197
potencial efectivo, 328, 334 δµ ν es un tensor, 132
pozo de potencial, 330, 334 ∂ µ ∂µ , 134
precesión perihelio mercurial, 339 ∂µ φ y ∂µ Aν son tensores, 134
pseudosingularidad, 348 ecuaciones, 137, 139
puntos de retorno, 328, 331, 332, electromagnético, 155, 193–197, 217
336, 338, 340 ²αβγδ es un tensor, 133
radio de, 248, 306 escalar, 129, 132
sı́mbolos Γµ αβ , 307 ηµν es un tensor, 132
singularidad, 347 F µν , 155, 193–197, 217
subespacios, 308 gµν , 199, 210
tensor Rµν , 307 J µ , 143, 163, 216
tensor Rα βµν , 307 kµ del fotón, 142
tiempo τ , 311, 323, 326, 347 Levi-Civita, 133
tiempo T , 311, 323 métrico, 132, 199, 210, 273
tiempo t, 311, 323, 327, 347 pµ es un tensor, 141
tiempo universal, 323 rango de un, 129, 207, 209
Serie de Taylor, 180, 270 Riemann, véase Riemann
Sı́mbolo de Christoffel, véase Γµ αβ simétrico, 166, 175, 192, 195, 209
µν
Simultaneidad, 31, 34, 36, 44, 54, 144, Tcan , 189–197
µν
313 θ , 170, 192, 196
Sincronización de relojes, 16 U µ es un tensor, 141
Singularidad, véase Schwarzschild vector, 79, 129
Sirio, 317 Tensor de Riemann, véase Riemann
Sistema fı́sico Teorı́a de la gravitación, véase Gravitación
aislado, 15, 169 Teorema
no aislado, 169 de Gauss, 163, 166
Snell, 3 de las coordenadas adaptadas, 236
Sol, 288, 306, 317, 333, 337, 339 del tensor métrico, 244
Sonido, 1, 5 principal del cálculo, 222
Stokes, 6 Teukolsky, 327
Szekeres, 349 θµν , 170, 192, 196
Thomas, 136
τ , 37, 178, 311, véase Tiempo propio Tiempo
Taylor, véase Serie de Taylor T , 311
382
τ , 311 Velocidad de una partı́cula, 17, 62, 75,
t, 311 140, 141
coordenado, véase Coordenada tem- Velocidad de un observador, 17, 62
poral Velocidad local, 312, 315, 321
de vida media, 39 Venus, 340
propio, 31, 37, 44, 55, 110, 140, 178, Vida media, 39
257, 311, 347 Virtual, 178
universal, 298, 313, 323 Volumen
inversión, 299 de nube, 110
Tierra, 4, 8–11, 288, 306, 323, 333, 337 diferencial de, 136, 221
T µν , 280, 287, 294, 304, 306 propio, 42
asimétrico, 192, 195, 298
T µν ,ν = 0, 166–175, 280 Wald, 348
T µν ;ν = 0, 280, 294 Weinberg, 133, 162, 281
simétrico, 166, 175, 192, 195, 298
Torretti, 348 Young, 4
Trabajo, 65–69, 82
Transformación
de p , E , m , F, 76
de E y B, 93–115, 158, 359, 367–369
de F µν , 158
de J µ = (cρ, J), 111
gauge, 148
Transformaciones de coordenadas, 17, 359,
360, 369
de Galileo, 12, 24, 26, 46, 65, 361
de Lorentz, 20–28, 124, 138, 139,
199, 218, 280, 366–367
familia de, 24, 361
generales, 199–251, 280
lineales, 20, 124, 199, 244
no lineales, 202
Translaciones, 188
Trayectoria de una partı́cula, 16, 39, 140,
164, 177
en campo grav., véase Caı́da libre
u = 1/r, 336
U µ , 141
Unión
de E y B, 101, 119
de espacio y tiempo, 31, 119
Unitario, véase Vector
Universal, véase Tiempo
Variacional, véase Cálculo variacional

Vector, 79, 125, 129, 203, 209
prototipo, 125, 131, 140, 203, 209
unitario, 85, 142, 143, 214
383

Elementos de Relatividad PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Elementos de Relatividad PDF

Cargado por

Copyright:

Formatos disponibles

Prefacio

Este libro presenta los elementos de la teorı́a de la relatividad. El texto

La primera parte del libro se dedica a la relatividad especial, y la segun-

Para algunos la esencia de la relatividad especial está en las transforma-

Pero también se puede pensar que la esencia del proyecto relativista es el

El capı́tulo 11 es crucial, y desarrolla la idea de que la gravitación puede

La teorı́a de la relatividad es la gloria de la fı́sica teórica. Si hay un lec-

2. Propiedades del espaciotiempo 31

5. Tensores en la relatividad especial 119

8. Dinámica lagrangiana 177

11. El principio de equivalencia 273

12. La ecuación del campo gravitatorio 287

13. La solución de Schwarzschild 301

A. La constancia de la velocidad de la luz 357

En este primer capı́tulo nos proponemos construir las primeras bases de la

Para darle fundamento a la teorı́a ondulatoria de la luz, los cientı́ficos de

Nuestra presentación se basa fuertemente en el experimento de Michelson

El principio de la relatividad, que dice que lo que ocurre para un observador

Se puede pensar que la parte fuerte de la teorı́a de la relatividad es en-

1.1 Corpúsculos y ondas

La interpretación ondulatoria mostró su eficacia al explicar los fenómenos

Los primeros seguidores de la interpretación ondulatoria se encontraron

Que la teorı́a ondulatoria inicial fuera incapaz de explicar la polarización

Uno de los seguidores más importantes de la interpretación corpuscular fue

La teorı́a undulatoria substituyó a la corpuscular tan súbitamente, que po-

No hay una definición precisa4 de en qué consiste este medio transmisor de

Debemos entender que un medio transmisor tan contradictorio se presta a

En el siglo XIX se dan los grandes avances del electromagnetismo, no sólo en

Consideremos un observador inercial O0 que se mueve con velocidad v re-

Esta ecuación implica que:

c02 = c2 + v 2 − 2vc cos θ , (1.2)

donde θ es el ángulo que se forma entre c y v . La Figura 1.1 muestra los

c02 = c2 + v 2 − 2v(v + c0 cos θ0 )

c02 + 2v cos θ0 c0 − (c2 − v 2 ) = 0

La solución con el signo inferior da una c0 negativa, y por eso es inaceptable.

Nótese que c0 depende explı́citamente de θ0 : la velocidad c0 de la luz es

Serı́a interesante averiguar la velocidad v de la Tierra respecto a O. Si dec-

1.3 El experimento de Michelson y Morley

En la pantalla se observa la interferencia de las señales que provienen de

Veamos el análisis que hace un observador en reposo respecto a la Tier-

El tiempo que demora la luz en este trayecto es L/c0 :

Para el trayecto AP hacemos θ0 = α + π en la fórmula (1.3). Para el trayecto

El retardo t0P AP − t0P BP es la diferencia (t0P A + t0AP ) − (t0P B + t0BP ):

Podrı́amos utilizar esta ecuación si α cambiara a medida que pasa el tiempo,

Esta ecuación corresponde al resultado experimental. Hay dos posibilidades:

La única implicación válida de (1.6) es v = 0. Esta conclusión dice que

Como el análisis de los resultados del experimento conduce a una conclusión

El hecho experimental: la velocidad de la luz es isótropa respecto a la Tierra.

El hecho experimental trae consigo una pregunta inmediata: ¿acaso el plan-

De otro lado, la frase escrita en bastardilla en la página 8 señala que la

1.4 La transformación de Galileo

y tomando otra derivada temporal:

Queremos substituir la transformación de Galileo por otra que esté de acuer-

1) El Principio de la Constancia de la Velocidad de la Luz.

Las próximas secciones están dedicadas a la descripción de estos tres postu-

1.5 La constancia de la velocidad de la luz

El principio que estamos discutiendo afirma que la velocidad de la luz es

1.6 El principio de la relatividad

¿Cómo se aplica este principio, de qué modo se implementa en las ecua-

Esto es lo que registra un observador inercial O. Ahora introducimos otro

p0a = p0d (1.12)

1.7 Homogeneidad del espacio y el tiempo

Conviene anotar que las ideas recién expresadas se basan en la suposición