Está en la página 1de 138

Relatividad

Notas de Clase∗

Eduardo Rodríguez

Departamento de Física
Universidad Nacional de Colombia

18 de junio de 2020


Notas de clase en proceso de construcción. Use bajo su propio riesgo. Si encuentra
un error en estas notas, o si tiene comentarios o sugerencias, le agradecería comuni-
cármelo al email eduarodriguezsal@unal.edu.co.
Capítulo 2

Principios de la Teoría Especial de


la Relatividad

En 1905, en un artículo titulado Sobre la electrodinámica de los cuerpos en


movimiento, Albert Einstein [8] propuso dos principios sobre los cuales basar
su nueva teoría especial de la relatividad:
Las leyes de la física tienen la misma forma en todos los marcos de refe-
rencia inerciales.
La velocidad de la luz es la misma para todos los observadores, sin im-
portar su estado de movimiento o el movimiento de la fuente.
El primer principio es una extensión directa del principio de la relativi-
dad de Galileo, abarcando ahora toda la física en lugar de solo la mecánica.
Esta extensión parece, a simple vista, natural: después de todo, la distinción
entre, por ejemplo, “mecánica” y “electromagnetismo” es probablemente solo
relevante para nosotros, seres humanos que buscamos entender el Universo, y
no representa una división inherente al funcionamiento de la naturaleza. ¿Es
posible acaso imaginar un experimento puramente mecánico, donde el elec-
tromagnetismo no juegue ningún rol? Si su experimento involucra el acto de
mirar, entonces ya no es puramente mecánico!
El segundo principio puede entenderse como una generalización del resul-
tado del experimento de Michelson–Morley, aunque no es claro que este haya
sido una inspiración directa para Einstein [9].
Hay, por supuesto, una violenta tensión entre estos dos principios: si la
transformación de Galileo (1.1) es cierta, entonces los principios son incompa-
tibles. En efecto, como vimos en la sección 1.2, la transformación de Galileo

13
aplicada a las ecuaciones de Maxwell predice que observadores en movimiento
relativo medirán distintas velocidades para la luz, de la misma manera como
medirán distintas velocidades para cualquier partícula en movimiento. Esto es
una consecuencia directa del hecho que, de acuerdo a la transformación de
Galileo, las leyes del electromagnetismo no son las mismas para estos dos ob-
servadores. La única manera de compatibilizar los dos principios de Einstein
consiste en abandonar la transformación de Galileo. Crucialmente, es necesa-
rio abandonar la idea del tiempo absoluto implícita en esta transformación.
En este capítulo analizamos las consecuencias más importantes de estos
principios.

2.1. Relatividad de la simultaneidad


Dos rayos impactan los extremos de un tren y emiten destellos de luz, de-
jando marcas tanto en el tren como en los rieles. Bob recibe los destellos pro-
venientes de ambos extremos del tren al mismo tiempo. Una vez que el tren
ha pasado, Bob mide la distancia entre su posición inicial y las marcas deja-
das por los destellos en los rieles, y descubre que son iguales. Esto quiere decir
que Bob estaba justo frente al punto medio del tren (donde, coincidentemente,
también estaba Alice) cuando los destellos fueron emitidos. Como los destellos
de luz recorrieron la misma distancia para llegar simultáneamente donde Bob,
él concluye que ambos fueron emitidos simultáneamente. Alice, que viaja a
bordo del tren, no está de acuerdo.
Como se ilustra en la figura 2.1, Alice recibe primero el destello de luz
proveniente del extremo delantero del tren. Para Alice Newton, que cree en la
veracidad de la suma galileana de velocidades, la interpretación de este hecho
es clara: el rayo de luz proveniente del extremo delantero del tren viaja con
velocidad c + V , donde V es la velocidad del tren, mientras que el rayo de luz
proveniente del extremo trasero del tren viaja con velocidad c − V . El rayo de
luz delantero llega primero porque viaja más rápido. Midiendo el intervalo de
tiempo entre la llegada de ambos rayos, Alice Newton concluye que fueron
emitidos simultáneamente. Para Alice Einstein, que cree en la veracidad del
principio de constancia de la velocidad de la luz, esta interpretación no es
válida. Como ambos rayos viajan a la misma velocidad y recorren la misma
distancia, la única explicación posible es que el rayo delantero fue emitido antes
que el rayo trasero. La evidencia experimental, como hemos visto, respalda a
Alice Einstein: en el marco del tren, los destellos de luz no son simultáneos.

14
B
? A ?

A
B

Figura 2.1: Bob, mirando desde el andén, recibe simultáneamente destellos


provenientes de los extremos del tren. Alice, en cambio, recibe primero el des-
tello del extremo delantero. En la figura, el tren se mueve hacia la derecha con
velocidad V = 2c/3.

Este análisis es simple pero demoledor: Bob afirma que los dos eventos son
simultáneos, y Alice no está de acuerdo. La aparente paradoja no tiene solu-
ción; simplemente, debemos aceptar que los principios de Einstein implican
que el concepto de simultaneidad es relativo, es decir, dependiente del obser-
vador.

2.2. Contracción de la longitud


Contracción de Lorentz–Fitzgerald. Bob mide la distancia entre las mar-
cas dejadas por los rayos en los rieles y determina la longitud del tren. Esta
medición le parece válida a Bob, pues, según él, los rayos impactaron ambos
extremos del tren simultáneamente. Alice, por supuesto, no está de acuerdo:
según ella, el impacto delantero ocurrió antes que el impacto trasero. Como
el tren se mueve entre ambos impactos, Alice concluye que Bob está midiendo

15
una longitud menor que la longitud verdadera del tren.
Esta contracción de la longitud es un efecto relativista directamente relacio-
nado con la relatividad de la simultaneidad. Para medir la longitud de un objeto
en movimiento, debe determinarse la posición de sus extremos en un mismo
instante de tiempo, es decir, simultáneamente. Como dos eventos simultáneos
para Bob no lo son necesariamente para Alice, las mediciones de la longitud
diferirán entre ambos observadores.
Alice, en reposo con respecto del tren, mide su longitud propia, que es siem-
pre mayor a la longitud medida por cualquier otro observador en movimiento
relativo.

Definición 2.1 (Longitud propia). Llamamos longitud propia o longitud en re-


poso a la longitud de un objeto medida en su marco comóvil instantáneo.

Invariancia de la dimensión transversal. La contracción de Lorentz–Fitz-


gerald ocurre solo en la dirección del movimiento; las dimensiones transversa-
les no se ven afectadas. Para establecer este hecho, asumamos por un momento
que las longitudes perpendiculares a la velocidad del tren también se contraen.
Bob observa el tren en el que viaja Alice a medida que este se acerca a la
entrada de un túnel. El túnel, por supuesto, ha sido diseñado de manera que su
entrada es un poco más ancha que el tren, permitiéndole entrar holgadamente.
Bob no tiene motivos para preocuparse; según él, el tren en movimiento es
aún más angosto y más bajo que el tren en reposo, por lo que entrará en el
túnel sin problemas. Alice, en cambio, mira la entrada del túnel con angustia.
Según ella, el tren está en reposo y la entrada del túnel se les acerca a gran
velocidad, haciéndose más angosta y más baja mientras más rápido vaya el
tren. Si la velocidad del tren es lo suficientemente alta, la entrada del túnel será
demasiado pequeña como para permitirle pasar, y se producirá un accidente
de proporciones.
La situación planteada en el párrafo anterior es una contradicción lógica:
no es posible que el tren entre al túnel, según Bob, y choque contra la entrada,
según Alice. Como ambos puntos de vista deberían ser válidos si la dimensión
transversal al movimiento también se contrae, concluimos que esto no ocurre:
la contracción de Lorentz–Fitzgerald solo afecta las longitudes paralelas, no las
perpendiculares, a la dirección del movimiento. En otras palabras: el tren en
movimiento se hace más corto, pero no más angosto o más bajo.

16
2.3. Dilatación del tiempo
La velocidad de la luz. Un reloj de luz es, conceptualmente al menos, el
más simple de los relojes. Consiste en dos espejos paralelos, separados por una
distancia fija, entre los cuales rebota un rayo de luz. Cada impacto del rayo de
luz en uno de los espejos corresponde a un “tic” o un “tac” del reloj.
Supongamos, para fijar ideas, que la distancia entre los espejos que forman
el reloj de luz es igual a 3 metros. Esto significa que el tiempo que tarda un rayo
de luz en ir de un espejo al otro es de, aproximadamente, 10 ns. De acuerdo
al principio de constancia de la velocidad de la luz, c ≈ 3 × 108 m/s es una
constante fundamental, la misma para todos los observadores. Podemos por
lo tanto, sin ambigüedad, afirmar que la distancia entre los dos espejos es de
10 ns. Esta afirmación tiene una sola interpretación posible: el tiempo que tarda
un rayo de luz en ir de un espejo a otro es igual a 10 ns, y esta información
nos permite calcular la distancia entre los espejos (en metros, por ejemplo) de
manera inequívoca.
Medir la distancia en unidades de tiempo (e.g., nanosegundos) no es algo
ajeno a nuestra experiencia. Es común, por ejemplo, decir “vivo a 45 minutos
de la Universidad”, o “la casa de mis padres queda a dos horas de Bogotá”.
En ambos casos existe una velocidad implícita que permite traducir tiempo a
distancia (en estos ejemplos, la velocidad promedio de un bus, seguramente).
La velocidad de la luz, al ser la misma para todos los observadores, provee de
un factor de conversión universal entre tiempo y distancia.
Este rol de factor de conversión de unidades para la velocidad de la luz está
reconocido explícitamente en la definición moderna de metro [10]:
El metro, símbolo m, es la unidad SI de longitud. Se define tomando
el valor numérico exacto de la velocidad de la luz en el vacío c
como 299 792 458 cuando se expresa en la unidad m s−1 , donde el
segundo está definido en términos de la frecuencia del cesio ∆νCs .
Esto quiere decir que, por definición, 1 metro es la distancia recorrida por un
rayo de luz en el vacío en un intervalo de tiempo de 1/299 792 458 segundos.
Por completitud, la definición moderna de segundo es [10]:
El segundo, símbolo s, es la unidad SI de tiempo. Se define tomando
el valor numérico exacto de la frecuencia del cesio ∆νCs , la frecuen-
cia de transición hiperfina del estado fundamental no perturbado
del átomo de cesio-133, como 9 192 631 770 cuando se expresa en
la unidad Hz, que es igual a s−1 .

17
De estas definiciones resulta que la velocidad de la luz en el vacío es igual a
299 792 458 metros por segundo exactamente, i.e., c = 299 792 458 m/s.
Nosotros vamos a llevar esta equivalencia a su conclusión lógica, definien-
do un “segundo de distancia” como la distancia recorrida en el vacío por la luz
durante un intervalo de tiempo de un segundo. Similarmente, definimos un
“metro de tiempo” como el tiempo necesario para que la luz recorra una distan-
cia de un metro en el vacío. Con estas definiciones, podemos escoger la misma
unidad (metro o segundo) para medir tiempos y distancias. Una consecuencia
inmediata es que la velocidad de la luz resulta ser igual a 1 (adimensional):

1 metro (espacio) 1 segundo (espacio)


c= = = 1. (2.1)
1 metro (tiempo) 1 segundo (tiempo)

Dicho de otra manera, 1 s = 299 792 458 m, y 1 m = 1/299 792 458 s. Usando
las mismas unidades para tiempo y espacio, todas las velocidades resultan ser
adimensionales, debiendo ser interpretadas como fracciones de la velocidad
de la luz.
Volviendo a nuestro reloj de luz, podemos decir que el tiempo que tarda el
rayo de luz en ir de un espejo a otro es de 3 metros.

∗ ∗ ∗

Montada en un tren muy rápido, Alice estudia el reloj de luz ubicado sobre
la mesita frente a su asiento. Definimos E como el evento donde el rayo de luz
es emitido desde el espejo inferior, y R como el evento donde el rayo de luz
es recibido en el mismo espejo inferior, luego de haber sido reflejado una vez
en el espejo superior. Para Alice, ambos eventos ocurren en el mismo punto en
el espacio (el reloj de luz está en reposo respecto de Alice), y el tiempo que
transcurre entre uno y otro es de 6 metros:

∆x 0 = 0, ∆t 0 = 6 m. (2.2)

Usamos variables primadas para denotar las cantidades medidas por Alice (en
el marco K 0 ) y variables no primadas para denotar aquellas medidas por Bob
(en el marco K), quien, por supuesto, está observando toda la escena desde
el andén. En la figura 2.2 se muestra la trayectoria seguida por el rayo de
luz entre los eventos E y R de acuerdo a Bob. Para Bob, la separación espacial
entre E y R es igual a la distancia recorrida por el tren entre ambos eventos. Esta
distancia debe ser mayor que seis metros, puesto que, según Bob, el rayo de

18
4m 4m

5m 5m ∆t
3m ∆t 0

E R ∆x

Figura 2.2: Izquierda: Bob, observando el reloj de luz de Alice desde el andén,
percibe que el rayo de luz sigue la trayectoria que se muestra en la figura.
Derecha: triángulo equivalente usado para cuantificar la dilatación del tiempo.

luz recorre una distancia mayor que los seis metros medidos por Alice. Fijemos
la velocidad del tren de modo tal que su desplazamiento entre los eventos E
y R, medido por Bob, sea de 8 metros. Entonces, el teorema de Pitágoras nos
permite calcular que el tiempo transcurrido entre ambos eventos, de acuerdo
a Bob, es de 10 metros:

∆x = 8 m, ∆t = 10 m. (2.3)

En particular, esto significa que la velocidad del tren (medida por Bob) es v =
∆x/∆t = 0,8, i.e., el 80 % de la velocidad de la luz.
Decimos que el intervalo de tiempo entre los eventos E y R medido por Ali-
ce es un intervalo de tiempo propio, pues, para Alice, ambos eventos ocurren
en un mismo punto del espacio (∆x 0 = 0). Bob, en cambio, mide un intervalo
de tiempo mayor. Esta es la dilatación del tiempo, un efecto relativista insepa-
rable de la contracción de la longitud, y, al igual que esta, una consecuencia
inevitable de la relatividad de la simultaneidad.

Definición 2.2 (Tiempo propio). Decimos que un observador K mide un in-


tervalo de tiempo propio ∆τ entre dos eventos si para él los eventos ocurren
en el mismo punto del espacio, i.e., si ∆x = 0 en el marco K.

En general, la relación entre los intervalos de tiempo medidos por Bob y


Alice, ∆t y ∆t 0 , puede calcularse a partir del triángulo rectángulo a la derecha
de la figura 2.2. Poniendo ∆x = v∆t, hallamos
2
(v∆t)2 + ∆t 0 = (∆t)2 . (2.4)

19
10
1
γ= p
1 − v2
Factor de Lorentz, γ 5

1
0 0,2 0,4 0,6 0,8 1
Magnitud de la velocidad, v

Figura 2.3: El factor de Lorentz es siempre mayor o igual a 1 y diverge cuando


v | → 1. Cuando |~
|~ v |  1, puede usarse la aproximación γ ≈ 1 + 21 v 2 (línea
punteada). Note que el eje vertical está en escala logarítmica.

Despejando ∆t, podemos escribir

∆t = γ∆t 0 , (2.5)

donde el factor de Lorentz γ está definido por


1
γ= p . (2.6)
1 − v2
Como γ ≥ 1 (ver figura 2.3), encontramos que ∆t ≥ ∆t 0 .
Note que γ diverge cuando la velocidad del tren tiende a la velocidad de
la luz. Para velocidades mayores que la velocidad de la luz, γ pasa a ser ima-
ginario, lo cual es inaceptable para una cantidad que representa un cociente
de intervalos temporales (ambos reales). Luego, hemos encontrado un resul-
tado fundamental: la velocidad de la luz constituye un límite máximo para la
velocidad de cualquier partícula.
El valor de γ puede interpretarse como una medida de la magnitud de los
efectos relativistas que ocurren a una velocidad v dada, i.e., de la divergencia
entre las predicciones relativista y no relativista para un mismo fenómeno.

20
Esta diferencia alcanza un 1 % recién cuando v ≈ 1/7. Esto quiere decir que
si tomamos como referencia este valor para decidir cuándo se hace necesario
reemplazar la mecánica de Newton con la mecánica relativista, el umbral de
velocidad está en torno a un 14 % de la velocidad de la luz.

2.4. El espacio-tiempo de Minkowski


La relación entre las separaciones espaciales y temporales medidas por Ali-
ce y Bob en el ejemplo de la sección 2.3 puede resumirse en la forma

−∆t 2 + ∆x 2 = −∆t 02 + ∆x 02 (2.7)

(recuerde que ∆x 0 = 0 en este caso). Esto significa que existe una cantidad
invariante, que tanto Alice como Bob pueden calcular a partir de las mediciones
hechas en sus marcos de referencia correspondientes, y en cuyo valor ambos
están de acuerdo.
Definición 2.3 (Intervalo espacio-temporal). Sean ∆t y ∆x las separaciones
temporal y espacial, respectivamente, entre dos eventos medidas en un marco
de referencia K. El intervalo espacio-temporal ∆s2 entre ambos eventos está
definido mediante la ecuación

∆s2 = −∆t 2 + ∆x 2 . (2.8)

Un observador K 0 en movimiento respecto de K medirá, en general, separacio-


nes temporal y espacial ∆t 0 y ∆x 0 distintas de ∆t y ∆x. Sin embargo, ambos
están de acuerdo en el valor de ∆s2 :

∆s02 = −∆t 02 + ∆x 02 = −∆t 2 + ∆x 2 = ∆s2 . (2.9)

Note que, a pesar de la notación utilizada, ∆s2 puede ser positivo, negativo, o
cero, incluso para eventos no coincidentes.
En 1908, Hermann Minkowski descubrió que la recién formulada teoría es-
pecial de la relatividad de Einstein podía entenderse como la física en lo que
hoy llamamos el espacio-tiempo de Minkowski: un espacio de cuatro dimensio-
nes, donde cada punto, llamado “evento”, es determinado por las coordenadas
(t, x, y, z), y la distancia, o intervalo espacio-temporal, entre dos eventos infi-
nitesimalmente cercanos puede calcularse a partir de la expresión

ds2 = −d t 2 + d x 2 + d y 2 + dz 2 . (2.10)

21
La presencia del signo menos delante de d t 2 en la ec. (2.10) hace que el
espacio-tiempo de Minkowski difiera de maneras importantes de R4 , donde
este signo menos no aparece. Minkowski mismo no escatimó palabras para
resaltar la importancia de su descubrimiento (mi traducción):
Las opiniones sobre el espacio y el tiempo que deseo exponerles
han crecido en el suelo de la física experimental. En ella yace su
fortaleza. Son de tendencia radical. De ahora en adelante, el espa-
cio por sí mismo y el tiempo por sí mismo deben reducirse comple-
tamente a sombras, y solo una especie de unión entre ambos habrá
de conservar independencia.
Hermann Minkowski, 1908 [11].
A menudo representamos el espacio-tiempo en un plano bidimensional,
donde tradicionalmente el tiempo t apunta hacia arriba y escogemos una di-
mensión espacial, por ejemplo, x, apuntando hacia la derecha. En esta repre-
sentación, que llamamos un diagrama espacio-temporal, se ignoran siempre dos
direcciones espaciales.
En el diagrama espacio-temporal de la figura 2.4, el origen del sistema coor-
denado, O, de coordenadas t = 0, x = 0, sirve como evento de referencia. Un
rayo de luz que pase por O sigue una de las líneas punteadas, según vaya hacia
la izquierda o hacia la derecha. En general, el lugar geométrico de todos los
rayos de luz que pasan por O es llamado el cono de luz de O. La denominación
“cono” proviene de la imagen mental de estos rayos de luz cuando incluimos
una dimensión espacial extra en el diagrama.
El cono de luz define la estructura causal del espacio-tiempo. El evento A,
por ejemplo, queda en el futuro de O, porque es posible llegar desde O a A
viajando a una velocidad menor que la de la luz. Esto significa que es posible
que exista una relación causal entre O y A, vale decir, que lo que ocurra en O sea
la causa de lo que ocurra en A. Similarmente, el evento C queda en el pasado
de O. En cambio, no es posible para O tener influencia alguna sobre lo que
ocurra en B, porque no hay manera de transferir información entre ambos a
una velocidad menor que la de la luz. Tampoco puede existir conexión causal
entre D y O.
Definición 2.4 (Separación tipo tiempo). Decimos que dos eventos tienen una
separación tipo tiempo si su separación espacial, ∆~r , tiene una magnitud menor
que su separación temporal, ∆t. En este caso, |∆~r | < |∆t|, o, equivalentemen-
te, ∆s2 < 0.

22
t
A
B

Figura 2.4: Espacio-tiempo de Minkowski, con varios eventos y el cono de luz


asociado al origen.

Definición 2.5 (Separación tipo espacio). Decimos que dos eventos tienen una
separación tipo espacio si su separación espacial, ∆~r , tiene una magnitud ma-
yor que su separación temporal, ∆t. En este caso, |∆~r | > |∆t|, o, equivalente-
mente, ∆s2 > 0.
Definición 2.6 (Separación nula o tipo luz). Decimos que dos eventos tienen
una separación nula o tipo luz si su separación espacial, ∆~r , tiene la misma
magnitud que su separación temporal, ∆t. En este caso, |∆~r | = |∆t|, o, equi-
valentemente, ∆s2 = 0. Note que dos eventos distintos pueden tener una se-
paración nula o tipo luz.
Dos eventos cuya separación sea tipo tiempo pueden tener una conexión
causal. En cambio, dos eventos cuya separación es tipo espacio siempre están
desconectados causalmente. Como las definiciones 2.4–2.6 hacen referencia
al signo del intervalo espacio-temporal entre dos eventos, ellas permanecen
válidas en todos los marcos de referencia inerciales. Esto significa que si dos
eventos tienen una separación tipo tiempo en un marco K dado, entonces tie-
nen también una separación tipo tiempo en cualquier marco K 0 que se mueva
con velocidad constante respecto de K, y similarmente para los casos de sepa-
raciones tipo espacio y nulas o tipo luz.
Cuando dos eventos tienen una separación tipo tiempo, el intervalo espacio-
temporal entre ellos es esencialmente equivalente a un intervalo de tiempo

23
propio, ∆s2 = −∆τ2 (ver definición 2.2). En efecto, cuando ∆s2 < 0 siempre
es posible encontrar un marco K 0 donde los dos eventos ocurren en el mismo
2
punto del espacio, de manera que ∆s02 = −∆t 02 + |∆~r 0 | = −∆t 02 .

2.5. Paradoja de los gemelos y viaje al futuro


El límite impuesto por la velocidad de la luz parece, a primera vista, cerrar-
nos la posibilidad de explorar el Universo. ¿Cómo vamos a llegar en el transcur-
so de una vida humana, pensaríamos ingenuamente, a una estrella que diste
más de 100 años-luz de la Tierra, si no podemos viajar más rápido que la luz?
Esta pregunta ignora los efectos de la dilatación temporal y la contracción de
la longitud, como veremos a continuación.
La estrella más próxima al Sol es Proxima Centauri, ubicada a una distancia
de aproximadamente ∆x = 4,244 años (usamos años para medir distancias!).
Esta distancia está medida en el marco K donde la Tierra está instantánea-
mente en reposo. (Como las velocidades relativas entre la Tierra, el Sol y Pro-
xima son mucho menores que la velocidad de la luz, no cometemos ningún
gran error si asumimos que los tres están en reposo en K). Para simplificar,
vamos a imaginar que Alice viaja desde la Tierra a Proxima a velocidad cons-
tante v = 3/5. Esto significa que el tiempo que tarda en llegar está dado por
∆t = ∆x/v = 7,07 años. Este es el tiempo medido por Bob (marco K), quien
se queda en la Tierra. ¿Cuánto dura el viaje de acuerdo a Alice? Según Alice
(marco K 0 ), la separación espacial entre los eventos salida de la Tierra y lle-
gada a Proxima es ∆x 0 = 0: ella no se ha movido de su nave en todo el viaje.
Esto significa que Alice mide un intervalo de tiempo propio ∆t 0 entre ambos
eventos. Con γ = 5/4, hallamos ∆t 0 = ∆t/γ = 5,66 años. Esto es 1,41 años
menos que el tiempo medido por Bob. ¿Adónde se han ido esos 515 días?
Si Alice decide retornar a la Tierra tan pronto como llega a Proxima, la si-
tuación no hace más que empeorar: cuando se reencuentra con Bob, este ha en-
vejecido 14,1 años, mientras que, para Alice, solo han transcurrido 11,3 años.
Esta es la famosa paradoja de los gemelos. Si Alice y Bob son hermanos gemelos,
entonces tienen exactamente la misma edad cuando Alice comienza su viaje,
pero 2,82 años de diferencia cuando Alice vuelve a la Tierra. Al igual como su-
cede con otras “paradojas” relativistas, no hay aquí ninguna contradicción. Los
intervalos de tiempo medidos por Alice y Bob son distintos porque el tiempo
no es una variable externa y absoluta, como creía Newton, sino una más de
las direcciones en el espacio-tiempo. Dos observadores en movimiento relativo

24
A

B ?

Figura 2.5: Diagrama espacio-temporal del viaje de ida y vuelta de Alice a


Proxima Centauri. Bob, quien se queda en la Tierra, es representado por una
línea vertical.

medirán, en general, intervalos de tiempo distintos entre dos eventos. Es im-


portante notar que la situación entre Alice y Bob no es perfectamente simétrica,
porque Alice debe cambiar su velocidad, es decir, acelerar, para poder volver
a la Tierra. Por este motivo es siempre Bob quien más envejece, nunca Alice.
Bob mide un intervalo de tiempo dilatado con respecto al intervalo de tiempo
propio medido por Alice.
¿Qué pasa si Alice viaja en una nave muy rápida, con una velocidad muy
cercana a la de la luz? La magnitud de la dilatación temporal está dada por el
factor de Lorentz, γ, y este crece sin límite a medida que la velocidad se acerca
a la de la luz. Esto significa que, yendo lo suficientemente rápido, sin nunca
ir más rápido que la luz, Alice puede demorarse tan poco como quiera en su
viaje. Las limitaciones aquí son tecnológicas, no fundamentales. Por ejemplo,
cuando v = 0,999 95, γ = 100, y hallamos ∆t 0 = 15,5 días para el viaje de
ida. En vez de cerrarnos el acceso al Universo, la Relatividad pone todo el
universo a nuestra disposición: solo tenemos que encontrar un medio para
viajar a velocidades muy cercanas a la de la luz, y podemos llegar tan lejos
como queramos en un tiempo tan corto como deseemos.
¿No es necesario viajar más rápido que la luz para recorrer una distancia
de 4,244 años en apenas 15,5 días? La respuesta es no: en el marco de Alice,
la distancia entre la Tierra y Proxima está reducida en el mismo factor γ.
Con γ = 100, el viaje de ida y vuelta de Alice dura aproximadamente un

25
mes. Para Bob, han transcurrido 8,5 años. ¿Cómo interpreta Alice lo que ve
cuando llega a la Tierra? Luego de un viaje de un mes, ella retorna a una Tierra
donde han transcurrido ocho años y medio. Alice ha efectivamente viajado al
futuro, ocho años y cinco meses hacia el futuro. Si Alice desear viajar cien años
hacia el futuro, también puede hacerlo. Para ello, debe dirigirse a una estrella
ubicada a 50 años-luz de distancia y viajar muy rápido, a una velocidad muy
cercana a la de la luz. Por ejemplo, con v = 0,999 999 5, el factor de Lorentz
llega a γ = 1000. Esto significa que el viaje de ida y vuelta tarda 36,5 días para
Alice, un mes largo, y cuando regresa, en la Tierra han transcurrido cien años.
Puede ser que Bob ya no esté presente para darle la bienvenida.

26
Capítulo 3

Transformaciones de Lorentz

Sea P un evento en el espacio-tiempo de Minkowski (“un rayo de luz im-


pacta el extremo delantero de un tren”). En un marco dado K (“Bob, observan-
do el tren desde el andén”) este evento tiene las coordenadas (t, x, y, z). Un
observador en un marco K 0 (“Alice, montada en el tren”) asigna coordenadas
distintas, (t 0 , x 0 , y 0 , z 0 ), a este mismo evento. ¿Cómo podemos establecer una
relación entre las coordenadas asignadas a P por ambos observadores?
La relación que buscamos está sujeta a dos restricciones. En primer lugar,
la relación debe ser lineal. Esta restricción está relacionada con la hipótesis de
homogeneidad e isotropía del espacio-tiempo, que nos permite escoger arbi-
trariamente el evento de referencia, u origen, O. En segundo lugar, la transfor-
mación debe dejar invariante la forma cuadrática

ds2 = −d t 2 + d x 2 + d y 2 + dz 2 , (3.1)

que corresponde al intervalo espacio-temporal (“distancia”) entre dos eventos


infinitesimalmente próximos en el espacio-tiempo. Como la relación es lineal,
basta con asegurar la invariancia de

s2 = −t 2 + x 2 + y 2 + z 2 , (3.2)

que corresponde al intervalo espacio-temporal entre el evento P, de coordena-


das (t, x, y, z), y el evento O, de coordenadas (0, 0, 0, 0).
Aunque no corresponde a la imagen mental de Alice y Bob en movimiento
relativo, una rotación espacial, descrita por una matriz ortogonal R de 3×3, su-
plementada por la ecuación t 0 = t, satisface todos nuestros requerimientos. En
efecto, una rotación espacial puede entenderse como la transformación lineal

27
más general que deja invariante la distancia al origen s, con s2 = x 2 + y 2 + z 2 .
En R3 , distinguimos tres rotaciones independientes, cada una de ellas confina-
da a los planos x y, yz, y z x (o, equivalentemente, respecto de los ejes z, x,
y y). En el espacio-tiempo de Minkowski, debemos añadir “rotaciones” confi-
nadas a los planos t x, t y, y tz, entendidas como las transformaciones lineales
más generales que dejan invariante el intervalo espacio-temporal (3.2). La si-
militud entre ambos conjuntos de transformaciones no es solo formal. En las
próximas secciones vamos a usar esta similitud para deducir la forma explícita
de las rotaciones en los planos t x, t y, y tz, llamadas boosts.

3.1. Rotación en el plano x y


Una rotación en el plano x y puede describirse por el par de ecuaciones
x 0 = x cos θ + y sin θ , (3.3)
0
y = −x sin θ + y cos θ , (3.4)
donde θ corresponde al ángulo de rotación. Como se sugiere en la figura 3.1,
estas ecuaciones tienen dos interpretaciones posibles. En la primera de ellas, a
menudo conocida como punto de vista pasivo, (x, y) y (x 0 , y 0 ) corresponden a
las coordenadas de un mismo punto P en dos sistemas distintos, K y K 0 , rotados
uno respecto del otro en un ángulo θ . En la segunda interpretación, a menudo
conocida como punto de vista activo, (x, y) y (x 0 , y 0 ) corresponden a las coor-
denadas de dos puntos distintos, P y Q, en un mismo sistema coordenado. En
el punto de vista pasivo, la rotación afecta solo a los ejes coordenados, dejan-
do inalterados los puntos. En el punto de vista activo, la rotación actúa sobre
los puntos, dejando inalterados los ejes coordenados. Es importante distinguir
entre ambos puntos de vista cuando se estudian ejemplos concretos.
Al ser lineal, la transformación (3.3)–(3.4) puede escribirse en la forma
matricial • 0 ˜ • ˜• ˜
x cos θ sin θ x
= , (3.5)
y0 − sin θ cos θ y
donde la matriz de rotación,
• ˜
cos θ sin θ
R (θ ) = , (3.6)
− sin θ cos θ
es ortogonal, R T R = 1, y tiene determinante uno, det (R) = +1. El conjunto de
todas las matrices de 2 × 2 con estas propiedades forma el grupo SO(2).

28
~r ~r
y y

~r 0
y0
y0

θ
x0 θ

θ
x x x0

Figura 3.1: Las ecuaciones de transformación (3.3)–(3.4) pueden interpretarse


de manera “pasiva” (izquierda) o de manera “activa” (derecha).

Definición 3.1 (Grupo). Un grupo es un conjunto, G, dotado de una operación


binaria, ·, a menudo llamada la “multiplicación” del grupo, que combina dos
elementos cualesquiera a y b para producir otro elemento, denotado por a · b
o simplemente ab. Para calificar como grupo, el conjunto y la operación deben
satisfacer cuatro condiciones, conocidas como los axiomas de un grupo:
Clausura. Si a, b ∈ G, entonces a · b ∈ G.

Asociatividad. Si a, b, c ∈ G, entonces (a · b) · c = a · (b · c).

Existencia de unidad. Existe e ∈ G tal que, para todo a ∈ G, se tiene que


a · e = e · a = a. Este elemento es único y se conoce como identidad.

Existencia de inverso. Si a ∈ G, entonces existe un elemento a−1 ∈ G tal que


a · a−1 = a−1 · a = e.
Existen grupos discretos, con un número típicamente finito de elementos, y
grupos continuos, con un número infinito de elementos. Decimos que un grupo
(discreto o continuo) es abeliano si a · b = b · a para todo a, b ∈ G. En física, los
grupos a menudo representan transformaciones, donde la operación del grupo
corresponde a la composición de dos transformaciones.
Para verificar que las rotaciones en el plano x y forman un grupo, compro-
bamos que se satisfagan los axiomas. La propiedad de clausura se satisface por-
que dos rotaciones sucesivas en el plano x y pueden siempre ser interpretadas

29
como una única rotación en el mismo plano. Equivalentemente, el producto de
dos matrices ortogonales con determinante uno produce siempre otra matriz
ortogonal con determinante uno. La propiedad de asociatividad se hereda di-
rectamente de la asociatividad del producto matricial. La rotación en un ángulo
θ = 0, representada como la matriz identidad, corresponde al elemento iden-
tidad del grupo. Finalmente, toda rotación en un ángulo θ puede deshacerse
a través de una rotación en un ángulo −θ ; en efecto, [R (θ )]−1 = R (−θ ).
El grupo SO(2), con infinitos elementos (tantos como ángulos θ existen
entre 0 y 2π), es uno de los ejemplos más simples de un grupo de Lie. La pro-
piedad clave de un grupo de Lie es que sus elementos (matrices de rotación
R, en este caso) son funciones analíticas de un número finito de parámetros
reales (solo uno en este caso, el ángulo θ ). Muchas de las propiedades de un
grupo de Lie pueden deducirse estudiando elementos ubicados infinitesimal-
mente cerca de la identidad, lo cual corresponde, en nuestro caso, a rotaciones
infinitesimales.
Si el ángulo de rotación es pequeño, |θ |  1, podemos escribir, a primer
orden en θ ,
• ˜ • ˜ • ˜
1 θ 1 0 0 1
R (θ ) = = +θ = 1 + θ J, (3.7)
−θ 1 0 1 −1 0

donde hemos definido • ˜


0 1
J= . (3.8)
−1 0
Interpretando la ec. (3.7) como los dos primeros términos de una expansión en
serie, podemos construir la rotación finita a partir de la rotación infinitesimal
simplemente completando la serie, mediante un proceso llamado exponencia-
ción.

Definición 3.2 (Exponencial matricial). Sea M una matriz cuadrada cuyos


elementos son números reales o complejos. La exponencial matricial de M , de-
notada por exp (M ) o, a veces, e M , se define mediante la serie
X

Mn 1 2 1 3
exp (M ) = =1+M + M + M + ··· . (3.9)
n=0
n! 2! 3!

Esta serie no solo converge siempre, para cualquier matriz M , sino que exp (M )
resulta ser una matriz invertible, con [exp (M )]−1 = exp (−M ).

30
La siguiente identidad es una propiedad clave de la exponencial matricial:

det [exp (M )] = eTr(M ) . (3.10)

En particular, la ec. (3.10) implica que det [exp (M )] 6= 0, mostrando que


exp (M ) es una matriz invertible.
Note que, en general, exp (A) exp (B) 6= exp (A + B). La igualdad solo se
cumple si A y B conmutan.

∗ ∗ ∗

Para verificar que la aproximación a primer orden (3.7) corresponde en


efecto a los primeros términos en la serie de una exponencial matricial, calcu-
lamos explícitamente exp (θ J) siguiendo la definición general (3.9):
X

θn θ2 2 θ3 3
exp (θ J) = Jn = 1 + θJ + J + J + ··· . (3.11)
n=0
n! 2! 3!

Es claro que para continuar necesitamos las potencias de J. Afortunadamente,


esta es una tarea sencilla, ya que
• ˜• ˜ • ˜
2 0 1 0 1 −1 0
J = = = −1. (3.12)
−1 0 −1 0 0 −1

De aquí obtenemos inmediatamente todas las potencias, las que resulta conve-
niente separar en pares e impares:

J 2n = (−1)n 1, J 2n+1 = (−1)n J, (3.13)

para n = 0, 1, 2, . . .. Separando también la expansión en serie en potencias


pares e impares, hallamos
X

θ 2n 2n X θ 2n+1

exp (θ J) = J + J 2n+1
n=0
(2n)! n=0
(2n + 1)!
X∞
(−1) θn 2n X

(−1)n θ 2n+1
=1 +J
n=0
(2n)! n=0
(2n + 1)!
 2 4 ‹  ‹
θ θ θ3 θ5
=1 1− + + ··· + J θ − + + ··· .
2! 4! 3! 5!

31
Reconociendo en estas expresiones las series de Taylor para cos θ y sin θ , po-
demos escribir∗
• ˜
cos θ sin θ
exp (θ J) = 1 cos θ + J sin θ = = R (θ ) . (3.14)
− sin θ cos θ

La matriz J recibe el nombre de generador de rotaciones en el plano x y,


pues ella genera rotaciones infinitesimales a través de R = 1 + θ J, cuando
|θ |  1, y rotaciones finitas a través de la exponencial matricial R = exp (θ J).
La forma explícita de una rotación infinitesimal es [cf. ec. (3.7)]:

x 0 = x + θ y, (3.15)
0
y = y − θ x. (3.16)

Esta transformación infinitesimal preserva la distancia al cuadrado s2 = x 2 + y 2


a primer orden en θ :

x 02 + y 02 = (x + θ y)2 + ( y − θ x)2

= x 2 + 2θ x y + y 2 − 2θ x y + O θ 2

= x2 + y2 + O θ 2 .

(Note cómo los dos términos lineales en θ se cancelan entre sí).


¿Qué hemos aprendido con este ejercicio? Partimos de una transformación
conocida, la rotación en el plano x y por un ángulo θ , y mostramos que la ma-
triz J que genera rotaciones infinitesimales puede usarse también para cons-
truir las rotaciones finitas a través de la exponenciación matricial. El poder de
este enfoque yace en el caso cuando no conocemos la transformación finita,
pero sí podemos construir una transformación infinitesimal que sea correcta
a primer orden. En este caso, la exponenciación matricial se convierte en un
método poderoso para construir la transformación finita a partir de la versión
infinitesimal.

3.2. Rotación en el plano t x


Una “rotación” en el plano t x debe ser una transformación lineal que pre-
serve el intervalo espacio-temporal s2 = −t 2 + x 2 . Por analogía con la rotación

Note la similitud entre la ec. (3.14) y la identidad de Euler e iθ = cos θ + i sin θ . ¿Cuál es
la relación entre ambas?

32
en el plano x y [cf. ecs. (3.15)–(3.16)], vamos a probar la transformación infi-
nitesimal

t 0 = t + φ x, (3.17)
0
x = x − φ t, (3.18)

donde φ es un parámetro similar al ángulo de rotación θ . Verificamos ahora si


esta transformación infinitesimal deja invariante el intervalo espacio-temporal
a primer orden en φ:

−t 02 + x 02 = − (t + φ x)2 + (x − φ t)2

= −t 2 − 2φ t x + x 2 − 2φ t x + O φ 2

= −t 2 + x 2 − 4φ t x + O φ 2 .

Este primer intento falla, pero nos sugiere cómo modificar la transformación.
Como segundo intento, probamos

t 0 = t − φ x, (3.19)
0
x = x − φ t, (3.20)

y verificamos que esta transformación sí deja invariante el intervalo espacio-


temporal a primer orden en φ:

−t 02 + x 02 = − (t − φ x)2 + (x − φ t)2

= −t 2 + 2φ t x + x 2 − 2φ t x + O φ 2

= −t 2 + x 2 + O φ 2 .

La transformación infinitesimal (3.19)–(3.20) puede escribirse matricial-


mente en la forma • 0 ˜ • ˜• ˜
t 1 −φ t
= , (3.21)
x0 −φ 1 x
donde la matriz que media la transformación es
• ˜ • ˜ • ˜
1 −φ 1 0 0 −1
B (φ) = = +φ = 1 + φK, (3.22)
−φ 1 0 1 −1 0
con • ˜
0 −1
K= . (3.23)
−1 0

33
La matriz K es el generador de rotaciones en el plano t x.
Calculamos ahora la exponencial matricial exp (φK), que debería entregar-
nos la transformación finita. Usando la definición (3.9), escribimos
X

φn φ2 2 φ3 3
n
exp (φK) = K = 1 + φK + K + K + ··· . (3.24)
n=0
n! 2! 3!

Para determinar las potencias de K, notamos que


• ˜• ˜ • ˜
2 0 −1 0 −1 1 0
K = = = 1, (3.25)
−1 0 −1 0 0 1

de donde hallamos

K 2n = 1, K 2n+1 = K, (3.26)

con n = 0, 1, 2, . . .. Separando también la expansión en serie en potencias pares


e impares, encontramos
X

φ 2n 2n X φ 2n+1

exp (φK) = K + K 2n+1
n=0
(2n)! n=0
(2n + 1)!
X φ 2n
∞ X φ 2n+1

=1 +K
n=0
(2n)! n=0
(2n + 1)!
   
φ2 φ4 φ3 φ5
=1 1+ + + ··· + K φ + + + ··· .
2! 4! 3! 5!

Reconociendo en estas expresiones las series de Taylor para cosh φ y sinh φ,


podemos escribir
• ˜
cosh φ − sinh φ
exp (φK) = 1 cosh φ + K sinh φ = = B (φ) . (3.27)
− sinh φ cosh φ

Esta es la matriz para una rotación finita con parámetro φ en el plano t x, que
llamamos un “boost” en dirección x. Para comprobar que esta transformación
en efecto deja invariante el intervalo espacio-temporal, tomamos la transfor-
mación explícita,

t 0 = t cosh φ − x sinh φ, (3.28)


0
x = −t sinh φ + x cosh φ, (3.29)

34
y reemplazamos en s2 = −t 2 + x 2 :
−t 02 + x 02 = − (t cosh φ − x sinh φ)2 + (−t sinh φ + x cosh φ)2
= −t 2 cosh2 φ + 2t x sinh φ cosh φ − x 2 sinh2 φ+
+ t 2 sinh2 φ − 2t x sinh φ cosh φ + x 2 cosh2 φ
 
= −t 2 + x 2 cosh2 φ − sinh2 φ
= −t 2 + x 2 .
Esto concluye nuestra búsqueda. Hemos hallado una transformación lineal en
el plano t x que depende de un parámetro φ y que preserva el intervalo espacio-
temporal entre eventos. Pero, ¿qué significa?
Para poder interpretar el boost (3.28)–(3.29), necesitamos partir recordan-
do qué se supone que debe representar. Aunque dedujimos la transformación
por analogía con las rotaciones en el plano x y, la interpretación física que esta-
mos buscando es la de dos sistemas inerciales, K y K 0 , que se mueven con velo-
cidad relativa constante V~ . Como nuestra transformación solo involucra t y x,
es claro que V~ debe ser paralela al eje x. Poniendo x 0 = 0 en la ec. (3.29), ha-
llamos la ecuación de movimiento para el origen del sistema K 0 : x = t tanh φ.
Esta ecuación describe un movimiento en línea recta con velocidad constante
dada por∗ (ver figura 3.2)
V = tanh φ. (3.30)
Llamando [cf. ec. (2.6)]
1
γ = cosh φ = p , (3.31)
1 − V2
podemos reescribir las ecs. (3.28)–(3.29) en la forma
t 0 = γ (t − V x) , (3.32)
0
x = γ (x − V t) . (3.33)
Escrita de esta forma, es claro que el boost reemplaza a la transformación de
Galileo, por lo menos en el caso cuando la velocidad entre los marcos es para-
lela al eje x. Para hacer más fácil la comparación, reintroducimos c:
 ‹
0 Vx
t =γ t− 2 , (3.34)
c
x 0 = γ (x − V t) . (3.35)

En inglés, φ es a menudo llamado “rapidity”. No conozco un término equivalente en
español que sea de uso generalizado.

35
1

0,5

0
V

−0,5

−1
−3 −2 −1 0 1 2 3
φ

Figura 3.2: La velocidad relativa entre dos marcos K y K 0 puede escribirse en


la forma V = tanh φ, donde φ es un parámetro real (“rapidity”). Note que sin
importar el valor de φ, siempre se tiene |V | < 1.

Cuando |V |  c, recuperamos la transformación de Galileo [cf. ec. (1.1)],

t 0 = t, (3.36)
0
x = x − V t. (3.37)

En el extremo opuesto, note que la parametrización V = tanh φ asegura


que |V | < 1. La transformación con V = 1 es singular o, dicho de otra manera,
no está definida.

Definición 3.3 (Configuración estándar). Decimos que dos marcos K y K 0 es-


tán en configuración estándar cuando sus orígenes coinciden en t = t 0 = 0, sus
ejes espaciales respectivos son paralelos, y el movimiento relativo ocurre en
la dirección del eje x (o x 0 ) con rapidez constante V . El boost (3.32)–(3.33)
relaciona las coordenadas de un evento P en dos marcos que están en configu-
ración estándar.

Relatividad de la simultaneidad. Como la transformación (3.32)–(3.33) es


lineal, también es válida para las separaciones espacial y temporal entre dos

36
eventos P y Q, ∆t = t Q − t P , ∆x = x Q − x P :

∆t 0 = γ (∆t − V ∆x) , (3.38)


0
∆x = γ (∆x − V ∆t) , (3.39)

donde ∆t 0 = t Q0 − t 0P , ∆x 0 = x Q0 − x P0 . La relatividad de la simultaneidad está


incorporada en estas ecuaciones: poniendo ∆t = 0 (i.e., los eventos son simul-
táneos en K), hallamos ∆t 0 = −γV ∆x, que es distinto de cero si ∆x 6= 0 (i.e.,
los eventos no son simultáneos en K 0 ).

Contracción de la longitud. Bob mide la longitud del tren determinando la


separación espacial ∆x entre dos eventos simultáneos, ∆t = 0. Alice no está
de acuerdo, pues para ella los eventos no son simultáneos: ∆t 0 = −γV ∆x 6= 0.
La separación espacial medida por Alice es [cf. ec. (3.39)] ∆x 0 = γ∆x. Luego,
la longitud medida por Bob es menor que la medida por Alice: ∆x = ∆x 0 /γ.

Dilatación del tiempo. Alice mide el tiempo ∆t 0 transcurrido entre dos tics
sucesivos del reloj de luz, que para ella ocurren en el mismo lugar, ∆x 0 = 0.
Bob no está de acuerdo. Él mide una separación espacial ∆x = V ∆t entre
los eventos. Reemplazando en la ec. (3.38), hallamos ∆t 0 = γ 1 − V 2 ∆t =
∆t/γ. Esto quiere decir que el tiempo medido por Bob es mayor que el medido
por Alice: ∆t = γ∆t 0 .

Interpretación gráfica del boost en dirección x. De acuerdo al punto de vis-


ta pasivo, las ecs. (3.32)–(3.33) relacionan las coordenadas espacio-tempora-
les de un único evento P en dos marcos inerciales K y K 0 que se mueven con
velocidad relativa constante V paralela al eje x. Para encontrar las coordena-
das de P en el marco K 0 , usamos las líneas t 0 = const. y x 0 = const. que se
muestran en la figura 3.3:

t0
t 0 = const. ⇒ t= + V x, (3.40)
γ
x0 x
x 0 = const. ⇒ t =− + . (3.41)
γV V

En esta “rotación hiperbólica”, los ejes t 0 y x 0 se acercan el uno al otro, cerrán-


dose como las hojas de una tijera, a medida que aumenta la velocidad V entre

37
los marcos. Cuando V → 1, los ejes primados tienden ambos a la línea diago-
nal t = x. Note que es incorrecto interpretar φ como el ángulo (euclidiano)
entre ejes primados y no primados.
De acuerdo al punto de vista activo, las ecs. (3.32)–(3.33) relacionan las
coordenadas espacio-temporales de dos eventos P y Q en un mismo marco iner-
cial K. Para encontrar las coordenadas de Q, usamos las hipérbolas invariantes
que se muestran en la figura 3.4:
− t 02 + x 02 = −t 2 + x 2 = const. (3.42)
La invariancia del intervalo espacio-temporal nos garantiza que ambos eventos
pueden ser hallados sobre la misma hipérbola invariante.

3.3. Suma relativista de velocidades paralelas


En la sección 3.2 derivamos la forma de un boost en dirección x y encon-
tramos que no es posible que la velocidad relativa entre los marcos K y K 0
alcance o exceda la velocidad de la luz. ¿Es posible alcanzar o exceder la velo-
cidad de la luz componiendo dos o más boosts? En la transformación de Galileo
[cf. ec. (1.3)], las velocidades se suman vectorialmente y no hay un límite má-
ximo para su magnitud. ¿Cuál es la manera relativista de sumar velocidades?
Para componer dos boosts en dirección x, consideramos tres marcos de
referencia, K, K 0 y K 00 . La velocidad de K 0 respecto de K es V1 = tanh φ1 , mien-
tras que la velocidad de K 00 respecto de K 0 es V2 = tanh φ2 . La pregunta que
queremos responder es cuál es la velocidad de K 00 respecto de K. Las transfor-
maciones de K a K 0 y de K 0 a K 00 son
• 0 ˜ • ˜• ˜
t cosh φ1 − sinh φ1 t
= , (3.43)
x0 − sinh φ1 cosh φ1 x
• 00 ˜ • ˜• 0 ˜
t cosh φ2 − sinh φ2 t
= . (3.44)
x 00 − sinh φ2 cosh φ2 x0
La transformación compuesta, que nos lleva directamente de K a K 00 , se obtiene
multiplicando las matrices:
• 00 ˜ • ˜• ˜• ˜
t cosh φ2 − sinh φ2 cosh φ1 − sinh φ1 t
=
x 00 − sinh φ2 cosh φ2 − sinh φ1 cosh φ1 x
• ˜• ˜
cosh (φ1 + φ2 ) − sinh (φ1 + φ2 ) t
= .
− sinh (φ1 + φ2 ) cosh (φ1 + φ2 ) x

38
t0
t

x0

Figura 3.3: Líneas t 0 = const. y x 0 = const. en un boost en dirección x (punto


de vista pasivo).

39
t, t 0

x, x 0

Figura 3.4: Hipérbolas invariantes en un boost en dirección x (punto de vista


activo).

40
Este cálculo nos muestra que la matriz que media la transformación compuesta
corresponde también a un boost, con parámetro φ3 = φ1 +φ2 . Esto quiere decir
que la velocidad de K 00 respecto de K es

tanh φ1 + tanh φ2 V1 + V2
V3 = tanh φ3 = tanh (φ1 + φ2 ) = = . (3.45)
1 + tanh φ1 tanh φ2 1 + V1 V2

Esta es la suma relativista de velocidades paralelas.

Ejemplo 3.4. Alice se aleja de la Tierra a bordo de una nave espacial que se
mueve con velocidad V1 = 0,8 respecto de Bob, quien ha decidido quedarse en
la Tierra. La hermana menor de Alice, Carmen, quien va también en la nave, se
monta en una pequeña sonda que se mueve en la misma dirección que la nave
mayor. La velocidad de Carmen respecto de Alice es V2 = 0,7. Para calcular la
velocidad de Carmen respecto de Bob, usamos la ec. (3.45):

V1 + V2 1,50
V3 = = = 0,961 54. (3.46)
1 + V1 V2 1,56

Carmen se mueve respecto de Bob a una velocidad menor que la de la luz.


En el caso extremo, con V2 = 1, encontramos V3 = 1, sin importar el valor
de V1 . Esto significa que es imposible sobrepasar la velocidad de la luz compo-
niendo velocidades.∗

El factor de Lorentz para la transformación compuesta es

γ3 = cosh φ3
= cosh (φ1 + φ2 )
= cosh φ1 cosh φ2 + sinh φ1 sinh φ2
= cosh φ1 cosh φ2 (1 + tanh φ1 tanh φ2 )
= γ1 γ2 (1 + V1 V2 ) .

Velocidad de una partícula en dos marcos distintos. Vamos a reinterpre-


tar las ecuaciones que hemos obtenido en esta sección identificando K 00 con
el marco comóvil instantáneo de una partícula cuyo movimiento es descrito

La ec. (3.45) sigue siendo válida incluso si una de las velocidades es igual a la de la luz,
en contraste con las ecuaciones del boost, que se vuelven singulares cuando V = 1.

41
tanto por K como por K 0 . Este reinterpretación motiva el siguiente cambio de
notación:
V1 = V, V2 = v 0 , V3 = v, (3.47)
0
γ1 = Γ , γ2 = γ , γ3 = γ. (3.48)
Aquí, usamos una v minúscula para la velocidad de la partícula (v en K y v 0
en K 0 ) y una V mayúscula para la velocidad entre los marcos, y similarmen-
te para los factores de Lorentz asociados. Con esta nueva notación, podemos
escribir
v0 + V
v= , (3.49)
1 + V v0 
γ = Γ γ0 1 + V v 0 . (3.50)
Reconocemos este par de ecuaciones como la transformación de velocidades
inversa, i.e., la que nos da la velocidad (y el factor de Lorentz) en K a partir de
las cantidades relevantes en K 0 . Para obtener la transformación directa, sim-
plemente reemplazamos V por −V e intercambiamos cantidades primadas con
cantidades no primadas:
v−V
v0 = , (3.51)
1−Vv
γ0 = Γ γ (1 − V v) . (3.52)
Note que estas ecuaciones son válidas para una partícula que se mueve en la
dirección x y para un boost en la misma dirección. Si el movimiento de la
partícula abarca dos o tres dimensiones, manteniendo el boost en dirección x,
entonces las ecuaciones siguen siendo válidas, con las siguientes modificacio-
nes:
vx − V
vx0 = , (3.53)
1 − V vx
γ0 = Γ γ (1 − V vx ) . (3.54)
La ley de transformación para las componentes y y z de la velocidad de la
partícula es distinta de aquella para la componente x, y será estudiada en el
capítulo 5, donde también deducimos formalmente las ecs. (3.53)–(3.54).
Cuando todas las velocidades involucradas son mucho menores que la de la
luz, entonces la suma de velocidades relativista (3.53) y las relaciones corres-
pondientes para las componentes y y z se reducen a la suma de velocidades
v0 = ~
galileana, ~ v − V~ [cf. ec. (1.3)].

42
3.4. Boost en una dirección arbitraria
El boost en dirección x que dedujimos en la sección 3.2 afecta solo las coor-
denadas (t, x), dejando ( y, z) inalteradas. Escribiéndolo explícitamente como
una transformación de coordenadas en las cuatro dimensiones del espacio-
tiempo de Minkowksi, encontramos
 0    
t cosh φ − sinh φ 0 0 t
 x 0   − sinh φ cosh φ 0 0   x 
 y0  =  . (3.55)
0 0 1 0  y 
z0 0 0 0 1 z
La matriz que media esta transformación, llamémosla B x (φ) para resaltar que
corresponde a un boost en dirección x con parámetro φ, puede escribirse en la
forma B x (φ) = exp (φK x ), donde el generador de boosts en dirección x está
dado por∗
 
0 −1 0 0
 −1 0 0 0 
Kx =  . (3.56)
0 0 0 0 
0 0 0 0
La receta para construir la matriz de un boost en dirección y o z debería
ahora ser clara: definiendo los generadores de boosts en direcciones y y z como
   
0 0 −1 0 0 0 0 −1
 0 0 0 0   0 0 0 0 
Ky =   , Kz =  , (3.57)
−1 0 0 0 0 0 0 0 
0 0 0 0 −1 0 0 0
las matrices de transformación son, respectivamente,
 
cosh φ 0 − sinh φ 0
  0 1 0 0 
B y (φ) = exp φK y =  , (3.58)
− sinh φ 0 cosh φ 0 
0 0 0 1
 
cosh φ 0 0 − sinh φ
 0 1 0 0 
Bz (φ) = exp (φKz ) =  . (3.59)
0 0 1 0
− sinh φ 0 0 cosh φ

La demostración de esta afirmación, que es esencialmente idéntica a la que dimos en la
sección 3.2, se deja como ejercicio al lector.

43
Para determinar la matriz de transformación correspondiente a un boost en
una dirección arbitraria, construimos a partir de K x , K y y Kz una matriz Kn que
actúe como generador de boosts en dirección n̂, donde n̂ es un vector unitario:
Kn = n x K x + n y K y + nz Kz = n̂ · K
~, (3.60)

con n2x + n2y + n2z = 1. La notación K ~ = K x , K y , Kz hace referencia a un vector
de matrices, de manera que la matriz Kn = n̂ · K ~ resulta ser igual a
 
0 −n x −n y −nz
~ = −n x 0 0 0 
n̂ · K  −n . (3.61)
y 0 0 0 
−nz 0 0 0
Para comprobar que esta matriz genera boosts infinitesimales que dejan inva-
riante el intervalo espacio-temporal a primer orden en φ, escribimos la trans-
formación de manera explícita,
t 0 = t − φ n̂ · ~r , (3.62)
0
~r = ~r − φ t n̂, (3.63)
y reemplazamos en s2 = −t 2 + |~r |2 :
2
−t 02 + ~r 0 = − (t − φ n̂ · ~r )2 + |~r − φ t n̂|2

= −t 2 + 2φ t n̂ · ~r + |~r |2 − 2φ t n̂ · ~r + O φ 2

= −t 2 + |~r |2 + O φ 2 .
Por lo tanto, la matriz que media un boost en dirección n̂ con parámetro φ
debe poder obtenerse exponenciando
 la transformación infinitesimal, Bn (φ) =
exp (φKn ) = exp φ n̂ · K
~ .
Para determinar explícitamente la forma  de la matriz Bn (φ) debemos cal-
cular la exponencial matricial exp φ n̂ · K
~ [cf. ec. (3.9)]:

 X

φp  φ2 
exp φ n̂ · K
~ = ~ p = 1 + φ n̂ · K
n̂ · K ~+ ~ 2 + ··· .
n̂ · K (3.64)
p=0
p! 2!

Vamos a necesitar las potencias de n̂ · K


~ . Con p = 2, hallamos
 
1 0 0 0
2  0 n2 n x n y n x nz 
x
n̂ · K = 
~ . (3.65)
0 n y nx n2y n y nz 
0 nz n x nz n y n2z

44
3
Para p = 3, encontramos n̂ · K ~ = n̂ · K
~ . Las potencias superiores pueden
resumirse en la forma
 2p+2 2
~ 2p+1 = n̂ · K
n̂ · K ~, n̂ · K
~ = n̂ · K
~ , (3.66)

con p = 0, 1, 2, . . ..
Para calcular la exponencial matricial, separamos la identidad, las potencias
impares y las potencias pares:
 X

φ 2p+1 2p+1 X∞
φ 2p+2 
exp φ n̂ · K = 1 +
~ n̂ · K
~ + ~ 2p+2
n̂ · K
n=0
(2p + 1)! p=0
(2p + 2)!
X

φ 2p+1  X

φ 2p+2 
=1+ n̂ · K +
~ ~ 2.
n̂ · K
p=0
(2p + 1)! p=0
(2p + 2)!

Explícitamente,
 
 φ3 φ5 
~ =1+ φ+
exp φ n̂ · K + + · · · n̂ · K~ +
3! 5!
 2 
φ φ 4
φ 6 
+ + + ~ 2.
+ · · · n̂ · K
2! 4! 6!
Reconociendo en estas expresiones las series de Taylor para sinh φ y cosh φ −1,
podemos escribir
  
~ = 1 + sinh φ n̂ · K
Bn (φ) = exp φ n̂ · K ~ 2 . (3.67)
~ + (cosh φ − 1) n̂ · K

Esta es la forma general para la matriz de un boost en dirección n̂ con pará-


metro φ. Algebraicamente, Bn (φ) es una combinación lineal de las matrices

1, n̂ · K ~ 2 , donde los coeficientes son funciones del parámetro φ. Como
~ y n̂ · K
estas tres matrices son simétricas, Bn (φ) también lo es.
Cuando n̂ = (1, 0, 0), recuperamos el boost en dirección x:

B x (φ) = 1 + K x sinh φ + (cosh φ − 1) K x2 = 1 cosh φ + K x sinh φ, (3.68)

porque K x2 = 1. Usando V = tanh φ y γ = cosh φ, podemos escribir esta matriz


en la forma  
γ −γV 0 0
 −γV γ 0 0 
B x (V ) =  . (3.69)
0 0 1 0 
0 0 0 1

45
Reparametrizando del mismo modo la ec. (3.67), hallamos
 
Bn (V ) = 1 + γV n̂ · K ~ 2.
~ + (γ − 1) n̂ · K (3.70)
Explícitamente,
 
γ −γVx −γVy −γVz
2
 −γVx 1 + (γ − 1) n x (γ − 1) n x n y (γ − 1) n x nz 
Bn (V ) =  , (3.71)
−γVy (γ − 1) n y n x 1 + (γ − 1) n2y (γ − 1) n y nz 
−γVz (γ − 1) nz n x (γ − 1) nz n y 1 + (γ − 1) n2z
donde hemos identificado Vx = V n x , y similarmente para y y z.

3.5. El grupo de Lorentz


En la sección 3.3 determinamos que la composición de dos boosts en direc-
ción x con parámetros φ1 y φ2 es equivalente a un único boost, también en
dirección x, con parámetro φ1 + φ2 . En esta sección estudiamos el problema
de la composición de boosts en direcciones distintas.
Si hacemos un boost en dirección x con parámetro φ1 seguido por un boost
en dirección y con parámetro φ2 , obtenemos la siguiente matriz:
 
cosh φ1 cosh φ2 − sinh φ1 cosh φ2 − sinh φ2 0
 − sinh φ1 cosh φ1 0 0 
B y (φ2 ) B x (φ1 ) =  .
− cosh φ1 sinh φ2 sinh φ1 sinh φ2 cosh φ2 0 
0 0 0 1
(3.72)
Al no ser simétrica, esta matriz no puede interpretarse como un boost, i.e., no
existe ninguna combinación de dirección n̂ y parámetro φ que reduzca el boost
general (3.67) a esta forma. En pocas palabras: la composición de dos boosts en
direcciones distintas no es un boost.
Para entender qué está pasando, comencemos recordando que cada boost
puede ser escrito como  una exponencial matricial, B x (φ1 ) = exp (φ1 K x ) y
B y (φ2 ) = exp φ2 K y . En general, la multiplicación de exponenciales matri-
ciales produce la serie infinita
 ‹ ‹
1 2 1 2
exp (A) exp (B) = 1 + A + A + · · · 1 + B + B + ···
2! 2!
1 2 
= 1 + (A + B) + A + 2AB + B 2 + · · · ,
2

46
donde hemos conservado términos hasta de segundo orden. A pesar de las
apariencias, el término cuadrático del lado derecho no puede ser interpretado
como (A + B)2 . En efecto,

(A + B)2 = (A + B) (A + B) = A2 + AB + BA + B 2 , (3.73)

y esta expresión difere de A2 + 2AB + B 2 si BA 6= AB. La siguiente definición


resulta útil en este contexto (y en otros).

Definición 3.5 (Conmutador de dos matrices). Sean A y B dos matrices cua-


dradas. El conmutador [A, B] es la matriz definida por

[A, B] = AB − BA. (3.74)

Decimos que A y B conmutan si [A, B] = 0.

Usando la definición 3.5, podemos escribir


1 1
exp (A) exp (B) = 1 + (A + B) + (A + B)2 + [A, B] + · · · . (3.75)
2 2
La expresión completa está dada por la fórmula de Baker–Campbell–Hausdorff :

exp (A) exp (B) = exp (C) , (3.76)

donde
1 1
C = A+ B + [A, B] + ([A, [A, B]] + [B, [B, A]]) + · · · . (3.77)
2 12
Más allá de la forma detallada de los términos de orden superior omitidos,
lo crucial de esta expresión es que C puede determinarse completamente en
términos de A, B y conmutadores anidados entre ellos.
Esto significa que para interpretar el producto B y B x necesitamos calcular
el conmutador entre K x y K y . Encontramos
 
K x , K y = Jz , (3.78)

donde [cf. ec. (3.8)]  


0 0 0 0
 0 0 1 0 
Jz =  . (3.79)
0 −1 0 0 
0 0 0 0

47
es el generador de rotaciones en el plano x y (en lenguaje tridimensional, en
torno al eje z), escrito esta vez como una matriz de 4 × 4. Similarmente, los
generadores de rotaciones en los planos yz (eje x) y z x (eje y) son
   
0 0 0 0 0 0 0 0
 0 0 0 0   0 0 0 −1 
Jx =  , Jy =  . (3.80)
0 0 0 1  0 0 0 0 
0 0 −1 0 0 1 0 0

Luego, el producto B y B x no es un boost puro, sino una combinación de un


boost y una rotación espacial. El conmutador (3.78) muestra que los boosts por
sí mismos no forman un conjunto cerrado; es necesario incluir las rotaciones
espaciales para obtener un grupo de transformaciones.
El grupo  generado por los tres generadores de rotaciones espaciales,
 J~ =
J x , J y , Jz , más los tres generadores de boosts, K = K x , K y , Kz , es llamado
~
grupo de Lorentz restringido y denotado por SO+ (3, 1). Un elemento arbitrario
del grupo de Lorentz restringido, Λ ∈ SO+ (3, 1), puede ser escrito en la forma

Λ = exp θ ê · J~ + φ n̂ · K
~ , (3.81)

que es una combinación de una rotación por un ángulo θ alrededor del eje
ê y un boost con parámetro φ en la dirección n̂. En principio, la combina-
ción de dos boosts arbitrarios puede ser determinada a través de la fórmula
de Baker–Campbell–Hausdorff (3.77), aunque el cálculo puede ser difícil en la
práctica [12]. Todo lo que necesitamos conocer para la aplicación de la fórmu-
la es el álgebra de Lie del grupo de Lorentz restringido, consistente en todos los
conmutadores entre los seis generadores. Calculando uno por uno, hallamos
(solo se listan las combinaciones no nulas)
   
J x , J y = −Jz , J y , Jz = −J x , [Jz , J x ] = −J y , (3.82)
   
J x , K y = −Kz , J y , Kz = −K x , [Jz , K x ] = −K y , (3.83)
   
K x , J y = −Kz , K y , Jz = −K x , [Kz , J x ] = −K y , (3.84)
   
K x , K y = Jz , K y , Kz = J x , [Kz , K x ] = J y . (3.85)

Las ecuaciones (3.82) muestran que las rotaciones espaciales forman un grupo
por sí mismas, denotado por SO(3). La misma afirmación no es cierta para los
boosts; como se desprende de las ecuaciones (3.85), el conmutador entre dos
boosts produce siempre una rotación espacial.

48
Es posible demostrar que toda transformación Λ ∈ SO+ (3, 1) puede ser
escrita como el producto de un boost B y una rotación espacial R, conocida
como rotación de Wigner: Λ = BR. Hallar esta factorización es un problema
algebraico no trivial, que no abordaremos aquí. En particular, esto significa
que la componente t t de Λ (en la esquina superior izquierda de la matriz),
que denotamos por Γ , cumple siempre con Γ ≥ +1, i.e., puede ser siempre
interpretada como el factor de Lorentz de un boost.
La nomenclatura SO+ (3, 1) se explica entonces por cuatro características
de la transformación:

1. La “S” es de special, que se refiere a la propiedad det (Λ) = +1. Esta puede
establecerse
 directamente
 a partir de la identidad (3.10), notando que
Tr J~ = Tr K ~ = 0.

2. Λ es una matriz “cuasi-ortogonal”, en el sentido que deja invariante una


forma cuadrática (que incluye un signo menos, por lo que la transpuesta
no coincide exactamente con la inversa). La “O” viene de orthogonal.

3. El exponente “+” viene del hecho que Γ ≥ +1.

4. Los números (3, 1) se refieren a los tres signos positivos y al único signo
negativo en la forma cuadrática ds2 = −d t 2 + d x 2 + d y 2 + dz 2 .

¿Hemos conseguido aquí el objetivo que nos planteamos al comienzo de


este capítulo? ¿Son estas todas las transformaciones lineales que dejan inva-
riante el intervalo espacio-temporal? La respuesta, como veremos enseguida,
es “casi”.

Inversión temporal. La transformación dada por la matriz


 
−1 0 0 0
 0 1 0 0 
T = , (3.86)
0 0 1 0 
0 0 0 1

que representa una inversión en el flujo del tiempo, también preserva el interva-
lo espacio-temporal (ya que d t 0 = −d t, y d t 02 = d t 2 ), pero no puede escribirse
en la forma (3.81). En efecto, tenemos det (T ) = −1 y Γ = −1 (donde Γ denota
la componente t t de la matriz T ).

49
det (Λ) = +1 det (Λ) = −1
Γ ≥ +1 PO IO
Γ ≤ −1 PA IA

Tabla 3.1: Clasificación de las transformaciones de Lorentz Λ. Decimos que la


transformación es “propia” (P) si det (Λ) = +1 e “impropia” (I) si det (Λ) = −1.
Denotando por Γ el elemento t t de la matriz Λ, llamamos “ortocrona” (O) a
una transformación con Γ ≥ +1 y “anticrona” (A) a una transformación con
Γ ≤ −1.

Paridad (reflexión espacial). La transformación dada por la matriz


 
1 0 0 0
 0 −1 0 0 
P = , (3.87)
0 0 −1 0 
0 0 0 −1

que representa una reflexión simultánea en las tres direcciones espaciales, tam-
bién preserva el intervalo espacio-temporal ds2 , pero, al igual que la inversión
temporal T , tampoco puede escribirse en la forma (3.81). (Note que P = −T ).

∗ ∗ ∗

Las transformaciones T y P son ejemplos de transformaciones de Lorentz


impropias, llamadas así porque det (T ) = det (P) = −1.
En general, las transformaciones de Lorentz pueden clasificarse en cuatro
categorías, dependiendo del signo del determinante (“propia” si es positivo e
“impropia” si es negativo) y de si el elemento t t de la matriz de transformación,
denotado por Γ , cumple con Γ ≥ 1 (“ortocrona”) o con Γ ≤ −1 (“anticrona”).
La tabla 3.1 muestra las cuatro posibilidades.
Las matrices que pueden escribirse en la forma exponencial dada en la
ec. (3.81) pertenecen todas al sector PO en la tabla 3.1: transformaciones pro-
pias y ortocronas. Este sector es el único que es un grupo por sí mismo, el grupo
de Lorentz restringido, o SO+ (3, 1). Si Λ ∈ SO+ (3, 1), entonces las transforma-
ciones de los sectores IA, IO, y PA pueden escribirse siempre en la forma T Λ,
PΛ, y P T Λ, respectivamente.

50
T
PO IA

P P

IO PA
T

Figura 3.5: El grupo de Lorentz O (3, 1) está compuesto de cuatro “islas” des-
conectadas entre sí. Las transformaciones propias y ortocronas (PO) forman
el grupo de Lie SO+ (3, 1), cuyos elementos  pueden escribirse en la forma
[cf. ec. (3.81)] Λ = exp θ ê · J + φ n̂ · K . Si Λ ∈ SO+ (3, 1), entonces las trans-
~ ~
formaciones impropias y anticronas (IA), impropias y ortocronas (IO) y propias
y anticronas (PA) pueden escribirse en la forma T Λ, PΛ y P T Λ, respectivamen-
te. En este sentido, P y T actúan como “botes” que nos permiten pasar de una
isla a otra. Note que P T = −1.

Distinguimos los siguientes grupos:

SO+ (3, 1) = PO, (3.88)


SO (3, 1) = PO ∪ PA, (3.89)
O+ (3, 1) = PO ∪ IO, (3.90)
O (3, 1) = PO ∪ PA ∪ IO ∪ IA, (3.91)

a los que llamamos grupo de Lorentz restringido, grupo de Lorentz propio, gru-
po de Lorentz ortocrono, y grupo de Lorentz (a secas), respectivamente. Note
que esta nomenclatura está lejos de ser universal, por lo que siempre convie-
ne aclarar qué se entiende cuando se habla del “grupo de Lorentz”. El grupo
de Lorentz O (3, 1) consiste entonces de cuatro “islas” desconectadas entre sí,
donde solo el grupo restringido SO+ (3, 1) corresponde a un grupo de Lie. Las
transformaciones impropias de paridad P e inversión temporal T actúan co-
mo “botes” que nos permiten pasar de una isla a otra, como se sugiere en la
figura 3.5.
El grupo de Lorentz es el grupo de rotaciones en el espacio-tiempo de Min-
kowski, y sus elementos, llamados transformaciones de Lorentz, son las trans-
formaciones lineales más generales que dejan invariante el intervalo espacio-
temporal ds2 = −d t 2 + d x 2 + d y 2 + dz 2 .

51
Traslaciones. La transformación

t 0 = t + a, x 0 = x + b, y 0 = y + c, z 0 = z + d, (3.92)

donde a, b, c, y d son constantes, también deja invariante el intervalo espacio-


temporal ds2 (trivialmente, ya que d t 0 = d t, d x 0 = d x, etc.). Las traslacio-
nes no están incluidas en el grupo de Lorentz, ya que no pueden ser escritas
como una matriz de 4 × 4 actuando sobre (t, x, y, z). (Es decir, no son trans-
formaciones lineales, a pesar de las apariencias). Es fácil ver que ellas forman
un grupo abeliano (i.e., conmutativo).
 El
álgebra de Lie del grupo de trasla-
ciones es trivial: llamando Pt , Px , P y , Pz a los cuatro generadores, hallamos
 
[Pt , Px ] = Px , P y = · · · = 0.
El conjunto formado por las transformaciones del grupo de Lorentz más las
traslaciones espacio-temporales es llamado grupo de Poincaré.

52
Capítulo 4

Introducción al cálculo tensorial

El Principio de la Relatividad que introdujimos en el capítulo 2 nos obliga a


buscar leyes de la física que sean válidas para todos los observadores inerciales.
Si K y K 0 son dos observadores inerciales, entonces las mediciones que ambos
realizan están relacionadas entre sí a través de las transformaciones de Lorentz
que estudiamos en el capítulo 3. En particular, si K 0 se mueve con velocidad
constante V~ respecto de K, entonces la transformación relevante es el boost
Bn (φ) = exp φ n̂ · K~ , donde V~ = V n̂, con V = tanh φ [cf. ec. (3.67)].
Juntando ambas ideas, encontramos que las leyes de la física deben ser in-
variantes bajo transformaciones de Lorentz. Más concretamente, todas las ecua-
ciones de la física debe conservar su forma, i.e., ser covariantes bajo transfor-
maciones de Lorentz.
En este capítulo desarrollamos los elementos esenciales de un lenguaje,
el formalismo tensorial, que nos permite asegurar de manera automática la
covariancia de Lorentz de nuestras ecuaciones. Comenzamos en la sección 4.1
con una introducción a la notación tensorial, seguida por las definiciones de
escalares, vectores y tensores para el grupo de rotaciones en tres dimensiones
O (3), en la sección 4.2. Los conceptos y técnicas que desarrollamos son luego
extendidos y refinados en las secciones 4.3, sobre transformaciones generales
de coordenadas, y 4.4, que trata sobre escalares, vectores y tensores del grupo
de Lorentz O (3, 1).
Los libros de Synge y Schild [13], Lovelock y Rund [14] y Kay [15] son
buenas referencias para profundizar en los temas de este capítulo.

53
4.1. La notación tensorial
En su nivel más elemental, el cálculo tensorial no es más que una nota-
ción computacional eficiente para tratar con “objetos con índices”: escalares
(0 índices), vectores (1 índice) y tensores (2 o más índices). Usamos letras
del alfabeto latino (típicamente, i, j, k, . . .) para denotar índices en el conjun-
to {1, 2, 3}. Así, x i representa una coordenada génerica de entre (x, y, z), con
x 1 = x, x 2 = y y x 3 = z.
Vectores y matrices son representados a través de sus componentes; por
ejemplo, escribimos Ai en lugar de A~ y Mi j en lugar de la matriz M . A menu-
do decimos “el vector Ai ” o “la matriz Mi j ” en lugar de las expresiones más
precisas “el vector cuyas componentes son Ai , con i = 1, 2, 3” o “la matriz de
componentes Mi j ”. Cuando sea importante marcar la diferencia entre el objeto
y suscomponentes, sobre todo en el caso de matrices, vamos a usar la notación
Mi j para denotar la matriz cuyas componentes son Mi j :
 
  M11 M12 M13
Mi j =  M21 M22 M23  . (4.1)
M31 M32 M33

Convención de la suma de Einstein. Cuando repetimos índices en un mismo


término de una expresión, entendemos que hay una suma sobre ellos, sin que
resulte necesario escribir explícitamente el símbolo de sumatoria.
Por ejemplo, en la ecuación x i0 = R i j x j debe entenderse que hay una suma
sobre el índice j en el lado derecho, mientras que en Ci = Ai +Bi no hay ninguna
suma indicada.
Esta convención de la suma es parte del Cálculo de Ricci, el conjunto de reglas
para la manipulación de tensores, y fue introducida a la física por Einstein en
1916 [16]. Actualmente es utilizada de manera universal en la física relativista.

Índices libres e índices mudos. Distinguimos entre índices libres e índices


mudos o de suma. Un índice libre puede tomar cualquier valor dentro de su
rango permitido, mientras que un índice mudo debe sumarse sobre todos los
valores posibles. Por ejemplo, en la ecuación x i0 = R i j x j el índice i es libre y
el índice j es mudo. Los índices libres deben coincidir a ambos lados de una
ecuación para que esta sea consistente. Por ejemplo, para expresar la igualdad
entre dos vectores A~ y B
~ escribimos Ai = Bi , entendiendo que esta ecuación es

54
equivalente a las tres ecuaciones A1 = B1 , A2 = B2 y A3 = B3 . Es incorrecto en
este contexto escribir, e.g., Ai = B j . Note, sin embargo, que las ecuaciones Ai =
Bi y A j = B j expresan exactamente lo mismo. Esto quiere decir que podemos
cambiar el nombre de un índice libre a voluntad, siempre que este cambio
afecte todas las ocurrencias del índice en la ecuación. Similarmente, un índice
mudo puede cambiar de nombre sin afectar el significado de una expresión; por
ejemplo, R i j x j expresa exactamente lo mismo que R ik x k . (Como los índices son
mudos, podemos cambiarles de nombre y no gritan). La regla fundamental que
debe respetarse al hacer estas manipulaciones está contenida en el mantra 4.1.

Mantra 4.1. No repetirás índices más de dos veces en un mismo término.

Contracción de índices. La operación Ai B j 7→ Ai Bi , donde dos índices se


hacen iguales y se procede por lo tanto a sumar sobre ellos, es llamada con-
tracción. Como veremos más adelante, la contracción de índices es una de las
operaciones básicas del cálculo tensorial.

Ejemplo 4.2 (Producto punto entre dos vectores). Sean A~ y B ~ dos vectores.
Usando la notación tensorial, podemos escribir su producto punto en la forma

A~ · B
~ = Ai Bi . (4.2)

Ejemplo 4.3 (Operaciones matriciales). Sean P y Q dos matrices cuadradas.


Las operaciones de transpuesta, traza y producto matricial se escriben de la
siguiente manera:

PiTj = P ji

Tr (P) = P j j
 
PQ = Pik Q k j

La última de estas ecuaciones contiene la regla computacional para calcular


el producto entre dos matrices, donde la componente i j del producto PQ co-
rresponde al producto punto de la i-ésima fila de P con la j-ésima columna
de Q. Como regla mnemotécnica, la interpretación del producto de dos ten-
sores como producto matricial requiere que el segundo índice de la primera
matriz este contraído con el primer índice de la segunda matriz, de manera
que la expresión final contiene dos índices libres y un par de índices mudos.

55
Ejemplo 4.4 (Propiedad cíclica de la traza). La traza del producto de tres ma-
trices satisface la siguiente propiedad cíclica:

Tr (ABC) = Tr (BCA) = Tr (CAB) . (4.3)

Resulta sencillo demostrar esta propiedad usando la notación tensorial. Escri-


bimos Tr (ABC) = Ai j B jk Cki y notamos que las componentes de las matrices,
al ser números reales o complejos, conmutan entre sí: esto quiere decir que
podemos escribir

Ai j B jk Cki = Ai j Cki B jk = B jk Cki Ai j = B jk Ai j Cki = Cki Ai j B jk = Cki B jk Ai j . (4.4)

De estas seis expresiones equivalentes, solo tres, correspondientes a las per-


mutaciones cíclicas ABC, BCA y CAB, pueden interpretarse como traza de un
producto matricial, demostrando así la propiedad cíclica.

¿Dónde está la base? Algunos autores prefieren incluir en su tratamiento


del cálculo tensorial una base vectorial êi , en términos de la cual es posible es-
cribir, e.g., A~ = Ai êi . En mi experiencia, la introducción de esta base vectorial es
superflua en este nivel. Todos nuestros cálculos asumen una base ortonormal y
pueden realizarse por lo tanto exclusivamente en términos de las componentes
de vectores y tensores.

4.2. Tensores en el espacio euclidiano tridimen-


sional
Formalmente, la definición de un tensor hace referencia a sus propiedades
de transformación bajo un grupo dado. En el caso del grupo de rotaciones
en tres dimensiones O (3), estas transformaciones están dadas por matrices
ortogonales R i j . En general, un tensor es un campo que transforma de manera
multilineal (i.e., lineal en cada uno de sus índices) bajo el grupo.

Definición 4.5 (Campo escalar). Decimos que φ (x) es un campo escalar si se


mantiene inalterado bajo una rotación x i0 = R i j x j :

φ 0 x 0 = φ (x) . (4.5)

Usamos la notación abreviada φ (x) para denotar φ (x, y, z).

56
En el cálculo tensorial, la palabra “escalar” se usa en un sentido más res-
trictivo que en el resto de la física, donde es básicamente un sinónimo de “nú-
mero”. Decimos que una cantidad es un escalar solo si se mantiene invariante
bajo rotaciones. Como muestra la siguiente definición, las componentes de un
vector no son, en este sentido, escalares.
Definición 4.6 (Campo vectorial). Decimos que Ai (x) es un campo vectorial si
bajo una rotación x i0 = R i j x j sus componentes cambian de acuerdo a la regla

A0i x 0 = R i j A j (x) . (4.6)

Ejemplo 4.7. Como veremos en el capítulo 7, el campo eléctrico E~ es, en efecto,


un campo vectorial de O (3).
Definición 4.8 (Campo tensorial de orden 2). Decimos que Ti j (x) es un campo
tensorial de orden 2 si bajo una rotación x i0 = R i j x j sus componentes cambian
de acuerdo a la regla 
Ti0j x 0 = R ik R jl Tkl (x) . (4.7)
Ejemplo 4.9. Si Ai y Bi son dos vectores, entonces el producto Ai B j es un tensor
de orden 2. Explícitamente,
 
  A1 B1 A1 B 2 A1 B 3
Ai B j =  A2 B1 A2 B2 A2 B3  . (4.8)
A3 B1 A3 B2 A3 B3

Definición 4.10 (Delta de Kronecker). El delta de Kronecker δi j está definido


como ¨
1 si i = j,
δi j = (4.9)
0 si i =
6 j.
El delta de Kronecker es un tensor inusual en el sentido que esta definición vale
en todos los marcos relacionados entre sí por rotaciones ortogonales, es decir,
el delta de Kronecker tiene el mismo valor en todos los marcos: δi0 j = δi j . En la
sección 4.3 mostraremos cómo esta definición es consistente con los requisitos
de transformación para un tensor de orden 2.
Resulta tentador imaginar el delta de Kronecker como la matriz identidad,
 
  1 0 0
δi j = 1 =  0 1 0  . (4.10)
0 0 1

57
No es, por supuesto, incorrecto caer en esta tentación, pero probablemente una
imagen mental más útil proviene de la comparación entre el delta de Kronecker
y su pariente “continuo”, la delta de Dirac δ (x). La propiedad fundamental de
la delta de Dirac está expresada en la ecuación
Z∞
δ (x − y) f ( y) d y = f (x) . (4.11)
−∞

Similarmente, el delta de Kronecker satisface

δi j f j = f i . (4.12)

Las variables x y y en la ec. (4.11) son análogas a índices continuos i y j, mien-


tras que la integración sobre y es análoga a la contracción sobre el índice j.
Decimos que el delta de Kronecker δi j actúa sobre el vector f j y le cambia el
nombre a su índice, que pasa de j a i.

Ejemplo 4.11. Explique por qué δii = 3.

Ejemplo 4.12 (Matriz inversa). Decimos que Mi−1 j


es la matriz inversa de Mi j
si Mik Mk j = Mik Mk j = δi j . Aquí, por supuesto, Mi−1
−1 −1
j
denota la componente
−1
i j de la matriz M , no el inverso multiplicativo de la componente i j de la
matriz M .

Ejemplo 4.13 (Matriz ortogonal). Decimos que R i j es una matriz ortogonal si


R−1
ij
= R Tij , i.e., si R ki R k j = R ik R jk = δi j .

Ejemplo 4.14 (Invariancia de A~ · B ~ ). Si Ai y Bi son dos vectores, entonces su


producto punto, Ai Bi , es un escalar, i.e., es invariante bajo rotaciones de O (3).
En efecto,

A0i Bi0 = R i j A j (R ik Bk ) = R i j R ik A j Bk = δ jk A j Bk = Ai Bi . (4.13)

Note cómo se manejan los índices mudos para evitar repetir cualquiera de ellos
más de dos veces.

Ejemplo 4.15. La ley de transformación para un tensor


 de  orden2 puede
 es-
0 −1
cribirse en la forma matricial T = RT R , donde T = Ti j y R = R i j .

58
Ejemplo 4.16 (Proyectores). Sea ni un vector unitario. Los tensores
k
Pi j = ni n j , Pi⊥j = δi j − ni n j , (4.14)

actúan como proyectores en las direcciones paralela y perpendicular a ni . Esto


quiere decir que cualquier vector Ai puede descomponerse en la forma Ai =
k
Ai + A⊥i , con
k k
Ai = Pi j A j , A⊥i = Pi⊥j A j . (4.15)

Estos vectores son, respectivamente, paralelo y perpendicular a ni .

Definición 4.17 (Campo tensorial de orden n). Decimos que Ti1 ···in (x) es un
campo tensorial de orden n si bajo una rotación x i0 = R i j x j sus componentes
cambian de acuerdo a la regla

Ti01 ···in x 0 = R i1 j1 · · · R in jn T j1 ··· jn (x) . (4.16)

La definición de tensor como un objeto que transforma multilinealmente


bajo rotaciones nos permite asegurar que si todas las componentes de un ten-
sor se anulan en un marco dado, entonces el tensor es cero en todos los marcos:
Ti1 ···in = 0 ⇒ Ti01 ···in = 0. Equivalentemente, si dos tensores son iguales en un
marco dado, entonces son iguales en todos los marcos relacionados con el pri-
mero a través de rotaciones ortogonales. Esto quiere decir que las ecuaciones
tensoriales conservan su forma, i.e., son covariantes bajo las transformaciones
del grupo en cuestión. Una vez definamos tensores de Lorentz en la sección 4.4,
el formalismo nos permitirá escribir ecuaciones que son automáticamente co-
variantes de Lorentz. Este es el poder del cálculo tensorial, y la razón por la
que constituye el lenguaje matemático natural para la Relatividad.

Simetrías tensoriales. Resulta crucial reconocer la existencia de distintas


clases de simetrías tensoriales.

Definición 4.18 (Tensor simétrico de orden 2). Decimos que el tensor Si j es


simétrico si S ji = Si j .

Definición 4.19 (Tensor antisimétrico de orden 2). Decimos que el tensor Ai j


es antisimétrico si A ji = −Ai j .

59
Un tensor Ti j no tiene por qué tener una simetría definida, i.e., no tiene por
qué ser simétrico o antisimétrico. En el caso más general posible, sus 3 × 3 = 9
componentes son todas independientes entre sí. Un tensor simétrico Si j , en
cambio, tiene solo 6 componentes independientes, mientras que uno antisimé-
trico Ai j tiene apenas 3, que pueden representarse de la siguiente manera:
   
  S11 S12 S 31   0 A12 −A31
Si j =  S12 S22 S23  , Ai j =  −A12 0 A23  . (4.17)
S31 S23 S33 A31 −A23 0

Como 6 + 3 = 9, esto sugiere que podemos descomponer un tensor general Ti j


en una parte simétrica y una parte antisimétrica. En efecto, llamando
1  1 
T(i j) = Ti j + T ji , T[i j] = Ti j − T ji , (4.18)
2 2
podemos escribir Ti j = T(i j) + T[i j] , donde T(i j) es simétrico y T[i j] es antisimé-
trico.

Ejemplo 4.20. Sean Si j un tensor simétrico y Ai j un tensor antisimétrico. En-


tonces, Si j Ai j = −S ji A ji = −Si j Ai j = 0.

Con dos índices, la única permutación posible consiste en intercambiarlos,


i j 7→ ji. Con tres índices, existen seis permutaciones posibles (incluyendo la
permutación trivial), como se lista en la tabla 4.1. Es posible asignar una pari-
dad a cada permutación teniendo en cuenta el número de intercambios de un
par de índices que es necesario efectuar para llegar desde el orden inicial i jk a
la permutación en cuestión. Por ejemplo, la permutación ik j es impar porque
basta con un intercambio de un par de índices para alcanzarla a partir de i jk:
i jk 7→ ik j, donde hemos intercambiado j y k. La permutación ki j, en cambio,
es par, porque se necesitan dos intercambios para alcanzarla a partir de i jk:
i jk 7→ jik 7→ jki. La figura 4.1 muestra que la paridad de una permutación
está bien definida en el sentido que, por ejemplo, es imposible pasar de i jk a
jki con un número impar de intercambios.
Con tres índices, las permutaciones pares coinciden con las permutaciones
cíclicas, pero esta coincidencia no ocurre para cuatro o más índices.

Definición 4.21 (Tensor totalmente simétrico de orden 3). Decimos que el


tensor Si jk es totalmente simétrico si Si jk = Sik j = S jki = S jik = Ski j = Sk ji , i.e.,
si su valor no cambia al hacer cualquier permutación en sus índices.

60
Permutación Paridad
i jk par i
ik j impar
jki par +
jik impar k j
ki j par
k ji impar

Tabla 4.1: Permutaciones pares e impares de tres índices. Con tres índices, pero
no con cuatro o más, las permutaciones pares coinciden con las permutaciones
cíclicas, representadas en el dibujo de la derecha.

ik j i jk ik j ···

i jk jik jki jik ···

k ji ki j k ji ···

0 1 2 3 ···

Figura 4.1: Partiendo de i jk y realizando un intercambio de índices, podemos


obtener ik j, jik o k ji, dependiendo de cuáles índices intercambiemos. Toman-
do una de estas tres permutaciones como punto de partida y realizando otro
intercambio de índices, llegamos a i jk, jki o ki j. Iterando el proceso, encontra-
mos que, comenzando con i jk, solo es posible alcanzar las permutaciones ik j,
jik y k ji a través de un número impar de intercambios, mientras que siempre
se necesita un número par de intercambios para obtener i jk, jki o ki j.

61
Definición 4.22 (Tensor totalmente antisimétrico de orden 3). Decimos que
el tensor Ai jk es totalmente antisimétrico si Ai jk = −Aik j = A jki = −A jik = Aki j =
−Ak ji , i.e., si cambia de signo cuando intercambiamos dos índices cualesquiera.

Contando cuidadosamente∗ , podemos concluir que un tensor totalmente


simétrico de orden 3 tiene 10 componentes independientes, las que podemos
escoger como S111 , S222 , S333 , S112 , S113 , S221 , S223 , S331 , S332 , S123 . Todas las otras
componentes pueden obtenerse a partir de estas diez usando la simetría en los
índices. Un tensor totalmente antisimétrico de orden 3, en cambio, tiene solo
una componente independiente, que puede escogerse como A123 . La diferencia
entre ambos ocurre porque Ai jk es automáticamente cero siempre que se repi-
tan dos o más índices. Por ejemplo, A112 = 0, porque la antisimetría exige que,
al intercambiar los dos primeros índices, se cumpla A112 = −A112 .
Estas 10+1 = 11 componentes son por supuesto insuficientes para generar
las 33 = 27 componentes independientes de un tensor de orden 3 genérico.
A diferencia del caso con dos índices, con tres o más índices es posible tener
simetrías parciales, e.g., T jik = Ti jk , que involucra solo los dos primeros índices.
Son estos tensores con simetrías parciales los que hacen falta para completar
las 27 componentes del tensor genérico.

Tensores totalmente antisimétricos. En tres dimensiones, un tensor total-


mente antisimétrico con dos índices tienes tres componentes independientes,
mientras que uno con tres índices tiene solo una. No hay tensores totalmente
antisimétricos con cuatro o más indices en tres dimensiones; debido a la anti-
simetría, todas sus componentes serían cero. Esto significa que un tensor total-
mente antisimétrico con dos índices tiene tantas componentes independientes
como un vector, Ai j ∼ Vi , mientras que uno con tres índices tiene tantas como
un escalar, Ai jk ∼ φ.
En un espacio de d dimensiones, un tensor totalmente antisimétrico con n
índices tiene  ‹
d d!
= (4.19)
n n! (d − n)!
componentes independientes. Dado que
 ‹  ‹
d d
= , (4.20)
n d−n
∗ d+n−1
 (d+n−1)!
En d dimensiones, un tensor totalmente simétrico de orden n tiene n = n!(d−1)!
componentes independientes.

62
Orden del Orden del Componentes
Dimensión
tensor tensor dual independientes
3 0 3 1
3 1 2 3
3 2 1 3
3 3 0 1
4 0 4 1
4 1 3 4
4 2 2 6
4 3 1 4
4 4 0 1

Tabla 4.2: Dualidades entre tensores totalmente antisimétricos en tres y cuatro


dimensiones.

existe siempre una dualidad entre tensores totalmente antisimétricos con n ín-
dices y tensores totalmente antisimétricos con d − n índices en d dimensiones.
No hay tensores totalmente antisimétricos con más de d índices en d dimen-
siones. La tabla 4.2 muestra un resumen de las dualidades entre tensores to-
talmente antisimétricos en tres y cuatro dimensiones.

Definición 4.23 (Símbolo de Levi-Civita). El símbolo de Levi-Civita εi jk está


definido como

 0 si se repiten dos o más indices,
εi jk = +1 si i jk es una permutación par de 123, (4.21)

−1 si i jk es una permutación impar de 123.

Explícitamente, las únicas componentes no nulas son ε123 = ε231 = ε312 =


+1 y ε132 = ε213 = ε321 = −1. Esta definición es válida en todos los marcos
relacionados entre sí a través de rotaciones ortogonales; en otras palabras,
ε0i jk = εi jk .

Ejemplo 4.24. Sea Ai jk un tensor totalmente antisimétrico. Como Ai jk tiene


solo una componente independiente, podemos escribir Ai jk = A123 εi jk .

63
Propiedades del símbolo de Levi-Civita. Llamemos

δ δin
il δim
δl mn = δ jl δ jm δ jn ,
i jk
(4.22)
δkl δkm δkn

donde las barras verticales denotan el determinante de la matriz de 3 × 3,


i jk
de manera que δl mn es un tensor de orden 6 definido como una combinación
lineal de productos de deltas de Kronecker. La posición de los índices está ade-
lantando los refinamientos que introduciremos en la sección 4.3; por ahora,
es solo una manera práctica de distinguir entre los índices que corresponden
a filas y los que corresponden a columnas. Este tensor es antisimétrico en los
tres índices superiores; en efecto, los intercambios i ↔ j, j ↔ k y k ↔ i son
equivalentes a intercambiar dos filas en la matriz, lo que produce un cambio
de signo en el determinante. Similarmente, los intercambios l ↔ m, m ↔ n
y n ↔ l son equivalentes a intercambiar dos columnas de la matriz, lo cual
también produce un cambio de signo en el determinante. Al ser antisimétrico
i jk 123
en i jk y en lmn, este tensor puede escribirse en la forma δlmn = δ123 εi jk εlmn
123
(ver ejemplo 4.24). Notando que δ123 = det (1) = 1, encontramos un primer
resultado importante sobre el símbolo de Levi-Civita:

δ δ δ
il im in
εi jk εlmn = δ jl δ jm δ jn . (4.23)
δkl δkm δkn

Desarrollando el determinante, esta identidad adopta la forma más explícita


pero menos memorable
  
εi jk εl mn = δil δ jm δkn − δ jn δkm −δim δ jl δkn − δ jn δkl +δin δ jl δkm − δ jm δkl .
(4.24)
Contrayendo n = k y simplificando, hallamos

εi jk εlmk = δil δ jm − δim δ jl , (4.25)

que debe ser una de las pocas ecuaciones que vale la pena memorizar en este
curso. Hay varias reglas mnemotécnicas para recordar la posición de los índi-
ces; busque una que le funcione a usted y adóptela como propia.
Contrayendo dos índices entre ambos símbolos de Levi-Civita, encontramos
la identidad
εikl ε jkl = 2δi j . (4.26)

64
Finalmente, cuando todos los índices están contraídos, obtenemos

εi jk εi jk = 6. (4.27)

Sea Mi j una matriz invertible. En analogía con (4.22), definimos



M M M
il im in
Mlmn = M jl M jm M jn .
i jk
(4.28)
Mkl Mkm Mkm

i jk i jk
Al igual que δl mn , el tensor Mlmn es antisimétrico en i jk y en l mn, por lo
i jk 123 123
que puede escribirse en la forma Mlmn = M123 εi jk εlmn . Notando que M123 =
i jk
det (M ), encontramos que Mlmn = det (M ) εi jk εlmn . Por otro lado, las propieda-
des del delta de Kronecker y de los determinantes nos permiten escribir

M
il Mim Min
det (M ) εi jk εl mn = M jl M jm M jn

Mkl Mkm Mkn

M δ M δ M δ
ip pl ip pm ip pn
= M jq δql M jq δqm M jq δqn
Mkr δ r l Mkr δ r m Mkr δ r n

δ δ δ
pl pm pn
= Mip M jq Mkr δql δqm δqn
δr l δr m δr n
= Mip M jq Mkr ε pqr εlmn .

Poniendo lmn = 123, obtenemos la identidad

det (M ) εi jk = Mip M jq Mkr ε pqr . (4.29)

Esta es una fórmula explícita para calcular el determinante de una matriz de


3 × 3 usando el símbolo de Levi-Civita.
T
Sea R una matriz ortogonal.  Tomando determinante en la ecuación R R =
T
1 y recordando que det M = det (M ) para cualquier matriz M , hallamos
[det (R)]2 = 1, i.e., det (R) = ±1. Las matrices R con determinante positivo
corresponden a rotaciones propias, mientras que aquellas con determinante
negativo corresponden a rotaciones impropias, que pueden descomponerse

65
como el producto de una rotación propia y una reflexión. Aplicando la identi-
dad (4.29) a la matriz R i j y multiplicando a ambos lados por det (R), encon-
tramos
ε0i jk = det (R) R il R jm R kn εlmn , (4.30)
donde hemos usado la relación (cf. def. 4.23) ε0i jk = εi jk . Esta ecuación ex-
presa la ley de transformación del símbolo de Levi-Civita bajo rotaciones, que
cambia para no cambiar. Un objeto con una ley de transformación como esta,
que difiere de la regla tensorial por la presencia del determinante de la matriz
de rotación en el lado derecho, es llamado un pseudotensor. Un pseudotensor
transforma de la misma manera que un tensor cuando la transformación es
propia, pero cambia en un signo adicional cuando la transformación es impro-
pia. Note que, como [det (R)]2 = 1, el producto de dos pseudotensores es otra
vez un tensor.

Ejemplo 4.25 (Producto cruz). Si A~ y B ~ son dos vectores, entonces las compo-
nentes de su producto cruz, C~ = A~ × B
~ , pueden calcularse en la forma

Ci = εi jk A j Bk . (4.31)

La presencia del símbolo de Levi-Civita en la ec. (4.31) implica que Ci trans-


forma como un pseudovector bajo rotaciones, i.e., Ci0 = det (R) R i j C j .

Ejemplo 4.26 (Vectores y pseudovectores). La diferencia entre un vector E~ y


un pseudovector B ~ se manifiesta en cómo transforman bajo rotaciones impro-
pias. Por ejemplo, bajo una reflexión dada por la matriz
 
−1 0 0
R =  0 1 0 , (4.32)
0 0 1

encontramos [con Ei0 = R i j E j , Bi0 = det (R) R i j B j ]


      
E x0 −1 0 0 Ex −E x
 E 0y  =  0 1 0   E y  =  E y  , (4.33)
Ez0 0 0 1 Ez Ez
      
B 0x −1 0 0 Bx Bx
 B 0y  = −  0 1 0   B y  =  −B y  , (4.34)
Bz0 0 0 1 Bz −Bz

66
y y
E~ E~0 B
~

x x

~0
B
Figura 4.2: Bajo una reflexión en un espejo perpendicular al eje x, un vector E~
y un pseudovector B~ transforman de maneras distintas. Note que esta figura
muestra el punto de vista activo de la reflexión (ver sección 3.1).

como se sugiere en la figura 4.2. Mientras que el vector E~ es reflejado en un es-


pejo que yace sobre el plano yz (i.e., perpendicular al eje x), el pseudovector B
~
es reflejado e invertido por el espejo.

Ejemplo 4.27 (Campo magnético). Como veremos en el capítulo 7, el cam-


po magnético B ~ transforma como un pseudovector bajo rotaciones de O (3).
Para entender esta propiedad del campo magnético de manera más intuitiva,
considere la situación que se ilustra en la figura 4.3. De acuerdo a la ley de
Ampère, una corriente estacionaria I en un circuito cerrado genera un campo
magnético B ~ que atraviesa el plano definido por el circuito. Para determinar la
dirección del campo magnético puede utilizarse la regla de la mano derecha,
con el pulgar en la dirección de la corriente y los dedos indicando la dirección
del campo magnético. Cuando reflejamos el circuito en un espejo, indicado por
la línea punteada vertical, las líneas de campo magnético sufren una reflexión
y una inversión, es decir, se comportan como un pseudovector.

Cálculo tensorial. Usamos la notación abreviada ∂i para denotar el operador


de derivada parcial respecto de x i :


∂i = . (4.35)
∂ xi

Como sugiere la notación, ∂i transforma como un vector bajo rotaciones de


O(3). Para comprobar esta propiedad, partimos usando la regla de la cadena

67
B
~ B
~

I I

Figura 4.3: Cuando reflejamos un circuito cerrado de corriente en un espejo,


el campo magnético generado sufre una reflexión y una inversión, es decir, se
comporta como un pseudovector. Los colores de las líneas de campo son solo
una ayuda visual para distinguir más fácilmente la reflexión de una rotación.

para obtener
∂ ∂ xj ∂ ∂ xj
∂i0 = = = ∂j. (4.36)
∂ x i0 ∂ x i0 ∂ x j ∂ x i0
La matriz jacobiana correspondiente a una rotación x i0 = R i j x j es

∂ x i0 ∂ ∂ xk
= (R ik x k ) = R ik = R ik δk j = R i j . (4.37)
∂ xj ∂ xj ∂ xj

Similarmente, la matriz jacobiana inversa es

∂ xi
= R−1
ij
. (4.38)
∂ x 0j

Esto significa que la ley de transformación para ∂i tiene la forma

∂i0 = R−1 ∂.
ji j
(4.39)

Como R es una matriz ortogonal, R−1


ji
= R Tji = R i j , y obtenemos finalmente

∂i0 = R i j ∂ j . (4.40)

68
En la sección 4.4 consideraremos tensores en el espacio-tiempo de Minkowski,
donde las transformaciones relevantes —las transformaciones de Lorentz—
son representadas por medio de matrices que no cumplen esta propiedad de
ortogonalidad.

Ejemplo 4.28 (Gradiente). Si φ es un campo escalar, entonces ∂i φ es un cam-


po vectorial, llamado gradiente de φ. En efecto,

∂i φ 7→ (∂i φ)0 = ∂i0 φ 0 = R i j ∂ j φ. (4.41)

Ejemplo 4.29 (Divergencia). Si Ai es un campo vectorial, entonces ∂i Ai es un


campo escalar, llamado divergencia de Ai . Explícitamente,

∂ A x ∂ A y ∂ Az
∂i Ai = + + . (4.42)
∂x ∂y ∂z

En general, si Ai es un campo vectorial, entonces ∂i A j es un campo tensorial


de orden 2. En efecto,
0 
∂i A j 7→ ∂i A j = ∂i0 A0j = R ik ∂k R jl Al = R ik R jl ∂k Al . (4.43)

La divergencia corresponde a la traza de este tensor. De interés resulta ser


también su parte antisimétrica, como muestra el siguiente ejemplo.

Ejemplo 4.30 (Rotacional). Si Ai es un campo vectorial, entonces εi jk ∂ j Ak es


un campo pseudovectorial, llamado rotacional (o rotor) de Ai . Las componentes
del rotacional pueden calcularse en la forma

ı̂ ̂ k̂
 
εi jk ∂ j Ak = ∇ × A~ = ∂ x ∂ y ∂z . (4.44)
A x A y Az

El rotacional εi jk ∂ j Ak organiza de manera vectorial las tres componentes


independientes de la parte antisimétrica del tensor ∂i A j (ver tabla 4.2):
 
  1 0 ∂ A
x y − ∂ A
y x ∂ A
x z − ∂ A
z x
∂[i A j] =  ∂ y A x − ∂ x A y 0 ∂ y Az − ∂z A y  . (4.45)
2 ∂z A x − ∂ x Az ∂z A y − ∂ y Az 0

69
Ejemplo 4.31 (Laplaciano). El laplaciano es un operador diferencial escalar
definido como
∂2 ∂2 ∂2
∇2 = ∂i ∂i = + + . (4.46)
∂ x 2 ∂ y 2 ∂ z2
Al ser un operador escalar, el laplaciano no cambia el orden de un campo ten-
sorial, pudiendo ser aplicado a campos escalares, vectoriales o tensoriales.

La notación tensorial resulta útil para manipular expresiones complicadas


del cálculo vectorial; en particular, a menudo es la mejor herramienta para
demostrar las múltiples identidades que existen en el cálculo vectorial.

Ejemplo 4.32. Las identidades del cálculo vectorial



∇ · ∇ × A~ = 0, ∇ × ∇φ = 0, (4.47)

pueden demostrarse fácilmente transcribiéndolas a notación tensorial:


  
∇ · ∇ × A~ = εi jk ∂i ∂ j Ak , ∇ × ∇φ = εi jk ∂ j ∂k φ , (4.48)

donde hemos usado el hecho que εi jk = const. La conmutatividad de las deri-


vadas parciales implica que el operador diferencial tensorial ∂i ∂ j es simétrico:
∂ j ∂i = ∂i ∂ j . Como notamos en el ejemplo 4.20, la contracción de un tensor si-
métrico con uno antisimétrico siempre es cero; luego, εi jk ∂i ∂ j = 0 y obtenemos
ambos resultados.

Ejemplo 4.33 (Ecuaciones de Maxwell). Las ecuaciones de Maxwell en nota-


ción tensorial toman la forma
ρ
∂i Ei = , (4.49)
ε0
∂i Bi = 0, (4.50)
∂ Bi
εi jk ∂ j Ek + = 0, (4.51)
∂t
1 ∂ Ei
εi jk ∂ j Bk − ε0 = ji . (4.52)
µ0 ∂t

En el capítulo 7 aprenderemos cómo escribir las ecuaciones de Maxwell de


manera aún más compacta y, más crucialmente, de manera explícitamente co-
variante bajo transformaciones de Lorentz.

70
4.3. Transformaciones generales de coordenadas
Un evento en el espacio-tiempo de Minkowski es descrito por un conjun-
to de cuatro coordenadas, (t, x, y, z). Vamos a usar la notación compacta x µ
para referirnos a una cualquiera de ellas, donde µ es un superíndice (¡no un
exponente!) que toma valores de 0 a 3:

x 0 = t, x 1 = x, x 2 = y, x 3 = z. (4.53)

Equivalentemente, a veces escribimos también x µ = t, x i = (t, ~r ). En ge-
neral, reservamos los índices latinos i, j, k, . . . para el conjunto {1, 2, 3} (solo
la parte espacial) y los índices griegos λ, µ, ν, . . . para el conjunto {0, 1, 2, 3}
(incluyendo el tiempo).
El lenguaje tensorial nos permitirá escribir ecuaciones que conserven su for-
ma (i.e., que sean covariantes) en todos los marcos de referencia relacionados
entre sí a través de transformaciones de Lorentz.
Como las transformaciones de Lorentz son rotaciones que dejan invarian-
te una forma cuadrática que incluye un signo negativo, ds2 = −d t 2 + d x 2 +
d y 2 + dz 2 , las matrices que describen estan transformaciones no son estricta-
mente ortogonales, en el sentido que Λ−1 6= Λ T (ver sección 3.5). En particular,
esto significa que debemos ser más cuidadosos en el desarrollo de un cálculo
tensorial de lo que hemos sido hasta ahora.
Para ilustrar la clase de generalización que necesitamos, vamos a recurrir
al ejemplo del paso de coordenadas polares a coordenadas cartesianas en el
plano. Esta transformación es no lineal y, por lo tanto, no está cubierta dentro
de las rotaciones ortogonales que fueron el tema de la sección 4.2.

Ejemplo 4.34 (Transformación no lineal de coordenadas). En un plano, la


transformación de coordenadas polares (r, θ ) a coordenadas cartesianas (x, y)
se escribe en la forma

x = r cos θ , y = r sin θ . (4.54)

Note que x y y son funciones lineales en r y no lineales en θ . La no linealidad


de la transformación se refleja también en el hecho que no existe una matriz
que nos lleve del “vector” (r, θ ) al “vector” (x, y).
A pesar de esta no linealidad, es posible identificar dos objetos que sí trans-
forman linealmente bajo el cambio de coordenadas (4.54).

71
El primero de ellos es el vector compuesto por los diferenciales, (d r, dθ ) y
(d x, d y). En efecto, tenemos

∂x ∂x ∂y ∂y
dx = dr + dθ , dy = dr + dθ , (4.55)
∂r ∂θ ∂r ∂θ
o bien • ˜ • ˜• ˜
dx ∂ x/∂ r ∂ x/∂ θ dr
= . (4.56)
dy ∂ y/∂ r ∂ y/∂ θ dθ
La matriz que media esta transformación es la matriz jacobiana de la trans-
formación de coordenadas polares a coordenadas cartesianas, (r, θ ) 7→ (x, y).
Calculando las derivadas, hallamos
• ˜ • ˜
∂ x/∂ r ∂ x/∂ θ cos θ −r sin θ
J= = . (4.57)
∂ y/∂ r ∂ y/∂ θ sin θ r cos θ

El segundo objeto que transforma linealmente es el vector compuesto de


las derivadas parciales, (∂ /∂ r, ∂ /∂ θ ) y (∂ /∂ x, ∂ /∂ y). En efecto, usando la
regla de la cadena encontramos

∂ ∂r ∂ ∂θ ∂ ∂ ∂r ∂ ∂θ ∂
= + , = + , (4.58)
∂x ∂ x ∂r ∂ x ∂θ ∂y ∂ y ∂r ∂ y ∂θ

o bien • ˜ • ˜• ˜
∂ /∂ x ∂ r/∂ x ∂ θ /∂ x ∂ /∂ r
= . (4.59)
∂ /∂ y ∂ r/∂ y ∂ θ /∂ y ∂ /∂ θ
La matriz que media esta transformación es la transpuesta de la matriz jaco-
biana de la transformación de coordenadas cartesianas a coordenadas pola-
res, (x, y) 7→ (r, θ ). Esta matriz es la inversa transpuesta de la matriz jacobia-
na (4.57). Calculando las derivadas (o tomando la inversa), hallamos

 • ˜  
−1 T ∂ r/∂ x ∂ θ /∂ x cos θ − 1r sin θ
J = = . (4.60)
∂ r/∂ y ∂ θ /∂ y sin θ 1r cos θ

Resumiendo: si bien la transformación de coordenadas (4.54) es no lineal,


tanto los diferenciales como las derivadas parciales transforman linealmente.
Los diferenciales transforman con la matriz jacobiana J y las derivadas parcia-
T
les transforman con la matriz jacobiana inversa transpuesta J −1 .

72
Como el ejemplo 4.34 muestra, incluso si la transformación de coordenadas
es no lineal, siempre es posible identificar cantidades que transforman lineal-
mente: los diferenciales y las derivadas parciales.
Escribimos una transformación general de coordenadas en la forma x µ 7→

x (x), indicando así que cada una de las nuevas coordenadas (primadas) es,
en principio, una función de todas las coordenadas originales (no primadas).
Bajo una transformación general de coordenadas x µ 7→ x 0µ (x), los diferen-
ciales d x µ transforman de acuerdo a
∂ x 0µ ν
d x µ 7→ d x 0µ = dx , (4.61)
∂ xν
donde ∂ x 0µ /∂ x ν son las componentes de la matriz jacobiana de la transforma-
ción.
Similarmente, bajo x µ 7→ x 0µ (x), las derivadas parciales ∂ /∂ x µ transfor-
man de acuerdo a
∂ ∂ ∂ xν ∂

7 = , (4.62)
∂ xµ ∂ x 0µ ∂ x 0µ ∂ x ν
donde ∂ x ν /∂ x 0µ son las componentes de la matriz jacobiana de la transfor-
mación inversa, que es la inversa de la matriz jacobiana de la transformación
directa. Aunque no es evidente en esta ecuación, la posición de los índices ga-
rantiza que las derivadas parciales transforman con la matriz jacobiana inversa
transpuesta.
A diferencia de lo que ocurren con las rotaciones tridimensionales, donde
T T
J = R y se cumple que R−1 = R, en el caso general tenemos que J −1 6= J.
Esta diferencia nos fuerza a distinguir entre dos clases de vectores, que llama-
mos contravariantes y covariantes∗ .

Definición 4.35 (Campo vectorial contravariante). Decimos que Aµ (x) es un


campo vectorial contravariante si, bajo una transformación general de coorde-
nadas x µ 7→ x 0µ (x), sus componentes cambian de acuerdo a la regla
 ∂ x 0µ ν
A0µ x 0 = A (x) . (4.63)
∂ xν
Definición 4.36 (Campo vectorial covariante). Decimos que Aµ (x) es un cam-
po vectorial covariante si, bajo una transformación general de coordenadas

Usamos la palabra “covariante” con dos significados distintos: el que acabamos de utilizar,
opuesto a “contravariante”, y el que introdujimos en el capítulo 1, que puede resumirse en la
idea de “invariancia de forma” de una ecuación, y que es el más importante de los dos.

73
x µ 7→ x 0µ (x), sus componentes cambian de acuerdo a la regla
0 0
 ∂ xν
Aµ x = Aν (x) . (4.64)
∂ x 0µ
En palabras: los vectores contravariantes (denotados con un superíndice)
transforman con la matriz jacobiana directa, mientras que los vectores cova-
riantes (denotados con un subíndice) transforman con la matriz jacobiana in-
versa transpuesta.
Solo en el caso de rotaciones representadas a través de matrices ortogo-
nales tenemos que estos dos tipos de vectores coinciden y la diferencia entre
superíndices y subíndices puede ser ignorada.
Definición 4.37 (Campo escalar). Decimos que φ (x) es un campo escalar si,
bajo una transformación general de coordenadas x µ 7→ x 0µ (x), cambia de
acuerdo a la regla 
φ 0 x 0 = φ (x) . (4.65)
Previsiblemente, un campo escalar es aquel que permanece invariante bajo
transformaciones generales de coordenadas.
Definición 4.38 (Campo tensorial). Decimos que T µ1 ···µmν1 ···νn (x) es un campo
tensorial de tipo (o valencia) (m, n) si, bajo una transformación general de
coordenadas x µ 7→ x 0µ (x), sus componentes cambian de acuerdo a la regla
 ∂ x 0µ1 ∂ x 0µm ∂ x σ1 ∂ x σn ρ1 ···ρm
T 0µ1 ···µmν1 ···νn x 0 = · · · · · · T σ1 ···σn
(x) . (4.66)
∂ x ρ1 ∂ x ρm ∂ x 0ν1 ∂ x 0νn
El orden (también llamado grado o rango) del tensor es m + n.
Ejemplo 4.39 (Delta de Kronecker). El delta de Kronecker es un tensor de tipo
(1, 1), definido (en todos los sistemas de coordenadas) como
¨
1 si µ = ν,
δνµ = (4.67)
0 si µ 6= ν.
Para comprobar la valencia (1, 1) del delta de Kronecker, notamos que
∂ xµ ∂ x 0µ
δνµ == = δν0µ . (4.68)
∂x ν ∂x 0ν

Esto significa que, usando la regla de la cadena, podemos escribir


∂ x 0µ ∂ x 0µ ∂ x ρ ∂ x 0µ ∂ x σ ρ
δν0µ = = = δ , (4.69)
∂ x 0ν ∂ x ρ ∂ x 0ν ∂ x ρ ∂ x 0ν σ
que corresponde a la ley de transformación general (4.66) cuando m = n = 1.

74
Ejemplo 4.40 (Producto punto). Si Aµ es un vector contravariante y Bµ es un
vector covariante, entonces el producto Aµ Bµ es un escalar. Comprobación:

∂ x 0µ ∂ x σ ρ ∂ xσ ρ
A0µ Bµ0 = A Bσ = A Bσ = δρσ Aρ Bσ = Aσ Bσ . (4.70)
∂ x ρ ∂ x 0µ ∂ xρ

Operaciones con tensores.

El producto de un escalar con un tensor produce un tensor del mismo


tipo que el tensor original.

Dos tensores del mismo tipo pueden sumarse y producir un nuevo tensor,
que tiene el mismo tipo que los tensores originales.

Estas dos operaciones permiten identificar el espacio de los tensores de tipo


(m, n) con un espacio vectorial de dimensión d m+n , donde d es el rango de los
índices (e.g., d = 3 para el espacio euclidiano tridimensional y d = 4 para el
espacio-tiempo de Minkowski).

El producto de dos tensores es un tensor. Si los tensores originales son


de tipo (m, n) y (p, q), respectivamente, entonces el tensor producto es
de tipo (m + p, n + q).

La contracción de un índice contravariante (superíndice) con un índice


covariante (subíndice) en un tensor de tipo (m, n) produce un tensor de
tipo (m − 1, n − 1).

La contracción de índices debe realizarse siempre entre índices de tipos distin-


tos, uno covariante y uno contravariante (i.e., un subíndice con un superíndi-
ce). Esta es la única manera de garantizar que el resultado de la contracción
sea tensorial. Repita conmigo el mantra 4.41.

Mantra 4.41. Solo contraerás índices de tipos distintos.

Ejemplo 4.42 (Contracción de índices). En relatividad general, la curvatura


del espacio-tiempo se cuantifica por medio de un tensor de tipo (1, 3), llamado
tensor de Riemann y denotado por Rρ σµν . A partir del tensor de Riemann se
construye el tensor de Ricci, de tipo (0, 2), mediante la contracción de dos ín-
dices: Rµν = Rσ µσν . (El uso de la misma letra para ambos tensores es un abuso
de notación ampliamente tolerado).

75
Cálculo tensorial. Como vimos al comienzo de esta sección [cf. ec. (4.62)],
el operador de derivada parcial,

∂µ = , (4.71)
∂ xµ
transforma como un vector covariante y es denotado consecuentemente con
un subíndice. Esto significa, por ejemplo, que el gradiente de un campo escalar
φ resulta ser un vector covariante, ∂µ φ. Sin embargo, la situación se complica
cuando se toman derivadas de tensores de orden superior.
Sea Aµ un campo vectorial covariante. A pesar de las apariencias, ∂µ Aν no es
un campo tensorial de tipo (0, 2). Para entender el motivo, analicemos su ley
de transformación bajo x µ 7→ x 0µ (x). Usando la ley de transformación para
un vector covariante y la regla de Leibniz para la derivada de un producto,
obtenemos
 ‹
0 0 ∂ ∂ xσ ∂ 2xσ ∂ x σ ∂ Aσ
∂µ Aν = Aσ = Aσ + . (4.72)
∂ x 0µ ∂ x 0ν ∂ x 0µ ∂ x 0ν ∂ x 0ν ∂ x 0µ
Utilizamos ahora la regla de la cadena para reescribir el segundo término del
lado derecho en la forma
∂ 2xσ ∂ xρ ∂ xσ
∂µ0 A0ν = Aσ + ∂ρ Aσ (4.73)
∂ x 0µ ∂ x 0ν ∂ x 0µ ∂ x 0ν
¡Esta no es la ley de transformación de un tensor! Existen varias posibilidades
para lidiar con este problema:

1. Restringir las transformaciones de coordenadas a transformaciones linea-


les. En este caso, el término inhomogéneo al lado derecho de la ec. (4.73)
se anula, y recuperamos la ley de transformación tensorial.

2. Tomar la parte antisimétrica de ∂µ Aν . Es posible demostrar que ∂µ Aν −


∂ν Aµ transforma como un tensor de tipo (0, 2) incluso bajo transforma-
ciones no lineales.

3. Definir una “derivada covariante” ∇µ y exigir que ∇µ Aν transforme ten-


sorialmente.

En este curso, escogeremos la opción 1, es decir, restringiremos nuestra aten-


ción a transformaciones lineales de coordenadas. Esta es la opción más sencilla,
aunque, si bien es suficiente para nuestros propósitos, nos limita a trabajar con

76
coordenadas cartesianas. La opción 2 es especialmente interesante, y puede
ser generalizada para tensores de orden superior. Esta es la base para la teo-
ría de las formas diferenciales, introducida por Élie Cartan en 1899 (para una
introducción moderna, consulte la Ref. [17]). La opción 3 es la utilizada en
relatividad general, donde es físicamente inadmisible restringirse a transfor-
maciones lineales.

4.4. Tensores en el espacio-tiempo de Minkowski


En relatividad especial, las transformaciones de coordenadas que nos in-
teresan son aquellas transformaciones lineales que dejan invariante el interva-
lo espacio-temporal, ds2 = −d t 2 + d x 2 + d y 2 + dz 2 . Escribiendo

x 0µ = Λµν x ν , (4.74)
” —
encontramos que las matrices Λ = Λµν deben pertenecer al grupo de Lorentz,
como se detalló en el capítulo 3. Note que, por consistencia notacional, las
componentes de las matrices Λ se escriben con un superíndice (el primero, µ,
que corresponde a la fila) y un subíndice (el segundo, ν, que corresponde a la
columna), Λµν . A pesar de que las transformaciones de Lorentz son lineales, la
presencia de un signo negativo en ds2 implica que las matrices Λ no son orto-
gonales en el sentido estricto de la palabra, i.e., Λ−1 6= Λ T . (La inversa difiere
en este caso de la transpuesta por algunos signos en la primera fila y la prime-
ra columna). Esto significa que debemos distinguir entre índices covariantes
y contravariantes cuando usemos el cálculo tensorial en el espacio-tiempo de
Minkowski.
Derivando la ec. (4.74), encontramos que las componentes de la matriz
jacobiana de la transformación son

∂ x 0µ
= Λ µν . (4.75)
∂ xν
Las componentes de la matriz jacobiana inversa son, por supuesto,
∂ xµ 
−1 µ
= Λ . (4.76)
∂ x 0ν ν

Definición 4.43 (Vectores de Lorentz). Decimos que Aµ (x) es un vector contra-


variante de Lorentz y que Bµ (x) es un vector covariante de Lorentz si, bajo una

77
transformación de Lorentz x 0µ = Λµν x ν , sus componentes cambian de acuerdo
a la regla

A0µ x 0 = Λµν Aν (x) , (4.77)
  ν
Bµ0 x 0 = Λ−1 µ Bν (x) . (4.78)
Para distinguirlos de los vectores en tres dimensiones, los vectores de Lorentz
son llamados a veces 4-vectores (“cuadrivectores”).
La definición de un tensor de Lorentz de tipo (m, n) sigue la lógica usual
(cf. def. 4.38), con m matrices Λ y n matrices Λ−1 en su ley de transformación.
Definición 4.44 (Métrica de Minkowski). La métrica de Minkowski ηµν es un
tensor de Lorentz de tipo (0, 2), cuyas componentes (en todos los marcos re-
lacionados entre sí mediante transformaciones de Lorentz) están dadas por
η00 = −1, η0 j = 0, ηi0 = 0, ηi j = δi j . Escribiéndola como una matriz de 4 × 4,
hallamos  
−1 0 0 0
   0 1 0 0 
ηµν =  . (4.79)
0 0 1 0 
0 0 0 1
En términos de la métrica de Minkowski, el intervalo espacio-temporal pue-
de escribirse en la forma compacta
ds2 = ηµν d x µ d x ν = −d t 2 + d x 2 + d y 2 + dz 2 . (4.80)
A partir de la ec. (4.80), y usando el hecho que ηµν tiene el mismo valor en
todos los marcos (i.e., η0µν = ηµν ), podemos escribir la condición de que Λ
sea una transformación de Lorentz en términos de la métrica de Minkowski.
Exigiendo que ds2 permanezca invariante bajo la transformación x µ 7→ x 0µ =
Λµν x ν , encontramos

ds02 = ηρσ d x 0ρ d x 0σ = ηρσ Λρµ Λσν d x µ d x ν = ηµν d x µ d x ν = ds2 , (4.81)


de donde obtenemos la condición
Λρµ Λσν ηρσ = ηµν . (4.82)
El grupo de Lorentz puede definirse entonces como el conjunto de todas las
matrices Λ cuyas componentes satisfacen la ec. (4.82). Esta ecuación es la ver-
sión minkowskiana de la condición de ortogonalidad R T R = 1 para las matrices
de rotación en tres dimensiones, que puede escribirse en la forma equivalente
R ik R jl δkl = δi j .

78
Definición 4.45 (Métrica de Minkowski inversa). Denotamos por ηµν las com-
ponentes de la métrica de Minkowski inversa. Por definición, estas componen-
 −1  
tes satisfacen ηµσ ησν = δνµ . Matricialmente, [ηµν ] = ηµν = ηµν . Note,
sin embargo, que ηµν define un tensor de Lorentz de tipo (2, 0), como sugiere
la notación.

Subiendo y bajando índices. La métrica de Minkowski nos provee de un


mapeo entre vectores de Lorentz covariantes y contravariantes.
Sea Aµ un 4-vector contravariante de Lorentz. Entonces, las cantidades

Aµ = ηµν Aν (4.83)

definen un 4-vector covariante de Lorentz.


Sea Aµ un 4-vector covariante de Lorentz. Entonces, las cantidades

Aµ = ηµν Aν (4.84)

definen un 4-vector contravariante de Lorentz.


Estas operaciones funcionan también para tensores de orden mayor. Deci-
mos que ηµν nos permite “bajar el índice” de un tensor, de la misma manera
que ηµν nos permite “subir el índice”.

Ejemplo 4.46. Sean Aµ = A0 , Ai las componentes contravariantes de un 4-
vector. Sus componentes covariantes, obtenidas por medio de la ec. (4.83),
son

A0 = −A0 , Ai = Ai . (4.85)

Ejemplo 4.47. Sean Aµ = (A0 , Ai ) las componentes covariantes de un 4-vector.


Sus componentes contravariantes, obtenidas por medio de la ec. (4.84), son

A0 = −A0 , Ai = Ai . (4.86)

La regla general es la siguiente: subir o bajar un índice temporal produce un


cambio de signo, mientras que los índices espaciales pueden subirse o bajarse
con abandono. Como muestran de manera explícita las ecs. (4.85)–(4.86), y
como exige la consistencia matemática, las operaciones de subir y bajar índices
son inversas la una de la otra.
La relación que existe entre Aµ y Aµ es análoga a la que existe en Mecánica
Cuántica entre el ket |ψ〉 y el bra 〈ψ|. Ambas son representaciones matemáticas
duales de un único objeto físico.

79
Condición Tipo
2
A <0 Tiempo
A2 = 0 Nulo o Luz
A2 > 0 Espacio

Tabla 4.3: Tipos de 4-vectores.

Definición 4.48 (Magnitud de un 4-vector). La magnitud al cuadrado de un


4-vector (ya sea contravariante, Aµ , o covariante, Aµ ) es definida como

A2 = Aµ Aµ . (4.87)

Equivalentemente, podemos escribir


2
A2 = ηµν Aµ Aν = − A0 + Ai Ai , (4.88)
2 2
A = η Aµ Aν = − (A0 ) + Ai Ai .
µν
(4.89)

Note que, sin importar lo que pueda sugerir la notación, A2 puede ser positivo,
negativo o cero, incluso para un 4-vector no nulo.

Definición 4.49 (Tipos de 4-vectores). Decimos que un 4-vector no nulo es


tipo tiempo, tipo luz (o nulo) o tipo espacio, según su magnitud al cuadrado
sea negativa, cero, o positiva. La tabla 4.3 resume la situación.

Ejemplo 4.50. Los 4-vectores constantes Aµ = (5, 4, 0, 0), B µ = (4, 5, 0, 0),


C µ = (1, 1, 0, 0), son, respectivamente, tipo tiempo, tipo espacio y nulo o tipo
luz, ya que Aµ Aµ = −9, Bµ B µ = 9 y Cµ C µ = 0.

Ejemplo 4.51. El intervalo espacio-temporal entre dos eventos infinitesimal-


mente próximos, ds2 = ηµν d x µ d x ν , puede entenderse como la magnitud al
cuadrado del 4-vector d x µ . La clasificación de separaciones entre eventos co-
mo tipo tiempo, tipo espacio y nula o tipo luz que dimos en la sección 2.4 (ver
definiciones 2.4, 2.5 y 2.6) se corresponde exactamente con la clasificación de
tipos de 4-vectores que hemos introducido en la definición 4.49.

Matrices y tensores de orden 2. Hay cuatro configuraciones posibles para


los índices de un tensor de orden 2; Aµν , B µν , Cµ ν y Dµν , y todos ellas pueden

80
representarse como matrices. La convención que usamos es la siguiente: el pri-
mer índice del tensor (µ, en todos estos casos) corresponde siempre a la fila,
sin importar si es un superíndice o un subíndice. Similarmente, el segundo ín-
dice del tensor (ν, en todos estos casos) corresponde siempre a la columna, sin
importar si es un superíndice o un subíndice. Cuando representamos un tensor
de orden 2 como una matriz, a menudo distinguimos entre índices temporal y
espaciales. Por ejemplo, escribimos
 0 
” — M 0 M 0j
M ν =
µ
. (4.90)
M i0 M ij
µν
La matriz transpuesta corresponde a intercambiar filas con columnas: AT =
 ν µ
Aνµ , B T µ = B νµ , C T ν = Cν µ y Dµν
T
= Dνµ . Por ejemplo,
 
 0  j – j
™
”  ν— M T
M T
M 00 M 0
M T
= 00 0j  = j . (4.91)
µ
MT MT M 0i M i
i i

Para representar matricialmente un producto como Aµ σ B σν es necesario ser ex-


tremadamente cuidadoso con los índices, como muestra la siguiente ecuación:
 0  0 0 
” — A A0
B B
0 k 0 j
Aµ σ B σν = i i k k . (4.92)
A0 Ak B0 B j

Ejemplo 4.52. Llamando


  ” — ”  ν—
η = ηµν , Λ = Λµν , ΛT = ΛT µ
, (4.93)

es posible escribir la condición [cf. ec. (4.82)] Λρµ Λσν ηρσ = ηµν en la forma
matricial Λ T ηΛ = η (compare con R T 1R = 1 para rotaciones ortogonales).

Ejemplo 4.53 (Rotación espacial). Las componentes matriciales de la trans-


formación de Lorentz correspondiente a una rotación espacial son

Λ00 = 1, Λ0 j = 0, (4.94)
i i
Λ 0 = 0, Λ j = Ri j , (4.95)

donde R i j son las componentes de la matriz de rotación tridimensional, que


satisfacen R ik R jk = δi j .

81
Ejemplo 4.54 (Boost en una dirección arbitraria). Las componentes matricia-
les de la transformación de Lorentz correspondiente a un boost con velocidad
V~ = V n̂ son [cf. ec. (3.71)]

Λ00 = γ, Λ0 j = −γVj , (4.96)


i i
Λ 0 = −γVi , Λ j = δi j + (γ − 1) ni n j , (4.97)
−1/2
donde γ = 1 − V 2 es el factor de Lorentz. En términos de los proyectores
paralelo y perpendicular a n̂ (ver ejemplo 4.16), las componentes espaciales
de Λ pueden escribirse en la forma
k
Λi j = Pi⊥j + γPi j . (4.98)

Esta ecuación muestra directamente que no existe contracción de la longitud


en la dirección perpendicular al boost.

Definición 4.55 (D’Alembertiano). El operador de D’Alembert, también lla-


mado D’Alembertiano u operador de onda, es un operador diferencial escalar
definido como
∂2
ƒ = −∂ µ ∂µ = −ηµν ∂µ ∂ν = − ∇2 . (4.99)
∂ t2
Al ser un operador escalar, el D’Alembertiano no cambia el orden de un campo
tensorial, pudiendo ser aplicado a campos escalares, vectoriales o tensoriales.

Estando definido como una contracción tensorial de derivadas parciales, el


D’Alembertiano es automáticamente invariante bajo transformaciones de Lo-
rentz. En particular, esto significa que la ecuación de onda para ondas que se
propagan con la velocidad de la luz,

∂ 2φ
ƒφ = − ∇2 φ = 0, (4.100)
∂ t2
tiene la misma forma en todos los marcos de referencia inerciales relacionados
entre sí a través de transformaciones de Lorentz (asumiendo que φ es una
cantidad tensorial). Dicho de otra manera, las ondas que se propagan a la
velocidad de la luz en un marco se propagan a la velocidad de la luz en todos
los marcos.

Ejemplo 4.56 (Gravitación newtoniana). La fuerza de Coulomb F E entre dos


cargas puntuales q1 y q2 y la fuerza de gravedad newtoniana FG entre dos

82
masas puntuales m1 y m2 separadas una distancia r tienen exactamente la
misma forma matemática:
1 q1 q2 m1 m2
FE = , FG = G , (4.101)
4πε0 r 2 r2

donde G = 6,674 × 10−11 N m2 /kg2 es la constante de Newton. La única dife-


rencia importante entre ambas fuerzas es que las cargas pueden ser positivas o
negativas, generando fuerzas eléctricas de atracción o repulsión, mientras que
las masas son siempre positivas, con una fuerza gravitacional que es siempre
de atracción. En electrodinámica, interpretamos la fuerza eléctrica como la ac-
ción de un campo eléctrico E~ sobre una carga de prueba q, con F~E = q E~. En
la teoría newtoniana de la gravitación, podemos también interpretar la fuer-
za gravitacional como la acción de un campo gravitacional g~ sobre una masa
de prueba m, con F~G = m~ g . Al igual como derivamos la fuerza de Coulomb a
partir de la ley de Gauss, podemos escribir una “ley de Gauss gravitacional” a
partir de la cual derivamos la ley de gravitación universal de Newton,

∇ · g~ = −4πGρ, (4.102)

donde ρ es la densidad de masa y el signo negativo del lado derecho corres-


ponde a la naturaleza siempre atractiva de la interacción gravitacional. Como
la fuerza gravitacional es conservativa, podemos definir un potencial gravita-
cional φ, análogo al potencial electrostático, tal que g~ = −∇φ. La ley de Gauss
gravitacional (4.102) resulta entonces ser equivalente a la ecuación de Poisson,

∇2 φ = 4πGρ. (4.103)

Al no incluir derivadas temporales, la ecuación de Poisson (4.103) no es cova-


riante bajo transformaciones de Lorentz, y es por lo tanto incompatible con la
teoría especial de la relatividad. En términos más físicos, la ecuación de Pois-
son predice la propagación instantánea de los efectos gravitacionales, contra-
diciendo el resultado relativista que nada puede viajar más rápido que la luz.
Los esfuerzos de Einstein por incorporar la gravedad en un contexto relativista
culminaron en 1915 con la formulación de la Teoría General de la Relatividad.
El capítulo 7 de la Ref. [18] tiene una discusión interesante sobre los intentos
fallidos por incorporar la gravitación en relatividad especial.

83
Capítulo 5

Cinemática relativista

En este capítulo establecemos las bases de la descripción matemática del


movimiento en la teoría especial de la relatividad.

5.1. Líneas de mundo


Como se sugiere en la figura 5.1, cualquier partícula, sin importar su estado
de movimiento (o si está en reposo) describe una trayectoria en el espacio-
tiempo.

Definición 5.1 (Línea de mundo). La línea de mundo (“worldline”) de una par-


tícula es la trayectoria seguida por la partícula en el espacio-tiempo. Usamos
el tiempo propio del observador montado en esta línea de mundo como pará-
metro para describir matemáticamente esta trayectoria a través de las cuatro
funciones 
 t = t (τ)

 x = x (τ)
x µ = x µ (τ) ⇔ (5.1)

 y = y (τ)

z = z (τ)

El intervalo espacio-temporal entre dos eventos infinitesimalmente cerca-


nos sobre la línea de mundo, con coordenadas x µ (τ) y x µ (τ + dτ) = x µ (τ) +
d x µ , respectivamente, está dado por

ds2 = −d t 2 + d x 2 + d y 2 + dz 2 = ηµν d x µ d x ν = −dτ2 . (5.2)

84
t

(a) (b) (c)


Figura 5.1: Líneas de mundo de (a) una partícula en reposo, (b) una partícula
con velocidad constante, y (c) una partícula con velocidad variable.

En particular, esta ecuación muestra explícitamente que el intervalo de tiem-


po propio dτ medido por el observador montado sobre la línea de mundo es
invariante bajo transformaciones de Lorentz.

5.2. 4-velocidad
Definición 5.2 (4-velocidad). Sea x µ (τ) una parametrización de la línea de
mundo de una partícula, con τ su tiempo propio. La 4-velocidad de la partícula
está definida por
d xµ
u =
µ
. (5.3)

Dado que d x µ es un 4-vector y dτ es un escalar de Lorentz, la 4-velocidad así
definida resulta ser un 4-vector. De manera análoga al caso tridimensional, este
4-vector es siempre tangente a la línea de mundo. Con nuestra convención de
medir tiempos y distancias en la misma unidad, la 4-velocidad es adimensional
(al igual que todas las velocidades).

Explícitamente, las componentes de la 4-velocidad son


 ‹
d t d x d y dz
u =
µ
, , , . (5.4)
dτ dτ dτ dτ

85
Para establecer una conexión con la velocidad ordinaria, vi = d x i /d t, es-
cribimos la ec. (5.2) en la forma
 ‹2  ‹  ‹2  ‹2
dx dy 2 dz dτ
−1+ + + =− (5.5)
dt dt dt dt
Despejando d t/dτ, hallamos
dt
= γ, (5.6)

donde γ es el factor de Lorentz calculado a partir de la velocidad ordinaria
de la partícula, vi = d x i /d t. Esta ecuación expresa la dilatación del tiempo,
mostrando que el intervalo de tiempo coordenado d t es mayor en un factor γ
que el intervalo de tiempo propio dτ.
Como d t/dτ = γ ≥ 1 > 0, la función t (τ) es siempre creciente, y por lo
tanto es invertible. Vamos a utilizar la ec. (5.6) y la regla de la cadena para
reescribir las derivadas respecto de τ como derivadas totales respecto de t de
acuerdo a la regla
d d
=γ . (5.7)
dτ dt
Aplicando la ec. (5.7) a las componentes de la 4-velocidad, hallamos
 ‹ 
dt d x d y dz
u =
µ
1, , , = γ 1, vx , v y , vz . (5.8)
dτ dt dt dt
A menudo escribiremos, de manera más compacta,

uµ = γ (1, vi ) = γ (1, ~
v) , (5.9)

o, equivalentemente,

u0 = γ, ui = γvi . (5.10)

A partir de la ec. (5.2) podemos establecer también que la magnitud al


cuadrado de la 4-velocidad es siempre igual a −1:
d xµ d xν
uµ uµ = ηµν = −1. (5.11)
dτ dτ
Esto quiere decir que la 4-velocidad es un 4-vector tipo tiempo. La ec. (5.11)
también puede interpretarse como un constraint∗ entre las cuatro componentes

Un constraint es una ligadura, i.e., una relación funcional entre variables que las hace
dependientes entre sí.

86
de la 4-velocidad. En particular, esto significa que la 4-velocidad solo tiene
tres componentes independientes, las cuales pueden identificarse con las tres
componentes de la velocidad ordinaria.
La 4-velocidad tiene implícita cierta redundancia, porque usa 4 números
para describir un objeto con solo 3 grados de libertad. Este es el precio que
pagamos por la covariancia de Lorentz. En relatividad especial y general, así
como también en la teoría relativista de campos, a menudo encontramos que
vale la pena usar una representación redundante si con eso ganamos covarian-
cia, como en este caso.
Definición 5.3 (Marco comóvil instantáneo). Consideremos una partícula P
cuyo movimiento es registrado desde un marco de referencia inercial K. En
cierto instante t, la velocidad de P medida en K es ~
v . El marco de referencia
0
inercial K que se mueve respecto de K con velocidad V~ = ~ v es llamado marco
comóvil instantáneo (MCI) de P en el instante t.
Es importante notar que el MCI K 0 se mueve con velocidad constante res-
pecto de K, por lo que, en general, será comóvil con la partícula P solo en el
instante t en que sus velocidades coinciden.
Sea K 0 el MCI de una partícula. En este marco, las componentes de su 4-
v 0 = 0, γ0 = 1]
velocidad son [cf. ec. (5.9), con ~

u0µ = (1, 0, 0, 0) . (5.12)

En particular, resulta trivial establecer que, en el marco K 0 , la magnitud al


cuadrado de la 4-velocidad es

u0µ u0µ = −1. (5.13)

Como esta es una ecuación tensorial, tiene la misma forma en todos los marcos.
De aquí concluimos que uµ uµ = −1 también en K.

5.3. 4-aceleración
Definición 5.4 (4-aceleración). La 4-aceleración de una partícula es
duµ
αµ = . (5.14)

Dado que uµ es un 4-vector y dτ es un escalar de Lorentz, la 4-aceleración así
definida resulta ser un 4-vector. Con nuestra convención de medir tiempos y

87
distancias en la misma unidad, por ejemplo, en segundos, la 4-aceleración se
mide en s−1 .

Ejemplo 5.5 (Conversión de unidades para la aceleración). La aceleración de


caída libre cerca de la superficie de la Tierra, g = 9,81 m/s2 , es igual a

9,81 m/s2 3600 s 24 h 365 días


g= × × × = 1,03 años−1 . (5.15)
299 792 458 m/s 1h 1 día 1 año
Note cómo usamos el factor de conversión c = 299 792 458 m/s = 1 para pasar
de unidades convencionales (m/s2 ) a unidades de tiempo−1 .

Para determinar de manera explícita las componentes de la 4-aceleración,


reemplazamos en la definición (5.14) las componentes de la 4-velocidad, uµ =
γ (1, vi ), y usamos la ec. (5.7) para cambiar las derivadas respecto de τ por
derivadas respecto de t:
 ‹
d dγ dγ
µ
α = γ (γ, γvi ) = γ , vi + γai , (5.16)
dt dt dt
donde ai = d vi /d t son las componentes de la aceleración ordinaria. Calcula-
mos ahora dγ/d t, teniendo presente que v 2 = vi vi :
dγ d −1/2 1 −3/2 d −3/2
= 1 − v2 = − 1 − v2 (−vi vi ) = 1 − v 2 vi ai . (5.17)
dt dt 2 dt
Este resultado puede escribirse en la forma más compacta

= γ3 vi ai = γ3 ~
v · a~. (5.18)
dt
Reemplazando la ec. (5.18) en las componentes de la 4-aceleración, encontra-
mos
  
αµ = γ4 v j a j , γ4 v j a j vi + γ2 ai = γ4 ~
v · a~, γ4 (~ v + γ2 a~ ,
v · a~) ~ (5.19)

o, equivalentemente,

α0 = γ4 v j a j , αi = γ4 v j a j vi + γ2 ai . (5.20)

Note que las componentes espaciales de la 4-aceleración son una combinación


lineal de la velocidad y aceleración ordinarias, por lo que su dirección no coin-
cide, en general, con la de ninguna de ellas.

88
Sea K 0 el marco comóvil instantáneo de una partícula. De acuerdo a la
ec. (5.12), y consistentemente con la definición 5.3, tenemos que su velocidad
ordinaria en K 0 se anula. Sin embargo, como K 0 se mueve con velocidad cons-
tante respecto de K, en general no es cierto que la aceleración ordinaria de la
partícula deba ser cero en K 0 . Reemplazando vi0 = 0, γ0 = 1 y manteniendo
ai0 6= 0 en la ec. (5.19), hallamos

α0µ = 0, ai0 . (5.21)

La aceleración ai0 es llamada aceleración propia de la partícula.

Definición 5.6 (Aceleración propia). Llamamos aceleración propia de una par-


tícula a la aceleración medida en su marco comóvil instantáneo.

Sea a~0 la aceleración propia de una partícula. En el MCI, la magnitud al


cuadrado de la 4-aceleración es α02 = α0µ α0µ = a~0 · a~0 = a02 . Como α0µ α0µ es
invariante de Lorentz, hemos encontrado que la magnitud de la aceleración
propia puede calcularse a través de la magnitud de la 4-aceleración en cual-
quier marco,
a02 = αµ αµ . (5.22)
Excluyendo el caso αµ = 0, la magnitud al cuadrado de la 4-aceleración es
siempre positiva, por lo que αµ resulta ser un 4-vector tipo espacio.
Para determinar la magnitud de la aceleración propia en términos de la
velocidad y la aceleración ordinarias en un marco de referencia arbitrario, cal-
culamos explícitamente la magnitud al cuadrado de αµ [cf. ec. (5.19)]:

a02 = α0 α0 + αi αi
   
= − γ4 vi ai γ4 v j a j + γ4 v j a j vi + γ2 ai γ4 vk ak vi + γ2 ai
= −γ8 vi ai v j a j + v 2 γ8 vi ai v j a j + 2γ6 vi ai v j a j + γ4 a2
  
= γ6 2 − 1 − v 2 γ2 (~ v · a~)2 + γ4 a2 .

Notando que 1 − v 2 γ2 = 1, podemos escribir
 
v · a~)2 .
a02 = γ4 a2 + γ2 (~ (5.23)

Por improbable que parezca, esta expresión es invariante de Lorentz, i.e., tiene
el mismo valor en todos los marcos de referencia inerciales.

89
En el marco comóvil instantáneo, la 4-velocidad y la 4-aceleración adoptan
las formas simplificadas

u0µ = (1, 0) , α0µ = (0, a~0 ) , (5.24)

donde a~0 es la aceleración propia de la partícula. En este marco, resulta trivial


establecer que el producto punto entre ambos 4-vectores es cero, α0µ u0µ = 0.
Sin embargo, como esta es una ecuación tensorial, su validez se extiende a
todos los marcos de referencia inerciales:

αµ uµ = 0. (5.25)

Luego, la 4-velocidad y la 4-aceleración de una partícula son siempre perpen-


diculares entre sí, y esta afirmación es válida en todos los marcos.
La ecuación αµ uµ = 0 puede interpretarse como un constraint entre las
componentes de la 4-velocidad y la 4-aceleración, de manera similar a como
uµ uµ = −1 representa una ligadura entre las componentes de la 4-velocidad.
En particular, esto significa que la 4-aceleración tiene solo tres componentes
independientes, las cuales pueden identificarse con las tres componentes inde-
pendientes de la aceleración ordinaria. Una vez más, redundancia a cambio de
covariancia.
Ejemplo 5.7 (Interpretación gráfica de αµ uµ = 0). La naturaleza hiperbólica
del espacio-tiempo de Minkowski hace que la noción de perpendicularidad en-
tre dos 4-vectores difiera de la idea de perpendicularidad entre dos vectores en
el espacio euclidiano tridimensional. Por ejemplo, para una partícula movién-
dose a lo largo del eje x en un marco K dado, la condición αµ uµ = 0 implica
α0 /α1 = u1 /u0 . Esto significa que, al dibujar los 4-vectores sobre un plano eu-
clidiano, el ángulo entre uµ y el eje t es igual al ángulo entre αµ y el eje x, como
se ilustra en la parte izquierda de la figura 5.2. Equivalentemente, observamos
que ambos 4-vectores hacen ángulos iguales con el borde del cono de luz, con
la 4-velocidad (tipo tiempo) dentro del cono y la 4-aceleración (tipo espacio)
fuera del cono.
Sea K 0 el marco comóvil instantáneo de esta partícula. Con u0µ = (1, 0) y

α = (0, a~0 ), estos dos 4-vectores son también ortogonales en el sentido eu-
clidiano. Interpretando el boost K 7→ K 0 de manera activa (ver sección 3.2),
podemos visualizar la 4-velocidad y la 4-aceleración como se muestra en la
parte central de la figura 5.2. En esta interpretación, los ejes t y x permanecen
fijos y los 4-vectores cambian. En la interpretación pasiva del boost, mantene-
mos fija la 4-velocidad y cambiamos la 4-aceleración y los ejes, produciendo

90
uµ u0µ u0µ

αµ

α0µ
α0µ

Figura 5.2: Izquierda: 4-velocidad y 4-aceleración de una partícula en un marco


K. Centro: Marco comóvil instantáneo, punto de vista activo. Derecha: Marco
comóvil instantáneo, punto de vista pasivo.

una rotación del cono de luz. La situación resultante se muestra en la parte


derecha de la figura 5.2. En K 0 , la 4-velocidad siempre apunta hacia el centro
del cono de luz y la 4-aceleración siempre se dirige perpendicularmente hacia
afuera.

Ejemplo 5.8 (Movimiento rectilíneo). Un movimiento es rectilíneo cuando la


velocidad y la aceleración ordinarias son paralelas o antiparalelas, de mane-
v · a~ = ±va (el signo es positivo si apuntan en la misma dirección, y
ra que ~
negativo si apuntan en direcciones opuestas). Reemplazando en la ec. (5.23),
hallamos 
a02 = γ4 a2 + γ2 v 2 a2 = γ6 a2 , (5.26)
de donde obtenemos
a0 = γ3 a. (5.27)
Luego, en un movimiento rectilíneo, la magnitud de la aceleración propia es
γ3 veces la magnitud de la aceleración ordinaria.

Ejemplo 5.9 (Movimiento circular uniforme). En un movimiento circular uni-


v ·~
forme, la aceleración es puramente centrípeta, de manera que tenemos ~ a = 0.
2 4 2
Reemplazando en la ec. (5.23), hallamos a0 = γ a , de donde obtenemos

a0 = γ2 a. (5.28)

Luego, en un movimiento circular uniforme, la magnitud de la aceleración pro-


pia es γ2 veces la magnitud de la aceleración ordinaria.

91
5.4. Movimiento hiperbólico
Uno de los movimientos más sencillos es aquel con ocurre en línea recta con
aceleración propia constante. Es importante aclarar que es solo la aceleración
propia, i.e., aquella medida en el marco comóvil instantáneo, la que se man-
tiene constante. La afirmación sin condiciones “movimiento con aceleración
constante” es ambigua en Relatividad, pues de inmediato surge la pregunta:
¿constante en qué marco? La elección del MCI nos permite darle un sentido
invariante a la respuesta, pues en todos los marcos tendremos a02 = const.
A diferencia de lo que ocurre en la física no relativista, donde una partícula
con aceleración constante realiza un movimiento parabólico, en nuestro caso
el movimiento resulta ser hiperbólico, como detallamos a continuación.
Para simplificar, escogemos el marco K donde vamos a describir el movi-
miento de manera que el eje x coincida con la dirección en que viaja la partí-
cula. Esto significa que la 4-velocidad toma la forma [cf. ec. (5.9)]

uµ = (γ, γv, 0, 0) , (5.29)

donde v es la velocidad ordinaria de la partícula en K y γ es el factor de Lorentz


asociado. Escribiendo
    
γ γ γv 0 0 1
 γv   γv γ 0 0   0 
 0  =  0 0 1 0  0 , (5.30)
0 0 0 0 1 0

podemos interpretar uµ como la 4-velocidad que obtenemos realizando un


boost inverso desde el MCI K 0 , donde u0µ = (1, 0, 0, 0). Poniendo v = tanh φ, la
4-velocidad adopta la forma

uµ = [cosh φ (τ) , sinh φ (τ) , 0, 0] , (5.31)

donde hemos escrito φ (τ) para resaltar el hecho que el MCI es distinto en
cada instante, de manera que el parámetro φ puede ser pensado como una
función del tiempo propio τ. La ec. (5.31) funciona como un ansatz para la 4-
velocidad, que queda completamente determinada a través de la función (aún
desconocida) φ (τ).
Derivando la ec. (5.31) obtenemos la 4-aceleración:

αµ = [sinh φ (τ) , cosh φ (τ) , 0, 0] . (5.32)

92
La magnitud al cuadrado de la aceleración propia es
 ‹
2 dφ 2
a0 = αµ α =
µ
, (5.33)

de donde obtenemos la ecuación

= a0 = const. (5.34)

La solución de esta ecuación es, simplemente, φ = a0 τ, donde hemos escogido
la condición inicial φ (0) = 0. Reemplazando, obtenemos la 4-velocidad y la
4-aceleración como funciones de τ:

uµ = [cosh (a0 τ) , sinh (a0 τ) , 0, 0] , (5.35)


α = a0 [sinh (a0 τ) , cosh (a0 τ) , 0, 0] .
µ
(5.36)

El lector puede comprobar fácilmente que estos 4-vectores satisfacen las con-
diciones uµ uµ = −1, uµ αµ = 0 y αµ αµ = a02 para todo τ. Note que nuestra elec-
ción para la condición inicial implica que la partícula comienza su movimiento
desde el reposo en τ = 0, pues uµ (0) = (1, 0, 0, 0). Integrando la 4-velocidad,
encontramos
1
xµ = [sinh (a0 τ) , cosh (a0 τ) , 0, 0] , (5.37)
a0
donde hemos escogido la condición inicial x µ (0) = (0, 1/a0 , 0, 0). Explícita-
mente, estamos describiendo el movimiento de la partícula a través de las
ecuaciones paramétricas
1 1
t= sinh (a0 τ) , x= cosh (a0 τ) . (5.38)
a0 a0

(Note que a0−1 sirve como escala espacial y temporal). Elevando al cuadrado y
restando, podemos escribir la ecuación de la trayectoria:
1
x2 − t2 = . (5.39)
a02

La ec. (5.39) muestra que la línea de mundo de la partícula es una hipérbola,


como se ilustra en la figura 5.3. Despejando x como función de t, encontramos
1q
x= 1 + (a0 t)2 . (5.40)
a0

93
t

1/a0 x

Figura 5.3: Línea de mundo de una partícula en movimiento hiperbólico. La


línea punteada curva representa el límite no relativista. Se indica también el
punto donde la partícula no relativista alcanzaría la velocidad de la luz.

Derivando, obtenemos la velocidad ordinaria como función del tiempo coor-


denado t,
dx a0 t
v= =Æ , (5.41)
dt 1 + (a t)2 0
que es claramente siempre menor que la velocidad de la luz (ver figura 5.4).
Note que |v| → 1 cuando t → ∞. A partir de la ec. (5.35) también es posible
expresar la velocidad ordinaria como función del tiempo propio τ, v = u1 /u0 =
tanh (a0 τ).
El límite no relativista se obtiene cuando |a0 t|  1. En este caso, la posición
y la velocidad adoptan las formas conocidas
1 1
x= + a0 t 2 , v = a0 t. (5.42)
a0 2
Estos límites no relativistas se indican con líneas punteadas en las figuras 5.3
y 5.4. Note que la velocidad no relativista alcanza la velocidad de la luz cuando
t = 1/a0 . Por supuesto, esta aproximación ya ha dejado de ser válida mucho
antes.

94
1

0,8

0,6
v

0,4

0,2

0
0 0,5 1 1,5 2 2,5 3
a0 t

Figura 5.4: Velocidad de una partícula en movimiento hiperbólico. La línea


punteada representa el límite no relativista.

Ejemplo 5.10. Imagine una nave espacial que pueda mantener una acelera-
ción propia constante a0 = 1 año−1 de manera indefinida. Esta aceleración les
brinda a los pasajeros un agradable campo gravitacional artificial de 9,5 m/s2 ,
muy similar al de la Tierra. El viaje comienza en órbita terrestre con velocidad
inicial nula. A diferencia de Perseverance, el rover de la misión Mars 2020, que
tardará siete meses en llegar a Marte, nosotros alcanzamos la órbita marciana
en apenas dos días y medio. Luego de cruzar sin contratiempos el cinturón de
asteroides (la probabilidad de chocar con un asteroide es, por supuesto, insig-
nificante), llegamos a la órbita de Júpiter 52 horas después. Han transcurrido
4,7 días desde que salimos de la Tierra y nuestra velocidad es del 1,3 % de la
velocidad de la luz. Juno, la sonda actualmente en órbita a Júpiter, tardó cinco
años en llegar. El nuestro no es, en ningún caso, un viaje de contemplación;
25 días después de haber salido de la Tierra, estamos tan lejos como el Voya-
ger 1, una de las dos sondas gemelas lanzadas en 1977 y que son actualmente
los emisarios más lejanos enviados por la humanidad. Vamos al 6,8 % de la ve-
locidad de la luz. El espacio, sin embargo, es vasto. Luego de 200 días de viaje
alcanzamos el 50 % de la velocidad de la luz, pero no llegaremos a Proxima
Centauri, la estrella más cercana al Sol, hasta que hayan transcurrido 2,3 años
desde que salimos de la Tierra. Nuestra velocidad es entonces igual al 98 % de

95
la velocidad de la luz. La Vía Láctea pasa relativamente rápido, y llegamos a la
Galaxia de Andrómeda cuando se cumplen 15 años de viaje. Hace tiempo que
nuestra velocidad, al ser tan cercana a la de la luz, dejó de ser un parámetro
interesante. En su lugar, el factor de Lorentz es γ = 2,5 × 106 , que coincide con
la distancia a la Tierra medida en años. ¿Hasta dónde podemos llegar? Cen-
trada siempre en nosotros mismos, el Universo observable forma una esfera
de unos 4,6 × 1010 años de radio. Luego de 25 años de viaje, nuestro Universo
observable ya no incluye la Tierra.
La figura 5.5 muestra una ilustración a escala logarítmica del universo ob-
servable.

5.5. Transformación de la velocidad


Habiendo definido la 4-velocidad como un 4-vector [cf. ec. (5.3)], sus com-
ponentes en dos marcos inerciales K y K 0 relacionados entre sí a través de una
transformación de Lorentz Λ están dadas por la ecuación

u0µ = Λµν uν . (5.43)

A modo de ejemplo, vamos a determinar las ecuaciones de transformación


explícitas para la velocidad ordinaria ~v y el factor de Lorentz γ de una partícula
0
para un boost con los marcos K y K en configuración estándar (cf. def. 3.3).
En este caso, la matriz Λ toma la forma [cf. ec. (3.69)]
 
Γ −Γ V 0 0
 −Γ V Γ 0 0 
Λ= , (5.44)
0 0 1 0 
0 0 0 1

donde Γ es el factor de Lorentz asociado a la velocidad V . Escribimos



uµ = γ (1, vi ) , u0µ = γ0 1, vi0 , (5.45)

y desarrollamos la ec. (5.43) para µ = 0, 1, 2, 3.


Con µ = 0, hallamos

u00 = Λ0ν uν = Λ00 u0 + Λ01 u1 , (5.46)

96
Figura 5.5: Ilustración a escala logarítmica del universo observable con el Sis-
tema Solar en el centro, los planetas interiores, el cinturón de asteroides, los
planetas exteriores, el cinturón de Kuiper, la nube de Oort, Alfa Centauri, el
brazo de Perseus, la Via Láctea, Andrómeda y las galaxias cercanas, la tela-
raña cósmica de cúmulos galácticos, la radiación de fondo de microondas y
el plasma invisible del Big Bang en el borde. Creada especialmente para Wi-
kipedia.org por Pablo Carlos Budassi. https://commons.wikimedia.org/
wiki/File:Observable_universe_logarithmic_illustration.png.

97
porque Λ02 = Λ03 = 0. Reemplazando ahora u00 = γ0 , u0 = γ, u1 = γvx , Λ00 = Γ ,
Λ01 = −Γ V , obtenemos [cf. ec. (3.54)]

γ0 = Γ γ (1 − V vx ) . (5.47)

Procediendo de manera análoga con µ = 1, 2, 3, hallamos

vx − V vy vz
vx0 = , v 0y = , vz0 = , (5.48)
1 − V vx Γ (1 − V vx ) Γ (1 − V vx )

donde hemos utilizado la ec. (5.47) para reemplazar γ0 en términos de cantida-


des no primadas. Note que las leyes de transformación para las componentes
y y z de la velocidad son distintas de la ley de transformación para la compo-
nente x. El trato especial que recibe la componente x es debido, por supuesto,
a que el boost que estamos considerando se realiza en esa dirección. La ley de
transformación para vx ya la habíamos deducido en el capítulo 3 a partir de la
composición de dos boosts en la misma dirección [cf. ec. (3.53)], pero las de y
y z son nuevas.
En general, la componente de la velocidad paralela al boost transforma de
manera distinta a las componentes perpendiculares. Usando la notación ~ vk y
v⊥ para distinguir entre componentes paralela y perpendicular a V~ , podemos
~
escribir

 vk − V~
~ v⊥
~
γ0 = Γ γ 1 − V~ · ~
vk , vk0 =
~ , v⊥0 =
~ . (5.49)
1 − V~ · ~
vk Γ 1 − V~ · ~
vk

Una deducción elegante (o, por lo menos, directa) de estas ecuaciones hace uso
de las componentes de un boost en una dirección arbitraria, en particular, de
la ec. (4.98). Note que cuando todas las velocidades involucradas son mucho
menores que la velocidad de la luz, recuperamos la ley de suma de velocidades
v0 = ~
galileana, ~ v − V~ [cf. ec. (1.3)].

Ejemplo 5.11. Una fuente de luz omnidireccional se encuentra en reposo en


un marco K dado. Como se ilustra en la figura 5.6, la fuente no parece omnidi-
reccional desde el punto de vista de un marco K 0 que se mueve con velocidad
V~ respecto de K, pues concentra la energía en la dirección opuesta al movi-
miento de K 0 . La magnitud de la velocidad de cada rayo de luz es, por supueso,
la misma en ambos marcos (compare con el ejemplo 1.4).

98
Figura 5.6: Izquierda: Una fuente de luz omnidireccional se encuentra en re-
poso en K. Derecha: Desde el punto de vista de un marco K 0 que se mueve con
velocidad V~ respecto de K (en la figura, V = 0,28, dirigida a la derecha) los
rayos de luz se concentran en la dirección opuesta a V~ , pero la magnitud de su
velocidad es la misma en todas las direcciones. Compare con la figura 1.6.

5.6. Transformación de la aceleración


Siguiendo el mismo procedimiento delineado en la sección 5.5, podemos
establecer la relación entre la aceleración ordinaria a~ de una partícula medida
en un marco K y su aceleración ordinaria a~0 medida en un marco K 0 que se
mueve con velocidad V~ respecto de K. Obtenemos
a~k
a~k0 = 3 , (5.50)
Γ 3 1 − V~ · ~
vk
a~⊥ a~k · V~
a~⊥0 = 2 + v⊥ ,
3 ~ (5.51)
Γ 2 1 − V~ · ~
vk Γ 2 1 − V~ · ~
vk
donde a~k y a~⊥ son las componentes de la aceleración ordinaria paralela y per-
pendicular a V~ , respectivamente.
Note que la abrumadora complejidad de las ecs. (5.50)–(5.51) se obtiene
directamente a partir de la ley de transformación para la 4-aceleración, que
está dada simplemente por α0µ = Λµν αν . El contraste entre ambas sugiere que
el punto de vista cuadridimensional del espacio-tiempo de Minkowski es, en
un sentido profundo, más simple que el punto de vista tridimensional.

99
a~0
a~0⊥
a~ a~
a~⊥

θ θ0

v
~ a~k k
a~0

Figura 5.7: Para determinar la aceleración propia a~0 de una partícula a partir de
su velocidad ~ v y aceleración a~ ordinarias (izquierda), proceda de la siguiente
manera. Descomponga la aceleración a~ en una componente paralela a~k y una
componente perpendicular a~⊥ a la velocidad ~ v (centro). Luego, escale a~k por γ3
y a~⊥ por γ2 [cf. ec. (5.52)] para obtener las componentes de la aceleración
k
propia a~0 paralela y perpendicular a ~ v , a~0 y a~0⊥ . Use estas componentes para
k
construir a~0 vía a~0 = a~0 + a~0⊥ (derecha). Note que |~ a0 | > |~
a| y θ0 < θ . Se ilustra
el caso v = 3/5, γ = 5/4.

La transformación inversa se obtiene, como siempre, intercambiando canti-


dades primadas con cantidades no primadas y reemplazando V~ por −V~ . Cuan-
do K 0 es el marco comóvil instantáneo de la partícula, esta transformación
v 0 = 0, a~0 = a~0 , V~ = ~
inversa, con ~ v y Γ = γ, nos permite calcular la aceleración
propia de una partícula a partir de su velocidad y aceleración ordinarias en K
(compare con los ejemplos 5.8 y 5.9):
k
a~0 = γ3 a~k , a~0⊥ = γ2 a~⊥ . (5.52)

Como se ilustra en la figura 5.7, la magnitud de la aceleración propia es siempre


mayor que la magnitud de la aceleración ordinaria,

k 2
2
a02 = a0 + a0⊥ = γ6 ak2 + γ4 a⊥2 > ak2 + a⊥2 = a2 , (5.53)

mientras que el ángulo entre la aceleración propia y la velocidad es siempre


menor que el ángulo entre la aceleración ordinaria y la velocidad,

a0⊥ a⊥ a
tan θ0 = = < ⊥ = tan θ . (5.54)
k
a0 γak ak

100
Capítulo 6

Dinámica relativista

6.1. 4-Momentum
Definición 6.1 (4-momentum). Sean m la masa y uµ la 4-velocidad de una
partícula. Definimos su 4-momentum a través de la expresión

pµ = muµ . (6.1)

Para que el 4-momentum sea un 4-vector, es necesario que la masa sea un


escalar, i.e., invariante bajo transformaciones de Lorentz.

Como veremos en la sección 6.3, el 4-momentum es la cantidad clave que


permanece constante durante cualquier interacción entre partículas.
Escribiendo uµ = γ (1, vi ) (ver sección 5.2), encontramos que las compo-
nentes temporal y espaciales del 4-momentum son

p0 = γm, p i = γmvi . (6.2)

Las componentes espaciales del 4-momentum son la generalización relati-


vista del momentum lineal newtoniano, m~v:

~p = γm~
v. (6.3)

Los momenta newtoniano y relativista coinciden aproximadamente cuando la


velocidad de la partícula es mucho menor que la velocidad de la luz, pero
difieren cada vez más drásticamente a medida que la velocidad aumenta. El
momentum lineal relativista diverge cuando |~
v | → 1, indicando que es imposible
para una partícula masiva alcanzar la velocidad de la luz.

101
¿Qué representa la componente temporal del 4-momentum? Para respon-
der esta pregunta, expandimos γ en serie de potencias en v 2 . Obtenemos

1 3
p0 = m + mv 2 + mv 4 + · · · . (6.4)
2 8

El segundo término del lado derecho es la energía cinética newtoniana, 12 mv 2 .


Por lo tanto, p0 debe representar la energía de la partícula:

E = γm. (6.5)

La energía así definida difiere en un aspecto crucial de la energía cinética new-


toniana: incluso cuando la partícula está en reposo, hallamos

E0 = m. (6.6)

Esta ecuación∗ es clave: una partícula en reposo tiene una energía igual a su
masa. Alternativamente, podemos interpretar esta ecuación como una concep-
ción nueva del significado de la masa: la masa es la energía en reposo de una
partícula.
La energía cinética relativista está definida como

K = E − E0 = E − m = (γ − 1) m. (6.7)

Esta definición resulta útil porque K se anula cuando ~ v = 0, de manera que


corresponde a la generalización directa de la energía cinética newtoniana. La
figura 6.1 compara las energías cinéticas relativista y newtoniana para distintas
velocidades.
Habiendo identificado las componentes temporal y espaciales del 4-mo-
mentum con la energía y el momentum lineal de una partícula, podemos es-
cribir
pµ = (E, ~p) . (6.8)
Esta forma, que no involucra explícitamente la velocidad de la partícula, es a
menudo la más conveniente para resolver problemas.
Sea K 0 el marco comóvil instantáneo de una partícula de masa m. En este
marco, su 4-momentum es
p0µ = (m, 0) . (6.9)

En su forma popular, E = mc 2 , esta es probablemente la ecuación más famosa de toda la
física.

102
1

0,8

0,6
K/m

0,4

0,2

0
0 0,2 0,4 0,6 0,8 1
v

Figura 6.1: Energía cinética (por unidad de masa) como función de la velo-
p La energía cinética diverge cuando v → 1. Note que K = m cuando
cidad.
v = 3/2 ≈ 0,866. La línea punteada es la aproximación newtoniana. Deci-
mos que una partícula es no relativista si K  m y ultrarrelativista si K  m.

103
A partir de esta ecuación, o usando pµ = muµ y recordando que uµ uµ = −1,
encontramos que la magnitud (al cuadrado) del 4-momentum es igual a

pµ pµ = −m2 . (6.10)

Al igual que la 4-velocidad, el 4-momentum es siempre un 4-vector tipo tiempo.


Usando la representación (6.8), podemos escribir la ec. (6.10) en la forma
equivalente
E 2 = m2 + p 2 , (6.11)
donde p2 = ~p · ~p es la magnitud al cuadrado del momentum lineal tridimen-
sional.
Tomando el cociente entre las componentes espaciales y la componente
temporal del 4-momentum, encontramos la relación

~p
v=
~ . (6.12)
E

El 4-momentum como cantidad primitiva. El 4-momentum contiene una


enorme cantidad de información sobre una partícula. En retrospectiva, resulta
interesante considerar el siguiente punto de vista.
Asociado a cada partícula existe un 4-vector, llamado 4-momentum y de-
notado por pµ , tal que:

La energía de la partícula es E = p0 , la parte temporal de pµ .

El momentum lineal de la partícula es ~p, la parte espacial de pµ .

La masa de la partícula está dada por m2 = −pµ pµ = E 2 − p2 .

La velocidad de la partícula es ~
v = ~p/E.

La energía cinética de la partícula es K = E − m.

De acuerdo a este punto de vista, el 4-momentum es una cantidad primitiva,


sin definición, a partir de la cual surgen los conceptos derivados de energía,
momentum lineal y masa. La figura 6.2 representa gráficamente las relaciones
entre momentum lineal, energía, masa y velocidad de una partícula.

104
E

E = γm E 2 = m2 + p 2

~p = E ~
v

v
~ ~p = γm~
v ~p

Figura 6.2: Ecuaciones que relacionan momentum lineal, energía, masa y ve-
locidad de una partícula. Adaptado de la Ref. [2].

Nota sobre el concepto de masa. En estas notas de clase, usamos el con-


cepto de masa abogado por Taylor y Wheeler [2]: la masa está dada por la
magnitud del 4-momentum, m2 = −pµ pµ , es independiente del estado de mo-
vimiento de la partícula, y tiene el mismo valor en todos los marcos de referen-
cia inerciales. (Vea, en particular, la sección Dialog: Use and Abuse of the Con-
cept of Mass, p. 246). La energía es la componente temporal del 4-momentum,
E = p0 , depende del estado de movimiento de la partícula, y cambia según el
marco de referencia inercial donde la midamos. Masa y energía solo coinciden
en el marco comóvil instantáneo de la partícula. Esta coincidencia es la que es-
tá expresada en la ecuación famosa de Einstein, E = mc 2 (E0 = m con nuestras
convenciones), que nos permite interpretar la masa de una partícula como su
energía en reposo.
Algunos autores prefieren introducir el concepto de “masa relativista”, que
se corresponde con nuestra noción de energía y que depende del estado de
movimiento de la partícula. En particular, Rindler [1] llama masa (relativista),
denotada por m, a lo que nosotros llamamos energía, y llama masa en reposo,
denotada por m0 , a lo que nosotros llamamos masa. Por supuesto, esto significa
que debe ser extremadamente cuidadoso con la interpretación de símbolos y

105
conceptos cuando lea este y otros libros.
Los dos artículos de Lev B. Okun [19, 20] abogan también por el concepto
de masa como cantidad invariante y dan una reseña histórica de su evolución
desde finales del siglo 19.

Unidades mecánicas. Con c = 1, masa, momentum lineal y energía se miden


todos en las mismas unidades, que pueden escogerse, e.g., como kg (masa),
kg m/s (momentum lineal) o J (energía), con
1 kg m
kg = 1 = 299 792 458 J. (6.13)
299 792 458 s

El electronvoltio (eV). Un electronvoltio es la energía ganada o perdida por


un electrón∗ al moverse a través de una diferencia de potencial eléctrico de un
voltio:
1 eV = 1,602 176 634 × 10−19 J. (6.14)
El electronvoltio es una unidad de energía comúnmente utilizada en física del
estado sólido, atómica, nuclear y de partículas. Aprovechando la equivalencia
entre masa y energía (6.6), las masas de las partículas elementales a menudo
se dan en eV. Por ejemplo, la masa del electrón es me = 0,511 MeV.

6.2. Fotones
La mecánica newtoniana no puede acomodar la existencia de partículas sin
masa. En efecto, si m = 0, la aceleración de una partícula sometida a la acción
de una fuerza neta F~ diverge de acuerdo a la segunda ley de Newton, a~ = F~/m.
Mirando la definición 6.1, parece que la teoría especial de la relatividad
fuera también a tener dificultades con la existencia de partículas sin masa. Sin
embargo, este no es el caso. Interpretando pµ como una cantidad primitiva
(p. 104), el 4-momentum de una partícula de masa cero puede escribirse sim-
plemente como pµ = (E, ~p), donde E es su energía y ~p su momentum lineal.
La condición m2 = −pµ pµ = E 2 − p2 = 0 implica que el 4-momentum de una
partícula sin masa es un 4-vector nulo o tipo luz, con

E = |~p| . (6.15)

A partir de mayo de 2019, la definición del amperio [10] fija el valor numérico para la
carga del electrón en e = 1,602 176 634 × 10−19 C.

106
Como la velocidad de una partícula está dada por ~ v = ~p/E, la ec. (6.15) implica
que la partícula sin masa se mueve siempre a la velocidad de la luz, |~ v | = 1. En
particular, esto significa que la 4-velocidad de una partícula sin masa no está
definida (porque γ diverge cuando |~ v | = 1), haciendo inviable la definición
inicial de 4-momentum.
En la teoría especial de la relatividad, una partícula sin masa se mueve siem-
pre a la velocidad de la luz, independientemente de su energía o su momentum
lineal. ¿Cómo distinguimos entonces dos partículas sin masa con energías dis-
tintas, si ambas viajan a la misma velocidad?
En 1905, Albert Einstein∗ introdujo el concepto de fotón como el cuanto de
radiación electromagnética, una partícula elemental sin masa. En el concepto
de Einstein, una onda electromagnética de frecuencia f puede interpretarse
también como un haz de fotones, cada uno de ellos con una energía

E = hf, (6.16)

donde h es la constante de Planck. Usando la ec. (6.16), podemos parametrizar


el 4-momentum de un fotón en la forma

pµ = h f (1, n̂) , (6.17)

donde n̂ = ~ v es un vector (tridimensional) unitario que apunta en la dirección


de movimiento del fotón.
Todos los fotones, sin importar su energía, viajan siempre a la velocidad
de la luz. Dos fotones con energías distintas corresponden a luz de diferentes
colores. La figura 6.3 muestra un esquema del espectro electromagnético.

La constante de Planck. Introducida por Max Planck en 1900, inicialmente


como parte de una “hipótesis ad-hoc” para deducir su ley de radiación de cuer-
po negro, la constante de Planck yace en la base de la descripción cuántica del
mundo. Desde mayo de 2019, la definición de kilogramo [10] está basada en
el valor exacto
h = 6,626 070 15 × 10−34 J s (6.18)
para la constante de Planck, de la misma manera cómo la definición de metro
fija de manera exacta el valor para la velocidad de la luz. A menudo se utiliza
también la constante de Planck reducida, ħ h = h/2π, en términos de la cual
podemos escribir E = ħhω, con ω = 2π f .

Sí, el mismo Albert Einstein. Sí, el mismo annus mirabilis de 1905.

107
λ/m
103 1 10−3 10−6 10−9 10−12

radio IR UV γ

visible
microondas rayos X
f /Hz
106 109 1012 1015 1018 1021
E/eV
10−9 10−6 10−3 1 103 106

Figura 6.3: El espectro elecromagnético. Una onda electromagnética monocro-


mática puede caracterizarse por su longitud de onda, λ, su frecuencia, f = 1/λ,
o la energía de un fotón típico, E = h f .

El efecto Doppler relativista. Siguiendo un procedimiento similar al utili-


zado en la sección 5.5, podemos relacionar las componentes del 4-momentum
de una partícula en dos marcos K y K 0 que se mueven con velocidad relativa
constante V~ . El resultado puede escribirse en la forma
 
E 0 = Γ E − V~ · ~pk , ~pk0 = Γ ~pk − E V~ , ~p⊥0 = ~p⊥ , (6.19)

donde ~pk y ~p⊥ son las componentes de ~p paralela y perpendicular a V~ , respec-


tivamente.
Para un fotón, estas ecuaciones implican un cambio en la frecuencia de la
luz percibida por los observadores K y K 0 . Si la dirección de movimiento del fo-
tón en el marco K está dada por el vector unitario n̂, entonces las frecuencias f
y f 0 están relacionadas mediante la ecuación

f 0 = Γ f 1 − V~ · n̂ . (6.20)

Este cambio en la frecuencia de la luz es conocido como efecto Doppler. El efecto


Doppler es importante, entre otros, en astronomía, donde se utiliza para medir
la velocidad radial de las estrellas.
Para ondas mecánicas, el efecto Doppler es cualitativamente similar pe-
ro cuantitativamente distinto al efecto Doppler electromagnético. La relación
entre f y f 0 en el caso mecánico contiene las velocidades de la fuente y del
observador respecto del medio de propagación de las ondas. En el caso electro-
magnético, solo importa la velocidad relativa entre fuente y observador, porque

108
10

2
f 0/ f

0,5

0,2

0,1
−1 −0,5 0 0,5 1
v

Figura 6.4: En el efecto Doppler, la frecuencia observada de un fotón depende


de la velocidad relativa entre el observador y la fuente de luz. Cuando el ob-
servador se aleja de la fuente (v > 0), la frecuencia observada es menor que
la emitida. En cambio, cuando el observador se acerca a la fuente (v < 0), la
frecuencia observada es mayor que la emitida.

la luz se propaga como ondas en el campo electromagnético, sin necesidad de


un medio material que la soporte.
Ejemplo 6.2 (Efecto Doppler relativista). Una fuente monocromática de luz
está en reposo en el marco del laboratorio. Bob, trabajando en el laboratorio,
determina que la frecuencia de los fotones emitidos por la fuente es f . Montada
en un cohete rápido, Alice no está de acuerdo con la frecuencia medida por
Bob. Cuando Alice se aleja de Bob, la frecuencia de los fotones es menor que la
frecuencia medida en el laboratorio. Cuando Alice se acerca a Bob, en cambio,
la frecuencia de los fotones resulta ser mayor que la medida en el laboratorio.
Asumiendo que la velocidad de Alice es siempre paralela o antiparalela con la
dirección de movimiento de los fotones, la ec. (6.20) toma la forma
v
t1 − v
f0= f, (6.21)
1+v
donde v = V~ · n̂ = ±V es positiva si Alice se aleja de Bob y negativa si Alice se
acerca a Bob. En la figura 6.4 se grafica este caso particular.

109
6.3. Conservación del 4-momentum
La propiedad más importante del 4-momentum es su conservación: El 4-
momentum total de un sistema aislado se mantiene constante en el tiempo.
Separando componente temporal y componentes espaciales, obtenemos dos
leyes de conservación independientes:

Conservación de la energía

Conservación del momentum lineal

Consideremos una colisión descrita por a + b → c + d. La notación indi-


ca que dos partículas, a y b, interactúan por un tiempo breve y luego de la
interacción emergen otras dos partículas, c y d, que pueden o no ser las mis-
mas partículas originales. La conservación del 4-momentum en esta interacción
queda expresada mediante la ecuación
µ µ
paµ + p b = pcµ + pd . (6.22)

En componentes, podemos escribir

Ea + E b = Ec + Ed , (6.23)
~pa + ~p b = ~pc + ~pd . (6.24)

La ec. (6.24) es la generalización relativista de la conservación del momentum


lineal newtoniano; exactamente la misma ecuación, pero con una definición
nueva para el momentum lineal, ~p = γm~ v . La ec. (6.23) es nueva; representa
la conservación de la energía total de una partícula, E = m + K, y es válida en
cualquier colisión, no solo en colisiones elásticas. Explícitamente, tenemos

ma + Ka + m b + K b = mc + Kc + md + Kd . (6.25)

No hay conservación de la masa en Relatividad; en su lugar, tenemos la con-


servación de la suma de masa y energía cinética, ec. (6.25). Como la masa es
una forma de energía, es posible convertir masa en energía y viceversa, con-
duciendo a que solo se conserva la suma de ambas, no cada una por sí sola.

Definición 6.3 (Colisión elástica). Decimos que una colisión es elástica si se


conserva la energía cinética. En la interacción a+ b → c +d, esto es equivalente
a
Ka + K b = Kc + Kd . (6.26)

110
En este caso, la ec. (6.25) implica que en una colisión elástica se conserva
también la masa:
ma + m b = mc + md . (6.27)
Ejemplo 6.4 (Colisión totalmente inelástica). Una colisión totalmente inelás-
tica puede escribirse como a + b → c, implicando que las partículas a y b
se mueven como una sola, c, después de la interacción. La conservación del
4-momentum en este caso toma la forma
µ
paµ + p b = pcµ . (6.28)
Consideremos dos partículas a y b de la misma masa, ma = m b = m, que se
acercan con velocidades de igual magnitud y direcciones opuestas: ~pa = γm~ v,
~p b = −γm~ v . En este caso, la conservación del momentum lineal produce ~pc =
~pa +~p b = 0, es decir, la partícula c queda en reposo después de la interacción. Si
K = (γ − 1) m es la energía cinética de a o b antes de la colisión, la conservación
de la energía implica
Ec = mc = 2m + 2K = 2γm. (6.29)
La masa de la partícula c es mayor que la suma de las masas de las partículas
a y b, porque la energía cinética de a y b contribuye también a la masa de c.
Esta es una instancia concreta de transformación de energía en masa.
¿Qué pasa si observamos esta colisión desde un marco de referencia dis-
tinto? En este caso, la partícula c no permanece en reposo, pero su masa es la
misma que en el caso simétrico. Por ejemplo, sea K 0 el marco donde b está en
reposo, de manera que E b0 = m, ~p0b = 0. En este caso, la velocidad, el factor
de Lorentz y el momentum lineal de a son [cf. ec. (5.49) con V~ = −~v, ~
v⊥ = 0,
v=~
~ vk , Γ = γ]
v
2~ 
va0 =
~ , γ0a = γ2 1 + v 2 , ~pa0 = 2γ2 m~
v. (6.30)
1 + v2
A partir de la conservación del 4-momentum encontramos la energía y el mo-
mentum lineal de c:
Ec0 = Ea0 + E b0 = 2γ2 m, ~pc0 = ~pa0 + ~p0b = 2γ2 m~
v, (6.31)

donde hemos usado la identidad 1 + γ2 1 + v 2 = 2γ2 . La masa de c está dada
por
2 
m2c = Ec02 − pc02 = 2γ2 m 1 − v 2 = (2γm)2 , (6.32)
que coincide con su masa en el marco K.

111
K m m mc
a b c

K0 m m mc
a b c

Figura 6.5: Colisión totalmente inelástica. En un marco K dado, dos partículas


idénticas, a y b, con velocidades de igual magnitud y direcciones opuestas se
fusionan en una nueva partícula, c. La masa de c es mayor que la suma de
las masas de a y b. Cuando observamos esta colisión desde el punto de vista
del marco K 0 donde b está en reposo, la energía y el momentum lineal de c
difieren de sus valores en el marco K, pero su masa permanece invariante. Ver
ejemplo 6.4.

Ejemplo 6.5 (Scattering de Compton, caso más simple). Llamamos scattering


de Compton al impacto de un fotón sobre un electrón en reposo, que produce
un electrón en movimiento y un fotón con una energía menor que la del fotón
original (i.e., con una longitud de onda más larga).
Veamos primero un caso simple, en el cual un fotón con energía E = 2me ,
donde me = 0,511 MeV es la masa del electrón, impacta un electrón en reposo
y emerge de la colisión en la dirección opuesta a la inicial, como se ilustra en
la figura 6.6, en un proceso llamado backscattering. Los 4-momenta del fotón
µ
y el electrón antes de la colisión son paµ = (2me , 2me , 0, 0) y p b = (me , 0, 0, 0).
µ
Después de la colisión, tenemos pcµ = (Ec , −Ec , 0, 0), pd = (Ed , pd , 0, 0), con
m2e = Ed2 − pd2 . La conservación del 4-momentum nos entrega las ecuaciones

3me = Ec + Ed , (6.33)
2me = −Ec + pd . (6.34)

Sumando, obtenemos
5me = Ed + pd . (6.35)
Combinando esta ecuación con la relación m2e = (Ed + pd ) (Ed − pd ), encontra-
mos
1
me = Ed − pd . (6.36)
5
Resolviendo el sistema formado por las ecs. (6.35)–(6.36), hallamos
13 12
Ed = me , pd = me . (6.37)
5 5

112
a b c d

Figura 6.6: Backscattering de un fotón por un electrón. Izquierda: un fotón (a)


de energía Ea = 2me impacta un electrón en reposo (b). Derecha: luego del
impacto, el electrón (d) se mueve hacia la derecha con velocidad vd = 12/13 y
un fotón (c) de energía Ec = (2/5) me sale hacia la izquierda. Ver ejemplo 6.5.

La velocidad del electrón después de la colisión es vd = pd /Ed = 12/13. Reem-


plazando en (6.33) ó (6.34) obtenemos finalmente
2
Ec = me . (6.38)
5
Resumiendo: un fotón de rayos gamma (Ea = 1,02 MeV, λa = 1,21 pm) im-
pacta un electrón en reposo, imprimiéndole una velocidad igual al 92 % de la
velocidad de la luz. El fotón emitido tiene apenas el 20 % de la energía del
fotón incidente (Ec = 204 keV, λc = 6,06 pm).

Ejemplo 6.6 (Creación de un par electrón-positrón). Si un fotón a impacta un


electrón b en reposo con la energía suficiente, es posible crear un par electrón-
positrón∗ . Vamos a asumir que el par electrón-positrón y el electrón original
se mueven como una sola partícula, c, después de la colisión, con mc = 3me ,
como muestra la figura 6.7. En este caso, la conservación del 4-momentum
produce las ecuaciones
Ea + me = Ec , Ea = pc , (6.39)
con Ec2 − pc2 = m2c = 9m2e . Resolviendo, hallamos que la energía del fotón in-
cidente debe ser igual a 4 veces la masa del electrón, Ea = 4me . La velocidad
de c es vc = pc /Ec = 4/5. La conservación del momentum lineal impide que la
partícula c sea creada en reposo, por lo que parte de la energía del fotón inci-
dente siempre se gasta en energía cinética. Por este motivo es que se necesita
un fotón con la energía de 4 electrones en reposo para producir un solo par
electrón-positrón. La presencia del electrón b es crucial; un fotón por sí solo
no puede desintegrarse espontáneamente en un par electrón-positrón.


El positrón es la antipartícula del electrón. El electrón y el positrón tienen la misma masa,
el mismo spin, y cargas eléctricas de signos opuestos. La existencia del positrón fue predicha
teóricamente por P. A. M. Dirac en 1928 y confirmada experimentalmente por C. D. Anderson
en 1932.

113
a b c

Figura 6.7: Creación de un par electrón-positrón. Un fotón energético a im-


pacta un electrón en reposo b y produce una nueva partícula, c, compuesta del
electrón original más un par electrón-positrón, con mc = 3me . Ver ejemplo 6.6.

Ejemplo 6.7 (Scattering de Compton). El caso general del scattering de Com-


pton se ilustra en la figura 6.8. Los cuatro 4-momenta involucrados pueden ser
escritos en la forma

paµ = h f (1, 1, 0, 0) , (6.40)


µ
pb = me (1, 0, 0, 0) , (6.41)
pcµ = h f 0 (1, cos θ , sin θ , 0) , (6.42)
µ
pd = (E, p cos ϕ, −p sin ϕ, 0) , (6.43)

donde f y f 0 son las frecuencias del fotón antes y después del scattering, y
m2e = E 2 − p2 . La conservación del 4-momentum nos entrega un sistema de
cuatro ecuaciones que puede resolverse algebraicamente.
A menudo ocurre que no estamos interesados en algún aspecto de la co-
lisión en estudio. Por ejemplo, en el scattering de Compton nos importa más
saber con qué energía emerge el fotón (i.e., en cuánto cambia su longitud de
onda) luego de la interacción que la energía y la dirección de movimiento del
electrón. En estos casos, podemos utilizar la siguiente técnica: de la ecuación
para la conservación del 4-momentum, aislamos el 4-momentum que no nos
interesa y elevamos al cuadrado:
µ
 µ

pµd pd = pµa + pµb − pµc paµ + p b − pcµ . (6.44)

En la ec. (6.44), la única información que queda sobre el electrón d es su masa.


Multiplicando los paréntesis en el lado derecho, hallamos
µ µ µ
pµd pd = pµa paµ + pµb p b + pµc pcµ + 2pµa p b − 2pµb pcµ − 2pµc paµ
−m2e = −m2e − 2h f me + 2h f 0 me − 2h2 f f 0 (−1 + cos θ ) .

Esto es equivalente a
1 1 h
− = (1 − cos θ ) . (6.45)
f 0 f me

114
c

θ
a b ϕ
d

Figura 6.8: Scattering de Compton. Izquierda: un fotón (a) impacta un electrón


en reposo (b). Derecha: luego de la colisión, el fotón (c) y el electrón (d) salen
disparados en direcciones distintas. Ver ejemplo 6.7.

Reemplazando λ = 1/ f y usando la identidad trigonométrica sin2 (θ /2) =


1
2 (1 − cos θ ), podemos escribir
 ‹
0 2h 2 θ
λ −λ= sin . (6.46)
me 2

La ec. (6.46) fue deducida por primera vez por Arthur Compton en 1923, re-
velando que la luz no podía siempre ser tratada como una onda. La cantidad
λc = h/me = 2,43 pm es conocida como longitud de onda de Compton del elec-
trón.

6.4. Sistemas de partículas


Consideremos dos partículas no interactuantes entre sí y dibujemos una
caja imaginaria que las contenga a ambas, como se muestra en la figura 6.9.
Para simplificar, asumimos que las partículas tienen la misma masa y velocida-
des de igual magnitud pero direcciones opuestas en el marco del laboratorio.
Estas dos partículas forman ahora un sistema que posee los mismos atributos
dinámicos —energía, momentum lineal y masa— que un único objeto.
Usando los datos numéricos de la tabla 6.1, determinamos que los 4-mo-
µ
menta de las partículas son paµ = (10, 6, 0, 0) y p b = (10, −6, 0, 0). A partir de
estas componentes podemos calcular la masa, la energía cinética y la velocidad
de cada una de las partículas.
µ
El 4-momentum del sistema de dos partículas es p̄µ = paµ +p b = (20, 0, 0, 0).
A partir de estas componentes calculamos la masa, la energía cinética y la

115
a b

Figura 6.9: Dos partículas no interactuantes que son consideradas como un


sistema.

E px m K vx
Partícula a 10 6 8 2 3/5
Partícula b 10 −6 8 2 −3/5
Sistema 20 0 20 0 0

Tabla 6.1: Información dinámica de dos partículas que son consideradas como
un sistema. Energía, momentum lineal y masa se miden en la misma unidad
(e.g., kilogramos). La velocidad es adimensional.

velocidad del sistema de dos partículas, con resultados sorprendentes: la masa


de un sistema de partículas es mayor que la suma de las masas individuales cuando
las partículas que lo componen se mueven unas respecto de las otras. En particular,
esto significa que la energía térmica asociada al movimiento aleatorio de las
partículas de un sistema contribuye también a su masa.
Más formalmente, consideremos una colección de partículas cuya única
interacción ocurre en la forma de colisiones y que no están sometidas a fuer-
zas externas. Denotando por paµ al 4-momentum de la partícula a-ésima (a =
1, 2, 3, . . .), el 4-momentum total del sistema puede escribirse en la forma
X
p̄µ = paµ , (6.47)
a

donde la suma se extiende a todas las partículas del sistema. Es posible de-
mostrar que p̄µ , al igual que cada uno de los 4-momenta individuales, es un
4-vector tipo tiempo [1].
En estas condiciones, el 4-momentum total del sistema, p̄µ , permanece
constante en el tiempo, i.e., se conserva.
La masa M del sistema de partículas está dada por

M 2 = −p̄µ p̄µ , (6.48)

116
y es en
P general mayor que la suma de las masas de las partículas individuales,
m̄ = a ma . De su definición, la masa del sistema es invariante de Lorentz, de
manera que todos los observadores inerciales coinciden en su valor. La conser-
vación del 4-momentum nos asegura que la masa M del sistema permanece
constante siempre que el sistema se mantenga aislado.

Definición 6.8 (Marco del centro del momentum). Como p̄µ es un 4-vector tipo
tiempo, existe un marco K 0 , llamado marco del centro del momentum (MCM),
donde sus componentes espaciales se anulan:

p̄i0 = 0. (6.49)

Si las componentes de p̄µ en un marco K dado son p̄µ = Ē, p̄i , entonces es
posible demostrar que la velocidad de K 0 respecto de K es
p̄i
Vi = . (6.50)

En el marco del centro del momentum, las componentes del 4-momentum
total son
p̄0µ = (M , 0) . (6.51)
Luego, podemos escribir
X X 
00
M = p̄ = pa00 = ma + Ka0 = m̄ + K̄ 0 , (6.52)
a a

donde K̄ 0 es la energía cinética total medida en el MCM. Esta ecuación muestra


que la masa del sistema es siempre mayor que la suma de las masas de las
partículas individuales. La diferencia entre M y m̄ puede interpretarse como
la energía cinética total medida en el marco del centro del momentum, i.e., la
energía térmica del sistema.
Si las partículas de un sistema interactúan entre sí, entonces la energía po-
tencial de interacción contribuye también a la masa del sistema.

6.5. 4-Fuerza
La primera ley de Newton, que define un marco de referencia inercial, sigue
siendo válida en Relatividad: un objeto sobre el que no actúan fuerzas se mueve
en línea recta con velocidad constante (que podría ser cero).

117
La segunda ley de Newton puede escribirse en la forma
d ~p
f~ = , (6.53)
dt
donde ~p es el momentum lineal y f~ es la fuerza neta que actúa sobre una
partícula. En Relatividad, esta relación es reemplazada por
d pµ
F =
µ
, (6.54)

donde pµ es el 4-momentum y F µ es la 4-fuerza total que actúa sobre una
partícula. Con pµ = (E, pi ), las componentes de la 4-fuerza total son
dE
F0 = γ , F i = γ fi , (6.55)
dt
donde P = d E/d t es la potencia desarrollada por la fuerza y
d pi d d
fi = = (γmvi ) = (E vi ) (6.56)
dt dt dt
es la fuerza tridimensional o 3-fuerza total. Esta 3-fuerza se corresponde con la
fuerza newtoniana, aunque difiere de ella: la relación f~ = d ~p/d t se mantiene,
pero la definicion del momentum lineal ~p ha pasado del m~ v newtoniano al
γm~ v relativista.
Dado que las interacciones instantáneas a distancia son incompatibles con
la Relatividad, la tercera ley de Newton sobrevive solo para interacciones lo-
cales, como las colisiones de las secciones anteriores.
A partir de las ecs. (6.55) podemos escribir
 ‹
dE
F =γ
µ
, fi . (6.57)
dt
Tomando el producto punto de F µ con la 4-velocidad uµ , hallamos
 ‹
2 dE
uµ F = γ −
µ
+ vi f i . (6.58)
dt
Sea K 0 el marco comóvil instantáneo de la partícula. En K 0 , u0µ = (1, 0, 0, 0) y
F 00 = dm/d t 0 , de manera que obtenemos u0µ F 0µ = −d m/d t 0 . Igualando con el
resultado obtenido en K, encontramos
dE 1 dm
= vi f i + , (6.59)
dt γ dt

118
donde hemos usado la relación d/d t 0 = γd/d t.
En general, una 4-fuerza relativista puede hacer dos cosas: cambiar la masa
y cambiar la velocidad de una partícula. Cuando una fuerza no cambia la masa
de la partícula, se cumplen uµ F µ = 0 y la relación newtoniana P = ~v · f~.

Definición 6.9 (Fuerza tipo calor). Decimos que una fuerza es tipo calor si
cambia la masa, pero no la velocidad, de la partícula sobre la que actúa.

Ejemplo 6.10. Las fuerzas de acción y reacción en una colisión son tipo calor.

Ejemplo 6.11. Si la 4-fuerza puede derivarse a partir de un potencial escalar,


Fµ = ∂µ Φ, entonces
d xµ ∂ Φ dΦ
uµ F µ = = . (6.60)
dτ ∂ x µ dτ
Como dΦ/dτ 6= 0 en general, una fuerza de esta clase será tipo calor.

Ejemplo 6.12. La fuerza electromagnética no cambia la masa de las partículas


sobre las que actúa.

Sea F µ una 4-fuerza que no cambia la masa de una partícula. En este caso,
podemos escribir 
F µ = γ v j f j , fi . (6.61)
Aplicando la regla de Leibniz a la relación f i = (d/d t) (E vi ), obtenemos

d vi d E
fi = E + vi = γmai + v j f j vi , (6.62)
dt dt
que claramente difiere de la segunda ley de Newton. Proyectando esta ecua-
ción sobre la dirección paralela y el plano perpendicular a la velocidad de la
partícula, obtenemos

f~k = γ3 m~
ak , f~⊥ = γm~
a⊥ , (6.63)

donde hemos usado la relación ~ v · f~ ~v = v 2 f~k . En la sección 5.6 mostramos
que la aceleración propia a~0 puede descomponerse en partes paralela y per-
pendicular a la velocidad en la forma
k
a~0 = γ3 a~k , a~0⊥ = γ2 a~⊥ . (6.64)

119
k
Esto significa que podemos escribir f~k = m~
a0 , pero f~⊥ 6= m~
a0⊥ . La única manera
de recuperar la segunda ley de Newton consiste en definir, de modo bastante
ad-hoc, una “masa longitudinal” y una “masa transversal” en la forma

mk = γ3 m, m⊥ = γm. (6.65)

Usando estas definiciones, conseguimos escribir

f~k = mk a~k , f~⊥ = m⊥ a~⊥ , (6.66)

pero es muy poco claro si hemos ganado algo con ello.

120
Capítulo 7

Electrodinámica relativista

El nombre secreto de este capítulo es “Campos relativistas”, porque ese


es el espíritu con que procedemos: estudiamos las ecuaciones relativistas más
sencillas que pueden satisfacer un campo escalar y un campo 4-vectorial, y
encontramos que en ambos casos los resultados tienen relevancia física.

7.1. La ecuación de Klein–Gordon


El caso más simple de un campo relativista es un campo escalar, φ, que
permanece invariante bajo transformaciones de Lorentz, i.e., en cuyo valor
están de acuerdo dos observadores K y K 0 que se mueven con velocidad relativa
constante.
¿Qué ecuaciones diferenciales puede satisfacer un campo escalar para ser
consistente con la Relatividad? Las ecuaciones de Laplace o Poisson, al no in-
cluir el tiempo, están descartadas. La posibilidad no trivial más simple es

ƒφ = 0, (7.1)

cuyas soluciones son ondas que se propagan a la velocidad de la luz (en todos
los marcos).
Con ƒ = −∂µ ∂ µ (cf. def. 4.55), la ecuación de onda ∂µ ∂ µ φ = 0 es reminis-
cente de la relación pµ pµ = 0, que describe a un fotón (ver sección 6.2). Esta
reminiscencia motiva la equivalencia heurística

pµ 7→ −iħ
h∂µ , (7.2)

121
h es, desde nuestro punto de vista, puramente convencional.
donde el factor −iħ
Explícitamente (note que E = p0 = −p0 , con ∂0 = ∂ /∂ t),

E 7→ iħ
h , ~p 7→ −iħ
h∇. (7.3)
∂t
En 1925, Erwin Schrödinger usó las equivalencias (7.3) para deducir una
ecuación diferencial que predice correctamente los niveles de energía para el
átomo de hidrógeno dados por el modelo de Bohr. Partiendo de la expresión
newtoniana para la energía,
p2
E= + V, (7.4)
2m
donde K = 12 mv 2 = p2 /2m es la energía cinética y V es energía potencial, y
efectuando los reemplazos (7.3), obtenemos la ecuación de Schrödinger,

∂ψ h2 2
ħ

h =− ∇ ψ + V ψ. (7.5)
∂t 2m
Aquí, ψ (~r , t) es una “función de onda”, valuada en los números complejos,
cuyo módulo al cuadrado da la densidad de probabilidad de encontrar una
partícula en la posición ~r en el instante t. La ecuación de Schrödinger es uno
de los pilares de la mecánica cuántica, y la base de la física atómica y molecular.
De la manera en que la hemos deducido resulta claro que no es compatible con
la Relatividad.
Aplicando la sustitución (7.2) en la expresión relativista pµ pµ = −m2 , ob-
tenemos la ecuación de Klein–Gordon,
 m 2
ƒφ + φ = 0. (7.6)
ħ
h
Curiosamente, Schrödinger mismo dedujo esta ecuación antes de la ecuación
que lleva su nombre, pero la descartó porque no reproduce correctamente los
niveles de energía del átomo de hidrógeno. La ecuación de Klein–Gordon es
una versión relativista de la ecuación de Schrödinger válida para partículas
de spin cero, como el bosón de Higgs. Ignorando tanto la Relatividad como el
spin del electrón, la ecuación de Schrödinger da una buena aproximación a
los niveles de energía del átomo de hidrógeno. La ecuación de Dirac corrige
ambas falencias de la ecuación de Schrödinger y predice correctamente la “es-
tructura fina” de los niveles de energía, además de la existencia del positrón,
la antipartícula del electrón.

122
7.2. El campo electromagnético
¿Qué ecuaciones relativistas podemos escribir para un campo 4-vectorial
Aµ ? De nuestra experiencia con el campo escalar, podríamos comenzar pro-
bando la ecuación de onda,
ƒAµ = 0. (7.7)
Aunque de apariencia relativista, esta ecuación esconde una potencial
 viola-
ción a la covariancia: con ƒ = −∂ ∂λ , tenemos ƒAµ = −∂ ∂λ Aµ . Como vi-
λ λ

mos en la sección 4.3 (p. 76), las derivadas parciales de un campo 4-vectorial
solo son tensoriales bajo transformaciones lineales de coordenadas. Bajo una
transformación no lineal, como el paso de coordenadas cartesianas a coorde-
nadas esféricas, el término ∂λ Aµ es no tensorial y no puede ser aceptado como
parte de una ecuación relativista covariante. Una manera de recuperar la co-
variancia consiste en tomar combinaciones antisimétricas de las derivadas de
Aµ , como en
Fµν = ∂µ Aν − ∂ν Aµ . (7.8)
En términos de este tensor, podemos reemplazar la ecuación de onda por

∂ν F µν = ∂ µ (∂ν Aν ) + ƒAµ = 0. (7.9)

Para hacer la ecuación más interesante, introducimos una fuente (“source”)


4-vectorial S µ en el lado derecho de esta ecuación homogénea y obtenemos

∂ν F µν = S µ . (7.10)

Estas son ecuaciones relativistas de segundo orden para un campo 4-vectorial


Aµ con una fuente 4-vectorial S µ .
¿Qué representan el tensor definido en (7.8) y las ecuaciones (7.10)? Un
tensor antisimétrico como F µν tiene seis componentes independientes (ver ta-
bla 4.2), las que pueden organizarse en dos vectores tridimensionales, F 0i y
εi jk F jk . Usando la definición (7.8), encontramos

∂ Ai
F 0i = ∂ 0 Ai − ∂ i A0 = − − ∂i φ, (7.11)
∂ t
εi jk F jk = εi jk ∂ i A j − ∂ j Ai = 2εi jk ∂ j Ak , (7.12)

donde hemos llamado φ = A0 . Estas ecuaciones son idénticas a las definiciones


del campo eléctrico y el campo magnético a partir de los potenciales escalar

123
eléctrico y vectorial magnético,

∂ A~
E~ = − − ∇φ, B
~ = ∇ × A.
~ (7.13)
∂t
Identificamos, por lo tanto,

1
Ei = F 0i , Bi = εi jk F jk , (7.14)
2
con el campo eléctrico y el campo magnético, respectivamente. Las relaciones
inversas son

F 0i = Ei , F i j = εi jk Bk . (7.15)

Más explícitamente,
 
0 Ex Ey Ez
 −E x 0 Bz −B y 
[F µν ] =  . (7.16)
−E y −Bz 0 Bx 
−Ez B y −B x 0

Por supuesto, esta identificación no pasaría de ser una curiosidad si las ecua-
ciones satisfechas por los campos no se corresponden con las ecuaciones de
Maxwell. Para comprobar esta última equivalencia, analizamos las componen-
tes de la ec. (7.10). Separando los casos µ = 0 y µ = i, hallamos

∂ν F 0ν = ∂i F 0i = ∂i Ei = S 0 , (7.17)
∂ Ei
∂ν F iν = ∂0 F i0 + ∂ j F i j = − + εi jk ∂ j Bk = S i . (7.18)
∂t

Identificando S 0 = ρ/ε0 , S i = µ0 ji , y notando que, con c = 1, tenemos ε0 µ0 =


1, estas ecuaciones corresponden a la ley de Gauss y la ley de Ampère–Maxwell,

ρ ∂ E~
∇ · E~ = , − +∇×B
~ = µ0 ~. (7.19)
ε0 ∂t

Definiendo la 4-corriente J µ como el 4-vector con componentes

J µ = (ρ, ~) , (7.20)

124
podemos escribir las ecuaciones de Maxwell inhomogéneas en la forma com-
pacta
∂ν F µν = µ0 J µ . (7.21)
Las ecuaciones de Maxwell homogéneas (la ley de Gauss para el magnetismo
y la ley de Faraday) se satisfacen automáticamente una vez se definen los cam-
pos a partir de potenciales, como hemos hecho. También es posible escribirlas
tensorialmente en la forma

∂λ Fµν + ∂µ Fνλ + ∂ν Fλµ = 0. (7.22)

Resulta directo comprobar que esta ecuación se reduce a una identidad cuando
reemplazamos la definición de Fµν dada en la ec. (7.8).

Conceptos clave de la electrodinámica relativista. Los 4-vectores Aµ y J µ


son llamados 4-potencial y 4-corriente, respectivamente. Sus componentes tem-
poral y espaciales son

Aµ = φ, A~ , J µ = (ρ, ~) . (7.23)

Aquí, identificamos φ con el potencial escalar eléctrico, A~ con el potencial vec-


torial magnético, ρ con la densidad de carga eléctrica, y ~ con la densidad de
corriente eléctrica. A partir del 4-potencial definimos el campo electromagnético
como
Fµν = ∂µ Aν − ∂ν Aµ . (7.24)
Este es un tensor antisimétrico de orden 2 que a veces es llamado tensor de
Faraday. El campo eléctrico E~ y el campo magnético B
~ corresponden a las com-
0i ij
ponentes F y F de este tensor:

1
Ei = F 0i , Bi = εi jk F jk , (7.25)
2
F 0i = Ei , F i j = εi jk Bk . (7.26)

Más explícitamente,
 
0 Ex Ey Ez
 −E x 0 Bz −B y 
[F µν ] =  . (7.27)
−E y −Bz 0 Bx 
−Ez B y −B x 0

125
El campo electromagnético obedece las ecuaciones de Maxwell inhomogéneas,

∂ν F µν = µ0 J µ , (7.28)

que son equivalentes a las leyes de Gauss y de Ampère–Maxwell. Las ecuacio-


nes de Maxwell homogéneas, i.e., las leyes de Gauss para el magnetismo y de
Faraday, se reducen a identidades cuando los campos son definidos a partir de
potenciales, como hemos hecho aquí. Ellas pueden escribirse tensorialmente
en la forma
∂λ Fµν + ∂µ Fνλ + ∂ν Fλµ = 0, (7.29)
que a veces es llamada identidad de Bianchi.

∗ ∗ ∗

La presentación de la electrodinámica que hemos hecho en esta sección


puede resultar difícil de aceptar. Después de todo, las ecuaciones de Maxwell
representan una síntesis teórica formidable de un sinnúmero de resultados ex-
perimentales obtenidos con esfuerzo y paciencia durante siglos. El malabaris-
mo teórico que hemos usado para obtenerlas no le hace en modo alguno jus-
ticia a este desarrollo histórico. Y, sin embargo, allí están, apareciendo como
componentes de una ecuación tensorial que planteamos de manera no muy
distinta a cómo un mago saca un conejo de su sombrero.
Nuestra presentación tiene, como mínimo, una virtud: escribiendo las ecua-
ciones de Maxwell tensorialmente, resulta evidente que ellas tienen la mis-
ma forma en todos los marcos de referencia relacionados entre sí a través de
transformaciones de Lorentz, i.e., son covariantes. De hecho, las ecuaciones
de Maxwell son uno de los ejemplos más simples de ecuaciones diferenciales
relativistas para un campo 4-vectorial Aµ .

7.3. Invariancia de gauge


Aparte de la simetría de Lorentz que está presente por construcción en la
presentación de la electrodinámica que hemos dado en la sección 7.2, existe
una segunda simetría, que llamamos invariancia de gauge, que resulta crucial
para el desarrollo de la electrodinámica.

126
Definición 7.1 (Transformación de gauge). Sea λ un campo escalar arbitrario.
La transformación Aµ 7→ A0µ , con

A0µ = Aµ − ∂µ λ, (7.30)

que reemplaza el 4-potencial Aµ por un nuevo 4-potencial A0µ , es llamada trans-


formación de gauge. Una transformación de gauge no es una transformación de
coordenadas, sino un cambio en el 4-potencial mediado por un campo esca-
lar λ.
En términos del potencial escalar eléctrico φ y el potencial vectorial mag-
nético A,
~ la transformación de gauge (7.30) toma la forma

∂λ
φ0 = φ + , A~0 = A~ − ∇λ. (7.31)
∂t
Bajo una transformación de gauge (7.30), el campo electromagnético Fµν
0
permanece invariante. En efecto, si llamamos Fµν al campo producido por el
0
nuevo 4-potencial Aµ , encontramos

0
Fµν = ∂µ A0ν − ∂ν A0µ

= ∂µ (Aν − ∂ν λ) − ∂ν Aµ − ∂µ λ
= ∂µ Aν − ∂ν Aµ − ∂µ ∂ν λ + ∂ν ∂µ λ
= Fµν .

Esto quiere decir que el campo electromagnético es insensible a cambios en


el 4-potencial de la forma (7.30). Más explícitamente, los campos eléctrico y
magnético derivados a partir de los potenciales φ y A~ son idénticos a los campos
derivados a partir de los potenciales primados (7.31),
 ‹
∂ A~0 ∂ A~ ∂ ∂λ
E~0 = − 0
− ∇φ = − − ∇φ + (∇λ) − ∇ = E~, (7.32)
∂t ∂t ∂t ∂t
~ 0 = ∇ × A~0 = ∇ × A~ − ∇ × ∇λ = B
B ~. (7.33)

La invariancia de gauge tiene dos consecuencias principales. En primer


lugar, la ambigüedad existente en el 4-potencial, en el sentido que dos 4-
potenciales relacionados entre sí por una transformación de gauge producen
el mismo campo electromagnético, puede utilizarse para simplificar las ecua-
ciones en una situación concreta. Una “elección de gauge” consiste en una

127
condición adicional que se le exige al 4-potencial, eliminando así total o par-
cialmente la libertad de gauge (7.30). Existen muchas elecciones de gauge po-
sibles; desde nuestro punto de vista, son particularmente interesantes aquellas
condiciones de gauge que son covariantes.

Definición 7.2 (Gauge de Lorenz). La condición de gauge

∂µ Aµ = 0 (7.34)

es conocida como gauge de Lorenz∗ y tiene la virtud de ser covariante, i.e., de


conservar su forma en todos los marcos de referencia inerciales.
La condición de Lorenz fija solo parcialmente el gauge; si el 4-potencial Aµ
satisface la ec. (7.34), entonces el 4-potencial A0µ = Aµ − ∂µ λ, con ƒλ = 0,
que es obtenido a partir de una transformación de gauge sobre Aµ , también la
cumple.

Usando el gauge de Lorenz, las ecuaciones de Maxwell inhomogéneas adop-


tan la forma simplificada
ƒAµ = µ0 J µ . (7.35)
En ausencia de cargas y corrientes, i.e., cuando J µ = 0, la ec. (7.35) muestra
que todas las componentes del 4-potencial satisfacen la ecuación de onda.
Una segunda consecuencia de la invariancia de gauge tiene que ver con
posibles modificaciones a las ecuaciones de Maxwell. Por ejemplo, la ecuación
de Proca,  m 2
∂ν F µν + Aµ = µ0 J µ , (7.36)
ħ
h
que describe un fotón de masa m, es compatible con la simetría de Lorentz
pero no con la simetría de gauge, i.e., la ec. (7.36) mantiene su forma bajo
transformaciones de Lorentz pero no bajo transformaciones de gauge. Desde
un punto de vista puramente teórico, la única razón para rechazar la ecuación
de Proca es la simetría de gauge, que se convierte así en el motivo para la masa
nula del fotón.
La invariancia de gauge y la simetría de Lorentz son los principios teóricos
básicos que dan forma a la electrodinámica. Apropiadamente generalizada, la

El gauge de Lorenz debe su nombre Ludvig Lorenz (1829–1891), un físico y matemático
danés, no a Hendrik A. Lorentz (1853–1928), el físico holandés al que nos referimos cuando
hablamos, e.g., de transformaciones de Lorentz. Es habitual que los textos de física confundan
ambos nombres.

128
simetría de gauge es el ingrediente clave para la formulación de las teorías de
gauge que describen las interacciones débil y fuerte y que, junto con la electro-
dinámica, conforman el modelo estándar de la física de partículas.

7.4. Conservación de la carga


Aplicando el operador de derivada parcial ∂µ a las ecuaciones de Maxwell
inhomogéneas (7.28), hallamos

∂µ ∂ν F µν = µ0 ∂µ J µ . (7.37)

La conmutatividad de las derivadas parciales implica que el lado izquierdo de


esta ecuación es idénticamente cero, porque corresponde a la contracción de
un tensor simétrico, el operador ∂µ ∂ν , con un tensor antisimétrico, el campo
electromagnético F µν . Esto significa que la 4-corriente J µ satisface la ecuación
de continuidad,
∂µ J µ = 0. (7.38)
Para desentrañar el significado de la ecuación de continuidad (7.38), par-
timos escribiéndola explícitamente en términos de las componentes de la 4-
corriente, J µ = (ρ, ~):
∂ρ
+ ∇ · ~ = 0. (7.39)
∂t
En esta ecuación, ρ y ~ describen una distribución continua de carga eléctrica
en movimiento, un “fluido eléctrico”. Consideremos un volumen tridimensio-
nal arbitrario V a través del cual fluye carga eléctrica, como se sugiere en la
figura 7.1. Si integramos la ec. (7.39) sobre V para un instante t fijo, obtene-
mos Z I
d
ρdV + ~ · n̂dA = 0, (7.40)
dt V S

donde S es la superficie cerrada que sirve de frontera para el volumen V . Como


la integración sobre V se realiza en un instante de tiempo fijo, podemos sacar
la derivada ∂ /∂ t de la integral en el primer término y escribirla como una
derivada total d/d t actuando sobre la integral de volumen. En el segundo
término, hemos usado el teorema de la divergencia para reescribir la integral
de volumen de la divergencia de ~ como una integral de superficie, donde n̂
denota el vector unitario perpendicular a la superficie.

129
S
~

Figura 7.1: Una distribución continua de carga eléctrica fluye a través de una
esfera S. La densidad de corriente es ~, que apunta siempre hacia la derecha,
y el vector unitario normal a la superficie es n̂. En el hemisferio izquierdo de
la esfera hay un flujo de carga hacia dentro, con ~ · n̂ < 0, mientras que en el
hemisferio derecho la carga fluye hacia fuera, con ~ · n̂ > 0.

En la ec. (7.40), el primer término representa la variación temporal de la


carga encerrada dentro de V , mientras que el segundo término representa el
flujo de carga a través de S. En efecto, el ángulo entre ~ y n̂ es mayor que
90◦ en el hemisferio izquierdo de S en la figura 7.1, i.e., en aquellos puntos
donde hay un flujo neto de carga hacia dentro de V , de manera que ~ · n̂ < 0.
Similarmente, el ángulo entre ~ y n̂ es menor que 90◦ en el hemisferio derecho
de S en la figura 7.1, i.e., en aquellos puntos donde hay un flujo neto de carga
hacia fuera de V , de manera que ~· n̂ > 0. Por lo tanto, la integral de superficie
en el segundo término de la ec. (7.40) representa la carga que sale de V menos
la carga que entra a V , i.e., el flujo neto de carga a través de S. Si hay un
aumento de carga dentro de V , el primer término en la ec. (7.40) será positivo
y el segundo negativo, porque está entrando más carga de la que sale; si hay
una disminución de carga dentro de V , el primer término en la ec. (7.40) será
negativo y el segundo positivo, porque está saliendo más carga de la que sale.
Ambos términos se compensan exactamente: la carga eléctrica se conserva.
La forma diferencial de la ecuación de continuidad muestra que la con-
servación de la carga es local: no es posible hacer desaparecer carga de un
lugar para simultáneamente hacerla aparecer en otro, porque eso violaría la
ec. (7.38).
Como la ec. (7.38) es tensorial, la conservación de la carga es válida en

130
todos los marcos de referencia inerciales.

La 4-corriente. Las componentes de la 4-corriente J µ = (ρ, ~) son la den-


v denota el campo de ve-
sidad de carga ρ y la densidad de corriente ~. Si ~
locidades de las cargas en movimiento, entonces podemos escribir ~ = ρ~ v.
Reemplazando en J , hallamos
µ

J µ = ρ (1, ~
v ) = ρ0 uµ , (7.41)
donde uµ = γ (1, ~v ) es el campo de 4-velocidades de las cargas en movimiento
y
ρ
ρ0 = (7.42)
γ
es la densidad propia de carga eléctrica. Para cada evento en el espacio-tiempo,
ρ0 corresponde a la densidad de carga eléctrica medida por un observador
comóvil con el flujo de carga en ese evento. A diferencia de la densidad de
carga ρ = J 0 , la densidad de carga propia ρ0 es un campo escalar, en cuyo
valor están de acuerdo todos los observadores inerciales.
Podemos entender la relación (7.42) entre ρ y ρ0 notando que el elemento
de carga dq = ρd V = ρ0 d V0 es un escalar. La contracción de la longitud a lo
largo de la dirección de movimiento tiene como consecuencia que el elemento
de volumen dV es más pequeño en un factor γ que el elemento de volumen
propio d V0 , dV = d V0 /γ. (El factor es γ, no γ3 , porque la contracción ocurre
solo en la dirección del movimiento, no en las direcciones perpendiculares).
Para preservar el valor de dq, la densidad de carga ρ debe ser mayor que la
densidad propia ρ0 en el mismo factor γ, ρ = γρ0 .

7.5. Fuerza de Lorentz


En Relatividad, la fuerza ejercida por el campo electromagnético sobre una
carga de prueba se cuantifica a través de una 4-fuerza F µ , que depende del
campo Fµν en el evento donde está la carga, del valor de la carga de prueba q
y de su 4-velocidad uµ . Básicamente la única expresión tensorial que puede
construirse a partir de estos elementos es
F µ = qF µν uν , (7.43)
que es, por supuesto, la relación correcta. Como uµ F µ = qF µν uµ uν = 0 (por-
que es la contracción de un tensor antisimétrico, F µν , con un tensor simétrico,

131
uµ uν ), concluimos que la 4-fuerza (7.43) no cambia la masa de las partículas
sobre las que actúa (ver sección 6.5).
La componente µ = 0 de la ec. (7.43) es

F 0 = qF 0ν uν = qF 0i ui = qγEi vi . (7.44)

Con [cf.ecs. (6.55)] F 0 = γd E/d t, hallamos

dE
= q E~ · ~
v, (7.45)
dt
donde E = p0 es la energía de la partícula. Esta ecuación nos dice que solo el
campo eléctrico, y no el campo magnético, realiza trabajo sobre la carga.
Las componentes µ = i de la ec. (7.43) son

F i = qF iν uν = qF i0 u0 + qF i j u j = qγEi vi + qγεi jk v j Bk . (7.46)

Con [cf.ecs. (6.55)] F i = γ f i , encontramos

f~ = q E~ + q~
v×B
~, (7.47)

que es la conocida
 expresión de Lorentz para la fuerza que un campo electro-
magnético E~, B~ ejerce sobre una carga puntual q que se mueve con veloci-
v.
dad ~
Para estudiar la acción de un campo electromagnético sobre una distribu-
ción continua de carga descrita por una 4-corriente J µ = (ρ, ~), resulta más
apropiado utilizar la densidad de 4-fuerza

ϕ µ = F µν Jν , (7.48)

cuyas componentes están dadas por

ϕ 0 = Ei ji , ϕ i = ρEi + εi jk j j Bk . (7.49)

7.6. Transformaciones de Lorentz para los cam-


pos eléctrico y magnético
Hasta ahora, nuestra exploración de la electrodinámica relativista nos ha
permitido comprender la covariancia de Lorentz de las distintas ecuaciones

132
electrodinámicas, como las ecuaciones de Maxwell, las transformaciones de
gauge, la ecuación de continuidad y la fuerza de Lorentz. En esta sección en-
contramos un resultado genuinamente nuevo: las leyes de transformación de
los campos eléctrico y magnético bajo un boost, que reemplazan a las ecuacio-
nes no relativistas (1.16).
La ley de transformación para el campo electromagnético F µν bajo una
transformación de Lorentz descrita por la matriz Λµν corresponde a la de un
tensor de orden 2,
F 0µν = Λµρ Λνσ F ρσ . (7.50)
Esta ecuación contiene toda la información que necesitamos para establecer
las leyes de transformación para los campos eléctrico y magnético.
Poniendo Ei = F 0i , Bi = 12 εi jk F jk , y similarmente para las cantidades pri-
madas respectivas, y desarrollando explícitamente las sumas sobre ρ y σ en la
ec. (7.50), hallamos
€ Š
Ei = Λ 0 Λ j − Λ 0 Λ j E j + ε jkl Λ0 j Λi k Bl ,
0 0 i i 0
(7.51)
j 1 j
Bi0 = εi jk Λ 0 Λk l El + εi jk εlmn Λ l Λk m Bn . (7.52)
2
Estas son las leyes de transformación generales para los campos eléctrico y
magnético bajo una transformación de Lorentz arbitraria.

Rotación espacial. En el caso de una rotación espacial, la matriz Λµν toma


la forma (ver ejemplo 4.53)

Λ00 = 1, Λ0 j = 0, (7.53)
Λi 0 = 0, Λi j = R i j , (7.54)

donde R ik R jk = δi j . En este caso, las ecs. (7.51)–(7.52) se reducen a


1
Ei0 = R i j E j , Bi0 = εi jk εlmn R jl R km Bn . (7.55)
2
Usando las propiedades del símbolo de Levi-Civita (ver sección 4.2, p. 64),
podemos simplificar la ecuación para el campo magnético, obteniendo

Ei0 = R i j E j , Bi0 = det (R) R i j B j . (7.56)

Esto significa que, bajo una rotación espacial R ∈ O (3), el campo eléctrico se
comporta como un vector y el campo magnético como un pseudovector.

133
Boost. Para un boost con velocidad vi = vni , la matriz Λµν toma la forma
(ver ejemplo 4.54)

Λ00 = γ, Λ0 j = −γv j , (7.57)


k
Λi 0 = −γvi , Λi j = Pi⊥j + γPi j , (7.58)

k
donde Pi j y Pi⊥j son los proyectores en las direcciones paralela y perpendicular
a ni ,
k
Pi j = ni n j , Pi⊥j = δi j − ni n j . (7.59)

En este caso, es posible demostrar que las ecs. (7.51)–(7.52) se reducen a


k
 k

Ei0 = Ei + γ Ei⊥ + εi jk v j Bk⊥ , Bi0 = Bi + γ Bi⊥ − εi jk v j Ek⊥ . (7.60)

Separando las ecuaciones para Ei0 y Bi0 en sus partes paralela y perpendicular a
la velocidad del boost, podemos escribir

E~k0 = E~k , E~⊥0 = γ E~⊥ + ~
v×B ~⊥ , (7.61)

B~0 = B ~k , B~0 = γ B v × E~⊥ .
~⊥ − ~ (7.62)
k ⊥

Estas son las leyes de transformación para los campos eléctrico y magnético
bajo un boost con velocidad ~v = v n̂.
En unidades convencionales, las ecs. (7.61)–(7.62) toman la forma

E~k0 = E~k , E~⊥0 = γ E~⊥ + ~
v×B ~⊥ , (7.63)
 ‹
1
B~0 = B ~k , ~0 = γ B
B ~⊥ − ~ v × E~⊥ , (7.64)
k ⊥
c2

donde c = 299 792 458 m/s. Cuando |~


v |  c, recuperamos la transformación
de Galileo (1.16),

E~0 = E~ + ~
v×B
~, ~0 = B
B ~. (7.65)

A diferencia de las leyes de transformación de Galileo, las leyes de trans-


formación relativistas son simétricas en los campos eléctrico y magnético. Las
componentes paralelas a la velocidad del boost permanecen invariantes, mien-
tras que las componentes perpendiculares se mezclan entre sí.

134
Ejemplo 7.3. Bajo un boost en dirección x, las componentes cartesianas de los
campos eléctrico y magnético cambian de acuerdo a las ecuaciones
 
E x0 = E x , E 0y = γ E y − vBz , Ez0 = γ Ez + vB y , (7.66)
 
B 0x = B x , B 0y = γ B y + vEz , Bz0 = γ Bz − vE y . (7.67)

Ejemplo 7.4. En K, el campo eléctrico es cero y el campo magnético solo tiene


componente z. ¿Cuánto valen los campos eléctrico y magnético en K 0 , si K y K 0
están en configuración estándar (cf. def. 3.3)? Usando las ecs. (7.66)–(7.67),
encontramos

E x0 = 0, E 0y = −γvBz , Ez0 = 0, (7.68)


B 0x = 0 B 0y = 0, Bz0 = γBz . (7.69)

Esto quiere decir que en K 0 , además del campo magnético existe también un
campo eléctrico.

7.7. Invariantes de Lorentz


En esta sección estudiamos cantidades construidas a partir de los campos
eléctrico y magnético que permanecen invariantes bajo una transformación de
Lorentz.
Como el campo electromagnético es un tensor de orden 2, cualquier con-
tracción de Fµν consigo mismo que no deje ningún índice libre debe ser un
escalar. Es posible demostrar que solo existen dos invariantes algebraicamente
independientes, que están dados por
1 1
E 2 − B 2 = − Fµν F µν , E~ · B
~ = − εµνρσ Fµν Fρσ , (7.70)
2 8
donde εµνρσ es el símbolo de Levi-Civita en 4 dimensiones, con ε0123 = 1. En
estricto rigor, E~ · B
~ es un pseudoescalar, que cambia de signo bajo una trans-
formación impropia.
La existencia de estos invariantes significa, en particular, que sin importar
cuánto cambien los campos eléctrico y magnético bajo el boost (7.61)–(7.62),
los valores que E 2 − B 2 y E~ · B
~ tengan en el marco K deben preservarse∗ en el
marco K 0 .

Note que un boost es una transformación de Lorentz propia, con det (Λ) = 1.

135
Ejemplo 7.5. En un marco K dado, tenemos E~ 6= 0, B ~ = 0. Con E 2 − B 2 > 0,
0 ~ 0 6= 0, pero siempre
E~ · B
~ = 0, concluimos que pueden existir marcos K donde B
debe cumplirse que E~0 · B
~ 0 = 0. No existe ningún marco K 0 donde E~0 = 0, B ~ 0 6= 0.
Ejemplo 7.6. Si E~ · B
~ 6= 0 en un marco K dado, entonces no existe ningún
0 0 ~ 0 = 0.
marco K donde E = 0 o B
~
Ejemplo 7.7. En un marco K dado, tenemos E 2 − B 2 < 0 y E~ · B
~ = 0. Deseamos
0 0
determinar si existe un marco K donde E~ = 0.
Asumimos tentativamente que K 0 existe y denotamos por ~ v su velocidad
respecto de K. Como E · B = 0, podemos usar E , B y E × B como una base
~ ~ ~ ~ ~ ~
v en la forma
ortogonal en la cual expandir ~
v = κ E~ + λB
~ ~ + µ E~ × B
~, (7.71)
v en esa base. Poniendo E~0 = 0 en la
donde κ, λ y µ son las componentes de ~
ec. (7.61), hallamos
E~k = 0, E~⊥ + ~
v×B
~⊥ = 0. (7.72)
La primera de estas ecuaciones establece que E~ no tiene ninguna componente a
lo largo de ~v , i.e., ~
v · E~ = 0. Como ~ v · E~ = κE 2 , concluimos que κ = 0. (Podemos
asumir que E~ 6= 0, porque si E~ = 0 el problema está trivialmente resuelto).
Con E~k = 0, E~⊥ = E~ y podemos reescribir la segunda de estas ecuaciones en la
forma
E~ + ~ v×B ~ = 0, (7.73)

donde hemos reemplazado B ~⊥ por B ~ apelando a que ~ v×B ~=~ v× B ~k + B
~⊥ =
v×B
~ ~⊥ . Usando la expansión (7.71) para ~ v , obtenemos

E~ + λB ~ + µ E~ × B ~ ×B ~ = 0. (7.74)
Notando que B ~×B~ = 0, desarrollando el doble producto cruz y recordando que

E · B = 0, encontramos que esta condición es equivalente a 1 − µB 2 E~ = 0, la
~ ~
cual se satisface solo si escogemos
1
µ= . (7.75)
B2
Esto significa que existe una familia de marcos K 0 , cuyas velocidades respecto
de K están dadas por
E~ × B
~
v = λB
~ ~+ , (7.76)
B2
con λ arbitrario, donde E~0 = 0.

136
7.8. Tensor momentum-energía
El campo electromagnético posee energía y momentum lineal propios, que
deben ser tomados en cuenta junto con la energía y el momentum lineal mecá-
nicos al escribir leyes de conservación para ambas cantidades. En Relatividad,
estos atributos del campo electromagnético se describen a través de un tensor
simétrico de rango 2, el tensor momentum-energía (en inglés, “stress-energy
tensor”) del campo electromagnético, Tµν .
En particular, el tensor momentum-energía del campo electromagnético ac-
túa como fuente del campo gravitacional en la teoría general de la relatividad,
curvando el espacio-tiempo de manera similar a una partícula masiva.
Vamos a deducir una expresión general para Tµν a partir de la densidad de
4-fuerza (7.48),
ϕ µ = F µν Jν . (7.77)
Usando las ecuaciones de Maxwell inhomogéneas (7.28) para reescribir la 4-
corriente en el lado derecho, encontramos

ϕ µ = ε0 F µν ∂ λ Fνλ . (7.78)

Integramos por partes∗ , antisimetrizamos y reorganizamos los índices:

ϕ µ = ε0 ∂ λ (F µν Fνλ ) − ε0 Fνλ ∂ λ F µν
1 
ϕ µ = ε0 ∂ λ (F µν Fνλ ) − ε0 Fνλ ∂ λ F µν − ∂ ν F µλ
2
€ Š 1 
ϕ µ = ε0 ∂λ F µν F νλ − ε0 Fνλ ∂ λ F µν + ∂ ν F λµ .
2
Usando las ecuaciones de Mawell homogéneas (7.29) para reescribir el segun-
do término, hallamos
€ Š 1
ϕ µ = ε0 ∂λ F µν F νλ + ε0 Fνλ ∂ µ F νλ . (7.79)
2
Integrando otra vez por partes en el segundo término y reorganizando los ín-

En este contexto, “integrar por partes” quiere decir tomar una expresión de la forma A∂µ B
y, usando la regla de Leibniz, reescribirla como A∂µ B = ∂µ (AB) − B∂µ A. Cuando A = B, esta

técnica nos permite escribir A∂µ A = 12 ∂µ A2 .

137
dices, obtenemos
€ Š 1 
ϕ µ = ε0 ∂λ F µν F νλ + ε0 ∂ µ Fνλ F νλ
 4 ‹
µ 1
ϕ = ε0 ∂ν F λ F + η Fρσ F
µ λν µν ρσ
.
4

Esta ecuación puede reescribirse en la forma

ϕ µ + ∂ν T µν = 0, (7.80)

donde T µν es el tensor momentum-energía del campo electromagnético,


 ‹
µ 1 µν
T = −ε0 F λ F + η Fρσ F
µν λν ρσ
. (7.81)
4
µ µ
Notando que F νλ F λµ = −F µλ F νλ = −F λ F νλ = F λ F λν , hallamos que T µν es
simétrico: T νµ = T µν . Una segunda propiedad importante de T µν es que su
traza es nula:
 ‹ € Š
µ 1 µ µ
T µ = −ε0 F λ F µ + δµ Fρσ F
µ λ ρσ
= −ε0 F λ F λµ − F ρσ F σρ = 0. (7.82)
4

En particular, T µµ = 0 significa que el campo electromagnético no posee escalas


invariantes de masa o energía, que podrían haber servido como una masa no
nula para el fotón.
Vamos a analizar una a una las componentes del tensor que acabamos de
definir.
Poniendo µ = ν = 0 en la ec. (7.81) y realizando las sumas indicadas,
hallamos
 ‹ 
00 0 1 00 1
T = −ε0 F λ F + η Fρσ F
λ0 ρσ
= ε0 E 2 + B 2 = u, (7.83)
4 2

la densidad de energía del campo electromagnético.


Con µ = 0, ν = i (o µ = i, ν = 0, ya que el tensor es simétrico), obtenemos
 ‹
0i 0 1 0i
T = −ε0 F λ F + η Fρσ F
λi ρσ
= ε0 εi jk E j Bk = Si , (7.84)
4
donde Si es conocido como vector de Poynting.

138
Finalmente, con µ = i, ν = j, encontramos
 ‹
ij i λj 1 ij
T = −ε0 F λ F + η Fρσ F ρσ
4
• ˜
i 0j i kj 1 2 2
= −ε0 F 0 F + F k F − δi j E − B
2
• ˜
1 2 2
= −ε0 Ei E j + εikl εk jm Bl Bm − δi j E − B .
2
Recurriendo a las propiedades del símbolo de Levi-Civita, podemos escribir
• ˜
ij 1 2 2
T = −ε0 Ei E j + Bi B j − δi j E + B = −σi j , (7.85)
2
donde σi j es llamado tensor de Maxwell.
Resumiendo, las componentes del tensor momentum-energía son
• ˜
u Sj
µν
[T ] = , (7.86)
Si −σi j

donde la densidad de energía u, el vector de Poynting Si y el tensor de Max-


well σi j están definidos como
1 
u = ε0 E 2 + B 2 , (7.87)
2
Si = ε0 εi jk E j Bk , (7.88)

σi j = ε0 Ei E j + Bi B j − uδi j . (7.89)

Estas tres cantidades nos permiten describir los flujos de energía y momentum
lineal entre el campo electromagnético y la materia, como veremos a continua-
ción.
∗ ∗ ∗

Nuestro desarrollo previo muestra que el tensor momentum-energía satis-


face [cf. ec. (7.80)]
ϕ µ + ∂ν T µν = 0, (7.90)

donde ϕ µ = E~ · ~, ρ E~ + ~ × B
~ es la densidad de 4-fuerza que el campo elec-
tromagnético ejerce sobre cargas y corrientes. La interpretación de las compo-
nentes del tensor momentum-energía está basada en las componentes de esta
ecuación.

139
La componente temporal de la ec. (7.90) puede escribirse en la forma

∂u
E~ · ~ + + ∇ · S~ = 0. (7.91)
∂t
Consideremos un sistema de campos y cargas en movimiento confinado al in-
terior de un volumen V . Integrando sobre V (ver sección 7.4), encontramos
Z Z I
d
E~ · ~dV + udV + S~ · n̂dA = 0, (7.92)
V
d t V S

donde S es la superficie que limita el volumen. En el lado izquierdo de es-


ta ecuación, el primer término representa el trabajo realizado por el campo
electromagnético sobre las cargas en movimiento, que es igual a la variación
temporal en la energía mecánica del sistema. Luego, los dos términos siguien-
tes deben también corresponder a variaciones en la energía. Interpretando u
como la densidad de energía electromagnética, el segundo término correspon-
de en efecto a su variación temporal. El tercer término, que compensa los otros
dos, es el flujo de energía a través de la superficie S que limita el sistema. Esto
quiere decir que el vector de Poynting S~ representa flujo de energía por uni-
dad de área, i.e., la cantidad de energía electromagnética que atraviesa una
superficie por unidad de tiempo.
Las componentes espaciales de (7.80) son

∂ Si
ϕi + − ∂ j σi j = 0. (7.93)
∂t
Integrando sobre V , hallamos
Z Z I
d
ϕi d V + Si dV − σi j n j dA = 0, (7.94)
V
dt V S

donde hemos utilizado una versión tensorial del teorema de la divergencia.


En el lado izquierdo de esta ecuación, el primer término representa la fuerza
electromagnética total que actúa sobre las cargas del sistema, que es igual al
cambio en su momentum lineal mecánico. Luego, los dos términos siguientes
deben también corresponder a variaciones en el momentum lineal del siste-
ma. Interpretando el vector de Poynting S~ como la densidad de momentum
lineal electromagnético, el segundo término corresponde en efecto a su varia-
ción temporal. El tercer término, que compensa los otros dos, es el flujo de

140
moméntum lineal a través de la superficie S que limita el sistema. Esto quiere
decir que la componente σi j del tensor de Maxwell puede interpretarse como
la densidad de flujo de la componente i del momentum lineal electromagnético
a través de una superficie perpendicular a x j .

Unidades electromagnéticas. Usando las mismas unidades (metro o segun-


do) para medir tiempos y distancias, tenemos cierta libertad para escoger las
unidades en que medimos las distintas cantidades electromagnéticas que in-
troducimos en este capítulo.
La carga eléctrica q se mide siempre en coulombios, C, con 1 C = 1 A s.
Las componentes de la 4-corriente, J µ = (ρ, ~), pueden medirse en C/m3 o
en A/m2 , con 1 C/m3 = 299 792 458 A/m2 . 
Las componentes del 4-potencial, Aµ = φ, A~ , pueden medirse en voltios,
V, con 1 V = 1 J/C, o en V s/m, con 1 V s/m = 299 792 458 V.
Con c = 1, el campo eléctrico y el campo magnético se miden en las mismas
unidades, que pueden escogerse como N/C o T, con 1 T = 299 792 458 N/C.
Las componentes del tensor momentum-energía,
• ˜
u Sj
µν
[T ] = , (7.95)
Si −σi j

se miden todas en las mismas unidades, que pueden escogerse como J/m3
(densidad de energía), kg/(m2 s) (densidad de momentum lineal), W/m2 (den-
sidad de flujo de energía) o kg/(s2 m) (densidad de flujo de momentum lineal),
con
1 kg kg J W
2
= 1 2 = 1 3 = 299 792 458 2 . (7.96)
299 792 458 m s s m m m
Estas diferentes elecciones hacen que, e.g., sea lícito interpretar el vector de
Poynting S~ tanto como densidad de flujo de energía o como densidad de mo-
mentum lineal.

7.9. Potenciales de Liénard–Wiechert


Los potenciales de Liénard–Wiechert permiten calcular el campo electromag-
nético producido por una carga puntual en movimiento arbitrario. En esta sec-
ción vamos a deducir estos potenciales a partir de un enfoque típicamente
relativista, sin resolver las ecuaciones de Maxwell.

141
P

Figura 7.2: Una carga puntual en movimiento arbitrario describe una línea de
mundo curva en el espacio-tiempo. El campo electromagnético en el evento P
está determinado por la velocidad y la aceleración de la carga puntual en el
evento retardado Q.

El campo electromagnético en el evento P de la figura 7.2 está determinado


por la velocidad y la aceleración de la carga puntual q en el evento retardado Q,
que se encuentra intersectando el cono de luz pasado de P con la línea de mun-
do de la carga puntual. Esto quiere decir que la separación espacio-temporal
entre Q y P es nula o tipo luz. La relación entre los eventos P y Q es un reco-
nocimiento a la velocidad finita, igual a la de la luz, con que se propagan los
efectos electromagnéticos.
Llamemos x µ a las coordenadas espacio-temporales de P y y µ (τ) a las coor-
denadas espacio-temporales de Q, donde τ es el tiempo propio que mide un
observador comóvil con la carga puntual. El 4-vector “desplazamiento” entre Q
y P es
Rµ = x µ − y µ (τ) = (t, ~r ) , (7.97)
donde t es el tiempo transcurrido entre ambos eventos y ~r es su separación
espacial. Como Rµ es tipo luz, tenemos

Rµ Rµ = −t 2 + r 2 = 0. (7.98)

El principio de causalidad exige que Q ocurra antes que P, por lo que debemos

142
tener t > 0. Luego, t = r > 0, y podemos escribir
Rµ = r (1, n̂) , (7.99)
donde n̂ = ~r /r es un vector unitario que apunta desde Q hacia P.
Sea K 0 el marco comóvil instantáneo de la carga puntual en el evento Q. En
este marco, el 4-potencial en P es el de Coulomb, i.e., el de una carga puntual
en reposo,
1 q
φ0 = , A~0 = 0, (7.100)
4πε0 r 0
donde r 0 es la distancia entre Q y P en el marco K 0 . Como φ 0 no depende
explícitamente del tiempo, este 4-potencial cumple el gauge de Lorenz (7.34).
La 4-velocidad de q en K 0 es u0µ = (1, 0, 0, 0), por lo que podemos escribir
1 q 1 q 0µ
A0µ = (1, 0, 0, 0) = u . (7.101)
4πε0 r 0 4πε0 r 0
A su vez, las componentes de Rµ en K 0 están dadas por R0µ = r 0 (1, n̂0 ). Luego,
r 0 = −u0µ R0µ , y obtenemos

q u0µ
A0µ = − . (7.102)
4πε0 u0σ R0σ
Siendo manifiestamente tensorial, esta ecuación conserva su forma en todos
los marcos∗ . Luego, podemos escribir el 4-potencial en un marco arbitrario K
en la forma
q uµ q uµ
Aµ = − = , (7.103)
4πε0 uσ Rσ 4πε0 D
donde hemos definido D = −uσ Rσ . Con uµ = d y µ /dτ = γ (1, ~
v ), tenemos
D = −uσ Rσ = γr (1 − n̂ · ~
v) . (7.104)
Explícitamente, los potenciales de Liénard–Wiechert en K son
1 q 1 q~
v
φ= , A~ = . (7.105)
4πε0 r (1 − n̂ · ~
v) 4πε0 r (1 − n̂ · ~
v)

Sean Aµ y B µ dos expresiones tensoriales distintas que coinciden con el 4-potencial de
Coulomb en K 0 , A0µ = B 0µ . Como la igualdad entre dos tensores se preserva bajo transfor-
maciones de Lorentz, estas dos expresiones tensoriales deben coincidir en todos los marcos,
Aµ = B µ . Esto significa que (7.102) es la única manera tensorial de escribir el 4-potencial de
Coulomb.

143
Figura 7.3: Las superficies equipotenciales de Liénard–Wiechert son elipsoides
de revolución de excentricidad v. En la figura se muestra la intersección de
estas superficies con un plano que contiene la velocidad de la partícula, que en
este caso tiene magnitud v = 3/5 y apunta hacia la derecha. Los círculos en
línea punteada representan el caso coulombiano, v = 0.

Estos potenciales nos permiten calcular el campo electromagnético generado


por una carga puntual en movimiento arbitrario, sin importar cuán cercana
sea su velocidad a la de la luz. Cuando |~ v |  1, recuperamos el potencial de
Coulomb. Como la condición de Lorenz es covariante, el 4-potencial (7.103)
satisface también esta condición de gauge en el marco K. En la figura 7.3 se
muestran algunas curvas con φ = const.
El campo electromagnético, Fµν = ∂µ Aν − ∂ν Aµ , involucra derivadas del 4-
potencial respecto de x µ . Si bien la 4-velocidad de la carga puntual no depende
explícitamente de x µ , sí existe una dependencia implícita que es necesario con-
siderar. Esto ocurre porque derivar respecto de x µ implica mover ligeramente
el punto P, lo cual a su vez implica mover también el evento retardado Q a
lo largo de la línea de mundo de la carga puntual, porque la separación tipo
luz entre ambos eventos debe preservarse. Esto quiere decir que la derivada
con respecto a x µ en P puede traducirse a una derivada con respecto a τ en Q.
Usando la regla de la cadena, hallamos
∂ ∂τ d d
∂µ = = = τµ , (7.106)
∂ xµ ∂ x µ dτ dτ
donde hemos llamado τµ = ∂µ τ. Para determinar τµ , calculamos las derivadas

144
de Rµ :
d yµ
∂ν Rµ = ∂ν [x µ − y µ (τ)] = δνµ − τν = δνµ − uµ τν . (7.107)

Recordando que Rµ Rµ = 0, encontramos
 
0 = ∂ν Rµ Rµ = 2Rµ ∂ν Rµ = 2Rµ δνµ − uµ τν , (7.108)

de donde obtenemos
Rµ Rµ
τµ = =− . (7.109)
uσ Rσ D
Luego, cuando derivemos cantidades definidas sobre la línea de mundo de la
carga puntual respecto de x µ , vamos a usar la relación
Rµ d
∂µ = − . (7.110)
D dτ
En particular, las derivadas de Rµ pueden escribirse en la forma
uµ R ν
∂ν Rµ = δνµ + . (7.111)
D
Habiendo aclarado estos preliminares, calculamos ahora ∂µ Aν :

u 
q q ∂µ ν D − uν ∂µ D
u
∂µ Aν = ∂µ ν = . (7.112)
4πε0 D 4πε0 D2
Usando la ec. (7.110), encontramos que las derivadas de la 4-velocidad son
Rµ duν Rµ αν
∂µ uν = − =− , (7.113)
D dτ D
donde αµ es la 4-aceleración de la carga puntual. Para calcular las derivadas
de D, usamos (7.111) y (7.113), recordando que uσ uσ = −1:

∂µ D = −∂µ (uσ Rσ )

= − ∂µ uσ Rσ − uσ ∂µ Rσ
 
Rµ ασ σ u σ
R µ
= R − uσ δµσ +
D D

= −uµ + (1 + ασ Rσ ) .
D

145
Reemplazando en ∂µ Aν , hallamos
§ • ˜ª
q 1 Rµ
∂µ Aν = −Rµ αν − uν −uµ + (1 + ασ R )
σ
4πε0 D2 D
 
q 1 Rµ ũν
= uµ uν − ,
4πε0 D2 D

donde, solo para abreviar, hemos llamado



ũµ = uµ + uµ ασ − uσ αµ Rσ . (7.114)

Antisimetrizando, encontramos el campo electromagnético Fµν :

q ũµ Rν − ũν Rµ
Fµν = . (7.115)
4πε0 D3

Aunque correcta, esta expresión no es particularmente reveladora. Evaluando


las componentes temporal y espaciales de ũµ , podemos obtener formas más
explícitas para el campo eléctrico y el campo magnético.
Calculamos en primer lugar el producto ασ Rσ , con [cf. ec. (5.20)] α0 =
γ4 vk ak , αi = γ4 vk ak vi + γ2 ai y [cf. ec. (7.99)] R0 = r, Ri = r ni :

ασ Rσ = −γ4 vk ak r + γ4 vk ak vi + γ2 ai r ni = γ2 r nk ak − γ3 vk ak D. (7.116)

Con este resultado, determinamos ahora las componentes de ũµ = uµ + αµ D +


uµ ασ Rσ ,

ũ0 = −γ 1 + γ2 r nk ak , ũi = γ2 Dai − ũ0 vi . (7.117)

Reemplazando estas componentes en Ei = Fi0 , encontramos que el campo eléc-


trico está dado por
 
q ũi R0 − ũ0 R i q 1 + γ2 r n j a j ai
Ei = = (ni − vi ) − .
4πε0 D3 4πε0 γ2 r 2 (1 − nk vk )3 r (1 − nk vk )2
(7.118)
El campo magnético, Bi = (1/2) εi jk F jk , puede determinarse a partir de

q ũ j R k
Bi = εi jk 3 = εi jk n j Ek . (7.119)
4πε0 D

146
P

n̂ ~r
n̂ − ~
v r (n̂ − ~
v)

v
~ Q r~
v Q0

Figura 7.4: Dos triángulos equivalentes para ilustrar la dirección del término
estático del campo eléctrico en la ec. (7.120).

Nuestro resultado puede resumirse en las ecuaciones


 
q 1 + γ2 r n̂ · a~ a~
E~ = v) −
(n̂ − ~ , B
~ = n̂ × E~. (7.120)
4πε0 γ2 r 2 (1 − n̂ · ~ v )3 v )2
r (1 − n̂ · ~

El campo eléctrico en la ec. (7.120) tiene dos partes; una “estática”, que va en
la dirección de n̂ − ~
v , y una de radiación, que va en la dirección de a~. Como se
sugiere en la figura 7.4, la parte estática del campo eléctrico apunta desde Q0 ,
no desde Q, hacia P, donde Q0 es la posición que tendría la carga puntual si
continuase moviéndose con velocidad constante desde Q durante un tiempo
t = r. Este término estático sobrevive incluso si a~ = 0, en cuyo caso es inver-
samente proporcional al cuadrado de la distancia entre Q y P. El término de
radiación existe solo si la carga puntual acelera, y es inversamente proporcio-
nal a la distancia entre Q y P. Esto significa que disminuye más lentamente que
el término estático, contribuyendo así a la emisión de radiación electromagné-
tica. Solo una carga acelerada radía; una carga en reposo o en movimiento
con velocidad constante produce un campo que disminuye demasiado rápido
con la distancia. En cambio, el campo de radiación producido por una carga
acelerada puede detectarse arbitrariamente lejos de la carga.

147
Bibliografía

[1] W. Rindler, Introduction to Special Relativity, 2.a ed. (Oxford University


Press, 1991).
[2] E. F. Taylor y J. A. Wheeler, Spacetime Physics, 2.a ed. (W. H. Freeman,
1992), http://www.eftaylor.com/spacetimephysics/.
[3] N. D. Mermin, It’s About Time, Understanding Einstein’s Relativity (Prin-
ceton University Press, 2005).
[4] G. Preti, F. de Felice y L. Masiero, «On the Galilean non-invariance of
classical electromagnetism», Eur. J. Phys. 30, 381-391 (2009).
[5] A. P. French, Special Relativity, The MIT Introductory Physics Series (W.
W. Norton & Company, Inc., 1968).
[6] M. G. Aartsen y col., «Neutrino Interferometry for High-Precision Tests
of Lorentz Symmetry with IceCube», Nature Phys. 14, 961-966 (2018),
arXiv:1709.03434 [hep-ex].
[7] M. Mewes, «Special relativity validated by neutrinos», Nature 560, 316-317
(2018).
[8] H. A. Lorentz, A. Einstein, H. Minkowski y H. Weyl, The Principle of Re-
lativity, A collection of original memoirs on the special and general theory
of relativity (Dover, 1952).
[9] A. Pais, Subtle is the Lord, The Science and the Life of Albert Einstein (Ox-
ford University Press, 2005).
[10] Bureau international des poids et mesures, The International System of
Units (SI), 2019, https://www.bipm.org/en/publications/si-
brochure/.
[11] H. Minkowski, Raum und Zeit (B. G. Teubner, Leipzig, 1909), https:
//de.wikisource.org/wiki/Raum_und_Zeit_(Minkowski).

148
[12] B. Coll y F. San José Martínez, «Composition of Lorentz Transformations
in Terms of Their Generators», Gen. Rel. Grav. 34, 1345-1356 (2002),
arXiv:gr-qc/0106052 [gr-qc].
[13] J. L. Synge y A. Schild, Tensor Calculus (Dover, 1978).
[14] D. Lovelock y H. Rund, Tensors, Differential Forms, and Variational Prin-
ciples, Dover Books on Mathematics (Dover, 1989).
[15] D. C. Kay, Tensor Calculus, Schaum’s Outlines (McGraw-Hill Education,
2011).
[16] A. Einstein, «Die Grundlage der allgemeinen Relativitätstheorie», Ann.
Phys. 49, 769-822 (1916).
[17] H. Flanders, Differential Forms with Applications to the Physical Sciences
(Dover, 1989).
[18] C. W. Misner, K. S. Thorne y J. A. Wheeler, Gravitation (W. H. Freeman
& Company, 1973).
[19] L. B. Okun, «The Concept of Mass», Physics Today 42, 31-36 (1989).
[20] L. B. Okun, «The concept of mass (mass, energy, relativity)», Soviet Phy-
sics Uspekhi 32, 629-638 (1989).

149

También podría gustarte