Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Notas de Clase∗
Eduardo Rodríguez
Departamento de Física
Universidad Nacional de Colombia
18 de junio de 2020
∗
Notas de clase en proceso de construcción. Use bajo su propio riesgo. Si encuentra
un error en estas notas, o si tiene comentarios o sugerencias, le agradecería comuni-
cármelo al email eduarodriguezsal@unal.edu.co.
Capítulo 2
13
aplicada a las ecuaciones de Maxwell predice que observadores en movimiento
relativo medirán distintas velocidades para la luz, de la misma manera como
medirán distintas velocidades para cualquier partícula en movimiento. Esto es
una consecuencia directa del hecho que, de acuerdo a la transformación de
Galileo, las leyes del electromagnetismo no son las mismas para estos dos ob-
servadores. La única manera de compatibilizar los dos principios de Einstein
consiste en abandonar la transformación de Galileo. Crucialmente, es necesa-
rio abandonar la idea del tiempo absoluto implícita en esta transformación.
En este capítulo analizamos las consecuencias más importantes de estos
principios.
14
B
? A ?
A
B
Este análisis es simple pero demoledor: Bob afirma que los dos eventos son
simultáneos, y Alice no está de acuerdo. La aparente paradoja no tiene solu-
ción; simplemente, debemos aceptar que los principios de Einstein implican
que el concepto de simultaneidad es relativo, es decir, dependiente del obser-
vador.
15
una longitud menor que la longitud verdadera del tren.
Esta contracción de la longitud es un efecto relativista directamente relacio-
nado con la relatividad de la simultaneidad. Para medir la longitud de un objeto
en movimiento, debe determinarse la posición de sus extremos en un mismo
instante de tiempo, es decir, simultáneamente. Como dos eventos simultáneos
para Bob no lo son necesariamente para Alice, las mediciones de la longitud
diferirán entre ambos observadores.
Alice, en reposo con respecto del tren, mide su longitud propia, que es siem-
pre mayor a la longitud medida por cualquier otro observador en movimiento
relativo.
16
2.3. Dilatación del tiempo
La velocidad de la luz. Un reloj de luz es, conceptualmente al menos, el
más simple de los relojes. Consiste en dos espejos paralelos, separados por una
distancia fija, entre los cuales rebota un rayo de luz. Cada impacto del rayo de
luz en uno de los espejos corresponde a un “tic” o un “tac” del reloj.
Supongamos, para fijar ideas, que la distancia entre los espejos que forman
el reloj de luz es igual a 3 metros. Esto significa que el tiempo que tarda un rayo
de luz en ir de un espejo al otro es de, aproximadamente, 10 ns. De acuerdo
al principio de constancia de la velocidad de la luz, c ≈ 3 × 108 m/s es una
constante fundamental, la misma para todos los observadores. Podemos por
lo tanto, sin ambigüedad, afirmar que la distancia entre los dos espejos es de
10 ns. Esta afirmación tiene una sola interpretación posible: el tiempo que tarda
un rayo de luz en ir de un espejo a otro es igual a 10 ns, y esta información
nos permite calcular la distancia entre los espejos (en metros, por ejemplo) de
manera inequívoca.
Medir la distancia en unidades de tiempo (e.g., nanosegundos) no es algo
ajeno a nuestra experiencia. Es común, por ejemplo, decir “vivo a 45 minutos
de la Universidad”, o “la casa de mis padres queda a dos horas de Bogotá”.
En ambos casos existe una velocidad implícita que permite traducir tiempo a
distancia (en estos ejemplos, la velocidad promedio de un bus, seguramente).
La velocidad de la luz, al ser la misma para todos los observadores, provee de
un factor de conversión universal entre tiempo y distancia.
Este rol de factor de conversión de unidades para la velocidad de la luz está
reconocido explícitamente en la definición moderna de metro [10]:
El metro, símbolo m, es la unidad SI de longitud. Se define tomando
el valor numérico exacto de la velocidad de la luz en el vacío c
como 299 792 458 cuando se expresa en la unidad m s−1 , donde el
segundo está definido en términos de la frecuencia del cesio ∆νCs .
Esto quiere decir que, por definición, 1 metro es la distancia recorrida por un
rayo de luz en el vacío en un intervalo de tiempo de 1/299 792 458 segundos.
Por completitud, la definición moderna de segundo es [10]:
El segundo, símbolo s, es la unidad SI de tiempo. Se define tomando
el valor numérico exacto de la frecuencia del cesio ∆νCs , la frecuen-
cia de transición hiperfina del estado fundamental no perturbado
del átomo de cesio-133, como 9 192 631 770 cuando se expresa en
la unidad Hz, que es igual a s−1 .
17
De estas definiciones resulta que la velocidad de la luz en el vacío es igual a
299 792 458 metros por segundo exactamente, i.e., c = 299 792 458 m/s.
Nosotros vamos a llevar esta equivalencia a su conclusión lógica, definien-
do un “segundo de distancia” como la distancia recorrida en el vacío por la luz
durante un intervalo de tiempo de un segundo. Similarmente, definimos un
“metro de tiempo” como el tiempo necesario para que la luz recorra una distan-
cia de un metro en el vacío. Con estas definiciones, podemos escoger la misma
unidad (metro o segundo) para medir tiempos y distancias. Una consecuencia
inmediata es que la velocidad de la luz resulta ser igual a 1 (adimensional):
Dicho de otra manera, 1 s = 299 792 458 m, y 1 m = 1/299 792 458 s. Usando
las mismas unidades para tiempo y espacio, todas las velocidades resultan ser
adimensionales, debiendo ser interpretadas como fracciones de la velocidad
de la luz.
Volviendo a nuestro reloj de luz, podemos decir que el tiempo que tarda el
rayo de luz en ir de un espejo a otro es de 3 metros.
∗ ∗ ∗
Montada en un tren muy rápido, Alice estudia el reloj de luz ubicado sobre
la mesita frente a su asiento. Definimos E como el evento donde el rayo de luz
es emitido desde el espejo inferior, y R como el evento donde el rayo de luz
es recibido en el mismo espejo inferior, luego de haber sido reflejado una vez
en el espejo superior. Para Alice, ambos eventos ocurren en el mismo punto en
el espacio (el reloj de luz está en reposo respecto de Alice), y el tiempo que
transcurre entre uno y otro es de 6 metros:
∆x 0 = 0, ∆t 0 = 6 m. (2.2)
Usamos variables primadas para denotar las cantidades medidas por Alice (en
el marco K 0 ) y variables no primadas para denotar aquellas medidas por Bob
(en el marco K), quien, por supuesto, está observando toda la escena desde
el andén. En la figura 2.2 se muestra la trayectoria seguida por el rayo de
luz entre los eventos E y R de acuerdo a Bob. Para Bob, la separación espacial
entre E y R es igual a la distancia recorrida por el tren entre ambos eventos. Esta
distancia debe ser mayor que seis metros, puesto que, según Bob, el rayo de
18
4m 4m
5m 5m ∆t
3m ∆t 0
E R ∆x
Figura 2.2: Izquierda: Bob, observando el reloj de luz de Alice desde el andén,
percibe que el rayo de luz sigue la trayectoria que se muestra en la figura.
Derecha: triángulo equivalente usado para cuantificar la dilatación del tiempo.
luz recorre una distancia mayor que los seis metros medidos por Alice. Fijemos
la velocidad del tren de modo tal que su desplazamiento entre los eventos E
y R, medido por Bob, sea de 8 metros. Entonces, el teorema de Pitágoras nos
permite calcular que el tiempo transcurrido entre ambos eventos, de acuerdo
a Bob, es de 10 metros:
∆x = 8 m, ∆t = 10 m. (2.3)
En particular, esto significa que la velocidad del tren (medida por Bob) es v =
∆x/∆t = 0,8, i.e., el 80 % de la velocidad de la luz.
Decimos que el intervalo de tiempo entre los eventos E y R medido por Ali-
ce es un intervalo de tiempo propio, pues, para Alice, ambos eventos ocurren
en un mismo punto del espacio (∆x 0 = 0). Bob, en cambio, mide un intervalo
de tiempo mayor. Esta es la dilatación del tiempo, un efecto relativista insepa-
rable de la contracción de la longitud, y, al igual que esta, una consecuencia
inevitable de la relatividad de la simultaneidad.
19
10
1
γ= p
1 − v2
Factor de Lorentz, γ 5
1
0 0,2 0,4 0,6 0,8 1
Magnitud de la velocidad, v
∆t = γ∆t 0 , (2.5)
20
Esta diferencia alcanza un 1 % recién cuando v ≈ 1/7. Esto quiere decir que
si tomamos como referencia este valor para decidir cuándo se hace necesario
reemplazar la mecánica de Newton con la mecánica relativista, el umbral de
velocidad está en torno a un 14 % de la velocidad de la luz.
(recuerde que ∆x 0 = 0 en este caso). Esto significa que existe una cantidad
invariante, que tanto Alice como Bob pueden calcular a partir de las mediciones
hechas en sus marcos de referencia correspondientes, y en cuyo valor ambos
están de acuerdo.
Definición 2.3 (Intervalo espacio-temporal). Sean ∆t y ∆x las separaciones
temporal y espacial, respectivamente, entre dos eventos medidas en un marco
de referencia K. El intervalo espacio-temporal ∆s2 entre ambos eventos está
definido mediante la ecuación
Note que, a pesar de la notación utilizada, ∆s2 puede ser positivo, negativo, o
cero, incluso para eventos no coincidentes.
En 1908, Hermann Minkowski descubrió que la recién formulada teoría es-
pecial de la relatividad de Einstein podía entenderse como la física en lo que
hoy llamamos el espacio-tiempo de Minkowski: un espacio de cuatro dimensio-
nes, donde cada punto, llamado “evento”, es determinado por las coordenadas
(t, x, y, z), y la distancia, o intervalo espacio-temporal, entre dos eventos infi-
nitesimalmente cercanos puede calcularse a partir de la expresión
ds2 = −d t 2 + d x 2 + d y 2 + dz 2 . (2.10)
21
La presencia del signo menos delante de d t 2 en la ec. (2.10) hace que el
espacio-tiempo de Minkowski difiera de maneras importantes de R4 , donde
este signo menos no aparece. Minkowski mismo no escatimó palabras para
resaltar la importancia de su descubrimiento (mi traducción):
Las opiniones sobre el espacio y el tiempo que deseo exponerles
han crecido en el suelo de la física experimental. En ella yace su
fortaleza. Son de tendencia radical. De ahora en adelante, el espa-
cio por sí mismo y el tiempo por sí mismo deben reducirse comple-
tamente a sombras, y solo una especie de unión entre ambos habrá
de conservar independencia.
Hermann Minkowski, 1908 [11].
A menudo representamos el espacio-tiempo en un plano bidimensional,
donde tradicionalmente el tiempo t apunta hacia arriba y escogemos una di-
mensión espacial, por ejemplo, x, apuntando hacia la derecha. En esta repre-
sentación, que llamamos un diagrama espacio-temporal, se ignoran siempre dos
direcciones espaciales.
En el diagrama espacio-temporal de la figura 2.4, el origen del sistema coor-
denado, O, de coordenadas t = 0, x = 0, sirve como evento de referencia. Un
rayo de luz que pase por O sigue una de las líneas punteadas, según vaya hacia
la izquierda o hacia la derecha. En general, el lugar geométrico de todos los
rayos de luz que pasan por O es llamado el cono de luz de O. La denominación
“cono” proviene de la imagen mental de estos rayos de luz cuando incluimos
una dimensión espacial extra en el diagrama.
El cono de luz define la estructura causal del espacio-tiempo. El evento A,
por ejemplo, queda en el futuro de O, porque es posible llegar desde O a A
viajando a una velocidad menor que la de la luz. Esto significa que es posible
que exista una relación causal entre O y A, vale decir, que lo que ocurra en O sea
la causa de lo que ocurra en A. Similarmente, el evento C queda en el pasado
de O. En cambio, no es posible para O tener influencia alguna sobre lo que
ocurra en B, porque no hay manera de transferir información entre ambos a
una velocidad menor que la de la luz. Tampoco puede existir conexión causal
entre D y O.
Definición 2.4 (Separación tipo tiempo). Decimos que dos eventos tienen una
separación tipo tiempo si su separación espacial, ∆~r , tiene una magnitud menor
que su separación temporal, ∆t. En este caso, |∆~r | < |∆t|, o, equivalentemen-
te, ∆s2 < 0.
22
t
A
B
Definición 2.5 (Separación tipo espacio). Decimos que dos eventos tienen una
separación tipo espacio si su separación espacial, ∆~r , tiene una magnitud ma-
yor que su separación temporal, ∆t. En este caso, |∆~r | > |∆t|, o, equivalente-
mente, ∆s2 > 0.
Definición 2.6 (Separación nula o tipo luz). Decimos que dos eventos tienen
una separación nula o tipo luz si su separación espacial, ∆~r , tiene la misma
magnitud que su separación temporal, ∆t. En este caso, |∆~r | = |∆t|, o, equi-
valentemente, ∆s2 = 0. Note que dos eventos distintos pueden tener una se-
paración nula o tipo luz.
Dos eventos cuya separación sea tipo tiempo pueden tener una conexión
causal. En cambio, dos eventos cuya separación es tipo espacio siempre están
desconectados causalmente. Como las definiciones 2.4–2.6 hacen referencia
al signo del intervalo espacio-temporal entre dos eventos, ellas permanecen
válidas en todos los marcos de referencia inerciales. Esto significa que si dos
eventos tienen una separación tipo tiempo en un marco K dado, entonces tie-
nen también una separación tipo tiempo en cualquier marco K 0 que se mueva
con velocidad constante respecto de K, y similarmente para los casos de sepa-
raciones tipo espacio y nulas o tipo luz.
Cuando dos eventos tienen una separación tipo tiempo, el intervalo espacio-
temporal entre ellos es esencialmente equivalente a un intervalo de tiempo
23
propio, ∆s2 = −∆τ2 (ver definición 2.2). En efecto, cuando ∆s2 < 0 siempre
es posible encontrar un marco K 0 donde los dos eventos ocurren en el mismo
2
punto del espacio, de manera que ∆s02 = −∆t 02 + |∆~r 0 | = −∆t 02 .
24
A
B ?
25
mes. Para Bob, han transcurrido 8,5 años. ¿Cómo interpreta Alice lo que ve
cuando llega a la Tierra? Luego de un viaje de un mes, ella retorna a una Tierra
donde han transcurrido ocho años y medio. Alice ha efectivamente viajado al
futuro, ocho años y cinco meses hacia el futuro. Si Alice desear viajar cien años
hacia el futuro, también puede hacerlo. Para ello, debe dirigirse a una estrella
ubicada a 50 años-luz de distancia y viajar muy rápido, a una velocidad muy
cercana a la de la luz. Por ejemplo, con v = 0,999 999 5, el factor de Lorentz
llega a γ = 1000. Esto significa que el viaje de ida y vuelta tarda 36,5 días para
Alice, un mes largo, y cuando regresa, en la Tierra han transcurrido cien años.
Puede ser que Bob ya no esté presente para darle la bienvenida.
26
Capítulo 3
Transformaciones de Lorentz
ds2 = −d t 2 + d x 2 + d y 2 + dz 2 , (3.1)
s2 = −t 2 + x 2 + y 2 + z 2 , (3.2)
27
más general que deja invariante la distancia al origen s, con s2 = x 2 + y 2 + z 2 .
En R3 , distinguimos tres rotaciones independientes, cada una de ellas confina-
da a los planos x y, yz, y z x (o, equivalentemente, respecto de los ejes z, x,
y y). En el espacio-tiempo de Minkowski, debemos añadir “rotaciones” confi-
nadas a los planos t x, t y, y tz, entendidas como las transformaciones lineales
más generales que dejan invariante el intervalo espacio-temporal (3.2). La si-
militud entre ambos conjuntos de transformaciones no es solo formal. En las
próximas secciones vamos a usar esta similitud para deducir la forma explícita
de las rotaciones en los planos t x, t y, y tz, llamadas boosts.
28
~r ~r
y y
~r 0
y0
y0
θ
x0 θ
θ
x x x0
29
como una única rotación en el mismo plano. Equivalentemente, el producto de
dos matrices ortogonales con determinante uno produce siempre otra matriz
ortogonal con determinante uno. La propiedad de asociatividad se hereda di-
rectamente de la asociatividad del producto matricial. La rotación en un ángulo
θ = 0, representada como la matriz identidad, corresponde al elemento iden-
tidad del grupo. Finalmente, toda rotación en un ángulo θ puede deshacerse
a través de una rotación en un ángulo −θ ; en efecto, [R (θ )]−1 = R (−θ ).
El grupo SO(2), con infinitos elementos (tantos como ángulos θ existen
entre 0 y 2π), es uno de los ejemplos más simples de un grupo de Lie. La pro-
piedad clave de un grupo de Lie es que sus elementos (matrices de rotación
R, en este caso) son funciones analíticas de un número finito de parámetros
reales (solo uno en este caso, el ángulo θ ). Muchas de las propiedades de un
grupo de Lie pueden deducirse estudiando elementos ubicados infinitesimal-
mente cerca de la identidad, lo cual corresponde, en nuestro caso, a rotaciones
infinitesimales.
Si el ángulo de rotación es pequeño, |θ | 1, podemos escribir, a primer
orden en θ ,
1 θ 1 0 0 1
R (θ ) = = +θ = 1 + θ J, (3.7)
−θ 1 0 1 −1 0
Esta serie no solo converge siempre, para cualquier matriz M , sino que exp (M )
resulta ser una matriz invertible, con [exp (M )]−1 = exp (−M ).
30
La siguiente identidad es una propiedad clave de la exponencial matricial:
∗ ∗ ∗
De aquí obtenemos inmediatamente todas las potencias, las que resulta conve-
niente separar en pares e impares:
31
Reconociendo en estas expresiones las series de Taylor para cos θ y sin θ , po-
demos escribir∗
cos θ sin θ
exp (θ J) = 1 cos θ + J sin θ = = R (θ ) . (3.14)
− sin θ cos θ
x 0 = x + θ y, (3.15)
0
y = y − θ x. (3.16)
x 02 + y 02 = (x + θ y)2 + ( y − θ x)2
= x 2 + 2θ x y + y 2 − 2θ x y + O θ 2
= x2 + y2 + O θ 2 .
32
en el plano x y [cf. ecs. (3.15)–(3.16)], vamos a probar la transformación infi-
nitesimal
t 0 = t + φ x, (3.17)
0
x = x − φ t, (3.18)
−t 02 + x 02 = − (t + φ x)2 + (x − φ t)2
= −t 2 − 2φ t x + x 2 − 2φ t x + O φ 2
= −t 2 + x 2 − 4φ t x + O φ 2 .
Este primer intento falla, pero nos sugiere cómo modificar la transformación.
Como segundo intento, probamos
t 0 = t − φ x, (3.19)
0
x = x − φ t, (3.20)
−t 02 + x 02 = − (t − φ x)2 + (x − φ t)2
= −t 2 + 2φ t x + x 2 − 2φ t x + O φ 2
= −t 2 + x 2 + O φ 2 .
33
La matriz K es el generador de rotaciones en el plano t x.
Calculamos ahora la exponencial matricial exp (φK), que debería entregar-
nos la transformación finita. Usando la definición (3.9), escribimos
X
∞
φn φ2 2 φ3 3
n
exp (φK) = K = 1 + φK + K + K + ··· . (3.24)
n=0
n! 2! 3!
de donde hallamos
K 2n = 1, K 2n+1 = K, (3.26)
Esta es la matriz para una rotación finita con parámetro φ en el plano t x, que
llamamos un “boost” en dirección x. Para comprobar que esta transformación
en efecto deja invariante el intervalo espacio-temporal, tomamos la transfor-
mación explícita,
34
y reemplazamos en s2 = −t 2 + x 2 :
−t 02 + x 02 = − (t cosh φ − x sinh φ)2 + (−t sinh φ + x cosh φ)2
= −t 2 cosh2 φ + 2t x sinh φ cosh φ − x 2 sinh2 φ+
+ t 2 sinh2 φ − 2t x sinh φ cosh φ + x 2 cosh2 φ
= −t 2 + x 2 cosh2 φ − sinh2 φ
= −t 2 + x 2 .
Esto concluye nuestra búsqueda. Hemos hallado una transformación lineal en
el plano t x que depende de un parámetro φ y que preserva el intervalo espacio-
temporal entre eventos. Pero, ¿qué significa?
Para poder interpretar el boost (3.28)–(3.29), necesitamos partir recordan-
do qué se supone que debe representar. Aunque dedujimos la transformación
por analogía con las rotaciones en el plano x y, la interpretación física que esta-
mos buscando es la de dos sistemas inerciales, K y K 0 , que se mueven con velo-
cidad relativa constante V~ . Como nuestra transformación solo involucra t y x,
es claro que V~ debe ser paralela al eje x. Poniendo x 0 = 0 en la ec. (3.29), ha-
llamos la ecuación de movimiento para el origen del sistema K 0 : x = t tanh φ.
Esta ecuación describe un movimiento en línea recta con velocidad constante
dada por∗ (ver figura 3.2)
V = tanh φ. (3.30)
Llamando [cf. ec. (2.6)]
1
γ = cosh φ = p , (3.31)
1 − V2
podemos reescribir las ecs. (3.28)–(3.29) en la forma
t 0 = γ (t − V x) , (3.32)
0
x = γ (x − V t) . (3.33)
Escrita de esta forma, es claro que el boost reemplaza a la transformación de
Galileo, por lo menos en el caso cuando la velocidad entre los marcos es para-
lela al eje x. Para hacer más fácil la comparación, reintroducimos c:
0 Vx
t =γ t− 2 , (3.34)
c
x 0 = γ (x − V t) . (3.35)
∗
En inglés, φ es a menudo llamado “rapidity”. No conozco un término equivalente en
español que sea de uso generalizado.
35
1
0,5
0
V
−0,5
−1
−3 −2 −1 0 1 2 3
φ
t 0 = t, (3.36)
0
x = x − V t. (3.37)
36
eventos P y Q, ∆t = t Q − t P , ∆x = x Q − x P :
Dilatación del tiempo. Alice mide el tiempo ∆t 0 transcurrido entre dos tics
sucesivos del reloj de luz, que para ella ocurren en el mismo lugar, ∆x 0 = 0.
Bob no está de acuerdo. Él mide una separación espacial ∆x = V ∆t entre
los eventos. Reemplazando en la ec. (3.38), hallamos ∆t 0 = γ 1 − V 2 ∆t =
∆t/γ. Esto quiere decir que el tiempo medido por Bob es mayor que el medido
por Alice: ∆t = γ∆t 0 .
t0
t 0 = const. ⇒ t= + V x, (3.40)
γ
x0 x
x 0 = const. ⇒ t =− + . (3.41)
γV V
37
los marcos. Cuando V → 1, los ejes primados tienden ambos a la línea diago-
nal t = x. Note que es incorrecto interpretar φ como el ángulo (euclidiano)
entre ejes primados y no primados.
De acuerdo al punto de vista activo, las ecs. (3.32)–(3.33) relacionan las
coordenadas espacio-temporales de dos eventos P y Q en un mismo marco iner-
cial K. Para encontrar las coordenadas de Q, usamos las hipérbolas invariantes
que se muestran en la figura 3.4:
− t 02 + x 02 = −t 2 + x 2 = const. (3.42)
La invariancia del intervalo espacio-temporal nos garantiza que ambos eventos
pueden ser hallados sobre la misma hipérbola invariante.
38
t0
t
x0
39
t, t 0
x, x 0
40
Este cálculo nos muestra que la matriz que media la transformación compuesta
corresponde también a un boost, con parámetro φ3 = φ1 +φ2 . Esto quiere decir
que la velocidad de K 00 respecto de K es
tanh φ1 + tanh φ2 V1 + V2
V3 = tanh φ3 = tanh (φ1 + φ2 ) = = . (3.45)
1 + tanh φ1 tanh φ2 1 + V1 V2
Ejemplo 3.4. Alice se aleja de la Tierra a bordo de una nave espacial que se
mueve con velocidad V1 = 0,8 respecto de Bob, quien ha decidido quedarse en
la Tierra. La hermana menor de Alice, Carmen, quien va también en la nave, se
monta en una pequeña sonda que se mueve en la misma dirección que la nave
mayor. La velocidad de Carmen respecto de Alice es V2 = 0,7. Para calcular la
velocidad de Carmen respecto de Bob, usamos la ec. (3.45):
V1 + V2 1,50
V3 = = = 0,961 54. (3.46)
1 + V1 V2 1,56
γ3 = cosh φ3
= cosh (φ1 + φ2 )
= cosh φ1 cosh φ2 + sinh φ1 sinh φ2
= cosh φ1 cosh φ2 (1 + tanh φ1 tanh φ2 )
= γ1 γ2 (1 + V1 V2 ) .
41
tanto por K como por K 0 . Este reinterpretación motiva el siguiente cambio de
notación:
V1 = V, V2 = v 0 , V3 = v, (3.47)
0
γ1 = Γ , γ2 = γ , γ3 = γ. (3.48)
Aquí, usamos una v minúscula para la velocidad de la partícula (v en K y v 0
en K 0 ) y una V mayúscula para la velocidad entre los marcos, y similarmen-
te para los factores de Lorentz asociados. Con esta nueva notación, podemos
escribir
v0 + V
v= , (3.49)
1 + V v0
γ = Γ γ0 1 + V v 0 . (3.50)
Reconocemos este par de ecuaciones como la transformación de velocidades
inversa, i.e., la que nos da la velocidad (y el factor de Lorentz) en K a partir de
las cantidades relevantes en K 0 . Para obtener la transformación directa, sim-
plemente reemplazamos V por −V e intercambiamos cantidades primadas con
cantidades no primadas:
v−V
v0 = , (3.51)
1−Vv
γ0 = Γ γ (1 − V v) . (3.52)
Note que estas ecuaciones son válidas para una partícula que se mueve en la
dirección x y para un boost en la misma dirección. Si el movimiento de la
partícula abarca dos o tres dimensiones, manteniendo el boost en dirección x,
entonces las ecuaciones siguen siendo válidas, con las siguientes modificacio-
nes:
vx − V
vx0 = , (3.53)
1 − V vx
γ0 = Γ γ (1 − V vx ) . (3.54)
La ley de transformación para las componentes y y z de la velocidad de la
partícula es distinta de aquella para la componente x, y será estudiada en el
capítulo 5, donde también deducimos formalmente las ecs. (3.53)–(3.54).
Cuando todas las velocidades involucradas son mucho menores que la de la
luz, entonces la suma de velocidades relativista (3.53) y las relaciones corres-
pondientes para las componentes y y z se reducen a la suma de velocidades
v0 = ~
galileana, ~ v − V~ [cf. ec. (1.3)].
42
3.4. Boost en una dirección arbitraria
El boost en dirección x que dedujimos en la sección 3.2 afecta solo las coor-
denadas (t, x), dejando ( y, z) inalteradas. Escribiéndolo explícitamente como
una transformación de coordenadas en las cuatro dimensiones del espacio-
tiempo de Minkowksi, encontramos
0
t cosh φ − sinh φ 0 0 t
x 0 − sinh φ cosh φ 0 0 x
y0 = . (3.55)
0 0 1 0 y
z0 0 0 0 1 z
La matriz que media esta transformación, llamémosla B x (φ) para resaltar que
corresponde a un boost en dirección x con parámetro φ, puede escribirse en la
forma B x (φ) = exp (φK x ), donde el generador de boosts en dirección x está
dado por∗
0 −1 0 0
−1 0 0 0
Kx = . (3.56)
0 0 0 0
0 0 0 0
La receta para construir la matriz de un boost en dirección y o z debería
ahora ser clara: definiendo los generadores de boosts en direcciones y y z como
0 0 −1 0 0 0 0 −1
0 0 0 0 0 0 0 0
Ky = , Kz = , (3.57)
−1 0 0 0 0 0 0 0
0 0 0 0 −1 0 0 0
las matrices de transformación son, respectivamente,
cosh φ 0 − sinh φ 0
0 1 0 0
B y (φ) = exp φK y = , (3.58)
− sinh φ 0 cosh φ 0
0 0 0 1
cosh φ 0 0 − sinh φ
0 1 0 0
Bz (φ) = exp (φKz ) = . (3.59)
0 0 1 0
− sinh φ 0 0 cosh φ
∗
La demostración de esta afirmación, que es esencialmente idéntica a la que dimos en la
sección 3.2, se deja como ejercicio al lector.
43
Para determinar la matriz de transformación correspondiente a un boost en
una dirección arbitraria, construimos a partir de K x , K y y Kz una matriz Kn que
actúe como generador de boosts en dirección n̂, donde n̂ es un vector unitario:
Kn = n x K x + n y K y + nz Kz = n̂ · K
~, (3.60)
con n2x + n2y + n2z = 1. La notación K ~ = K x , K y , Kz hace referencia a un vector
de matrices, de manera que la matriz Kn = n̂ · K ~ resulta ser igual a
0 −n x −n y −nz
~ = −n x 0 0 0
n̂ · K −n . (3.61)
y 0 0 0
−nz 0 0 0
Para comprobar que esta matriz genera boosts infinitesimales que dejan inva-
riante el intervalo espacio-temporal a primer orden en φ, escribimos la trans-
formación de manera explícita,
t 0 = t − φ n̂ · ~r , (3.62)
0
~r = ~r − φ t n̂, (3.63)
y reemplazamos en s2 = −t 2 + |~r |2 :
2
−t 02 + ~r 0 = − (t − φ n̂ · ~r )2 + |~r − φ t n̂|2
= −t 2 + 2φ t n̂ · ~r + |~r |2 − 2φ t n̂ · ~r + O φ 2
= −t 2 + |~r |2 + O φ 2 .
Por lo tanto, la matriz que media un boost en dirección n̂ con parámetro φ
debe poder obtenerse exponenciando
la transformación infinitesimal, Bn (φ) =
exp (φKn ) = exp φ n̂ · K
~ .
Para determinar explícitamente la forma de la matriz Bn (φ) debemos cal-
cular la exponencial matricial exp φ n̂ · K
~ [cf. ec. (3.9)]:
X
∞
φp φ2
exp φ n̂ · K
~ = ~ p = 1 + φ n̂ · K
n̂ · K ~+ ~ 2 + ··· .
n̂ · K (3.64)
p=0
p! 2!
44
3
Para p = 3, encontramos n̂ · K ~ = n̂ · K
~ . Las potencias superiores pueden
resumirse en la forma
2p+2 2
~ 2p+1 = n̂ · K
n̂ · K ~, n̂ · K
~ = n̂ · K
~ , (3.66)
con p = 0, 1, 2, . . ..
Para calcular la exponencial matricial, separamos la identidad, las potencias
impares y las potencias pares:
X
∞
φ 2p+1 2p+1 X∞
φ 2p+2
exp φ n̂ · K = 1 +
~ n̂ · K
~ + ~ 2p+2
n̂ · K
n=0
(2p + 1)! p=0
(2p + 2)!
X
∞
φ 2p+1 X
∞
φ 2p+2
=1+ n̂ · K +
~ ~ 2.
n̂ · K
p=0
(2p + 1)! p=0
(2p + 2)!
Explícitamente,
φ3 φ5
~ =1+ φ+
exp φ n̂ · K + + · · · n̂ · K~ +
3! 5!
2
φ φ 4
φ 6
+ + + ~ 2.
+ · · · n̂ · K
2! 4! 6!
Reconociendo en estas expresiones las series de Taylor para sinh φ y cosh φ −1,
podemos escribir
~ = 1 + sinh φ n̂ · K
Bn (φ) = exp φ n̂ · K ~ 2 . (3.67)
~ + (cosh φ − 1) n̂ · K
45
Reparametrizando del mismo modo la ec. (3.67), hallamos
Bn (V ) = 1 + γV n̂ · K ~ 2.
~ + (γ − 1) n̂ · K (3.70)
Explícitamente,
γ −γVx −γVy −γVz
2
−γVx 1 + (γ − 1) n x (γ − 1) n x n y (γ − 1) n x nz
Bn (V ) = , (3.71)
−γVy (γ − 1) n y n x 1 + (γ − 1) n2y (γ − 1) n y nz
−γVz (γ − 1) nz n x (γ − 1) nz n y 1 + (γ − 1) n2z
donde hemos identificado Vx = V n x , y similarmente para y y z.
46
donde hemos conservado términos hasta de segundo orden. A pesar de las
apariencias, el término cuadrático del lado derecho no puede ser interpretado
como (A + B)2 . En efecto,
(A + B)2 = (A + B) (A + B) = A2 + AB + BA + B 2 , (3.73)
donde
1 1
C = A+ B + [A, B] + ([A, [A, B]] + [B, [B, A]]) + · · · . (3.77)
2 12
Más allá de la forma detallada de los términos de orden superior omitidos,
lo crucial de esta expresión es que C puede determinarse completamente en
términos de A, B y conmutadores anidados entre ellos.
Esto significa que para interpretar el producto B y B x necesitamos calcular
el conmutador entre K x y K y . Encontramos
K x , K y = Jz , (3.78)
47
es el generador de rotaciones en el plano x y (en lenguaje tridimensional, en
torno al eje z), escrito esta vez como una matriz de 4 × 4. Similarmente, los
generadores de rotaciones en los planos yz (eje x) y z x (eje y) son
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 −1
Jx = , Jy = . (3.80)
0 0 0 1 0 0 0 0
0 0 −1 0 0 1 0 0
que es una combinación de una rotación por un ángulo θ alrededor del eje
ê y un boost con parámetro φ en la dirección n̂. En principio, la combina-
ción de dos boosts arbitrarios puede ser determinada a través de la fórmula
de Baker–Campbell–Hausdorff (3.77), aunque el cálculo puede ser difícil en la
práctica [12]. Todo lo que necesitamos conocer para la aplicación de la fórmu-
la es el álgebra de Lie del grupo de Lorentz restringido, consistente en todos los
conmutadores entre los seis generadores. Calculando uno por uno, hallamos
(solo se listan las combinaciones no nulas)
J x , J y = −Jz , J y , Jz = −J x , [Jz , J x ] = −J y , (3.82)
J x , K y = −Kz , J y , Kz = −K x , [Jz , K x ] = −K y , (3.83)
K x , J y = −Kz , K y , Jz = −K x , [Kz , J x ] = −K y , (3.84)
K x , K y = Jz , K y , Kz = J x , [Kz , K x ] = J y . (3.85)
Las ecuaciones (3.82) muestran que las rotaciones espaciales forman un grupo
por sí mismas, denotado por SO(3). La misma afirmación no es cierta para los
boosts; como se desprende de las ecuaciones (3.85), el conmutador entre dos
boosts produce siempre una rotación espacial.
48
Es posible demostrar que toda transformación Λ ∈ SO+ (3, 1) puede ser
escrita como el producto de un boost B y una rotación espacial R, conocida
como rotación de Wigner: Λ = BR. Hallar esta factorización es un problema
algebraico no trivial, que no abordaremos aquí. En particular, esto significa
que la componente t t de Λ (en la esquina superior izquierda de la matriz),
que denotamos por Γ , cumple siempre con Γ ≥ +1, i.e., puede ser siempre
interpretada como el factor de Lorentz de un boost.
La nomenclatura SO+ (3, 1) se explica entonces por cuatro características
de la transformación:
1. La “S” es de special, que se refiere a la propiedad det (Λ) = +1. Esta puede
establecerse
directamente
a partir de la identidad (3.10), notando que
Tr J~ = Tr K ~ = 0.
4. Los números (3, 1) se refieren a los tres signos positivos y al único signo
negativo en la forma cuadrática ds2 = −d t 2 + d x 2 + d y 2 + dz 2 .
que representa una inversión en el flujo del tiempo, también preserva el interva-
lo espacio-temporal (ya que d t 0 = −d t, y d t 02 = d t 2 ), pero no puede escribirse
en la forma (3.81). En efecto, tenemos det (T ) = −1 y Γ = −1 (donde Γ denota
la componente t t de la matriz T ).
49
det (Λ) = +1 det (Λ) = −1
Γ ≥ +1 PO IO
Γ ≤ −1 PA IA
que representa una reflexión simultánea en las tres direcciones espaciales, tam-
bién preserva el intervalo espacio-temporal ds2 , pero, al igual que la inversión
temporal T , tampoco puede escribirse en la forma (3.81). (Note que P = −T ).
∗ ∗ ∗
50
T
PO IA
P P
IO PA
T
Figura 3.5: El grupo de Lorentz O (3, 1) está compuesto de cuatro “islas” des-
conectadas entre sí. Las transformaciones propias y ortocronas (PO) forman
el grupo de Lie SO+ (3, 1), cuyos elementos pueden escribirse en la forma
[cf. ec. (3.81)] Λ = exp θ ê · J + φ n̂ · K . Si Λ ∈ SO+ (3, 1), entonces las trans-
~ ~
formaciones impropias y anticronas (IA), impropias y ortocronas (IO) y propias
y anticronas (PA) pueden escribirse en la forma T Λ, PΛ y P T Λ, respectivamen-
te. En este sentido, P y T actúan como “botes” que nos permiten pasar de una
isla a otra. Note que P T = −1.
a los que llamamos grupo de Lorentz restringido, grupo de Lorentz propio, gru-
po de Lorentz ortocrono, y grupo de Lorentz (a secas), respectivamente. Note
que esta nomenclatura está lejos de ser universal, por lo que siempre convie-
ne aclarar qué se entiende cuando se habla del “grupo de Lorentz”. El grupo
de Lorentz O (3, 1) consiste entonces de cuatro “islas” desconectadas entre sí,
donde solo el grupo restringido SO+ (3, 1) corresponde a un grupo de Lie. Las
transformaciones impropias de paridad P e inversión temporal T actúan co-
mo “botes” que nos permiten pasar de una isla a otra, como se sugiere en la
figura 3.5.
El grupo de Lorentz es el grupo de rotaciones en el espacio-tiempo de Min-
kowski, y sus elementos, llamados transformaciones de Lorentz, son las trans-
formaciones lineales más generales que dejan invariante el intervalo espacio-
temporal ds2 = −d t 2 + d x 2 + d y 2 + dz 2 .
51
Traslaciones. La transformación
t 0 = t + a, x 0 = x + b, y 0 = y + c, z 0 = z + d, (3.92)
52
Capítulo 4
53
4.1. La notación tensorial
En su nivel más elemental, el cálculo tensorial no es más que una nota-
ción computacional eficiente para tratar con “objetos con índices”: escalares
(0 índices), vectores (1 índice) y tensores (2 o más índices). Usamos letras
del alfabeto latino (típicamente, i, j, k, . . .) para denotar índices en el conjun-
to {1, 2, 3}. Así, x i representa una coordenada génerica de entre (x, y, z), con
x 1 = x, x 2 = y y x 3 = z.
Vectores y matrices son representados a través de sus componentes; por
ejemplo, escribimos Ai en lugar de A~ y Mi j en lugar de la matriz M . A menu-
do decimos “el vector Ai ” o “la matriz Mi j ” en lugar de las expresiones más
precisas “el vector cuyas componentes son Ai , con i = 1, 2, 3” o “la matriz de
componentes Mi j ”. Cuando sea importante marcar la diferencia entre el objeto
y suscomponentes, sobre todo en el caso de matrices, vamos a usar la notación
Mi j para denotar la matriz cuyas componentes son Mi j :
M11 M12 M13
Mi j = M21 M22 M23 . (4.1)
M31 M32 M33
54
equivalente a las tres ecuaciones A1 = B1 , A2 = B2 y A3 = B3 . Es incorrecto en
este contexto escribir, e.g., Ai = B j . Note, sin embargo, que las ecuaciones Ai =
Bi y A j = B j expresan exactamente lo mismo. Esto quiere decir que podemos
cambiar el nombre de un índice libre a voluntad, siempre que este cambio
afecte todas las ocurrencias del índice en la ecuación. Similarmente, un índice
mudo puede cambiar de nombre sin afectar el significado de una expresión; por
ejemplo, R i j x j expresa exactamente lo mismo que R ik x k . (Como los índices son
mudos, podemos cambiarles de nombre y no gritan). La regla fundamental que
debe respetarse al hacer estas manipulaciones está contenida en el mantra 4.1.
Ejemplo 4.2 (Producto punto entre dos vectores). Sean A~ y B ~ dos vectores.
Usando la notación tensorial, podemos escribir su producto punto en la forma
A~ · B
~ = Ai Bi . (4.2)
PiTj = P ji
Tr (P) = P j j
PQ = Pik Q k j
55
Ejemplo 4.4 (Propiedad cíclica de la traza). La traza del producto de tres ma-
trices satisface la siguiente propiedad cíclica:
56
En el cálculo tensorial, la palabra “escalar” se usa en un sentido más res-
trictivo que en el resto de la física, donde es básicamente un sinónimo de “nú-
mero”. Decimos que una cantidad es un escalar solo si se mantiene invariante
bajo rotaciones. Como muestra la siguiente definición, las componentes de un
vector no son, en este sentido, escalares.
Definición 4.6 (Campo vectorial). Decimos que Ai (x) es un campo vectorial si
bajo una rotación x i0 = R i j x j sus componentes cambian de acuerdo a la regla
A0i x 0 = R i j A j (x) . (4.6)
57
No es, por supuesto, incorrecto caer en esta tentación, pero probablemente una
imagen mental más útil proviene de la comparación entre el delta de Kronecker
y su pariente “continuo”, la delta de Dirac δ (x). La propiedad fundamental de
la delta de Dirac está expresada en la ecuación
Z∞
δ (x − y) f ( y) d y = f (x) . (4.11)
−∞
δi j f j = f i . (4.12)
Note cómo se manejan los índices mudos para evitar repetir cualquiera de ellos
más de dos veces.
58
Ejemplo 4.16 (Proyectores). Sea ni un vector unitario. Los tensores
k
Pi j = ni n j , Pi⊥j = δi j − ni n j , (4.14)
Definición 4.17 (Campo tensorial de orden n). Decimos que Ti1 ···in (x) es un
campo tensorial de orden n si bajo una rotación x i0 = R i j x j sus componentes
cambian de acuerdo a la regla
Ti01 ···in x 0 = R i1 j1 · · · R in jn T j1 ··· jn (x) . (4.16)
59
Un tensor Ti j no tiene por qué tener una simetría definida, i.e., no tiene por
qué ser simétrico o antisimétrico. En el caso más general posible, sus 3 × 3 = 9
componentes son todas independientes entre sí. Un tensor simétrico Si j , en
cambio, tiene solo 6 componentes independientes, mientras que uno antisimé-
trico Ai j tiene apenas 3, que pueden representarse de la siguiente manera:
S11 S12 S 31 0 A12 −A31
Si j = S12 S22 S23 , Ai j = −A12 0 A23 . (4.17)
S31 S23 S33 A31 −A23 0
60
Permutación Paridad
i jk par i
ik j impar
jki par +
jik impar k j
ki j par
k ji impar
Tabla 4.1: Permutaciones pares e impares de tres índices. Con tres índices, pero
no con cuatro o más, las permutaciones pares coinciden con las permutaciones
cíclicas, representadas en el dibujo de la derecha.
ik j i jk ik j ···
k ji ki j k ji ···
0 1 2 3 ···
61
Definición 4.22 (Tensor totalmente antisimétrico de orden 3). Decimos que
el tensor Ai jk es totalmente antisimétrico si Ai jk = −Aik j = A jki = −A jik = Aki j =
−Ak ji , i.e., si cambia de signo cuando intercambiamos dos índices cualesquiera.
62
Orden del Orden del Componentes
Dimensión
tensor tensor dual independientes
3 0 3 1
3 1 2 3
3 2 1 3
3 3 0 1
4 0 4 1
4 1 3 4
4 2 2 6
4 3 1 4
4 4 0 1
existe siempre una dualidad entre tensores totalmente antisimétricos con n ín-
dices y tensores totalmente antisimétricos con d − n índices en d dimensiones.
No hay tensores totalmente antisimétricos con más de d índices en d dimen-
siones. La tabla 4.2 muestra un resumen de las dualidades entre tensores to-
talmente antisimétricos en tres y cuatro dimensiones.
63
Propiedades del símbolo de Levi-Civita. Llamemos
δ δin
il δim
δl mn = δ jl δ jm δ jn ,
i jk
(4.22)
δkl δkm δkn
que debe ser una de las pocas ecuaciones que vale la pena memorizar en este
curso. Hay varias reglas mnemotécnicas para recordar la posición de los índi-
ces; busque una que le funcione a usted y adóptela como propia.
Contrayendo dos índices entre ambos símbolos de Levi-Civita, encontramos
la identidad
εikl ε jkl = 2δi j . (4.26)
64
Finalmente, cuando todos los índices están contraídos, obtenemos
εi jk εi jk = 6. (4.27)
i jk i jk
Al igual que δl mn , el tensor Mlmn es antisimétrico en i jk y en l mn, por lo
i jk 123 123
que puede escribirse en la forma Mlmn = M123 εi jk εlmn . Notando que M123 =
i jk
det (M ), encontramos que Mlmn = det (M ) εi jk εlmn . Por otro lado, las propieda-
des del delta de Kronecker y de los determinantes nos permiten escribir
M
il Mim Min
det (M ) εi jk εl mn = M jl M jm M jn
Mkl Mkm Mkn
M δ M δ M δ
ip pl ip pm ip pn
= M jq δql M jq δqm M jq δqn
Mkr δ r l Mkr δ r m Mkr δ r n
δ δ δ
pl pm pn
= Mip M jq Mkr δql δqm δqn
δr l δr m δr n
= Mip M jq Mkr ε pqr εlmn .
65
como el producto de una rotación propia y una reflexión. Aplicando la identi-
dad (4.29) a la matriz R i j y multiplicando a ambos lados por det (R), encon-
tramos
ε0i jk = det (R) R il R jm R kn εlmn , (4.30)
donde hemos usado la relación (cf. def. 4.23) ε0i jk = εi jk . Esta ecuación ex-
presa la ley de transformación del símbolo de Levi-Civita bajo rotaciones, que
cambia para no cambiar. Un objeto con una ley de transformación como esta,
que difiere de la regla tensorial por la presencia del determinante de la matriz
de rotación en el lado derecho, es llamado un pseudotensor. Un pseudotensor
transforma de la misma manera que un tensor cuando la transformación es
propia, pero cambia en un signo adicional cuando la transformación es impro-
pia. Note que, como [det (R)]2 = 1, el producto de dos pseudotensores es otra
vez un tensor.
Ejemplo 4.25 (Producto cruz). Si A~ y B ~ son dos vectores, entonces las compo-
nentes de su producto cruz, C~ = A~ × B
~ , pueden calcularse en la forma
Ci = εi jk A j Bk . (4.31)
66
y y
E~ E~0 B
~
x x
~0
B
Figura 4.2: Bajo una reflexión en un espejo perpendicular al eje x, un vector E~
y un pseudovector B~ transforman de maneras distintas. Note que esta figura
muestra el punto de vista activo de la reflexión (ver sección 3.1).
∂
∂i = . (4.35)
∂ xi
67
B
~ B
~
I I
para obtener
∂ ∂ xj ∂ ∂ xj
∂i0 = = = ∂j. (4.36)
∂ x i0 ∂ x i0 ∂ x j ∂ x i0
La matriz jacobiana correspondiente a una rotación x i0 = R i j x j es
∂ x i0 ∂ ∂ xk
= (R ik x k ) = R ik = R ik δk j = R i j . (4.37)
∂ xj ∂ xj ∂ xj
∂ xi
= R−1
ij
. (4.38)
∂ x 0j
∂i0 = R−1 ∂.
ji j
(4.39)
∂i0 = R i j ∂ j . (4.40)
68
En la sección 4.4 consideraremos tensores en el espacio-tiempo de Minkowski,
donde las transformaciones relevantes —las transformaciones de Lorentz—
son representadas por medio de matrices que no cumplen esta propiedad de
ortogonalidad.
∂ A x ∂ A y ∂ Az
∂i Ai = + + . (4.42)
∂x ∂y ∂z
69
Ejemplo 4.31 (Laplaciano). El laplaciano es un operador diferencial escalar
definido como
∂2 ∂2 ∂2
∇2 = ∂i ∂i = + + . (4.46)
∂ x 2 ∂ y 2 ∂ z2
Al ser un operador escalar, el laplaciano no cambia el orden de un campo ten-
sorial, pudiendo ser aplicado a campos escalares, vectoriales o tensoriales.
70
4.3. Transformaciones generales de coordenadas
Un evento en el espacio-tiempo de Minkowski es descrito por un conjun-
to de cuatro coordenadas, (t, x, y, z). Vamos a usar la notación compacta x µ
para referirnos a una cualquiera de ellas, donde µ es un superíndice (¡no un
exponente!) que toma valores de 0 a 3:
x 0 = t, x 1 = x, x 2 = y, x 3 = z. (4.53)
Equivalentemente, a veces escribimos también x µ = t, x i = (t, ~r ). En ge-
neral, reservamos los índices latinos i, j, k, . . . para el conjunto {1, 2, 3} (solo
la parte espacial) y los índices griegos λ, µ, ν, . . . para el conjunto {0, 1, 2, 3}
(incluyendo el tiempo).
El lenguaje tensorial nos permitirá escribir ecuaciones que conserven su for-
ma (i.e., que sean covariantes) en todos los marcos de referencia relacionados
entre sí a través de transformaciones de Lorentz.
Como las transformaciones de Lorentz son rotaciones que dejan invarian-
te una forma cuadrática que incluye un signo negativo, ds2 = −d t 2 + d x 2 +
d y 2 + dz 2 , las matrices que describen estan transformaciones no son estricta-
mente ortogonales, en el sentido que Λ−1 6= Λ T (ver sección 3.5). En particular,
esto significa que debemos ser más cuidadosos en el desarrollo de un cálculo
tensorial de lo que hemos sido hasta ahora.
Para ilustrar la clase de generalización que necesitamos, vamos a recurrir
al ejemplo del paso de coordenadas polares a coordenadas cartesianas en el
plano. Esta transformación es no lineal y, por lo tanto, no está cubierta dentro
de las rotaciones ortogonales que fueron el tema de la sección 4.2.
71
El primero de ellos es el vector compuesto por los diferenciales, (d r, dθ ) y
(d x, d y). En efecto, tenemos
∂x ∂x ∂y ∂y
dx = dr + dθ , dy = dr + dθ , (4.55)
∂r ∂θ ∂r ∂θ
o bien
dx ∂ x/∂ r ∂ x/∂ θ dr
= . (4.56)
dy ∂ y/∂ r ∂ y/∂ θ dθ
La matriz que media esta transformación es la matriz jacobiana de la trans-
formación de coordenadas polares a coordenadas cartesianas, (r, θ ) 7→ (x, y).
Calculando las derivadas, hallamos
∂ x/∂ r ∂ x/∂ θ cos θ −r sin θ
J= = . (4.57)
∂ y/∂ r ∂ y/∂ θ sin θ r cos θ
∂ ∂r ∂ ∂θ ∂ ∂ ∂r ∂ ∂θ ∂
= + , = + , (4.58)
∂x ∂ x ∂r ∂ x ∂θ ∂y ∂ y ∂r ∂ y ∂θ
o bien
∂ /∂ x ∂ r/∂ x ∂ θ /∂ x ∂ /∂ r
= . (4.59)
∂ /∂ y ∂ r/∂ y ∂ θ /∂ y ∂ /∂ θ
La matriz que media esta transformación es la transpuesta de la matriz jaco-
biana de la transformación de coordenadas cartesianas a coordenadas pola-
res, (x, y) 7→ (r, θ ). Esta matriz es la inversa transpuesta de la matriz jacobia-
na (4.57). Calculando las derivadas (o tomando la inversa), hallamos
−1 T ∂ r/∂ x ∂ θ /∂ x cos θ − 1r sin θ
J = = . (4.60)
∂ r/∂ y ∂ θ /∂ y sin θ 1r cos θ
72
Como el ejemplo 4.34 muestra, incluso si la transformación de coordenadas
es no lineal, siempre es posible identificar cantidades que transforman lineal-
mente: los diferenciales y las derivadas parciales.
Escribimos una transformación general de coordenadas en la forma x µ 7→
0µ
x (x), indicando así que cada una de las nuevas coordenadas (primadas) es,
en principio, una función de todas las coordenadas originales (no primadas).
Bajo una transformación general de coordenadas x µ 7→ x 0µ (x), los diferen-
ciales d x µ transforman de acuerdo a
∂ x 0µ ν
d x µ 7→ d x 0µ = dx , (4.61)
∂ xν
donde ∂ x 0µ /∂ x ν son las componentes de la matriz jacobiana de la transforma-
ción.
Similarmente, bajo x µ 7→ x 0µ (x), las derivadas parciales ∂ /∂ x µ transfor-
man de acuerdo a
∂ ∂ ∂ xν ∂
→
7 = , (4.62)
∂ xµ ∂ x 0µ ∂ x 0µ ∂ x ν
donde ∂ x ν /∂ x 0µ son las componentes de la matriz jacobiana de la transfor-
mación inversa, que es la inversa de la matriz jacobiana de la transformación
directa. Aunque no es evidente en esta ecuación, la posición de los índices ga-
rantiza que las derivadas parciales transforman con la matriz jacobiana inversa
transpuesta.
A diferencia de lo que ocurren con las rotaciones tridimensionales, donde
T T
J = R y se cumple que R−1 = R, en el caso general tenemos que J −1 6= J.
Esta diferencia nos fuerza a distinguir entre dos clases de vectores, que llama-
mos contravariantes y covariantes∗ .
73
x µ 7→ x 0µ (x), sus componentes cambian de acuerdo a la regla
0 0
∂ xν
Aµ x = Aν (x) . (4.64)
∂ x 0µ
En palabras: los vectores contravariantes (denotados con un superíndice)
transforman con la matriz jacobiana directa, mientras que los vectores cova-
riantes (denotados con un subíndice) transforman con la matriz jacobiana in-
versa transpuesta.
Solo en el caso de rotaciones representadas a través de matrices ortogo-
nales tenemos que estos dos tipos de vectores coinciden y la diferencia entre
superíndices y subíndices puede ser ignorada.
Definición 4.37 (Campo escalar). Decimos que φ (x) es un campo escalar si,
bajo una transformación general de coordenadas x µ 7→ x 0µ (x), cambia de
acuerdo a la regla
φ 0 x 0 = φ (x) . (4.65)
Previsiblemente, un campo escalar es aquel que permanece invariante bajo
transformaciones generales de coordenadas.
Definición 4.38 (Campo tensorial). Decimos que T µ1 ···µmν1 ···νn (x) es un campo
tensorial de tipo (o valencia) (m, n) si, bajo una transformación general de
coordenadas x µ 7→ x 0µ (x), sus componentes cambian de acuerdo a la regla
∂ x 0µ1 ∂ x 0µm ∂ x σ1 ∂ x σn ρ1 ···ρm
T 0µ1 ···µmν1 ···νn x 0 = · · · · · · T σ1 ···σn
(x) . (4.66)
∂ x ρ1 ∂ x ρm ∂ x 0ν1 ∂ x 0νn
El orden (también llamado grado o rango) del tensor es m + n.
Ejemplo 4.39 (Delta de Kronecker). El delta de Kronecker es un tensor de tipo
(1, 1), definido (en todos los sistemas de coordenadas) como
¨
1 si µ = ν,
δνµ = (4.67)
0 si µ 6= ν.
Para comprobar la valencia (1, 1) del delta de Kronecker, notamos que
∂ xµ ∂ x 0µ
δνµ == = δν0µ . (4.68)
∂x ν ∂x 0ν
74
Ejemplo 4.40 (Producto punto). Si Aµ es un vector contravariante y Bµ es un
vector covariante, entonces el producto Aµ Bµ es un escalar. Comprobación:
∂ x 0µ ∂ x σ ρ ∂ xσ ρ
A0µ Bµ0 = A Bσ = A Bσ = δρσ Aρ Bσ = Aσ Bσ . (4.70)
∂ x ρ ∂ x 0µ ∂ xρ
Dos tensores del mismo tipo pueden sumarse y producir un nuevo tensor,
que tiene el mismo tipo que los tensores originales.
75
Cálculo tensorial. Como vimos al comienzo de esta sección [cf. ec. (4.62)],
el operador de derivada parcial,
∂
∂µ = , (4.71)
∂ xµ
transforma como un vector covariante y es denotado consecuentemente con
un subíndice. Esto significa, por ejemplo, que el gradiente de un campo escalar
φ resulta ser un vector covariante, ∂µ φ. Sin embargo, la situación se complica
cuando se toman derivadas de tensores de orden superior.
Sea Aµ un campo vectorial covariante. A pesar de las apariencias, ∂µ Aν no es
un campo tensorial de tipo (0, 2). Para entender el motivo, analicemos su ley
de transformación bajo x µ 7→ x 0µ (x). Usando la ley de transformación para
un vector covariante y la regla de Leibniz para la derivada de un producto,
obtenemos
0 0 ∂ ∂ xσ ∂ 2xσ ∂ x σ ∂ Aσ
∂µ Aν = Aσ = Aσ + . (4.72)
∂ x 0µ ∂ x 0ν ∂ x 0µ ∂ x 0ν ∂ x 0ν ∂ x 0µ
Utilizamos ahora la regla de la cadena para reescribir el segundo término del
lado derecho en la forma
∂ 2xσ ∂ xρ ∂ xσ
∂µ0 A0ν = Aσ + ∂ρ Aσ (4.73)
∂ x 0µ ∂ x 0ν ∂ x 0µ ∂ x 0ν
¡Esta no es la ley de transformación de un tensor! Existen varias posibilidades
para lidiar con este problema:
76
coordenadas cartesianas. La opción 2 es especialmente interesante, y puede
ser generalizada para tensores de orden superior. Esta es la base para la teo-
ría de las formas diferenciales, introducida por Élie Cartan en 1899 (para una
introducción moderna, consulte la Ref. [17]). La opción 3 es la utilizada en
relatividad general, donde es físicamente inadmisible restringirse a transfor-
maciones lineales.
x 0µ = Λµν x ν , (4.74)
encontramos que las matrices Λ = Λµν deben pertenecer al grupo de Lorentz,
como se detalló en el capítulo 3. Note que, por consistencia notacional, las
componentes de las matrices Λ se escriben con un superíndice (el primero, µ,
que corresponde a la fila) y un subíndice (el segundo, ν, que corresponde a la
columna), Λµν . A pesar de que las transformaciones de Lorentz son lineales, la
presencia de un signo negativo en ds2 implica que las matrices Λ no son orto-
gonales en el sentido estricto de la palabra, i.e., Λ−1 6= Λ T . (La inversa difiere
en este caso de la transpuesta por algunos signos en la primera fila y la prime-
ra columna). Esto significa que debemos distinguir entre índices covariantes
y contravariantes cuando usemos el cálculo tensorial en el espacio-tiempo de
Minkowski.
Derivando la ec. (4.74), encontramos que las componentes de la matriz
jacobiana de la transformación son
∂ x 0µ
= Λ µν . (4.75)
∂ xν
Las componentes de la matriz jacobiana inversa son, por supuesto,
∂ xµ
−1 µ
= Λ . (4.76)
∂ x 0ν ν
77
transformación de Lorentz x 0µ = Λµν x ν , sus componentes cambian de acuerdo
a la regla
A0µ x 0 = Λµν Aν (x) , (4.77)
ν
Bµ0 x 0 = Λ−1 µ Bν (x) . (4.78)
Para distinguirlos de los vectores en tres dimensiones, los vectores de Lorentz
son llamados a veces 4-vectores (“cuadrivectores”).
La definición de un tensor de Lorentz de tipo (m, n) sigue la lógica usual
(cf. def. 4.38), con m matrices Λ y n matrices Λ−1 en su ley de transformación.
Definición 4.44 (Métrica de Minkowski). La métrica de Minkowski ηµν es un
tensor de Lorentz de tipo (0, 2), cuyas componentes (en todos los marcos re-
lacionados entre sí mediante transformaciones de Lorentz) están dadas por
η00 = −1, η0 j = 0, ηi0 = 0, ηi j = δi j . Escribiéndola como una matriz de 4 × 4,
hallamos
−1 0 0 0
0 1 0 0
ηµν = . (4.79)
0 0 1 0
0 0 0 1
En términos de la métrica de Minkowski, el intervalo espacio-temporal pue-
de escribirse en la forma compacta
ds2 = ηµν d x µ d x ν = −d t 2 + d x 2 + d y 2 + dz 2 . (4.80)
A partir de la ec. (4.80), y usando el hecho que ηµν tiene el mismo valor en
todos los marcos (i.e., η0µν = ηµν ), podemos escribir la condición de que Λ
sea una transformación de Lorentz en términos de la métrica de Minkowski.
Exigiendo que ds2 permanezca invariante bajo la transformación x µ 7→ x 0µ =
Λµν x ν , encontramos
78
Definición 4.45 (Métrica de Minkowski inversa). Denotamos por ηµν las com-
ponentes de la métrica de Minkowski inversa. Por definición, estas componen-
−1
tes satisfacen ηµσ ησν = δνµ . Matricialmente, [ηµν ] = ηµν = ηµν . Note,
sin embargo, que ηµν define un tensor de Lorentz de tipo (2, 0), como sugiere
la notación.
Aµ = ηµν Aν (4.83)
Aµ = ηµν Aν (4.84)
A0 = −A0 , Ai = Ai . (4.85)
A0 = −A0 , Ai = Ai . (4.86)
79
Condición Tipo
2
A <0 Tiempo
A2 = 0 Nulo o Luz
A2 > 0 Espacio
A2 = Aµ Aµ . (4.87)
Note que, sin importar lo que pueda sugerir la notación, A2 puede ser positivo,
negativo o cero, incluso para un 4-vector no nulo.
80
representarse como matrices. La convención que usamos es la siguiente: el pri-
mer índice del tensor (µ, en todos estos casos) corresponde siempre a la fila,
sin importar si es un superíndice o un subíndice. Similarmente, el segundo ín-
dice del tensor (ν, en todos estos casos) corresponde siempre a la columna, sin
importar si es un superíndice o un subíndice. Cuando representamos un tensor
de orden 2 como una matriz, a menudo distinguimos entre índices temporal y
espaciales. Por ejemplo, escribimos
0
M 0 M 0j
M ν =
µ
. (4.90)
M i0 M ij
µν
La matriz transpuesta corresponde a intercambiar filas con columnas: AT =
ν µ
Aνµ , B T µ = B νµ , C T ν = Cν µ y Dµν
T
= Dνµ . Por ejemplo,
0 j j
ν M T
M T
M 00 M 0
M T
= 00 0j = j . (4.91)
µ
MT MT M 0i M i
i i
es posible escribir la condición [cf. ec. (4.82)] Λρµ Λσν ηρσ = ηµν en la forma
matricial Λ T ηΛ = η (compare con R T 1R = 1 para rotaciones ortogonales).
Λ00 = 1, Λ0 j = 0, (4.94)
i i
Λ 0 = 0, Λ j = Ri j , (4.95)
81
Ejemplo 4.54 (Boost en una dirección arbitraria). Las componentes matricia-
les de la transformación de Lorentz correspondiente a un boost con velocidad
V~ = V n̂ son [cf. ec. (3.71)]
∂ 2φ
φ = − ∇2 φ = 0, (4.100)
∂ t2
tiene la misma forma en todos los marcos de referencia inerciales relacionados
entre sí a través de transformaciones de Lorentz (asumiendo que φ es una
cantidad tensorial). Dicho de otra manera, las ondas que se propagan a la
velocidad de la luz en un marco se propagan a la velocidad de la luz en todos
los marcos.
82
masas puntuales m1 y m2 separadas una distancia r tienen exactamente la
misma forma matemática:
1 q1 q2 m1 m2
FE = , FG = G , (4.101)
4πε0 r 2 r2
∇ · g~ = −4πGρ, (4.102)
∇2 φ = 4πGρ. (4.103)
83
Capítulo 5
Cinemática relativista
84
t
5.2. 4-velocidad
Definición 5.2 (4-velocidad). Sea x µ (τ) una parametrización de la línea de
mundo de una partícula, con τ su tiempo propio. La 4-velocidad de la partícula
está definida por
d xµ
u =
µ
. (5.3)
dτ
Dado que d x µ es un 4-vector y dτ es un escalar de Lorentz, la 4-velocidad así
definida resulta ser un 4-vector. De manera análoga al caso tridimensional, este
4-vector es siempre tangente a la línea de mundo. Con nuestra convención de
medir tiempos y distancias en la misma unidad, la 4-velocidad es adimensional
(al igual que todas las velocidades).
85
Para establecer una conexión con la velocidad ordinaria, vi = d x i /d t, es-
cribimos la ec. (5.2) en la forma
2 2 2
dx dy 2 dz dτ
−1+ + + =− (5.5)
dt dt dt dt
Despejando d t/dτ, hallamos
dt
= γ, (5.6)
dτ
donde γ es el factor de Lorentz calculado a partir de la velocidad ordinaria
de la partícula, vi = d x i /d t. Esta ecuación expresa la dilatación del tiempo,
mostrando que el intervalo de tiempo coordenado d t es mayor en un factor γ
que el intervalo de tiempo propio dτ.
Como d t/dτ = γ ≥ 1 > 0, la función t (τ) es siempre creciente, y por lo
tanto es invertible. Vamos a utilizar la ec. (5.6) y la regla de la cadena para
reescribir las derivadas respecto de τ como derivadas totales respecto de t de
acuerdo a la regla
d d
=γ . (5.7)
dτ dt
Aplicando la ec. (5.7) a las componentes de la 4-velocidad, hallamos
dt d x d y dz
u =
µ
1, , , = γ 1, vx , v y , vz . (5.8)
dτ dt dt dt
A menudo escribiremos, de manera más compacta,
uµ = γ (1, vi ) = γ (1, ~
v) , (5.9)
o, equivalentemente,
u0 = γ, ui = γvi . (5.10)
86
de la 4-velocidad. En particular, esto significa que la 4-velocidad solo tiene
tres componentes independientes, las cuales pueden identificarse con las tres
componentes de la velocidad ordinaria.
La 4-velocidad tiene implícita cierta redundancia, porque usa 4 números
para describir un objeto con solo 3 grados de libertad. Este es el precio que
pagamos por la covariancia de Lorentz. En relatividad especial y general, así
como también en la teoría relativista de campos, a menudo encontramos que
vale la pena usar una representación redundante si con eso ganamos covarian-
cia, como en este caso.
Definición 5.3 (Marco comóvil instantáneo). Consideremos una partícula P
cuyo movimiento es registrado desde un marco de referencia inercial K. En
cierto instante t, la velocidad de P medida en K es ~
v . El marco de referencia
0
inercial K que se mueve respecto de K con velocidad V~ = ~ v es llamado marco
comóvil instantáneo (MCI) de P en el instante t.
Es importante notar que el MCI K 0 se mueve con velocidad constante res-
pecto de K, por lo que, en general, será comóvil con la partícula P solo en el
instante t en que sus velocidades coinciden.
Sea K 0 el MCI de una partícula. En este marco, las componentes de su 4-
v 0 = 0, γ0 = 1]
velocidad son [cf. ec. (5.9), con ~
Como esta es una ecuación tensorial, tiene la misma forma en todos los marcos.
De aquí concluimos que uµ uµ = −1 también en K.
5.3. 4-aceleración
Definición 5.4 (4-aceleración). La 4-aceleración de una partícula es
duµ
αµ = . (5.14)
dτ
Dado que uµ es un 4-vector y dτ es un escalar de Lorentz, la 4-aceleración así
definida resulta ser un 4-vector. Con nuestra convención de medir tiempos y
87
distancias en la misma unidad, por ejemplo, en segundos, la 4-aceleración se
mide en s−1 .
o, equivalentemente,
α0 = γ4 v j a j , αi = γ4 v j a j vi + γ2 ai . (5.20)
88
Sea K 0 el marco comóvil instantáneo de una partícula. De acuerdo a la
ec. (5.12), y consistentemente con la definición 5.3, tenemos que su velocidad
ordinaria en K 0 se anula. Sin embargo, como K 0 se mueve con velocidad cons-
tante respecto de K, en general no es cierto que la aceleración ordinaria de la
partícula deba ser cero en K 0 . Reemplazando vi0 = 0, γ0 = 1 y manteniendo
ai0 6= 0 en la ec. (5.19), hallamos
α0µ = 0, ai0 . (5.21)
a02 = α0 α0 + αi αi
= − γ4 vi ai γ4 v j a j + γ4 v j a j vi + γ2 ai γ4 vk ak vi + γ2 ai
= −γ8 vi ai v j a j + v 2 γ8 vi ai v j a j + 2γ6 vi ai v j a j + γ4 a2
= γ6 2 − 1 − v 2 γ2 (~ v · a~)2 + γ4 a2 .
Notando que 1 − v 2 γ2 = 1, podemos escribir
v · a~)2 .
a02 = γ4 a2 + γ2 (~ (5.23)
Por improbable que parezca, esta expresión es invariante de Lorentz, i.e., tiene
el mismo valor en todos los marcos de referencia inerciales.
89
En el marco comóvil instantáneo, la 4-velocidad y la 4-aceleración adoptan
las formas simplificadas
αµ uµ = 0. (5.25)
90
uµ u0µ u0µ
αµ
α0µ
α0µ
a0 = γ2 a. (5.28)
91
5.4. Movimiento hiperbólico
Uno de los movimientos más sencillos es aquel con ocurre en línea recta con
aceleración propia constante. Es importante aclarar que es solo la aceleración
propia, i.e., aquella medida en el marco comóvil instantáneo, la que se man-
tiene constante. La afirmación sin condiciones “movimiento con aceleración
constante” es ambigua en Relatividad, pues de inmediato surge la pregunta:
¿constante en qué marco? La elección del MCI nos permite darle un sentido
invariante a la respuesta, pues en todos los marcos tendremos a02 = const.
A diferencia de lo que ocurre en la física no relativista, donde una partícula
con aceleración constante realiza un movimiento parabólico, en nuestro caso
el movimiento resulta ser hiperbólico, como detallamos a continuación.
Para simplificar, escogemos el marco K donde vamos a describir el movi-
miento de manera que el eje x coincida con la dirección en que viaja la partí-
cula. Esto significa que la 4-velocidad toma la forma [cf. ec. (5.9)]
donde hemos escrito φ (τ) para resaltar el hecho que el MCI es distinto en
cada instante, de manera que el parámetro φ puede ser pensado como una
función del tiempo propio τ. La ec. (5.31) funciona como un ansatz para la 4-
velocidad, que queda completamente determinada a través de la función (aún
desconocida) φ (τ).
Derivando la ec. (5.31) obtenemos la 4-aceleración:
dφ
αµ = [sinh φ (τ) , cosh φ (τ) , 0, 0] . (5.32)
dτ
92
La magnitud al cuadrado de la aceleración propia es
2 dφ 2
a0 = αµ α =
µ
, (5.33)
dτ
de donde obtenemos la ecuación
dφ
= a0 = const. (5.34)
dτ
La solución de esta ecuación es, simplemente, φ = a0 τ, donde hemos escogido
la condición inicial φ (0) = 0. Reemplazando, obtenemos la 4-velocidad y la
4-aceleración como funciones de τ:
El lector puede comprobar fácilmente que estos 4-vectores satisfacen las con-
diciones uµ uµ = −1, uµ αµ = 0 y αµ αµ = a02 para todo τ. Note que nuestra elec-
ción para la condición inicial implica que la partícula comienza su movimiento
desde el reposo en τ = 0, pues uµ (0) = (1, 0, 0, 0). Integrando la 4-velocidad,
encontramos
1
xµ = [sinh (a0 τ) , cosh (a0 τ) , 0, 0] , (5.37)
a0
donde hemos escogido la condición inicial x µ (0) = (0, 1/a0 , 0, 0). Explícita-
mente, estamos describiendo el movimiento de la partícula a través de las
ecuaciones paramétricas
1 1
t= sinh (a0 τ) , x= cosh (a0 τ) . (5.38)
a0 a0
(Note que a0−1 sirve como escala espacial y temporal). Elevando al cuadrado y
restando, podemos escribir la ecuación de la trayectoria:
1
x2 − t2 = . (5.39)
a02
93
t
1/a0 x
94
1
0,8
0,6
v
0,4
0,2
0
0 0,5 1 1,5 2 2,5 3
a0 t
Ejemplo 5.10. Imagine una nave espacial que pueda mantener una acelera-
ción propia constante a0 = 1 año−1 de manera indefinida. Esta aceleración les
brinda a los pasajeros un agradable campo gravitacional artificial de 9,5 m/s2 ,
muy similar al de la Tierra. El viaje comienza en órbita terrestre con velocidad
inicial nula. A diferencia de Perseverance, el rover de la misión Mars 2020, que
tardará siete meses en llegar a Marte, nosotros alcanzamos la órbita marciana
en apenas dos días y medio. Luego de cruzar sin contratiempos el cinturón de
asteroides (la probabilidad de chocar con un asteroide es, por supuesto, insig-
nificante), llegamos a la órbita de Júpiter 52 horas después. Han transcurrido
4,7 días desde que salimos de la Tierra y nuestra velocidad es del 1,3 % de la
velocidad de la luz. Juno, la sonda actualmente en órbita a Júpiter, tardó cinco
años en llegar. El nuestro no es, en ningún caso, un viaje de contemplación;
25 días después de haber salido de la Tierra, estamos tan lejos como el Voya-
ger 1, una de las dos sondas gemelas lanzadas en 1977 y que son actualmente
los emisarios más lejanos enviados por la humanidad. Vamos al 6,8 % de la ve-
locidad de la luz. El espacio, sin embargo, es vasto. Luego de 200 días de viaje
alcanzamos el 50 % de la velocidad de la luz, pero no llegaremos a Proxima
Centauri, la estrella más cercana al Sol, hasta que hayan transcurrido 2,3 años
desde que salimos de la Tierra. Nuestra velocidad es entonces igual al 98 % de
95
la velocidad de la luz. La Vía Láctea pasa relativamente rápido, y llegamos a la
Galaxia de Andrómeda cuando se cumplen 15 años de viaje. Hace tiempo que
nuestra velocidad, al ser tan cercana a la de la luz, dejó de ser un parámetro
interesante. En su lugar, el factor de Lorentz es γ = 2,5 × 106 , que coincide con
la distancia a la Tierra medida en años. ¿Hasta dónde podemos llegar? Cen-
trada siempre en nosotros mismos, el Universo observable forma una esfera
de unos 4,6 × 1010 años de radio. Luego de 25 años de viaje, nuestro Universo
observable ya no incluye la Tierra.
La figura 5.5 muestra una ilustración a escala logarítmica del universo ob-
servable.
96
Figura 5.5: Ilustración a escala logarítmica del universo observable con el Sis-
tema Solar en el centro, los planetas interiores, el cinturón de asteroides, los
planetas exteriores, el cinturón de Kuiper, la nube de Oort, Alfa Centauri, el
brazo de Perseus, la Via Láctea, Andrómeda y las galaxias cercanas, la tela-
raña cósmica de cúmulos galácticos, la radiación de fondo de microondas y
el plasma invisible del Big Bang en el borde. Creada especialmente para Wi-
kipedia.org por Pablo Carlos Budassi. https://commons.wikimedia.org/
wiki/File:Observable_universe_logarithmic_illustration.png.
97
porque Λ02 = Λ03 = 0. Reemplazando ahora u00 = γ0 , u0 = γ, u1 = γvx , Λ00 = Γ ,
Λ01 = −Γ V , obtenemos [cf. ec. (3.54)]
γ0 = Γ γ (1 − V vx ) . (5.47)
vx − V vy vz
vx0 = , v 0y = , vz0 = , (5.48)
1 − V vx Γ (1 − V vx ) Γ (1 − V vx )
vk − V~
~ v⊥
~
γ0 = Γ γ 1 − V~ · ~
vk , vk0 =
~ , v⊥0 =
~ . (5.49)
1 − V~ · ~
vk Γ 1 − V~ · ~
vk
Una deducción elegante (o, por lo menos, directa) de estas ecuaciones hace uso
de las componentes de un boost en una dirección arbitraria, en particular, de
la ec. (4.98). Note que cuando todas las velocidades involucradas son mucho
menores que la velocidad de la luz, recuperamos la ley de suma de velocidades
v0 = ~
galileana, ~ v − V~ [cf. ec. (1.3)].
98
Figura 5.6: Izquierda: Una fuente de luz omnidireccional se encuentra en re-
poso en K. Derecha: Desde el punto de vista de un marco K 0 que se mueve con
velocidad V~ respecto de K (en la figura, V = 0,28, dirigida a la derecha) los
rayos de luz se concentran en la dirección opuesta a V~ , pero la magnitud de su
velocidad es la misma en todas las direcciones. Compare con la figura 1.6.
99
a~0
a~0⊥
a~ a~
a~⊥
θ θ0
v
~ a~k k
a~0
Figura 5.7: Para determinar la aceleración propia a~0 de una partícula a partir de
su velocidad ~ v y aceleración a~ ordinarias (izquierda), proceda de la siguiente
manera. Descomponga la aceleración a~ en una componente paralela a~k y una
componente perpendicular a~⊥ a la velocidad ~ v (centro). Luego, escale a~k por γ3
y a~⊥ por γ2 [cf. ec. (5.52)] para obtener las componentes de la aceleración
k
propia a~0 paralela y perpendicular a ~ v , a~0 y a~0⊥ . Use estas componentes para
k
construir a~0 vía a~0 = a~0 + a~0⊥ (derecha). Note que |~ a0 | > |~
a| y θ0 < θ . Se ilustra
el caso v = 3/5, γ = 5/4.
a0⊥ a⊥ a
tan θ0 = = < ⊥ = tan θ . (5.54)
k
a0 γak ak
100
Capítulo 6
Dinámica relativista
6.1. 4-Momentum
Definición 6.1 (4-momentum). Sean m la masa y uµ la 4-velocidad de una
partícula. Definimos su 4-momentum a través de la expresión
pµ = muµ . (6.1)
~p = γm~
v. (6.3)
101
¿Qué representa la componente temporal del 4-momentum? Para respon-
der esta pregunta, expandimos γ en serie de potencias en v 2 . Obtenemos
1 3
p0 = m + mv 2 + mv 4 + · · · . (6.4)
2 8
E = γm. (6.5)
E0 = m. (6.6)
Esta ecuación∗ es clave: una partícula en reposo tiene una energía igual a su
masa. Alternativamente, podemos interpretar esta ecuación como una concep-
ción nueva del significado de la masa: la masa es la energía en reposo de una
partícula.
La energía cinética relativista está definida como
K = E − E0 = E − m = (γ − 1) m. (6.7)
102
1
0,8
0,6
K/m
0,4
0,2
0
0 0,2 0,4 0,6 0,8 1
v
Figura 6.1: Energía cinética (por unidad de masa) como función de la velo-
p La energía cinética diverge cuando v → 1. Note que K = m cuando
cidad.
v = 3/2 ≈ 0,866. La línea punteada es la aproximación newtoniana. Deci-
mos que una partícula es no relativista si K m y ultrarrelativista si K m.
103
A partir de esta ecuación, o usando pµ = muµ y recordando que uµ uµ = −1,
encontramos que la magnitud (al cuadrado) del 4-momentum es igual a
pµ pµ = −m2 . (6.10)
~p
v=
~ . (6.12)
E
La velocidad de la partícula es ~
v = ~p/E.
104
E
E = γm E 2 = m2 + p 2
~p = E ~
v
v
~ ~p = γm~
v ~p
Figura 6.2: Ecuaciones que relacionan momentum lineal, energía, masa y ve-
locidad de una partícula. Adaptado de la Ref. [2].
105
conceptos cuando lea este y otros libros.
Los dos artículos de Lev B. Okun [19, 20] abogan también por el concepto
de masa como cantidad invariante y dan una reseña histórica de su evolución
desde finales del siglo 19.
6.2. Fotones
La mecánica newtoniana no puede acomodar la existencia de partículas sin
masa. En efecto, si m = 0, la aceleración de una partícula sometida a la acción
de una fuerza neta F~ diverge de acuerdo a la segunda ley de Newton, a~ = F~/m.
Mirando la definición 6.1, parece que la teoría especial de la relatividad
fuera también a tener dificultades con la existencia de partículas sin masa. Sin
embargo, este no es el caso. Interpretando pµ como una cantidad primitiva
(p. 104), el 4-momentum de una partícula de masa cero puede escribirse sim-
plemente como pµ = (E, ~p), donde E es su energía y ~p su momentum lineal.
La condición m2 = −pµ pµ = E 2 − p2 = 0 implica que el 4-momentum de una
partícula sin masa es un 4-vector nulo o tipo luz, con
E = |~p| . (6.15)
∗
A partir de mayo de 2019, la definición del amperio [10] fija el valor numérico para la
carga del electrón en e = 1,602 176 634 × 10−19 C.
106
Como la velocidad de una partícula está dada por ~ v = ~p/E, la ec. (6.15) implica
que la partícula sin masa se mueve siempre a la velocidad de la luz, |~ v | = 1. En
particular, esto significa que la 4-velocidad de una partícula sin masa no está
definida (porque γ diverge cuando |~ v | = 1), haciendo inviable la definición
inicial de 4-momentum.
En la teoría especial de la relatividad, una partícula sin masa se mueve siem-
pre a la velocidad de la luz, independientemente de su energía o su momentum
lineal. ¿Cómo distinguimos entonces dos partículas sin masa con energías dis-
tintas, si ambas viajan a la misma velocidad?
En 1905, Albert Einstein∗ introdujo el concepto de fotón como el cuanto de
radiación electromagnética, una partícula elemental sin masa. En el concepto
de Einstein, una onda electromagnética de frecuencia f puede interpretarse
también como un haz de fotones, cada uno de ellos con una energía
E = hf, (6.16)
107
λ/m
103 1 10−3 10−6 10−9 10−12
radio IR UV γ
visible
microondas rayos X
f /Hz
106 109 1012 1015 1018 1021
E/eV
10−9 10−6 10−3 1 103 106
108
10
2
f 0/ f
0,5
0,2
0,1
−1 −0,5 0 0,5 1
v
109
6.3. Conservación del 4-momentum
La propiedad más importante del 4-momentum es su conservación: El 4-
momentum total de un sistema aislado se mantiene constante en el tiempo.
Separando componente temporal y componentes espaciales, obtenemos dos
leyes de conservación independientes:
Conservación de la energía
Ea + E b = Ec + Ed , (6.23)
~pa + ~p b = ~pc + ~pd . (6.24)
ma + Ka + m b + K b = mc + Kc + md + Kd . (6.25)
110
En este caso, la ec. (6.25) implica que en una colisión elástica se conserva
también la masa:
ma + m b = mc + md . (6.27)
Ejemplo 6.4 (Colisión totalmente inelástica). Una colisión totalmente inelás-
tica puede escribirse como a + b → c, implicando que las partículas a y b
se mueven como una sola, c, después de la interacción. La conservación del
4-momentum en este caso toma la forma
µ
paµ + p b = pcµ . (6.28)
Consideremos dos partículas a y b de la misma masa, ma = m b = m, que se
acercan con velocidades de igual magnitud y direcciones opuestas: ~pa = γm~ v,
~p b = −γm~ v . En este caso, la conservación del momentum lineal produce ~pc =
~pa +~p b = 0, es decir, la partícula c queda en reposo después de la interacción. Si
K = (γ − 1) m es la energía cinética de a o b antes de la colisión, la conservación
de la energía implica
Ec = mc = 2m + 2K = 2γm. (6.29)
La masa de la partícula c es mayor que la suma de las masas de las partículas
a y b, porque la energía cinética de a y b contribuye también a la masa de c.
Esta es una instancia concreta de transformación de energía en masa.
¿Qué pasa si observamos esta colisión desde un marco de referencia dis-
tinto? En este caso, la partícula c no permanece en reposo, pero su masa es la
misma que en el caso simétrico. Por ejemplo, sea K 0 el marco donde b está en
reposo, de manera que E b0 = m, ~p0b = 0. En este caso, la velocidad, el factor
de Lorentz y el momentum lineal de a son [cf. ec. (5.49) con V~ = −~v, ~
v⊥ = 0,
v=~
~ vk , Γ = γ]
v
2~
va0 =
~ , γ0a = γ2 1 + v 2 , ~pa0 = 2γ2 m~
v. (6.30)
1 + v2
A partir de la conservación del 4-momentum encontramos la energía y el mo-
mentum lineal de c:
Ec0 = Ea0 + E b0 = 2γ2 m, ~pc0 = ~pa0 + ~p0b = 2γ2 m~
v, (6.31)
donde hemos usado la identidad 1 + γ2 1 + v 2 = 2γ2 . La masa de c está dada
por
2
m2c = Ec02 − pc02 = 2γ2 m 1 − v 2 = (2γm)2 , (6.32)
que coincide con su masa en el marco K.
111
K m m mc
a b c
K0 m m mc
a b c
3me = Ec + Ed , (6.33)
2me = −Ec + pd . (6.34)
Sumando, obtenemos
5me = Ed + pd . (6.35)
Combinando esta ecuación con la relación m2e = (Ed + pd ) (Ed − pd ), encontra-
mos
1
me = Ed − pd . (6.36)
5
Resolviendo el sistema formado por las ecs. (6.35)–(6.36), hallamos
13 12
Ed = me , pd = me . (6.37)
5 5
112
a b c d
∗
El positrón es la antipartícula del electrón. El electrón y el positrón tienen la misma masa,
el mismo spin, y cargas eléctricas de signos opuestos. La existencia del positrón fue predicha
teóricamente por P. A. M. Dirac en 1928 y confirmada experimentalmente por C. D. Anderson
en 1932.
113
a b c
donde f y f 0 son las frecuencias del fotón antes y después del scattering, y
m2e = E 2 − p2 . La conservación del 4-momentum nos entrega un sistema de
cuatro ecuaciones que puede resolverse algebraicamente.
A menudo ocurre que no estamos interesados en algún aspecto de la co-
lisión en estudio. Por ejemplo, en el scattering de Compton nos importa más
saber con qué energía emerge el fotón (i.e., en cuánto cambia su longitud de
onda) luego de la interacción que la energía y la dirección de movimiento del
electrón. En estos casos, podemos utilizar la siguiente técnica: de la ecuación
para la conservación del 4-momentum, aislamos el 4-momentum que no nos
interesa y elevamos al cuadrado:
µ
µ
pµd pd = pµa + pµb − pµc paµ + p b − pcµ . (6.44)
Esto es equivalente a
1 1 h
− = (1 − cos θ ) . (6.45)
f 0 f me
114
c
θ
a b ϕ
d
La ec. (6.46) fue deducida por primera vez por Arthur Compton en 1923, re-
velando que la luz no podía siempre ser tratada como una onda. La cantidad
λc = h/me = 2,43 pm es conocida como longitud de onda de Compton del elec-
trón.
115
a b
E px m K vx
Partícula a 10 6 8 2 3/5
Partícula b 10 −6 8 2 −3/5
Sistema 20 0 20 0 0
Tabla 6.1: Información dinámica de dos partículas que son consideradas como
un sistema. Energía, momentum lineal y masa se miden en la misma unidad
(e.g., kilogramos). La velocidad es adimensional.
donde la suma se extiende a todas las partículas del sistema. Es posible de-
mostrar que p̄µ , al igual que cada uno de los 4-momenta individuales, es un
4-vector tipo tiempo [1].
En estas condiciones, el 4-momentum total del sistema, p̄µ , permanece
constante en el tiempo, i.e., se conserva.
La masa M del sistema de partículas está dada por
116
y es en
P general mayor que la suma de las masas de las partículas individuales,
m̄ = a ma . De su definición, la masa del sistema es invariante de Lorentz, de
manera que todos los observadores inerciales coinciden en su valor. La conser-
vación del 4-momentum nos asegura que la masa M del sistema permanece
constante siempre que el sistema se mantenga aislado.
Definición 6.8 (Marco del centro del momentum). Como p̄µ es un 4-vector tipo
tiempo, existe un marco K 0 , llamado marco del centro del momentum (MCM),
donde sus componentes espaciales se anulan:
p̄i0 = 0. (6.49)
Si las componentes de p̄µ en un marco K dado son p̄µ = Ē, p̄i , entonces es
posible demostrar que la velocidad de K 0 respecto de K es
p̄i
Vi = . (6.50)
Ē
En el marco del centro del momentum, las componentes del 4-momentum
total son
p̄0µ = (M , 0) . (6.51)
Luego, podemos escribir
X X
00
M = p̄ = pa00 = ma + Ka0 = m̄ + K̄ 0 , (6.52)
a a
6.5. 4-Fuerza
La primera ley de Newton, que define un marco de referencia inercial, sigue
siendo válida en Relatividad: un objeto sobre el que no actúan fuerzas se mueve
en línea recta con velocidad constante (que podría ser cero).
117
La segunda ley de Newton puede escribirse en la forma
d ~p
f~ = , (6.53)
dt
donde ~p es el momentum lineal y f~ es la fuerza neta que actúa sobre una
partícula. En Relatividad, esta relación es reemplazada por
d pµ
F =
µ
, (6.54)
dτ
donde pµ es el 4-momentum y F µ es la 4-fuerza total que actúa sobre una
partícula. Con pµ = (E, pi ), las componentes de la 4-fuerza total son
dE
F0 = γ , F i = γ fi , (6.55)
dt
donde P = d E/d t es la potencia desarrollada por la fuerza y
d pi d d
fi = = (γmvi ) = (E vi ) (6.56)
dt dt dt
es la fuerza tridimensional o 3-fuerza total. Esta 3-fuerza se corresponde con la
fuerza newtoniana, aunque difiere de ella: la relación f~ = d ~p/d t se mantiene,
pero la definicion del momentum lineal ~p ha pasado del m~ v newtoniano al
γm~ v relativista.
Dado que las interacciones instantáneas a distancia son incompatibles con
la Relatividad, la tercera ley de Newton sobrevive solo para interacciones lo-
cales, como las colisiones de las secciones anteriores.
A partir de las ecs. (6.55) podemos escribir
dE
F =γ
µ
, fi . (6.57)
dt
Tomando el producto punto de F µ con la 4-velocidad uµ , hallamos
2 dE
uµ F = γ −
µ
+ vi f i . (6.58)
dt
Sea K 0 el marco comóvil instantáneo de la partícula. En K 0 , u0µ = (1, 0, 0, 0) y
F 00 = dm/d t 0 , de manera que obtenemos u0µ F 0µ = −d m/d t 0 . Igualando con el
resultado obtenido en K, encontramos
dE 1 dm
= vi f i + , (6.59)
dt γ dt
118
donde hemos usado la relación d/d t 0 = γd/d t.
En general, una 4-fuerza relativista puede hacer dos cosas: cambiar la masa
y cambiar la velocidad de una partícula. Cuando una fuerza no cambia la masa
de la partícula, se cumplen uµ F µ = 0 y la relación newtoniana P = ~v · f~.
Definición 6.9 (Fuerza tipo calor). Decimos que una fuerza es tipo calor si
cambia la masa, pero no la velocidad, de la partícula sobre la que actúa.
Ejemplo 6.10. Las fuerzas de acción y reacción en una colisión son tipo calor.
Sea F µ una 4-fuerza que no cambia la masa de una partícula. En este caso,
podemos escribir
F µ = γ v j f j , fi . (6.61)
Aplicando la regla de Leibniz a la relación f i = (d/d t) (E vi ), obtenemos
d vi d E
fi = E + vi = γmai + v j f j vi , (6.62)
dt dt
que claramente difiere de la segunda ley de Newton. Proyectando esta ecua-
ción sobre la dirección paralela y el plano perpendicular a la velocidad de la
partícula, obtenemos
f~k = γ3 m~
ak , f~⊥ = γm~
a⊥ , (6.63)
donde hemos usado la relación ~ v · f~ ~v = v 2 f~k . En la sección 5.6 mostramos
que la aceleración propia a~0 puede descomponerse en partes paralela y per-
pendicular a la velocidad en la forma
k
a~0 = γ3 a~k , a~0⊥ = γ2 a~⊥ . (6.64)
119
k
Esto significa que podemos escribir f~k = m~
a0 , pero f~⊥ 6= m~
a0⊥ . La única manera
de recuperar la segunda ley de Newton consiste en definir, de modo bastante
ad-hoc, una “masa longitudinal” y una “masa transversal” en la forma
mk = γ3 m, m⊥ = γm. (6.65)
120
Capítulo 7
Electrodinámica relativista
φ = 0, (7.1)
cuyas soluciones son ondas que se propagan a la velocidad de la luz (en todos
los marcos).
Con = −∂µ ∂ µ (cf. def. 4.55), la ecuación de onda ∂µ ∂ µ φ = 0 es reminis-
cente de la relación pµ pµ = 0, que describe a un fotón (ver sección 6.2). Esta
reminiscencia motiva la equivalencia heurística
pµ 7→ −iħ
h∂µ , (7.2)
121
h es, desde nuestro punto de vista, puramente convencional.
donde el factor −iħ
Explícitamente (note que E = p0 = −p0 , con ∂0 = ∂ /∂ t),
∂
E 7→ iħ
h , ~p 7→ −iħ
h∇. (7.3)
∂t
En 1925, Erwin Schrödinger usó las equivalencias (7.3) para deducir una
ecuación diferencial que predice correctamente los niveles de energía para el
átomo de hidrógeno dados por el modelo de Bohr. Partiendo de la expresión
newtoniana para la energía,
p2
E= + V, (7.4)
2m
donde K = 12 mv 2 = p2 /2m es la energía cinética y V es energía potencial, y
efectuando los reemplazos (7.3), obtenemos la ecuación de Schrödinger,
∂ψ h2 2
ħ
iħ
h =− ∇ ψ + V ψ. (7.5)
∂t 2m
Aquí, ψ (~r , t) es una “función de onda”, valuada en los números complejos,
cuyo módulo al cuadrado da la densidad de probabilidad de encontrar una
partícula en la posición ~r en el instante t. La ecuación de Schrödinger es uno
de los pilares de la mecánica cuántica, y la base de la física atómica y molecular.
De la manera en que la hemos deducido resulta claro que no es compatible con
la Relatividad.
Aplicando la sustitución (7.2) en la expresión relativista pµ pµ = −m2 , ob-
tenemos la ecuación de Klein–Gordon,
m 2
φ + φ = 0. (7.6)
ħ
h
Curiosamente, Schrödinger mismo dedujo esta ecuación antes de la ecuación
que lleva su nombre, pero la descartó porque no reproduce correctamente los
niveles de energía del átomo de hidrógeno. La ecuación de Klein–Gordon es
una versión relativista de la ecuación de Schrödinger válida para partículas
de spin cero, como el bosón de Higgs. Ignorando tanto la Relatividad como el
spin del electrón, la ecuación de Schrödinger da una buena aproximación a
los niveles de energía del átomo de hidrógeno. La ecuación de Dirac corrige
ambas falencias de la ecuación de Schrödinger y predice correctamente la “es-
tructura fina” de los niveles de energía, además de la existencia del positrón,
la antipartícula del electrón.
122
7.2. El campo electromagnético
¿Qué ecuaciones relativistas podemos escribir para un campo 4-vectorial
Aµ ? De nuestra experiencia con el campo escalar, podríamos comenzar pro-
bando la ecuación de onda,
Aµ = 0. (7.7)
Aunque de apariencia relativista, esta ecuación esconde una potencial
viola-
ción a la covariancia: con = −∂ ∂λ , tenemos Aµ = −∂ ∂λ Aµ . Como vi-
λ λ
mos en la sección 4.3 (p. 76), las derivadas parciales de un campo 4-vectorial
solo son tensoriales bajo transformaciones lineales de coordenadas. Bajo una
transformación no lineal, como el paso de coordenadas cartesianas a coorde-
nadas esféricas, el término ∂λ Aµ es no tensorial y no puede ser aceptado como
parte de una ecuación relativista covariante. Una manera de recuperar la co-
variancia consiste en tomar combinaciones antisimétricas de las derivadas de
Aµ , como en
Fµν = ∂µ Aν − ∂ν Aµ . (7.8)
En términos de este tensor, podemos reemplazar la ecuación de onda por
∂ν F µν = S µ . (7.10)
∂ Ai
F 0i = ∂ 0 Ai − ∂ i A0 = − − ∂i φ, (7.11)
∂ t
εi jk F jk = εi jk ∂ i A j − ∂ j Ai = 2εi jk ∂ j Ak , (7.12)
123
eléctrico y vectorial magnético,
∂ A~
E~ = − − ∇φ, B
~ = ∇ × A.
~ (7.13)
∂t
Identificamos, por lo tanto,
1
Ei = F 0i , Bi = εi jk F jk , (7.14)
2
con el campo eléctrico y el campo magnético, respectivamente. Las relaciones
inversas son
F 0i = Ei , F i j = εi jk Bk . (7.15)
Más explícitamente,
0 Ex Ey Ez
−E x 0 Bz −B y
[F µν ] = . (7.16)
−E y −Bz 0 Bx
−Ez B y −B x 0
Por supuesto, esta identificación no pasaría de ser una curiosidad si las ecua-
ciones satisfechas por los campos no se corresponden con las ecuaciones de
Maxwell. Para comprobar esta última equivalencia, analizamos las componen-
tes de la ec. (7.10). Separando los casos µ = 0 y µ = i, hallamos
∂ν F 0ν = ∂i F 0i = ∂i Ei = S 0 , (7.17)
∂ Ei
∂ν F iν = ∂0 F i0 + ∂ j F i j = − + εi jk ∂ j Bk = S i . (7.18)
∂t
ρ ∂ E~
∇ · E~ = , − +∇×B
~ = µ0 ~. (7.19)
ε0 ∂t
124
podemos escribir las ecuaciones de Maxwell inhomogéneas en la forma com-
pacta
∂ν F µν = µ0 J µ . (7.21)
Las ecuaciones de Maxwell homogéneas (la ley de Gauss para el magnetismo
y la ley de Faraday) se satisfacen automáticamente una vez se definen los cam-
pos a partir de potenciales, como hemos hecho. También es posible escribirlas
tensorialmente en la forma
Resulta directo comprobar que esta ecuación se reduce a una identidad cuando
reemplazamos la definición de Fµν dada en la ec. (7.8).
1
Ei = F 0i , Bi = εi jk F jk , (7.25)
2
F 0i = Ei , F i j = εi jk Bk . (7.26)
Más explícitamente,
0 Ex Ey Ez
−E x 0 Bz −B y
[F µν ] = . (7.27)
−E y −Bz 0 Bx
−Ez B y −B x 0
125
El campo electromagnético obedece las ecuaciones de Maxwell inhomogéneas,
∂ν F µν = µ0 J µ , (7.28)
∗ ∗ ∗
126
Definición 7.1 (Transformación de gauge). Sea λ un campo escalar arbitrario.
La transformación Aµ 7→ A0µ , con
A0µ = Aµ − ∂µ λ, (7.30)
∂λ
φ0 = φ + , A~0 = A~ − ∇λ. (7.31)
∂t
Bajo una transformación de gauge (7.30), el campo electromagnético Fµν
0
permanece invariante. En efecto, si llamamos Fµν al campo producido por el
0
nuevo 4-potencial Aµ , encontramos
0
Fµν = ∂µ A0ν − ∂ν A0µ
= ∂µ (Aν − ∂ν λ) − ∂ν Aµ − ∂µ λ
= ∂µ Aν − ∂ν Aµ − ∂µ ∂ν λ + ∂ν ∂µ λ
= Fµν .
127
condición adicional que se le exige al 4-potencial, eliminando así total o par-
cialmente la libertad de gauge (7.30). Existen muchas elecciones de gauge po-
sibles; desde nuestro punto de vista, son particularmente interesantes aquellas
condiciones de gauge que son covariantes.
∂µ Aµ = 0 (7.34)
128
simetría de gauge es el ingrediente clave para la formulación de las teorías de
gauge que describen las interacciones débil y fuerte y que, junto con la electro-
dinámica, conforman el modelo estándar de la física de partículas.
∂µ ∂ν F µν = µ0 ∂µ J µ . (7.37)
129
S
~
n̂
Figura 7.1: Una distribución continua de carga eléctrica fluye a través de una
esfera S. La densidad de corriente es ~, que apunta siempre hacia la derecha,
y el vector unitario normal a la superficie es n̂. En el hemisferio izquierdo de
la esfera hay un flujo de carga hacia dentro, con ~ · n̂ < 0, mientras que en el
hemisferio derecho la carga fluye hacia fuera, con ~ · n̂ > 0.
130
todos los marcos de referencia inerciales.
J µ = ρ (1, ~
v ) = ρ0 uµ , (7.41)
donde uµ = γ (1, ~v ) es el campo de 4-velocidades de las cargas en movimiento
y
ρ
ρ0 = (7.42)
γ
es la densidad propia de carga eléctrica. Para cada evento en el espacio-tiempo,
ρ0 corresponde a la densidad de carga eléctrica medida por un observador
comóvil con el flujo de carga en ese evento. A diferencia de la densidad de
carga ρ = J 0 , la densidad de carga propia ρ0 es un campo escalar, en cuyo
valor están de acuerdo todos los observadores inerciales.
Podemos entender la relación (7.42) entre ρ y ρ0 notando que el elemento
de carga dq = ρd V = ρ0 d V0 es un escalar. La contracción de la longitud a lo
largo de la dirección de movimiento tiene como consecuencia que el elemento
de volumen dV es más pequeño en un factor γ que el elemento de volumen
propio d V0 , dV = d V0 /γ. (El factor es γ, no γ3 , porque la contracción ocurre
solo en la dirección del movimiento, no en las direcciones perpendiculares).
Para preservar el valor de dq, la densidad de carga ρ debe ser mayor que la
densidad propia ρ0 en el mismo factor γ, ρ = γρ0 .
131
uµ uν ), concluimos que la 4-fuerza (7.43) no cambia la masa de las partículas
sobre las que actúa (ver sección 6.5).
La componente µ = 0 de la ec. (7.43) es
F 0 = qF 0ν uν = qF 0i ui = qγEi vi . (7.44)
dE
= q E~ · ~
v, (7.45)
dt
donde E = p0 es la energía de la partícula. Esta ecuación nos dice que solo el
campo eléctrico, y no el campo magnético, realiza trabajo sobre la carga.
Las componentes µ = i de la ec. (7.43) son
f~ = q E~ + q~
v×B
~, (7.47)
que es la conocida
expresión de Lorentz para la fuerza que un campo electro-
magnético E~, B~ ejerce sobre una carga puntual q que se mueve con veloci-
v.
dad ~
Para estudiar la acción de un campo electromagnético sobre una distribu-
ción continua de carga descrita por una 4-corriente J µ = (ρ, ~), resulta más
apropiado utilizar la densidad de 4-fuerza
ϕ µ = F µν Jν , (7.48)
ϕ 0 = Ei ji , ϕ i = ρEi + εi jk j j Bk . (7.49)
132
electrodinámicas, como las ecuaciones de Maxwell, las transformaciones de
gauge, la ecuación de continuidad y la fuerza de Lorentz. En esta sección en-
contramos un resultado genuinamente nuevo: las leyes de transformación de
los campos eléctrico y magnético bajo un boost, que reemplazan a las ecuacio-
nes no relativistas (1.16).
La ley de transformación para el campo electromagnético F µν bajo una
transformación de Lorentz descrita por la matriz Λµν corresponde a la de un
tensor de orden 2,
F 0µν = Λµρ Λνσ F ρσ . (7.50)
Esta ecuación contiene toda la información que necesitamos para establecer
las leyes de transformación para los campos eléctrico y magnético.
Poniendo Ei = F 0i , Bi = 12 εi jk F jk , y similarmente para las cantidades pri-
madas respectivas, y desarrollando explícitamente las sumas sobre ρ y σ en la
ec. (7.50), hallamos
Ei = Λ 0 Λ j − Λ 0 Λ j E j + ε jkl Λ0 j Λi k Bl ,
0 0 i i 0
(7.51)
j 1 j
Bi0 = εi jk Λ 0 Λk l El + εi jk εlmn Λ l Λk m Bn . (7.52)
2
Estas son las leyes de transformación generales para los campos eléctrico y
magnético bajo una transformación de Lorentz arbitraria.
Λ00 = 1, Λ0 j = 0, (7.53)
Λi 0 = 0, Λi j = R i j , (7.54)
Esto significa que, bajo una rotación espacial R ∈ O (3), el campo eléctrico se
comporta como un vector y el campo magnético como un pseudovector.
133
Boost. Para un boost con velocidad vi = vni , la matriz Λµν toma la forma
(ver ejemplo 4.54)
k
donde Pi j y Pi⊥j son los proyectores en las direcciones paralela y perpendicular
a ni ,
k
Pi j = ni n j , Pi⊥j = δi j − ni n j . (7.59)
Separando las ecuaciones para Ei0 y Bi0 en sus partes paralela y perpendicular a
la velocidad del boost, podemos escribir
E~k0 = E~k , E~⊥0 = γ E~⊥ + ~
v×B ~⊥ , (7.61)
B~0 = B ~k , B~0 = γ B v × E~⊥ .
~⊥ − ~ (7.62)
k ⊥
Estas son las leyes de transformación para los campos eléctrico y magnético
bajo un boost con velocidad ~v = v n̂.
En unidades convencionales, las ecs. (7.61)–(7.62) toman la forma
E~k0 = E~k , E~⊥0 = γ E~⊥ + ~
v×B ~⊥ , (7.63)
1
B~0 = B ~k , ~0 = γ B
B ~⊥ − ~ v × E~⊥ , (7.64)
k ⊥
c2
E~0 = E~ + ~
v×B
~, ~0 = B
B ~. (7.65)
134
Ejemplo 7.3. Bajo un boost en dirección x, las componentes cartesianas de los
campos eléctrico y magnético cambian de acuerdo a las ecuaciones
E x0 = E x , E 0y = γ E y − vBz , Ez0 = γ Ez + vB y , (7.66)
B 0x = B x , B 0y = γ B y + vEz , Bz0 = γ Bz − vE y . (7.67)
Esto quiere decir que en K 0 , además del campo magnético existe también un
campo eléctrico.
135
Ejemplo 7.5. En un marco K dado, tenemos E~ 6= 0, B ~ = 0. Con E 2 − B 2 > 0,
0 ~ 0 6= 0, pero siempre
E~ · B
~ = 0, concluimos que pueden existir marcos K donde B
debe cumplirse que E~0 · B
~ 0 = 0. No existe ningún marco K 0 donde E~0 = 0, B ~ 0 6= 0.
Ejemplo 7.6. Si E~ · B
~ 6= 0 en un marco K dado, entonces no existe ningún
0 0 ~ 0 = 0.
marco K donde E = 0 o B
~
Ejemplo 7.7. En un marco K dado, tenemos E 2 − B 2 < 0 y E~ · B
~ = 0. Deseamos
0 0
determinar si existe un marco K donde E~ = 0.
Asumimos tentativamente que K 0 existe y denotamos por ~ v su velocidad
respecto de K. Como E · B = 0, podemos usar E , B y E × B como una base
~ ~ ~ ~ ~ ~
v en la forma
ortogonal en la cual expandir ~
v = κ E~ + λB
~ ~ + µ E~ × B
~, (7.71)
v en esa base. Poniendo E~0 = 0 en la
donde κ, λ y µ son las componentes de ~
ec. (7.61), hallamos
E~k = 0, E~⊥ + ~
v×B
~⊥ = 0. (7.72)
La primera de estas ecuaciones establece que E~ no tiene ninguna componente a
lo largo de ~v , i.e., ~
v · E~ = 0. Como ~ v · E~ = κE 2 , concluimos que κ = 0. (Podemos
asumir que E~ 6= 0, porque si E~ = 0 el problema está trivialmente resuelto).
Con E~k = 0, E~⊥ = E~ y podemos reescribir la segunda de estas ecuaciones en la
forma
E~ + ~ v×B ~ = 0, (7.73)
donde hemos reemplazado B ~⊥ por B ~ apelando a que ~ v×B ~=~ v× B ~k + B
~⊥ =
v×B
~ ~⊥ . Usando la expansión (7.71) para ~ v , obtenemos
E~ + λB ~ + µ E~ × B ~ ×B ~ = 0. (7.74)
Notando que B ~×B~ = 0, desarrollando el doble producto cruz y recordando que
E · B = 0, encontramos que esta condición es equivalente a 1 − µB 2 E~ = 0, la
~ ~
cual se satisface solo si escogemos
1
µ= . (7.75)
B2
Esto significa que existe una familia de marcos K 0 , cuyas velocidades respecto
de K están dadas por
E~ × B
~
v = λB
~ ~+ , (7.76)
B2
con λ arbitrario, donde E~0 = 0.
136
7.8. Tensor momentum-energía
El campo electromagnético posee energía y momentum lineal propios, que
deben ser tomados en cuenta junto con la energía y el momentum lineal mecá-
nicos al escribir leyes de conservación para ambas cantidades. En Relatividad,
estos atributos del campo electromagnético se describen a través de un tensor
simétrico de rango 2, el tensor momentum-energía (en inglés, “stress-energy
tensor”) del campo electromagnético, Tµν .
En particular, el tensor momentum-energía del campo electromagnético ac-
túa como fuente del campo gravitacional en la teoría general de la relatividad,
curvando el espacio-tiempo de manera similar a una partícula masiva.
Vamos a deducir una expresión general para Tµν a partir de la densidad de
4-fuerza (7.48),
ϕ µ = F µν Jν . (7.77)
Usando las ecuaciones de Maxwell inhomogéneas (7.28) para reescribir la 4-
corriente en el lado derecho, encontramos
ϕ µ = ε0 F µν ∂ λ Fνλ . (7.78)
ϕ µ = ε0 ∂ λ (F µν Fνλ ) − ε0 Fνλ ∂ λ F µν
1
ϕ µ = ε0 ∂ λ (F µν Fνλ ) − ε0 Fνλ ∂ λ F µν − ∂ ν F µλ
2
1
ϕ µ = ε0 ∂λ F µν F νλ − ε0 Fνλ ∂ λ F µν + ∂ ν F λµ .
2
Usando las ecuaciones de Mawell homogéneas (7.29) para reescribir el segun-
do término, hallamos
1
ϕ µ = ε0 ∂λ F µν F νλ + ε0 Fνλ ∂ µ F νλ . (7.79)
2
Integrando otra vez por partes en el segundo término y reorganizando los ín-
∗
En este contexto, “integrar por partes” quiere decir tomar una expresión de la forma A∂µ B
y, usando la regla de Leibniz, reescribirla como A∂µ B = ∂µ (AB) − B∂µ A. Cuando A = B, esta
técnica nos permite escribir A∂µ A = 12 ∂µ A2 .
137
dices, obtenemos
1
ϕ µ = ε0 ∂λ F µν F νλ + ε0 ∂ µ Fνλ F νλ
4
µ 1
ϕ = ε0 ∂ν F λ F + η Fρσ F
µ λν µν ρσ
.
4
ϕ µ + ∂ν T µν = 0, (7.80)
138
Finalmente, con µ = i, ν = j, encontramos
ij i λj 1 ij
T = −ε0 F λ F + η Fρσ F ρσ
4
i 0j i kj 1 2 2
= −ε0 F 0 F + F k F − δi j E − B
2
1 2 2
= −ε0 Ei E j + εikl εk jm Bl Bm − δi j E − B .
2
Recurriendo a las propiedades del símbolo de Levi-Civita, podemos escribir
ij 1 2 2
T = −ε0 Ei E j + Bi B j − δi j E + B = −σi j , (7.85)
2
donde σi j es llamado tensor de Maxwell.
Resumiendo, las componentes del tensor momentum-energía son
u Sj
µν
[T ] = , (7.86)
Si −σi j
Estas tres cantidades nos permiten describir los flujos de energía y momentum
lineal entre el campo electromagnético y la materia, como veremos a continua-
ción.
∗ ∗ ∗
139
La componente temporal de la ec. (7.90) puede escribirse en la forma
∂u
E~ · ~ + + ∇ · S~ = 0. (7.91)
∂t
Consideremos un sistema de campos y cargas en movimiento confinado al in-
terior de un volumen V . Integrando sobre V (ver sección 7.4), encontramos
Z Z I
d
E~ · ~dV + udV + S~ · n̂dA = 0, (7.92)
V
d t V S
∂ Si
ϕi + − ∂ j σi j = 0. (7.93)
∂t
Integrando sobre V , hallamos
Z Z I
d
ϕi d V + Si dV − σi j n j dA = 0, (7.94)
V
dt V S
140
moméntum lineal a través de la superficie S que limita el sistema. Esto quiere
decir que la componente σi j del tensor de Maxwell puede interpretarse como
la densidad de flujo de la componente i del momentum lineal electromagnético
a través de una superficie perpendicular a x j .
se miden todas en las mismas unidades, que pueden escogerse como J/m3
(densidad de energía), kg/(m2 s) (densidad de momentum lineal), W/m2 (den-
sidad de flujo de energía) o kg/(s2 m) (densidad de flujo de momentum lineal),
con
1 kg kg J W
2
= 1 2 = 1 3 = 299 792 458 2 . (7.96)
299 792 458 m s s m m m
Estas diferentes elecciones hacen que, e.g., sea lícito interpretar el vector de
Poynting S~ tanto como densidad de flujo de energía o como densidad de mo-
mentum lineal.
141
P
Figura 7.2: Una carga puntual en movimiento arbitrario describe una línea de
mundo curva en el espacio-tiempo. El campo electromagnético en el evento P
está determinado por la velocidad y la aceleración de la carga puntual en el
evento retardado Q.
Rµ Rµ = −t 2 + r 2 = 0. (7.98)
El principio de causalidad exige que Q ocurra antes que P, por lo que debemos
142
tener t > 0. Luego, t = r > 0, y podemos escribir
Rµ = r (1, n̂) , (7.99)
donde n̂ = ~r /r es un vector unitario que apunta desde Q hacia P.
Sea K 0 el marco comóvil instantáneo de la carga puntual en el evento Q. En
este marco, el 4-potencial en P es el de Coulomb, i.e., el de una carga puntual
en reposo,
1 q
φ0 = , A~0 = 0, (7.100)
4πε0 r 0
donde r 0 es la distancia entre Q y P en el marco K 0 . Como φ 0 no depende
explícitamente del tiempo, este 4-potencial cumple el gauge de Lorenz (7.34).
La 4-velocidad de q en K 0 es u0µ = (1, 0, 0, 0), por lo que podemos escribir
1 q 1 q 0µ
A0µ = (1, 0, 0, 0) = u . (7.101)
4πε0 r 0 4πε0 r 0
A su vez, las componentes de Rµ en K 0 están dadas por R0µ = r 0 (1, n̂0 ). Luego,
r 0 = −u0µ R0µ , y obtenemos
q u0µ
A0µ = − . (7.102)
4πε0 u0σ R0σ
Siendo manifiestamente tensorial, esta ecuación conserva su forma en todos
los marcos∗ . Luego, podemos escribir el 4-potencial en un marco arbitrario K
en la forma
q uµ q uµ
Aµ = − = , (7.103)
4πε0 uσ Rσ 4πε0 D
donde hemos definido D = −uσ Rσ . Con uµ = d y µ /dτ = γ (1, ~
v ), tenemos
D = −uσ Rσ = γr (1 − n̂ · ~
v) . (7.104)
Explícitamente, los potenciales de Liénard–Wiechert en K son
1 q 1 q~
v
φ= , A~ = . (7.105)
4πε0 r (1 − n̂ · ~
v) 4πε0 r (1 − n̂ · ~
v)
∗
Sean Aµ y B µ dos expresiones tensoriales distintas que coinciden con el 4-potencial de
Coulomb en K 0 , A0µ = B 0µ . Como la igualdad entre dos tensores se preserva bajo transfor-
maciones de Lorentz, estas dos expresiones tensoriales deben coincidir en todos los marcos,
Aµ = B µ . Esto significa que (7.102) es la única manera tensorial de escribir el 4-potencial de
Coulomb.
143
Figura 7.3: Las superficies equipotenciales de Liénard–Wiechert son elipsoides
de revolución de excentricidad v. En la figura se muestra la intersección de
estas superficies con un plano que contiene la velocidad de la partícula, que en
este caso tiene magnitud v = 3/5 y apunta hacia la derecha. Los círculos en
línea punteada representan el caso coulombiano, v = 0.
144
de Rµ :
d yµ
∂ν Rµ = ∂ν [x µ − y µ (τ)] = δνµ − τν = δνµ − uµ τν . (7.107)
dτ
Recordando que Rµ Rµ = 0, encontramos
0 = ∂ν Rµ Rµ = 2Rµ ∂ν Rµ = 2Rµ δνµ − uµ τν , (7.108)
de donde obtenemos
Rµ Rµ
τµ = =− . (7.109)
uσ Rσ D
Luego, cuando derivemos cantidades definidas sobre la línea de mundo de la
carga puntual respecto de x µ , vamos a usar la relación
Rµ d
∂µ = − . (7.110)
D dτ
En particular, las derivadas de Rµ pueden escribirse en la forma
uµ R ν
∂ν Rµ = δνµ + . (7.111)
D
Habiendo aclarado estos preliminares, calculamos ahora ∂µ Aν :
u
q q ∂µ ν D − uν ∂µ D
u
∂µ Aν = ∂µ ν = . (7.112)
4πε0 D 4πε0 D2
Usando la ec. (7.110), encontramos que las derivadas de la 4-velocidad son
Rµ duν Rµ αν
∂µ uν = − =− , (7.113)
D dτ D
donde αµ es la 4-aceleración de la carga puntual. Para calcular las derivadas
de D, usamos (7.111) y (7.113), recordando que uσ uσ = −1:
∂µ D = −∂µ (uσ Rσ )
= − ∂µ uσ Rσ − uσ ∂µ Rσ
Rµ ασ σ u σ
R µ
= R − uσ δµσ +
D D
Rµ
= −uµ + (1 + ασ Rσ ) .
D
145
Reemplazando en ∂µ Aν , hallamos
§ ª
q 1 Rµ
∂µ Aν = −Rµ αν − uν −uµ + (1 + ασ R )
σ
4πε0 D2 D
q 1 Rµ ũν
= uµ uν − ,
4πε0 D2 D
q ũµ Rν − ũν Rµ
Fµν = . (7.115)
4πε0 D3
q ũ j R k
Bi = εi jk 3 = εi jk n j Ek . (7.119)
4πε0 D
146
P
n̂ ~r
n̂ − ~
v r (n̂ − ~
v)
v
~ Q r~
v Q0
Figura 7.4: Dos triángulos equivalentes para ilustrar la dirección del término
estático del campo eléctrico en la ec. (7.120).
El campo eléctrico en la ec. (7.120) tiene dos partes; una “estática”, que va en
la dirección de n̂ − ~
v , y una de radiación, que va en la dirección de a~. Como se
sugiere en la figura 7.4, la parte estática del campo eléctrico apunta desde Q0 ,
no desde Q, hacia P, donde Q0 es la posición que tendría la carga puntual si
continuase moviéndose con velocidad constante desde Q durante un tiempo
t = r. Este término estático sobrevive incluso si a~ = 0, en cuyo caso es inver-
samente proporcional al cuadrado de la distancia entre Q y P. El término de
radiación existe solo si la carga puntual acelera, y es inversamente proporcio-
nal a la distancia entre Q y P. Esto significa que disminuye más lentamente que
el término estático, contribuyendo así a la emisión de radiación electromagné-
tica. Solo una carga acelerada radía; una carga en reposo o en movimiento
con velocidad constante produce un campo que disminuye demasiado rápido
con la distancia. En cambio, el campo de radiación producido por una carga
acelerada puede detectarse arbitrariamente lejos de la carga.
147
Bibliografía
148
[12] B. Coll y F. San José Martínez, «Composition of Lorentz Transformations
in Terms of Their Generators», Gen. Rel. Grav. 34, 1345-1356 (2002),
arXiv:gr-qc/0106052 [gr-qc].
[13] J. L. Synge y A. Schild, Tensor Calculus (Dover, 1978).
[14] D. Lovelock y H. Rund, Tensors, Differential Forms, and Variational Prin-
ciples, Dover Books on Mathematics (Dover, 1989).
[15] D. C. Kay, Tensor Calculus, Schaum’s Outlines (McGraw-Hill Education,
2011).
[16] A. Einstein, «Die Grundlage der allgemeinen Relativitätstheorie», Ann.
Phys. 49, 769-822 (1916).
[17] H. Flanders, Differential Forms with Applications to the Physical Sciences
(Dover, 1989).
[18] C. W. Misner, K. S. Thorne y J. A. Wheeler, Gravitation (W. H. Freeman
& Company, 1973).
[19] L. B. Okun, «The Concept of Mass», Physics Today 42, 31-36 (1989).
[20] L. B. Okun, «The concept of mass (mass, energy, relativity)», Soviet Phy-
sics Uspekhi 32, 629-638 (1989).
149