Está en la página 1de 186

Principios de la Relatividad Especial:

Fundamentos Fı́sicos, Geométricos y Algebraicos

F REDY A. O CHOA
Departamento de Fı́sica
Universidad Nacional de Colombia
Sede Bogotá
II
Índice general

Prefacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VII

Introducción 1

PARTE I: FUNDAMENTOS FÍSICOS

1. La relatividad clásica 5
1.1. Definiciones básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Las transformaciones de Galileo . . . . . . . . . . . . . . . . . . . . . 6
1.3. La relatividad de las partı́culas puntuales . . . . . . . . . . . . . . . . . 7
1.3.1. Teorema de adición de velocidades . . . . . . . . . . . . . . . 7
1.3.2. Invariancia de la aceleración . . . . . . . . . . . . . . . . . . . 8
1.3.3. La fuerza y masa inercial clásicos . . . . . . . . . . . . . . . . 8
1.4. La relatividad de las ondas mecánicas . . . . . . . . . . . . . . . . . . 9
1.4.1. Retraso longitudinal . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.2. Retraso transversal . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.3. Efecto Doppler clásico . . . . . . . . . . . . . . . . . . . . . . 12

2. La relatividad especial 15
2.1. Experimento de Michelson-Morley . . . . . . . . . . . . . . . . . . . . 15
2.2. Postulados de la relatividad especial . . . . . . . . . . . . . . . . . . . 19
2.3. Transformaciones de Lorentz Simples . . . . . . . . . . . . . . . . . . 20
2.4. Aclaraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3. Cinemática relativista 29
3.1. La relatividad del tiempo . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.1.1. Simultaneidad . . . . . . . . . . . . . . . . . . . . . . . . . . 30

III
IV ÍNDICE GENERAL

3.1.2. Dilatación temporal . . . . . . . . . . . . . . . . . . . . . . . . 32


3.2. La relatividad de la longitud . . . . . . . . . . . . . . . . . . . . . . . 33
3.3. La relatividad del movimiento . . . . . . . . . . . . . . . . . . . . . . 35
3.3.1. Teorema de adición de velocidades . . . . . . . . . . . . . . . 35
3.3.2. Transformación de la aceleración . . . . . . . . . . . . . . . . 36
3.3.3. Efecto Doppler longitudinal . . . . . . . . . . . . . . . . . . . 38
3.4. Lı́mites a altas y bajas velocidades . . . . . . . . . . . . . . . . . . . . 39
3.4.1. El lı́mite clásico . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.4.2. El lı́mite ultrarelativista . . . . . . . . . . . . . . . . . . . . . . 41

4. Dinámica relativista 43
4.1. El momento relativista . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.1.1. Taquiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.2. La energı́a relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.2.1. Energı́a cinética clásica . . . . . . . . . . . . . . . . . . . . . . 48
4.2.2. Energı́a cinética relativista . . . . . . . . . . . . . . . . . . . . 49
4.3. La masa en reposo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3.1. La masa de los quarks . . . . . . . . . . . . . . . . . . . . . . 52
4.3.2. El mecanismo de Brout-Englert-Higgs . . . . . . . . . . . . . . 53
4.4. La relación energı́a y momento . . . . . . . . . . . . . . . . . . . . . . 54
4.4.1. El fotón . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.2. Decaimiento de partı́culas . . . . . . . . . . . . . . . . . . . . 56
4.4.3. Fisión Nuclear . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4.4. Creación de partı́culas . . . . . . . . . . . . . . . . . . . . . . 60

PARTE II: FUNDAMENTOS GEOMÉTRICOS

5. Estructura de Espacio-Tiempo 65
5.1. La geometrı́a Euclidiana del espacio . . . . . . . . . . . . . . . . . . . 65
5.2. Estructuras de espacio-tiempo . . . . . . . . . . . . . . . . . . . . . . 67
5.2.1. Espacio-tiempo clásico . . . . . . . . . . . . . . . . . . . . . . 68
5.2.2. Espacio-tiempo de Poincaré . . . . . . . . . . . . . . . . . . . 69
5.2.3. Espacio-tiempo de Minkowski . . . . . . . . . . . . . . . . . . 71
5.3. La estructura de cono de luz . . . . . . . . . . . . . . . . . . . . . . . 72
5.3.1. El principio de causalidad . . . . . . . . . . . . . . . . . . . . 74

6. La Geometrı́a de la Cinemática Relativista 77


6.1. Distorsión Angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.2. Cinemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.2.1. Relatividad de la simultaneidad . . . . . . . . . . . . . . . . . 78
6.2.2. Dilatación temporal . . . . . . . . . . . . . . . . . . . . . . . . 79
ÍNDICE GENERAL V

6.2.3. Contracción de Fitzgerald-Lorentz . . . . . . . . . . . . . . . . 79


6.3. Hipérbolas invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . 80
6.3.1. La paradoja de los gemelos . . . . . . . . . . . . . . . . . . . . 81
6.4. La rapidez hiperbólica . . . . . . . . . . . . . . . . . . . . . . . . . . 83

PARTE III: FUNDAMENTOS ALGEBRAICOS

7. El Grupo de Lorentz 89
7.1. Grupo Abstracto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
7.2. El grupo de Lorentz simple . . . . . . . . . . . . . . . . . . . . . . . . 91
7.3. El grupo de Lorentz en general . . . . . . . . . . . . . . . . . . . . . . 94
7.3.1. El tensor métrico . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.3.2. El grupo de Lorentz restringido . . . . . . . . . . . . . . . . . 95
7.4. Transformaciones de Lorentz restringidas . . . . . . . . . . . . . . . . 97
7.5. Álgebra del Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . 104
7.5.1. Grupos de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
7.5.2. Los generadores del grupo de Lorentz . . . . . . . . . . . . . . 105
7.5.3. Representaciones del Grupo de Lorentz . . . . . . . . . . . . . 106
7.5.4. Representaciones tensoriales . . . . . . . . . . . . . . . . . . . 110

8. Álgebra de Tensores 113


8.1. Notación de ı́ndices de Einstein . . . . . . . . . . . . . . . . . . . . . . 113
8.2. Operaciones tensoriales . . . . . . . . . . . . . . . . . . . . . . . . . . 114
8.3. Tensores especiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
8.3.1. Boost de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . 118
8.3.2. Tensores isotrópicos . . . . . . . . . . . . . . . . . . . . . . . 119
8.3.3. Tensores Dual . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

9. Formulación Covariante: Mecánica 123


9.1. Variables cinemáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
9.1.1. La cuadri-velocidad . . . . . . . . . . . . . . . . . . . . . . . 124
9.1.2. La cuadri-aceleración . . . . . . . . . . . . . . . . . . . . . . . 125
9.2. Variables dinámicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
9.2.1. El cuadri-momento . . . . . . . . . . . . . . . . . . . . . . . . 127
9.2.2. La fuerza de Minkowski . . . . . . . . . . . . . . . . . . . . . 127
9.2.3. La masa invariante . . . . . . . . . . . . . . . . . . . . . . . . 130
9.3. Colisiones de partı́culas puntuales . . . . . . . . . . . . . . . . . . . . 131
9.3.1. Sistema centro de masa y laboratorio . . . . . . . . . . . . . . 135
9.4. El cohete relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
VI ÍNDICE GENERAL

10. Formulación Covariante: Electrodinámica 145


10.1. Representación vectorial . . . . . . . . . . . . . . . . . . . . . . . . . 145
10.2. Representación tensorial . . . . . . . . . . . . . . . . . . . . . . . . . 149
10.2.1. La cuadri-corriente . . . . . . . . . . . . . . . . . . . . . . . . 150
10.2.2. El cuadri-potencial . . . . . . . . . . . . . . . . . . . . . . . . 151
10.2.3. Tensor electromagnético . . . . . . . . . . . . . . . . . . . . . 152
10.3. Ecuaciones de Maxwell covariantes . . . . . . . . . . . . . . . . . . . 154
10.3.1. Ley de Gauss y de Ampere-Maxwell . . . . . . . . . . . . . . . 154
10.3.2. Ley de Gauss magnética y de Faraday . . . . . . . . . . . . . . 156

Apéndices 159
A. Ondas Armónicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
B. El experimento real de Michelson-Morley . . . . . . . . . . . . . . . . . . 160
C. El electronvoltio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
D. Rotaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
E. Generadores del Grupo de Lie . . . . . . . . . . . . . . . . . . . . . . . . 163
F. Operadores diferenciales del cálculo vectorial . . . . . . . . . . . . . . . . 165
G. Ecuaciones de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Prefacio
El presente texto es el resultado de las clases de relatividad especial que dicté para
los estudiantes de la carrera de fı́sica de la Universidad Nacional de Colombia en los
años 2013 y 2015. A pesar de la amplia y excelente oferta de textos sobre el tema, no
encontré un texto que cubriera de forma integral y a un nivel básico tanto los aspectos
fı́sicos, como los geométricos y algebraicos que surgen de los principios de la relatividad.
En los textos más tradicionales, los autores generalmente hacen énfasis en el desarrollo
histórico y en las evidencias experimentales que motivaron las ideas de Einstein, com-
plementados con amplias discusiones conceptuales y las tradicionales consecuencias en
cinemática y dinámica, mientras que aspectos como las consecuencias geométricas que-
dan limitadas a algunos comentarios aislados o en algúna sección dentro de un capı́tulo.
Además, el tratamiento moderno del cálculo tensorial no se menciona, o se limita a una
introducción básica de los cuadri-vectores. La mayorı́a de textos que incluyen el len-
guaje geométrico y tensorial, son textos más especializados dirigidos generalmente a
estudiantes de niveles avanzados y enfocados hacia la relatividad general y a la teorı́a
cuántica de campos.
Debido a la activa investigación en fı́sica teórica y a la gran variedad de experimen-
tos destinados a la búsqueda de nueva fı́sica, se ha vuelto primordial que los estudiantes
desde los cursos fundamentales, empiecen a familiarizarse con la notación moderna y su
relación con los temas actuales de la investigación. En el caso de la relatividad, si bien es
una teorı́a que se construyó de forma completa desde hace más de un siglo, su vigencia
sigue siendo actual y es el eje central que soporta la investigación de frontera en áreas
como la fı́sica de partı́culas y la cosmologı́a. Ası́, problemas actuales a nivel de partı́cu-
las elementales como el fenómeno de oscilación de neutrinos, el reciente descubrimiento
del bosón de Higgs, la búsqueda de la llamada supersimetrı́a, etc, o a nivel cosmológi-
co como la búsqueda de las ondas gravitacionales, el problema de la cuantización de la
gravedad, las evidencias de la llamada materia oscura y energı́a oscura, etc, son temas
de una investigación intensa tanto teórico como experimental, y que además de cumplir
con los postulados de la relatividad especial, se soportan en principios fundamentales
inspirados en la relatividad. Surge entonces la necesidad de que los estudiantes no sola-
mente aprendan los conceptos básicos y generales, sino que además vean el alcance de
tales conceptos y su importancia en el contexto de problemas actuales.
El propósito principal de éste texto es iniciar al estudiante en los principios de la
relatividad especial cubriendo de forma integral y concisa tres enfoques. Primero, evi-
tando las discusiones de caracter histórico, se introducen los postulados de la relatividad
especial contrastado con la relatividad clásica, y sus consecuencias fenomenológicas en
situaciones fı́sicas concretas. Segundo, se replantea la cinemática relativista usando un
lenguaje puramente geométrico en el contexto de los diagramas de espacio-tiempo, don-
de se enfatiza la importancia de los principios de invariancia usando rotaciones de ejes
espacio-temporales. Finalmente, y relacionado con los dos enfoques anteriores, se hace
una introducción formal al lenguaje del álgebra tensorial como una herramienta eficien-
te para introducir principios de invariancia y describir las variables fı́sicas, yendo más
allá de los básicos cuadri-vectores. Como aplicación, se replantea de nuevo la cinemáti-
ca y dinámica de la relatividad en el lenguaje tensorial, y se hace una introducción a la
formulación covariante de la electrodinámica.
Como resultado de la propuesta, se espera que el estudiante, primero, adquiera una
visión global e integral de la relatividad especial visto desde los tres enfoques. Segun-
do, que el estudiante adquiera destresas no solamente en el planteamiento y solución
de problema relativistas usando álgebra tradicional, si no que adicionalmente aproveche
herramientas como los diagramas de espacio-tiempo desde el punto de vista geométrico
y del cálculo tensorial desde un punto de vista algebraico para plantear, entender y resol-
ver problemas, lo que le permita en el futuro tener las herramientas básicas para iniciarse
en un trabajo de investigación en las áreas afines de forma más rápida y fluida.
Introducción

Uno de los propósitos de la fı́sica es la de lograr describir la mayor cantidad de


fenómenos observados en la naturaleza con la mı́nima cantidad de suposiciones inicia-
les, incluso aunque los fenómenos muchas veces parecen ser muy distintos. En la historia
moderna de la ciencias, hay muchos ejemplos de hechos diferentes que se han logrado
entender bajo una única visión, o al menos en relación muy próxima. La caı́da libre de
los objetos en la superficie de la Tierra, el movimiento de los planetas alrededor del
Sol, la dinámica de las estrellas y galaxias en el Universo observable, etc, se descri-
ben de forma aproximada con una única ley: la ley gravitacional de Newton. Las reglas
que obedecen los circuitos eléctricos, los fenómenos magnéticos, la óptica de la luz, la
radiación de partı́culas cargadas, etc, se logran describir clásicamente con solamente 4
ecuaciones fundamentales: las ecuaciones de Maxwell. Para citar un ejemplo más actual,
la interacción de fotones muy energéticos con la materia y los procesos de decaimiento
radioactivo de la materia como el decaimiento beta, se logran describir por un principio
común de simetrı́as: el modelo estándar electrodébil. En ese esfuerzo de encontrar una
relación común entre diferentes fenómenos, la fı́sica ha logrado identificar en los prin-
cipios de relatividad, un conjunto de premisas fundamentales que deben ser obedecidas
por las teorı́as fı́sicas, y que logró su máximo alcance con la fomulación de la relatividad
especial.

Básicamente, un principio de relatividad es un principio de invariancia entre dife-


rentes sistemas de referencias [inerciales] relacionado con algún parámetro o alguna ley
fı́sica. En particular, los postulados de la relatividad especial tienen un alcance tal que
hasta donde sabemos, se cumple para todas las leyes de la fı́sica conocidas, y que tiene
consecuencias dramáticas en la concepción clásica de los fenómenos. Con el propósito
de lograr un entendimiento integral, aunque introductorio de la relatividad especial, el
presente texto se divide en tres partes: primero, los fundamentos fı́sicos, donde se expo-
nen las consecuencias fı́sicas de los principios de la relatividad a nivel de la mecánica.

1
Segundo, los fundamentos geométricos, en la cual se reinterpreta la concepción del es-
pacio y del tiempo bajo el contexto de los principios. Tercero, los fundamentos algebrai-
cos, donde después de una revisión puramente matemática, se reformulan las leyes de la
mecánica y la electrodinámica en el lenguaje formal y moderno de los tensores.
Parte I
Fundamentos Fı́sicos

3
CAPÍTULO 1

La relatividad clásica

Existen diferentes principios de relatividad planteados en el contexto de situaciones


fı́sicas particulares. Incluso, la relatividad especial tuvo su origen puntual en los fenóme-
nos electromagnéticos, particularmente en los problemas asociados a la propagación de
la luz. Sin embargo, fue Einstein quien por primera vez formuló un principio de rela-
tividad que no solamente abarcaba los fenómenos electromagnéticos, sino que además
cambiaba de forma dramática nuestra concepción del espacio, el tiempo y la energı́a,
afectando a todos los fenómenos fı́sicos conocidos, desde la mecánica hasta la fı́sica
subatómica.
En este capı́tulo haremos primero una revisión básica y discutiremos algunas conse-
cuencias del principio de relatividad clásico asociados a las partı́culas puntuales. Poste-
riormente, describirémos la relatividad asociada a las ondas mecánicas, donde se enten-
derá desde el punto de vista mecánico algunos resultados de los fenómenos ondulatorios,
lo cual será de importancia central para contextualizar las interpretaciones que los fı́sicos
de finales del siglo XIX daban a algunos de los experimentos con luz.

1.1. Definiciones básicas


Antes de abordar el caso de la relatividad clásica, es fundamental establecer las de-
finiciones más básicas del lenguaje de la relatividad.

1. Evento: Intuitivamente, un evento es un hecho fı́sico que ocurre en cierta región


limitada de espacio y que tiene una duración en un intervalo de tiempo dado. Sin
embargo, formalmente, lo vamos a definir como un punto matemático asociado a
una posición y un instante de tiempo especı́ficos, y que representa un hecho fı́sico

5
6 CAPÍTULO 1. LA RELATIVIDAD CLÁSICA

puntual. En la práctica, los eventos se asemejan más a nuestra idea intuitiva que a
la formalmente definida. Sin embargo, la definición formal es compatible con la
realidad si asumimos que los fenómenos fı́sicos se pueden reproducir como una
sucesión continua de eventos puntuales, que de ahora en adelante simplemente los
vamos a llamar eventos. Ejemplos de eventos son: una partı́cula ubicada en una
posición r(t) en el instante de tiempo t, la colisión de dos partı́culas [puntuales]
en un punto, el decaimiento de un núcleo en un instante t, etc.

2. Sistema Inercial: El principio de relatividad especial se plantea en sistemas de re-


ferencia donde se cumple la ley de inercia de Galileo generalizada en la primera
ley de Newton. Para que dicha ley se cumpla, el sistema inercial debe asociarse a
cuerpos en movimiento rectilı́neo y uniforme. Ası́, un sistema inercial lo definire-
mos simplemente como un conjunto de cuerpos no acelerados.

3. Observador Inercial: El proceso de medición en relatividad especial es una parte


fundamental en la concepción misma del tiempo y el espacio. Para incorporarlo
de forma natural, es necesario ampliar el concepto de sistema inercial e incluir
los instrumentos de observación. Ası́, se define un observador inercial como un
conjunto compuesto por un sistema de ejes coordenados inerciales, reglas y relojes
que permiten registrar en “tiempo real” las posiciones y los tiempos de los eventos,
es decir, en el lugar exacto donde ocurren y en el instante cuando ocurren. Para que
esta definición tenga sentido, es necesario garantizar siempre que haya una regla y
un reloj en cada uno los puntos del sistema coordenado donde pueden ocurrir los
eventos.

1.2. Las transformaciones de Galileo


La relatividad clásica de las partı́culas puntuales fue establecida originalmente por
Galileo, y soportadas en un conjunto de ecuaciones conocidas como las transformaciones
de Galileo. Con el propósito de comparar las diferentes relatividades, vamos a clasificar
las transformaciones en los siguientes dos postulados:

1. Invariancia del intervalo de tiempo


Si ∆t representa el intervalo de tiempo entre dos eventos medido por un observador
inercial Σ, y ∆t 0 el medido por otro observador inercial Σ0 en movimiento relativo
respecto a Σ, se cumple la relación:

∆t = ∆t 0 , (1.1)

es decir, los intervalos de tiempo entre eventos son los mismos para todo observa-
dor inercial.
1.3. LA RELATIVIDAD DE LAS PARTÍCULAS PUNTUALES 7

2. Transformación de la posición
La Figura 1.1 representa los ejes coordenados de dos observadores inerciales, Σ y Σ’
u

Σ0 , en movimiento relativo con velocidad relativa u, y P representa un evento que
Σ
P

ocurre en las posiciones mostradas y en el instante de tiempo t, que de acuerdo a
la invariancia del tiempo, es el mismo para ambos observadores. Realizando una r
r’

simple suma de vectores y teniendo en cuenta que u = dR dt , se puede demostrar que
las posiciones de P cumplen la relación vectorial: R

r0 (t) = r(t) − ut, (1.2)
Figura 1.1
donde R es la posición relativa entre observadores y donde se asume que sus orı́ge-
nes coinciden en el tiempo t = 0. Es importante enfatizar que la regla de transfor-
mación (1.2) se cumple bajo la suposición de la invariancia de tiempo, la cual no
será cierta en relatividad especial.

1.3. La relatividad de las partı́culas puntuales


El principio de relatividad de Galileo que rige el movimiento de las partı́culas pun-
tuales en el contexto de la mecánica clásica, se puede enunciar de la siguiente forma:

Las leyes clásicas de la dinámica deben ser


las mismas para cualquier observador inercial

Existen dos formas equivalentes de enunciar el principio de relatividad clásico:

à Las leyes de Newton son invariantes bajo las transformaciones de Galileo.

à Es imposible medir la velocidad absoluta de un cuerpo usando solamente experi-


mentos dinámicos.

Es importante enfatizar que este principio de relatividad no es exacto y no se extiende


a todos los fenómenos de la naturaleza. Solamente se cumple de forma aproximada en
fenómenos asociados a la dinámica de partı́culas puntuales y a bajas velocidades [en
relación a la velocidad de la luz]. También es necesario hacer notar que el principio no
se cumple en los fenómenos asociados a ondas mecánicas, aunque las transformaciones
de Galileo sigan siendo válidas. A continuación, discutiremos algunas consecuencias de
la relatividad de Galileo.

1.3.1. Teorema de adición de velocidades


Si un observador inercial Σ mide que una partı́cula tiene una velocidad v, usando
las transformaciones de Galileo expresadas por las ecuaciones (1.1) y (1.2), se puede
8 CAPÍTULO 1. LA RELATIVIDAD CLÁSICA

calcular la velocidad de esa misma partı́cula medida por otro observador Σ0 que se mueve
con velocidad u relativa a Σ:

dr0 (t 0 ) dr0 (t) d


v0 = = = (r(t) − ut) = v − u, (1.3)
dt 0 dt dt
que corresponde al teorema clásico de adición de velocidades.

1.3.2. Invariancia de la aceleración


Considerando los mismos observadores del caso anterior, si a es la aceleración de la
partı́cula medida por Σ, se puede demostrar con el mismo procedimiento anterior que la
aceleración en Σ0 es:

a0 = a. (1.4)
Ası́, las aceleraciones al igual que el tiempo, son las mismas para todos los observadores
inerciales, o dicho de otra forma, la aceleración es invariante bajo las transformaciones
de Galileo.

1.3.3. La fuerza y masa inercial clásicos


En mecánica clásica, el concepto de fuerza es fundamental en la descripción de la
dinámica. La razón de ello es porque las leyes de Newton y el principio de relatividad
de Galileo, permiten definir la fuerza con dos propiedades importantes: la fuerza es una
cantidad invariante y absoluta. Para mostrar cómo se obtienen estas propiedades, parta-
mos de la premisa que las leyes de la dinámica se rigen por las leyes de Newton, por lo
que deben cumplir con el principio de relatividad de Galileo.
1. Primera ley: Como consecuencia de la primera ley de Newton, si un observador
inercial Σ mide que una partı́cula se mueve uniformemente (su velocidad es cons-
tante), entonces la fuerza sobre la partı́cula debe ser nula. Si otro observador iner-
cial Σ0 en movimiento relativo mide la velocidad de esa misma partı́cula aplicando
el teorema de adición de velocidades según la ecuación (1.3), también medirá que
es constante, es decir, la fuerza seguirá siendo nula. Ası́, si una fuerza es cero para
un observador inercial, será cero para todos los observadores inerciales. Decimos
entonces que la fuerza es una cantidad absoluta.
2. Segunda ley: La segunda ley de Newton define matemáticamente la fuerza como
el producto entre la masa inercial m y la aceleración de una partı́cula. Entonces,
el observador Σ escribe la ecuación en la forma F = ma. Por el principio de rela-
tividad, el observador Σ0 debe escribir la misma ley para su propio sistema coor-
denado inercial, es decir F0 = m0 a0 . Como la aceleración es la misma para ambos
observadores, se encuentra la igualdad:
1.4. LA RELATIVIDAD DE LAS ONDAS MECÁNICAS 9

F0 F
0
= . (1.5)
m m
Si definimos la masa inercial como una propiedad intrı́nseca de la materia inde-
pendiente del sistema de referencia, de acuerdo a (1.5) se puede definir la fuerza
como una cantidad invariante. Ası́, si m0 = m entonces F0 = F. También se pue-
de ver en forma inversa: si la fuerza es invariante, entonces la masa también va a
ser invariante. De esta manera, del principio de relatividad y de la segunda ley de
Newton se derivan dos propiedades importantes de la mecánica clásica: la fuerza
sobre los cuerpos y la masa inercial de los cuerpos se definen clásicamente tal
que sean las mismas para todos los observadores inerciales, es decir, la fuerza y la
masa en mecánica clásica son cantidades invariantes.

1.4. La relatividad de las ondas mecánicas


Otra clase de fenómenos observados en la naturaleza son aquellos asociados a las on-
das mecánicas, que exhiben una cinemática y una relatividad diferentes al de las partı́cu-
las. Primero, mientras que la propagación de un objeto se describe como el movimiento
localizado de materia en el espacio, una onda mecánica describe la propagación de una
deformación local en un medio material, donde cada parte del medio sufre pequeños
corrimientos alrededor de un punto fijo en el espacio, pero no se desplaza junto a la de-
formación. Ası́, lo que nos interesa es describir cómo esa deformación se extiende a lo
largo del medio. Segundo, la cinemática de las ondas está determinada por un conjunto
adicional de parámetros asociados a la deformación, y que no aparecen en el movimien-
to de las partı́culas puntuales, como la amplitud, el periodo, la frecuencia, etc.. Para el
propósito de la presente discusión, nos limitamos a las llamadas ondas armónicas, cuyas
propiedades se resumen en el Apéndice A. Las propiedades relativistas de los movi-
mientos ondulatorios vienen descritas por la ecuación de onda, la cual cumple con el
siguiente principio de relatividad

La ecuación de onda de una onda mecánica es la misma


sin importar el movimiento de la fuente. Depende
del movimiento del observador inercial respecto al medio

Como un corolario del principio anterior, se tiene la siguiente propiedad:

à Las velocidad de una onda mecánica es independiente del movimiento de la fuen-


ta que la produce. Depende de las propiedades del medio y del movimiento del
observador inercial respecto al medio.

Hay que enfatizar que aunque la naturaleza de los fenómenos ondulatorios y de partı́cu-
las puntuales son muy diferentes, la relación de la posición, tiempo y velocidad de la
10 CAPÍTULO 1. LA RELATIVIDAD CLÁSICA

onda entre distintos observadores inerciales sigue siendo gobernada por las transforma-
ciones de Galileo. Para estudiar las consecuencias del principio de relatividad anterior,
es necesario usar la relación de dispersión descrita en el Apéndice A en términos de la
longitud de onda λ :
c
λ= = cT, (1.6)
f
donde c es la velocidad de la onda, f la frecuencia y T el periodo. Para enmarcar la
discusión en un contexto fı́sico conocido, vamos a considerar ondas sonoras.

1.4.1. Retraso longitudinal


En la siguiente situación, el sistema fı́sico coincide con el observador:
Un parlante emite un pulso de sonido hacia una pared rı́gida ubicada a una
distancia L. El pulso se refleja en la pared y se devuelve en dirección opuesta
hacia el parlante, donde es detectada por un micrófono. Calcular el tiempo total
entre la emisión y la detección del pulso si a.) el sistema fı́sico se encuentra en
reposo respecto al medio (la atmósfera) y b.) el sistema se mueve con velocidad
u en dirección de emisión del pulso.
En el caso a.), el sistema de referencia del observador coincide con el sistema
ΣM
en reposo del medio ΣM , como se ilustra en la Figura 1.2. Es evidente de la
figura que el tiempo total de ida y regreso del pulso es:
c
-c

2L
t= . (1.7)
0
L |c|

Figura 1.2 En el caso b.), aunque el sistema fı́sico se encuentre en movimiento, la veloci-
dad del pulso respecto al medio sigue siendo c por el principio de relatividad
para ondas. Ası́, el observador Σ0 que se mueve con el sistema, medirá una
velocidad transformada de acuerdo al teorema de adición de la ecuación (1.3).
Primero, para el pulso de ida, si identificamos v0 = c0 como la velocidad de la
ΣM
Σ’
onda medida por Σ0 , v = c la velocidad de la onda respecto al medio ΣM y u
-u
c’
-c’’
la velocidad de Σ0 respecto a ΣM , entonces se cumple que c0 = c − u, como se
muestra en la Figura 1.3. Para el pulso de vuelta, se cambia c0 por −c00 y c por
−c, por lo que el observador mide −c00 = −c − u. Ası́, el tiempo total de viaje
medido por Σ0 es:
Figura 1.3
L L
t 0 = tida
0 0
+ tvuelta = +
|c | |−c00 |
0

L L
= +
c−u c+u
2L
= . (1.8)
c (1 − u2 /c2 )
1.4. LA RELATIVIDAD DE LAS ONDAS MECÁNICAS 11

La cantidad u2 /c2 aparece frecuentemente en relatividad, por lo que conviene escribirlo


en términos del siguiente parámetro adimensional:
u
β= , (1.9)
c
por lo que el tiempo total de un pulso que viaja con la misma orientación de movimiento
del sistema es:

2L ΣM

tk0 = . (1.10)
c (1 − β 2 )
Si en lugar de un parlante emitiendo un pulso de sonido, se tiene un cañón que dis- c
para proyectiles, hubiésemos obtenido que el tiempo de ida y vuelta de un proyectil con
el sistema en movimiento serı́a el mismo que con el sistema en reposo, en concordancia
con el principio de relatividad de Galileo, que en éste caso se interpreta de la siguiente
forma: midiendo el tiempo de viaje de proyectiles, no es posible distinguir si el obser-
vador está en reposo o en movimiento respecto al medio. En contraste, en el caso de las
ondas, observamos que el tiempo medido con el sistema en reposo (ecuación (1.7)) difie-
re del tiempo medido con el sistema en movimiento (ecuación (1.10)), debido al factor
β , que contiene justamente la velocidad del sistema respecto al medio. Ası́, por medio
de un experimento con ondas como el ilustrado, es posible determinar si un observador
inercial está o no en reposo respecto a un sistema de referencia particular: el sistema del
medio por donde se propaga la onda, lo que demuestra el alcance limitado del principio
de relatividad de Galileo.
Figura 1.4
1.4.2. Retraso transversal
Rotemos ahora el sistema en un ángulo de 900 hacia arriba. Si el sistema se encuentra
en reposo respecto al medio, no hay ninguna diferencia con el caso a.) anterior, por lo
que el tiempo de viaje sigue siendo el de la ecuación (1.7). Sin embargo, cuando el
sistema se mueve horizontalmente, las ondas se emitirán transversales al movimiento de
la fuente. Para calcular el tiempo de viaje del pulso, vamos a cambiar la tactica usada
anteriormente. En vez de usar la transformación de velocidades para calcular el tiempo
directamente desde el observador Σ0 , calculemos el tiempo que mide el observador en ctida

reposo ΣM . De acuerdo a éste observador, el frente de onda se propaga con la secuencia
mostrada en la Figura 1.4, desde el instante en que se emite, pasando por el instante
L
cuando se refleja en la pared y finalmente cuando vuelve al parlante. Al final, lo que
interesa es calcular el tiempo de viaje del rayo de la porción del frente de onda que utida

se detecta, representado por las flechas. Para la trayectoria de ida, el rayo describe la
hipotenusa de un triángulo cuyo lado opuesto es la distancia L entre el parlante y la
pared, mientras que el lado adyacente es la distancia que alcanza a desplazarce el parlante Figura 1.5
durante el tiempo de ida, que es utida , como se ilustra en la Figura 1.5. Usando el teorema
de Pitágoras, se obtiene:
12 CAPÍTULO 1. LA RELATIVIDAD CLÁSICA

L2
c2tida
2
= , (1.11)
1−β2
con β definido en la ecuación (1.9). Como la distancia recorrida por el rayo de regreso es
el mismo que el de ida, vamos a obtener el mismo resultado. Ası́, despejando el tiempo
en la ecuación (1.11) y multiplicando por dos, obtenemos el tiempo total de viaje del
pulso emitido transversal al movimiento del sistema:

2L
t⊥ = p . (1.12)
c 1−β2
Puesto que, clásicamente, los intervalos de tiempo de eventos son invariantes, de acuerdo
a (1.1), el observador en movimiento Σ0 va a medir el mismo tiempo del pulso en ir y
volver:

0 2L
t⊥ = p . (1.13)
c 1−β2
Al comparar el resultado anterior con el tiempo del pulso emitido paralelo a la di-
rección del movimiento dado por la ecuación (1.10), se comprueba que tk0 > t⊥ 0 . Ası́, en

éste experimento con ondas sonoras, no solamente podemos determinar si un observador


se encuentra en movimiento respecto al medio, sino que además, podemos determinar
su dirección de movimiento relativa a la dirección de propagación de la onda. Como se
verá en el próximo capı́tulo, éste mismo experimento se puede realizar con luz, que es
la esencia del famoso experimento de Michelson-Morley.

1.4.3. Efecto Doppler clásico


En la relatividad de las ondas mecánicas se pueden distinguir diferentes efectos Dop-
pler según el movimiento relativo entre la fuente y el observador. Ilustramos un caso en
detalle, de acuerdo a la siguiente situación fı́sica:

Un parlante emite un pulso de sonido a una frecuencia fF hacia un observador


que lo detecta. Calcular la frecuencia del pulso medida por el observador si a.)
el observador se encuentra en reposo respecto al medio y el parlante se mueve
hacia el observador con rapidez u y b.) el parlante se encuentra en reposo y el
observador se mueve hacia el parlante con rapidez u.

A primera vista, pareciera que ambos casos son equivalentes. De hecho si el problema
fuera con partı́culas, no habrı́a ninguna diferencia si la fuente se mueve hacia el obser-
vador o si es el observador el que se mueve hacia la fuente, que es consecuencia del
principio de relatividad de Galileo. Pero en este caso con ondas, se verá que las dos si-
tuaciones llevan a diferentes soluciones, lo que muestra de nuevo las diferencias entre
la relatividad de las partı́culas puntuales y la de las ondas mecánicas. En el diagrama de
1.4. LA RELATIVIDAD DE LAS ONDAS MECÁNICAS 13

la Figura 1.6 se muestra la situación del caso a.) visto desde el sistema del observador
en reposo ΣO , donde ΣF es el sistema de la fuente en movimiento. De acuerdo a la rela-
ción de dispersión de la ecuación (1.6), la longitud de onda medida por el observador en
reposo es:
c ΣF
ΣO

λO = ,
fO
(1.14) u

donde fO es la frecuencia medida por el observador. Sin embargo, ésta frecuencia no es c
la misma que la emitida por la fuente. La razón es que los pulsos van a salir mas cercanos
uno a otro debido al desplazamiento continuo de la fuenta. Para ilustrar ésto, la gráfica
de la Figura 1.7 muestra la secuencia de emisión de dos frentes de onda, 1 y 2, el primero
en el tiempo cero, y el segundo después de un periodo TF , correspondiente al periodo de Figura 1.6
emisión. Como se puede ver en la segunda gráfica, el parlante se ha movido una distancia
uTF , mientras que el primer pulso ha avanzado la distancia cTF . De la figura, se deduce
que la longitud de onda medida por el observador y que coincide con la distancia entre
los dos pulsos es: 1  
c−u cTF

λO = (c − u)TF = , (1.15)
fF
2   1  
donde se usó la definición T = 1/ f en la segunda igualdad. Igualando las ecuaciones
(1.15) y (1.14), se obtiene que la frecuencia medida por el observador es:
uTF

fF
fO = , (1.16)
1−β Figura 1.7
con β el factor definido en (1.9). Como la velocidad es hacia el observador, el factor β es
positivo, lo que implica que la frecuencia detectada fO es mayor a la frecuencia emitida
fF . Sin embargo, ésa misma ecuación se aplica también al caso en que la fuente se aleja
del observador, con la diferencia de que el factor β se vuelve negativo, por lo que en ese
caso la frecuencia detectada va a ser menor a la emitida.
El caso b.) se puede resolver de la misma forma. La diferencia fundamental radica
en que el observador, el cual ahora está en movimiento respecto al medio, mide una ve-
locidad del sonido dada por c0 = c + u, de acuerdo al teorema de adición de velocidades.
Ası́, para este caso, las ecuaciones (1.14) y (1.15) se convierten en:

c0 c0 − u
λO = = (c0 − u)TF = . (1.17)
fO fF
Reemplazando la velocidad c0 = c + u en la ecuaciones anteriores y despejando en térmi-
nos de las frecuencias, se obtiene para el efecto Doppler con fuente en reposo que:

fO = fF (1 + β ), (1.18)
la cual claramente difiere del resultado para el efecto Doppler con fuente en movimiento
dado por (1.16).
14 CAPÍTULO 1. LA RELATIVIDAD CLÁSICA

Problema 1: Demuestre que para el caso más general en que tanto la fuente como el
observador se mueven con velocidades u y v en relación al medio, respectivamente,
la frecuencia medida por el observador es:
 
1 − v/c
fO = fF . (1.19)
1 − u/c
CAPÍTULO 2

La relatividad especial

En el capı́tulo anterior describimos los principios de relatividad para partı́culas pun-


tuales y ondas mecánicas. En éste capı́tulo extenderemos la descripción a la relatividad
de la propagación de la luz, de la cual se desprenderá de forma natural la necesidad de
reformular los principios de relatividad clásicos a una nueva relatividad. En particular,
la discusión se centra en el histórico experimento de Michelson-Morley. Motivado por
la evidencia experimental, formularemos los dos postulados de la relatividad. Finalmen-
te, obtendremos las transformaciones de Lorentz simples asumiendo la validez de los
postulados y aplicados en situaciones fı́sicas particulares.
A continuación, haremos una descripción simplificada del experimento de Michelson-
Morley, que aunque irrealizable, destaca las ideas esenciales que nos permitirá entender
la necesidad de formular una nueva relatividad. Una descripción mas realista del experi-
mento se muestra en el Apéndice B.

2.1. Experimento de Michelson-Morley


Durante el siglo XIX, las numerosas evidencias experimentales recolectadas de los
fenómenos eléctricos y magnéticos condujeron a una formulación matemática unificada
desarrollada por James C. Maxwell y sintetizadas en 4 ecuaciones fundamentales, co-
nocidas hoy en dı́a como las ecuaciones de Maxwell. En particular, dicha formulación
era compatible con la naturaleza ondulatoria de la luz. En electrodinámica clásica, la
luz se describe como una onda de campos eléctricos y magnéticos que se propaga en el
espacio a una velocidad enorme pero finita de aproximadamente 3 × 108 m/s. Puesto que
los únicos fenómenos ondulatorios conocidos en la época eran las ondas mecánicas, los
fı́sicos le dieron inicialmente una interpretación de naturaleza mecánica a los procesos

15
16 CAPÍTULO 2. LA RELATIVIDAD ESPECIAL

de propagación de la luz, lo que en particular presumı́a las siguientes propiedades:

1. La luz debı́a ser la propagación de perturbaciones en un medio material. Puesto


que los objetos astronómicos son visibles, dicho medio debı́a llenar completa-
mente el Universo y poseer propiedades extraordinarias para ser indetectable por
otros medios diferentes a la de la luz. A dicho medio se le dió el nombre de éter
luminı́fero.

2. La velocidad de la luz es independiente del movimiento de la fuente. Sólo depende


del movimiento del observador a través del éter.

De acuerdo a lo descrito en el capı́tulo anterior, una forma de detectar la existencia del


éter es midiendo nuestra [de la Tierra] velocidad relativa por medio de experimentos con
ondas luminosas. Por ejemplo, por medio de la diferencia de tiempos de rayos de luz
viajando transversal y horizontalmente a la dirección de movimiento, se puede inferir el
factor beta de las ecuaciones (1.10) y (1.13). Para eso, se plantea el siguiente montaje
experimental:
Espejo  

L
Un láser de luz monocromática se orienta en dirección de mo-
vimiento de la Tierra. El rayo de luz se divide en dos haces
B   Espejo   perpendiculares, A y B, a través de un espejo semitransparen-
te orientado a 450 respecto al rayo principal. A una distancia
Láser   A  
L
L se encuentran dos espejos reflectores donde incide cada haz,
los cuales regresan al espejo semitransparente y se recombi-
nan sobre una pantalla, como se muestra en la Figura 2.1
Pantalla  

Figura 2.1 Si suponemos que la Tierra se mueve hacia la derecha, el haz A regresa al espejo semi-
transparente después del tiempo tk0 de (1.10), mientras que el B lo hará en el tiempo t⊥
0

de (1.13). Ası́, el rayo A llega con un retraso respecto al B dado por la diferencia:

2L 2L
∆t 0 = tk0 − t⊥
0
= 2
− p
c (1 − β ) c 1 − β 2
!
2L 1 1
= 2
−p . (2.1)
c 1−β 1−β2

Si asumimos que el sistema de referencia del éter coincide aproximadamente con el


sistema en reposo del Sol, la velocidad de la Tierra a través del éter será su velocidad
orbital. Teniendo en cuenta que c es la velocidad de la luz, se obtendrı́a un factor beta
del orden de β = u/c ∼ 1 × 10−4 , que es una cantidad muy pequeña. Ası́, una forma
de simplificar la diferencia de tiempo en la ecuación (2.1), es tomando los términos
2.1. EXPERIMENTO DE MICHELSON-MORLEY 17

dominantes de hasta segundo orden en una expansión de Taylor en cada factor dentro
del paréntesis:

−1
1−β2 ≈ 1+β2
−1/2 1
1−β2 ≈ 1 + β 2,
2
por lo que la diferencia de tiempo entre ambos rayos es aproximadamente:

L
∆t 0 ≈ β 2 . (2.2)
c
Si realizamos un estimativo numérico, para un montaje con L = 1 m y tomando
c ≈ 3 × 108 m/s y β ≈ 1 × 10−4 , obtenemos diferencias de tiempo del orden de 3 × 10−17
s, que es una cantidad muy pequeña, por lo que medir directamente tiempos no resul-
ta práctico. Sin embargo, Michelson y Morley explotaron la propiedad de interferencia
de las ondas para detectar de forma indirecta el efecto de la diferencia de los tiempos.
Para entender el método usado en el experimento, vamos a asumir una situación ideal
suponiendo que 1.) los rayos de luz siguen un único camino óptico, 2.) el espejo se-
mitransparente divide el haz en dos rayos perfectamente perpendiculares entre sı́, y los
espejos reflejan los rayos en direcciones exactamente opuestas y 3.) la única fuente de
retraso entre ambos rayos es debido al supuesto movimiento de la tierra a través del éter.
Bajo tales condiciones, se puede realizar un estimativo simple de la intensidad de la luz
que incide sobre la pantalla utilizando el cálculo complejo para describir las oscilacio-
nes de campos. Si EA y EB describen las componentes de campo eléctrico de cada haz
cuando inciden sobre la pantalla y asumimos que ambos rayos tienen la misma frecuen-
cia angular ω, entonces los campos oscilan sobre la pantalla de acuerdo a las formas
armónicas:

0 0 0
EA = E0 eiω(t +∆t ) , EB = E0 eiωt , (2.3)

donde se supone que ambos campos tienen la misma amplitud E0 y ∆t 0 es la diferencia


de tiempo entre los rayos dada por la ecuación (2.2). Si los rayos llegan en perfecta
alineación y sincronı́a, sobre la pantalla se detecta un solo campo eléctrico dado por:

 0 0 0

E = EA + EB = E0 eiω(t +∆t ) + eiωt
 
iωt 0 iω∆t 0
= E0 e 1+e . (2.4)

La intensidad observada es proporcional al cuadrado de la magnitud del campo eléctrico


total, es decir:
18 CAPÍTULO 2. LA RELATIVIDAD ESPECIAL

I ∼ |E|2 = EE ∗ = 2E02 1 + cos (ω∆t 0 ) ,


 
(2.5)

donde hemos usado la ecuación de Euler para expresar las exponenciales complejas en
forma de funciones trigonométricas:

eiy = cos(y) + i sin(y). (2.6)

Ası́, se obtiene que la intensidad depende de la diferencia de tiempo ∆t 0 , la cual de


acuerdo a la ecuación (2.2) depende a su vez de la velocidad de la Tierra a través del
hipotético éter. La gráfica de la Figura 2.2 ilustra la forma en cómo cambia la intensidad
para diferentes valores del factor β .
Por ejemplo, si β = 0, la intensidad detectada en la pantalla será la máxima.
2.0 Pero si β ≈ 1.3×10−4 , la intensidad disminuye a la mitad. En el caso en que no
1.5 se detecte nada sobre la pantalla (intensidad nula), es porque β = 1.7 × 10−4 .
Para valores mayores, la intensidad oscila. Aunque la velocidad de la Tierra es
I 1.0
una cantidad fija sobre la que no tenemos control, el efecto de la oscilación se
0.5 puede manifestar si se rota el sistema en un ángulo α respecto a la dirección de
0.0 movimiento. En ese caso la intensidad dependerá de la velocidad proyectada

b @¥ 10 D
0 0.5 1 1.5 2 2.5 3 a lo largo de los rayos, tal que si α se hace variar, la intensidad cambiará en
-4
forma parecida a la descrita por la figura.

Figura 2.2 Aunque el método descrito es irrealizable en la práctica, ilustra la esencia del efecto
usado para determinar la existencia del éter. En el Apéndice B se describe el montaje en
forma más cercana al experimento original. Si trasladamos los resultados reales a lo que
se obtendrı́a en el experimento idealizado, los datos nos darı́an una intensidad máxima
y sin oscilaciones, que de acuerdo a la Figura 2.2, es compatible con un valor β = 0,
es decir, los experimentos no detectaron un movimiento relativo respecto al éter, lo que
abrió de nuevo las preguntas acerca de la verdadera naturaleza de la luz.

Problema 2: Si las distancias a los espejos reflectores son LA y LB recorridas por los
rayos A y B respectivamente, calcule la diferencia de tiempo de los rayos cuando se
recombinan. Calcule la diferencia de tiempo si el sistema se rota en 900 . Demuestre
que hasta orden cuadrático, la resta entre las diferencias de tiempo es:
 
LA + LB
∆t00 0 0
− ∆t90 0 ≈ β 2. (2.7)
c
2.2. POSTULADOS DE LA RELATIVIDAD ESPECIAL 19

2.2. Postulados de la relatividad especial


El resultado nulo de la detección del éter a través del experimento de Michelson-
Morley se sumó a una serie de otros indicios de que habı́a algo mal en la teorı́a. Ini-
cialmente, los fı́sicos asociaron dichos problemas a la misma teorı́a de Maxwell, y otros
trataron de explicar los resultados de las mediciones planteando efectos adicionales del
éter que fueran compatibles con esos resultados. Sin embargo, fué Albert Einstein quién
finalmente encontró el origen de la inconsistencia. El problema estaba, primero, en la
interpretación mecánica de la propagación de la luz, y segundo, en la errónea concep-
ción del espacio y del tiempo de la mecánica clásica, problema que los principios de
relatividad clásicos y las transformaciones de Galileo heredaban, ası́ como las leyes de
la dinámica, en concreto, la segunda y tercera ley de Newton.
Para el primero de los problemas, Einstein evitó el concepto del éter asociándole a la
luz una nueva naturaleza diferente a las partı́culas puntuales y a las ondas mecánicas. Ası́,
la luz no son partı́culas [clásicas] puntuales ni deformaciones de un medio propagándose
en el espacio. La luz es una onda de variación de campos eléctricos y magnéticos que
se pueden propagar independiente de la materia. Ası́, el resultado nulo en experimentos
como el de Michelson-Morley es consecuencia de la inexistencia de un medio por donde
se propague la luz en el espacio exterior.
Para el segundo problema, Einstein planteó un principio de relatividad a partir de los
siguientes postulados :

I. Postulado de relatividad: Las leyes fı́sicas deben ser las


mismas para todos los observadores inerciales.

II. Postulado de la velocidad de la luz : La velocidad de la luz


en el vacı́o es la misma para todos los observadores inerciales,
independiente de la dirección de propagación y del movimiento
de la fuente.

El postulado I, a diferencia del principio de relatividad de Galileo, no se restringe


solamente a las leyes dinámicas de las partı́culas puntuales, sino que abarca la totalidad
de los fenómenos fı́sicos, incluyendo partı́culas puntuales y fenómenos electromagnéti-
cos (y hasta donde sabemos hoy en dı́a, a cualquier fenómeno fı́sico). El postulado II,
comparte con las ondas mecánicas la propiedad de que la velocidad es independiente del
movimiento de la fuente. Sin embargo, la luz además es independiente del movimiento
del observador inercial, es decir, la velocidad de la luz es una constante universal que
vale aproximadamente c = 3 × 108 m/s sin importar que el observador se acerque o se
aleje de la fuente. Como consecuencia, las transformaciones de Galileo expresadas por
las ecuaciones (1.1) y (1.2) resultan incompatibles con los postulados anteriores. Ası́,
20 CAPÍTULO 2. LA RELATIVIDAD ESPECIAL

se debe plantear un nuevo conjunto de transformaciones entre observadores inerciales


que adopte los postulados. Otra consecuencia, es que las nuevas transformaciones que
reemplacen a las de Galileo no van a dejar invariante a la segunda ley de Newton, lo
que contradice al postulado I. Einstein asoció esta dificultad al hecho de que la segun-
da ley de Newton no es la “verdadera” ley que describe la dinámica de los cuerpos.
Ası́, además de un nuevo conjunto de transformaciones de tiempo y de posiciones, la
relatividad especial trae consigo un nuevo conjunto de leyes dinámicas.

2.3. Transformaciones de Lorentz Simples


Las transformaciones de Lorentz es el conjunto de relaciones de tiempo y posición
entre observadores inerciales compatibles con los postulados de la relatividad especial,
las cuales van a reemplazar a las de Galileo. Para el propósito de la discusión de los
próximos capı́tulos, es suficiente restringirnos a las transformaciones de Lorentz simples
(TLS)1 , en la cual se adopta la siguiente configuración estándar entre dos observadores
inerciales Σ y Σ0 :

i.) Los ejes coordenados de ambos observadores son paralelos entre sı́.

ii.) Solamente existe movimiento relativo entre los observadores en dirección de los
ejes x y x0 .

iii.) Los relojes de los observadores se calibran tal que cuando los origenes de sus ejes
coordenados coinciden, éstos marcan el tiempo t = t 0 = 0.

Bajo la configuración estándar, no existe movimiento relativo en las direcciones


(y, z), por lo que dichas coordenadas no cambian entre observadores, es decir cumplen
las relaciones triviales y = y0 y z = z0 . Ası́, toda la discusión se reduce a la coordena-
da x y al tiempo. Como punto de partida, se plantea una relación lineal general entre
coordenadas y tiempos de la forma:

x0 = Ax + Bt,
t 0 = Dx + Et, (2.8)

donde los coeficientes A, B, D y E son constantes desconocidas. Por ejemplo, una posibi-
lidad es A = E = 1, B = −u y D = 0, con u la velocidad de Σ0 respecto a Σ. Reemplazando
estos coeficientes en el sistema de ecuaciones (2.8), se reproducen las transformaciones
de Galileo dadas por las ecuaciones (1.1) y (1.2) en la configuración estándar. Ası́, di-
cha escogencia de los coeficientes da un conjunto de transformaciones compatible con
el principio de relatividad de Galileo. Sin embargo, tal escogencia no es apropiada bajo
1 La extensión a las transformaciones de Lorentz generales no se abordará sino hasta el capı́tulo 7
2.3. TRANSFORMACIONES DE LORENTZ SIMPLES 21

los postulados de la relatividad especial. Para deducir el nuevo conjunto de coeficientes,


extraigamos las ideas esenciales de los dos postulados en tres principios fundamentales
asociados a dos observadores en movimiento relativo:

a.) Las leyes de la fı́sica son las mismas en Σ y Σ0 .

b.) La velocidad de la luz es la misma en Σ y Σ0 .

c.) La velocidad de la luz es la misma en todas direcciones en Σ y Σ0 .

Partiendo de las transformaciones generales de la ecuación (2.8), vamos a exigir cada


una de las condiciones anteriores en el contexto de situaciones fı́sicas especı́ficas.

a.) Las leyes de la fı́sica son las mismas en Σ y Σ0


Una ley fı́sica fundamental que se sigue cumpliendo en relatividad especial es la ley
de inercia, que se enuncia de la siguiente forma:

Si sobre un cuerpo no se ejercen fuerzas, éste


describirá un movimiento rectilı́neo uniforme.
Para evaluar cómo deben ser las transformaciones entre observadores para que la ley
de inercia se mantenga igual, se plantea la siguiente situación fı́sica:

Dos particulas libres, 1 y 2, se mueven con velocidad relativa u.


Sea Σ el observador donde la partı́cula 1 se encuentra en reposo, y
Σ0 donde la partı́cula 2 está en reposo. Determinar las ecuaciones
de transformación que deja invariante la ley de la inercia.
Σ

Se asume que la fuerza es nula (patı́culas libres). La Figura 2.3 representa los coor- u

denadas de las partı́culas vistas desde cada observador, donde la partı́cula en reposo se 1
2

ubica en el origen del respectivo sistema. Si la ley de inercia es invariante, la acele- x

x2(t2)

ración de las partı́culas deben ser nulas para ambos observadores. Ası́, las ecuaciones
cinemáticas de posición determinadas por cada observador son:
Σ’

(
-u

x1 (t1 ) = 0 1
2

Desde Σ : x’
x2 (t2 ) = ut2 x’1(t1’)

(
x10 (t10 ) = −ut10 Figura 2.3
Desde Σ0 : (2.9)
x20 (t20 ) = 0,

donde x1 (t1 ) y x10 (t10 ) identifican la posición en función del tiempo de la partı́cula 1 medi-
dos por Σ y Σ0 respectivamente, mientras que x2 (t2 ) y x20 (t20 ) marca posiciones y tiempos
22 CAPÍTULO 2. LA RELATIVIDAD ESPECIAL

de la partı́cula 2. Observe que la ausencia de la acelereación en las ecuaciones anterio-


res, es consecuencia de la suposición de que la ley de la inercia se cumple para ambos
observadores. Las ecuaciones de transformación en (2.8) aplicadas a cada partı́cula se
expresan como:
(
x10 (t10 ) = Ax1 (t1 ) + Bt1
Partı́cula 1:
t10 = Dx1 (t1 ) + Et1
(
x20 (t20 ) = Ax2 (t2 ) + Bt2
Partı́cula 2: (2.10)
t20 = Dx2 (t2 ) + Et2 .

Reemplazando las coordenadas espaciales dadas según las ecuaciones (2.9) en las ecua-
ciones (2.10), se obtiene el siguiente sistema de ecuaciones:

(
−ut10 = Bt1
Partı́cula 1:
t10 = Et1
(
0 = Aut2 + Bt2
Partı́cula 2: (2.11)
t20 = Dut2 + Et2 .

Despejando los coeficientes, se obtiene que B = −uA y E = A. Ası́, las ecuaciones de


transformación general de (2.8) se reduce a las siguientes:

x0 = A (x − ut) ,
t 0 = Dx + At, (2.12)

lo que deja pendiente solamente dos coeficientes desconocidos: A y D. Para hallarlos se


Σ
hace uso de los otros dos principios.
c
b.) La velocidad de la luz es la misma en Σ y Σ0
x(t)

Consideremos la siguiente situación:
-u
Σ’
c Una fuente emite un pulso de luz en dirección x desde su sis-
tema en reposo Σ. Otro observador Σ0 se mueve con velocidad
x’(t’)
u constante respecto a la fuente. Determinar las ecuaciones de
transformación que deja invariante la velocidad de la luz.

Figura 2.4 La Figura 2.4 ilustra la propagación del pulso visto desde ambos observadores. Clási-
camente, Σ0 medirı́a una velocidad del pulso dada por c0 = c − u si se aplicara el teorema
clásico de adición de velocidades. Sin embargo, dicho teorema es incompatible con el
postulado de invariancia de la velocidad de la luz, la cual exige que c0 = c, tal como
2.3. TRANSFORMACIONES DE LORENTZ SIMPLES 23

se escribe en la segunda figura. Ası́, las ecuaciones cinemáticas del pulso según cada
observador son:

n
Desde Σ : x(t) = ct
n
Desde Σ0 : x0 (t 0 ) = ct 0 . (2.13)

Si las coordenadas anteriores se reemplazan en las ecuaciones de transformación (2.12),


se obtiene:

ct 0 = A (ct − ut) ,
t 0 = Dct + At. (2.14)

Despejando los coeficientes, se obtiene que D = −Au/c2 . Ası́, las ecuaciones de trans-
formación compatibles con la invariancia de la velocidad de la luz son:

A
y(t)
Σ

0
x = A (x − ut) ,
 
−u
t0 = A x+t , (2.15)
c2

lo que reduce el sistema a una única incógnita: A. Para hallarla, se hace uso del principio
de isotropı́a de la luz.
Figura 2.5

c.) La velocidad de la luz es la misma en todas direcciones en Σ y Σ0

Tomemos de nuevo la situación fı́sica del problema anterior, pero estudiando la pro-
Σ’

pagación de los pulsos en dirección y, esto es, perpendicular al movimiento relativo entre A

y’(t’)

los observadores. Como la propagación del pulso es independiente del movimiento del
observador, el frente de onda se propaga igual sin importar que la fuente se vea o no r’(t’)

en movimiento. Marquemos como A el punto del frente de onda que siempre viaja por
encima de la fuente. La Figuras 2.5 muestra el progreso de A en el sistema Σ con la
fuente en reposo, mientras que en la Figura 2.6 se muestre desde el sistema Σ0 , donde -u

se ve la fuente moverse con velocidad −u. Por el principio de isotropı́a, en ambos siste-
mas la velocidad con que se propaga el punto A es la misma velocidad c. La distancia x’(t’)

r0 (t 0 ) corresponde a la distancia diagonal recorrida por el punto visto desde Σ0 , mientras
que (x0 (t 0 ), y0 (t 0 )) marca sus coordenadas cartesianas. Ası́, las ecuaciones cinemáticas
Figura 2.6
del punto A son:
24 CAPÍTULO 2. LA RELATIVIDAD ESPECIAL

(
x(t) = 0 (1)
Desde Σ :
y(t) = ct (2)
(
x0 (t 0 ) = −ut 0 (3)
Desde Σ0 : , (2.16)
r0 (t 0 ) = ct 0 = x0 (t 0 )2 + y0 (t 0 )2
p
(4)

donde en la última ecuacin, (4), se usó el teorema de Pitágoras. Como no hay movimiento
relativo en dirección y entre los observadores, se cumple trivialmente que y(t) = y0 (t 0 ).
Teniendo en cuenta esto y las coordenadas de acuerdo a (2) y (3), la relación (4) lleva a
la siguiente igualdad:
p
ct 0 = u2t 02 + c2t 2 , (2.17)
la cual, al despejar, se obtiene la siguiente relación de tiempos:
 
1
t 02 = t 2 = γ 2t 2 . (2.18)
1 − u2 /c2
donde se definió el factor γ como:

1
γ=p , (2.19)
1−β2
con β = u/c. Ası́, vemos de la ecuación (2.18) que a diferencia de la relatividad clásica,
en relatividad especial el tiempo no es un invariante bajo transformaciones entre obser-
vadores inerciales. Si las coordenadas dadas por (1) y (3) en las ecuaciones de (2.16), y
el tiempo dado por (2.18) se reemplazan en las ecuaciones de transformación (2.15), se
obtiene:

−uγt = A (0 − ut) ,
 
−u
γt = A (0) + t , (2.20)
c2

de donde se deduce que A = γ. De esta forma, se determina la totalidad de coeficien-


tes compatibles con los postulados de la relatividad especial, obteniendo finalmente las
transformaciones de Lorentz simples (TLS):

x0 (t 0 ) = γ [x(t) − ut] ,
h u i
t0 = γ t − 2 x(t) . (2.21)
c
2.4. ACLARACIONES 25

Problema 3: Usando las TLS, demuestre las siguientes derivadas parciales:

∂ x0 ∂ x0 ∂t 0 γβ ∂t 0
= γ, = −γu, =− , =γ (2.22)
∂x ∂t ∂x c ∂t

Problema 4: De acuerdo a la electrodinámica clásica, la componente de campo


eléctrico de un rayo de luz cumple con la siguiente ecuación de onda:

∂ 2 E(x,t) 1 ∂ 2 E(x,t)
= , (2.23)
∂ x2 c2 ∂t 2
donde el campo E(x,t) es una función de la coordenada y el tiempo medido por un
observador Σ. Calcular la forma de la ecuación de onda según otro observador Σ0 que
se mueve con velocidad relativa u, usando a.) las TLS y b.) las transformaciones de
Galileo. Demuestre que bajo las TLS, la ecuación toma la misma forma que (2.23)
cambiando las variables (x,t) por (x0 ,t 0 ), mientras que bajo las de Galileo, la ecuación
cambia a:
∂ 2 E(x0 ,t 0 ) 1 ∂ 2 E(x0 ,t 0 ) 2u ∂ 2 E(x0 ,t 0 )
= − , (2.24)
∂ x02 c2 − u2 ∂t 02 c2 − u2 ∂ x0 ∂t 0

2.4. Aclaraciones
En relatividad especial es común obtener resultados contradictorios, lo que causa
las paradojas. Sin embargo, es importante aclarar que dichas paradojas no son resulta-
dos de posibles inconsistencias internas de la formulación, sino de una mala aplicación
de las transformaciones de Lorentz o incorrecta interpretación de los postulados. Ası́,
reiteramos el significado de las TLS:

Sea un observador Σ que mide un evento en una posición x(t) en el tiempo


t. Sea otro observador Σ0 que se mueve respecto a Σ a una velocidad u.
Entonces, la posición y el tiempo de ese mismo evento medido por Σ0 se
puede calcular a través de las transformaciones de Lorentz:

x0 (t 0 ) = γ [x(t) − ut] ,
h u i
t0 = γ t − 2 x(t) .
c
26 CAPÍTULO 2. LA RELATIVIDAD ESPECIAL

donde el factor γ se calcula de acuerdo a la ecuación (2.19), el cual a


su vez contiene al factor β = u/c, con u la velocidad relativa entre los
observadores y c la velocidad de la luz.
Algunas aclaraciones adicionales:

1.) Si los eventos involucran el movimiento de partı́culas, hay que ser cuidadosos de
no confundir la velocidad relativa entre observadores con la velocidad misma de la
partı́cula. La velocidad que aparece en las TLS es la relativa entre observadores,
mientras que la velocidad de las partı́culas se calcula derivando las coordenadas,
esto es:

dx(t)
ẋ = : velocidad de la partı́cula medida por Σ
dt
dx0 (t 0 )
ẋ0 = : velocidad de la partı́cula medida por Σ0 . (2.25)
dt 0

2.) En las transformaciones se asume que el signo de la velocidad relativa es positi-


va, es decir cuando Σ0 se mueve hacia “adelante” respecto a Σ. Sin embargo, las
ecuaciones (2.21) también son válidas si Σ0 se mueve en dirección opuesta, pero
siendo cuidadosos de incluir el signo negativo de la velocidad relativa. Ası́, en vez
de tener dos términos que se restan, se tendran términos que suman.

3.) Las TLS expresan las coordenadas y el tiempo de un observador Σ0 en función de


las de Σ. Sin embargo, se puede requerir lo opuesto, expresar las coordenadas y el
tiempo de Σ en función de las de Σ0 . La diferencia es que si Σ0 se mueve en una
dirección respecto a Σ, entonces Σ se moverá en dirección opuesta respecto a Σ0 ,
por lo que el único cambio es la del signo de la velocidad relativa. Tal transforma-
ción se conoce como las transformaciones de Lorentz inversas, y se expresa de las
siguiente forma:

x(t) = γ x0 (t 0 ) + ut 0 ,
 
h u i
t = γ t 0 + 2 x0 (t 0 ) . (2.26)
c

4.) Debido a la velocidad finita de la luz, en relatividad especial es necesario dife-


renciar entre el acto fı́sico de ver los eventos al de observarlos. De acuerdo a las
definiciones descritas en la Sección 1.1 del capı́tulo anterior, observar los eventos
se asocia al acto de medir las posiciones y los tiempos de los eventos en el lugar
donde ocurren y en el instante cuando ocurren. Por otro lado, ver los eventos es el
acto de mirarlos desde una posición fija del espacio alejado del lugar donde ocu-
rren y en instantes retrasados de cuando ocurren. El retraso se debe a la diferencia
2.4. ACLARACIONES 27

de tiempo que surge mientras la luz viaja desde el evento hasta el lugar donde se
ubica la persona. Ası́, en el proceso de interpretación de un resultado, debemos ser
cuidadosos de no confundir la medida de un evento con la imagen gráfica de ver
el evento, ya que ambos no se corresponden uno al otro.
28 CAPÍTULO 2. LA RELATIVIDAD ESPECIAL
CAPÍTULO 3

Cinemática relativista

En este capı́tulo estudiaremos las consecuencias cinemáticas de los postulados y las


transformaciones de Lorentz. Primero, discutiremos la relatividad del tiempo, incluyen-
do el concepto de simultaneidad y el efecto de dilatación temporal. Luego, extenderemos
la discusión al problema de medición de longitudes, donde aparece el efecto de contrac-
ción. Finalmente, describiremos las nuevas propiedades de las variables cinemáticas y
algunas aplicaciones.

3.1. La relatividad del tiempo


El problema central del tiempo no está en como definirlo abstractamente, sino en
como lo medimos, lo que requiere adoptar una definición precisa y fundamental de me-
dición de intervalos de tiempo independiente de la técnica especı́fica que se utilize para
realizar tal medición. Para eso, vamos a definir el reloj como el instrumento que permite
medir tiempos asociados a eventos, sin importar que el reloj sea el tradicional reloj de
manecillas, o digital, o un censor infrarojo capaz de arrancar y detenerse cuando ocurran
los eventos, etc. Simplemente asumimos que los eventos ocurren en instantes de tiem-
po determinados, los cuales en principio podemos medir. Con esto, vamos a definir de
manera fundamental el tiempo como:

El intervalo de tiempo entre dos eventos medido por un observador


inercial, es la diferencia entre el tiempo marcado por un reloj
en la posición donde ocurre el evento final y el tiempo marcado
por otro reloj en la posición donde ocurre el evento inicial.

29
30 CAPÍTULO 3. CINEMÁTICA RELATIVISTA

En la definición anterior, se esta asumiendo tres condiciones esenciales:

i.) Los relojes se encuentran en reposo en el sistema del observador que realiza las
mediciones.

ii.) Si los eventos ocurren en distintas posiciones, los tiempos se miden con distintos
relojes. Ası́, si en vez de eventos puntuales, se tiene una sucesión continua de
eventos que ocurren en una región extendida del espacio, se asume entonces que
el observador posee una sucesión continua de relojes en reposo que cubre todos
los puntos del espacio.

iii.) Para que la medición tenga sentido, es necesario garantizar siempre que para un
mismo observador, todos sus relojes se encuentran sincronizados, es decir, arran-
can en el mismo tiempo y marcan intervalos de tiempos exactamente iguales.

Teniendo una definición precisa de [medición de] tiempo, ya podemos estudiar las
consecuencias temporales de los postulados de la relatividad.

3.1.1. Simultaneidad
Decimos que dos eventos son simultáneos si ocurren en el mismo instante de tiempo
medido por un observador inercial, esto es, si el intervalo de tiempo entre los eventos
es nulo. Es importante enfatizar en la definición anterior el hecho de que se esta restrin-
giendo a un observador, no a todos. La razón de eso es porque como consecuencia de
los postulados, la simultaneidad puede ser relativa, es decir, si para un observador dos
eventos ocurren simultáneamente, para otro observador en movimiento relativo esos dos
mismos eventos pueden ocurrir en tiempos diferentes, situación que no se presenta en la
relatividad clásica. Más concretamente, en relatividad especial pueden ocurrir dos casos:

1.) Si dos eventos son simultáneos medido por un observador inercial, y adicional-
mente ocurren en la misma posición, esos mismos eventos también serán simultáneos
para cualquier otro observador inercial. En este caso decimos que la simultaneidad
es absoluta.

2.) Si dos eventos son simultáneos medido por un observador inercial, pero ocurren
en diferentes posiciones, esos mismos eventos no serán simultáneos para otro ob-
servador inercial. En este caso decimos que la simultaneidad es relativa.

En mecánica clásica, la simultaneidad es absoluta sin importar si ocurren en la mis-


ma o en diferentes posiciones. Para ilustrar el efecto relativista de la simultaneidad,
consideremos el siguiente ejemplo:
3.1. LA RELATIVIDAD DEL TIEMPO 31

Dos partı́culas, 1 y 2, viajan con velocidades de 2 × 107 m/s y 4 × 107 m/s


respectivamente. La partı́cula 1 colisiona con un detector fijo ubicado a una
distancia de 0.5 km del origen del observador inercial Σ, mientras que la 2 lo
hace con otro detector ubicado a una distancia de 1 km del mismo origen. Si
las partı́culas cruzan el origen simultáneamente en el instante t = 0, calcular
el tiempo en que cada partı́cula colisionará los detectores medido por a.) el
observador Σ y b.) el observador Σ0 donde la partı́cula 1 está en reposo.
Σ

Mientras no se diga lo contrario, se asume en éste y en los demás problemas que la v1

configuración de sistemas coordenados es la estándar, es decir, aquella donde se pueden 1

aplicar las transformaciones de Lorentz simples. La Figura 3.1 muestra las coordenadas v2

2

medidas por Σ. Para movimiento constante, el tiempo que demora cada partı́cula entre el
L1
L2

origen y los detectores son:
Figura 3.1
L1 0.5 × 103 m
Partı́cula 1: t1 = = = 2.5 × 10−5 s
v1 2 × 107 m/s
L2 1 × 103 m
Partı́cula 2: t2 = = = 2.5 × 10−5 s. (3.1)
v2 4 × 107 m/s
Ası́, los eventos correspondientes a la detección de las partı́culas, son eventos simultáneos.
Para calcular los tiempos medidos por Σ0 , se puede utilizar los datos medidos por Σ y las
TLS de las ecuaciones (2.21). Para eso, identificamos cada variable:

velocidad relativa: u = 2 × 107 m/s


tiempo medido por Σ : t1 = t2 = 2.5 × 10−5 s
posición medida por Σ : x1 (t1 ) = 0.5 km, x2 (t2 ) = 1 km
factor beta: β = u/c = (2 × 107 m/s)/(3 × 108 m/s) ≈ 6.6 × 10−2
p
factor gama: γ = 1/ 1 − β 2 ≈ 1.002. (3.2)

Ası́, usando la transformación de tiempos, se obtiene para Σ0 :

h u i
t10 = γ t1 − 2 x1 (t1 )
c
0
h u i
t2 = γ t2 − 2 x2 (t2 ) . (3.3)
c
El problema se reduce ahora a realizar los reemplazos numéricos en las ecuaciones an-
teriores para calcular t10 y t20 . Sin embargo, es más útil obtener un resultado más general
expresado en una ecuación simbólica. Teniendo en cuenta que Σ mide que t1 = t2 , se
obtiene para Σ0 la siguiente diferencia de tiempo :

∆t 0 = t10 − t20 = γβ 2t1 . (3.4)


32 CAPÍTULO 3. CINEMÁTICA RELATIVISTA

Numéricamente, para este caso particular, se obtiene que ∆t 0 ≈ 1.1 × 10−7 s. Ası́, los
eventos de colisión contra los detectores ya no son simultáneos para el observador Σ0 , el
cual mide que la partı́cula 2 llega primero, mientras que 1 llega 10−7 s después. Aunque
el valor numérico es muy pequeño, dicha diferencia aumenta si el factor β aumenta de
acuerdo a la ecuación (3.4), es decir, si las partı́culas viajan más cercanas a la de la luz,
lo que evidencia que los efectos relativistas son apreciables a velocidades altas .

3.1.2. Dilatación temporal


Σp

La dilatación temporal es el fenómeno en el cual los intervalos de tiempo entre even-
tos son mayores para un observador que para otro. Para que este concepto tenga sentido,
Evento  1  
es necesario definir respecto a quién sucede el aumento, esto es, el observador que mide
t  =  0  
el mı́nimo intervalo de tiempo posible entre dos eventos. Tal tiempo es el tiempo propio,
que lo definimos formalmente de la siguiente forma:
Evento  2   El tiempo propio es el intervalo de tiempo entre dos
eventos medido por un mismo reloj en el sistema en
t  =  τ

  donde el reloj se encuentra en reposo

Figura 3.2 De acuerdo a la definición anterior, la única forma de que dos eventos sucedan en un
intervalo de tiempo propio, es que los eventos ocurran en la misma posición para algún
observador. Por lo tanto, otra forma de definir el tiempo propio es:
à El tiempo propio es el intervalo de tiempo entre dos eventos medido por el sistema
Σ’
inercial donde los eventos ocurren en la misma posición.
Evento  1   De esta forma, se puede definir sin ambigüedad el concepto de dilatación temporal como
el aumento en el intervalo de tiempo entre dos eventos medido por un observador en mo-
t’  =  0   vimiento respecto al observador que mide el tiempo propio de los mismos eventos. Ası́,
por ejemplo, la Figura 3.2 ilustra la secuencia de dos eventos, 1 y 2, medido por el mis-
Evento  2   mo reloj, es decir por el observador propio de los eventos, marcando un tiempo propio τ.
Pero otro observador en movimiento, medirá el segundo evento desplazado respecto al
t’  =  Δ
     t
’   primero, por lo que el tiempo se marcará con dos relojes en posiciones diferentes, como
se ilustra en la Figura 3.3. Dicho observador medirá un tiempo dilatado de los mismos
Figura 3.3 eventos, es decir ∆t 0 > τ. Para calcular la cantidad en cuanto se dilata el tiempo para un
observador en movimiento, utlizamos las TLS. Supongamos que desde el sistema propio
Σ p , el evento 1 sucede en el tiempo t1 = 0 y en la posición x1 = 0, mientras que el evento
2 sucede en t2 = τ y en la misma posición x1 = 0. Usando la transformación de tiempo
de la ecuación (2.21), se encuentra que los tiempos de los eventos para un observador en
movimiento con velocidad relativa u son:
 u 
t10 = γ t1 − 2 x1 = 0
c 
0
 u  u 
t2 = γ t2 − 2 x2 = γ τ − 2 x1 = γτ, (3.5)
c c
3.2. LA RELATIVIDAD DE LA LONGITUD 33

por lo que el intervalo de tiempo medido por Σ0 es:

∆t 0 = t20 − t10 = γτ, (3.6)

el cual expresa el intervalo de tiempo entre dos eventos medido por un observador iner-
cial en relación al tiempo propio. Ası́, si se comparan los relojes que midieron el segundo
evento, el reloj de Σ p va a marcar menos tiempo que el reloj de Σ0 para el mismo par de
eventos. Esto significa entonces, que los eventos desde Σ p sucedieron más rápido (en
menor intervalo de tiempo) que desde Σ0 .

3.2. La relatividad de la longitud


Al igual que el tiempo, la longitud espacial de los objetos se define en base a su t’ = t’1
medición. En la práctica, la longitud de un objeto se obtiene al comparar las posiciones
relativas de sus extremos. Sin embargo, si el objeto se encuentra en movimiento, es nece-
sario que dicha comparación se realice de forma simultánea. Si no fuera simultáneo, y el
cuerpo se mueve, la posición de un extremo estará corrida respecto al del otro extremo en x’(t’)

x’(t’)

1 1 2 1
una cantidad extra debido al desplazamiento del cuerpo en el intervalo de tiempo entre
mediciones, como se ilustra en la Figura 3.4. Si el extremo izquierdo se mide primero en
el tiempo t10 , la posición marcada será la que corresponda a ese tiempo, es decir x10 (t10 ). Si t’ = t’2
posteriormente en el tiempo t20 se mide la posición del extremo derecho, se obtendrá un
valor x20 (t20 ). Ası́, la supuesta longitud serı́a L0 = x20 (t20 )−x10 (t10 ), la cual como se evidencia
en la figura, no corresponde a la longitud real del objeto. Solamente si el cuerpo está en x’(t’)

2 2

reposo, la medida anterior coincidirá con la verdadera. Pero si el objeto está en movi-
miento, se deben comparar las posiciones de los extremos en forma simultánea. Ası́, si Figura 3.4
la posición de un extremo se mide en el tiempo t10 , el extremo opuesto debe ser medido
en ese mismo tiempo, como indica la lı́nea vertical punteada de la Figura 3.4. Definimos
entonces la longitud como:

La longitud de un cuerpo medido por un observador inercial en


movimiento relativo, es la diferencia entre las posiciones de sus
extremos medidas simultáneamente

En relatividad clásica, el valor de la longitud va a ser independiente del observador,


es decir, clásicamente la longitud es invariante. Sin embargo, en relatividad especial,
aunque las medidas se hagan simultáneamente, la longitud al igual que el tiempo es
una cantidad relativa, que toma diferentes valores de acuerdo al movimiento relativo del
observador. Más concretamente, se puede demostrar que la longitud se contrae para un
observador en movimiento respecto a la longitud medida por el observador donde el
objeto está en reposo, efecto comunmente conocido como contracción de Fitzgerald-
Lorentz. Se define la longitud propia como:
34 CAPÍTULO 3. CINEMÁTICA RELATIVISTA

La longitud propia de un cuerpo es la longitud


medida por el observador inercial donde el
cuerpo se encuentra en reposo.

En el caso en que se mida la longitud propia, no es necesario realizar la medida de


posiciones en forma simultánea. De hecho, para poder comparar la longitud propia con
la relativa medida por un observador en movimiento, es necesario ajustar la diferencia
de tiempos de medida del sistema propio para que al transformarlos al observador en
movimiento, los tiempos sean simultáneos. Ası́, supongamos que el cuerpo se ubica tal
que su extremo izquierdo coincida con el origen del sistema propio Σ y se mida en el
tiempo t1 = 0, mientras que el extremo opuesto se encuentra en la posición x2 (t2 ) = L0
medido en un tiempo t2 , tal que L0 corresponderá a la longitud propia. Para calcular las
posiciones de los extremos en un observador Σ0 moviendose con velocidad relativa u, se
usa la transformación de coordenadas de acuerdo a (2.21):

Extremo izquierdo: x10 (t10 ) = γ [x1 (t1 ) − ut1 ] = 0,


Extremo derecho: x20 (t20 ) = γ [x2 (t2 ) − ut2 ] = γ [L0 − ut2 ] , (3.7)

obteniendo la diferencia:

L0 = x20 (t20 ) − x10 (t10 ) = γ [L0 − ut2 ] . (3.8)

Para que la longitud L0 de la ecuación anterior represente la verdadera longitud, se debe


escoger el tiempo t2 tal que la medida en Σ0 sea simultánea, es decir, se debe exigir que
t10 = t20 . Ası́, usando la transformación de tiempo de las TLS (2.21), se obtiene:

h u i
t10 = γ t1 − 2 x1 (t1 ) = 0,
c
0
h u i h u i
t2 = γ t2 − 2 x2 (t2 ) = γ t2 − 2 L0 , (3.9)
c c
que al igualarlas, se puede despejar el tiempo t2 , obteniendo:
u
t2 = L0 . (3.10)
c2
Después de reemplazar el tiempo t2 de la fórmula (3.10) en la ecuación (3.8), se obtiene
que la longitud medida por Σ0 es:
L0
L0 = , (3.11)
γ
que corresponde a la longitud de un cuerpo en movimiento respecto a su longitud propia,
3.3. LA RELATIVIDAD DEL MOVIMIENTO 35

3.3. La relatividad del movimiento


Adicional a los efectos que causa la relatividad especial en conceptos tales como el
tiempo y el tamaño de los cuerpos, también se van a tener consecuencias importantes en
la descripción del movimiento de los cuerpos, algunas de las cuales se estudian en esta
sección.

3.3.1. Teorema de adición de velocidades


En la sección 1.3, se obtuvo el teorema de adición de velocidades utilizando las
transformaciones de Galileo. Ahora se obtendrá el teorema bajo el contexto de las TLS.
Si un observador inercial Σ mide que una partı́cula tiene una velocidad v en dirección
x, usando las TLS, se puede calcular la velocidad de esa misma partı́cula medida por
otro observador Σ0 que se mueve con velocidad u relativa a Σ. Teniendo en cuenta que
la velocidad se define de acuerdo a las ecuaciones (2.25), y usando las TLS para la
coordenada espacial de (2.21), se obtiene:

dx0 (t 0 ) d
v0 = = γ [x(t) − ut]
dt 0 dt0 
dx(t) dt
= γ −u 0 . (3.12)
dt 0 dt

En relatividad, es importante identificar cuales variables dependen de los tiempos t y


cuales de los tiempos t 0 . Ası́, por ejemplo, en la primera derivada dentro del paréntesis
de la ecuacón (3.12), la posición x está en función de t, mientras que la derivación es
respecto al otro tiempo t 0 . Sin embargo, sabemos que por transformación de tiempos,
el tiempo t depende de t 0 , es decir, la función x(t) es función implı́cita del tiempo t 0 .
Aplicando la regla de la cadena, se obtiene entonces:

dx(t) dx(t) dt dt
0
= 0
= v 0. (3.13)
dt dt dt dt
Usando las TLS inversas dadas por la ecuación (2.26), se puede derivar t respecto a t 0 :

dt d h0 u 0 0 i
= γ t + 2 x (t )
dt 0 dt0 c
u dx0 (t 0 )

= γ 1+ 2
c dt 0
uv0
 
= γ 1+ 2 . (3.14)
c

Reemplazando la forma de la derivada (3.14) en (3.13), se obtiene:


36 CAPÍTULO 3. CINEMÁTICA RELATIVISTA

uv0
 
dx(t)
= vγ 1 + 2 . (3.15)
dt 0 c
Finalmente, reemplazando (3.15) y (3.14) en (3.12), se llega a la forma relativista del
teorema de adición de velocidades:

v−u
v0 = . (3.16)
1 − uv
c2

Problema 5: Suponga que la partı́cula se mueve en el plano de Σ a una velocidad con


componente vx en dirección x y vy en dirección y. Muestre que las componentes de la
velocidad medidas por el sistema Σ0 son:

vx − u vy
v0x = , v0y = . (3.17)
1 − uv
c2
x
γ 1 − uv
c2
x

3.3.2. Transformación de la aceleración


Clásicamente, la aceleración de una partı́cula es invariante y absoluta entre obser-
vadores inerciales. Bajo las transformaciones de Lorentz, la aceleración se mantiene
absoluta, pero ya no será invariante. Para mostrar eso, consideremos una partı́cula con
movimiento acelerado en dirección x medido por un observador Σ. Aplicando el teorema
de adición de velocidades, se puede calcular la aceleración medida por otro observador
Σ0 con velocidad relativa u. Derivando la ecuación de la suma de velocidades (3.16), se
obtiene para Σ0 :
!
dv0 (t 0 ) d v(t) − u
a0 = 0
= 0 , (3.18)
dt dt 1 − uv(t)
c2

donde las velocidades se escriben en función de sus respectivos tiempos. Realizando las
diferentes derivaciones, y teniendo en cuenta que la velocidad relativa u es constante, se
obtiene:
 2
1 dv(t)
a0 =    . (3.19)
uv(t)
γ 1 − c2 dt 0

Aplicando de nuevo la regla de la cadena y usando la derivada entre tiempos de la ecua-


ción (3.14), se obtiene para la derivada de velocidad en (3.19):
3.3. LA RELATIVIDAD DEL MOVIMIENTO 37

uv0
 
dv(t) dv(t) dt
= = aγ 1 + 2 , (3.20)
dt 0 dt dt 0 c

que reemplazando en (3.19), se obtiene:


 0

a 1 + uv
c2
a0 = 2 . (3.21)
γ 1 − uv
c2

La expresión anterior aún mezcla la velocidad instantánea v0 medida por Σ0 (en el nu-
merador) con la velocidad v medida por Σ (en el denominador), por lo que no es una
ecuación final. Para expresarlo en términos de una única velocidad, se hace de nuevo
uso del teorema de adición de velocidades. Por ejemplo, si se usa directamente la ecua-
ción (3.16), podemos obtener la relación entre aceleraciones enteramente en función de
la velocidad v, obteniendo finalmente:

a
a0 =  3 . (3.22)
3 uv
γ 1 − c2

Ası́, si un cuerpo tiene una aceleración a de acuerdo a un observador inercial, otro obser-
vador inercial en movimiento relativo medirá una aceleración diferente, según la ecua-
ción (3.22). Por lo tanto la aceleración, al igual que el tiempo, la longitud y la velocidad,
es una cantidad relativa. Sin embargo, se observa que si a = 0, entonces a0 = 0, esto es,
la aceleración sigue siendo absoluta. Ésta última propiedad implica en particular, que la
ley de la inercia sigue siendo invariante en relatividad especial, es decir, si un cuerpo
se mueve con movimiento rectilı́neo uniforme (la aceleración es nula) desde un sistema
inercial, éste seguirá moviéndose uniformemente desde cualquier otro sistema inercial.

Problema 6: Suponga que la partı́cula se mueve en el plano de Σ y tiene una acelera-


ción con componente ax en dirección x y ay en dirección y. Muestre que las compo-
nentes de la aceleración desde el sistema Σ0 son:

ax
a0x = 3 ,
γ 3 1 − uv
c2
x

1 h uv  uvx  i
y
a0y = ax + 1 − 2 ay . (3.23)
uvx 3 c2 c

γ 2 1− c2
38 CAPÍTULO 3. CINEMÁTICA RELATIVISTA

3.3.3. Efecto Doppler longitudinal


En la subsección 1.4.3 se obtuvo la frecuencia de una onda mecánica medida por un
observador en movimiento. La luz también va a exhibir un efecto parecido. Sin embargo,
en relatividad especial la luz tiene una naturaleza diferente a las ondas mecánicas, por
lo que el efecto se va a dar en una cantidad diferente. Consideremos el caso en que el
observador se mueve directamente hacia la fuente, el cual va a producir el llamado efecto
Doppler longitudinal. Se plantea entonces la siguiente situación:
Σ’
Una fuente luminosa emite pulsos de luz a una frecuencia fF en su sistema en
1   reposo Σ0 hacia un observador Σ que lo detecta. Calcular la frecuencia del pulso
c
medida por el observador Σ si éste se mueve hacia la fuente con rapidez u.

t’  =  0   Observamos que a diferencia del caso con ondas de sonido, aquı́ no se hace referencia
a un medio (éter), por lo que no hay que distinguir si el observador y la fuente se en-
2   1   cuentran en reposo o en movimiento respecto al medio. La Figura 3.5 ilustra la emisión
de pulsos en dos instantes de tiempo en el sistema Σ0 , donde la fuente está en reposo.
Un observador en este sistema medirá la secuencia de dos pulsos con el mismo reloj
t’  =    τF


ubicado en su origen, tal como se ilustra en la figura, por lo que su medida corresponde
a un periodo de tiempo propio τF dado por:
Figura 3.5
1
τF = . (3.24)
fF
Σ
El observador Σ, por otro lado, medirá la secuencia de dos pulsos con relojes ubicados
en diferentes posiciones debido al movimiento relativo de la fuente, como se muestra en
1   la Figura 3.6. Ası́, este observador va a medir un periodo de tiempo dilatado de acuerdo
a la fórmula de dilatación (3.6), esto es:
t = 0

cTO
TO = γτF . (3.25)
u
TO

2   1   Por otro lado, la longitud de onda medida será la distancia entre los pulsos 1 y 2, que
corresponde a la diferencia de la distancia recorrida por el primer pulso y la distancia
t = TO
recorrida por la fuente, como se muestra en la segunda gráfica de la Figura 3.6. Ası́,
usando la relación de dispersión, se obtiene que la longitud de onda cumple:
Figura 3.6
c
λO = = TO (c − u). (3.26)
fO
Reemplazando el periodo propio de la ecuación (3.24) en el periodo relativo de (3.25),
y éste a su vez en la ecuación (3.26), se encuentra que la frecuencia medida por el
observador Σ es:
s
1+β
fO = fF , (3.27)
1−β
3.4. LÍMITES A ALTAS Y BAJAS VELOCIDADES 39

la cual difere de las ecuaciones (1.16), (1.18) y (1.19) para ondas mecánicas.

Problema 7: Si el observador se mueve horizontalmente pero a una altura y = d arri-


ba de la fuente, demuestre que la frecuencia medida cuando cruza exactamente por
encima de la fuente es:

fF
fO = . (3.28)
γ

Este caso se conoce como el efecto Doppler transversal.

3.4. Lı́mites a altas y bajas velocidades


En los postulados de la relatividad especial, la velocidad c surge como una de las
constantes fundamentales de la naturaleza. Sin embargo, es accidental que la luz se pro-
pague justo con esa velocidad. De hecho, cualquier tipo de ondas electromagnética se
propaga en el vacı́o a la velocidad c. Aún más, se ha encontrado a nivel de la fı́sica
subatómica fenómenos asociados a objetos que se pueden propagar a esa misma velo-
cidad, o al menos muy cercana, como los neutrinos y los gluones. La razón de que c
se asocie a la velocidad de la luz es simplemente circunstancial: la luz es el objeto más
común en el Universo que puede viajar a la velocidad c. Por tradición, a la constante c
la seguiremos llamando la velocidad de la luz. Por otro lado, la constante c marca dos
lı́mites extremos de la relatividad: el lı́mite ultrarelativista en el cual los observadores
se mueven relativamente a velocidades cercanas a c, y el lı́mite clásico, en el cual esa
velocidad es mucho más pequeña que c.

3.4.1. El lı́mite clásico


De acuerdo a los resultados de la cinemática relativista estudiada a lo largo del
capı́tulo, nos podemos dar cuenta que los nuevos parámetros que modifican a la vieja
cinemática clásica son los factores γ y β . De hecho, el factor β determina al γ de acuer- 5
do a la definición en la ecuación (2.19), la cual graficamos en la Figura 3.7. Como se 4
puede ver, γ varı́a lentamente para pequeños valores de β , mientras que para valores
cercanos a β = 1, el factor γ empieza a crecer asintóticamente. En particular, si las velo- g3
2
cidades relativas entre observadores son mucho menores a la de la luz (β  1), el factor
γ se puede aproximar a los primeros términos de una expansión en series de Taylor. 1
0.0 0.2 0.4 0.6 0.8 1.0 1.2
Como este factor puede aparecer multiplicando o dividiendo, es útil tener expansiones b
separadas para ambos casos. Hasta segundo orden, se tiene que:
Figura 3.7
40 CAPÍTULO 3. CINEMÁTICA RELATIVISTA

−1/2 1
γ = 1−β2 ≈ 1 + β 2,
2
1 2 1/2 1
≈ 1 − β 2.

= 1−β (3.29)
γ 2
Si adicionalmente, los observadores se mueven a velocidades relativas “ordinarias”
muy por debajo de la velocidad de la luz1 , obtenemos el lı́mite clásico, donde, primero,
los términos cuadráticos de las expansiones anteriores son indetectablemente pequeños,
por lo que en la práctica se puede hacer β 2 = 0 y por lo tanto γ = γ −1 = 1, y segundo,
términos de la forma uv/c2 también se pueden despreciar, como el que aparece en la ex-
presión del teorema de adición de velocidades. Las consecuencias de esta aproximación
sobre distintos parámetros cinemáticos se ilustra en la Tabla 3.1. Como se puede verifi-
car, en el lı́mite clásico se reproduce la cinemática de Galileo. Por ejemplo, se observa
que el tiempo deja de ser relativo: el tiempo medido por todos los observadore inerciales
son los mismos. Lo mismo se obtiene para la longitud.

Problema 8: Calcule la frecuencia del efecto Doppler longitudinal dado por la ecua-
ción (3.27) teniendo en cuenta una expansión de Taylor hasta el orden lineal en β .
De acuerdo a los diferentes efectos Doppler clásicos, ¿qué caso se reproduce?

Problema 9: Si la velocidad de un cuerpo es v = c, ¿qué forma toma el teorema de


adición de velocidades?
1 Enfatizamos de nuevo, que los factores γ y β se relacionan con la velocidad relativa u entre observado-
res, la cual podrı́a o no coincidir con la velocidad de los objetos

Parámetro Caso Relativista Lı́mite Clásico

Transf. Coordenada x0 = γ [x(t) − ut] x0 = x(t) − ut


h 2
i
Transf. Tiempo t 0 = γ t − βu x(t) t0 = t
Dilatación temporal ∆t = γτ ∆t = τ
L0
Contracción F-L L0 = γ L0 = L0
T. de adición vel. v0 = v−u
1− vu2 v0 = v − u
c

Tabla 3.1: Relaciones cinemáticas de la relatividad especial y sus lı́mites clásicos.


3.4. LÍMITES A ALTAS Y BAJAS VELOCIDADES 41

3.4.2. El lı́mite ultrarelativista


De acuerdo a lo observado en la Figura 3.7, cuando la velocidad relativa entre ob-
servadores empieza a acercarse a la de la luz, es decir β → 1, su factor γ crece sin lı́mite
superior. Esto sugiere que el principio de relatividad impone de forma natural un lı́mite
a la velocidad que puede tener un sistema inercial: ningún observador puede viajar a
la velocidad de la luz. Sin embargo, en cercanı́as de la velocidad de la luz, a veces es
útil aproximar las ecuaciones en expansiones alrededor de β = 1. Una forma de obtener
cuantitativamente tal aproximación, es suponiendo que el factor β es ligeramente menor
a 1, por ejemplo:

β = 1 − ε, (3.30)
donde ε es un número muy pequeño, esto es ε  1. Para obtener las ecuaciones ci-
nemáticas cercanas al lı́mite ultrarelativista, conviene reescribir el factor γ en función
del parámetro ε como:

−1/2 −1/2
γ = 1−β2 = 1 − (1 − ε)2
 

1 h ε i−1/2
= √ 1− . (3.31)
2ε 2

Como ε es menor que 1, se puede utilizar de nuevo la expansión de Taylor sobre la


segunda raı́z. Por ejemplo, manteniendo orden lineal en la expansión, se obtiene:

 
1 1
γ≈√ 1+ ε ,
2ε 4

 
−1 1
γ ≈ 2ε 1 − ε . (3.32)
4

Un error común en relatividad, es la de afirmar que ningún objeto puede [observarse]


viajar más rápido que la velocidad de la luz. Si bien la relatividad impone una velocidad
lı́mite, no impide que existan partı́culas superluminales, esto es, objetos que viajen por
encima de la velocidad de la luz, comunmente conocidas como taquiones. En ese caso,
la velocidad c ya no representarı́a un lı́mite superior, sino un lı́mite inferior, y ningún
taquión puede desacelerarse por debajo de dicha velocidad. Concretamente, lo que la
relativa especial prohı́be es que cualquier cuerpo, sea subluminal, o superluminal, pueda
cruzar el lı́mite de la velocidad c para cualquier observador inercial, Aunque experimen-
talmente sólo tenemos evidencia en nuestro Universo de objetos que se mueven igual o
42 CAPÍTULO 3. CINEMÁTICA RELATIVISTA

por debajo de la velocidad de la luz, los taquiones son una posibilidad teórica y que ac-
tualmente se está buscando en diferentes experimentos. En el siguiente capı́tulo haremos
una discusión más amplia sobre la naturaleza de los taquiones.
CAPÍTULO 4

Dinámica relativista

De acuerdo al postulado de relatividad, las leyes de la fı́sica deben ser las mismas
para todos los observadores inerciales. Sin embargo, la segunda ley de Newton que des-
cribe la dinámica de los cuerpos puntuales resulta incompatible con dicho postulado. Por
ejemplo, si un observador Σ0 asegura que una partı́cula cumple con la ecuación F = ma0
(asumiendo que la masa y la fuerza son cantidades invariantes), usando la transforma-
ción de aceleración dada por (3.22), se obtiene para otro observador Σ en movimiento
relativo que:

−3
 uv −3
F = maγ 1− 2 , (4.1)
c

que no reproduce la forma tı́pica de la segunda ley de Newton. Einstein se dió cuen-
ta que el problema radicaba en la suposición de la invariancia de la masa y la fuerza.
Ası́, habı́a que replantear las leyes dinámicas teniendo en cuenta que en realidad estas
cantidades son relativas y dependen del observador inercial. Esto implica en particular,
que la fuerza deja de ser una variable apropiada para la descripción de la dinámica, por
lo que en relatividad especial como se verá de ahora en adelante, deja de jugar un pa-
pel central en la fı́sica. Sin embargo, las leyes de conservación siguen siendo válidas
para todos los obervadores inerciales, por lo que la dinámica descrita en términos de
parámetros que se conservan resultan más apropiados. En éste capı́tulo se plantea las
consecuencias dinámicas de los postulados de la relatividad en términos del momento
lineal y la energı́a, lo que nos conducirá a una de las concepciones más revolucionarias
de la relatividad: la equivalencia de masa y energı́a.

43
44 CAPÍTULO 4. DINÁMICA RELATIVISTA

4.1. El momento relativista


En la mecánica clásica, se define el momento lineal como:

pclásico = mv, (4.2)


donde la masa inercial m se toma en el sentido clásico de la subsección 1.3.3. En particu-
lar, si sobre un sistema de cuerpos no existen interacciones externas, su momento lineal
total es constante, y dicha conservación se mantiene bajo las transformaciones de Gali-
leo, es decir, el principio de conservación del momento lineal es invariante para todos
los observadores inerciales. Si queremos extender la anterior propiedad al caso relati-
vista, vamos a encontrar que la conservación del momento lineal no va a ser invariante
frente a las transformaciones de Lorentz. El problema, como ya se mencionó, está en la
naturaleza de la masa inercial: la masa de un cuerpo es una propiedad que depende del
observador inercial, esto es, la masa inercial es relativa. Ası́, Einstein modificó la defini-
ción del momento lineal por otra [relativista] donde la masa depende de la magnitud de
la velocidad de la partı́cula :

p = m(v)v, (4.3)
donde la forma funcional de m(v) se escoge tal que cumpla con los siguientes principios
de conservación:

I. Conservación de la masa: La masa relativista de un sistema fı́sico


se mantiene constante para todos los observadores inerciales.

II. Conservación del momento lineal: El momento lineal de un sistema


fı́sico aislado se mantiene constante para todos los observadores inerciales.
Σ

1   v
2   Para encontrar la función m(v), consideremos la siguiente situación fı́sica:
Dos partı́culas libres idénticas, 1 y 2, se mueven una hacia la otra
pantes=m(v)v
con velocidad relativa v. Sea Σ el observador donde la partı́cula 2
se encuentra en reposo, y Σ0 donde la 1 está en reposo. Asumien-
vf
do que las partı́culas se propagan como un sólo cuerpo después
de la colisión (colisión totalmente inelástica), determinar la masa
relativista de las partı́culas suponiendo que la masa y el momento
pdespues=M(vf)vf

lineal se conservan para ambos observadores.

Figura 4.1 La Figura 4.1 ilustra el movimiento antes y después de la colisión visto por el obser-
vador Σ, con los momentos lineales respectivos, y donde v f es la velocidad después de
la colisión. Usando los principios de conservación, se obtiene el siguiente conjunto de
ecuaciones:
4.1. EL MOMENTO RELATIVISTA 45

masa: m(v) + m(0) = M(v f )


momento: m(v)v = M(v f )v f , (4.4)

donde m(v) representa la masa de la partı́cula que se mueve a velocidad v (partı́cula 1),
m(0) la de la partı́cula en reposo (partı́cula 2), y M(v f ) la masa del cuerpo resultante des-
pués de la colisión. Despejando del sistema de ecuaciones (4.4), se obtiene la velocidad
Σ’

final: 1   -v
2  
 
m(v)
vf = v . (4.5) ’   = - m(v)v

pantes
m(0) + m(v)
Por otro lado, el observador Σ0 va a observar el mismo proceso en la forma como vf’  

se muestra en la Figura 4.2, con su respectivas medidas de momento lineal. Como las
partı́culas son idénticas, la masa de la partı́cula que ahora está en reposo (la 1) y la que
se mueve (la 2) se marcan iguales que antes: m(0) y m(v)1 . Al plantear las ecuaciones ’   =M(vf’  )vf’  

pdespués
de conservación, se obtiene según Σ0 que:
Figura 4.2

masa: m(v) + m(0) = M(v0f )


momento: −m(v)v = M(v0f )v0f . (4.6)

Resolviendo de nuevo, se obtiene:


 
m(v)
v0f = −v . (4.7)
m(0) + m(v)
Las velocidades finales v f y v0f de (4.5) y (4.7) se pueden relacionar mutuamente
a través del teorema de adición de la ecuación (3.16), donde la velocidad relativa entre
observadores es u = v, obteniendo:
vf −v
v0f = vv . (4.8)
1 − c2f
Reemplazando las expresiones para las velocidades v f y v0f dadas por (4.5) y (4.7), al
final vamos a obtener que:

m(0)
m(v) = p , (4.9)
1−β2
1 Para la partı́cula que se mueve en éste caso, pueden tener la tentación de escribir m(−v). Sin embargo,

la masa relativista depende de la magnitud y no de la dirección de la velocidad, ası́ que m(−v) = m(v).
No se ha detectado experimentalmente que la masa de una partı́cula cambie por el cambio de dirección del
movimiento
46 CAPÍTULO 4. DINÁMICA RELATIVISTA

donde β = v/c. Tradicionalmente, la masa con velocidad nula m(0) se nota como m0 ,
y se conoce como la masa en reposo del cuerpo. Ası́, la masa relativista de un cuerpo
depende de la rapidez del cuerpo respecto a un observador inercial y de su masa en
reposo de acuerdo a

m0
m(v) = p = γm0 , (4.10)
1−β2

mientras que el momento lineal relativista es:

p = m(v)v = γm0 v (4.11)

Problema 10: Considere el mismo problema de colisión anterior, pero asumiendo la


versión clásica de la masa y del momento lineal. Suponiendo que el momento se con-
serva para el observador Σ, muestre que bajo TLS, el observador Σ0 mide diferentes
momentos lineales antes y después de la colisión.

4.1.1. Taquiones
Una de las consecuencias de la ecuación (4.10), es que la masa de los cuerpos au-
menta con su rapidez, creciendo sin lı́mite superior en cercanı́as de la velocidad de la
luz. Ası́, una condición inevitable es que ningún cuerpo se puede acelerar hasta alcanzar
la velocidad c. Sin embargo, la relatividad especial no prohibe la existencia de taquio-
nes, objetos superluminales hipotéticos que viajan a velocidades mayores a la de la luz.
De observarse, tales objetos se caracterizarı́an por exhibir un factor β siempre mayor
que uno. Como consecuencia, el otro factor cinemático, γ, describirı́a las propiedades
matemáticas de un número imaginario:

1 −i
γ=p =p . (4.12)
1−β 2 β2 −1

Ası́, para un taquión, su masa relativista toma la forma:

−im0
m(v) = γm0 = p . (4.13)
β2 −1

Fı́sicamente, la condición β ≥ 1 hace que no sea posible observar un taquión en reposo,


por lo que su masa en reposo no es una cantidad observable. A lo sumo, un observador
4.2. LA ENERGÍA RELATIVISTA 47

inercial podrá medir su masa relativista. Ası́, la ecuación (4.13) toma sentido fı́sico si
definimos la masa en reposo de un taquión como una cantidad imaginaria (no observa-
ble), m0 = im∗ , con m∗ real, tal que su masa relativista sea una cantidad real positiva
(observable):

m∗
m(v) = p . (4.14)
β2 −1

En este caso, la masa relativista aumenta a medida que la velocidad del taquión dis-
minuye, creciendo sin lı́mite al aproximarse a la velocidad de la luz, esto es, no es posible
desacelerar un taquión hasta velocidades por debajo de la velocidad de la luz. Ası́, la
relatividad especial prohibe que un objeto subluminal sea acelerado hasta velocidades
superluminales y un objeto superluminal se desacelere hasta velocidades subluminales,
por lo que la velocidad de la luz representa un lı́mite que separa la materia ordinaria
(masa en reposo real) de la taquiónica (masa en reposo imaginaria). Aunque la existen-
cia de materia taquiónica es teóricamente posible, experimentalmente no hay evidencias
sólidas de su existencia en el Universo actual.2

4.2. La energı́a relativista


En mecánica clásica, la energı́a total de cualquier sistema fı́sico, se puede separar en
tres contribuciones:

E = K +U + Q = K + E0 , (4.15)

donde cada término describe diferentes estados de un cuerpo de acuerdo con la Tabla 4.1.
En particular, es conveniente separar la energı́a de un cuerpo en contribuciones debido a
solamente su movimiento global (energı́a cinética del centro de masa K) y aquellas que
pueden existir independiente del movimiento (energı́a en reposo E0 ), donde la energı́a
en reposo es la suma de la energı́a potencial e interna del cuerpo. Ası́, la ecuación (4.15)
se puede usar para definir la energı́a cinética como:

K = E − E0 , (4.16)

esto es, la energı́a cinética es la energı́a remanente de un cuerpo al restar de su energı́a


total todas las energı́as en reposo. La importancia de describir los estados de un cuerpo
en función de sus energı́as, es que éstas se pueden definir tal que cumplan con el siguiente
principio de conservación:
2 Teorı́ascosmológicas predicen que gran cantidad de partı́culas taquiónicas pudieron ser generados en
las etapas más tempranas de la evolución del Universo.
48 CAPÍTULO 4. DINÁMICA RELATIVISTA

III. Conservación de la energı́a: La energı́a total de un sistema fı́sico


cerrado se mantiene constante para todos los observadores inerciales.

En relatividad especial, también podemos definir las energı́as tal que el principio de
conservación anterior se mantenga. Sin embargo, al exigir invariancia de esa conserva-
ción bajo las TLS, Einstein encontró cambios fundamentales en la forma de las energı́as.
Antes de entrar a discutir la versión relativista de las energı́as, estudiemos las formas
clásicas para luego comparar las diferencias. Por simplicidad, nos limitamos a una sola
dimensión.

4.2.1. Energı́a cinética clásica


Clásicamente, el cambio de energı́a cinética de un sistema fı́sico es el trabajo que
realiza la fuerza sobre un cuerpo, donde la fuerza es la variación del momento lineal
[clásico]. Para calcular dicho trabajo, primero debemos expresar la fuerza en términos
de la posición usando la regla de la cadena:

d pclásico d pclásico dx dv
F= = = mv . (4.17)
dt dx dt dx
El trabajo es la integral de la fuerza respecto al desplazamiento:

1
Z Z
Wclasico = Fdx = m vdv = mv2 +C = K(v), (4.18)
2
con C una constante de integración. Si el cuerpo se encuentra en reposo, entonces no
habrá desplazamianto, por lo que el trabajo es nulo para v = 0. Aplicando ésta condición
en (4.18), obtenemos que C = 0. Ası́ surge la tradicional definición de la energı́a cinética
en mecánica clásica:

Parámetro Tipo de Energı́a Origen Fı́sico


Debido al movimiento del centro de masa.
K Cinética
Depende de la rapidez
Debido a interacciones externas
U Potencial
Depende de la posición
Debido a movimientos e interacciones internas
Q Interna
Depende de la estructura interna

Tabla 4.1: Estados de un cuerpo en terminos de energı́as en mecánica clásica


4.2. LA ENERGÍA RELATIVISTA 49

1
K = mv2 . (4.19)
2
Si lo comparamos con la definición de la ecuación (4.16), se obtiene que la energı́a total
de un cuerpo es:

1
Eclasico = mv2 + E0 . (4.20)
2
Por otro lado, la energı́a en reposo contiene dos contribuciones: la energı́a potencial
U y la energı́a interna Q. Estas energı́as no contribuyen bajo las siguientes circunstan-
cias:
1. La energı́a potencial se puede calibrar en cero si no hay interacciones externas.
Esto es, si el cuerpo es libre, entonces se puede hacer U = 0.
2. Clásicamente la energı́a interna depende de la estructura interna del cuerpo. Pero si
el cuerpo es una partı́cula puntual, que por definición carece de estructura interna,
no existirán estados internos para describir, por lo que la podemos calibrar en cero.
Ası́, en mecánica clásica Q = 0 para partı́culas puntuales
Ası́, obtenemos la siguiente propiedad fundamental de la mecánica clásica: la energı́a
total de una partı́cula puntual libre es puramente cinética, mientras que su energı́a en
reposo es nula.

4.2.2. Energı́a cinética relativista


Para obtener el equivalente relativista de la energı́a, definamos la fuerza relativista
como la variación del momento lineal relativista. Usando la definición (4.11) y la regla
de la cadena, se tiene:

d p d p dx dγv
Frelativista = = = m0 v . (4.21)
dt dx dt dx
Ası́, el trabajo relativista será:
Z Z Z
Wrelativista = Frelativista dx = m0 vd(γv) = m0 c2 β d(γβ ), (4.22)

donde se introdujo el factor β = v/c en la última igualdad. Para separar el diferencial de


integración, se evalúa:
!
d(γβ ) d β
= p
dβ dβ 1−β2
1 β2
= p + (4.23)
1 − β 2 (1 − β 2 )3/2
50 CAPÍTULO 4. DINÁMICA RELATIVISTA

de donde se obtiene el diferencial:

1 β2
d(γβ ) = p dβ + dβ . (4.24)
1−β2 (1 − β 2 )3/2
Reemplazando el diferencial anterior en la integral (4.22), se obtiene:

"Z #
β3
Z
2 β
Wrelativista = m0 c p dβ + dβ . (4.25)
1−β2 (1 − β 2 )3/2

Al realizar las integraciones [por partes], se encuentra al final que:

" #
2 1
Wrelativista = m0 c p +C , (4.26)
1−β2

donde C es una constante remanente de integración. Si usamos, como en el caso clásico,


la condición de que el trabajo es nulo cuando la partı́cula se encuentra en reposo (β = 0),
se obtiene que C = −1. Ası́, definiendo la energı́a cinética relativista como el trabajo
relativista, se obtiene:

m0 c2
K=p − m0 c2 = γm0 c2 − m0 c2 = m(v)c2 − m0 c2 , (4.27)
1−β2
en donde se aplicó la definición de masa relativista de acuerdo a la ecuación (4.10)3 . De
nuevo, comparando el resultado (4.27) con la definición general de la ecuación (4.16),
se obtiene para las energı́as total y en reposo que:

E − E0 = m(v)c2 − m0 c2 . (4.28)
El primer término después de la igualdad lo podemos interpretar como la energı́a medida
por un observador donde la partı́cula tiene movimiento (depende de la masa relativista
m(v)), mientras que el segundo término es la energı́a medida por el observador donde la
partı́cula está en reposo (depende de m0 ), que es justamente la energı́a en reposo. Ası́, se
deduce de forma natural que la energı́a total y la energı́a en reposo de un cuerpo estan
dadas por:

Energı́a total: E = m(v)c2 = γm0 c2 ,


Energı́a en reposo: E0 = m0 c2 . (4.29)
3 Observe que si en la ecuación (4.27) hacemos β = 0, entonces K = 0, por lo que la ecuación define una
energı́a cinética.
4.3. LA MASA EN REPOSO 51

En particular, a diferencia de la mecánica clásica que no dá una expresión especı́fica


para la energı́a en reposo, en la relatividad especial se predice que sin importar cual sea el
origen de la energı́a en reposo, éstas siempre tienen que sumar la cantidad E0 = m0 c2 , que
es la célebre relación de equivalencia de masa y energı́a. La esencia de dicha relación
se manifiesta explı́citamente en el caso de partı́culas puntuales libres. Mientras que en la
mecánica clásica se predice que las partı́culas puntuales aisladas tienen energı́a en reposo
nula, en mecánica relativista aún tendrán contribución debido a su propiedad de masa en
reposo, es decir, aunque la partı́cula sea libre, no tenga estructura interna y se encuentre
en reposo, aún existe una energı́a remanente en forma de masa en reposo: la masa en
reposo es una forma de energı́a de un cuerpo, y como tal, puede transformarse en otros
tipos de energı́as como cinética, calorı́fica, eléctrica, etc. Si el cuerpo tiene estructura
interna, la masa en reposo puede tener contribuciones adicionales debido a energı́as de
interacción entre los constituyentes internos del cuerpo, o a movimientos térmicos de
los mismos. Ası́, por ejemplo, un cuerpo caliente va a tener más masa en reposo que
el mismo cuerpo en estado frı́o. Adicionalmente, como la velocidad de la luz es una
constante universal, la expresión E = m(v)c2 implica que la conservación de la masa
relativista es equivalente a la conservación de la energı́a total.
Por otro lado, aunque la relatividad predice una ecuación para la energı́a en reposo
en función de la masa en reposo, no da explicación del origen de dicha masa, por lo
que su naturaleza es un tema de investigación actual en la fı́sica, la cual se discute en la
siguiente sección.

4.3. La masa en reposo


Uno de los problemas fundamentales de la fı́sica moderna es la de entender el origen
y la naturaleza de la masa. En mecánica clásica, la segunda ley de Newton y sus pro-
piedades relativistas [Galileanas] permiten definir de forma única y matemática la masa
inercial de un cuerpo. Pero en el contexto de la relatividad especial, el concepto de masa
ya no se puede asociar exclusivamente a una propiedad intrı́nseca de la materia. Primero,
la medida de masa depende del movimiento relativo del observador, en cuyo caso habla-
mos de la masa relativista del cuerpo. Segundo, algo que se acerca más a una propiedad
intrı́nseca del cuerpo es su masa en reposo. Sin embargo, si el cuerpo se encuentra en un
potencial externo, o contiene grados de libertad internos, no es posible separar qué par-
te de su masa en reposo corresponde a energı́as internas o externas extras, o qué parte
corresponde a energı́a “auténticamente” intrı́nseca independiente de las interacciones y
movimientos internos. Ası́, no es posible hablar de una única masa asociado a un cuerpo,
sino que va a depender de las condiciones dinámicas y cinemáticas del cuerpo. Por otro
lado, aunque se garantice que la partı́cula sea puntual y esté libre de interacciones ex-
ternas, aún existen inconvenientes teóricos para explicar la fuente de su masa en reposo.
Aunque la relatividad especial no pretende resolver el problema de la naturaleza de la
masa, es importante mencionar cual es el estado actual de las investigaciones sobre el
52 CAPÍTULO 4. DINÁMICA RELATIVISTA

Partı́cula Masa de corriente (MeV/c2 ) Masa constituyente (MeV/c2 )


quark u 2.3 330
quark d 4.8 330
protón 940 940

Tabla 4.2: Masas de los quarks y del protón en unidades de megaelectronvoltios

tema. Para no hacer una discusión en abstracto, nos vamos a contextualizar en dos casos
especı́ficos en relación a los dos problemas discutidos anteriormente.

4.3.1. La masa de los quarks


Existen evidencias experimentales sólidas de que los constituyentes de los núcleos
atómicos, esto es, los protones y neutrones, están ası́ mismos constituidos por partı́culas
más “pequeñas”, conocidas como quarks. Hasta donde sabemos, los quarks son partı́cu-
las verdaderamente puntuales, es decir, no tienen estructura interna, por lo que su masa
en reposo no tendrá contribución debido a grados de libertad extras. Sin embargo, los
quarks no son totalmente libres: entre ellos existe interacción nuclear fuerte. Ésta fuerza
Fuerza Gravitacional

describe propiedades diferentes a otras como la gravitacional. Por ejemplo, la Figura 4.3
muestra de forma cualitativa la dependencia de las fuerzas entre dos cuerpos en relación
a su distancia. La diferencia primordial está en que mientras la gravedad disminuye su
fuerza a medida que alejamos los cuerpos, la fuerza fuerte exhibe una región donde la
0 fuerza en vez de disminuir, aumenta. Ası́, en el caso de los quarks, mientras ellos se
Distancia
mantengan muy cercanos, la interacción fuerte es despreciable y por lo tanto la masa
en reposo es de partı́cula puntual libre4, 5 . Bajo tales circunstancias es que se define la
Fuerza Fuerte

masa de corrientes de los quarks. En la segunda columna de la Tabla 4.2 se muestra las
masas de corrientes de los quarks que componen a un protón (notados u y d que son
abreviaturas de las palabras en inglés up y down) y la masa del protón mismo, donde se
usan las unidades de energı́a Megaelectronvoltios, que se explican en el Apéndice C. Se
0
Distancia sabe que el protón está constituido por dos quarks tipo u y uno tipo d. Sin embargo, si
hacemos la suma directamente, vemos que:
Figura 4.3
2mu + md = 9.4 MeV/c2 , (4.30)
mientras que la masa de un protón es m p ≈ 940 MeV/c2 . Ası́, las masas de corrientes de
los quarks no están dando cuenta de la masa total del protón. La razón, al menos en parte,
4 Ésta propiedad fué descrita en forma precisa usando herramientas de la teorı́a cuántica de campos

en 1973, y se conoce como libertad asintótica, lo que le mereció el Premio Nobel a David Gross, David
Politzer y Frank Wilczek en 2004.
5 Además de la fuerza fuerte, los quarks también interactúan eléctricamente, por lo que no son totalmente

libres. Son libres de la interacción fuerte.


4.3. LA MASA EN REPOSO 53

está en la equivalencia masa y energı́a de la relatividad especial: existe masa extra debido
a la energı́a de interacción entre los quarks, que se ha despreciado en la aproximación
anterior. Ası́, debido a que los quarks están sumergidos en una energı́a potencial fuerte,
surge una contribución adicional a la masa en reposo del protón. Por lo tanto, a los quarks
se le pueden definir otra masa en reposo que tiene en cuenta la energı́a de interacción
al interior del protón, conocida como la masa constituyente, cuyos valores se muestran
en la tercera columna de la Tabla 4.2. Vemos que de forma aproximada, se reproduce la
masa del protón como la suma de las masas constituyentes de los quarks. A pesar de los
avances en el entendimiento de la masa de los quarks, aún existen controversias debido
a que al interior del protón existen otras interacciones (electromagnéticas y débiles) y a
las evidencias de otras estructuras en el protón además de los tres quarks.

4.3.2. El mecanismo de Brout-Englert-Higgs


Los electrones son partı́culas puntuales que a diferencia de los quarks, pueden estar
en estado “verdaderamente” libre. Aún ası́, los electrones exhiben energı́a en reposo de-
bido a su masa intrı́nseca en reposo. Uno de los misterios más fundamentales de la fı́sica
es la de explicar de donde sale esa energı́a, si aparentemente no hay interacciones que la
provean. Una posible respuesta surgió en el contexto de la otra interacción que se dá al
interior de los núcleos atómicos: la interacción nuclear débil. Adicional a la invarian-
cia de las leyes fı́sicas entre observadores inerciales, se ha comprobado que existen otro
U

tipo de invariancias: las leyes de la fı́sica son [aproximadamente] las mismas frente a
cambios de propiedades internas de los sistemas fı́sicos. Por ejemplo, si intercambiamos
los signos de todas las cargas eléctricas del Universo, de positivas a negativas y vicever-
sa, no habrá ningún efecto observable; nuestro Universo seguirá siendo el mismo. Ésta φ

invariancia se mantiene incluso aunque el cambio se haga en regiones localizadas. Al ge-
neralizar dicha propiedad a la interacción nuclear débil, surgen inconvenientes teóricos
debido a la masa en reposo de las partı́culas. Los fı́sicos evitaron el problema ignorando
la masa, como si las partı́culas fueran no masivas, y plantearon teorı́as que describı́an Figura 4.4
con precisión las interacciones débiles. Sin embargo, quedaba la cuestión de la masa.
En 1964, Robert Brout, Francois Englert y Peter Higgs implementaron un mecanismo
conocido como el mecanismo BEH o simplemente mecanismo de Higgs, en el cual las
partı́culas no están totalmente libres, sino que interactúan a través de una nueva fuer-
za suministrada por un campo de interacción, conocido como campo escalar. El campo
escalar al vibrar [en el sentido cuántico], le puede suministrar energı́a en reposo a las
partı́culas. La Figura 4.4 describe la forma de la energı́a potencial del campo escalar en
función de su amplitud de vibracion. Por mucho tiempo, ese mecanismo no fué más que
una hipótesis teórica debido a la falta de evidencias experimentales de la existencia del
campo escalar. Sin embargo, el mecanismo adicionalmente predice que si el campo se
hace vibrar lo suficiente, por la relatividad especial, esa energı́a de vibración se puede
transformar y “materializar” en una partı́cula muy masiva conocida como el bosón de
Higgs. Pero surgen los siguientes inconvenientes prácticos: primero, la energı́a necesa-
54 CAPÍTULO 4. DINÁMICA RELATIVISTA

ria debe ser enorme; segundo, aunque se logre tal energı́a, muy pocos bosones de Higgs
se materializan; finalmente, la energı́a en forma de un bosón de Higgs es muy inestable,
por lo que en muy poco tiempo (del orden de 1 × 10−22 s) la energı́a se transforma en
forma de energı́a en reposo de otras partı́culas y energı́a cinética. Por lo tanto resulta
extremadamente difı́cil detectar la presencia del Bosón de Higgs. No fue sino hasta el
año 2012 en que los experimentos llevados a cabo en el Gran Colisionador Hadrónico
(LHC por sus siglas en inglés) en el laboratorio CERN, lograron suministrar la energı́a
necesaria para producir un número de bosones de Higgs suficientes para ser detectados,
descubrimiento que le dió el premio Nobel a Englert y a Higgs en el año 2013. Aunque
el mecanismo de Higgs da una explicación natural a la existencia de la masa en reposo,
aún hay detalles teóricos y medidas experimentales que se mantiene sin una respues-
ta satisfactoria, como por ejemplo, el problema de la masa de los neutrinos, lo que es
motivo de una intensa investigación.

Problema 11: Un bosón de Higgs, que tiene una energı́a en reposo de E0 = 126 GeV,
decae del reposo en dos quarks tipo b (bottom), cada uno con una energı́a en reposo de
4 GeV. Calcular la energı́a cinética de los quarks usando conservación de la energı́a.

4.4. La relación energı́a y momento


Existe una relación muy útil entre el momento y la energı́a relativista, que nos per-
mitirá complementar las ecuaciones de conservación del momento lineal y de la energı́a
para la resolución de problemas de colisión. De acuerdo a lo obtenido en las secciones
anteriores, las variables dinámicas fundamentales son:

Momento relativista: p = γm0 v, (A)


2
Energı́a relativista: E = γm0 c (B), (4.31)
donde el factor γ contiene la velocidad relativa entre el observador en reposo del cuerpo
y el observador que mide el cuerpo moviéndose a velocidad v. Ası́, explicitamente la
ecuación (A) de (4.31) es:
m0 v
p= p . (4.32)
1 − v2 /c2
Calculandole el modulo al cuadrado a la expresión anterior, se obtiene:

m20 v2
|p|2 = p2 = . (4.33)
1 − v2 /c2
4.4. LA RELACIÓN ENERGÍA Y MOMENTO 55

Despejando para la magnitud de la velocidad, se obtiene:


p
v= q . (4.34)
m20 + p2 /c2
Por otro lado, si usamos el resultado anterior dentro de la energı́a relativista (B) de
la ecuación (4.31), se obtiene:

m0 c2 m0 c2
E=p = q
1 − v2 /c2 1 − p2 /(m20 c2 + p2 )
q
= c m20 c2 + p2 . (4.35)

Ası́, la energı́a relativista y el momento lineal relativista se relacionan de acuerdo a:


q
E = c p2 + m20 c2 . (4.36)
En mecánica clásica, sabemos que si la masa de un cuerpo es nulo, entonces su
momento lineal será nulo sin importar su energı́a. Sin embargo, de acuerdo a la relación
(4.36), si el cuerpo tiene masa en reposo nulo, aún puede existir un momento lineal en
virtud de su energı́a. En la naturaleza existen objetos que no interactúan con el campo
escalar de Higgs, por lo que no tienen masa en reposo. El más común es justamente
los cuantos de luz, esto es, los fotones. Aunque la relatividad sigue tratando a la luz
como ondas de vibración en el sentido de la electrodinámica clásica, es importante para
algunos procesos relativistas considerar su naturaleza cuántica.

Problema 12: Demuestre que la velocidad de una partı́cula se relaciona con su mo-
mento lineal y su energı́a cómo:

cp
v/c = β = . (4.37)
E

Problema 13: Una partı́cula con energı́a E, se mueve con velocidad v = β c en direc-
ción x de acuerdo a un observador inercial Σ. Demuestre que la energı́a medida por
otro observador Σ0 que se mueve con velocidad u = βu c respecto a Σ es:

E 0 = γu (1 − β βu )E (4.38)
56 CAPÍTULO 4. DINÁMICA RELATIVISTA

4.4.1. El fotón
Los fotones son paquetes de energı́a de campos electromagnéticos, que exhiben un
comportamiento de partı́cula con masa en reposo nula. De acuerdo a la relación de ener-
gia y momento de la ecuación (4.36), un fotón cumple con la siguiente relación:

E = cp, (4.39)

donde c es la velocidad de propagación del fotón, que obviamente es la de la luz. Por


otro lado, la mecánica cuántica postula (contribución de Einstein independiente de la re-
latividad) que la energı́a contenida en un solo fotón depende de su frecuencia de acuerdo
a la siguiente relación:

E = hf, (4.40)

donde h es, junto a la velocidad c, otra de las constantes fundamentales de la naturaleza,


conocida como la constante de Planck, y cuyo valor en unidades internacionales y en
electronvoltios es:

h = 6.63 × 10−34 J · s = 4.14 × 10−21 MeV · s. (4.41)

A las ecuaciones (4.39) y (4.40) las vamos a llamar las ecuaciones del fotón.

4.4.2. Decaimiento de partı́culas


Una de las consecuencias de la relación de equivalencia de masa y energı́a, es la
posibilidad de que la masa en reposo de una partı́cula se convierta en otras formas de
energı́as, como por ejemplo otras partı́culas más livianas y energı́a cinética. Un ejemplo
de tales proceso es el decaimiento de un pión neutro, que es una partı́cula compueta por
dos quarks. Una de las posibilidades de transformación de la masa del pión es produc-


Ei , pi
ción de energı́a electromagnética en forma de dos fotones. Consideremos la siguiente
situación:

Un pión neutro con masa en reposo de 135 MeV/c2 viaja con una energı́a
de 426 MeV. Después de un tiempo, el pión decae en dos fotones que se
E2 , -p2
E1 , p1
dispersan en direcciones opuestas y con la misma orientación de propa-
gación del pión original. Calcular las frecuencias de cada fotón

Figura 4.5 La Figura 4.5 ilustra el proceso antes y después del decaimiento, con sus respectivas
energı́as y momentos. Teniendo en cuenta las leyes de conservación, la relación entre
energı́a y momento, y las ecuaciones del fotón, se plantean las siguientes ecuaciones:
4.4. LA RELACIÓN ENERGÍA Y MOMENTO 57

conservación de energı́a: Ei = E1 + E2 (A)


conservación de momento: pi = p1 − p2 (B)
q
relación de energı́a-momento pión: Ei = c p2i + Mπ2 c2 (C)
ecuación de momento de fotones: p1 = E1 /c, p2 = E2 /c (D)
ecuación de frecuencia de fotones: f1 = E1 /h, f2 = E2 /h (E) (4.42)

Sin importar el método que se use para combinar las ecuaciones anteriores y resolver
la pregunta, siempre es importante identificar las variables conocidas y las que se pueden
calcular directamente. En este caso, se conocen la masa en reposo del pión Mπ , y su
energı́a total Ei , mientras que su momento se puede calcular directamente de la ecuación
(C), obteniendo:
s
Ei2
pi = − Mπ2 c2 = 404 MeV/c. (4.43)
c2
De esta manera, se pueden combinar las 2 ecuaciones (A) y (B), y las 2 de (D) para
resolver las 4 incógnitas E1 , E2 , p1 y p2 . En particular, para las energı́as, se obtiene:

1
E1 = (Ei + cpi ) = 415 MeV,
2
1
E2 = (Ei − cpi ) = 11 MeV, (4.44)
2
correspondientes a las energı́as de cada fotón. Finalmente, reemplazando lo anterior en
las ecuaciones (E), se obtienen las frecuencias buscadas (donde se usa el valor de la
constante de Planck en unidades MeV, dada en la ecuación (4.41) ):

f1 = E1 /h = 1 × 1023 s−1 ,
f2 = E2 /h = 2.6 × 1021 s−1 . (4.45)

4.4.3. Fisión Nuclear


Otra consecuencia importante de la energı́a relativista es el proceso de fisión nuclear,
que se da en los núcleos atómicos. A este nivel, conviene expresar la masa de los núcleos
en unidades de masa atómica u.m.a, la cual se define como 1/12 veces la masa de un
núcleo de Carbono 12:

1 u.m.a = 1.685 × 10−27 kg. (4.46)


58 CAPÍTULO 4. DINÁMICA RELATIVISTA

Como los núcleos son cuerpos con estructura interna, parte de su masa en reposo
proviene de la energı́a potencial nuclear que mantiene unido a sus componentes (pro-
tones y neutrones) y la energı́a electrostática respulsiva que se da entre los protones.
Esa porción de energı́a en reposo puede ser transformada en otros núcleos más livianos
y energı́a cinética liberada que puede ser aprovechada en la generación de energı́as al-
ternas como la eléctrica. Una forma de lograr liberar la energı́a acumulado en la masa
en reposo, es haciendo chocar neutrones con núcleos de Uranio. Para ilustrar el tipo de
reacciones que se dan, consideremos la siguiente situación:

Un neutrón y un núcleo de Uranio 235 sufre la siguiente reacción:

n +235
92 U −→
92 140
38 Sr + 54 Xe + 4n, (4.47)

donde las masas en reposo de cada uno de los núcleos participantes son:

Estroncio: m(Sr) = mS = 91.937 u.m.a,


Xenón: m(Xe) = mX = 139.947 u.m.a,
Uranio: m(U) = mU = 235.175 u.m.a,
Neutrón: m(n) = mn = 1.009 u.m.a. (4.48)

Calcular a.) la energı́a liberada en la reacción y b.) la cantidad de Uranio


necesario para generar la energı́a eléctrica producida en Colombia en
el año 2012 de aproximadamente 5.7 × 1013 kilovatios-hora, asumiendo
una eficiencia del 50 %.

Para resolver el caso a.), el procedimiento metodológico es igual que en el caso de


decaimiento de partı́culas, con la diferencia de que ahora tenemos dos cuerpos en el
estado inicial, por lo que las energı́as iniciales y finales son:

Ei = En + EU ,
E f = ES + EX + 4En , (4.49)

donde los subı́ndices se asignan a cada núcleo. En éste caso nos piden la energı́a cinética
entre los estados finales e iniciales, por lo que requeriremos usar la definición general
(4.16) con las formas relativistas de la ecuación (4.29). Es importante distinguir qué co-
rresponde a energı́a total y qué a energı́a en reposo. Las energı́as en (4.49), que son las
que se conservan, corresponden a la energı́a total (las energı́as en reposo no se conser-
van), mientras que las masas dadas por (4.48) determinan las energı́as en reposo. Con
esto, será suficiente usar solamente el principio de conservación de la energı́a, por lo que
el conjunto de ecuaciones es:
4.4. LA RELACIÓN ENERGÍA Y MOMENTO 59

E0 (n) = mn c2 , E0 (U) = mU c2 , E0 (S) = mS c2 , E0 (X) = mX c2 ,


Kn = En − E0 (n), KU = EU − E0 (U), KS = ES − E0 (S), KX = EX − E0 (X).
Ei = E f . (4.50)

Nuestras variables conocidas son todas las masas en reposo, por lo que sus energı́as
en reposo se pueden calcular directamente con la primera lı́nea de ecuaciones en (4.50).
No conocemos las energı́as totales iniciales ni finales, pero eso no interesa ya que debe-
mos calcular la diferencia de energı́as cinéticas, por lo que al realizar la resta y en virtud
de la conservación de la energı́a, las totales se van a cancelar. Ası́, la única contribución
al cambio de energı́a cinética proviene del cambio de las energı́as en reposo. Usando la
segunda lı́nea de ecuaciones en (4.50) se obtiene:

∆K = K f − Ki = Kn + KU − KS − KX − 4Kn
= (mU − mS − mX − 3mn ) c2 . (4.51)

Reemplazando los valores numéricos de (4.48), se obtiene que ∆K = (0.264 u.m.a.)c2 .


Para convertirlo en Joules, se hace uso de la definición (4.46) y se usa la velocidad de la
luz a 3 cifras significativas, que es 2.998 × 108 m/s, por lo que:

1.685 × 10−27 kg 2
∆K = (0.264 u.m.a.)c2 = (0.264 u.m.a.) c
1 u.m.a
= 3.998 × 10−11 J, (4.52)

que corresponde a la energı́a liberada para una única reacción. Si el proceso se multiplica
por muchas reacciones idénticas, la energı́a liberada aumentara en el mismo factor. Para
el punto b.), se pide calcular cuantas reacciones son necesarias para producir una canti-
dad dada de energı́a liberada pero suponiendo que solamente el 50 % de esa energı́a se
convierte efectivamente en energı́a eléctrica. Ası́, definimos la eficiencia como la razón
entre la energı́a eléctrica convertida y la energı́a total liberada por un número N de reac-
ciones:

Eelect
η= . (4.53)
N∆K
En el problema planteado, se tiene que η = 0.5, Eelect = 5.7 × 1013 kilovatios-hora y
∆K = 3.998 × 10−11 J. Ası́, el problema numérico se reduce a realizar la conversión
de kilovatios-hora a Joules y calcular el número de reacciones necesarias, N. Para la
conversión de unidades, recordemos que el vatio es la unidad de la razón de energı́a
transferida por unidad de tiempo, por lo que:
60 CAPÍTULO 4. DINÁMICA RELATIVISTA

kiloJoules 3600 s
Eelect = 5.7 × 1013 kilovatios-hora = 5.7 × 1013
s 1h
= 2.052 × 1020 J. (4.54)
Reemplazando los valores, se obtiene que el número de reacciones necesarias para ob-
tener la energı́a eléctrica de consumo en un año en Colombia a un 50 % de eficiencia es
N = 1.026 × 1031 , que requerirá el mismo número de nucleos de Uranio, cada uno de
masa 235.175 u.m.a, lo que corresponderá a una masa total de:

= 235.175 u.m.a 1.026 × 1031



MU = NmU
1.685 × 10−27 kg
 
1.026 × 1031

= 235.175
1 u.m.a
= 4.066 × 106 kg, (4.55)
que corresponde a cerca de 4000 toneladas de Uranio.

4.4.4. Creación de partı́culas


En los procesos de decaimiento de núcleos y partı́culas estudiados anteriormente,
se tiene conversión de masa en reposo en energı́a cinética. Contrariamente, la relación
masa-energı́a permite tambien el proceso inverso: convertir energı́a cinética en materia.
Por ejemplo, si se hace colisionar dos partı́culas, A y B, con suficiente energı́a, des-
pués de la colisión se puede obtener la dispersión de las dos partı́culas acompañadas
de nuevas partı́culas. La energı́a mı́nima de la colisión para que ocurra estos eventos de
creación se conoce como energı́a umbral, cuyo valor es relativo al observador inercial.
En la práctica, las colisiones en los aceleradores de partı́culas suelen producirsen de dos
formas: colisión con blanco fijo y colisiones frontales. En el primer caso, una partı́cula
se utiliza como proyectil, acelerándose a velocidades relativistas, hasta colisionar con
otra partı́cula, generalmente más masiva, como un núcleo atómico, que se encuentra ini-
cialmente en reposo. El observador inercial que mide la partı́cula blanco en reposo se
conoce como el sistema de laboratorio. En el segundo caso, las dos partı́culas se acele-
ran una hacia la otra hasta colisionar. En particular, si el observador inercial mide que
el centro de masa de las dos partı́culas se encuentra en reposo, decimos que la colisión
sucede en el sistema de centro de masa. La energı́a umbral para la creación de partı́culas
en el sistema centro de masa es la energı́a mı́nima de la colisión para obtener todos los
estados finales en reposo. Por ejemplo, si cada partı́cula original tienen masa en reposo
mA y mB , y después de la colisión se crea una nueva partı́cula con masa en reposo mX
según el proceso A + B → A + B + X, la energı́a umbral desde el centro de masa es:

Eumbral = (mA + mB + mX ) c2 . (4.56)


4.4. LA RELACIÓN ENERGÍA Y MOMENTO 61

Como la energı́a de las partı́culas incidentes es la energı́a cinética mas la energı́a en


reposo, la energı́a cinética umbral será

Kumbral = Eumbral − (mA + mB ) c2 = mX c2 . (4.57)

Ası́, desde el centro de masa, la energı́a cinética mı́nima para crear nuevas partı́culas
es justo la energı́a en reposo de esas partı́culas. En el caso más general, el problema de
creación de partı́culas es conveniente tratarlo a través del concepto de energı́a de centro
de masa, desarrollado con herramientas del cálculo tensorial, tal como lo estudiaremos
en el capı́tulo 9.

Problema 14: Dos haces de protones se propagan uno hacia el otro con una energı́a
de 1.5 GeV, cada uno. La colisión produce creación de pares partı́cula-antipartı́cula
de acuerdo a la reacción:

P + P −→ P + P + X + X, (4.58)

con X una partı́cula desconocida y X su antipartı́cula. Si los estados finales quedan


en reposo y la masa en reposo de cada protón es alrededor de 1 GeV/c2 , muestre que
la masa en reposo de cada partı́cula creada es mX = 0.5 GeV/c2 .

En la naturaleza, existen partı́culas con una masa semejante a la obtenida en el problema


anterior, conocidas como Kaones. Dichas partı́culas no son del todo puntuales, sino,
como los protones y neutrones, son hadrones constituidos por quarks.
62 CAPÍTULO 4. DINÁMICA RELATIVISTA
Parte II
Fundamentos Geométricos

63
CAPÍTULO 5

Estructura Espacio Tiempo

En 1907, el fı́sico Hermann Minkowski introdujo el concepto de espacio-tiempo


en el lenguaje de la relatividad especial como una alternativa de entender los efectos
cinemáticos de los postulados. Dicha formulación permitió el desarrollo de dos ideas
fundamentales de la fı́sica actual. Primero, aunque la formulación fue originalmente
propuesta para observadores inerciales (relatividad especial), permitió la extensión natu-
ral a observadores acelerados (relatividad general). Segundo, el tratamiento geométrico
reveló indirectamente la importancia de los principios de invariancia en fı́sica, los cua-
les fueron fundamentales para la construcción de las teorı́as que describen las demás
interacciones: la electromagnética, la fuerte y la débil. En éste capı́tulo se introducen los
conceptos básicos del tratamiento geométrico de la relatividad.

5.1. La geometrı́a Euclidiana del espacio


El concepto más básico que define la geometrı́a de un espacio vectorial es la de dis-
tancia entre puntos. En particular, definimos la distancia Euclidiana entre dos puntos
medido en un espacio vectorial de n dimensiones respecto a un sistema de ejes coorde-
nados como:

q
d= ∆x12 + ∆x22 + ... + ∆xn2 , (5.1)

donde cada variable ∆xi representa la proyección de la distancia sobre cada uno de los
ejes coordenados. La geometrı́a del espacio viene determinada por el siguiente principio
de invariancia:

65
66 CAPÍTULO 5. ESTRUCTURA DE ESPACIO-TIEMPO

Un espacio de n dimensiones es de naturaleza


Euclidiana si la distancia Euclidiana es la misma
entre sistemas coordenados rotados

y
Las posiciones espaciales de los objetos se pueden describir de forma completa en
y2
un espacio vectorial de 3 dimensiones, pero por simplicidad, nos limitamos a un subes-
pacio de 2 dimensiones sobre el plano cartesiano (x, y). Para contextualizar la discusión,
d
consideremos el caso de una partı́cula que parte de la posición (x, y) = (0, 0) (evento 1)
α
y se desplaza en lı́nea recta hasta la posición (x, y) = (x2 , y2 ) (evento 2) medido desde un
x
sistema coordenado con su eje x horizontal, como se muestra en la Figura 5.1. Por otro
x2

lado, la Figura 5.2 representa la misma situación superponiendo al anterior un sistema de
Figura 5.1 ejes coordenados rotado en un ángulo θ y sus correspondientes proyecciones, en donde
el evento 1 tiene posición (x0 , y0 ) = (0, 0) y el 2 tiene posición (x0 , y0 ) = (x20 , y02 ). Extrai-
gamos de la Figura 5.2 los dos triángulos cuya hipotenusa es la misma, la cual ilustramos
en la Figura 5.3. Por simple geometrı́a, se obtienen las siguiente proyecciones:

y
Sistema no rotado: x2 = d cos α, y2 = d sin α,
y’
Sistema rotado: x20 = d cos (α − θ ), y02 = d sin (α − θ ). (5.2)
y2
x’

x2’

En particular, usando identidades trigonométricas básicas, las coordenadas en el sistema
y2’


θ
rotado se pueden escribir como:
x

x2

Figura 5.2 x20 = d cos α cos θ + d sin α sin θ ,


y02 = d sin α cos θ − d cos α sin θ . (5.3)

Al comparar las coordenadas de la ecuación (5.3) con las coordenadas del sistema
d

y2
no rotado en (5.2), obtenemos las siguientes ecuaciones de rotación:
α

x2

x20 = x2 cos θ + y2 sin θ ,
y02 = −x2 sin θ + y2 cos θ . (5.4)
d
y’

2

α-θ
Si nuestro espacio de posiciones es de naturaleza Euclidiana, entonces la distancia defi-
x’
nida en (5.1) debe ser invariante bajo las anteriores rotaciones, esto es:
2

Figura 5.3 q q
si d = x22 + y22 y d 0 = x202 + y02
2 ⇒ d = d0. (5.5)

Efectivamente, usando las transformaciones (5.4), obtenemos:


5.2. ESTRUCTURAS DE ESPACIO-TIEMPO 67

q q
x202 + y02
2 = (x2 cos θ + y2 sin θ )2 + (−x2 sin θ + y2 cos θ )2
q
x22 cos2 θ + sin2 θ + y22 sin2 θ + cos2 θ
 
=
q
= x22 + y22 . (5.6)

La principal conclusión extraida de las ecuaciones (5.4), es que bajo rotaciones, las
coordenadas (x, y) varı́an pero no de forma independiente ni separada una de otra, sino
conjuntamente una dependiendo de la otra con un solo fı́n: que la distancia Euclidiana
se mantenga invariante. Decimos entonces que la coordenada x tiene la misma naturale-
za que y, y esa naturaleza es Euclidiana. Lo mismo se puede decir de la coordenada z en
la extensión a 3 dimensiones. Pero ¿qué sucede si adicionamos el tiempo?

5.2. Estructuras de espacio-tiempo


En general, un diagrama de espacio-tiempo es una gráfica de tiempo en función
de las coordenadas espaciales. La Figura 5.4 ilustra un ejemplo de diagrama espacio-
temporal en una dimensión espacial, la cual está compuesta por los siguientes elementos:

1. Evento: Es un punto en el diagrama de espacio-tiempo.


t

2. Lı́nea de Universo: Es el conjunto de eventos trazado en el diagrama.

3. Espacio-tiempo tipo (n + m): Espacio vectorial con n coordenadas espaciales y m


t2

temporales. t1

4. Intervalo de espacio-tiempo: También conocido como la distancia de espacio- x

tiempo, es la distancia entre dos eventos. x1
x2

Observamos que la distancia de espacio-tiempo es la generalización de la distancia entre Figura 5.4
dos puntos en el espacio. Es importante aclarar que una lı́nea de Universo no es lo mismo
que una trayectoria, la cual se define como una sucesión de posiciones espaciales. Ası́,
la curva de la Figura 5.4 representa una sucesión de eventos que se adelantan más o
menos rápido en el tiempo, pero la trayectoria es siempre una lı́nea recta sobre el eje x.
En el caso de un espacio-tiempo tipo (2 + 1), las lı́neas de Universo se extienden sobre
una superficie tridimensional curva, mientras que sus trayectorias son lı́neas en un plano
de dos dimensiones. En (3 + 1), la lı́neas se extienden sobre hipersuperficies de cuatro
dimensiones, y sus trayectorias son curvas en las 3 dimensiones espaciales. Aunque los
espacios vectoriales con dimensionalidad mayor o igual a (3 + 1) no se puedan graficar,
sı́ se pueden describir de forma algebráica.
Por otro lado, la transformación de coordenadas entre observadores inerciales se
puede ver alternativamente como rotaciones de ejes en un diagrama de espacio-tiempo,
68 CAPÍTULO 5. ESTRUCTURA DE ESPACIO-TIEMPO

Rotación Espacial Transformación inercial


x0= (cos θ )x + (sin θ )y x0 = Ax + Bt
0
y = −(sin θ )x + (cos θ )y t 0 = Dx + Et

Tabla 5.1: Comparación entre rotaciones espaciales y transformación general entre ob-
servadores inerciales en movimiento relativo

análogo (aunque no idéntico) a las rotaciones del espacio, lo que nos permitirá hacer una
descripción geométrica de la cinemática relativista. Para ver eso, retomemos la forma
general de una transformación dada por las ecuaciones (2.8) del Capı́tulo 2 y las ecua-
ciones de rotación espacial dadas en (5.4), reunidas en la Tabla 5.1. Al comparar ambos
casos, vemos una analogı́a donde en vez de las coordenadas (x, y), se tienen los ejes
y’
(x,t), mientras que los cosenos y senos son reemplazados por los coeficientes genéricos
y
A, B, D y E. Hay que aclarar que esta analogı́a no es exacta debido a que mientras las
Σ’

Σ
u
funciones senos y cosenos toman valores cerrados entre −1 y 1, los coeficientes pueden
tomar valores hasta infinito. Dichos coeficientes pueden ser descritos por medio de las
x’
funciones hiperbólicas, las cuales permiten una interpretación geométrica análoga a una
x

rotación, pero en un plano complejo con ángulos imaginarios (esto se detallará en las
secciones siguientes). Ası́, la transformación de las coordenadas entre observadores en
Figura 5.5 movimiento relativo mostrado en la Figura 5.5, se puede representar equivalentemente
como una rotación de los ejes espacio-temporales, donde cada eje rota en un ángulo ima-
ginario como se muestra en la gráfica de la Figura 5.6, y donde el eje temporal se toma
como el eje imaginario1 . La naturaleza del espacio-tiempo viene entonces determina-
da por el comportamiento del intervalo de espacio-tiempo entre eventos bajo rotaciones
de los ejes espacio-temporales. A continuación, discutiremos las estructuras de espacio-
i·t
tiempo en el contexto de las transformaciones de Galileo y de Lorentz.
i·t’


θ2
x’
5.2.1. Espacio-tiempo clásico


θ1
Las transformaciones de Galileo para una dimensión espacial son:
x

Figura 5.6 x0 = x − ut,


t 0 = t, (5.7)

que se pueden ver como una rotación en un plano espacio-tiempo complejo, donde úni-
camente el eje x rota. Consideremos el caso de un observador inercial Σ que mide una
partı́cula moviéndose sobre el eje x a velocidad constante v desde su origen. La lı́nea de
1 El tiempo imaginario i · t = it simplemente es una descripción matemática. Lo que tiene significado
fı́sico es el “coeficiente” t que acompaña a la unidad imaginaria. Vamos a seguir hablando de diagramas de
espacio-tiempo independiente de que la descripción sea real o compleja (el contenido fı́sico no cambia).
5.2. ESTRUCTURAS DE ESPACIO-TIEMPO 69

Universo de la partı́cula en su diagrama de espacio-tiempo es entonces una lı́nea recta,


como se muestra en la Figura 5.7, donde s indica la distancia de espacio-tiempo y (it2 , x2 )
indican un tiempo [imaginario] y una posición final de la partı́cula. Si otro observador Σ0
en movimiento relativo describe la cinemática de la misma partı́cula, obtendrá una lı́nea i·t

de Universo con una pendiente (velocidad) diferente al anterior. La superposición del
diagrama de espacio-tiempo del observador en movimiento Σ0 respecto al de Σ se puede
representar como una rotación, donde el eje x0 forma un ángulo imaginario iφ , tal que
i·t2

(ver problema 16): Las transformaciones de Galileo para una dimensión espacial son: s


θ2

sin iφ ≈ iu, cos iφ ≈ 1, (5.8) x

x2

mientras que los ejes temporales coinciden, de acuerdo a las transformaciones de las
ecuaciones (5.7). La Figura 5.8 representa las proyecciones2 de las distancias en el siste- Figura 5.7
ma rotado y no rotado simultáneamente. Se evidencia en la figura que si el eje temporal
no rota y el tiempo es el mismo, entonces el intervalo de espacio-tiempo s0 medido
por el observador Σ0 no coincide con el medido por Σ, es decir, bajo transformaciones i·t

de Galileo no es posible definir un espacio-tiempo que deje invariante la distancia [de
espacio-tiempo] entre eventos. Ası́, en mecánica clásica el tiempo se describe como un
parámetro independiente y separado del espacio en el sentido de que no existe un prin- i·t2

cipio geométrico de invariancia que relacione el tiempo y el espacio bajo rotaciones s’

espacio-temporales. En este sentido es que decimos que el tiempo tiene una naturaleza s

diferente a la del espacio en mecánica clásica. ’


φ

La importancia de los diagramas de espacio-tiempo en mecánica clásica radica en x

x2

que son una herramienta útil para la descripción del movimiento de los cuerpos, pero no
contienen ningún principio fundamental de la fı́sica.
Figura 5.8
5.2.2. Espacio-tiempo de Poincaré
Escribamos las transformaciones de Lorentz simples dadas por la ecuación (2.21)
como:

u
x0 = γx − γ ct,
c
0 u
ct = − γx + γct, (5.9)
c
donde los tiempos, por conveniencia, se multiplicaron por la velocidad de la luz, la cual
es una constante universal independiente del movimiento del observador. A diferencia de
las transformaciones de Galileo, vemos que la analogı́a con las rotaciones espaciales es
más cercana en el sentido de que tanto el tiempo como la coordenada espacial cambian.
Ası́, considerando la representación compleja, definimos los ángulos de rotación tal que:
2 Gráficamente, las proyecciones se trazan como lı́neas paralelas a cada eje.
70 CAPÍTULO 5. ESTRUCTURA DE ESPACIO-TIEMPO

cos iφ = γ,
u
sin iφ = i γ = iβ γ, (5.10)
c
por lo que las TLS expresadas en la forma de la ecuación (5.9) se pueden escribir de
forma equivalente en un plano complejo como:

x0 = x cos iφ + ict sin iφ ,


ict 0 = −x sin iφ + ict cos iφ . (5.11)
El significado fı́sico de los ángulos imaginarios se aclara en la Sección 6.4. Por
el momento simplemente lo asimilamos como una rotación de los ejes. Por otro lado,
como el eje temporal se reparametrizó en terminos de un producto con una velocidad
[de la luz], se asimila como una coordenada con unidades de longitud, semejante a una
coordenada espacial. Ası́, se acostumbra en el caso más general usar la siguiente notación
para marcar las coordenadas espacio-temporales de eventos:

(x, y, z, ict) → (x1 , x2 , x3 , x4 ), (5.12)


que genera el espacio-tiempo en el esquema de tiempo imaginario (esquema de Poin-
caré). Ası́, en el caso del plano (1 + 1), las TLS se escriben como:

x10 = x1 cos iφ + x4 sin iφ ,


x40 = −x1 sin iφ + x4 cos iφ , (5.13)
que son el análogo espacio-temporal de las rotaciones espaciales de la ecuación (5.4).
x4

x4’

Ası́, tomando de nuevo el ejemplo de una partı́cula que se mueve con velocidad cons-
tante, se puede trazar su lı́nea de Universo en el sistema de ejes de un observador Σ, y
0
x1’

correspondiente sistema coordenado rotado de un observador Σ en movimiento rela-
el
s
tivo, como se muestra en la Figura 5.9. Como la coordenada temporal x4 rota, se puede
observar en la figura que es posible definir una distancia de espacio-tiempo, s, que se

φ

x1
mantiene invariante frente a las rotaciones (transformaciones) de Lorentz, donde la dis-
tancia se define en la forma Euclidiana como :
Figura 5.9 q q
s = x1 + x4 = x102 + x402 .
2 2 (5.14)
Ası́, bajo TLS, es posible definir una estructura de espacio-tiempo donde la coorde-
nada temporal y las espaciales varı́an conjuntamente una dependiendo de la otra tal que
el intervalo de espacio-tiempo se mantiene invariante. Decimos entonces que el tiempo
adquiere la misma naturaleza que las coordenadas espaciales. En el caso del esquema
complejo usado, esa naturaleza, al igual que la geometrı́a del espacio, es Euclidiana.
5.2. ESTRUCTURAS DE ESPACIO-TIEMPO 71

Problema 15: Demuestre que de acuerdo a las rotaciones definidas en (5.10), se cum-
ple la identidad:
sin2 iφ + cos2 iφ = 1. (5.15)

Problema 16: Demuestre que haciendo el cambio sin iφ → c−1 sin iφ , las ecuaciones
(5.10) se aproximan a (5.8) en el lı́mite clásico, mientras que las TLS expresadas en
(5.11) se convierten en las de Galileo en (5.7).

5.2.3. Espacio-tiempo de Minkowski


En la estructura de espacio-tiempo de Poincaré, las TLS junto con las rotaciones
espaciales generan una geometrı́a donde las distancias invariantes toman la forma Eu-
clidiana. Existe otro esquema equivalente, donde el plano y los ángulos de rotación son
reales, pero la geometrı́a es seudo-Euclidiana con coordenadas espacio-temporales defi-
nidas como:

(x0 , x1 , x2 , x3 ) = (ct, x, y, z), (5.16)

donde la coordenada temporal es real (esquema de Minkowski). Para distinguirlo del


esquema complejo, el tiempo se marca como la primera coordenada y con el subı́ndice
0. La relación entre ambos esquemas se manifiesta al calcular el cuadrado de las coorde-
nadas temporales:

x42 = (ict)2 = − (ct)2 = −x02 . (5.17)


Ası́, la distancia de espacio-tiempo definida en el plano complejo de acuerdo a la forma
Euclidiana de (5.14) se convierte en un plano real en la distancia seudo-Euclidiana:
q
s = x12 − x02 . (5.18)
Las TLS definidas de acuerdo a la forma (5.9), se reescriben en el esquema real como:

x10 = γ (x1 − β x0 ) ,
x00 = γ (x0 − β x1 ) . (5.19)

Las transformaciones expresadas en la ecuación (5.19) se pueden interpretar como rota-


ción de ejes coordenados si encontramos la ecuación de cada eje, x00 y x10 , sobre un plano
72 CAPÍTULO 5. ESTRUCTURA DE ESPACIO-TIEMPO

ortogonal formado por los ejes x0 y x1 . Por ejemplo, si en la segunda ecuación de (5.19)
hacemos x00 = 0, encontraremos el conjunto de eventos simultáneos en el tiempo t 0 = 0.
Al despejar, se obtiene :

x0
x0 = β x1 , (5.20)

que representa una lı́nea recta en el plano (x0 , x1 ) con pendiente

x’

1
tan φ = β , (5.21)
φ

x1
como se muestra en la Figura 5.10. El conjunto de eventos ocurridos en el tiempo t 0 = 0
no es más que la definición del eje x10 . De forma análoga, si tomamos el conjunto de
Figura 5.10 eventos que ocurren en la posición x10 = 0, entonces de la primera ecuación en (5.19)
obtenemos la solución:

x0 = (β )−1 x1 , (5.22)
x0
x’

0

cuya pendiente es también β pero respecto al eje vertical, lo que nos define al eje x00 .
La Figura 5.11 muestra la superposición de ambas rectas. Ası́, las TLS en el esquema
φ
real de Minkowski se pueden interpretar como una rotación, donde los ejes coordenados
x’
espacio-temporales de observadores en movimiento relativo rotan en dirección opuesta,
1

mientras que la distancia semi-Euclidiana definida en (5.18) se mantiene invariante fren-
φ

x1
te a dichas rotaciones, como se ilustra en la Figura 5.12. Es importante resaltar de nuevo
que las proyecciones se realizan trazando lı́neas paralelas a los ejes de acuerdo a cada
observador.
Figura 5.11

5.3. La estructura de cono de luz


La distancia de espacio-tiempo de la ecuación (5.18) se definió para el caso parti-
cular de que el primer evento suceda en el origen de los ejes espacio-temporales y para
x0
dimensionalidad (1 + 1). En general, si los eventos ocurren con una separación espacial
x’

0

∆x y en un intervalo de tiempo ∆t, el cuadrado del intervalo de espacio-tiempo es:
s

∆s2 = |∆x|2 − ∆x02 , (5.23)
x1’

donde ∆x indica el vector de desplazamiento espacial, cuya magnitud mantiene la forma
x1
Euclidiana
q
Figura 5.12 |∆x| = ∆x12 + ∆x22 + ∆x32 , (5.24)
razón por la cual al intervalo en (5.23) se le llama seudo-Euclidiana (Euclidiano en el
espacio, pero no Euclidiano en el tiempo). Se evidencia que el cuadrado del intervalo
5.3. LA ESTRUCTURA DE CONO DE LUZ 73

de espacio-tiempo puede ser positivo, nulo o negativo según la relación entre el des-
plazamiento y el intervalo de tiempo. Antes de discutir cada caso, tengamos en cuenta
que:




|∆x| : Distancia espacial entre dos eventos

∆t : Diferencia de tiempo entre dos eventos
(5.25)


c∆t : Distancia recorrida por un rayo de luz

 en el intervalo de tiempo de los eventos

Veamos los diferentes casos que genera el signo del intervalo.


i.) Intervalo tipo espacio: Corresponde al intervalo de espacio-tiempo entre eventos
cuya separación [espacial] es mayor que la distancia que recorrerı́a un rayo de luz
en el intervalo de tiempo en que ocurren esos mismos eventos:

|∆x|2 > (c∆t)2 ⇒ ∆s2 > 0. (5.26)

Ası́, si se envı́a un rayo de luz en el lugar y en el instante en que ocurre el primer


evento, ese rayo de luz no alcanza a llegar al lugar donde y cuando ocurre el
segundo evento.
ii.) Intervalo tipo luz: Corresponde al intervalo de espacio-tiempo de eventos cuya
separación es igual a la distancia que recorrerı́a un rayo de luz en el intervalo de
tiempo en que ocurren esos mismos eventos:

|∆x|2 = (c∆t)2 ⇒ ∆s2 = 0. (5.27)

Ası́, si se envı́a un rayo de luz en el lugar y en el instante en que ocurre el primer


evento, ese rayo de luz justo alcanza a llegar al lugar donde y cuando ocurre el
segundo evento.
iii.) Intervalo tipo tiempo: Corresponde al intervalo de espacio-tiempo de eventos cuya
separación es menor que la distancia que recorrerı́a un rayo de luz en el intervalo
de tiempo en que ocurren esos mismos eventos:

|∆x|2 < (c∆t)2 ⇒ ∆s2 < 0. (5.28)

Ası́, si se envı́a un rayo de luz en el lugar y en el instante en que ocurre el primer


evento, ese rayo de luz llega a la posición del segudo evento antes de que éste
ocurra.
74 CAPÍTULO 5. ESTRUCTURA DE ESPACIO-TIEMPO

En particular, el intervalo tipo luz divide al espacio-tiempo en regiones separadas por


las lı́neas de Universo de rayos de luz viajando hacia y desde un evento. Por ejemplo, la
Figura 5.13 representa las lı́neas de Universo de cuatro rayos de luz en un diagrama de
x0
dimensión (1 + 1): dos rayos de luz se emiten desde el evento A en direcciones opuestas
(lı́neas 1 y 2), y simultáneamente otro dos rayos llegan al evento A de direcciones opues-
1   2   tas (lı́neas 3 y 4). Tal configuración de lı́neas de Universo se conoce como cono de luz.
La Figura 5.14 ilustra los tres tipos de intervalos espacio-tiemporales en relación a un
x0(A)  

A   cono de luz. Los eventos A y B estan separados por un intervalo tipo tiempo, los eventos
3   4   C y D lo estan por un intervalo tipo luz, y los eventos E y F son eventos separados por un
x1
intervalo tipo espacio. Es importante enfatizar que el intervalo tipo luz, que es nulo, se
x1(A)  

representa como una lı́nea paralela al cono de luz, contrario a la distancia espacial nula,
la cual se representa como un punto de longitud cero.
Figura 5.13
5.3.1. El principio de causalidad
La estructura de cono de luz del espacio-tiempo de Minkowski separa el espacio-
B   tiempo en tres regiones de influencias en relación a algún evento puntual A, representado
Δ
s2<0
como el vértice del cono. Primero, el interior del cono se define como el conjunto de
C  
Δ
s2=0
eventos que se pueden unir con el A por intervalos tipo tiempo. Todos los eventos debajo
A   del vértice son eventos que ocurren antes de A, por lo que los vamos a llamar el pasado
D   de A, mientras que aquellos que estan por encima, serán eventos que ocurren después,
Δ
s2>0
F   por lo que representan el futuro de A, como se indica en la Figura 5.15. Segundo, como
E   consecuencia de la estructura de cono de luz, aparece una nueva región externa al cono,
formada por todos aquellos eventos que no tienen ninguna relación causal con A, es
decir, no forman ni el pasado, ni el futuro de A, por lo que simplemente lo vamos a
Figura 5.14 llamar el resto. Ası́, cualquier evento futuro son eventos potencialmente posibles que
pueden ser causados por A en el sentido de que cualquier objeto o información que viaje
por debajo o igual a la velocidad de la luz puede influenciar eventos [futuros] después
de que ocurrió el evento A. Por otro lado, el pasado de A corresponde a todos aquellos
posibles eventos que pudieron causar o influenciar al evento A. Los eventos ubicados en
el resto tendrı́an que enviar información que viaje por encima de la velocidad de la luz
Resto  
para conectarsen con A, por lo que tales eventos no pueden influencia ni tampoco ser
Resto   influenciados por el evento A3 .
Evento   Por otro lado, podrı́amos plantear un efecto causal inverso del pasado y futuro de
A  
un evento. Por ejemplo, si el futuro de A se define como todos los posibles eventos
que pueden ser influenciados por A, ¿será posible que los eventos futuros de A pue-
dan influenciar a los eventos pasados?. Si eso fuera posible, encontramos entonces una
ambigüedad de lo que llamamos pasado y futuro, lo que nos llevará a paradojas como
Figura 5.15 la famosa paradoja del abuelo: si una persona pudiera viajar a su pasado y matar a su
abuelo antes de conocer a su abuela, entonces esa persona no hubiera nacido, y por lo
3 No con las formas de materia y energı́a conocidas del Universo. Aunque el principio de la relatividad
especial no prohibe la existencia de taquiones, estos no han sido observados.
5.3. LA ESTRUCTURA DE CONO DE LUZ 75

tanto no pudo haber viajado al pasado para matar a su abuelo. Sin embargo, las obser-
vaciones muestran que el Universo define una única dirección temporal de los eventos
contenido en el principio de causalidad:

Principio de causalidad : Para todo observador inercial, ningún evento


puede influenciar eventos que ya sucedieron; solamente los eventos
pasados pueden influenciar eventos futuros.

Ası́, el principio de causalidad define de forma invariante y absoluta el pasado y el


futuro de los eventos:

Pasado de un evento A: Son todos aquellos eventos que sucedieron o pudieron suceder
y que pueden influenciar a A.
Futuro de un evento A: Son todos aquellos eventos que sucederán o pueden suceder
y que A puede influenciar.

Los eventos del resto, son eventos o realidades posibles, pero que no pueden influenciar
ni ser influenciados por el evento A, ni por su futuro, ni por su pasado.

Problema 17: Una vara de longitud propia L0 se mueve horizontalmente con veloci-
dad u hacia una pared fija. Asumiendo que la infomación de los eventos de un extremo
a otro se propaga a la velocidad lı́mite c, calcule la longitud final de la vara después
de quedar enteremante en reposo respecto a la pared de acuerdo al observador que
viaja a velocidad u. Pista: Resuelva el problema pintando las lı́neas de universo de
los extremos de acuerdo a como se describe abajo.

El observador que viaja junto con la vara cuando ésta se encuentra en movimiento en
el problema 17 observa que es la pared la que se mueve hacia un extremo con velocidad
−u, mientras que la vara se encuentra inicialmente en reposo. Puesto que la información
no puede viajar más rápido que la velocidad c, la colisión entera se prolonga entre dos
eventos que se pueden describir en un diagrama de espacio-tiempo: el primer evento
sucede cuando la pared toca un extremo de la vara (evento A), el cual se empieza a
mover junto con la pared, y el segundo cuando la información de la colisión llega al
extremo opuesto (evento B), instante en que dicho extremo se pone en movimiento. La
longitud final se puede obtener al pintar las lı́neas de Universo de cada extremo entre los
dos eventos, teniendo como referencia el cono de luz con vértice en el evento A.
76 CAPÍTULO 5. ESTRUCTURA DE ESPACIO-TIEMPO

El efecto descrito en el problema anterior se puede usar para resolver una de las
versiones de la paradoja del saltador con pértiga. La paradoja consiste en un saltador
S que lleva una pértiga horizontal con longitud propia L0 y corriendo a velocidad u. El
saltador ingresa a un garaje cuya longitud propia coincide con la longitud de la pértiga en
movimiento medida por un portero P en reposo respecto al garaje. Tan pronto el portero
observa que los extremos se encuentran al interior del garaje, activa un sistema que cierra
instantáneamente las puertas, dejando al saltador completamente encerrado. Por su lado,
el saltador mide que la longitud del garaje en movimiento está contraida respecto a su
vara, tal que aparemente no puede quedar encerrado dentro del garaje cuando las puertas
se cierran. Determine si el saltador queda o no encerrado.
CAPÍTULO 6

La Geometrı́a de la Cinemática Relativista

La estructura de espacio-tiempo estudiada en el capı́tulo anterior es consecuencia x0’




x0

directa de las transformaciones de Lorentz, las cuales a su vez se soportan en los pos-
tulados de la relatividad especial. Ası́, la geometrı́a exhibida por el espacio-tiempo de
Minkowski incorpora automáticamente efectos relativistas tales como la dilatación tem- φ

poral y la contracción de Fitzgerald-Lorentz. En éste capı́tulo se discutirá el tratamiento
geométrico de la cinemática relativista, la cual harémos en el esquema real de Min- φ

x1’


kowski. Sin embargo, antes es importante distinguir aquellas distorsiones aparentes que
x1

surgen debido a la naturaleza seudo-Euclidiana del espacio-tiempo de Minkowski para
no confundirlos con los efectos verdaderamente relativistas.
Figura 6.1

6.1. Distorsión Angular


La Figura 5.11 del capı́tulo anterior ilustra los ejes coordenados ortogonales (x0 , x1 )
asociados a un observador Σ en reposo, mientras que los ejes (x00 , x10 ) corresponde a los x0’


ejes de otro observador Σ0 visto en movimiento desde Σ. Debido a la naturaleza seudo-
Euclidiana del espacio de Minkowski, pareciera como si los ejes de Σ0 perdieran su
Δ
s

ortogonalidad. Pero si nos ubicamos sobre el observador Σ0 , vemos que sus ejes, ahora en Δ
x’

0

reposo, siguen siendo ortogonales, mientras que los ejes del observador Σ moviéndose en 90
0
dirección opuesta, se ven rotados como se muestra en la Figura 6.1. Ası́, para la correcta
x1’


interpretación geométrica de los aspectos cinemáticos de la relatividad, debemos ser Δ
x’

1

cuidadosos de la presencia de distorsiones irreales debido a la no ortogonalidad aparente
de los ejes en movimiento. Para ilustrar los efectos de esa distorsión, consideremos el Figura 6.2
triángulo espacio-temporal con un ángulo recto mostrado en la Figura 6.2 trazado desde
el observador Σ0 en reposo. Si trazamos el mismo triángulo desde otro observador Σ que

77
78 CAPÍTULO 6. LA GEOMETRÍA DE LA CINEMÁTICA RELATIVISTA

ve a Σ0 en movimiento relativo, se obtiene el triángulo distorsionado de la Figura 6.3,


donde el ángulo sigue siendo recto aunque se vea deformado en un ángulo agudo, efecto
que llamaremos distorsión angular.
x0

x0’

6.2. Cinemática
Δ
s

Estudiaremos los efectos relativistas del tiempo y la longitud en el contexto de los
0
90

x1’

diagramas de espacio-tiempo en el esquema real de Minkowski.

x1
6.2.1. Relatividad de la simultaneidad
Consideremos un observador inercial Σ, que mide dos eventos simultáneos A y B
Figura 6.3 que ocurren en el tiempo t y en las posiciones x1A y x1B respectivamente. Usando rotación
de diagramas espacio-temporales, podemos comprobar que esos mismos eventos ya no
serán simultáneos desde otro observador Σ0 moviéndose con velocidad relativa u. La
Figura 6.4 muestra los eventos y sus proyecciones sobre los ejes del observador en reposo
Σ y los ejes del observador en movimiento Σ0 rotados en un ángulo φ , de acuerdo a la
Σ
Σ’
ecuación (5.21). A simple vista, es evidente que los eventos medidos por Σ0 ocurren en
A B
x0
tiempos diferentes en un intervalo ∆x00 = c∆t 0 , y con una separación espacial ∆x10 . La
Figura 6.5 muestra el triángulo espacio-temporal extraido del diagrama anterior, donde
al tener en cuenta la distorsión angular, se cumple1 :
φ

∆x00 u
x1
A
tan φ = =β = , (6.1)
x1B

∆x10 c
de donde se obtiene:
Figura 6.4
∆x00
∆x10 =
. (6.2)
β
Por otro lado, como el intervalo de espacio-tiempo es invariante, se cumple:
A Δ
s
B 2 2
∆s2 = ∆x0 1 − ∆x0 0 = ∆x12 . (6.3)
φ

Reemplazando el intervalo espacial obtenido en (6.2) en la ecuación (6.3), se obtiene:
Δ
x0

0
90

∆x0 20 2
− ∆x0 0 = ∆x12
β2
β2
 
02
⇒ ∆x 0 = ∆x12
Figura 6.5 1−β2
⇒ ∆x00 = γβ ∆x1
γβ
⇒ ∆t 0 = ∆x1 . (6.4)
c
1 Para mayor claridad, pueden pintar ése mismo triángulo tomando a Σ0 como el sistema en reposo.
6.2. CINEMÁTICA 79

Ası́, los eventos en Σ0 se separan temporalmente. Los eventos son simultáneos en Σ0


solamente si la separación espacial en Σ es nula, es decir, ∆t 0 = 0 solo si ∆x1 = 0, lo que
describe las propiedades relativistas de la simultaneidad obtenidas en la subsección 3.1.1
bajo las TLS: es relativa para eventos ocurridos en diferentes posiciones espaciales, y es
absoluta para eventos ocurridos en la misma posición

6.2.2. Dilatación temporal Σ


Σ’
A
x0A  

Consideremos ahora un observador inercial Σ, que mide dos eventos A y B en la φ

misma posición x1 y en los tiempos propios t A y t B respectivamente. Usando rotación

x0

de diagramas espacio-temporales podemos calcular el intervalo de tiempo entre esos x0B  
B
mismos eventos desde otro observador Σ0 moviéndose con velocidad relativa u. La Figura
6.6 muestra los eventos y sus proyecciones sobre los ejes del observador en reposo Σ y los
ejes del observador en movimiento Σ0 . La Figura 6.7 muestra el triángulo distorsionado, x1

el cual ahora cumple con la relación:
Figura 6.6
∆x10
tan φ = = β, (6.5)
∆x00
de donde se obtiene: A
∆x10 = β ∆x00 . (6.6)
La invariancia del intervalo espacio-temporal nos lleva a φ

Δ
s

2 2
∆s = 2
∆x0 1 − ∆x0 0 = −∆x02 . (6.7) 0
90

Reemplazando el intervalo (6.6) en la ecuación (6.7), se obtiene:
B
1

Δ
x’

2 2
β 2 ∆x0 0 − ∆x0 0 = −∆x02
  Figura 6.7
02 1
⇒ ∆x 0 = ∆x02
1−β2
⇒ ∆x00 = γ∆x0
⇒ ∆t 0 = γτ, (6.8)
donde τ = t A − t B es el intervalo de tiempo propio medido por el observador Σ. La ecua-
ción anterior no es mas que la fórmula de dilatación temporal obtenida en la ecuación
(3.6) del capı́tulo 3 bajo las TLS.

6.2.3. Contracción de Fitzgerald-Lorentz


Para obtener el efecto de contracción de longitudes, recordemos que si el observador
se encuentra en movimiento respecto al objeto, la medida de los extremos se debe rea-
lizar de forma simultánea, por ejemplo en el tiempo t 0 = 0. Ası́, si graficamos una barra
80 CAPÍTULO 6. LA GEOMETRÍA DE LA CINEMÁTICA RELATIVISTA

desde su sistema en reposo Σ, sus extremos deben de estar alineados a lo largo del eje
x10 del observador en movimiento Σ0 , como se muestra en la Figura 6.8. La proyección
x0
x’

sobre el eje x1 de Σ corresponde a la longitud propia L0 . Procediendo de forma análoga
0
a los casos anteriores, se puede demostrar el efecto de contracción de longitudes:
L0
x0A  
B   x’


1
L0 = . (6.9)
γ
A  
x0B  
φ

x1

L0

Problema 18: Demuestre la ecuación (6.9) por el método de diagramas espacio-
Figura 6.8 tiempo

6.3. Hipérbolas invariantes


x0

2
Otro efecto de la estructura seudo-Euclidiana del espacio-tiempo de Minkowski, es
el cambio de escala de los ejes coordenados entre observadores en movimiento relativo.
1  
1

La condición fundamental que determina la relación de escala de medida es que sin


x1
importar el movimiento de los observadores inerciales, el intervalo espacio-temporal
-2 -1
1  1 2

entre eventos debe valer lo mismo, por lo que el intervalo de espacio-tiempo se puede
-1
usar como patrón de comparación universal. Como el intervalo puede ser positivo o
negativo, se definen dos unidades de comparación:
-2

Figura 6.9 s2+ = x12 − x02 = 1, (A)


s2− = x12 − x02 = −1, (B) (6.10)

donde la unidad puede ser metros, centimetros, pulgadas, etc, según sea el sistema de
unidades que se use. Las ecuaciones (6.10) representan las ecuaciones de hipérbolas, dos
x0
con vértices en las coordenadas x1 = ±1 (ecuación (A)) y otras dos en las coordenadas
x’

0
x0 = ±1 (ecuación (B)). Ası́, por definición, la distancia entre el origen y cualquier
3   punto sobre las hipérbolas es constante, y en este caso igual a 1. La Figura 6.9 ilustra las
3   hipérbolas con vértices positivos, donde la ası́ntota que separa las dos curvas representa
2  
2  
x’

1
la lı́nea de Universo de un rayo de luz, es decir, el cono de luz con vértice en el origen.
3  
1   2  
Como se muestra, todas las lı́neas de espacio-tiempo pintadas a trazos desde el origen
1   miden una unidad, incluso aunque a simple vista aparentan ser de diferentes longitudes.
1  
x1
Por otro lado, como las distancias espacio-temporales de la ecuación (6.10) son in-
1   2   3   denpendientes del observador, las hipérbolas no cambian si el sistema coordenado se
cambia por otro de un observador en movimiento, razón por la cual se habla de hipérbo-
Figura 6.10 las invariantes. Por ejemplo, la Figura 6.10 ilustra los ejes de un observador en movi-
miento Σ0 con sus ejes rotados respecto a otro observador en reposo Σ, y un conjunto de
6.3. HIPÉRBOLAS INVARIANTES 81

hipérbolas invariantes separadas en una unidad. Los cortes de las hipérbolas sobre cada
eje determina la escala de medida. Teniendo en cuenta este cambio de escala a través
de las hipérbolas invariantes, es posible determinar las coordenadas espacio-temporales x0

de eventos para cualquier observador usando regla y transportador directamente. Para
20c
20 Desintegración  
ilustrar cómo aplicar el método, consideremos como ejemplo el problema de un neutrón
que se mueve a la mitad de la velocidad de la luz (0.5c) de acuerdo a un observador Σ. 15c
15 Línea  de  
Suponga que dicho observador mide que el neutrón se desintegra después de un tiem- Universo  
10c
10 26.60

po t = 17.3 minutos. La lı́nea de Universo del neutrón de acuerdo a ese observador se
5c
5
muestra en la Figura 6.11, cuyo ángulo es:
0
5 10 15
15c
20
x1

5c
10c
20c

φ = tan−1 β = tan−1 0.5 ≈ 26.60 . (6.11)


Figura 6.11
Otro observador Σ0 que ve al neutrón en reposo, va a medir un tiempo de vida diferente.
Para calcularlo, pintemos los ejes coordenados del observador que se mueve junto con
el neutrón (por lo que la lı́nea de Universo coincide con el eje temporal, suponiendo que
x0
x’

0

el neutrón se encuentra en el origen de posiciones), como se muestra en la Figura 6.12.
La Figura 6.13 muestra una porción detallada de los diagramas de espacio-tiempo con 20c
20
un conjunto de hipérbolas invariantes con vértices en x0 = 15c, 15.5c, 16c, 16.5c, 17c, 15c
15
y 17.5c. Vemos directamente que la desintegración sobre el eje x00 corta a la hipérbola x1’


10c
10 26.60

de 15c, es decir, t 0 ≈ 15 minutos para el observador Σ0 . Aunque no se aplicó las TLS
para resolver el problema, indirectamente si se estan usando debido a que la geometrı́a 5c
5
automáticamente las tiene incorporadas. 0
5 10 15 20
x1

5c
10c
15c
20c

Figura 6.12
Problema 19: Demuestre, usando la ecuación de dilatación temporal, que el tiempo
de vida propio del neutrón es 15 minutos. Usando diagramas de espacio-tiempo, de-
termine el tiempo de vida del neutrón medido por un observador Σ0 que se mueve a
una velocidad relativa de u = 0.9c respecto a Σ.
x0
x0’


17.3c  
18.0

17.5c

17.5

17c

17.0

6.3.1. La paradoja de los gemelos 16.5c



16.5 15c  
16c
16.0
Dos gemelos, el primero en tierra (observador T ), y el segundo embarcado en un 15.5c

15.5

15c
15.0
viaje por el espacio (observador V ) deciden reencontrarsen después de 20 años terres- 2 4 6 8 10
x1

tres. En virtud del efecto de dilatación temporal, los tiempos medidos de los eventos
difieren entre ambos observadores. Ası́, por ejemplo, si después de unos años, medimos Figura 6.13
el tiempo transcurrido cuando el viajero cruza una posición determinada, los relojes de
T medirán un tiempo tT , que lo podemos hacer corresponder con la edad del gemelo en
tierra, mientras que los relojes de V medirán un tiempo propio τV que coincidirá con la
edad del hermano viajero. Por efecto de la dilatación, se tiene que tT > τV , por lo que
82 CAPÍTULO 6. LA GEOMETRÍA DE LA CINEMÁTICA RELATIVISTA

el observador T es más viejo que V cuando éste se haya desplazado una distancia deter-
minada. Por otro lado, visto desde el sistema del gemelo viajero, éste observa que es su
hermano T el que está en movimiento, por lo que la relación de tiempos se invierte: V
mide un tiempo dilatado tV de su edad en relación a la edad que mide su propio hermano
τT , es decir tV > τT tal que en éste escenario el observador V es más viejo que T . Cuando
los gemelos se reencuentren, ¿quién es más viejo?
El problema plantea dos formas de medir las edades relativas con resultados opues-
tos, produciendo una aparente paradoja. Sin embargo, la paradoja es irreal ya que, pri-
mero, es aceptable que cada observador mida diferentes resultados siempre y cuando los
hermanos se mantengan alejados, y segundo, si hay un reencuentro en el mismo punto
espacial, el hermano viajero tuvo que invertir su movimiento para regresar, por lo que
sus relojes acelerados cambian su lectura tal que al momento del reencuentro, sólo hay
un único resultado. Antes de calcular la edad de los gemelos, hagamos una descripción
cualitativa de la solución separando lo que mide cada observador:

1. Medida desde T: Inicialmente, cuando el viajero V arranca desde la Tierra, T ob-


serva que éste se aleja continuamente. Ası́, la edad de T corre más rápido que la de
su hermano V . Después, en algún momento V cambia su dirección de movimiento,
tal que T observa que éste se acerca continuamente. Como la fórmula de dilata-
ción es independiente de la dirección de movimiento, T sigue registrando que V
es más joven, tal que cuando se reencuentran, T es más viejo que su hermano V.
2. Medida desde V: Inicialmente, cuando el viajero V arranca de la Tierra, V observa
x0
que es T quién se aleja continuamente. Ası́, la edad de V corre más rápido que la
20c

20 de T . Aunque el resultado es opuesto al medido desde T , ambos observadores en
su propio sistema tiene razón, que es la esencia del primer postulado de la relativi-
15c

15
dad. Sin embargo, cuando el viajero V cambia su dirección de movimiento, debe
transitar por diferentes sistemas inerciales continuamente hasta quedar direccio-
10c
nado hacia la tierra, es decir, debe desacelerar y luego acelerar, proceso que T
R
10

6c  
no sufre. El efecto de la aceleración, es que desde V ,sus relojes corren más lento
5c

5
que los relojes de T, por lo que el hermano T sufre un “envejecimiento prematu-
ro” en relación a V pasando de ser más joven a ser más viejo, tal que cuando se
2 4 6 8 10 x1
reencuentran, T es más viejo que su hermano V.
2c
4c
6c
8c

Figura 6.14 Ası́, al final hay una única solución: un viajero que se aleja y vuelve va a encontrar
que es más joven que su hermano en tierra. Para resolver el problema numéricamente,
podemos aprovechar las herramientas ofrecidas por los diagramas de espacio-tiempo.
Supongamos que un viajero adquiere una velocidad constante v = 0.8c de forma ins-
tantánea cuando sale de la Tierra, y que a mitad de su viaje, cambia instantáneamente
la dirección de movimiento, por lo que el viajero solamente transita por dos sistemas
inerciales diferentes. La Figura 6.14 muestra la lı́nea de Universo del viajero visto des-
de tierra. El evento R marca el cambia de dirección del viajero. Como se muestra, la
hipérbola invariante que corta al evento R, tiene vértice en 6c, por lo que mientras en
6.4. LA RAPIDEZ HIPERBÓLICA 83

tierra han pasado 10 años, los relojes de V marcan solo 6 años desde su partida. El tiem-
po de regreso es el mismo, por lo que al final cuando en tierra han pasado 20 años,
el viajero habrá registrado solo 12 años, es decir, V es 8 años más jóven que T . Para
calcular los tiempos desde el viajero, lo podemos hacer rotando sus ejes respecto a los
de la tierra. Para representar el cambio de sistema inercial cuando cambia su dirección, x0’’


x0
x’

0

podemos considerar dos sistemas de ejes, el primero (sistema Σ0 ) alejándose desde tierra
y el segundo (sistema Σ00 ) acercándose hacia la tierra, tal que cuando los ejes temporales
x’

1

se cruzen, el viajero “salta” de un sistema a otro. La Figura 6.15 ilustra los ejes a trazos
rotados positivamente (velocidad positiva) de Σ0 y los ejes rotados negativamente (velo- R

cidad negativa) de Σ00 . La lı́nea de Universo continua representa el movimiento de V , que


x1

como se observa, viaja sobre el sistema Σ0 hasta el evento R, y luego se regresa sobre el
sistema Σ00 . Ası́, debemos separar las observaciones de V en dos tramos. La Figura 6.16 x1’’



muestra la proyección de tiempo del evento R en tierra, cuando el viajero se prepara
para su retorno, es decir, cuando V marca 6 años, los relojes de T marcan 3.6 años. Ası́, Figura 6.15
visto desde el sistema Σ0 , hasta ese instante T es más joven que V . Pero justo después de
emprender el retorno, la proyección cambian de acuerdo a la Figura 6.17, donde ahora
los relojes de T marcan 16.4 años, mayor a los 6 de V , es decir, en el proceso del “salto”
de un sistema a otro, el observador V registra un cambio repentino de 3.6 a 16.4 años x0

en los relojes de T , como si el tiempo en la Tierra se acelerara2 . Después del cambio de 14
x’

0

dirección, el viajero continuará su regreso a la Tierra en sus 6 años restantes, tal que al 12

R x1’


10c
10
3.6c  
llegar, el viajero también registra que es 8 años más joven que su hermano T . 8

6c
6

6.4. La rapidez hiperbólica 2c


2

2 4 6 8 10 12 14 x1

4c
8c
12c

En el esquema de tiempo imaginario de Poincaré de la Sección 5.2.2, se definieron
las rotaciones de coordenadas espacio-temporales a través de ángulos imaginarios de Figura 6.16
acuerdo a las ecuaciones (5.13). Por supuesto, los ángulos de rotación no se interpretan
de la misma forma que una rotación “ordinaria” en el espacio, sino que son una repre-
sentación de las transformaciones entre observadores inerciales en movimiento relativo.
Ası́, los ángulos imaginarios se relacionan con la velocidad relativa entre los observado-
x0

x0’


res. Para estudiar el contenido cinemático de tales rotaciones en el plano complejo, re- 20c

20

cordemos que las funciones trigonométricas de ángulos imaginarios son funciones muy
15c

15

conocidas en la geometrı́a: corresponden a funciones hiperbólicas, las cuales se definen


R
en términos de la función exponencial como: 10c

10

16.4c  
5

1 φ x1

e + e−φ ,
 5 10 15 20

cos iφ = cosh φ = 5c
10c
x’1’



2
i φ
e − e−φ ,

sin iφ = i sinh φ = (6.12)
2 Figura 6.17
2 El proceso se modela como un salto instantáneo, pero en una situación con aceleración finita, el cambio

es suave, por lo que el tiempo en tierra se acelera continuamente hasta llegar a 16.4.
84 CAPÍTULO 6. LA GEOMETRÍA DE LA CINEMÁTICA RELATIVISTA

donde φ es una variable real. Haciendo una inspección superficial, podemos ver que la
función coseno de un número imaginario es una cantidad real, mientras que la función
seno de un número imaginario es otro número imaginario. Por su parte, las funciones
coseno hiperbólico y seno hiperbólico son ambas funciones reales.
Por otro lado, las definiciones de la ecuación (5.10) del capı́tulo 5 se pueden escribir
en términos de las funciones hiperbólicas como:

cosh φ = γ,
sinh φ = β γ, (6.13)

tal que la tangente hiperbólica es:

sinh φ u
tanh φ = =β = , (6.14)
cosh φ c
por lo que la rotación del plano complejo se relaciona con la velocidad relativa entre
observadores de acuerdo a la ecuación (6.14). Debido a esa relación, al parámetro φ se
le conoce como la rapidéz hiperbólica3 , y tradicionamente se nota con la letra y. Ası́, la
rapidez hiperbólica entre observadores inerciales es:

y = tanh−1 β . (6.15)
En procesos de colisión es conveniente parametrizar el movimiento de las partı́culas
en terminos de la rapidez hiperbólica en lugar de la velocidad o el factor beta directa-
mente. Por ejemplo, definiendo las razones βv0 = v0 /c, βv = v/c y βu = u/c, el teorema
de adición de velocidades en la ecuación (3.16) se puede expresar como:

βv − βu
βv0 = ,
1 − βv βu
tanh yv − tanh yu
⇒ tanh yv0 = . (6.16)
1 − tanh yv tanh yu

Usando la identidad

tanh x − tanh y
tanh (x − y) = , (6.17)
1 − tanh x tanh y
la ecuación (6.16) queda:

tanh yv0 = tanh (yv − yu ), (6.18)


3 La expresión en inglés es rapidity, la cual no tiene una traducción directa al español, ya que rapidez se
refiere a la magnitud de la velocidad. Para no confundir ambos términos, lo llamo rapidez hiperbólica
6.4. LA RAPIDEZ HIPERBÓLICA 85

la cual se cumple si sus argumentos son iguales, es decir, el teorema de suma de veloci-
dades en términos de la rapidez hiperbólica se expresa en la forma simple:

yv0 = yv − yu , (6.19)
que es mucho más sencillo de manipular que la forma racional de la ecuación (3.16).

Problema 20: Usando expansión en series de Taylor, demuestra que a bajas veloci-
dades, la ecuación (6.19) se convierte en la forma clásica v0 = v − u del teorema de
suma de velocidades.
86 CAPÍTULO 6. LA GEOMETRÍA DE LA CINEMÁTICA RELATIVISTA
Parte III
Fundamentos Algebraicos

87
CAPÍTULO 7

El Grupo de Lorentz

Actualmente, se han encontrado diversos tipos de invariancias en las leyes fı́sicas,


donde el principio de la relatividad especial no es más que una clase de invariancia.
Ası́, en la primera parte del texto, se plantearon las leyes de la mecánica clásica exi-
giendo invariancia frente a las transformaciones de Lorentz simples. En la segunda par-
te, dichas transformaciones se visualizaron geométricamente como rotaciones de ejes
espacio-temporales, donde la distancia espacio-temporal se definió de tal que manera
que fuera invariante. Ahora, introduciremos un tercer enfoque más formal usando la
notación tensorial, la cual exhibe de manera explı́cita las propiedades de transforma-
ción e invariancia de los parámetros fı́sicos frente al cambio de observadores inerciales
compatible con los postulados. Para comenzar, en éste capı́tulo vamos a implementar el
fundamento matemático que servirá de soporte para entender la relación entre el álgebra
tensorial y el principio de relatividad especial.

7.1. Grupo Abstracto


Un conjunto de elementos G = {g1 , g2 , ...} forman un grupo si cumple con las si-
guientes propiedades:

i.) El conjunto G es cerrado bajo el producto. En lenguaje de la teorı́a de conjuntos,


esto significa que:

(∃∗)(∀gi , g j ∈ G)(gi ∗ g j = gk ∈ G), (7.1)


esto es, existe una operación producto (∗) tal que para todo par de elementos gi y
g j en G, su producto da como resultado otro elemento gk que también pertenece a

89
90 CAPÍTULO 7. EL GRUPO DE LORENTZ

G.
ii.) El conjunto G contiene un elemento identidad. Ası́:

(∃I ∈ G)(∀gi ∈ G)(I ∗ gi = gi ∗ I = gi ), (7.2)


esto es, existe un elemento I en G, tal que para cualquier elemento gi de G, su
producto da el mismo elemento.
iii.) El conjunto G contiene los elementos inversos:

(∀gi ∈ G)(∃)(g̃i ∈ G)(gi ∗ g̃i = g̃i ∗ gi = I), (7.3)


es decir, para cada elemento gi en G, existen elementos inversos g̃i en G tal que su
producto mutuo da la identidad.
iv.) El conjunto G es asociativo:

(∀gi, j.k ∈ G)(gi ∗ (g j ∗ gk ) = (gi ∗ g j ) ∗ gk ) (7.4)

Las propiedades anteriores describen un grupo en general, donde los elementos del
conjunto es abstracto. Por otro lado, se pueden definir propiedades adicionales a las
descritas anteriormente que inducen diferentes tipos de grupos, de los cuales nos interesa
los siguientes:
1. Grupo Abeliano: Grupo cuyos elementos conmutan entre sı́, es decir:

(∀gi. j ∈ G)(gi ∗ g j = g j ∗ gi ). (7.5)


2. Grupo Discreto: Grupo cuyos elementos son contables (o numerables), es decir,
los elementos del grupo se pueden etiquetar con subı́ndices de números naturales:

G = {g} ↔ {g1 , g2 , g3 , ...} (7.6)

3. Grupo Continuo: Grupo no contable cuyos elementos son funciones de parámetros


continuos:

G = {g} ↔ {g(θθ )}. (7.7)


La variable θ en general se define en un espacio vectorial de n dimensiones, es
decir, es un vector con componentes:

θ = {θ1 , θ2 , ..., θn }. (7.8)


donde cada componente θi puede tomar valores continuos reales o complejos.
7.2. EL GRUPO DE LORENTZ SIMPLE 91

7.2. El grupo de Lorentz simple


Desde el punto de vista algebraico, podemos describir las transformaciones de Lo-
rentz como un conjunto de elementos que cumple con las condiciones de grupo. Para
mostrar eso, vamos primero a considerar el caso de las transformaciones de Lorentz sim-
ples en el esquema de tiempo real descrito por las ecuaciones (5.19), las cuales podemos
expresar en forma matricial como:

 0   
x0 γ −γβ x0
0 = . (7.9)
x1 −γβ γ x1

Si definimos las cantidades:

 0
0 x0
X = ,
x10
 
x0
X = ,
x1
 
γ −γβ
L = , (7.10)
−γβ γ

entonces la ecuación (7.9) se reduce a la forma compacta

X0 = LX. (7.11)

La ecuación (7.11) no es mas que la forma algebraica de las rotaciones espacio-


temporales de la figura 5.11 en el capı́tulo 5, y que representa la transformación del
vector X al vector X0 debido a la acción de la matrı́z L, la cual podemos expresar como:

L : X −→ X0 . (7.12)

Ası́, en el contexto del álgebra matricial, podemos definir una transformación de Lo-
rentz como el conjunto de matrices L que transforma las coordenadas espacio-temporales
de acuerdo a la ecuación (7.11) y que cumple con los postulados de la relatividad espe-
cial.
Por otro lado, de acuerdo a las definiciones en (7.10), vemos que la TLS es una
función del parámetro β , esto es L = L(β ), la cual puede tomar valores continuos en
el intervalo abierto (−1, 1). Se puede entonces demostrar que el conjunto G = {L(β )}
exhibe propiedades de un grupo continuo en el mismo sentido que lo definimos en la
ecuación (7.7). Antes de describir las propiedades algebraicas del grupo de Lorentz sim-
ple, es conveniente tener una definición mas general de grupo de Lorentz independiente
92 CAPÍTULO 7. EL GRUPO DE LORENTZ

de la forma particular que tome la matrı́z L. Recordemos que la distancia de espacio-


tiempo se define en la forma seudo-Euclidiana de la ecuación (5.18), la cual podemos
expresar en forma matricial como

  
2 −1 0 x0
s = x12 − x02 = (x0 , x1 ) . (7.13)
0 1 x1
Teniendo en cuenta las definiciones en (7.10) y definiendo la matrı́z

 
−1 0
η= , (7.14)
0 1
la distancia de espacio-tiempo se puede expresar de forma compacta como:

s2 = XT ηX, (7.15)
donde el sı́mbolo T representa la transpuesta. Una de las condiciones que debe cumplir
las TLS es que deje invariante la distancia de espacio-tiempo, propiedad que se puede
expresar formalmente en términos de la matriz η de la siguiente forma:

Sean s2 = XT ηX y s02 = X0 T ηX0 las distancias de espacio-tiempo medidas por dos


observadores inerciales en movimiento relativo, tal que s2 = s02 . Teniendo en cuenta
que las coordenadas se relacionan de acuerdo a la ecuación (7.11), se obtiene:
T
XT ηX = X0 ηX0
= (LX)T η(LX)
= XT (LT ηL)X. (7.16)
Al comparar el primer término con el último, se concluye entonces que la distancia
de espacio-tiempo es invariante siempre y cuando se cumpla que:

η = LT ηL. (7.17)
La condición expresada por la ecuación (7.17) es suficiente para garantizar que la
transformación L cumpla con los postulados de la relatividad especial. Ası́, formalmente
vamos a definir el grupo de Lorentz simple como:

Grupo de Lorentz simple : Es el conjunto de transformaciones L que actuan


sobre las coordenadas de espacio-tiempo y que cumplen con:

η = LT ηL,

donde η es la matrı́z dada por (7.14)


7.2. EL GRUPO DE LORENTZ SIMPLE 93

A partir de la propiedad (7.17), podemos describir las propiedades algebraicas de las


TLS. Primero, se puede mostrar que la matrı́z L cumple con las cuatro propiedades que
definen un grupo descritas en la sección 7.1. Solamente a manera de ilustración, vamos
a demostrar la primera de esas propiedades:

i.) El conjunto G = {L} es cerrado bajo el producto. Ası́, si L1 = y L2 = L2 son dos


elementos del conjunto, entonces L3 = L1 L2 también es un elemento del mismo gru-
po, es decir, L3 debe cumplir también la condición (7.17). Efectivamente, asumiendo
que L1 y L2 cumplen con (7.17), se obtiene:

L3T ηL3 = (L1 L2 )T η(L1 L2 )


= L2T (L1T ηL1 )L2
= L2T ηL2
= η. (7.18)

Problema 21: Demuestre que las TLS cumple con las demás propiedades (ii., iii. y
iv.) que definen a un grupo.

Adicional a las condiciones de grupo que exhibe las TLS, existen otras propiedades
algebraicas que se enumeran a continuación:

1. El determinante es 1: Det[L] = 1.

2. Es simétrica. Esto es, los elementos matriciales no diagonales son iguales: L12 =
L21 = −γβ .

3. El grupo es no compacto. Esto es, cada elemento se define por el parámetro β que
toma valores continuos en el intervalo abierto (−1, 1) sin nunca llegar a ser 1 ni
−1.

4. El grupo es Abeliano. Esto es, dos elementos cualquiera conmutan entre sı́: L1 L2 =
L2 L1 .

Ası́, en conclusión, el grupo de Lorentz simple es un grupo continuo Abeliano y no


compacto.
94 CAPÍTULO 7. EL GRUPO DE LORENTZ

7.3. El grupo de Lorentz en general


A lo largo de los capı́tulos anteriores, nos hemos limitado a observadores inerciales
en la configuración estándar que nos define las TLS, tal como se planteó en la Sec-
ción 2.3. Ahora, con las herramientas algebraicas que nos ofrece el concepto de grupo,
podemos hacer la extensión a las transformaciones de Lorentz entre observadores con
movimiento relativo en direcciones arbitrarias y con ejes coordenados no paralelos entre
sı́. Para eso, vamos a generalizar las definiciones de la sección anterior que incluya las
tres coordenadas espaciales.

7.3.1. El tensor métrico


En la sección 5.3, definimos la forma general del intervalo de espacio-tiempo en la
ecuación (5.23), la cual podemos expresar también en forma matricial como:

  
−1 0 0 0 ∆x0
0 1 0 0 ∆x1 
∆s2 = |∆x|2 − ∆x02 = (∆x0 , ∆x1 , ∆x2 , ∆x3 ) 
0
 
0 1 0 ∆x2 
0 0 0 1 ∆x3
= XT ηX, (7.19)

con X definido en un espacio vectorial de 4 dimensiones, y η una matrı́z 4 × 4 definida


como

 
−1 0 0 0
0 1 0 0
η =
0
. (7.20)
0 1 0
0 0 0 1

Ésta definición es la forma matricial del llamado tensor métrico que define la estructura
seudo-Euclidiana del espacio-tiempo de Minkowski, y que se caracteriza por la presencia
de la cantidad negativa −1 en la primera componente en la diagonal. Ası́, se acostumbra
usar la notación η = (−, +, +, +) para indicar que la matrı́z métrica es diagonal con −1
en la componente temporal y +1 en las tres espaciales. Es importante aclarar que la for-
ma definida por (7.20) no es única en la relatividad especial. Existe la forma (+, −, −, −)
que define el mismo intervalo de espacio-tiempo que (7.19) con una diferencia de sig-
nos, es decir s2 = ∆x02 − |∆x|2 . En este caso, se acostumbra notar al tensor métrico con
la letra g en vez de η. No hay ninguna diferencia fı́sica en usar una forma u otra, por lo
que vamos a escoger la que hemos venido usando con la estructura (−, +, +, +).
7.3. EL GRUPO DE LORENTZ EN GENERAL 95

7.3.2. El grupo de Lorentz restringido


Extrapolando la definición del grupo de Lorentz simple de la sección anterior, vamos
a definir un grupo de Lorentz en general como:

ω ) que deja
Grupo de Lorentz: Es el conjunto de transformaciones lineales Λ(ω
invariante al tensor métrico:

ω ) | η = ΛT ηΛ}.
GL = {Λ(ω

En la definición anterior, se introduce un espacio de parámetros ω que debe incluir


la velocidad y las direcciones relativas entre los ejes coordenados de observadores, como
se especificará más adelante. Por ahora, podemos estudiar algunas propiedades globales
del grupo de Lorentz sin necesidad de conocer la forma especı́fica de la transformación
Λ:

1. Si el tensor métrico es invariante frente a las transformaciones de Lorentz, su


determinante cumple:

Det[η] = Det[ΛT ηΛ]


= Det[ΛT ]Det[η]Det[Λ]
= (Det[Λ])2 Det[η]. (7.21)

Al comparar el último termino con el primero, se deduce que:

(Det[Λ])2 = 1, (7.22)
en donde se identifican dos clases de transformaciones con determinantes de dife-
rentes signos:

(
+1, Transformaciones Propias
Det[Λ] = (7.23)
−1, Transformaciones Impropias.

2. La transformación de Lorentz se puede representar en el caso mas general como


una matrı́z 4 × 4 con componentes

Λ0 0 Λ0 1 Λ0 2 Λ0 3
 
Λ1 Λ1 1 Λ1 2 Λ1 3 
Λ= 0 , (7.24)
Λ2 Λ2 1 Λ2 2 Λ2 3 
0
Λ3 0 Λ3 1 Λ3 2 Λ3 3
96 CAPÍTULO 7. EL GRUPO DE LORENTZ

µ
donde se usa la notación de indices de la forma Λ ν empezando por 0 para indicar
cada una de las componentes. La forma matemática que tengan estas componentes
debe ser tal que deje invariante al tensor métrico, es decir, que cumplan con:

 
−1 0 0 0
0 1 0 0
η = 
0

0 1 0
0 0 0 1
 0
Λ1 0 Λ2 0 Λ3 0
 0
Λ 0 Λ0 1 Λ0 2 Λ0 3
 
Λ 0 −1 0 0 0
Λ0 ∗ ∗ ∗  0 1 0 0  1 ∗ ∗ ∗ 
=  1   Λ 0 .
Λ0 ∗ ∗ ∗  0 0 1 2
0  Λ 0 ∗ ∗ ∗ 
2
Λ0 3 ∗ ∗ ∗ 0 0 0 1 Λ3 0 ∗ ∗ ∗
Para simplificar, se usan los sı́mbolos (∗) que marcan las posiciones de las demás
componentes. Al realizar los productos entre las tres matrı́ces, se obtiene una
matrı́z que debe igualarse con la primera. En general, dos matrices son iguales
si cada una de sus componentes son iguales, por lo que la ecuación anterior repre-
senta realmente un conjunto de 16 ecuaciones: una que debe igualarse a −1, tres
iguales a 1 y doce iguales a 0. En particular, la primera ecuación es:

−1 = −(Λ0 0 )2 + (Λ1 0 )2 + (Λ2 0 )2 + (Λ3 0 )2


3
= −(Λ0 0 )2 + ∑ (Λi 0 )2 , (7.25)
i=1

donde se usa el ı́ndice i para denotar las componentes espaciales {1, 2, 3}. Ası́, se
generan dos tipos de soluciones para Λ0 0 , que produce dos clases de transforma-
ciones de Lorentz:

 q
+ 1 + ∑3 (Λi )2 > 1, Transformaciones Ortocronas
0 i=1 0
Λ 0= q (7.26)
− 1 + ∑3 (Λi )2 < −1, Transformaciones anti-Ortocronas.
i=1 0

Ası́, el grupo de Lorentz se puede separar en 4 tipos formados por diferentes combi-
naciones de las propiedades anteriores: 1.) propias ortocronas, 2.) propias anti-ortocronas,
3.) impropias ortocronas y 4.) impropias anti-ortocronas. Aunque fı́sicamente los cuatro
tipos de transformaciones describen rotaciones espaciales puras y cambio de observado-
res inerciales en movimiento relativo, solamente las transformaciones propias ortocronas
puede generar de forma continua dichas rotaciones a partir del elemento identidad. Ası́,
definimos el grupo de Lorentz restringido como:
7.4. TRANSFORMACIONES DE LORENTZ RESTRINGIDAS 97

ω ) | η = ΛT ηΛ, Det[Λ] = 1, Λ0 0 > 1}.


Grupo de Lorentz restringido: {Λ(ω

Los otros 3 tipos de grupos describen transformaciones de Lorentz desconectados de la


identidad, es decir, sus elementos no se pueden conectar con la identidad por variaciones
continuas de ω . Como un grupo debe contener al elemento identidad, es necesario recu-
rrir a transformaciones discontinuas para conectar la identidad con los demás elementos.
Estas transformaciones discontinuas se clasifican en tres tipos de transformaciones dis-
cretas: inversión temporal, transformación de paridad e inversión espacio-temporal.

7.4. Transformaciones de Lorentz restringidas


x2

Después de describir algunas propiedades generales del grupo de Lorentz, en ésta
sección vamos a obtener la forma explı́cita de la transformación Λ(ω ω ) para el grupo de Σ

Lorentz restringido. La estrategia para obtenerlas, es partir de las TLS, y por medio de ro- v

taciones espaciales, llegar a la forma más general de las transformaciones. Inicialmente,
la obtendremos para un espacio-tiempo de dimensión (2 + 1), y posteriormente haremos θ

la extensión a (3 + 1). Para simplificar el álgebra, usaremos la siguiente notación para α

x1

las funciones trigonométricas:
Figura 7.1
sin φ = Sφ , cos φ = Cφ . (7.27)

Consideremos dos observadores Σ y Σ0 , donde Σ0 se mueve en el plano respecto a


Σ con velocidad v = v1 ê1 + v2 ê2 , donde ê1,2 representan los vectores unitarios de los
ejes coordenados de Σ. Supongamos además que el eje x10 forma un ángulo α respecto a X1’


X1

x1 , como se muestra en la Figura 7.1, mientras que θ es el ángulo del vector velocidad
respecto al eje x1 . Las coordenadas transforman de acuerdo a las TLS si rotamos los v

ejes coordenados de ambos observadores en la dirección de la velocidad relativa, como X2’

Σ’

se muestra en la Figura 7.2, la cual podemos describir por ecuaciones de rotación de X2

la forma obtenidas anteriormente en la ecuación (5.4). Ası́, usando la notación de las Σ

Figuras. 7.1 y 7.2, los ejes originales y rotados se relacionen entre sı́ de acuerdo a:

( Figura 7.2
X1 = x1Cθ + x2 Sθ ,
Observador Σ : (7.28)
X2 = −x1 Sθ + x2Cθ ,
(
X10 = x10 C(θ −α) + x20 S(θ −α) ,
Observador Σ0 : (7.29)
X20 = −x10 S(θ −α) + x20 C(θ −α) .

Los ejes rotados cumplen con las condiciones de la configuración estándar descrito
en la sección 2.3, por lo que se relacionan entre sı́ a través de las TLS:
98 CAPÍTULO 7. EL GRUPO DE LORENTZ

x00 = γ (x0 − |β
β | X1 ) .
0
X1 = γ (X1 − |ββ | x0 ) ,
X20 = X2 , (7.30)

donde se define el vector β como:

v
β= , (7.31)
c
mientras que el factor γ se relaciona con la magnitud del vector anterior como:

1 1
γ=q =p . (7.32)
2 1 − β 2
1 − |β
β|

Si reemplazamos las ecuaciones de rotación [espacial] dadas por (7.28) y (7.29)


en las ecuaciones de transformación (7.30), podemos obtener las transformaciones de
Lorentz en los sistemas coordenados originales. Este procedimiento se puede simplificar
si expresamos las ecuaciones de rotación (7.28) y (7.29) en forma matricial como 1 :

      
x0 1 0 0 x0 x0
X1  = 0 Cθ Sθ  x1  = R(θ ) x1  (7.33)
X2 0 −Sθ Cθ x2 x2
 0   0   0
x0 1 0 0 x0 x0
X10  = 0 C(θ −α) S(θ −α)  x10  = R(θ − α) x10  , (7.34)
X20 0 −S(θ −α) Cθ −α) x20 x20

y las de transformación en (7.30) como:

 0     
x0 γ −γβ 0 x0 x0
X10  = −γβ γ 0   X1 = L(β ) X1  ,
  (7.35)
X20 0 0 1 X2 X2

donde se definen las matrices de rotación espacial R(θ ) y R(θ −α), y la matrı́z de la TLS
L(β ). Reemplazando las rotaciones (7.33) y (7.34) en las de transformación en (7.35),
obtenemos:
1 Aunque las rotaciones espaciales en (7.33) y (7.34) se adiciona la componente temporal, observe que
ésta no rota de ninguna manera, obteniendo la relación trivial x0 = x0 y x00 = x00 .
7.4. TRANSFORMACIONES DE LORENTZ RESTRINGIDAS 99

 0  
x0 x0
 0
R(θ − α) x1 = L(β )R(θ ) x1  .
  (7.36)
x20 x2

Multiplicando a lado y lado de la ecuación anterior por el inverso R−1 (θ −α), se obtiene:

 0  
x0 x0
x10  = R−1 (θ − α)L(β )R(θ ) x1  , (7.37)
x20 x2

que corresponde a la transformación de Lorentz en el sistema de ejes coordenados origi-


nales. Explı́citamente, la matrı́z inversa es:

 
1 0 0
R−1 (θ − α) = 0 C(θ −α) −S(θ −α)  . (7.38)
0 S(θ −α) Cθ −α)

Problema 22: Demuestre que la matrı́z (7.38), es la inversa de R(θ − α).

Usando las identidades trigonométricas C(θ −α) = Cθ Cα + Sθ Sα y S(θ −α) = Sθ Cα −


Cθ Sα , la matrı́z inversa (7.38) se puede separar en el producto de dos matrices como:

 
1 0 0
R−1 (θ − α) = 0 C(θ −α) −S(θ −α) 
0 S(θ −α) C(θ −α)
  
1 0 0 1 0 0
= 0 Cα Sα  0 Cθ −Sθ 
0 −Sα Cα 0 Sθ Cθ
= R(α)R−1 (θ ). (7.39)

Problema 23: Demuestre la igualdad de la ecuación (7.39).


100 CAPÍTULO 7. EL GRUPO DE LORENTZ

Ası́, el producto entre las tres matrices de (7.37) da la siguiente matrı́z de transfor-
mación en el espacio-tiempo (2 + 1):

Λ2 = R−1 (θ − α)L(β )R(θ ) = R(α)R−1 (θ )L(β )R(θ )


= R(α)L2 (β , θ ), (7.40)

donde R(α) representa una rotación espacial pura alrededor del eje x3 en un ángulo α,
y L2 (β , θ ) contiene la transformación pura entre observadores en movimiento relativo,
conocidos comunmente como los Boost de Lorentz, como se ilustra en las Figurass 7.3
y 7.4:

 
1 0 0
x3
R(α) = 0 Cα Sα 
0 −Sα Cα
L2 (β , θ ) = R−1 (θ )L(β )R(θ )
x2’


γ −γβCθ −γβ Sθ

x1
α
x2
= −γβCθ γCθ2 + Sθ2 (γ − 1)Cθ Sθ  . (7.41)
x’
−γβ Sθ (γ − 1) Sθ Cθ γSθ2 +Cθ2
1

En particular, para los boost de Lorentz, en vez del ángulo θ y la magnitud β , la matrı́z
Figura 7.3: Rotación Pura se acostumbra escribir en terminos de las componentes cartesianas del factor β , donde:

β1 β2
Cθ = , Sθ = , (7.42)
β β
con lo que se obtienen las siguientes relaciones asociadas a las componentes de los boost:

Σ’

Σ
β
βCθ = β1 ,
β Sθ = β2 ,
θ

γCθ2 + Sθ2 = 1 + (γ − 1)Cθ2
β2
= 1 + (γ − 1) 12 ,
β
Figura 7.4: Boost de
Lorentz γSθ2 +Cθ2 = 1 + (γ − 1)Sθ2
β2
= 1 + (γ − 1) 22 ,
β
β1 β2
(γ − 1)Sθ Cθ = (γ − 1) 2 . (7.43)
β
Para simplificar estas expresiones, podemos definir el siguiente parámetro:
7.4. TRANSFORMACIONES DE LORENTZ RESTRINGIDAS 101

βi β j
ai j = δi j + (γ − 1) , (7.44)
β2

donde δi j se conoce como el delta de Kronecker, que se define como:

(
1, si i = j
δi j = , (7.45)
0, si i 6= j

y los ı́ndices i y j toman valores de 1 o 2 según sean las componentes cartesianas β1 y


β2 que participen en cada término. Ası́, las tres últimas ecuaciones de (7.43) se reducen
a:

(β1 )2
γCθ2 + Sθ2 = 1 + (γ − 1) = a11
β2
(β2 )2
γSθ2 +Cθ2 = 1 + (γ − 1) 2 = a22
β
β1 β2
(γ − 1)Sθ Cθ = (γ − 1) 2 = a12 . (7.46)
β

Usando las identidades anteriores, los boost de Lorentz en (7.41) se expresan explı́ci-
tamente en función de (β1 , β2 ), obteniendo:

 
γ −γβ1 −γβ2
L2 (β1 , β2 ) = −γβ1 a11 a12  . (7.47)
−γβ2 a21 a22

Ası́, las transformaciones de Lorentz se construyen a través del producto de rotacio-


nes espaciales y boost de acuerdo a la ecuación (7.40), que son funciones del espacio de
parámetros ω = {β1 , β2 , α}:

Λ2 (β1 , β2 , α) = R(α)L2 (β1 , β2 )


  
1 0 0 γ −γβ1 −γβ2
= 0 Cα Sα  −γβ1 a11 a12  . (7.48)
0 −Sα Cα −γβ2 a21 a22

La extensión al caso más general de las tres dimensiones espaciales se puede hacer
directamente a partir de los resultados anteriores. En este caso, el movimiento relati-
vo entre dos observadores viene descrito por un vector beta de la forma β = β1 ê1 +
102 CAPÍTULO 7. EL GRUPO DE LORENTZ

β2 ê2 + β3 ê3 . Existen diferentes formas de parametrizar las rotaciones espaciales, como
por ejemplo, a través de los ángulos de Euler, tradicionalmente usados para describir
la rotación del cuerpo rı́gido. Sin embargo, como se muestra en el Apéndice D, con
ésta parametrización, las rotaciones no tendrı́an las propiedades de un grupo de Lorentz
restringido. Para lograr eso, describiremos entonces una rotación general como tres ro-
taciones alrededor de cada uno de los ejes coordenados de un sistema inercial externo
al cuerpo, cada una parametrizada por un ángulo de rotación. Ası́, sea α1 el ángulo de
rotación alrededor del eje x1 , α2 el ángulo alrededor de x2 y α3 el ángulo alrededor de x3 .
Para construir estas rotaciones, tomemos como referencia la matrı́z R(α) de la ecuación
(7.41), la cual representa la rotación alrededor del eje x3 . Pero en el caso del espacio-
tiempo de dimensión (3 + 1), esa matrı́z debe tener una columna y una fila adicional que
represente posibles rotaciones del mismo eje x3 alrededor de los otros. Para rotaciones
alrededor del eje x3 , los ejes x1 y x2 rotan, mientras que x3 se mantiene fijo, tal como se
mostró en la Figura 7.3. Ası́, ésta matrı́z de rotación toma la forma:

 
1 0 0 0
0 Cα3 Sα3 0
R3 (α3 ) = 
0 −Sα3 Cα3
, (7.49)
0
0 0 0 1

donde la última fila y columna llena de ceros con un 1 en la diagonal indica que la ro-
tación es alrededor de x3 . Con esto, es directo obtener las demás rotaciones. La rotación
alrededor del eje x2 es:

 
1 0 0 0
0 Cα2 0 Sα2 
R2 (α2 ) = 
0
, (7.50)
0 1 0 
0 −Sα2 0 Cα2

donde la tercera fila y columna esta llena de ceros con un 1 en la diagonal, indicando la
rotación alrededor de x2 . Finalmente, alrededor del eje x1 , se obtiene:

 
1 0 0 0
0 1 0 0 
R1 (α1 ) = 
0
. (7.51)
0 Cα1 Sα1 
0 0 −Sα1 Cα1

Ası́, la rotación completa se obtiene como el producto de las tres rotaciones anteriores:

R(α1 , α2 , α3 ) = R(α1 )R(α2 )R(α3 ). (7.52)


7.4. TRANSFORMACIONES DE LORENTZ RESTRINGIDAS 103

Por otro lado, la generalización de los boost de Lorentz, también se obtienen a partir
de la forma (2 + 1) de la matrı́z (7.47). Su extensión a la forma (3 + 1) se logra adicio-
nando una fila y una columna que contenga la componente β3 , obteniendo:

 
γ −γβ1 −γβ2 −γβ3
−γβ1 a11 a12 a13 
L3 (β1 , β2 , β3 ) = 
−γβ2 a21
, (7.53)
a22 a23 
−γβ3 a31 a32 a33

donde cada coefienciente ai j sigue tomando la misma forma definida en (7.44), con la
diferencia de que ahora los ı́ndices i y j pueden tomar los tres valores 1, 2 o 3. De esta
manera, las transformaciones de Lorentz restringidas más generales son:

β ,α
Λ(β α ) = R(α1 , α2 , α3 )L3 (β1 , β2 , β3 ), (7.54)

donde hemos usado la notación β = (β1 , β2 , β3 ) y α = (α1 , α2 , α3 ).

Problema 24: Muestre que la Transformación de Lorentz de la ecuación (7.54), cum-


ple con las condiciones de un grupo de Lorentz restringido.

Problema 25: Muestre que si a las transformaciones de Lorentz restringidas se le


aplica una transformacin de inversión temporal, Λ → Z ∗ Λ, donde

 
−1 0 0 0
0 1 0 0
Z=
0
, (7.55)
0 1 0
0 0 0 1

entonces la transformacin de Lorentz se vuelve impropia y antiortocrona.

Finalmente, es importante aclarar que a diferencia de las TLS, la forma general de


las transformaciones de Lorentz tienen propiedades de un grupo no abeliano.2
2 Los boost de Lorentz en 2 y 3 dimensiones no forman un grupo, ya que viola la primera propiedad,
i.). Para mantener las propiedades de grupo, los boost deben estar acompañadas por una o más rotaciones
espaciales.
104 CAPÍTULO 7. EL GRUPO DE LORENTZ

7.5. Álgebra del Grupo de Lorentz


Para construir las leyes de la fı́sica en el lenguaje de la relatividad especial, es necesa-
rio tener las herramientas algebraicas apropiadas soportadas en la formulación tensorial.
En ésta sección se hace una introducción formal a los tensores a partir de las propiedades
de grupo que exhibe las transformaciones de Lorentz.

7.5.1. Grupos de Lie


Especı́ficamente, las transformaciones de Lorentz exhibe las propiedades de los lla-
mados grupos de Lie, que son grupos continuos y diferenciables a todos los ordenes
alrededor del elemento identidad, los cuales cumplen con las siguientes propiedades

1. Los elementos del grupo son funciones de un conjunto de parámetros reales con-
tinuos:

G = {g(θθ ) | θ = (θ1 , θ2 , ..., θn )}. (7.56)

2. El elemento de identidad es el elemento con el valor θ = 0:

g(0) = 1. (7.57)

3. En cercanı́a de la identidad, donde cada componente cumple con θi  1, se cumple


para un par de componentes que:

g(θi , 0)g(0, θ j ) = g(θi , θ j ). (7.58)

4. Tal como se demuestra en el Apéndice E, los elementos del grupo se pueden pa-
rametrizar como:

g(θθ ) = e−i ∑k Tk θk , (7.59)

donde cada componente se le asocia un generador, definido como:



∂ g(θk )
Tk = i , (7.60)
∂ θk θ =0
definido para cada componente k.
7.5. ÁLGEBRA DEL GRUPO DE LORENTZ 105

5. Si los generadores son hermı́ticos, el grupo de Lie es unitario :

si Tk = Tk† ⇒ g† (θθ ) = g−1 (θθ ). (7.61)

Si los generadores no son hermı́ticos, entonces el grupo de Lie será no unitario.

7.5.2. Los generadores del grupo de Lorentz


Para el caso del grupo de Lorentz, es conveniente expresar las transformaciones de
Lorentz en terminos de la rapidez hiperbólica definida en la sección 6.4, en vez de usar el
factor β . Para eso, generalicemos la definición dada por la ecuación (6.15), y definamos
el vector rapidez hiperbólica como:

y = (tanh−1 β )β̂ , (7.62)


donde el vector unitario β̂ indica la dirección de la velocidad relativa entre observado-
res. Ası́, las transformaciones de Lorentz en (7.54) se pueden escribir en función de las
componentes de la rapidez hiperbólica:

α ) = R(α1 , α2 , α3 )L3 (y1 , y2 , y3 ).


Λ(y,α (7.63)
Si definimos los siguientes generadores:

∂ R(αk )
Momento Angular : Jk = i ,
∂ αk α =0

∂ L3 (yk )
Boost : Kk = i , (7.64)
∂ yk y=0
entonces, una transformación de Lorentz se pueden expresar como:

α ) = e−i ∑k (αk Jk +yk Kk ) .


Λ(y,α (7.65)

Problema 26: Demuestre que los momentos angulares, generadores de rotaciones,


tienen la siguiente forma matricial
     
0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 1 0 0 1 0
J1 = i 
0 0 0 1 , J2 = i 0 0 , J = i  . (7.66)
0 3
 
0 0 −1 0 0
0 0 −1 0 0 −1 0 0 0 0 0 0
Obtenga los generadores de los boost de Lorentz.
106 CAPÍTULO 7. EL GRUPO DE LORENTZ

7.5.3. Representaciones del Grupo de Lorentz


Extendiendo la definición de la ecuación (7.12), una transformación de Lorentz se
define como:

Λ : X −→ X0 , (7.67)

tal que el operador Λ deja el tensor métrico invariante. Lo anterior se traduce en térmi-
nos fı́sicos como el cambio que sufren las coordenadas de espacio y de tiempo de un
evento debido al cambio entre observadores en movimiento relativo, el cual es generado
por la acción del operador Λ, y que son compatibles con los postulados de la relatividad
especial. Por otro lado, además de sus coordenadas, los eventos pueden exhibir otras
propiedades fı́sicas que también pueden cambiar bajo transformacin de observadores
inerciales. La forma especı́fica que tenga dicho cambio depende de la naturaleza de la
propiedad fı́sica asociada al evento, la cual puede diferir de la transformación de coor-
denadas. Para describir el efecto que producen las transformaciones de Lorentz sobre
propiedades fı́sicas diferentes a las coordenadas, vamos a definir una variable genérica
Φ que contenga la descripción completa de la propiedad. Por ejemplo, Φ puede repre-
sentar fuerzas, masas en reposo, energı́a, campo eléctrico, funciones de onda cuánticas,
etc. Al igual que sucede con las coordenadas, el cambio que sufra Φ debe respetar los
postulados de la relatividad. El cumplimiento de los postulados se puede garantizar si
exigimos que el operador que genera la transformación de esa propiedad es función de
Λ. Ası́, postulamos que cualquier cantidad fı́sica Φ transforma bajo las transformaciones
de Lorentz como:

Φ0 = M(Λ)Φ, (7.68)

tal que la función M(Λ) deje invariante el tensor métrico:

M(Λ)T ηM(Λ) = η. (7.69)

Para que la condición anterior se cumpla, es necesario que M(Λ) sea un homomor-
fismo de Λ, esto es, que M(Λ) sea una función lineal de Λ que cumpla:

1. M(1) = 1

2. M(Λ1 Λ2 ) = M(Λ1 )M(Λ2 )

Como consecuencia de las condiciones anteriores, las funciones M(Λ) heredan las
mismas propiedades de grupo de las transformaciones de Lorentz, razón por la cual las
llamamos representaciones del Grupo de Lorentz. Concretamente, definimos:
7.5. ÁLGEBRA DEL GRUPO DE LORENTZ 107

Representaciones del Grupo de Lorentz: Es el conjunto de transformaciones


lineales M(Λ) que transforman una variable fı́sica Φ bajo transformaciones
de Lorentz como
Φ0 = M(Λ)Φ,
tal que M(Λ) sea un homomorfismo de Λ.

Especı́ficamente, lo anterior define una representación finita del grupo de Lorentz, ya


que la cantidad Φ genera un espacio vectorial de dimensión finita3 . Por otro lado, como
se dijo anteriormente, la forma especı́fica que tome el homomorfismo M(Λ) depende
de la naturaleza de la propiedad Φ, es decir, conociendo la naturaleza de Φ, podemos
determinar la forma de M(Λ). Pero esto también se puede ver de manera inversa: si
conocemos cómo es M(Λ), podemos definir cual es la naturaleza de la propiedad Φ.
Decimos entonces que Φ forma una base de las representaciones de Lorentz:

Base de una representaciones del Grupo de Lorentz: Es el conjunto de variables


Φ que transforman a través de una representación del Grupo de Lorentz
bajo transformaciones de Lorentz.

Dicho de otra forma:

à Si Φ → Φ0 = M(Λ)Φ cuando x → x0 = Λx, entonces Φ es base de la representación


de Lorentz M(Λ).

Es importante enfatizar que no cualquier variable Φ es base de una representación


de Lorentz. Por ejemplo, si F describe la fuerza sobre un cuerpo, sabemos que ésta es
diferente entre dos observadores en movimiento relativo. Si F es la fuerza medida por Σ
y F 0 la medida por Σ0 , en principio podremos relacionar ambas por medio de una función
g(u) (ver ecuación (4.1)) que depende de la velocidad relativa entre ambos observadores:

F 0 = g(u)F. (7.70)
Sin embargo, al determinar la función g(u) vamos a encontrar que no es un homomor-
fismo de las transformaciones de Lorentz. Esto sigue sucedieno incluso aunque la fuerza
se extienda a sus tres componentes espaciales. Por lo tanto, la fuerza descrita en la forma
tradicional de un vector con tres componentes, no es una base de las representaciones
del grupo de Lorentz. Como veremos más adelante, para poder describir la fuerza en una
base de Lorentz, es necesario definir una cantidad más “grande” que un vector, en cuyo
caso para distinguirlo de la fuerza clásica, lo llamaremos la cuadri-fuerza.
Por otro lado, usando la forma exponencial (7.65), podemos clasificar todas las repre-
sentaciones de Lorentz posibles, o equivalentemente, todas las bases de representaciones
3 Tambiénexisten representaciones infinitas, donde la cantidad Φ representan campos que dependen de
las coordenadas espacio-temporales.
108 CAPÍTULO 7. EL GRUPO DE LORENTZ

de Lorentz. Si las transformaciones de Lorentz se describen por medio de sus genera-


dores de acuerdo a (7.65), entonces una representacion de Lorentz también se puede
describir de la misma forma:

M(Λ) = e−i ∑k (αk M(Jk )+yk M(Kk )) , (7.71)

donde a los generadores también se le asocia una representación, esto es, una función de
los generadores:

Jk −→ M(Jk ),
Kk −→ M(Kk ). (7.72)

Para clasificar las representaciones del grupo de Lorentz, conviene definir la siguiente
combinación compleja de los generadores

Jk ± iKk
Jk± = , (7.73)
2
tal que la forma exponencial (7.71) se reescribe como:

+ ∗ −
M(Λ) = e−i ∑k (zk M(Jk )+zk M(Jk )) , (7.74)

donde zk = yk −iαk . Cada uno de los dos generadores en (7.73), J + y J − , cumplen con las
mismas propiedades del operador de momento angular de la mecánica cuántica4 , por lo
que sus representaciones se pueden clasificara través de un número entero o semi-entero
j± asociado a los vectores J± = J1± , J2± , J3± :

M(J± ) → M j± , (7.75)

tal que si

(
entero, M(Λ) es representación tensorial,
j = | j+ ± j− | = (7.76)
semi-entero, M(Λ) es representación espinorial.

A la base de las representaciones anteriores se le conocen como tensores y espinores,


respectivamente. Ası́, se define:
4 Formalmente, el operador momento angular forma un grupo SU(2). Ası́, el grupo de Lorentz se puede
representar como un grupo SU(2) × SU(2).
7.5. ÁLGEBRA DEL GRUPO DE LORENTZ 109

1. Tensor: Base que transforma a través de una representación tensorial del grupo de
Lorentz ante el cambio entre observadores inerciales.
2. Espinor: Base que transforma a través de una representación espinorial del grupo
de Lorentz ante el cambio entre observadores inerciales.
Ası́, cualquier representación del grupo de Lorentz cae en alguna de dos categorı́as:
tensores o espinores. Para ilustrar algunas aplicaciones fı́sicas, consideremos los siguien-
tes ejemplos:
- Espinores de Weyl: Cuando ( j+ , j− ) = (1/2, 0) o (0, 1/2), las bases forman un es-
pinor de Weyl con espı́n j = 1/2. En el primer caso, se genera un espinor derecho
ψR , mientras que el segundo es un espinor izquierdo ψL . Estas representaciones
describen fermiones de espı́n 1/2 que exhiben distintas propiedades bajo transfor-
mación de paridad. A nivel nuclear, la fuerza de interacción débil distingue si un
fermión es derecho o izquierdo. Un caso extremo de dicha diferencia se observa
en las partı́culas llamadas neutrinos, las cuales solo se han detectado de tipo iz-
quierdo. Un tema actual de la fı́sica de partı́culas está en entender porqué no se
han observan neutrinos derechos.
- Espinor de Dirac: Si se combinan las representaciones de Weyl en una represen-
tación (1/2, 0) ⊕ (0, 1/2), se genera una base con dos espinores de Weyl de la
forma:


ψL
ψD = , (7.77)
ψR
correspondiente a un espinor de Dirac, los cuales tambien describen fermiones de
espı́n j = 1/2 pero que son indistinguibles bajo paridad. Por ejemplo, los electro-
nes que son partı́culas con carga eléctrica no nula, se describen por un espinor de
Dirac.
- Representación fundamental: Cuando ( j+ , j− ) = (1/2, 1/2) ( j = 0 y 1), las repre-
sentaciones de los generadores son los mismos generadores, es decir, M(Jk ) = Jk
y M(Kk ) = Kk . Por lo tanto, la representación del grupo de Lorentz coincide con
una transformación de Lorentz:

M(Λ) = Λ, (7.78)
que se conoce como la representación fundamental. Como se definirá mas adelan-
te, la base de esta representación forma un tensor de rango uno, que tradicional-
mente se conoce como un cuadri-vector. Hay muchos ejemplos fı́sicos de cuadri-
vectores que vamos a describir en los dos últimos capı́tulos: el cuadri-momento,
la cuadri-fuerza, la cuadri-corriente eléctrica, etc.
110 CAPÍTULO 7. EL GRUPO DE LORENTZ

- Representación escalar: Si ( j+ , j− ) = (0, 0), obtenemos el caso trivial M(Jk ) =


M(Kk ) = 0, por lo que la representación del grupo de Lorentz es simplemente la
identidad. Ası́, la base de ésta representación no cambia frente a las transforma-
ciones de Lorentz, lo que se conoce como un escalar. Por ejemplo, la masa en
reposo es una cantidad que no cambia frente a las transformaciones de Lorentz,
por lo que tiene naturaleza escalar. En la fı́sica de partı́culas, el recientemente des-
cubierto Bosón de Higgs exhibe propiedades de espı́n j = 0, por lo que cae en esta
representación. Decı́mos entonces que el bosón de Higgs es una partı́cula escalar.

- Otras representaciones: Se pueden tener otras construcciones que pueden ser usa-
das para describir cantidades fı́sicas. Por ejemplo, las representaciones (1, 0) o
(0, 1) describen tensores antisimétricos de rango 2, como es el caso del tensor
de campo electromagnético. La representación (1, 1) son tensores simétricos de
rango 2, que permite describir teóricamente la partı́cula que media la fuerza de
gravedad: el gravitón.

7.5.4. Representaciones tensoriales


A nivel de la mecánica y la electrodinámica clásicas, las únicas representaciones que
nos interesan son las tensoriales. En la sección anterior definimos un tensor de forma
general. Sin embargo, dentro de los tensores, existen diferentes clasificaciones. Para eso,
vamos a utilizar otra descripción de una representación tensorial diferente a la dada por
(7.76). Si el espı́n j es un número entero, cualquier representación del grupo de Lorentz
se puede construir como productos sucesivos de transformaciones de Lorentz, que lo
notamos de manera genérica como:

M(Λ) j=entero = ∏ Λk . (7.79)


k

Dependiendo de la cantidad de productos y del tipo de elementos del grupo que


participan, los tensores se clasifican en:

Tensores de rango n contravariantes: Es el conjunto de variables T que trans-


forman como n transformaciones de Lorentz ante el cambio entre observadores
inerciales:

n
T −→ T 0 = ∏ Λk T. (7.80)
k=1

Tensores de rango n covariantes: Es el conjunto de funciones que transforman


como n transformaciones de Lorentz inversas
7.5. ÁLGEBRA DEL GRUPO DE LORENTZ 111

n
T −→ T 0 = ∏ Λ−1
k T. (7.81)
k=1

Tensores mixtos de rango n: Es el conjunto de funciones que transforman como p


transformaciones de Lorentz y n − p transformaciones inversas

p n−p
T −→ T 0 = ∏ Λk ∏ Λ−1
l T. (7.82)
k=1 l=1

Con estas definiciones, podemos obtener las representaciones escalares, cuadri-vectores


y tensores de rango superior que describimos al final de la subsección anterior. Lo que
no estan incluidos son los espinores, ya que estos caen en otra categorı́a diferente a los
tensores:

- Escalares: Cuando la potencia es n = 0, se obtiene la representación de rango


cero:

M(Λ) = Λ0 = 1, (7.83)
cuya base T = φ forma un escalar:

φ −→ φ 0 = φ . (7.84)

Ası́, un escalar es una cantidad invariante bajo las transformaciones de Lorentz.

- Cuadri-vectores: Cuando la potencia es n = 1, se obtiene la representación de


rango uno, que puede ser contravariante (V) o covariante (Ṽ ):

Si M(Λ) = Λ ⇒ V 0 = ΛV : c-vector contravariante


Si M(Λ) = Λ−1 ⇒ Ṽ 0 = Λ−1Ṽ : c-vector covariante. (7.85)

Ası́, por ejemplo, las coordenadas espacio-temporales (x0 , x) forman un c-vector


que puede ser contra- o covariante.

Finalmente, existen otras representaciones tensoriales cuya transformación depende


del determinante de la transformación de Lorentz. La base de tales representaciones se
conocen como seudo-tensores:
112 CAPÍTULO 7. EL GRUPO DE LORENTZ

seudo-tensor: Conjunto de variables que transforman como un tensor y con el


signo del determinante de la transformación de Lorentz:

T −→ T 0 = Det[Λ](Λ)n T. (7.86)
CAPÍTULO 8

Álgebra de Tensores

Aunque el tratamiento matricial desarrollado en el capı́tulo anterior permitió descri-


bir de forma mas directa las propiedades algebraicas de las transformaciones de Lorentz,
su alcance en casos más generales es limitado. En este capı́tulo vamos a describir un
álgebra más conveniente y general para el tratamiento de los tensores.

8.1. Notación de ı́ndices de Einstein


En general, análogo a los vectores, un tensor puede estar compuesto por más de
una componente. En particular, debido a que las transformaciones de Lorentz modifica
las coordenadas espacio-temporales de los observadores, las componentes de un tensor
de la representación del grupo de Lorentz se identifica con los 4 ı́ndices de espacio y
tiempo, las cuales se acostumbran notar con letras minúsculas del alfabeto Griego. Ası́,
un ı́ndice marcado con cualquiera de las letras {α, β , γ, δ , σ , ω, ...}, indica una de las
componentes {0, 1, 2, 3}, donde 0 hace referencia a componentes temporales y (1, 2, 3) a
componentes espaciales. En algunas circunstancias, vamos a encontrar parámetros pura-
mente espaciales, es decir, que solamente tiene componentes (1, 2, 3). Para distinguirlo
del anterior, esos ı́ndices se marcan con letras latinas minúsculas: {a, b, c, ...}.
Por otro lado, como se describió en el capı́tulo anterior, un tensor del grupo de Lo-
rentz se caracteriza por el número entero de veces en que transforma bajo transformacio-
nes de Lorentz, y si ocurre por transformaciones directas, inversas o mixtas. La primera
caracterı́stica la vamos a llamar el rango del tensor, el cual viene determinado por el
número de ı́ndices espacio-temporales. Ası́, por ejemplo, un escalar no exhibe produc-
tos con la transformación de Lorentz, por lo que no se necesitan ı́ndices (rango 0). Un
c-vector transforma con una transformación de Lorentz, por lo que requiere de un ı́ndice

113
114 CAPÍTULO 8. ÁLGEBRA DE TENSORES

(rango 1). Un tensor de rango 2 transforma con dos transformaciones de Lorentz, lo que
requiere de dos ı́ndices, y ası́ sucesivamente. La segunda caracterı́stica define la forma
del tensor, esto es, si es contravariante, covariante o mixto. Para distinguir uno de otro,
los ı́ndices de los tensores contravariantes los ubicamos como superı́ndices, mientras que
los covariantes como subı́ndices. Ası́, usamos la siguiente notación tensorial:


µ µν
Contravariante: ı́ndices arriba. Ejemplo: T , T .

Forma: Covariante: ı́ndices abajo. Ejemplo: Tµ , Tµν .
 µ
Mixto: ı́ndices arriba y abajo. Ejemplo: T ν , T αβ γ .


escalar: sin ı́ndices.

Rango: cuadrivector: un ı́ndice. (8.1)

de rango n ≥ 2: n ı́ndices.

De esta manera, la notación de ı́ndices exhibe explı́citamente la naturaleza tensorial


de las variables: su forma de transformación y su rango.

8.2. Operaciones tensoriales


Al igual que sucede con las variables y funciones ordinarias, los tensores se pueden
combinar para formar operaciones que den como resultado otros tensores de la misma o
diferente naturaleza, algunas de las cuales vamos a describir a continuación:

1. Producto interno (contracción de ı́ndices):


El producto interno define el producto entre tensores, donde dos o más ı́ndices
suman sobre todas las componentes espacio-temporales, y que da como resultado
otro tensor del mismo o menor rango. Por ejemplo, sean dos tensores Aµ y Bµν .
Un producto interno puede ser:

3
∑ Aµ Bµν = A0 B0ν + A1 B1ν + A2 B2ν + A3 B3ν . (8.2)
µ=0

Se observa que al realizar la suma, resulta una cantidad con componente ν abajo,
es decir, el producto interno anterior da como resultado un c-vector covariante:

3
∑ Aµ Bµν = Cν . (8.3)
µ=0

El ejemplo anterior exhibe dos reglas básicas del producto interno:


8.2. OPERACIONES TENSORIALES 115

i.) Los ı́ndices que suman deben aparecer en posiciones opuestas, esto es, el
producto interno se define con la suma entre un ı́ndices covariante con uno
contravariante. Por ejemplo, la operación ∑3µ=0 Aµ Bµ no es un producto in-
terno.
ii.) La suma es diagonal en los ı́ndices, esto es, los ı́ndices que suman, corren
simultáneamente sobre las componentes de espacio-tiempo. Esto se indica
notando con la misma letra a los ı́ndices que suman. Por ejemplo, el producto
∑3µ=0 ∑3ν=0 Aµ Bν no es un producto interno.

Las reglas anteriores permite interpretar el producto interno como una contracción
de ı́ndices, donde la presencia de ı́ndices repetidos arriba y abajo automáticamente
indica que existe una suma sobre todos los valores (0, 1, 2, 3) sin necesidad de
poner el sı́mbolo de sumatoria, y que el resultado es un nuevo tensor del rango de
los ı́ndices no repetidos, como si los que suman se aniquilaran entre sı́ (esto se le
conoce como contracción). Ası́, por ejemplo, el producto interno

Aµ Bµν = Aµ/ Bµ/ ν = Cν , (8.4)


representa la operación extendida descrita en las ecuaciones (8.2) y (8.3)
2. Producto escalar:
El producto escalar es un producto interno donde se contraen completamente los
ı́ndices, que da como resultado una cantidad escalar. Por ejemplo:

µ
A ν Bν µ = C. (8.5)

La importancia del producto escalar es que permite construir cantidades invarian-


tes bajo transformaciones de Lorentz.
3. Producto externo:
Adicional al producto interno, se puede definir el producto externo entre dos ten-
sores como la multiplicación de todas las posibles combinaciones entre compo-
nentes, el cual da como resultado un tensor de mayor rango. Por ejemplo, si Aµ
representa la componente µ de un c-vector, y Bν la componente ν de otro c-vector,
entonces el producto externo:

Aµ Bν = C µν , (8.6)
representa la componente µν de un nuevo tensor de rango 2. Las demás compo-
nentes del tensor se obtienen de los productos de todas las combinaciones entre
A µ y Bν .
116 CAPÍTULO 8. ÁLGEBRA DE TENSORES

4. Adición:
La adición o suma se define solamente entre tensores del mismo rango y de com-
ponente a componente, que da como resultado un tensor del mismo rango y misma
componente. Por ejemplo,

µ µ µ
A ν +B ν = C ν, (8.7)
µ
para un valor particular de µ y ν. En cambio, sumas como por ejemplo A ν + Bµ ,
Aµ + Bν o Aµ + Bµ no existen.

5. Producto por un escalar :


Es el producto entre un tensor y un escalar, que da como resultado otro tensor del
mismo rango y naturaleza. Por ejemplo, si λ es un escalar, se cumple:

µ µ
λA ν = C ν. (8.8)

6. Otras reglas operacionales:


Antes de introducir los tensores más fundamentales de la relatividad, es importante
tener en cuenta algunas reglas adicionales del álgebra tensorial.

a) Regla del Cociente: Sea X una cantidad arbitraria y V un tensor de la repre-


sentación del grupo de Lorentz. Sea el producto (interno o externo) XV = T .
Si T también es un tensor de la representación de Lorentz, entonces la canti-
dad X es otro tensor de la representación de Lorentz.
b) La permutación entre ı́ndices repetidos en un producto interno, no cambia el
resultado. Por ejemplo:

µ
Aµ Bµν = Aµ B ν . (8.9)

c) En general, un tensor puede o no cambiar bajo permutaciones de ı́ndices. Por


ejemplo, si Tµν es un tensor de rango 2, en el caso más general se cumple
que:

Tµν 6= Tν µ . (8.10)

Existen dos casos particulares de tensores con simetrı́a bien definida bajo
permutaciones: tensores simétricos y antisimétricos. Un tensor simétrico es
8.2. OPERACIONES TENSORIALES 117

aquel que no cambia frente a la permutación entre dos ı́ndices. Por ejemplo,
si Sµν es un tensor de rango 2 simétrico, se cumple:

Sµν = Sν µ . (8.11)

Un tensor antisimétrico es aquel que cambia solamente de signo frente a la


permutación. Por ejemplo, si Aµν es un tensor de rango 2 antisimétrico, se
cumple:

Aµν = −Aν µ . (8.12)

d) En general, un tensor cambia si sus ı́ndices cambian de posición. Por ejem-


plo:

µ
Aµ 6= Aµ , B ν 6= Bµ ν . (8.13)

Problema 27: Demuestre que el producto escalar entre un tensor antisimétrico y un


tensor simétrico se anula. Esto es, muestre que:

Aµν Sµν = 0, (8.14)

donde A es antisimétrico y S es simétrico.

Problema 28: Suponga que en el problema anterior, las componentes de los tensores
cumplen Aµν = {(0 si µ = ν)(1 si µ < ν)(−1 si µ > ν)}, y Sµν = {1 ∀ µν}.
Demuestre las siguientes identidades:

Sµν Aνα Sαβ = 0 ∀ µ y β


= {T 0α = 3, T 1α = 1, T 2α = −1, T 3α = −3}.
µν µ
A Sνα = T α

Problema 29: Sean los tensores Aαβ γ = {1 si α < β < γ, −1 si α > β >
γ, 0 el resto } y Sµ = {(−1 si µ = 0)(1 si µ = 1, 2, 3)}. Demuestre que:

Aαβ γ Sγ = T αβ = {T 01 = 2, T 02 = T 12 = T 21 = T 31 = 1, 0 el resto}.
118 CAPÍTULO 8. ÁLGEBRA DE TENSORES

8.3. Tensores especiales


Antes de definir las bases de representaciones del grupo de Lorentz asociadas a va-
riables fı́sicas, vamos a definir un conjunto de tensores fundamentales para el cálculo
algebraico.

8.3.1. Boost de Lorentz


En la ecuación (7.54), expresamos la transformación de Lorentz como la combi-
nación de rotaciones espaciales y transformaciones entre observadores en movimiento
relativo. Como siempre podremos reorientar los ejes de los observadores tal que queden
alineados, vamos a asumir que R(α1 , α2 , α3 ) = R(0, 0, 0) = 1, por lo que solamente va-
mos a trabajar con los Boost de Lorentz. En particular, la representación fundamental
de los Boost del grupo de Lorentz restringido viene dada por la matrı́z de la ecuación
(7.53). Usando la notación de ı́ndices, cada componente de los Boost lo vamos a notar
µ
como L ν , los cuales de acuerdo a las forma de la matrı́z (7.53) y la definición en (7.44),
podemos escribir como:


0
L 0 = γ,


= L0 i = Li 0 = −γβi ,
µ
L ν (8.15)
 i
Li = δ i + (γ − 1) β β2 j .

j j β

Las transformaciones de Lorentz inversas describen las transformaciones de Lorentz


pero donde el movimiento entre los observadores ocurren en dirección opuesta. Ası́, las
inversas toman la misma forma que las transformaciones directas, con un cambio de
signo en el factor β :


−1 0

 L  0 = γ, 


µ 0 i
L−1 ν
= L−1 i = L−1 0 = γβi , (8.16)
 L−1 i = δ i + (γ − 1) β i β2 j .

 
j j β

Para entender cómo actúan los boost sobre los tensores, tomemos por ejemplo las
coordenadas espacio-temporales. Como estas transforman con una transformación de
Lorentz, en la notación tensorial se representan como un cuadri-vector que puede ser
contra- o covariante, y que tiene la siguiente forma vectorial:

.
= x0 , x1 , x2 , x3 = x0 , x ,
 

.
xµ = (x0 , x1 , x2 , x3 ) = (x0 , x) , (8.17)
8.3. TENSORES ESPECIALES 119

.
donde el sı́mbolo = indica que xµ o xµ es una de las cuatro componentes de espacio-
tiempo. Observese que en la definición anterior, se escoge la notación tradicional x para
indicar vectores espaciales sin importar que sea covariante o contravariante1 . Bajo el
cambio de observador inercial, sabemos que las coordenadas transforman de acuerdo a
(7.11), que de forma explı́cita es:

 00   0
L 0 L0 1 L0 2 L0 3
  0
x x
x01  L 1 ∗  x 1 
  =  0 ∗ ∗  
x02 

L 2 ∗ ∗ ∗  x 2 
0
x03 L3 0 ∗ ∗ ∗ x3
 0 ν
L νx
L 1 ν x ν 
= 
L 2 ν x ν  ,
 (8.18)
L3 ν xν

donde se aplicó la notación de suma del producto interno en el último termino. Al com-
parar este termino con el primero, obtenemos el siguiente conjunto de ecuaciones:

x00 = L0 ν xν
x01 = L1 ν xν
x02 = L2 ν xν
x03 = L3 ν xν , (8.19)

o en forma mas corta:

x0µ = L ν xν ,
µ
(8.20)
para cualquier componente µ = 0, 1, 2 o 3. De la misma forma, se obtiene la transforma-
ción de Lorentz para las componentes covariantes:

x0µ = (L−1 )ν µ xν . (8.21)

8.3.2. Tensores isotrópicos


Un tensor isotrópico es una cantidad cuyas componentes no cambian de valor bajo
transformaciones de Lorentz. A diferencia de los escalares, un tensor isotrópico esta
formado por varias componentes de acuerdo a su rango. Algunos de estos tensores son:
1 Estaindistinguibilidad de la parte espacial es consecuencia de la estructura (−, +, +, +) que exhibe el
tensor métrico, como se muestra en la ecuación (8.27). Es importante aclarar que si usamos la estructura
.
(+, −, −, −), la representación covariante serı́a xµ = (x0 , −x).
120 CAPÍTULO 8. ÁLGEBRA DE TENSORES

1. Tensor de Kronecker:
Por definición, la transformación inversa seguida por la transformación directa da
la identidad, lo que en terminos tensoriales se expresa como el producto interno:

(
µ −1 α 1 si µ = ν µ
L α (L ) ν = = δ ν, (8.22)
0 si µ 6= ν
que corresponde a la extensión cuadri-dimensional del delta de Kronecker de la
ecuación (7.45).
2. Tensor métrico:
La matrı́z de la ecuación (7.20) define el tensor métrico que determina la geometrı́a
seudo-Euclidiana del intervalo de espacio-tiempo. En notación tensorial toma la
forma:


−1 si µ = ν = 0

η µν = ηµν = 1 si µ = ν = 1, 2, 3 , (8.23)

0 si µ 6= ν

tal que la distancia de espacio-tiempo queda expresada como un producto escalar


de la forma:

s2 = xµ ηµν xν . (8.24)

Como los ı́ndices se contraen completamente, es evidente que la cantidad s2 es un


escalar, por lo que la distancia de espacio-tiempo es invariante frente a las trans-
formaciones de Lorentz. Adicionalmente, el tensor métrico permite la conversión
entre tensores contravariantes y covariantes. Ası́, por ejemplo, un c-vector contra-
variante T µ lo podemos convertir en covariante si bajamos su ı́ndice, lo cual se
logra haciendo el producto interno con el tensor métrico de la siguiente forma:

T µ ηµν = Tν . (8.25)

Si se tienen tensores de rango superior, se puede generar versiones contravariates,


covariantes y mixtos aplicando el tensor métrico el mı́smo número de veces que
el número de ı́ndices a modificar. Por ejemplo, el tensor T µν puede generar las
siguientes representaciones:

µ
T β = T µν ηνβ , Tαβ = T µν ηµα ηνβ . (8.26)
8.3. TENSORES ESPECIALES 121

.
Problema 30: Sea la c-posición con componentes xµ = (x0 , x). Muestre que su forma
covariante es:
.
xµ = (x0 , x) = (−x0 , x). (8.27)

Problema 31: Muestre que el producto escalar del tensor métrico da η µν ηµν = 4.

3. Tensor de Levi-Civita:
Consideremos el siguiente tensor de rango 4:


1
 si (αβ γδ ) = permutaciones par de (0123)
αβ γδ
ε = −1 si (αβ γδ ) = permutaciones impar de (0123) . (8.28)

0 si hay ı́ndices repetidos

El número de permutaciones es el número de intercambios consecutivos para ob-


tener otro ordenamiento del conjunto (0123). Por ejemplo, la componente con
(αβ γδ ) = (3120) vale −1 ya que hay que realizar 5 permutaciones entre ı́ndices
para ir de (0123) a (3120):

(0123) → (1023) → (1203) → (1230) → (1320) → (3120). (8.29)


Ası́, el tensor de Levi-Civita es antisimétrico en todos sus ı́ndices. Por otro lado,
para obtener la forma covariante, es necesario bajar los 4 ı́ndices, lo que requiere
el producto interno con 4 tensores métricos. Se puede demostrar que el resultado
es un tensor igual a la forma contravariante pero con signo opuesto:

εαβ γδ = ηα µ ηβ ν ηγσ ηδ ω ε µνσ ω



−1 si (αβ γδ ) = permutaciones par de (0123)

= 1 si (αβ γδ ) = permutaciones impar de (0123) (8.30)

0 si hay ı́ndices repetidos

Problema 32: Demuestre la ecuación (8.30).


122 CAPÍTULO 8. ÁLGEBRA DE TENSORES

8.3.3. Tensores Dual


Ası́ como el tensor métrico se puede interpretar como una operación que permite la
conversión entre tensores contravariante, covariantes y mixtos, el tensor de Levi-Civita
se puede usar como un operador que convierte un tensor de rango 2 en otro diferente
llamado su forma dual:

ε : V µν −→ Vαβ , (8.31)

que es un tensor de naturaleza covariante, y que se obtiene como:

D 1
(V µν ) = εαβ µν V µν = Vαβ . (8.32)
2
El factor 1/2 surge para corregir dobles sumas que aparecen en el producto interno.
CAPÍTULO 9

Formulación Covariante de la Mecánica

En el contexto del álgebra tensorial, una variable covariante es un tipo de represen-


tación del grupo de Lorentz que transforma como el inverso de las transformaciones
de Lorentz bajo el cambio entre observadores inerciales. Sin embargo, en el contexto de
una teorı́a fı́sica, se usa también la palabra covariante al conjunto de leyes que además de
cumplir con el principio de relatividad especial, éstas se escriben en términos de repre-
sentaciones del grupo de Lorentz, es decir, en términos de tensores y espinores, incluso
aunque un tensor puede aparecer en su forma contravariante. En la primera parte del tex-
to, planteamos las leyes de la mecánica que respetaban los postulados de la relatividad,
pero donde las variables no son representaciones del grupo de Lorentz. En éste capı́tulo,
se revisará de nuevo las leyes de la mecánica pero en el lenguaje formal de los tensores,
es decir, en la formulación covariante.

9.1. Variables cinemáticas


En la notación tradicional, las variables cinemáticas se representan en términos de
escalares y vectores, como el tiempo, el desplazamiento, la velocidad, etc. Sin embar-
go, estas variables no transforman como representaciones del grupo de Lorentz. Para
reconstruir la cinemática con una fomulación covariante, empecemos por las dos va-
riables básicas que ya tenemos en forma de representaciones del grupo de Lorentz: la
cuadri-posición y el intervalo de espacio-tiempo. Primero, en la ecuación (8.17) se defi-
nió las componentes de las coordenadas de espacio-tiempo, que lo llamaremos como la
cuadri-posición, o en forma corta, la c-posición. Por tradición, la componente temporal
la definimos en su forma contravariante como x0 = ct. Sin embargo, debido a la forma
del tensor métrico y de acuerdo al resultado de la ecuación (8.27), su forma covariante

123
124 CAPÍTULO 9. FORMULACIÓN COVARIANTE: MECÁNICA

tiene signo opuesto x0 = −ct. Ası́, la c-posición se define:

.
x0 , x = (ct, x) ,

xµ =
.
−x0 , x = (−ct, x) .

xµ = (9.1)

Por otro lado, de acuerdo a la definición (5.23), el intervalo de espacio-tiempo se


define igual que la distancia de espacio-tiempo pero entre dos eventos que ocurren en
posiciones y tiempos arbitrarios. En el lı́mite al continuo, si los eventos ocurren en tiem-
pos y posiciones infinitesimalmente cercanos, se define el elemento de espacio-tiempo
como:

ds2 = −(dx0 )2 + |dx|2 = −c2 dt 2 + |dx|2 . (9.2)


En particular, cuando los eventos ocurren en la misma posición, el termino espacial
se anula, |dx| = 0, y de acuerdo a la definición en la subsección 3.1.2, el observador
medirá elementos de tiempo propio dτ. Ası́, se obtiene que ds2 = −c2 dτ 2 , o despejando
para el tiempo propio:
r
−ds2
dτ = . (9.3)
c2
Usando la regla del cociente, puesto que la distancia de espacio-tiempo y la veloci-
dad de la luz son escalares, entonces el tiempo propio también es un escalar, por lo que
el tiempo propio de los eventos es único, independiente del observador inercial. Aunque
los eventos no ocurran en la misma posición para un observador arbitrario, es posible
relacionar los tiempos relativos con el escalar tiempo propio a través de la fórmula de
dilatación de la ecuación (3.6). Ası́, aunque el observador no sea el de los tiempos pro-
pios de los eventos, es posible expresar la cinemática en términos de tiempos propios en
lugar de tiempos relativos, esto es, en términos de una representación escalar del grupo
de Lorentz. De la fórmula de dilatación, es directo comprobar las siguientes relaciones
que serán de uso frecuente en los desarrollos algebraicos:

dt dτ
= γ, = γ −1 , dt = γdτ. (9.4)
dτ dt

9.1.1. La cuadri-velocidad
La cuadri-velocidad se define como la variación de la c-posición respecto al tiempo
propio:

dxµ
Uµ = . (9.5)

9.1. VARIABLES CINEMÁTICAS 125

De nuevo, por la regla del cociente, como dxµ es un c-vector y dτ es un escalar, entonces
U µ es un c-vector. Es importante enfatizar que la cantidad

dxµ
vµ = , (9.6)
dt
donde dt es el tiempo relativo, el cual no es un escalar del grupo de Lorentz (no es
invariante frente a transformaciones de Lorentz), no es un c-vector aunque exhiba cuatro
componentes. A partir de (9.1) y la definición (9.6), podemos calcular las componentes
de la c-velocidad:

d µ . d
x = (ct, x)
dτ dτ
 
dt dx
= c , . (9.7)
dτ dτ

Usando las relaciones (9.4), se concluye:

.
Uµ = γ (c, v) ,
.
Uµ = γ (−c, v) , (9.8)

donde se define el vector velocidad en la forma tradicional:

dx
v= . (9.9)
dt

9.1.2. La cuadri-aceleración
Continuando con la construcción, definimos la cuadri-aceleración como la variación
de la c-velocidad respecto al tiempo propio:

dU µ
aµ = , (9.10)

que evidentemente también es un cuadri-vector. Usando las componentes (9.8), se obtie-
ne:

d µ . d
U = γ (c, v)
dτ dτ 
dv dγ
= γ 0, + (c, v) , (9.11)
dτ dτ
126 CAPÍTULO 9. FORMULACIÓN COVARIANTE: MECÁNICA

donde cada derivada es:

dv dv
= γ = γA
dτ dt
dγ dγ
= γ . (9.12)
dτ dt

Problema 33: Demuestre que:


γ̇ = = γ 3β · β˙ . (9.13)
dt

Usando las ecuaciones (9.12) y (9.13), y teniendo en cuenta que β = v/c, la c-


aceleración tiene las siguientes componentes:

 4
. 0
 a0 = γchv · A,
aµ = a ,a : 2
i (9.14)
a = γ 2 A + γ 2 (v · A)v ,
c

donde el vector A representa la aceleración clásica. La expresión anterior no es de uso


frecuente debido a su forma complicada. Para simplificar las expresiones cinemáticas,
se acostumbra usar la aceleración del sistema co-movil, que se define como:

Sistema co-movil: conjunto de observadores inerciales que instantáneamente se


encuentran en reposo respecto a un cuerpo acelerado.

Ası́, desde un sistema co-movil, el cuerpo se encuentra en reposo intantáneo, por lo que
la velocidad instantánea es v = 0. La c-aceleración en un sistema co-movil es entonces:

.
acµ = (0, A) . (9.15)

9.2. Variables dinámicas


A partir de las variables cinemáticas, se pueden construir las representaciones de
Lorentz que describirá la dinámica de las partı́culas puntuales.
9.2. VARIABLES DINÁMICAS 127

9.2.1. El cuadri-momento
El momento lineal definido como el producto de la masa y la velocidad no forma
una representación del grupo de Lorentz. Para eso, se define el cuadri-momento como:

pµ = m0U µ , (9.16)

donde m0 es la masa en reposo y U µ la c-velocidad. Como sucede con el tiempo propio,


se utiliza la masa en reposo en vez de la masa relativista, ya que el primero es un escalar
invariante frente a las transformaciones de Lorentz. Explı́citamente, las componentes del
c-momento son:

.
pµ = m0U µ = m0 (γc, γv) . (9.17)

Usando las definiciones de momento y energı́a relativistas dadas por las ecuaciones (4.3)
y (4.29 ), las componentes del c-momento se pueden expresar como:

m(v)c2 E
m0 γc = m(v)c = =
c c
m0 γv = m(v)v = p, (9.18)

por lo que:

 
µ. E
p = ,p . (9.19)
c

La forma del c-momento exhibe una de las consecuencias más importantes de la


formulación covariante de la relatividad, y tiene que ver con la unificación de concep-
tos diferentes en un mismo esquema. Esto ya lo habiamos obtenido anteriormente en
el tratamiento geométrico, donde describimos el tiempo y el espacio como variables de
la misma naturaleza en un solo objeto, que identificamos como la c-posición. De for-
ma análoga, vemos que la energı́a y el momento lineal se pueden describir de forma
unificada como componentes de un único concepto fı́sico: el c-momento.

9.2.2. La fuerza de Minkowski


Podemos plantear el análogo relativista de la segunda Ley de Newton, conocida co-
mo la ecuación de Minkowski. Si la fuerza es la variación del momento lineal respecto
al tiempo, vamos a definir la cuadri-fuerza, o la fuerza de Minkowski sobre una partı́cula
puntual como:
128 CAPÍTULO 9. FORMULACIÓN COVARIANTE: MECÁNICA

d pµ
Fµ = . (9.20)

Como el c-momento contiene la energı́a y momento lineal total de la partı́cula, la fuerza
de Minkowski representa variaciones de dichas componentes, es decir, la fuerza de Min-
kowski describe procesos de intercambio de energı́a y de momento lineal entre sistemas
fı́sicos. Solamente si F µ se anula, obtendremos las leyes de conservación de la energı́a
y del momento lineal, como explicaremos en la siguiente sección.
Otro aspecto importante de mencionar en relación a la ecuación (9.20) es que aunque
la c-fuerza y el c-momento cambian frente a las transformaciones de Lorentz, la forma de
la ecuación no cambia, tal como lo exige el primer postulado de la relatividad especial.
Para ilustrar el manejo del álgebra tensorial descrito en el capı́tulo anterior, vamos a
demostrar la invariancia de la ecuación de Minkowski. Sea un observador inercial Σ que
mide una c-fuerza que respeta la ecuación (9.20). Sea otro observador Σ0 moviendose
con velocidad u respecto a Σ. Queremos calcular la c-fuerza medida por Σ0 en relación al
c-momento que mide ese mismo observador. Como la c-fuerza es un cuadri-vector, esta
transforma con una transformación de Lorentz directa:

F 0µ = L ν F ν .
µ
(9.21)

Aplicando la ecuación de Minkowski para F ν , se obtiene:

d pν
F 0µ = L
µ
ν . (9.22)

Para relacionar F 0µ con el c-momento en Σ0 , invirtamos la transformación del c-momento:

p0µ = L pν = (L−1 )ν µ p0µ .


µ ν
νp ⇒ (9.23)

Reemplazando (9.23) en (9.22), y teniendo en cuenta que el tiempo propio es escalar


(τ = τ 0 ) obtenemos:

d p0µ
F 0µ = L ν (L−1 )ν µ
µ
, (9.24)
dτ 0
donde de acuerdo a la definición del tensor de Kronecker en (8.22) se cumple para una
componente µ particular que:

L ν (L−1 )ν µ = δ
µ µ
µ = 1, (9.25)
por lo que la ecuación de Minkowski en Σ0 toma la misma forma que en Σ:
9.2. VARIABLES DINÁMICAS 129

d p0µ
F 0µ = . (9.26)
dτ 0
Para estudiar cómo la fuerza de Minkowski se relaciona con procesos de intercambio
de energı́a y momento lineal, calculemos explı́citamente sus componentes. Teniendo en
cuenta (9.19), se obtiene:

 
µ d E
F = ,p
dτ c
 
d E
= γ ,p
dt c
 
P
= γ ,K , (9.27)
c

donde se define:

dE
P =
dt
dp
K = . (9.28)
dt
Podemos ver que P no es más que la potencia absorbida o dispersada por la partı́cula y
K es el equivalente relativista de la fuerza, esto es, la variación de momento lineal relati-
vista respecto al tiempo. Observamos que esta fuerza no es exactamente la componente
espacial de la c-fuerza. De acuerdo a (9.27), las componentes de la c-fuerza son:

P
F0 = γ
c
F = γK. (9.29)

Por otro lado, podemos mostrar que existe una ligadura que relaciona los cambios de
energı́a con los cambios de momento lineal. En particular, para partı́culas estables con
masa en reposo constante, la c-velocidad y la c-fuerza son ortogonales entre sı́, es decir,
su producto escalar es nulo:

F µ Uµ = 0, (9.30)
relación que se puede demostrar usando la ecuación general (9.31).
130 CAPÍTULO 9. FORMULACIÓN COVARIANTE: MECÁNICA

Problema 34: Usando la descomposición de la c-velocidad de la ecuación (9.8), de-


muestre el siguiente producto escalar:
dUµ
Uµ = 0, (9.31)

Ası́, se cumple que:

F 0U0 + F · U = 0
−F · U
⇒ F0 =
U0
K·v
= γ . (9.32)
c
Definiendo β = v/c y teniendo en cuenta que F 0 = γP/c, se encuentra la relación:

P = cK ·β
β, (9.33)

por lo que las componentes de la c-fuerza para partı́culas puntuales estables se puede
escribir como:

F µ = γ (K ·β
β , K) . (9.34)

9.2.3. La masa invariante


Como se mencionó en el capı́tulo anterior, el producto escalar es una herramienta útil
que nos permite construir nuevas cantidades invariantes frente a las transformaciones de
Lorentz. Por ejemplo, el producto escalar entre las c-posiciones dada por la ecuación
(8.24) define la distancia de espacio-tiempo. De forma análoga, podemos definir el pro-
ducto escalar entre los c-momentos:

pµ pµ = m20U µ Uµ
= m20 U 0U0 +U iUi

 
= m20 γ 2 −c2 + |v|2
= −m20 c2 γ 2 1 − β 2 .

(9.35)

Teniendo en cuenta que el término dentro del paréntesis no es más que γ −2 , se obtiene:

pµ pµ = −m20 c2 , (9.36)
9.3. COLISIONES DE PARTÍCULAS PUNTUALES 131

es decir, el producto escalar de los c-momentos se relacionan con la masa en reposo del
cuerpo, la cual como ya habı́amos conjeturado, es invariante. Por tal razón, a la cantidad
m0 c se le conoce como la masa invariante del cuerpo, aunque su producto por c hace
que no sea exactamente una masa.
Adicionalmente, el producto escalar entre c-momentos nos permite obtener de forma
casi inmediata la relación de energı́a-momento dada por la ecuación (4.36). Explı́cita-
mente, con la descomposición del c-momento de la ecuación (9.19), se obtiene:

pµ pµ = p0 p0 + pi pi
E2
= − + |p|2 . (9.37)
c2

Al igualar el resultado de (9.37) con (9.36), se puede demostrar la relación de energı́a-


momento:

q
E =c p2 + m20 c2 , (9.38)

donde p2 = |p|2 .

9.3. Colisiones de partı́culas puntuales n!

!.!.!.!
m!
5!

!.!.!.!
Vamos ahora a estudiar sistemas de muchas partı́culas puntuales que pueden interac- 4!
3! 3!
tuar. En particular, trataremos solamente partı́culas que interactuan por colisión directa1 . 2! 2!
A diferencia del caso clásico, donde la masa es una cantidad absoluta que se conserva, en 1! 1!
relatividad la materia y la energı́a pueden intercambiarsen, por lo que la masa en reposo
no es una cantidad fija en el tiempo, incluso aunque el sistema sea cerrado. En el caso
de colisiones de contacto entre partı́culas puntuales, la interacción sucede simultánea- Figura 9.1
mente en el mismo punto espacial2 , tal que mientras no suceda la interacción, el número
de partı́culas y masas en reposo son fijas. Ası́, consideremos un sistema de n partı́culas
libres que se convierte en otro de m partı́culas después de la colisión, como se muestra
µ
en la Figura 9.1. Si pi representa el c-momento de la i−ésima partı́cula en cada instante,
definimos el c-momento del sistema de partı́culas antes y después de la colisión como:

1 Se puede hacer un tratamiento más general con partı́culas que interactuan a distancia a través de cam-
pos. Sin embargo, dicho tratamiento requiere de herramientas más sofisticadas provenientes de la teorı́a de
campos, por lo que no lo trataremos aquı́.
2 Aunque en general el concepto de simultaneidad es relativo, en el caso de eventos que sucedan en

la misma posición, toma un caracter absoluto. Ası́, una colisión de contacto es simultánea para todos los
observadores inerciales.
132 CAPÍTULO 9. FORMULACIÓN COVARIANTE: MECÁNICA

n
µ(antes)
Pµ(antes) = ∑ pi ,
i=1
m
µ(después)
Pµ(después) = ∑ pi . (9.39)
i=1

El cambio del c-momento debido a la colisión es:

∆Pµ = Pµ(después) − Pµ(antes) . (9.40)

Si las interacciones al interior del conjunto se da solamente por contacto directo


entre las partı́culas, la tercera ley de Newton sigue siendo válida sin violar el principio de
causalidad. Entonces, tal como sucede en la mecánica clásica, la transferencia de energı́a
y momento entre solamente las partı́culas que colisionan, no produce ningún incremento
ni disipación global de estas cantidades, por lo que ∆Pµ = 0. Se cumple entonces que los
c-momentos totales definidos de acuerdo a la ecuación (9.39) se conservan sin importar
el cambio en el número de partı́culas. Para que esto ocurra, se tiene que conservar cada
una de sus componentes, es decir, la energı́a y el momento lineal relativistas del sistema
antes y después de la colisión son los mismos:

(
(después)
µ(después) µ(antes) ∑m
i=1 Ei = ∑ni=1 Ei(antes) ,
P =P ⇒ (después) (9.41)
∑m
i=1 pi = ∑ni=1 p(antes)
i .

Por otro lado, como ocurre con el caso clásico, las colisiones las podemos clasificar
de dos tipos de acuerdo a si la energı́a cinética se conserva o no: elásticas o inelásticas.
En el caso relativista, ésta clasificación se traduce en terminos de la energı́a en reposo del
sistema. Especı́ficamente, usando la definición (4.27) y teniendo en cuenta que la energı́a
total se conserva en sistemas aislados, la condición que determina si una colisión es o no
elástica es:

K = E − M0 c2 = const. ⇒ M0 = const., (9.42)

con M0 la suma de las masas en reposo de las partı́culas del sistema. Ası́, en relatividad
especial las colisiones se clasifican de acuerdo a:

(
Elásticas, si M0 = ∑i mi se conserva,
Colisiones: (9.43)
Inelásticas, si M0 = ∑i mi no se conserva.

Finalmente, podemos plantear la generalización de masa invariante definida en la


sección 9.2.3 a un sistema de muchas partı́culas. En particular, se define la cantidad:
9.3. COLISIONES DE PARTÍCULAS PUNTUALES 133


µ

p
s = c −Pµ Pµ , (9.44)
k p µ

la cual es invariante frente a las transformaciones de Lorentz. Como se justificará más
adelante, al invariante anterior se le conoce como la enegı́a de centro de masa del siste-
ma de muchas partı́culas. En el caso en que el c-momento total se conserva, entonces la µ

energı́a de centro de masa también se conservará. Para ilustrar el uso de las definiciones
k ’  
anteriores, estudiemos el efecto Compton, que se puede tratar como una colisión elásti- θ

ca. En el efecto Compton, un fotón de longitud de onda λ0 colisiona con un electrón libre φ

originalmente en reposo. Queremos calcular la nueva longitud de onda del fotón disper- p’  µ

sado en función de su ángulo de dispersión. La Figura 9.2 muestra el proceso antes y
después de la dispersión. Los c-momentos antes de la colisión de cada partı́cula son:
Figura 9.2
   
Ef Ef Ef
kµ = , kf = , , 0, 0
c c c
 
Ee
pµ = , pf = (mc, 0, 0, 0) , (9.45)
c

donde se hı́zo uso de la relación de energı́a-momento de la ecuación (9.38) y se tuvo


en cuenta que el electrón está en reposo. Las componentes de c-momento después de la
colisión son:

! !
E 0f E 0 E0
f f E 0
f
k0µ = , k0 = , cos θ , sin θ , 0
c f c c c
 0   0 
Ee 0 Ee 0
p0µ = ,p = 0
, p cos φ , −p f sin φ , 0 . (9.46)
c f c f

Si definimos el c-momento total inicial como Pµ = k µ + pµ y el final como P0µ = k0µ +


p0µ , la conservacin del c-momento nos dice que k µ + pµ = k0µ + p0µ . Despejando para
el electrón, obtenemos:

p0µ = k µ + pµ − k0µ . (9.47)

Para calcular las energı́a de centro de masa, debemos primero obtener los productos
escalares de los c-momentos totales. Antes de la colisión, tenemos:

Pµ Pµ = k µ kµ + pµ pµ + 2k µ pµ
= −m2 c2 + 2k µ pµ , (9.48)
134 CAPÍTULO 9. FORMULACIÓN COVARIANTE: MECÁNICA

donde se usó el resultado de la ecuación (9.36). Para el c-momento después de la colisión,


se obtiene:

P0µ Pµ0 = k0µ k0µ + p0µ p0µ + 2k0µ p0µ


= −m2 c2 + 2k0µ p0µ
= −m2 c2 + 2k0µ kµ + pµ − k0µ ,

(9.49)

donde se usó la ecuación (9.47) en la última igualdad. Ası́, usando la definición (9.44) y
aplicando la conservación de la energı́a de centro de masa, obtenemos:

√ √
s = s0
q q 
⇒ c m2 c2 − 2k µ pµ = c m2 c2 − 2k0µ kµ + pµ − k0µ
⇒ k µ pµ = k0µ kµ + pµ − k0µ .

(9.50)

Para calcular la última igualdad, debemos obtener los productos escalares individua-
les teniendo en cuenta las componentes de las ecuaciones (9.45) y (9.46). Explı́citamen-
te, se obtiene:

k µ pµ = −mE f ,
E f E 0f E f E 0f
k0µ kµ = − 2 + 2 cos θ ,
c c
k0µ pµ = −mE 0f
k0µ k0µ = 0. (9.51)

Reemplazando cada producto escalar obtenido en (9.51) en la ecuación (9.50), obtene-


mos:

E f E 0f
−mE f = − (1 − cos θ ) − mE 0f . (9.52)
c2
Si en la ecuación anterior despejamos la energı́a del fotón después de la dispersión,
obtenemos:

E
E 0f =  f . (9.53)
E
1 + mcf2 (1 − cos θ )

Teniendo en cuenta que la energı́a del fotón se relaciona con su frecuencia de acuer-
do a la ecuación (4.40) y la frecuencia a la longitud de onda como f = c/λ con c la
9.3. COLISIONES DE PARTÍCULAS PUNTUALES 135

velocidad de la luz, la ecuación (9.53) se puede escribir en terminos de la longitud de


onda como:

h
λ 0 = λ0 + (1 − cos θ ) . (9.54)
mc
La ecuación (9.54) nos dice que la longitud de onda del fotón cambia de acuerdo al
ángulo de dispersión, resultado que no solamente es compatible con el tratamiento relati-

Dl @¥ 10-12 mD
vista, sino que confirma la naturaleza cuántica de la luz, ya que la electrodinámica clásica 4
3
predice una longitud de onda independiente del ángulo, contrario a las observaciones ex- 2
perimentales. La Figura 9.3 ilustra el cambio de la longitud de onda, ∆λ = λ 0 −λ0 , donde 1
se observa que la variación va aumentando con el ángulo de dispersión, llegando a ser 0 p p 3p p 5p 3p 7p
p
q @radD
0 8 4 8 2 8 4 8
máxima para los fotones de retroceso, que corresponden a los fotones que se dispersan
en dirección opuesta (θ = π).
Figura 9.3

Problema 35: Un fotón de frecuencia f colisiona con un átomo libre inicialmente en


reposo y de masa m0 . Después de la colisión, el átomo sufre un retroceso, absorbiendo ν

al fotón. Muestre que la nueva masa en reposo del átomo es: π
θ

φ

s µ

2h f
m00 = m0 1+ (9.55)
m0 c2
Figura 9.4

Problema 36: La Figura 9.4 muestra un pión (π) decayendo en un neutrino (ν) y un
muón (µ) con los ángulos de dispersión mostrados. Si el pión se propaga con una
velocidad vπ = β c en la dirección x, demuestre que la energı́a del neutrino es:
"  2 #
mπ c2 mµ
Eν = 1− , (9.56)
2γ (1 − β cos θ ) mπ

donde mπ,µ son las correspondientes masas en reposo del pión y muón, mientras que
la masa en reposo del neutrino se asume nula.

9.3.1. Sistema centro de masa y laboratorio


Al final del capı́tulo 4 definimos el sistema de centro de masa como el sistema iner-
cial que observa el centro de masa de un sistema de muchas partı́culas en reposo. Como
consecuencia, el momento lineal del sistema será nulo. Ası́, marcando P µ como el c-
momento total en el sistema centro de masa, entonces sus componentes deben tener la
forma:
136 CAPÍTULO 9. FORMULACIÓN COVARIANTE: MECÁNICA

E
 
.
P =µ
,0 , (9.57)
c
indicando que los momentos lineales de todas las partı́culas deben sumar cero. En parti-
cular, la cantidad invariante definida en la ecuación (9.44) darı́a desde el centro de masa:

√ q
s = c −P µ Pµ = E , (9.58)

que coincide justo con la energı́a total del sistema. Por esta razón, a la cantidad s se le
dió el nombre de energı́a de centro de masa del sistema de muchas partı́culas.
Por otro lado, cualquier observador inercial distinto al observador de centro de ma-
sa, va a medir que el centro de masa del sistema de muchas partı́culas se mueve. Para
describir su movimiento, extendamos la definición de centro de masa clásico al caso re-
lativista. Clásicamente, la velocidad de centro de masa vista desde un sistema inercial
arbitrario es:

∑i mi vi
Vclásico = . (9.59)
∑i mi
En relatividad, la masa se cambia por la masa relativista, tal que si mi son las correspon-
dientes masas en reposo de cada partı́cula, entonces:

∑i γi mi vi
Vrelativista = , (9.60)
∑i γi mi
donde γi es el factor gama asociado al movimiento de cada partı́cula. Teniendo en cuenta
el momento y energı́a relativistas, la expresión anterior se puede escribir equivalente-
mente como:

∑i pi
Vrelativista = c2 . (9.61)
∑i Ei
Definiendo Vrelativista /c como el factor beta asociado al movimiento del centro de masa,
β CM , obtenemos:

c ∑i pi cP
β CM = = , (9.62)
∑i Ei E
donde P y E representan el momento lineal y la energı́a total del sistema medida por un
observador inercial arbitrario, que puede ser, por ejemplo, el sistema de laboratorio. El
c-momento total será entonces:
9.3. COLISIONES DE PARTÍCULAS PUNTUALES 137

 
µ. E
P = ,P , (9.63)
c

Ası́, la energı́a de centro de masa toma la forma:


q
s = c −Pµ Pµ = E 2 − c2 |P|2 .
p
(9.64)

Debido a que ésta energı́a es un escalar, su valor es el mismo para todos los observadores
inerciales, lo que nos permitirá encontrar relaciones entre las variables medidas por un
observador en el sistema de laboratorio y otro en el sistema centro de masa. A manera de
ejemplo, tomemos el proceso de creación de una partı́cula X de acuerdo a la reacción:

A + B −→ A + B + X. (9.65)

Desde el sistema de centro de masa, la energı́a cinética umbral del proceso anterior
corresponde a la energı́a en reposo de la nueva partı́cula X, tal como se obtuvo en la
ecuación (4.57) en el capı́tulo 4. Para obtener la energı́a umbral medida en el sistema de
laboratorio, donde la partı́cula B inicialmente se encuentra en reposo, podemos usar la
propiedad de invariancia de la energı́a centro de masa. Desde el sistema de laboratorio,
el c-momento de cada partı́cula antes de la colisión es:

KA + mA c2
 
µ .
pA = , pA ,
c
µ .
pB = (mB c, 0) , (9.66)

por lo que la energı́a de centro de masa en el sistema de laboratorio es:

√ q
s = c − (pA + pB )µ (pA + pB )µ
r
(KA + mA c2 ) mB c2
= c m2A c2 + m2B c2 + 2 . (9.67)
c2

Como s = E en el sistema centro de masa, de acuerdo a la ecuación (9.58), y KA = K
es la energı́a cinética total en el sistema de laboratorio, entonces las energı́as entre ambos
observadores se relacionan como:

r
(K + mA c2 ) mB c2
E =c m2A c2 + m2B c2 + 2 . (9.68)
c2
138 CAPÍTULO 9. FORMULACIÓN COVARIANTE: MECÁNICA

Despejando para la energı́a cinética, obtenemos:

2
E 2 − mA c2 + mB c2
K= . (9.69)
2mB c2
En particular, teniendo en cuenta que la energı́a umbral para la producción de la partı́cula
X desde el centro de masa esta dada por la ecuación (4.56) obtenida en el capı́tulo 4, la
energı́a cinética umbral desde el sistema laboratorio será:

Eumbral
2 − (mA + mB )2 c4
Kumbral =
2mB c2
(mA + mB + mX )2 c4 − (mA + mB )2 c4
=
2mB c2
  
2 2mA + mX
= mX c 1 + . (9.70)
2mB

Comparando con la ecuación (4.57), es evidente que la energı́a cinética umbral desde el
sistema de laboratorio es mayor que desde el sistema centro de masa. En general, desde
el punto de vista de la energı́a, es más eficiente lograr creación de partı́culas haciendo
colisionar cuerpos frontalmente que con un blanco fijo.

Problema 37: De acuerdo al problema 14, pares de kaón-antikaón pueden crearsen


haciendo colisionar dos haces de protones con una energı́a umbral de Eumbral = 3
GeV desde el sistema centro de masa. Demuestre que la energı́a umbral del mismo
proceso desde el sistema de laboratorio es Eumbral = 4.5 GeV.

Problema 38: Muestre que la energı́a cinética umbral para producir un par protón-
antiprotón en colisiones de dos protones en el sistema de laboratorio es 6mP c2 . Si
un protón se mueve hacia el protón en reposo con la energı́a umbral, muestre que la
velocidad del centro de masa del sistema es 0.866c.

9.4. El cohete relativista


En la mecánica clásica, un sistema puede disminuir su masa expulsando materia. En
el caso relativista, sin embargo, debido a que la masa y la energı́a pueden intercambiar-
sen, existen otras fuentes que producen variación de la masa en reposo del sistema. Ası́,
9.4. EL COHETE RELATIVISTA 139

la masa en reposo de la materia emitida da cuenta de solo una parte de la masa total
perdida por el sistema; el resto se distribuye entre energı́a cinética y energı́a de radiación
dependiendo del tipo de reacciones que se den al interior del sistema. Por lo tanto, es
µ

mejor hablar en terminos de emisión de c-momento. En particular, el sistema se define F
ext

como un cohete si el c-momento expulsado se logra colimar en una misma dirección,
funcionando como un mecanismo de propulsión. M
(τ)

Supongamos un cohete que en cierto instante de tiempo propio tiene masa en reposo
U
µ
(τ)

M(τ) y c-velocidad U µ (τ) medidos por algún observador inercial. Después de un inter-
valo de tiempo propio ∆τ, el cohete expulsa una porción de c-momento ∆qµ en forma de
materia y energı́a, tal que en el tiempo τ + ∆τ, el cohete tiene una nueva masa en reposo M
(τ+Δτ)

M(τ + ∆τ) y c-velocidad U µ (τ + ∆τ). En general, el sistema puede estar sometido a in- µ
µ

U
(τ+Δτ)

µ Δ
q

teracciones externas descritas por una c-fuerza Fext . La Figura 9.5 ilustra la situación en
ambos instantes de tiempo. El c-momento del sistema completo encerrado por las lı́neas
a trazos en cada tiempo es:
Figura 9.5

Pµ (τ) = M(τ)U µ (τ),


Pµ (τ + ∆τ) = M(τ + ∆τ)U µ (τ + ∆τ) + ∆qµ , (9.71)

de manera que el cambio del c-momento debido a las interacciones externas es:

∆Pµ = Pµ (τ + ∆τ) − Pµ (τ) = M(τ + ∆τ)U µ (τ + ∆τ) − M(τ)U µ (τ) + ∆qµ . (9.72)

Si consideramos pequeños intervalos de tiempo, y asumiendo que el cambio de la


masa en reposo del cohete se puede describir como una función continua y suave, pode-
mos realizar la siguiente expansión en series de Taylor:


1 d (n) M(τ) n
M(τ + ∆τ) = ∑ (n)
∆τ
n=0 n! dτ
dM(τ) ∞
1 d (n) M(τ) n
= M(τ) + ∆τ + ∑ (n)
∆τ , (9.73)
dτ n=2 n! dτ

donde hemos separado los dos primeros términos de la suma ya que son las únicas contri-
buciones que nos interesarán. Reemplazando la expansión anterior en la ecuación (9.72)
y dividiendo por el intervalo ∆τ, obtenemos:

 
∆Pµ U µ (τ + ∆τ) −U µ (τ) dM ∆qµ
= M(τ) +U µ (τ + ∆τ) +
∆τ ∆τ dτ ∆τ

1 d (n) M(τ) n−1
+ ∑ (n)
∆τ . (9.74)
n=2 n! dτ
140 CAPÍTULO 9. FORMULACIÓN COVARIANTE: MECÁNICA

Tomando el lı́mite ∆τ → 0, las razones se convierten en derivadas, mientras que la suma


en el último término se cancela para n ≥ 2, por lo que obtenemos:

dPµ dU µ dM dqµ
= M(τ) +U µ (τ) + . (9.75)
dτ dτ dτ dτ
La ecuación anterior se puede simplificar si definimos:

µ dPµ
Fext =

MU µ = pcµ
dqµ
λµ = . (9.76)

La primera ecuación es la definición de c-fuerza que es la variación del c-momento total.
La segunda es el c-momento del cohete que va perdiendo masa. Finalmente, la tercera
ecuación describe la razón de emisión de c-momento. Con lo anterior, la ecuación (9.75)
se puede escribir como:

µ
d pc µ
= Fext − λ µ , (9.77)

la cual indica que la variación del c-momento del cohete tiene dos contribuciones: pri-
mero, debido a intercambios de energı́a y momento con otros sistemas externos descrito
µ
por Fext , y segundo, por emisión de c-momento en forma de masa en reposo y energı́a
definido por λ µ .
Para ilustrar una aplicación de la ecuación dinámica (9.77), vamos a calcular la ve-
locidad adquirida por el cohete en un caso ideal sin interacciones externas y con una
eficiencia de propulsión del 100 %, donde cualquier variación de la masa en reposo del
cohete se transforma en c-momento emitido en forma perfectamente colimada en una so-
la dirección, por ejemplo, a lo largo de la coordenada x1 . Por simplicidad, consideremos
solo emisión de materia, en cuyo caso el c-momento de la porción de masa expulsada
en el intervalo ∆τ es ∆qµ = ∆mW µ , con ∆m su masa en reposo y W µ su c-velocidad
respecto a algún observador inercial. En el lı́mite infinitesimal se obtiene para la razón
de emisión:

∆qµ ∆m µ dm
λ µ = lı́m = lı́m W = Wµ
∆τ→0 ∆τ ∆τ→0 ∆τ dτ
= W µ λ0 , (9.78)

donde λ0 es la razón de masa en reposo expulsada. La ecuación dinámica (9.77) sin


c-fuerza externa se convierte en:
9.4. EL COHETE RELATIVISTA 141

µ
d pc
= −W µ λ0 , (9.79)

Por otro lado, clásicamente es de esperar que la razón de masa en reposo expulsada
dependa de la razón a la que el cohete pierda masa. Sin embargo, debido a la relación
masa-energı́a, dicha dependencia no es la relación clásica λ0 = −dM/dτ obtenida de la
conservación de la masa [clásica]. Para calcularla, podemos usar la relación de ortogo-
nalidad de la ecuación (9.31). Multiplicando por la c-velocidad del cohete, la ecuación
(9.79) se transforma en:

µ
d pc
Uµ = −Uµ W µ λ0 . (9.80)

El primer término se puede descomponer como:

µ
d pc dMU µ dU µ dM
Uµ = Uµ = MUµ +Uµ U µ
dτ dτ dτ dτ
dM
= −c2 , (9.81)

donde se usó el producto escalar Uµ (dU µ /dτ) = 0 y Uµ U µ = −c2 . Usando lo anterior
en (9.80), se obtiene:

c2
 
dM
λ0 = , (9.82)
Uµ W µ dτ

por lo que la ecuación del cohete (9.79) con propulsión de materia se escribe como3 :

µ
−c2
 
d pc dM µ
= W . (9.83)
dτ Uν W ν dτ
Para resolver la ecuación diferencial (9.83), sigamos la siguiente estrategia:

i.) Primero, expresemos la ecuación dinámica (9.83) por medio de su producto esca-
lar por la c-velocidad Wµ :

µ
−c2
 
d pc dM
Wµ = Wµ W µ . (9.84)
dτ Uν W ν dτ
3 Aunque en la ecuación (9.82), el produto escalar se nota con el ı́ndice µ, es conveniente cambiarlo por
ν para no confundirlo con la componente µ de (9.79).
142 CAPÍTULO 9. FORMULACIÓN COVARIANTE: MECÁNICA

El primer término se puede descomponer como:

µ
d pc dMU µ
Wµ = Wµ = MWµ U̇ µ +Wµ U µ Ṁ, (9.85)
dτ dτ
donde usamos la notación punto para indicar las derivadas temporales. Para el
segundo termino, se cumple Wµ W µ = −c2 . Ası́, la ecuación (9.84) se desdobla
como:

c4
 
µ µ
MWµ U̇ +Wµ U Ṁ = Ṁ, (9.86)
Uν W ν
que al reunir los dos terminos con Ṁ, se convierte en:

c4
 
µ µ
MWµ U̇ = −Wµ U Ṁ. (9.87)
Uν W ν

ii.) Conviene expresar las c-velocidades en términos de la rapidez hiperbólica. Como


el movimiento ocurre enteramente en una sola dirección (a lo largo del eje x1 ), es
suficiente utilizar la definición (6.15).

Problema 39: Usando la ecuación (6.15), demuestre que el factor γ, la c-velocidad y


la c-aceleración para movimiento unidimensional se pueden escribir en terminos de
la rapidez hiperbólica como:

γ = cosh y,
µ.
U = c (cosh y, sinh y, 0, 0)
.
U̇ µ = cẏ (sinh y, cosh y, 0, 0) (9.88)

Llamando yU y yW las rapideces hiperbólicas del cohete y de la materia expulsada


respectivamente, y usando las componentes de acuerdo a la ecuación (9.88), se
obtienen los siguientes productos escalares:

Uν W ν = −c2 (cosh yU cosh yW − sinh yU sinh yW )


= −c2 cosh(yU − yW )
= −c2 cosh yr , (9.89)
9.4. EL COHETE RELATIVISTA 143

U̇ν W ν = −c2 ẏU (sinh yU cosh yW − cosh yU sinh yW )


= −c2 ẏU sinh(yU − yW )
= −c2 ẏU sinh yr , (9.90)

donde yr = yU − yW es la rapidez relativa entre el cohete y la materia emitida.


Utilizando el resultado de estos dos productos escalares en la ecuación (9.87), se
obtiene:

c2
 
−Mc2 ẏU sinh yr = − + c2 cosh yr Ṁ
cosh yr
 2 
2 cosh yr − 1
= c Ṁ
cosh yr
 2 
2 sinh yr
= c Ṁ. (9.91)
cosh yr

Reorganizando términos y conviertendo las derivadas en diferenciales, se obtiene:

dM
dyU = − tanh yr . (9.92)
M

Ası́, el problema se reduce en integrar la ecuación diferencial anterior. Pero antes,


observemos que la tangente hiperbólica remanente se relaciona con la velocidad relativa
entre el cohete y la materia expulsada. Usando identidades hiperbólicas, se tiene:

tanh(yU ) − tanh(yW )
tanh yr = tanh(yU − yW ) =
1 − tanh(yU ) tanh(yW )
βU − βW
= , (9.93)
1 − βU βW

donde se definen los factores betas βU = U/c y βW = W /c, con U y W las velocidades del
cohete y la materia emitida respecto al observador inercial. Si comparamos el resultado
final de la ecuación anterior con el teorema de adición de velocidades en la ecuación
(3.16), vemos que (9.93) no es mas que la velocidad relativa escrita en términos de los
factores beta:

vr
tanh yr = βr = . (9.94)
c
144 CAPÍTULO 9. FORMULACIÓN COVARIANTE: MECÁNICA

Aplicando lo anterior en (9.92), y tomando el tiempo inicial en cero, obtenemos las


siguientes integrales:

U (τ)
yZ M(τ)
dM
Z
dyU = −βr , (9.95)
M
yU (0) M(0)

donde supusimos que βr es constante. Al realizar las integrales, obtenemos:



M(τ)
yU (τ) = yU (0) − βr ln , (9.96)
M(0)

que nos describe la rapidez hiperbólica del cohete en cualquier instante τ en función de
la masa instantánea M(τ). Para obtener la solución en términos de la velocidad, usamos
la siguiente propiedad de las funciones hiperbólicas:

 
−1 1 1 − βU
yU (τ) = tanh βU = − ln . (9.97)
2 1 + βU

Si adicionalmente suponemos que el cohete parte del reposo (lo cual implica que yU (0) =
0), la ecuación (9.96) se reescribe para la velocidad como:

!
1 − (M(τ)/M0 )2βr
U(τ) = c. (9.98)
1 + (M(τ)/M0 )2βr

Problema 40: Demuestre que la ecuación que describe el movimiento del cohete
fotónico, donde en vez de materia se expulsan fotones es:

µ
−c2
 
d pc dM µ
= Q . (9.99)
dτ Uν Qν dτ

Tenga en cuenta que la porción de c-momento expulsado en el intervalo ∆τ se puede


calcular como ∆qµ = ∆NQµ , donde ∆N es la cantidad de fotones emitidos en el
intervalo de tiempo, y Qµ es el c-momento de un solo fotón cuyas componentes
cumplen con las ecuación (4.39).
CAPÍTULO 10

Formulación Covariante de la Electrodinámica

Aunque la teorı́a de Maxwell de los campos electromagnéticos fué el escenario ori-


ginal en que se formuló la relatividad especial, su forma matemática soportada en el
cálculo vectorial no manifiesta de forma trivial su naturaleza relativista. Sin embargo, es
posible definir las variables electromagnéticas en el lenguaje formal de las representa-
ciones del grupo de Lorentz, lo que nos permitirá plantear las leyes en forma manifies-
tamente invariantes frente a las transformaciones de Lorentz. En éste capı́tulo, primero,
haremos una descripción de las variables básicas de la electrodinámica en términos de
la formulación vectorial y tensorial, y posteriormente se mostrará la forma covariante de
las ecuaciones de Maxwell partiendo de su forma vectorial.

10.1. Representación vectorial


Antes de describir la electrodinámica en términos de representaciones del grupo de
Lorentz, vamos a repasar algunos conceptos básicos en el tradicional lenguaje vectorial
del cálculo diferencial. En el apéndice E definimos los operadores diferenciales bási-
cos. La formulación de la electrodinámica clásica hace uso del paradigma de campos de
interacción para describir la fuerza que ejercen los cuerpos cargados entre sı́. Concreta-
mente, una partı́cula puntual en movimiento y con carga eléctrica q va a experimentar
una fuerza debida a un campo eléctrico E y magnético B dada por la ley de fuerza de
Lorentz:

 
1
F = q E+ v×B , (10.1)
c

145
146 CAPÍTULO 10. FORMULACIÓN COVARIANTE: ELECTRODINÁMICA

donde v es la velocidad instantánea de la partı́cula. Por otro lado, los campos se determi-
nan a patir de las ecuaciones de Maxwell, clasificadas en cuatro ecuaciones de naturaleza
vectorial:



 Ley de Gauss: ∇ · E = 4πρ
Ley de Ampere-Maxwell: ∇ × B = 4π J + 1 ∂ E

c c t (10.2)
1


 Ley de Faraday: ∇ × E = − c ∂t B

Ley de Gauss magnética: ∇·B = 0

En lo anterior, se introduce la densidad de carga eléctrica ρ, y la densidad de corriente


J, las cuales se definen como:

dq
ρ = ,
dV
J = ρv, (10.3)

donde dq/dV representa la carga eléctrica por unidad de volumen y v es la velocidad de


las fuentes que contienen carga eléctrica. Aunque la discusión se centra en el formalis-
mo matemático, es importante aclarar al menos el significado fı́sico de las ecuaciones
anteriores, las cuales resumimos a continuación:

1. Los campos eléctricos se originan en fuentes puntuales de cargas eléctricas.

2. Los campos magnéticos se pueden producir por corrientes eléctricas, rodeándolas.


También, es posible inducir campos magnéticos por medio de campos eléctricos
que varien en el tiempo.

3. Existen campos eléctricos inducidos por variaciones de campos magnéticos.

4. No existen cargas magnéticas puntuales (monopolos magnéticos).

Por otro lado, la forma de las ecuaciones de Maxwell contiene varias propiedades
matemáticas, algunas de las cuales vamos a describir brevemente. Primero, la ley de
Gauss magnética en (10.2) describe al campo magnético como un campo de divergencia
nula, es decir, un campo solenoidal. Como la divergencia de un rotacional es siempre
nula (ecuación (78) en el apéndice E), un campo solenoidal se puede expresar como el
rotor de otro campo vectorial:

∇ · B = 0 ⇒ B = ∇ × A. (10.4)

El vector A se conoce como el potencial vector. Ası́, si expresamos el campo magnético


en terminos del potencial vector, la ley de Faraday en (10.2) se puede reescribir de la
siguiente forma:
10.1. REPRESENTACIÓN VECTORIAL 147

 
1 1
∇ × E = − ∂t ∇ × A = −∇ × ∂t A . (10.5)
c c
Agrupando la expresión en un solo rotacional, se obtiene la siguiente forma alternativa
de la ley de Faraday:

 
1
∇ × E + ∂t A = 0, (10.6)
c

es decir, la función vectorial Ẽ = E + 1c ∂t A describe un campo irrotacional. Como el


rotacional de un gradiente es siempre nulo (ecuación (79) en el apéndice E), un campo
irrotacional se puede expresar como el gradiente de un campo escalar:

∇ × Ẽ = 0 ⇒ Ẽ = −∇φ . (10.7)

La función φ es el potencial escalar1 . Teniendo en cuenta que Ẽ = E + 1c ∂t A, el campo


eléctrico original se puede describir en terminos de los potenciales escalar y vectorial
como:

1
E = −∇φ − ∂t A. (10.8)
c
Otra consecuencia de la forma de las ecuaciones de Maxwell, es la conservación de
la carga eléctrica manifestada en la ecuación de continuidad. Como se demuestra en el
apéndice F, las fuentes de campos eléctricos y magnéticos cumplen con la ecuación:

∇ · J = −∂t ρ. (10.9)

Dicha ecuación afirma fundamentalmente que la carga eléctrica en una región localizada
del espacio puede variar solamente si fluye de forma continua hacia otra región. Es decir,
la carga no puede desaparecer y aparecer de forma discontinua en otra parte del espacio.
Por otro lado, una de las propiedades más interesantes de las ecuaciones de Maxwell
es su invariancia frente a un tipo de transformaciones de los potenciales electromagnéti-
cos conocidas como transformaciones de gauge definidas como:
1
φ→ φ 0 = φ − ∂t ψ,
c
A → A0 = A + ∇ψ, (10.10)
1 El signo negativo en la definición del gradiente en (10.7) es una asignación arbitraria que permite
asociar a φ directamente con el potencial eléctrico
148 CAPÍTULO 10. FORMULACIÓN COVARIANTE: ELECTRODINÁMICA

donde ψ es una función escalar arbitraria. Como se demuestra en el apéndice F, los cam-
pos electromagnéticos (y por lo tanto las ecuaciones de Maxwell) no cambian cuando
los potenciales cambian de acuerdo a las ecuaciones (10.10). Decimos entonces que la
electrodinámica clásica es una teorı́a invariante de gauge.
Finalmente, en la definición de los potenciales vector y escalar usamos dos de las
ecuaciones de Maxwell: la ley de Gauss magnética y la ley de Faraday. Ası́, las ecuacio-
nes (10.4) y (10.8) heredan las propiedades fı́sicas contenidas en esas dos ecuaciones de
Maxwell. Si expresamos los campos eléctricos y magnéticos en terminos de los poten-
ciales, las dos ecuaciones de Maxwell remanentes, la ley de Gauss y la ley de Ampere-
Maxwell, las podemos cambiar por otras dos que contenga solamente a los potenciales.

Problema 41: Usando la propiedad de la ecuación (80) del apéndice E y las defi-
niciones de las ecuaciones (10.4) y (10.8), demuestre que las leyes de Gauss y de
Ampere-Maxwell se puede escribir como:
1
∇2 φ + ∂t (∇ · A) = −4πρ,
 c
1 1 4π
∇2 A − ∇ ∇ · A + ∂t φ − 2 ∂t2 A = − J. (10.11)
c c c

Las ecuaciones (10.11) es un conjunto de ecuaciones diferenciales de segundo or-


den acopladas. Para resolverlas (es decir, encontrar cómo los potenciales dependen del
tiempo y el espacio tal que cumpla con ambas ecuaciones diferenciales), es conveniente
desacoplar ambas ecuaciones, lo cual podemos lograr usando la propiedad de invarian-
cia de gauge. Como los potenciales φ y A pueden cambiarse con una transformación de
gauge, podemos escoger una función escalar ψ adecuada, tal que los nuevos potenciales
cumplan con la siguiente relación:

1
∇ · A = − ∂t φ . (10.12)
c
Si reemplazamos la divergencia del potencial vector por la derivada temporal del poten-
cial escalar de acuerdo a la ecuación anterior, las ecuaciones (10.11) se reducen a dos
ecuaciones diferenciales descopladas, una para φ y otra para A:

1 2
∇2 φ − ∂ φ = −4πρ,
c2 t
1 4π
∇2 A − 2 ∂t2 A = − J. (10.13)
c c
10.2. REPRESENTACIÓN TENSORIAL 149

La exigencia de una relación que restringa la forma de los potenciales como la da-
da por (10.12) se conoce como asignación del gauge. El caso particular de la relación
(10.12) se conoce como la asignación del gauge de Lorentz, que como se verá en la
próxima sección, nos permitirá expresar los potenciales en una representación del grupo
de Lorentz.

10.2. Representación tensorial


Las variables básicas de la electrodinámica descritas en la sección anterior, se pue-
den describir de manera formal en terminos de representaciones del grupo de Lorentz,
lo que nos conducirá a una formulación covariante. Antes de definir las variables elec-
trodinámicas, definamos la extensión c-vectorial del operador gradiente. Anteriormente,
definimos el gradiente como un vector compuesto por las derivadas parciales respecto a
cada componente espacial, la cual vamos a notar en el lenguaje de ı́ndices como:
 
∂ ∂ ∂
∇= 1
, 2, 3 = (∂1 , ∂2 , ∂3 ) , (10.14)
∂x ∂x ∂x
mientras que la derivada temporal la definimos con el producto por la velocidad de la luz
como:

∂ ∂
= 0 = ∂0 . (10.15)
∂ ct ∂x
En las definiciones anteriores, observamos que aunque las derivadas se definieron ini-
cialmente respecto a componentes espacio-temporales contravariantes (ı́ndices arriba),
la derivada completa se define con ı́ndices covariante (ı́ndices abajo). Lo mismo sucede
a la inversa. Ası́, definimos la cuadri-derivada en representaciones co- y contravariantes
como:
 
. 0
 ∂ ∂ ∂ ∂
∂µ = −∂ , ∇ = − , , , ,
∂ x0 ∂ x1 ∂ x2 ∂ x3
 
. ∂ ∂ ∂ ∂
∂ 0, ∇ =

∂µ = , , , , (10.16)
∂ x0 ∂ x1 ∂ x2 ∂ x3
donde la parte temporal la escribimos en su representación contravariante en ambos ca-
sos.

Problema 42: Demuestre que la c-derivada ∂ µ definida en la forma de la ecuación


(10.16), transforma como un c-vector contravariante.
150 CAPÍTULO 10. FORMULACIÓN COVARIANTE: ELECTRODINÁMICA

También podemos definir el producto escalar entre c-derivadas, que dá como resulta-
do un escalar de Lorentz. Dicho producto corresponde a la extensión cuadri-dimensional
del laplaciano, conocido como el D’Alambertiano, que lo simbolizamos como un cua-
drado 2 para indicar que es la generalización cuadri-dimensional del operador tri-
dimensional del laplaciano ∇2 :

1 2
2 = ∂ µ ∂µ = ∇2 + ∂ 0 ∂0 = ∇2 − ∂ . (10.17)
c2 t

10.2.1. La cuadri-corriente
Extendiendo la definición vectorial de la densidad de corriente en la ecuación (10.3),
definimos la c-corriente como:

J µ = ρ0U µ , (10.18)

donde ρ0 es la densidad de carga propia medida por el observador donde la distribución


de carga se encuentra en reposo, y U µ es la c-velocidad de las fuentes de cargas eléctricas
medida por un observador arbitrario. Para entender el contenido fı́sica de la c-corriente,
obtengamos sus componentes usando las de la c-velocidad de la ecuación (9.8):

.
Jµ = ρ0 γ (c, v) = (ρc, ρv) , (10.19)

donde hemos defiido la densidad relativa como ρ = ρ0 γ, correspondiente a la densidad


de carga medida por un obervador en movimiento respecto a la distribución de carga.
Comparando las componentes de la c-corriente con la ecuación (10.3), es evidente que
la primera componente depende de la densidad de carga y las demás coinciden con la
densidad de corriente:

.
Jµ = (ρc, J) . (10.20)

Ası́, la c-corriente describe de forma simultánea y unificada las fuentes que producen los
campos eléctricos y magnéticos, esto es, las cargas eléctricas y las corrientes.
Con las definiciones de la c-derivada y la c-corriente, podemos expresar la ecuación
de continuidad en forma tensorial. Para eso, escribamos la ecuación (10.9) como:

∇ · J + ∂t ρ = 0. (10.21)

Si expresamos la derivada temporal como ∂t = c∂ct = c∂0 , y teniendo en cuenta que la


componente temporal de la c-corriente es J 0 = ρc, la ecuación anterior se puede escribir
como:
10.2. REPRESENTACIÓN TENSORIAL 151

∇ · J + ∂0 J 0 =
∂i J i + ∂0 J 0 =
∂µ J µ = 0. (10.22)

Por lo tanto la ecuación de continuidad que expresa la conservación de la carga eléctrica


toma la forma simple ∂µ J µ = 0. Como la ecuación es un producto escalar, por definición,
es invariante frente a las transformaciones de Lorentz, por lo que la carga se conserva
para todos los observadores inerciales.

Problema 43: Teniendo en cuenta que un c-vector transforma como un tensor de


rango uno, demuestre que las densidades de carga y corriente entre dos observadores
inerciales en movimiento relativo con velocidad v = cβ
β se relacionan como:

    
0 1 0 γ −1
ρ =γ ρ+ β ·J , J = J+ β · J − γcρ β (10.23)
c β2

10.2.2. El cuadri-potencial
Si aplicamos las definiciones de c-corriente y del D0 Alambertiano, las ecuaciones de
onda de los potenciales en (10.13) se pueden escribir como:

4π 0
2 φ = −
J ,
c

2 A = − J. (10.24)
c
Si definimos el c-potencial como:

.
Aµ = (φ , A) , (10.25)

entonces las dos ecuaciones en (10.24) se pueden escribir en forma compacta como:

4π µ
2 Aµ = − J . (10.26)
c
Utilizando la regla del cociente de la sección 8.2, puesto que 2 y c son escalares,
mientras que J µ es un c-vector, entonces Aµ es un c-vector.
152 CAPÍTULO 10. FORMULACIÓN COVARIANTE: ELECTRODINÁMICA

10.2.3. Tensor electromagnético


A partir de los c-potenciales, podemos obtener los campos eléctrico y magnético en
una representación del grupo de Lorentz. Para eso, recordemos que los campos, salvo
una transformación de gauge, estan determinados a través de las definiciones (10.4) y
(10.8). Para el rotacional, si utilizamos la definicón de la ecuación (76) del apéndice E
en el lenguaje de ı́ndices, el campo magnético se puede escribir explı́citamente como:


i
1 j2 k3

B = ∇ × A = ∂ ∂ ∂
A1 A2 A3
∂ 2 A3 − ∂ 3 A2 i + ∂ 3 A1 − ∂ 1 A3 j + ∂ 1 A2 − ∂ 2 A1 k,(10.27)
  
=

mientras que para el gradiente y la derivada temporal, el campo eléctrico es:

1
E = −∇φ − ∂t A
c
= − i∂ + j∂ 2 + k∂ 3 A0 + ∂ 0 A1 i + A2 j + A3 k ,
1
 
(10.28)

donde usamos la relación ∂t = c∂ct = c∂0 = −c∂ 0 y la definición φ = A0 . Teniendo


en cuenta que los coeficentes de los vectores unitarios (i, j, k) corresponde a las com-
ponentes 1, 2 y 3 de los campos, en las ecuaciones (10.27) y (10.28) identificamos las
siguientes relaciones:

B1 = ∂ 2 A3 − ∂ 3 A2 = F 23 ,
B2 = − ∂ 1 A3 − ∂ 3 A1 = −F 13 ,


B3 = ∂ 1 A2 − ∂ 2 A1 = F 12 ,
E 1 = ∂ 0 A1 − ∂ 1 A0 = F 01 ,
E 2 = ∂ 0 A2 − ∂ 2 A0 = F 02 ,
E 3 = ∂ 0 A3 − ∂ 3 A0 = F 03 , (10.29)

donde hemos definido la cantidad:

F µν = ∂ µ Aν − ∂ ν Aµ , (10.30)

para simplificar la resta entre derivadas. Evidentemente F µν es una cantidad antisimétri-


ca que contiene a los campos eléctricos y magnéticos, y que se puede representar de
forma matricial como:
10.2. REPRESENTACIÓN TENSORIAL 153

E1 E2 E3
 
0
. −E 1 0 B3 −B2 
F µν =−E 2 −B3
. (10.31)
0 B1 
−E 3 B2 −B1 0

De esta forma, las relaciones (10.4) y (10.8) se unifican en una única ecuación dada
por (10.30), mientras que los campos eléctricos y magnéticos dejan de aparecer como
dos campos separados e independientes, y se identifican como distintas componentes
de un solo campo: el campo electromagnético F µν . Como las cantidades ∂ µ y Aµ son
c-vectores, el producto externo expresado por (10.30) es una representación tensorial de
rango 2.

Problema 44: Usando el tensor métrico como un operador que baja los ı́ndices, de-
muestre que las componentes de la forma covariante del tensor electromagnético
cumple con las siguientes relaciones:

F0i = −F 0i , Fi j = F i j . (10.32)

Por otro lado, recordando las definiciones de la sección 8.3, el tensor electromagnéti-
co puede también representarse en su forma dual como:

D 1
(F µν ) = Fµν = εµναβ F αβ
2
 
0 B1 B2 B3
. −B1 0 E3 −E2 
= 
−B2 −E3
, (10.33)
0 E1 
−B3 E2 −E1 0

la cual también cumple con relaciones equivalentes a (10.32).


154 CAPÍTULO 10. FORMULACIÓN COVARIANTE: ELECTRODINÁMICA

Problema 45: Considere un observador inercial, Σ, que mide un tensor de campo dado
por:

 
0 0 E E
.  0 0 0 0
F µν = −E
, (10.34)
0 0 0
−E 3 0 0 0

que describe un campo electrostático de magnitud E y definido en un plano. Calcule


el tensor de campo medido por otro observador, Σ0 , que se mueve en dirección del eje
x con rapidez v respecto a Σ. ¿Cómo es el campo magnético medido por Σ0 ?

Problema 46: La c-fuerza que ejerce un campo electromagnético sobre un partı́cula


con carga eléctrica q y c-velocidad Uµ se define como:

q
F ν = Uµ F µν . (10.35)
c
Demuestre que la definición anterior contiene la ley de fuerza de Lorentz dada por
la ecuación (10.1). En el caso particular del problema anterior, calcule las fuerzas
medidas por los observadore Σ y Σ0 .

10.3. Ecuaciones de Maxwell covariantes


En ésta sección obtendremos las ecuaciones de Maxwell en el lenguaje tensorial.

10.3.1. Ley de Gauss y de Ampere-Maxwell

Teniendo en cuenta la definición de divergencia, la ley de Gauss de la ecuación (10.2)


se escribe en notación de ı́ndices como:

∂i E i = 4πρ, (10.36)

mientras que con la forma del rotacional, la ley de Ampere-Maxwell desplegada en sus
componentes se separa en tres ecuaciones como
10.3. ECUACIONES DE MAXWELL COVARIANTES 155

4π 1
∂2 B3 − ∂3 B2 = J + ∂0 E 1 ,
c
4π 2
∂3 B1 − ∂1 B3 = J + ∂0 E 2 ,
c
4π 3
∂1 B2 − ∂2 B1 = J + ∂0 E 3 . (10.37)
c
Teniendo en cuenta que la densidad de carga y de corriente, y los campos eléctricos y
magnéticos son componentes de los tensores J µ y F µν respectivamente, las ecuaciones
en (10.36) y (10.37) se puede escribir equivalentemente como:

4π 0
∂1 F 10 + ∂2 F 20 + ∂3 F 30 = − J ,
c

∂0 F 01 + ∂2 F 21 + ∂3 F 31 = − J1,
c
4π 2
∂0 F 02 + ∂1 F 12 + ∂3 F 32 = − J ,
c
4π 3
∂0 F 03 + ∂1 F 13 + ∂2 F 23 = − J . (10.38)
c
El conjunto de las 4 ecuaciones anteriores se puede escribir de forma abreviada para
cada componente ν como:

4π ν
∂µ F µν = − J , (10.39)
c
donde se debe tener en cuenta que F µν es antisimétrica, lo que en particular implica que
se anula cuando µ = ν. De esta manera, dos de las ecuaciones de Maxwell se pueden
reducir a una única ecuación dada por (10.39) en representaciones del grupo de Lorentz.
A manera de ejercicio, vamos a demostrar que dicha ecuación cumple con el primer
postulado de la relatividad, esto es, tiene la misma forma para otro observador inercial
Σ0 en movimiento relativo. Recordemos que cada uno de los tensores que componen a la
ecuación transforma de la siguiente forma bajo transformaciones de Lorentz2 :


∂α0 = L−1 ∂ ,
α µ
F 0αβ
β
= Lα µ L µν
νF ,

J 0β
β
= L ν Jν . (10.40)
2 Por simplicidad, nos limitamos a los boost de Lorentz. Las conclusiones no se modifican si se incluyen

rotaciones
156 CAPÍTULO 10. FORMULACIÓN COVARIANTE: ELECTRODINÁMICA

Para obtener las variables medidas en Σ comparadas con las de Σ0 , debemos invertir las
ecuaciones de (10.40). Esto se puede lograr si a ambos lados de la igualdad realizamos el
producto interno por las correspondientes transformaciones inversas. Por ejemplo, para
una componente µ particular, la primera variable se invierte como:

µ µ
∂α0 = L−1 ∂
α µ
→ Lα µ ∂α0 = Lα µ L−1 ∂
α µ
µ
= δ µ ∂µ
= ∂µ , (10.41)

donde aplicamos la definición del tensor de Kronecker de la ecuación (8.22) para una
componente ν = µ particular. Si aplicamos el mismo procedimiento a las demás varia-
bles, obtenemos:

∂µ = Lα µ ∂α0 ,
µ ν
F µν = L−1 α L−1 β F 0αβ ,

Jν = L−1 β J 0β . (10.42)

Si en la ecuación (10.39) reemplazamos las variables originales por las primadas de


acuerdo a las relaciones en (10.42), obtenemos:

µ ν 4π −1 ν 0β
Lα µ L−1 α
L−1 β
∂α0 F 0αβ = − L J . (10.43)
c β

Como Lα µ L−1 α
= 1, la ecuación se reduce a:

ν 4π −1 ν 0β
L−1 β
∂α0 F 0αβ = − L J . (10.44)
c β

Es evidente que las transformaciones de Lorentz a ambos lados de la igualdad son las
mismas, por lo que se simplifican. Ası́, visto desde el otro observador Σ0 , obtenemos la
misma forma de la ecuación (10.39):

4π 0β
∂α0 F 0αβ = − J . (10.45)
c

10.3.2. Ley de Gauss magnética y de Faraday


La ley de Gauss magnética en notación de ı́ndices es:

∂ i Bi = 0. (10.46)
10.3. ECUACIONES DE MAXWELL COVARIANTES 157

Ésta ecuación se expresa de forma simple a través de la versión dual del tensor electro-
magnético definido de acuerdo a la ecuación (10.33), obteniendo:

∂ i Fi0 = 0. (10.47)

La ley de Faraday se despliega en las siguientes componentes:

∂ 2 E3 − ∂ 3 E2 − ∂ 0 B1 = 0,
∂ 3 E1 − ∂ 1 E3 − ∂ 0 B2 = 0,
∂ 1 E2 − ∂ 2 E1 − ∂ 0 B3 = 0. (10.48)

De nuevo, usando el tensor dual, las tres ecuaciones anteriores se expresan como:

∂ i Fi1 + ∂ 0 F01 = 0,
∂ i Fi2 + ∂ 0 F02 = 0,
∂ i Fi3 + ∂ 0 F03 = 0. (10.49)

Las 4 ecuaciones en (10.47) y (10.49) se pueden escribir para cada componente ν


como:

∂ µ Fµν = 0. (10.50)

En conclusión, las electrodinámica clásica se puede describir en el lenguaje tensorial


a partir del conjunto de ecuaciones (10.39) y (10.50).
APÉNDICES

A. Ondas Armónicas
En una dimensión, una onda arbitraria cumple la siguiente ecuación diferencial (ecua-
ción de onda):

∂ 2 f (x,t) 1 ∂ 2 f (x,t)
= . (51)
∂ x2 c2 ∂t 2
La solución de la ecuación de onda es la forma de la función f (x,t) que cumple con la
igualdad anterior. En el caso de una onda armónica, esa solución tiene la forma genérica:

f (x,t) = f0 sin (ωt + kx + φ ) , (52)


donde f0 representa la amplitud de la onda, y φ la fase que determina el corrimiento de
la onda en el punto x = 0 y el tiempo t = 0. Los parámetros cinemáticos básicos que
describen una onda armónica son:

1. Amplitud A: Valor máximo de la oscilación

2. Periodo T : Tiempo de duración de una oscilación completa.

3. Frecuencia f : Razón entre el número de oscilaciones y el intervalo de tiempo.

4. Frecuencia angular ω: Frecuencia medida en radianes/segundo.

5. Longitud de onda λ : Distancia a la cual la oscilación vuelve a comenzar.

6. Número de onda k: Razón entre el número de oscilaciones y el intervalo de dis-


tancia

7. velocidad de fase c: Velocidad a la cual se propaga la oscilación en el espacio

159
Existen las siguientes relaciones algebráicas entre los distintios parámetros cinemáti-
cos:

1
relación periodo-frecuencia: T= , (53)
f
relación frecuencia-frecuencia angular: ω = 2π f (54)

relación longitud de onda-número de onda: λ= (55)
k
relación de dispersión: ω = kc. (56)

En particular, si se combinan las relaciones de periodos, frecuencias y longitudes de


onda, la relación de dispersión se puede escribir equivalentemente como:
c
λ= = cT. (57)
f

B. El experimento real de Michelson-Morley


En la sección 2.1 se realizó un análisis simplificado del experimento de
Michelson-Morley para detectar el movimiento de la Tierra a través del éter. Sin
embargo, se hicieron consideraciones que en el experimento real no podı́a llevar-
se a cabo. Primero, el rayo de luz del láser no sigue un único camino óptico en
una lı́nea matemática bién definida. El haz son rayos que se distribuyen transver-
salmente en el espacio de forma continua. El efecto de esa distribución es que
Espejo   en la recombinación sobre la pantalla, la interferencia no es de solamente dos
rayos, sino de muchos rayos simultáneamente. Segundo, no es posible garanti-
zar con precisión absoluta que el haz A y B se dividan en rayos perfectamente
B   Espejo   perpendiculares entre sı́. Esto hace que cada haz describa caminos ópticos con
Láser  
desviaciones, tal que sobre la pantalla van a llegar rayos en distintas posiciones,
A por lo que en vez de un solo punto, se ve una distribución de franjas luminosas.
Tercero, no es posible garantizar tampoco que los haces A y B sigan trayectorias
Pantalla   con exactamente la misma longitud, por lo que hay efectos de interferencia adi-
cionales proveniente de retrasos debido a que un rayo recorre mayor distancia que
el otro, y que es independiente del hipotético movimiento a través del éter. Ası́, la
Interferencia   situación real es más parecida a como se observa en la Figura B-1.

Figura B-1 Se observa entonces un patrón de interferencia con bandas de intensidades máximas
que se degradan hasta intensidades nulas y ası́ sucesivamente como se observa en la
figura, la cual aparece incluso aunque no haya movimiento respecto al éter. Sin embargo,
si el sistema se rota en 900 cuidadosamente sin modificar ninguna parte del montaje, el
patrón de franjas se tiene que mantener exactamente igual en ausencia de éter. Pero si
el éter existiera y hay movimiento relativo, surge un retraso adicional en los tiempos de
llegada de cada uno de los rayos al rotar el sistema, en una cantidad dada por la ecuación
(2.7) en el capı́tulo 2, por lo que una franja brillante disminuye su intensidad, mientras
que las zonas oscuras la aumenta. Este efecto serı́a equivalente a como si el patrón de
interferencia se desplazara una fracción de distancia n correspondiente a la razón entre
la distancia desplazada d y la distancia entre franjas D, como se muestra en la Figura
B-2. Ésta fracción es igual a la fracción de diferencias de tiempos entre el sistema sin
rotar y el sistema rotado respecto al periodo de oscilación de la luz, el cual de acuerdo a
la ecuación (2.7) es:

∆t 0 0 − ∆t90
0  
d 0 L1 + L2 1
n= = 0 ≈ β2 . (58)
D T c T
Teniendo encuenta la relación de dispersión (1.6), el periodo se puede expresar en fun-
ción de la longitud de onda del láser, obteniendo: D

  00  
L1 + L2 d

n≈ β 2. (59)
λ 900  

Ası́, por ejemplo, para un láser de longitud de onda λ = 6 × 10−7 m, una velocidad Figura B-2
de la tierra de v = 30000 m/s y para longitudes L1 = L2 = 0.6 m, se obtendrı́a:

n ≈ 0.04, (60)
es decir, el patrón se correrı́a en un 4 % del tamaño de la franja cuando el sistema se
rota, valor suficiente para ser observado en el experimento original, que éra capaz de
registrar un corrimiento de hasta 1 %. Sin embargo, el resultado dentro del error experi-
mental dió nulo, compatible con el valor β = 0. Experimentos más sofisticados capaces
de registrar velocidades de hasta 1 cm/s, siguen siendo compatibles con un factor beta
nulo.

C. El electronvoltio
En fenómenos donde los efectos relativistas son relevantes, las masas de las partı́cu-
las convienen expresarlas en unidades de energı́a através de la relación de equivalencia
de masa y energı́a E0 = m0 c2 . En el sistema internacional, la unidad básica de energı́a
es el Joule. Sin embargo, dicha escala de medida no es adecuada cuando se trata con
objetos microsópicos. Una unidad más adecuada en ese caso es el electrón-voltio, o
electronvoltio, el cual se deifine de la siguiente forma:

1 electronvoltio (1 eV) es la diferencia de energı́a potencial de un electrón (car-


ga eléctrica q = −1.6 × 10−19 Coulombs) cuando se acelera en una diferencia
de potencial de 1 Voltio.

Teniendo en cuenta que la diferencia de potencial ∆V se define tal que ∆U = q∆V ,


se obtiene para 1 eV de energı́a que:
1 eV = 1.6 × 10−19 Joules. (61)

Se obtienen las siguientes unidades derivadas en potencias de 10:

1 electronvoltio = 1 eV = 1.6 × 10−19 J,


1 kiloelectronvoltio = 1 KeV = 1 × 103 eV = 1.6 × 10−16 J,
1 megaelectronvoltio = 1 MeV = 1 × 106 eV = 1.6 × 10−13 J,
1 gigaelectronvoltio = 1 GeV = 1 × 109 eV = 1.6 × 10−10 J,
1 teraelectronvoltio = 1 TeV = 1 × 1012 eV = 1.6 × 10−7 J. (62)

Actualmente, el gran colisionador hadrónico LHC del CERN logra acelerar protones
a una energı́a de hasta 8 TeV, y se proyecta que en unos años alcanzará los 14 TeV.

D. Rotaciones
En mecánica clásica, se usa tradicionalmente los ángulos de Euler para parametrizar
la rotación de un cuerpo rı́gido, separandola como tres rotaciones independientes alre-
dedor de ejes coordenados fijos al cuerpo. Matricialmente, dichas rotaciones toman la
forma:

   
Cψ Sψ 0 1 0 0 Cϕ Sϕ 0
RE (ψ, θ , ϕ) = −Sψ Cψ 0 0 Cθ Sθ  −Sϕ Cϕ 0 , (63)
0 0 1 0 −Sθ Cθ 0 0 1

donde los ángulos de rotación se definen en los rangos −π ≤ ψ ≤ π, 0 ≤ θ ≤ π y −π ≤


ϕ ≤ π. Para rotaciones infinitesimales, alrededor del elemento identidad, los ángulos de
Euler se convierten en elementos diferenciales, notados respectivamente como δ ψ, δ θ
y δ ϕ. A primer orden, la rotación infinitesimal de la ecuación (63) se aproxima entonces
a:

   
1 δψ 0 1 0 0 1 δϕ 0
RE (δ ψ, δ θ , δ ϕ) ≈ −δ ψ 1 0 0 1 δ θ  −δ ϕ 1 0 ,
0 0 1 0 −δ θ 1 0 0 1
     
1 0 0 0 1 0 0 0 0
= 0 1 0 + −1 0 0 (δ ψ + δ ϕ) + 0 0 1 δ θ
0 0 1 0 0 0 0 −1 0
= 1 + T1 δ α + T2 δ θ , (64)
donde δ α = δ ψ + δ ϕ. El hecho de que dos de los ángulos de Euler se pueda factorizar
en unos solo, indica que la rotación infinitesimal no está descrita completamente cerca a
la identidad, ya que en general, las rotaciones requieren de tres parámetros independien-
tes. Para lograr eso, la rotación infinitesimal hay que hacerla alrededor de otros valores
diferente a la identidad.
Por otro lado, si aproximamos a primer orden las rotaciones de la ecuación (7.52),
que describe tres rotaciones alrededor de ejes coordenados externos al cuerpo, obtene-
mos cerca a la identidad que:

   
1 0 0 1 0 δ α2 1 δ α3 0
R(δ α1 , δ α2 , δ α3 ) ≈ 0 1 δ α1   0 1 0  −δ α3 1 0 ,
0 −δ α1 1 −δ α2 0 1 0 0 1
     
1 0 0 0 0 0 0 0 1
=  0 1 0 + 0 0 1 δ α1 + 0 0 0 δ α2 +
   
0 0 1 0 −1 0 −1 0 0
 
0 1 0
−1 0 0 δ α3
0 0 0
= 1 + T1 δ α1 + T2 δ α2 + T3 δ α3 , (65)
que representa tres rotaciones independientes. Adicionalmente, se puede demostrar que
se cumple el conmutador:

[T1 , T2 ] = T3 . (66)
Ası́, la anterior parametrización cumple con las propiedades de un álgebra de Lie
asociada al grupo de Lorentz restringido.

E. Grupo de Lie
Un grupo de Lie es un grupo continuo que cumple con las propiedades descritas en
la sección 7.5. Primero, al ser continuo con derivadas parciales continuas alrededor de la
identidad, los elementos del grupo los podemos representar como una serie de potencias
alrededor de la identidad. Ası́, la expansión de Taylor de g(θθ ) alrededor de θ = 0 es:

n
1 n ∂ 2 g(θk , θl )

∂ g(θk )
g(θθ ) = g(0) + ∑ θk + ∑ ∂ θk ∂ θl θk θl + ... (67)
k=1 ∂ θk θk =0 2! k,l=1 θk,l =0

Segundo, debido a la propiedad (7.58), las derivadas parciales de orden superior se pue-
den escribir como el producto de derivadas de primer orden. Por ejemplo, a segundo
orden, se tiene:
∂ 2 g(θk , θl ) ∂2 ∂ g(θk , 0) ∂ g(0, θl )
= g(θk , 0)g(0, θl ) = , (68)
∂ θk ∂ θl ∂ θk ∂ θl ∂ θk ∂ θl
propiedad que se puede generalizar a cualquier orden m:

∂ m g(θ1 , θ2 , ...θm ) = ∂1 g(θ1 , 0, 0, ...)∂2 g(0, θ2 , 0, ...)...∂m g(0, 0, ...θm )


m
= ∏ ∂ p g(0, ..., θ p , ..., 0), (69)
p=1

donde se usa la siguiente notación:

∂m
∂m = ,
∂ θ1 ∂ θ2 , ..., ∂ θm

∂p = . (70)
∂ θp

Aplicando la propiedad anterior, la expansión en (67) se puede escribir como:

n
1 n
g(θθ ) = g(0) + ∑ ∂k g|θk =0 θk + ∑ ∂k g∂l g|θk,l =0 θk θl + ... (71)
k=1 2! k,l=1

Recordando que los generadores del grupo se definen de acuerdo a la ecuación (7.60), y
definiendo g(0) como la identidad 1, la expansión toma la forma mas corta:

n
1 n
g(θθ ) = 1 − ∑ iTk θk + ∑ iTk iTl θk θl + ...
k=1 2! k,l=1
! !2
n n
1
= 1 + −i ∑ Tk θk + −i ∑ Tk θk + ..., (72)
k=1 2! k=1

que es una serie que converge a una función exponencial:

n
g(θθ ) = e−i ∑k=1 Tk θk . (73)

Ası́, en un grupo de Lie, sus elementos se pueden generar a través de los generadores
de acuerdo a la ecuación (73).
F. Operadores diferenciales del cálculo vectorial
La formulación vectorial de la electrodinámica se soporta en el cálculo diferencial
en varias variables. Los operadores diferenciales en coordenadas cartesianas se definen
como:

- Gradiente: Si ϕ es una función escalar continua y con derivadas parciales conti-


nuas, su gradiente es:

∇ϕ = (i∂x + j∂y + k∂z ) ϕ. (74)

- Divergencia: Si V es una función vectorial continua y con derivadas parciales


continuas, su divergencia es:

∇ · V = ∂xVx + ∂yVy + ∂zVz . (75)

- Rotacional: El rotacional de una función vectorial es:


i j k

∇ × V = ∂x ∂y ∂z (76)
Vx Vy Vz

- Laplaciano: El laplaciano es el producto punto entre dos operadores gradientes:

∇2 = ∇ · ∇ = ∂xx
2 2
+ ∂yy + ∂zz2 (77)

Existen tres propiedades importantes que cumplen estos operadores:

∇ · (∇ × V) = 0 (78)
∇ × (∇ϕ) = 0 (79)
2
∇ × (∇ × V) = ∇ (∇ · V) − ∇ V (80)
G. Ecuaciones de Maxwell
Las ecuaciones de Maxwell es el conjunto de 4 ecuaciones compuesto por las dos
leyes de Gauss, la ley de Faraday y la ley de Ampere-Maxwell descritos en la ecuación
(10.2). En la sección 10.1 describimos algunas propiedades matemáticas de la forma
vectorial de las ecuaciones de Maxwell. En éste apéndice demostraremos algunos de los
resultados mostrados.
Primero, para demostrar la ecuación de continuidad de la ecuación (10.9), calcule-
mos la divergencia a ambos lados de la ley de Ampere-Maxwell dada en la ecuación
(10.2):

4π 1
∇ · (∇ × B) = ∇ · J + ∂t ∇ · E. (81)
c c
Usando la propiedad (78) y la ley de Gauss, se obtiene:

4π 4π
0= ∇ · J + ∂t ρ. (82)
c c
Despejando, se obtiene la ecuación de continuidad de la ecuación (10.9).
Por otro lado, el campo magnético se puede definir como el rotacional de un poten-
cial vector, de acuerdo a la ecuación (10.4). Sin embargo, debido a la propiedad (79), el
potencial vector no está definido de forma única. Si al potencial se le suma la divergencia
de alguna función escalar arbitraria como

A → A0 = A + ∇ψ, (83)

entonces la definición (10.4) nos dá el mismo campo magnético:

B → B0 = ∇ × (A + ∇ψ)
= ∇×A
= B, (84)

por lo que B es invariante frente a la transformación del potencial vector. Para extender
esta propiedad al campo eléctrico definido como en la ecuación (10.8), el potencial es-
calar debe transformar tal que E0 = E. Para encontrar la forma de dicha transformación,
supongamos un campo eléctrico definido por un potencial escalar y vectorial de acuerdo
a la forma:

1
E = −∇φ − ∂t A. (85)
c
Si posteriormente cambiamos el potencial vector por otro A0 definido en la ecuación
(83), y el potencial escalar por otro aún desconocido φ 0 , entonces el campo eléctrico
transformado será:

1 1
E0 = −∇φ 0 − ∂t A0 = −∇φ 0 − ∂t (A + ∇ψ)
c  c 
1 1
= −∇ φ 0 + ∂t ψ − ∂t A. (86)
c c

Exigiendo la invariancia del campo eléctrico, E = E0 , de las ecuaciones (85) y (86)


obtenemos que el potencial escalar debe transforma como:

1
φ 0 = φ − ∂t ψ, (87)
c
tal como se tiene en la ecuación (10.10).
Bibliografı́a

[1] Relatividad Especial, A.P. French, Ed. Reverte (1984).


[2] Introducción a la teorı́a especial de la relatividad, R. Resnick, Ed. Limusa (1981).
[3] Sobre la teorı́a especial de la relatividad, J. M. Tejeiro, Ed. Universidad Nacional-
Observatorio Astronómico Nacional (2005).
[4] A first course in general relativity, B.F. Schutz, Ed. Cambridge University Press
(2000).
[5] Introducing Einstein’s Relativity, R. D’ Inverno, Ed. Oxford University Press
(1998).
[6] Tensors, Relativity and Cosmology, M. Dalarsson and N. Dalarsson, Ed. Elsevier
Academic Press (2005).
[7] An introduction to mechanics, D. Kleppner and R.J. Kolenkow, Ed. McGrawHill
(1986).
[8] The Feynman Lectures on Physics Vol. 1 y 2, R. Feynman, R.B. Leighton and M.
Sands, Ed. Addison Wesley (1998).
[9] Classical Electrodynamics, J.D. Jackson, John Wiley and Sons (1975).
[10] Classical Mechanics: Point particles and Relativity, W. Greiner, Ed. Springer
(1989).
[11] Mecánica Clásica, H. Goldstein, Ed. Reverté (1987).
[12] Classical Group for Physicists, Brian G. Wybourne, Ed. John Wiley and Sons
(1974).

169
Índice alfabético

absoluta Boost de Lorentz, 118


aceleración, 36 boost de Lorentz, 103
fuerza, 8 Bosón de Higgs, 53, 54, 110
simultaneidad, 79
aceleración campo
absoluta, 36 eléctrico, 1, 15, 17, 25, 145, 152
de relojes, 82 electromagnético, 56, 153
invariancia clásica, 8 escalar de Higgs, 53
relativa, 37 irrotacional, 147
transformación de la, 36, 43 magnético, 1, 15, 145, 152
adición solenoidal, 146
de velocidad, teorema clásico de, 8 carga eléctrica, 53
de velocidad, teorema relativista de, 35, conservación de la, 147, 151
84 causalidad, principio de, 74
rapidez hiperbólica, teorema de, 85 centro de masa
angular energı́a de, 133, 136
distorsión, 77 sistema, 60, 135
angulo velocidad de, 136
de rotación, 66 clásica
imaginario, 68, 70, 83 energı́a cinética, 48
angulos de Euler, 102, 162 clásico
armónica, onda, 9 efecto Doppler, 12, 13, 40
asintótica, libertad, 52 espacio-tiempo, 68
atómico, núcleo, 52 lı́mite, 39
masa inercial, 44
base del grupo de Lorentz, 107 momento lineal, 44
beta trabajo, 48
decaimiento, 1 cohete
factor, 11, 39, 40, 84 ecuación del, 141

170
fotónico, 144 -fuerza electromagnética, 154
relativista, 138 -momento, 127
colisión -posición, 124
con blanco fijo, 60, 138 -potencial, 151
de contacto, 131 -vector, 109, 111
elástica, 132 -velocidad, 124
frontal, 60, 138
inelástica, 132 D‘Alambertiano, 150
Colisonador LHC, 54 decaimiento
Compton, efecto, 133 beta, 1
configuración estándar, 20, 31 de partı́culas, 56
cono de luz, 72, 74 de pión, 56, 135
futuro, 74 del neutrón, 81
pasado, 74 delta de Kronecker, 101
resto, 74 desplazamiento
conservación vector espacial, 72
de la carga eléctrica, 147, 151 diagrama
de la energı́a, 47, 132 de espacio-tiempo, 67, 78, 82
de la masa relativista, 44 de espacio-tiempo complejo, 68
del c-momento, 132 tipo (2 + 1), 67
del momento lineal relativista, 44, 132 dilatación temporal, 32, 33, 38, 79, 81
constante Dirac, espinor de, 109
de Planck, 56 dispersión
contracción de ı́ndices, 115 relación de, 10, 12, 38
contracción de Fitzgerald-Lorentz, 33, 79 distancia
contravariante, tensor, 110, 114, 120 Euclidiana, 65, 70
conversión seudo-Euclidiana, 71, 92
a energı́a eléctrica, 59 distancia de espacio-tiempo, 67, 69, 72, 92,
eficiencia de, 59 94, 120
coordenadas distorsión angular, 77
transformación de, 24, 26, 34 Doppler, efecto
corriente clásico, 12, 13, 40
masa quarks, 52 longitudinal, 37, 40
covariante transversal, 38
ecuaciones de Maxwell, 154 dual
formulación de la mecánica, 123 tensor, 122
tensor, 110, 114, 120 tensor electromagnético, 153, 157
cuadri
-aceleración, 125 ecuación
-corriente, 150 de continuidad, 147, 151
-derivada, 149 de Minkowski, 127
-fuerza, 127, 129 de onda, 9, 25, 151
del cohete, 141 potencial, 47, 49
ecuaciones relativista, 47, 50, 54
cinemáticas, 21 umbral, 60, 137, 138
de hipérbolas, 80 y masa, equivalencia, 51, 53
de Maxwell, 1, 146 y trabajo, teorema relativista, 50
de Maxwell covariantes, 154 equivalencia
de rotación, 66, 68 de masa y energı́a, 51, 53
del fotón, 56 escalar
efecto Compton, 133 campo de Higgs, 53
Efecto Doppler producto, 115, 130
clásico, 12, 13, 40 representación, 110, 111
longitudinal, 37, 40 espacio
transversal, 38 de Minkowski, 77
eficiencia Euclidiano, 65
de conversión, 59 intervalo tipo, 73
eléctrica seudo-Euclidiano, 77
carga, 53 vectorial, 65
conversion a energı́a, 59 espacio-tiempo
energı́a, 58, 59 clásico, 68
fuerza, 52 de Minkowski, 71
electrón, 53 de Poincaré, 69, 83
electromagnético diagrama de, 67, 78, 82
c-fuerza, 154 distancia de, 67, 69, 72, 92, 94, 120
campo, 56 elemento de, 124
tensor, 152, 153 esquema complejo, 68
tensor dual, 153, 157 estructura de, 67
electronvoltio, 56 intervalo de, 67, 69, 72, 78
mega-, 52 invariancia del intervalo, 70, 79, 80,
energı́a 92
-momento, relación, 55 tipo (3 + 1), 67
cinética, 47 tipo (n + m), 67
cinética clásica, 48 espinor, 109
cinética relativista, 49 de Dirac, 109
clásica, 49 de Weyl, 109
conservación de la, 47, 132 estándar
de centro de masa, 133, 136 configuración, 20, 31
eléctrica, 58, 59 modelo, 1
eléctrica, conversión, 59 estructura
en reposo, 47, 49, 50, 58 de espacio-tiempo, 67
interna, 47, 49, 51 eter, 16–19, 38
liberada en reacciones nucleares, 59 Euclidiana
nuclear, 58 distancia, 65, 70
Euclidiano gama
espacio, 65 factor, 39
Euler, ángulos de, 102 gauge
Euler, angulos de, 162 de Lorentz, 149
evento, 5, 29, 67 transformaciones de, 147
eventos generadores
simultáneos, 30, 31 de grupo, 104
sucesión de, 67 del grupo de Lorentz, 105
representación de, 108
fórmula gravedad
de dilatación, 124 fuerza de la, 52
factor gravitón, 110
beta, 11, 16, 18, 24, 26, 39, 40, 84 grupo
gama, 24, 26, 39 Abeliano, 90
fisión nuclear, 57 abstracto, 89
Fitzgerald-Lorentz, contracción de, 33, 79 continuo, 90
fotón, 1, 55, 56 de Lie, 104, 163
ecuaciones del, 56 de Lie unitario, 105
frecuencia, 56 de Lorentz, 94, 95
fotónico, cohete, 144 de Lorentz restringido, 95, 97
fotones de Lorentz simple, 91, 92
de retroceso, 135 discreto, 90
decaimiento de pión en, 56 generadores de, 104
fuerza representaciones de, 106, 107, 109
absoluta, 8
clásica, 8 hadrónico, gran colisionador LHC, 54
de Lorentz, 145, 154 Higgs
de Minkowski, 127, 129 Bosón de, 53, 54, 110
eléctrica, 52 mecanismo de, 53, 54
gravitacional, 52 hipérbolas
invariancia clásica de la, 8, 9 ecuaciones de, 80
nuclear débil, 53 invariantes, 80, 82
nuclear fuerte, 52 hiperbólica
relativista, 49 rapidez, 83, 84, 105, 142
funciones tangente, 84
hiperbólicas, 68, 83 hiperbólicas, funciones, 68, 83
futuro de cono de luz, 74 hiperbólico
coseno y seno, 84
Galileo hipersuperficie, 67
principio de relatividad de, 7 homomorfismo, 106
relatividad de, 11, 12
transformaciones de, 6, 10, 69 inercia
Ley de, 21, 22, 37 Ley
inercial de Ampere-Maxwell, 146, 148, 154
masa, clásico, 8, 9, 44 de Faraday, 146, 156
masa, relativista, 44, 45 de fuerza de Lorentz, 145, 154
observador, 6, 9, 10, 19, 20, 30, 43 de Gauss, 146, 148, 154
sistema, 6 de inercia, 21, 22, 37
intensidad de la luz, 17, 18 Gravitacional de Newton, 1
intervalo segunda, de Newton, 9, 43
de espacio-tiempo, 67, 69, 72, 78 Leyes
tipo espacio, 73 de Newton, 20
tipo luz, 73 LHC, Gran colisonador hadrónico, 54
tipo tiempo, 73 libertad asintótica, 52
invariancia longitud
clásica de la aceleración, 8 de onda, 10, 12, 38
clásica de la fuerza, 8, 9 invariancia clásica de la, 33
clásica de la longitud, 33 propia, 33, 34, 80
clásica de la masa, 9 relativa, 34
clásica del tiempo, 6, 7 relatividad de la, 33
de intervalo espacio-tiempo, 70, 79, 80, longitudinal
92 efecto Doppler, 37, 40
de la conservación del momento lineal, retraso para ondas mecánicas, 10–12
44 Lorentz
de la ecuación de Minkowski, 128 base del grupo de, 107
de Leyes fı́sicas, 53 Boost de, 118
principios de, 65 boost de, 103
invariante fuerza de, 145, 154
hipérbolas, 80, 82 gauge de, 149
masa, 130 generadores del grupo de, 105
inversión grupo de, 91, 92, 94, 95
espacio-temporal, 97 grupo restringido de, 95, 97
temporal, 97, 103 representación del grupo de, 106, 107,
109
Kaón, 61, 138 transformaciones de, 20, 91
Kronecker transformaciones inversas de, 26, 35,
delta de, 101 118
Kronecker, tensor de, 120 transformaciones restringidas de, 97,
103
lı́mite transformaciones simples de, 20, 25,
clásico, 39 31, 68
ultrarelativista, 39, 40 luz
lı́nea de Universo, 67, 69, 70 cono de, 72, 74
Levi-Civita, tensor de, 121 fotones, 55
intervalo tipo, 73 desintegración de, 81
tiempo de vida, 81
métrico, tensor, 94, 95, 120 neutrino, 109, 135
masa neutrones, 58
constituyente de los quarks, 53 Newton
de corrientes de quarks, 52 Ley Gravitacional de, 1
de los quarks, 52 Leyes de, 20
de núcleo Carbono 12, 57 segunda Ley de, 9, 43
de pión neutro, 56 nuclear
en reposo, 46, 51, 54, 58 energı́a, 58
en reposo del protón, 52 energı́a liberada, 59
inercial clásico, 8, 9, 44 fisión, 57
inercial relativista, 44, 45 fuerza débil, 53
invariancia clásica de la, 9 fuerza fuerte, 52
invariante, 130
relativista, conservación de la, 44 observador
y energı́a, equivalencia, 51, 53 inercial, 6, 9, 10, 19, 20, 30, 43
Maxwell propio, 32, 34
ecuaciones covariantes de, 154 onda
ecuaciones de, 1, 15, 146 armónica, 9, 17
James C., 15 ecuación de, 9, 25, 151
mecanismo de Brout-Englert-Higgs, 53, 54 electromagnética, 39
Michelson-Morley, experimento de, 12, 15, frecuencia, 12
17, 18 frecuencia angular, 17
Minkowski intensidad, 17, 18
ecuación de, 127 interferencia, 17
espacio-tiempo de, 71, 77 longitud de, 10, 12, 38
fuerza de, 127, 129 luminosa, 15, 16
Hermann, 65 mecánica, 7, 9, 15, 37
momento relatividad para, 9
-energı́a, relación, 55 retraso longitudinal, 10–12, 16
lineal clásico, 44 retraso transversal, 11, 12, 16
lineal relativista, 44, 54 sonora, 10, 38
lineal relativista, conservación del, 44 velocidad de, 9, 10
lineal, conservación del, 44, 132
muón, 135 paradoja
de los gemelos, 81
núcleo del abuelo, 74
de Carbono 12, masa, 57 del saltador con pértiga, 76
de Uranio, 58 partı́cula
núcleo atómico, 52 decaimiento de, 56
neutrón, 52, 81 libre, 51, 53
puntual, 49, 51 up, 52
pasado de cono de luz, 74 quarks
pión fuerza fuerte de los, 53
decaimiento, 56, 135 masa, 52
neutro, 56 masa constituyente, 53
neutro, masa en reposo de, 56 masa de corrientes, 52
Planck, constante de, 56 piones, 56
Poincaré
espacio-tiempo de, 69, 83 rango de un tensor, 113
posición rapidez
transformación clásica de la, 7 hiperbólica, 142
postulado rapidez hiperbólica, 83, 84, 105
de la velocidad de la luz, 19 teorema de adición, 85
de relatividad, 19, 43, 82 regla de la cadena, 36, 48, 49
postulados de la relatividad especial, 19 regla del cociente, 116
potencia, 129 relatividad
potencial de Galileo, 11, 12, 19, 20
escalar, 147 de Galileo, principio de, 7
vectorial, 146 de la aceleración, 37
principio de la longitud, 33
de conservación de la energı́a, 47 de la simultaneidad, 30
de causalidad, 74 del movimiento, 34
de conservación de la masa relativista, del tiempo, 29
44 especial, 19, 65
de conservación del momento lineal, general, 65
44 para ondas mecánicas, 9, 10, 12
de invariancia, 65 postulado de, 19, 43, 82
producto postulados de la, 19
escalar, 115, 130 principio de, 1
externo, 115 relativista
interno, 114 cohete, 138
por un escalar, 116 conservación de la masa, 44
propia conservación del momento lineal, 44
longitud, 33, 34, 80 energı́a, 47, 50, 54
propio energı́a cinética, 49
observador, 32, 34 fuerza, 49
tiempo, 32, 38, 79, 81, 124 masa inercial, 44, 45
protón, 52 momento lineal, 44, 54
masa en reposo del, 52 teorema trabajo y energı́a, 50
trabajo, 49
quark reloj, 29
down, 52 relojes
acelerados, 82 simétrico, 116
sincronizados, 30 teorema
representación clásico de adición de velocidad, 8
de los generadores, 108 de adición de la rapidez hiperbólica,
del grupo de Lorentz, 106, 107, 109 85
escalar, 110, 111 relativista de adición de velocidad, 35,
espinorial, 108 37, 84
fundamental, 109 trabajo y energı́a relativista, 50
tensorial, 108, 110 tiempo
resto de cono de luz, 74 dilatación de, 32, 33, 38, 79, 81
imaginario, 68, 70, 83
seudo- intervalo tipo, 73
Euclidiano, 92 invariancia clásica del, 6, 7
Euclidiano, distancia, 71 propio, 32, 38, 79, 81, 124
Euclidiano, espacio, 71, 77 transformación del, 24, 26, 31, 32, 34
tensor, 111 trabajo, 48
simultaneidad clásico, 48
absoluta, 30, 79 relativista, 49
de eventos, 30, 31 y energı́a, teorema relativista, 50
relativa, 30, 78 transformación
sistema del tiempo, 31
centro de masa, 60, 135 clásica de la posición, 7
co-movil, 126 de coordenadas, 24, 26, 34
laboratorio, 60, 135, 137 de la aceleración, 36, 43
subluminal, 41, 47 de la corriente, 151
superluminal, 41, 46 del tiempo, 24, 26, 32, 34
transformaciones
taquiones, 41, 46, 74 antiortocronas, 96
Taylor, expansión en series de, 17, 39 de Galileo, 6, 10, 19, 69
tensor, 109, 110 de gauge, 147
antisimétrico, 117 de Lorentz, 20, 91
contravariante, 110, 114, 120 de Lorentz inversas, 26, 35, 118
covariante, 110, 114, 120 de Lorentz restringidas, 97, 103
de Kronecker, 120 de Lorentz simples, 20, 24, 25, 31, 68,
de Levi-Civita, 121 69
dual, 122 impropias, 95
dual electromagnético, 153, 157 ortocronas, 96
electromagnético, 152, 153 propias, 95
isotrópico, 119 transversal
métrico, 94, 95, 120 efecto Doppler, 38
mixto, 111, 114 retraso para ondas mecánicas, 11, 12
rango de un, 113 trayectoria, 67
ultrarelativista, lı́mite, 39, 40
umbral, energı́a, 137, 138
unidad de masa atómica, u.m.a, 57
Universo
lı́nea de, 67, 69, 70
Uranio, 58

vatio, 59
velocidad
de la luz, 15, 19, 26, 39–41
de la luz, postulado de la, 19
de una onda mecánica, 9, 10
orbital, 16, 18
relativa, 26, 83
relativista, 32
teorema de adición relativista de, 35,
37

Weyl, espinor de, 109

También podría gustarte