Está en la página 1de 189

Sobre la teoría especial de la relatividad

Juan Manuel Tejeiro Sarmiento


Profesor Titular
Observatorio Astronómico Nacional
Facultad de Ciencias
Universidad Nacional de Colombia

2005
ii
Índice general

Introducción IX

I Cinemática relativista 1
1. Modelo mecánico del mundo 3
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Leyes de Newton y principio de relatividad . . . . . . . . . . . 4
1.3. Luz y éter: El retorno al espacio absoluto . . . . . . . . . . . . 9
1.3.1. Un experimento crucial . . . . . . . . . . . . . . . . . . 15

2. Fundamentos de la relatividad especial 19


2.1. Postulados de la relatividad especial . . . . . . . . . . . . . . . 19
2.2. Transformaciones de Lorentz . . . . . . . . . . . . . . . . . . . 24
2.3. Propiedades de las TL . . . . . . . . . . . . . . . . . . . . . . 32
2.4. Consecuencias de las TL . . . . . . . . . . . . . . . . . . . . . 41

3. La estructura causal del espacio-tiempo 49


3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2. Rotaciones en el plano euclideano . . . . . . . . . . . . . . . . 49
3.3. Cuadri-vectores y el grupo de Lorentz . . . . . . . . . . . . . . 53
3.4. Conos de luz y relaciones de causalidad . . . . . . . . . . . . . 58
3.5. Algebra de cuadri-vectores . . . . . . . . . . . . . . . . . . . . 62

4. Cinemática relativista 67
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.2. Cuadri-vector velocidad . . . . . . . . . . . . . . . . . . . . . 67
4.3. Cuadri-vector aceleración . . . . . . . . . . . . . . . . . . . . . 72

iii
iv ÍNDICE GENERAL

4.3.1. Viaje interestelar . . . . . . . . . . . . . . . . . . . . . 73


4.4. Cuadri-vector de onda . . . . . . . . . . . . . . . . . . . . . . 79

II Dinámica relativista 83
5. Dinámica relativista 85
5.1. Ecuaciones de movimiento . . . . . . . . . . . . . . . . . . . . 85
5.2. Leyes de conservación . . . . . . . . . . . . . . . . . . . . . . . 89
5.3. Propiedades del c-momentun . . . . . . . . . . . . . . . . . . . 92
5.4. Sistema centro de masa . . . . . . . . . . . . . . . . . . . . . . 95
5.5. Energía umbral . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.6. Fotones y partículas de masa en reposo cero . . . . . . . . . . 100

6. Aplicaciones de la dinámica relativista 105


6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.2. Colisiones elásticas . . . . . . . . . . . . . . . . . . . . . . . . 105
6.2.1. Efecto Compton . . . . . . . . . . . . . . . . . . . . . . 106
6.2.2. Efecto Compton inverso . . . . . . . . . . . . . . . . . 109
6.3. Colisiones inelásticas . . . . . . . . . . . . . . . . . . . . . . . 111
6.3.1. Absorción de un fotón por un átomo . . . . . . . . . . 113
6.3.2. Emisión de un fotón por un átomo exitado . . . . . . . 116
6.4. Sistemas de masa variable . . . . . . . . . . . . . . . . . . . . 118
6.5. Creación y aniquilación de partículas . . . . . . . . . . . . . . 120

III Electrodinámica relativista 123


7. Tensores 125
7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
7.2. Definiciones fundamentales . . . . . . . . . . . . . . . . . . . . 126
7.2.1. Componentes covariantes . . . . . . . . . . . . . . . . . 128
7.2.2. Algebra tensorial . . . . . . . . . . . . . . . . . . . . . 131
7.2.3. Propiedades de simetría de tensores . . . . . . . . . . . 136
7.3. Transformación general de coordenadas . . . . . . . . . . . . . 142
7.4. Operadores vectoriales . . . . . . . . . . . . 145
ÍNDICE GENERAL v

8. Electrodinámica 149
8.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
8.2. Ecuaciones de Maxwell . . . . . . . . . . . . . . . . . . . . . . 150
8.3. Campo magnético como un efecto relativista . . . . . . . . . . 152
8.4. Ecuaciones de Maxwell covariantes . . . . . . . . . . . . . . . 161
8.5. Transformaciones Gauge . . . . . . . . . . . . . . . . . . . . . 171

9. Revisión bibliográfica 175


vi ÍNDICE GENERAL
Prefacio

El presente libro es el resultado de varios años de experiencia como pro-


fesor de la asignatura de Relatividad para los estudiantes de la carrera de
Física. Una primera versión del libro fue publicada por la Facultad de Cien-
cias como Notas de Clase, la cual, en el transcursos de los últimos dos años
y con las sugerencias y recomendaciones de muchos de los alumnos, me ha
permito mejorar sustancialmente esta primera versión.
El objetivo fundamental de este libro es presentar los principios básicos y
los resultados fundamentales de la teoría especial de la relatividad, con énfasis
en una formulación covariante, es decir una formulación que nos permite
desde un principio, exhibir en forma explícita el carácter relativista de una
teoría. Para este fin se han organizado los temas en tres Partes
La primera parte del libro la conforman los tres primeros capítulos. El
primer capítulo es una introducción general, un segundo capítulo sobre los
fundamentos de la mecánica Newtoniana, con una breve discusión sobre el
problema del éter, esto con el fin de motivar los postulados básicos de la
teoría especial de la relatividad y sus principales consecuencias, desarolladas
en el tercer capítulo.
La segunda parte constituye el cuerpo central del libro. Comenzando con
un capítulo dedicado a una formulación exhaustiva del concepto de cuadri-
vector y la estructura causal del espacio-tiempo, se continua con el capítulo
quinto en el cual formulamos los principios y leyes de la dinámica relativista,
para tratar en el siguiente capítulo las principales aplicaciones de la dinámica
relativista.
La última parte está destinada a formular la teoría electromagnética
(ecuaciones de Maxwell) en forma explícita relativista y a mostrar como surge
el campo magnético como un efecto relativista (capítulo octavo). Para este fin
es necesario dedicar un capítulo a la formulación y álgebra de tensores sobre
el espacio de Minkowski, partiendo de la definición de cuadri-vector desarro-

vii
viii PREFACE

llada en el capítuo cuarto, sin recurrir a todo el formalismo matemático de


las variedades y la geometría diferencial, pero manteniendo la validéz general,
tanto en la notación como en los resultados fundamentales.
En un breve capítulo final se lista y se comenta una bibliografia bási-
ca sobre relatividad especial, la cual contiene libros de divulgación, textos
elementales y avanzados, y algunos libros de interes histórico.
Introducción

La teoría de la relatividad (especial y general) es considerada como uno


de los más grandes logros de la mente humana y forma parte, de lo que
podemos llamar la cultura del hombre del siglo XX. A pesar del estigma
de incomprensibilidad que siempre ha rodeado a la teoría de la relatividad,
en el sentido que su comprensión está al alcance solamente de unos pocos
especialistas, esta teoría científica ha sido la de mayor impacto y difusión a
nivel de divulgación y ha tenido influencia definitiva sobre nuestra imagen
del mundo.
El desarrollo de la teoría de la relatividad ha estado marcado por cir-
cunstancias particulares que la diferencian de otros desarrollos de la física
contemporánea, a las cuales me referiré en esta introducción, con el fin de
mostrar, por una parte el estado actual de la teoría y por otra, el papel
fundamental que ha jugado y juega esta teoría en el desarrollo de la física
actual.
La formulación de la Teoría Especial de la Relatividad dada por Einstein
en 1905 es completa, es decir, a parte de ejemplos y aplicaciones de la teoría,
o de su reformulación en términos de modelos matemáticos más sofisticados,
todo los elementos básicos que hoy conocemos de la teoría especial de la
relatividad están contenidos en los trabajos originales de Einstein. Además,
el estilo del primer trabajo publicado por Einstein sobre el tema, a diferen-
cia de otros trabajos en física teórica, se caracterizó por su sencillez en la
exposición, con muy poco contenido matemático y la ausencia de referencias
a artículos y trabajos anteriores. Su conclusión fundamental, la necesidad de
reformular el concepto absoluto de simultaneidad y con él, el concepto de
tiempo en física, muestra la genialidad de Einstein, no por la complejidad de
sus razonamientos ni la complejidad en los cálculos, sino por la profundidad
de sus conclusiones, las cuales modificaron de manera radical e irreversible
nuestros conceptos básicos de espacio y tiempo.

ix
x INTRODUCCIÓN

No es cierto, como sostienen algunos escritos de divulgación sobre rela-


tividad, que el trabajo de Einstein no fue comprendido en su tiempo, pues
pocos meses después de su publicación físicos de Cracovia afirmaban que
había nacido un nuevo Copernico y ya para 1909, los principales físicos de
esa época tales como Planck, von Laue y otros, reconocieron la genialidad de
Einstein y la importancia de sus trabajos.
Es importante resaltar en este punto que de hecho todas las ecuaciones
básicas de la teoría especial de la relatividad, tales como la contracción de lon-
gitudes, aumento de la masa con la velocidad, la equivalencia masa-energía,
etc., ya eran conocidas en la literatura y por lo tanto, la física si estaba
preparada para entender y asimilar las ideas de Einstein. Para comprender
esto, basta con recordar que la teoría electromagnética de Maxwell es una
teoría relativista y por lo tanto era de esperar que un estudio minucioso
de las ecuaciones de Maxwell (recordemos el excelente trabajo realizado por
Lorentz sobre el electrón, el cual fue publicado en 1904) condujera a todas
estas ecuaciones relativistas, aun cuando su interpretación estuviera fuerte-
mente influenciada por el concepto del éter.
Claramente, el impacto de la teoría especial de la relatividad de Einstein
no se podía esperar que fuera muy grande a nivel experimental y tecnológico,
pues de hecho la posibilidad de probar experimentalmente la teoría en forma
directa era muy difícil y más significativo aún, era su escasa o prácticamente
nula aplicabilidad. Esto, debido a que los fenómenos relativistas son rele-
vantes en situaciones que involucren velocidades comparables a la velocidad
de la luz en el vacío (aproximadamente 300 000 ), lo cual solo vino a ser
posible con el desarrollo de los grandes aceleradores de partículas a mediados
del siglo XX.
En 1916 Einstein publica la Teoría General de la Relatividad, la cual co-
rresponde a la formulación relativista de la ley de gravitación universal de
Newton. Estos trabajos, a diferencia de sus primeras publicaciones sobre la
teoría especial de la relatividad, si requirieron de una estructura matemática
muy compleja: la geometría diferencial y el cálculo tensorial. Dos predic-
ciones fundamentales surgen de estos trabajos, el corrimiento del perihelio
de Mercurio, efecto que ya había sido observado, más no explicado por los
astrónomos y la desviación de la luz por el sol, cuya corroboración se da en
1919, aprovechando un eclipse total de sol que tuvo lugar el 29 de Mayo.
Más significativo aún para el desarrollo de la teoría general de la relativi-
dad, puede ser el descubrimiento de Hubble de la expansión del universo en
1929, si bien Einstein no había predicho este efecto, si estaba contenido en
xi

sus ecuaciones de la relatividad general. Este punto de la historia marca el


comienzo de la cosmología actual, la cual es una de las áreas de investigación
más activas que tenemos hoy día.
Retomando de nuevo el desarrollo de la teoría especial de la relatividad,
es importante anotar en este punto, que si bien Albert Einstein recibió el
Premio Nobel de física, no por la teoría de la relatividad, sino por su trabajo
sobre el efecto foto-eléctrico, el papel fundamental que juega la teoría de la
relatividad especial en el desarrollo de la física se comienza a reconocer a
finales de la segunda década del siglo XX y el cual va muy de la mano con
el desarrollo de la teoría cuántica. En efecto, dado que las predicciones de la
teoría de la relatividad son significativas experimentalmente para velocidades
cercanas a la de la luz, es de esperar que sus efectos se manifiesten a escalas
atómicas. Un primer ejemplo que podemos citar es el trabajo de De Broglie
(Premio Nobel), en donde, utilizando argumentos relativistas, generaliza la
hipótesis de Einstein sobre la cuantización de la radiación electromagnética
a toda la materia, es decir asocia a cualquier partícula de momentun p una
longitud de onda = |p|, postulando que las partículas materiales se
comportan de manera similar a las ondas electromagnéticas, por ejemplo
exhibiendo efectos de interferencia. A comienzos de la década del veinte,
Schrödinger e independientemente Heisenberg, formulan los principios de la
mecánica cuántica. Si bien esta teoría era por principio no relativista, estaba
claro en el ambiente la necesidad de dar una formulación relativista de la
mecánica cuántica.
Dirac en 1925 presenta el primer desarrollo de la mecánica cuántica rela-
tivista en donde se amplía sustancialmente el panorama de la física. En efecto,
hasta 1925 se conocían solamente dos partículas elementales: el electrón y el
protón. Como una consecuencia fundamental de su recién desarrollada teoría
relativista del electrón, Dirac predice la existencia del spin del electrón y la
existencia de una nueva partícula, el positrón, que es una partícula funda-
mental de la misma masa del electrón pero de carga opuesta. Este hecho es
posteriormente generalizado y se establece un resultado general de la natu-
raleza y es que a toda partícula fundamental le corresponde una antipartícu-
la. Estos desarrollos condujeron entonces a la teoría cuántica de campos, que
constituye el marco teórico para entender las interacciones fundamentales de
la naturaleza (electromagnética, fuerte y débil), que rigen el comportamiento
de la materia a escala microscópica.
Hoy día la teoría especial de la relatividad es reconocida como una teoría
fundamental de la física, cuyo alcance va más allá de sus posibles aplica-
xii INTRODUCCIÓN

ciones experimentales o tecnológicas, pues élla se enmarca en el contexto


de las propiedades fundamentales del espacio-tiempo, independientemente
de cualquier modelo físico utilizado para describir los fenómenos. En gene-
ral, las leyes físicas que rigen el comportamiento de los sistemas se formulan
en términos de relaciones (ecuaciones diferenciales) entre las variables físi-
cas necesarias para describir un sistema. Estas variables físicas se describen
por funciones del espacio y el tiempo (posición, momentun, energía, etc.),
cuyo comportamiento está regido por los principios de la teoría especial de
la relatividad.
Parte I
Cinemática relativista

1
Capítulo 1

Modelo mecánico del mundo

1.1. Introducción
En este capítulo presentaremos en forma resumida la situación de la física
a comienzos del siglo XX, destacando los hechos más relevantes, que nos per-
mitan motivar y entender mejor los conceptos y postulados fundamentales,
sobre los cuales está basada la teoría especial de la relatividad, formulada en
1905 por el físico alemán Albert Einstein.
En la primera sección revisaremos las leyes y conceptos fundamentales
de la mecánica Newtoniana, dedicando el resto del capítulo a presentar una
breve descripción de algunas de las teorías del éter, con el fín de entender el
problema central que se debatía en la física en la segunda mitad del sigloXIX,
en cuanto a la aparente inconsistencia entre la mecánica Newtoniana y la
recién desarrollada teoría electromagnética.
La teoría de la mecánica formulada por Newton en el siglo XVI y en-
riquecida por la contribución de muchos físicos y matemáticos a lo largo de
los dos siglos siguientes, se constituyó en la teoría fundamental que permitía
entender, explicar y predecir todos los fenómenos físicos conocidos. Fue en
la primera mitad del siglo XIX que aparecieron fenómenos relacionados con
el electromagnetismo y con la luz que comenzaron a complicar la imágen
(explicación) mecánica del mundo. Esta situación se tornó más crítica en la
segunda mitad del siglo con el desarrollo de la teoría de la electrodinámica
de Maxwell, pues su aparente incompatibilidad con la mecánica Newtonia-
na, reflejada no sólo en consideraciones teóricas sino también en resultados
experimentales, hacían pensar que alguna de las dos teorías, la mecánica o la

3
4 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

electrodinámica, debería ser abandonada o revisada, lo cual no era un pro-


blema fácil, pues ambas teorías presentaban una enorme cantidad de pruebas
experimentales y desarrollos tecnológicos que sustentaban su validez.

1.2. Leyes de Newton y principio de relativi-


dad
Para comprender mejor los problemas que se le planteaban a la física en
el siglo XIX y preparar el terreno para entender los cambios de interpretación
necesarios que se dieron con el desarrollo de la teoría especial de la relatividad,
en esta sección revisaremos brevemente algunos conceptos fundamentales de
la mecánica newtoniana, cuyo punto de partida son las tres leyes de Newton:
Ley de la inercia- Toda partícula permanece en estado de reposo o
movimiento rectilíneo uniforme respecto a cualquier sistema de referencia
inercial, mientras no actúen fuerzas externas sobre él, o equivalentemente el
momentum de una partícula libre de fuerzas permanece constante, en donde
la cantidad dinámica de momentum se define como
= (1.1)
siendo la masa inercial de la partícula y su velocidad.
Ecuación de movimiento- La fuerza aplicada sobre la partícula es igual
a la rata de cambio de su momentum

= = (1.2)

en donde la última igualdad se deduce del hecho que la masa inercial de una
partícula puntual es constante e independiente de su estado de movimiento.
Interacción entre partículas- La fuerza que una partícula A ejerce
sobre otra partícula B es igual en magnitud y en sentido opuesto a la fuerza
que la partícula B ejerce sobre A.
Para la formulación de estas leyes hay toda una serie de supuestos básicos
necesarios, tales como la estructura geométrica del espacio, el concepto de
tiempo, observador y sistema de referencia, magnitudes físicas y el concepto
de medida. Sin embargo, no es objeto del presente libro entrar a discutir
exhaustivamente estos conceptos, sino nos centraremos únicamente en aque-
llos aspectos que son relevantes para plantear y motivar la formulación de la
teoría especial de la relatividad.
1.2. LEYES DE NEWTON Y PRINCIPIO DE RELATIVIDAD 5

Definamos, en primer lugar, el concepto de observador como un sistema


físico (reglas o patrón de medida espacial y relojes o patrón de medida tem-
poral), que permite determinar la posición y el instante de tiempo respecto
a un origen arbitrario, de un fenómeno físico (que en lo sucesivo llamaremos
evento). A este conjunto de reglas y relojes lo denominaremos sistema de
referencia, cuya representación matemática se puede realizar por el espacio
R × R3 , con R los números reales que representa el tiempo y R3 el espacio
euclidiano tridimensional que representa el espacio físico. Dotar al espacio y
al tiempo con esta estructura matemática supone (como lo asumió explícita-
mente Newton) que el espacio es absoluto, homogéneo e isotrópico y obedece
la geometría euclideana y el tiempo es absoluto y homogéneo y por lo tanto
son conceptos independientes del observador.
En segundo lugar, Newton asumió que sus leyes se cumplen en el espacio
absoluto, es decir que sus leyes son válidas para un observador, cuyo sis-
tema de coordenadas esté fijo respecto al espacio absoluto. A este observador
particular se le llama ”sistema de referencia inercial” y lo denotaremos por
. Elegir un sistema de referencia inercial es, en principio, escoger una co-
ordenada temporal y un sistema de coordenadas cartesianas ( ) para
determinar el instante y la posición de un evento. Que el origen de la coor-
denada temporal es arbitrario, refleja el hecho que el tiempo es homogéneo,
mientras que el origen y la orientación arbitrarias de las coordenadas es-
paciales ponen de manifiesto la homogeneidad e isotropía del espacio. Si la
primera ley de Newton es válida en , entonces una partícula , sobre la cual
no actúan fuerzas, debe viajar en una línea recta y a velocidad constante re-
specto al sistema . Así por ejemplo, si elegimos el origen del tiempo y los
ejes espaciales de tal manera, que la partícula pase por el origen espacial en
el instante = 0 y se mueva en la dirección del eje positivo, entonces su
posición, en un instante de tiempo cualquiera , está dada por

= ; =0; =0 (1.3)

con
=( )=( 0 0) (1.4)
la velocidad de la partícula.
Consideremos otro sistema de referencia 0 , con respecto al cual la partícu-
la permanece en reposo en su origen de coordenadas espaciales, y elijamos
los ejes espaciales de 0 paralelos a los del sistema de referencia inercial
6 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

Figura 1.1: Transformaciones de Galileo

y el origen del tiempo de tal manera los relojes comiencen a contar el tiem-
po, = 0 = 0, cuando los orígenes de los dos sistemas se cruzan. Entonces,
podemos determinar las coordenadas espaciales y el tiempo de cualquier even-
to físico, bien sea con respecto al sistema inercial o con respecto al sistema
de referencia 0 . Si llamamos ( ) las coordenadas de un evento físico
cualquiera, medidas respecto a y ( 0 0 0 0 ) las correspondientes coorde-
nadas, medidas respecto a 0 , podemos encontrar la relación entre las coor-
denadas del evento, medidas por los dos sistemas de referencia 0 y . Estas
relaciones son llamadas ecuaciones de transformación de Galileo.
Es fácil encontrar las ecuaciones de transformación de Galileo (Figura
1.1), pues teniendo encuenta que las ecuaciones (1.3) nos dan la posición,
respecto al sistema inercial , del origen de coordenadas del sistema 0 ,
entonces, las coordenadas ( 0 0 0 0 ) de cualquier evento medidas por 0 ,
están relacionadas con las coordenadas ( ) del mismo evento medidas
por , por las ecuaciones:
0 0 0 0
= = = = (1.5)

en donde se ha hecho el cambio = , para rescatar la notación usual


utilizada en la literatura.
1.2. LEYES DE NEWTON Y PRINCIPIO DE RELATIVIDAD 7

Así, en lo sucesivo denotará la velocidad del sistema de referencia 0 res-


pecto a . La elección de los dos sistemas coordenados de y 0 con los ejes
coordenados paralelos y la misma orientación, así como la velocidad relativa
0
de los dos sistemas a lo largo de los ejes no representa pérdida alguna
de generalidad y su justificación se encuentra en la hipótesis de isotropía del
espacio, la cual implica que la física no depende de la orientación de los ejes
coordenados, o equivalentemente, que el espacio es isotrópico. Además, en las
ecuaciones de tranformación de Galileo está implícita también la hipótesis de
homogeneidad del espacio y el tiempo, pues la elección del origen del tiempo
para los dos sistemas, en el instante en que los orígenes espaciales coinci-
den, es arbitraria, indicando que cualquier instante de tiempo y todos los
puntos del espacio son equivalentes para describir los fenómenos físicos. La
primera ecuación de transformación, 0 = , representa el carácter absoluto
del tiempo, y significa que (salvo la elección arbitraria del origen) el instante
en el cual ocurre un evento físico es independiente del observador y además,
esta ecuación lleva también la hipótesis implícita, que existe algún mecanismo
físico apropiado que permite transmitir información instantáneamente. Otra
forma de expresar este carácter absoluto del tiempo, es a través del concepto
de simultaneidad: Si dos eventos, que ocurren en puntos diferentes del es-
pacio para un observador, son simultáneos, entonces estos dos eventos son
también simultáneos para cualquier otro observador, sin importar su estado
de movimiento relativo respecto al primer observador. Como veremos más
adelante, la simultaneidad es uno de los conceptos fundamentales que debe
ser cuestionado y se torna en un punto muy importante para la formulación
de la teoría de la relatividad.
Una primera consecuencia de las transformaciones de Galileo, es que las
leyes de la mecánica son válidas en todos los sistemas de referencia que se
muevan con respecto al sistema de referencia inercial, el cual se encuentra en
reposo con respecto al espacio absoluto. La demostración de este resultado
es directa, pues, si una partícula libre posee una velocidad

=( )=( ) (1.6)

respecto al sistema de referencia inercial , entonces, se obtiene de las ecua-


ciones de transformación de Galileo (1.5), que las componentes de la velocidad
de la partícula, medidas en el sistema de referencia 0 están dadas por:
0
0 = 0
= 0 = 0 = (1.7)
8 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

Este resultado se conoce con el nombre de teorema de adición de veloci-


dades de Galileo. Así, puesto que la velocidad relativa entre los sistemas de
referencia y 0 es constante, entoces, la partícula libre también se mueve
con velocidad constante 0 = ( 0 0 0 0 ) respecto al sistema 0 . De manera
similar, se deduce que la segunda ley de Newton también se satisface, pues,
utilizando el resultado anterior (ecuación (1.7)), tenemos que
0 0
0
= 0
= = = = (1.8)

con el resultado adicional, que no sólo la forma de la segunda ley de Newton


= es la misma, como queríamos probar, sino que tanto la fuerza que
actúa sobre la partícula, como su aceleración, toman el mismo valor en los
dos sistemas de referencia. Que la tercera ley de Newton también se cumple
para el sistema de referencia , se obtiene de este resultado y del carácter
absoluto de la simultaneidad, pues, la igualdad de las fuerzas de acción y
reacción es instantánea, independiente de la posición relativa de los puntos
de aplicación de las fuerzas.
Esta invarianza de las leyes de la mecánica bajo transformaciones de
Galileo, constituye el Principio de Relatividad Galileano. En la formulación
inicial de las leyes de Newton, se postuló que ellas eran válidas para un
observador en reposo con respecto al espacio absoluto, que lo llamamos ob-
servador inercial o sistema de referencia inercial, y mostramos, que si este
postulado se cumplía, entonces las leyes de Newton también eran válidas en
cualquier sistema de referencia que se moviera con velocidad constante re-
specto al observador inercial. Esto justifica extender el nombre de sistema
de referencia inercial, para todos los observadores con movimiento relativo
constante, respecto al observador inercial inicialmente en reposo relativo al
espacio absoluto. Así, podemos dar otras formas equivalentes de enunciar el
principio de relatividad galileano: Las leyes de la mecánica son las mismas en
todos los sistemas de referencia inerciales, o también, no es posible, a través
de experimentos mecánicos, determinar la velocidad del sistema de referencia
inercial con respecto al espacio absoluto.
Esta última forma equivalente de enunciar el principio de relatividad Ga-
lileano, le quita todo el sentido físico al espacio absoluto, pues elimina su
estatus privilegiado de ser el único sistema de referencia con respecto al cual
se cumplen las leyes de la mecánica y por lo tanto, el espacio absoluto queda
como un concepto empíricamente vacío, por lo menos en lo que a fenómenos
mecánicos se refiere.
1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 9

Esta situación, reconocida desde un principio por Newton, lo condujo a


buscar experimentos alternativos que le permitieran determinar el movimien-
to con respecto al espacio absoluto. El ejemplo más conocido en la literatura
lo constituye su experimento del balde rotante, en el cual, la curvatura que
toma la superficie del agua del balde, cuando éste se encuentra en rotación,
se la atribuye a su movimiento de rotación respecto al espacio absoluto, pues
este fenómeno, sostenía Newton, tenía lugar aún en el caso que el balde se
encontrara solo en el universo. Críticas a este análisis son igualmente abun-
dantes en la literatura, siendo la de Mach la más conocida, pues parte del
análisis que llevó a Einstein a formular los principios de la Teoría General de
la Relatividad está basado sobre los trabajos de Mach.
No es objeto de la presente sección profundizar más sobre este tema,
pues volveremos sobre el problema del espacio absoluto, cuando discutamos
las teorias del eter y los fenómenos electromagnéticos. Sin embargo, es im-
portante dejar claro un aspecto referente a este tema: Dada la imposibilidad
de determinar el movimiento absoluto (a velocidad constante) a través de
fenómenos mecánicos, Newton recurrió, entonces, a sistemas de referencia
acelerados, para los cuales las leyes de la mecánica ya no permanecen invari-
antes y claramente, los efectos de la aceleración si son detectables (las, no
bien llamadas fuerzas ficticias, tales como la fuerza centrífuga o la fuerza de
coriolis, que surgen en sistemas de referencia acelerados), pero aún, en este
caso de sistemas de referencia no inerciales, cualquier referencia al espacio
absoluto sigue siendo superflua.

1.3. Luz y éter: El retorno al espacio absoluto


Hasta comienzos del siglo XIX todos los fenómenos físicos, incluidos los de
la óptica, admitían una explicación mecánica. Esto nos permite comprender,
en gran parte, por qué esta imágen mecánica del mundo se extendió hasta
finales del siglo XIX, tratando de explicar fenómenos tales como la propa-
gación de las ondas de luz, y todos aquellos fenómenos relacionados con la
teoría electromagnética de Maxwell. Un ejemplo, que ilustra muy bien esta
concepción, lo podemos encontrar en la siguiente cita debida a Lord Kelvin:
”No estaré contento hasta que pueda construir un modelo mecánico del ob-
jeto que estoy estudiando. Si lo puedo lograr significa que lo he entendido,
de lo contrario no.”.
En este parágrafo describiremos brevemente dos desarrollos de la física del
10 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

siglo XIX, el carácter ondulatorio de la luz descubierto por Young y Fresnel


y la electrodinámica de Maxwell, que constituyen, en mi opinión, el punto
de partida más directo para formular los principios y conceptos de la teoría
especial de la relatividad.
El sonido es la propagación de ondas longitudinales en un medio material,
en donde la velocidad de propagación está dada por la ecuación debida a
Newton: s
Y
= (1.9)

en donde Y es el módulo de elasticidad del medio y la densidad del medio.


Además, la velocidad del sonido es independiente de la fuente, pero de-
pende de la velocidad del medio en el cual se transmite. De manera similar,
se trabajaron modelos para explicar los fenómenos de la luz, como los desar-
rollados por Hook y Huygens, en donde la luz se consideraba como alguna
forma de onda longitudinal, que se propagaba a través del espacio. Newton
trabajó este modelo por algún tiempo, pero dada la imposibilidad de ex-
plicar la polarización de la luz, desarrolló el modelo corpuscular, capaz de
explicar este efecto y de dar cuenta de otras propiedades conocidas de la luz,
desplazando al modelo ondulatorio de Huygens.
La teoría corpuscular de la luz permaneció vigente hasta comienzos del
siglo XIX, cuando Young y Fresnel explicaron los nuevos fenómenos de in-
terferencia y difracción, con base en la teoría ondulatoria, relegando a la
teoría corpuscular Newtoniana, a un capítulo más de la historia de la físi-
ca. Sin embargo, de la misma manera que el sonido necesita de un medio
para propagarse, se vió la física avocada a postular un medio material para
la propagación de las ondas de luz. Este medio material, que optaron por
llamar éter, debería ser de naturaleza diferente a la materia conocida hasta
entonces. Es importante anotar, que el éter en la física no era una idea com-
pletamente original, pues ya había sido usado antes para ”explicar” muchos
otros fenómenos. Por ejemplo, Newton, sugiere que el éter puede estar aso-
ciado con la gravitación, con los fenómenos eléctricos y magnéticos, con la
propagación del calor etc.. A este respecto, Young aclara, que el éter a través
del cual se propaga la luz no necesariamente es el mismo que el éter eléctrico,
y por esta razón Young propone llamarlo éter lumínico.
Una vez aceptado que la luz es un fenómeno ondulatorio, comenzaron a
desarrollarse teorías y modelos mecánicos del éter, para explicar el mecanismo
de propagación de las ondas de luz en este medio. Young y Fresnel fueron
1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 11

los primeros en encontrar que las ondas de luz deben ser transversales, para
poder explicar el fenómeno de polarización. Este hecho exigía, entonces, un
esfuerzo teórico muy grande para comprender el mecanismo de transmisión de
ondas transversales en un medio elástico, dado que ésto requería que el medio
de transmisión, el éter, tuviera un coeficiente de rigidez muy grande, pues,
como lo demostró Poisson, ondas longitudinales y transversales se podían
propagar en un sólido, con
= ( )1 2 (1.10)
la velocidad de las ondas transversales y

k
= ([ + 4 3] )1 2
(1.11)
la velocidad de las ondas longitudinales, siendo el módulo de rigidez, el
módulo de elasticidad volumétrico y la densidad del sólido. Una dificultad,
de este modelo mecánico del éter, era la ausencia de componente longitudi-
nal de las ondas de luz, lo que llevó a Cauchy a sugerir, que el eter debía
tener una compresibilidad negativa, de tal manera que el factor + 4 3,
en la ecuación (1.11), se anulara. Estas teorías estaban basadas sobre las
propiedades conocidas de los medios elásticos, pero la combinación tan inusu-
al de las propiedades que debería tener el éter, condujeron a MacCullagh a
postular, que este medio era un nuevo tipo de sustancia elástica, diferente
a las conocidas y asociándole otras propiedades desarrolló una teoría más
sofisticada, con un sistema de ecuaciones, muy parecido a las ecuaciones de
Maxwell, que fue intensamente trabajado en la segunda mitad del siglo XIX.
A diferencia de las propiedades mecánicas del éter, anteriormente dis-
cutidas, para las cuales era difícil proponer experimentos directos que las
verificaran, el teorema de adición de velocidades de Galileo, que se cumple
también para las ondas en un medio mecánico, permitió proponer y realizar
toda una serie de experimentos para medir la velocidad de la luz, desde un
sistema de referencia móvil respecto al éter. La situación se plantea de la sigu-
iente forma: De la teoría de propagación de las ondas en un medio elástico,
sabemos que:
0
= (1.12)
en donde es la velocidad de propagación de las ondas, medida en sistema
de referencia inercial , el cual está en reposo con respecto al medio de
propagación (el éter para el caso de ondas de luz), 0 es la velocidad de las
ondas, medida por un observador en un sistema de referencia inercial 0 , que
se mueve con velocidad respecto a .
12 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

Figura 1.2: Aberración de la luz estelar

En 1728 Bradley descubrió el fenómeno de aberración de la luz, que con-


siste en el cambio aparente de posición de las estrellas en diferentes épocas
del año (Figura 1.2). Este efecto se explica fácilmente, si se supone que el
éter está en reposo respecto al sol, pues, dado que la tierra se mueve con
una velocidad aproximada de 30 en su órbita alrededor del sol y, por
lo tanto, si tomamos una estrella colocada perpendicularmente al plano de
translación de la tierra, el telescopio debe inclinarse un ángulo adicional dado
por sin , en donde es la velocidad orbital de la tierra, la velocidad de
la luz respecto al éter y mide la posición angular instántanea de la estrella
respecto a la tierra. Esta interpretación fue capaz de dar el valor correcto de
la aberración observada, a primer orden en .
Es de anotar, que los experimentos de aberración de la luz estelar no
eran capaces de dar el valor de la velocidad absoluta de la tierra respecto al
éter, sino solamente cambios de la velocidad relativa de la tierra respecto al
éter. Arago en 1810 propuso una modificación al experimento de aberración,
que sí permitiría medir la velocidad absoluta de la tierra respecto al éter,
pues de acuerdo con la teoría clásica, si la luz atravesaba un medio refractivo
(como el agua o un vidrio), el cual estuviera moviéndose respecto al éter,
entonces la velocidad de la luz respecto a este medio variaba, dependiendo
1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 13

de la dirección relativa de movimiento del medio y el éter, es decir, el índice de


refración del medio dependería de la dirección relativa de movimiento. Arago
colocó un prisma en el telescopio y observó diferentes estrellas, esperando
encontrar variaciones del ángulo de aberración. El resultado negativo de su
experimento, condujo a Fresnel a proponer la teoría del arrastre parcial del
éter por los medios materiales en movimiento y mostró que este arrastre
parcial del éter hacía inobservable el efecto del viento de éter en medios
materiales, en órdenes de magnitud de .
Basados sobre este mismo principio, se realizaron toda una serie de exper-
imentos como los de Hoek, de Mascart y Jamin, Airy, Fizeau, etc, obtenién-
dose también resultados negativos. Sin embargo, no se podía estar seguro
que las condiciones experimentales fueran lo suficientemente adecuadas para
medir los pequeños efectos que se estaban buscando. Además se agregaba la
dificultad que al utilizar luz blanca, el índice de refración de la luz en un
medio dependía de la frecuencia y por tanto cada color (frecuencia) sufría un
arrastre diferente.
Los problemas de la teoría del éter no se centraban únicamente en la
determinación de la velocidad absoluta de la tierra respecto al éter, sino
también tenían que dar cuenta de los demás efectos conocidos, tales como
las leyes de reflexión, refracción, polarización, cristales ópticos, etc, lo cual
conducía a complicar cada vez más el modelo mecánico del éter.
Un elemento adicional que se sumaba a esta historia del éter, lo cons-
tituye el desarrollo de las teorías de la electricidad y el magnetismo, que
culminan hacia mediados del siglo XIX con las ecuaciones de Maxwell y con
el descubrimiento, tal vez el más importante de ese siglo, que la luz son ondas
electromagnéticas. A partir de este momento el éter se asoció como el medio
de propagación de los campos eléctricos y magnéticos. Pero un punto más
importante para nuestra discusión de los orígenes de la teoría especial de
la relatividad, lo constituye el hecho de que las leyes del electromagnetismo
de Maxwell no satisfacen el principio de relatividad de Galileo. Lo que resta
de esta sección lo dedicaremos a explicar el significado de este hecho y sus
implicaciones.
Que las leyes del electromagnetismo de Maxwell no satisfacen el prin-
cipio de relatividad de Galileo significa que las ecuaciones de Maxwell no
permanecen invariantes, cuando se realiza una transformación de Galileo en-
tre dos sistemas de referencia inerciales, o en otros términos equivalentes, si
suponemos que las ecuaciones de Maxwell son válidas en un sistema de ref-
erencia inercial , entonces ellas cambiarán para cualquier otro observador
14 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

Figura 1.3: Experimento de Truton-Noble

inercial 0 , que se mueva con respecto a . Este cambio se refleja en que a


las ecuaciones de Maxwell le aparecen nuevos términos, que van a depender
de la velocidad relativa de los sistemas. Estos nuevos términos dependientes
de la velocidad en las leyes de la electrodinámica deben producir efectos ob-
servables y por tanto, deben permitir determinar la velocidad del sistema de
referencia 0 del observador, respecto al único sistema de referencia inercial
para el cual las ecuaciones de Maxwell toman su forma más simple.
Esta situación de las leyes del electromagnetismo rescataba entonces el
concepto de espacio absoluto, identificado a su vez con el sistema de reposo
del éter, pero ahora y a diferencia del caso de la mecánica de Newton, dándole
un significado físico: Las leyes de la electrodinámica son válidas solamente
en el sistema de referencia en reposo con respecto al espacio absoluto.
Para ilustrar esta situación, consideremos dos cargas + y , unidas
por una varilla rígida aislante (Figura 1.3). Si este sistema está en reposo
respecto al espacio absoluto , la única fuerza entre las cargas es la eléctrica,
dada por la ley de Coulomb. Pero si estas cargas se encuentran en reposo en
otro sistema de referencia inercial 0 que se mueva respecto a una veloci-
dad , entonces aparecerá un campo magnético y así, una fuerza, adicional
a la fuerza eléctrica, debida al movimiento de las cargas, que producirá, por
1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 15

lo tanto, un par de fuerzas que tenderá a hacer girar el sistema. Este ex-
perimento, con resultado negativo, fue llevado a cabo por Trouton y Noble,
2
esperando encontrar una fuerza magnética que dependía de la relación 2 ,
siendo la velocidad de la tierra. Es de anotar, que el diseño experimental
utilizado para realizar este experimento, permitía medir cantidades del orden
de magnitud de 2 2 10 8 .

1.3.1. Un experimento crucial


El experimento más notable, y de referencia obligada en todo tratado
de relatividad, lo constituye el realizado por Michelson y Morley en 1887.
Es interesante notar, que Einstein no hace referencia alguna a este experi-
mento en sus primeros artículos, en donde desarrolla la teoría especial de
la relatividad y de hecho, varios historiadores de la ciencia afirman que ni
siquiera lo conocía. La importancia histórica de este experimento y su obliga-
toria referencia, la podemos entender por dos aspectos: primero, el diseño del
experimento permitía medir, con una precisión suficiente (corrimientos del
patrón de interferencia menores a 1/100 de franja), evitando así el problema
que se presentaba en todos los otros experimentos realizados hasta entonces,
en cuanto a que el orden de magnitud de los efectos esperados, eran siempre
menores o del mismo orden que el error experimental, dejando siempre un
velo de duda sobre los resultados obtenidos. Segundo, el resultado negativo
del experimento de Michelson y Morley generó toda una serie de trabajos
teóricos, que impulsaron el desarrollo de la física y abrieron el camino para
la formulación de la teoría de la relatividad.
Tal vez, el más importante de estos trabajos fue el realizado por Lorentz,
que culminó con su libro sobre la teoría del electrón publicado en 1905.
Es interesante, más no sorprendente, anotar como, en este libro, se encuen-
tran todas las ecuaciones que describen los fenómenos más significativos que
predice la relatividad, como por ejemplo, las transformaciones entre sistemas
de referencia inerciales (llamadas hoy transformaciones de Lorentz), las ecua-
ciones de contracción de longitudes y dilatación del tiempo, la equivalencia
masa-energía, la variación de la masa inercial con la velocidad, etc, solamente
que su interpretación, en términos de las propiedades del éter, era incorrecta,
en cuanto a que, estos efectos esperados, siempre se compensaban con otros
debidos al éter, de tal manera que ninguno de ellos resultaba ser observable.
Este trabajo teórico de Lorentz resolvía, así, la aparente inconsistencia entre
los dos grandes pilares de la física conocidos hasta entoces, la mecánica de
16 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

Newton y la electrodinámica de Maxwell, pero dejaba el problema funda-


mental sin resolver: el espacio absoluto y la indetectabilidad del éter.
Anotábamos en el parágrafo anterior, que no es una sorpresa que el tra-
bajo de Lorentz contenga todas las ecuaciones relativistas, pues está basado
sobre la electrodinámica de Maxwell, que como veremos en un capítulo poste-
rior, es una teoría relativista. Igualmente, esta anotación nos permite también
entender, por qué no era necesario que Einstein conociera el experimento de
Michelson y Morley para desarrollar la teoría de la relatividad. En efecto, bas-
ta con recordar el título del primer artículo publicado por Einstein sobre el
tema:“Zur Elektrodinamik der bewegten Körper” (Sobre la electrodinámica
de los cuerpos en movimiento).
El experimento de Michelson-Morley fue realizado en 1887, utilizando
como principio físico el fenómeno de interferencia de la luz. El diseño experi-
mental es bosquejado en la (Figura 1.4). De la fuente S sale un haz de luz que
incide sobre un espejo semitransparente A, el cual divide al haz en dos rayos
mutuamente perpendiculares, los cuales se reflejan en los espejos planos B
y C, retornando al espejo A, en donde, el rayo proveniente del espejo C es
desviado hacia el objetivo O, mientras que el rayo reflejado en B atraviesa
el espejo A y llega al objetivo O, donde se observan franjas de interferencia,
las cuales dependen de la diferencia de caminos ópticos entre los dos rayos
de luz.

Supongamos, sin pérdida de generalidad y para simplicar el análisis, que


los caminos AB y AC de los dos haces de luz son iguales. Sea la velocidad
de la tierra respecto al éter y paralela al brazo AC del interferómetro. Así, la
velocidad del viento del éter respecto al interferómetro, fijo a la tierra, está en
la dirección de CA (ver Figura 1.4), suponiendo que no hay arrastre parcial
del éter. De acuerdo con las teorías del éter, la velocidad de la luz relativa
al laboratorio es , cuando va de A hacia C y + cuando regresa de
2 12
C hacia A, mientras que la velocidad del otro rayo de luz es ( 2 ) en la
dirección de A hacia B y de B hacia A.
Entonces, si la longitud de cada uno de los brazos del interferómetro es
L, la diferencia de tiempos de llegada de los dos rayos está dada por:

2 2
= = 2 2 2 2

2 1 1
= ( 2 2
p ) (1.13)
1 1 2 2
1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 17

Figura 1.4: Experimento de Michelson y Morley

Utilizando la expansión en serie


1 2
(1 + ) = 1 + + ( 1) +··· (1.14)
2!
la cual es convergente para | | 1, se desarrolla cada fracción hasta términos
del orden de 2 2 , obteniendo:
2
' 2
(1.15)

Si rotamos el interferómetro 90 , el tiempo para recorrer el camino ABA


será ahora mayor que el tiempo para el camino ACA, y la diferencia de
tiempos estará dada por
2
' 2
(1.16)

Por lo tanto, el cambio total en la diferencia de tiempos al rotar el inter-


ferómetro es igual a
2
2 2
(1.17)
18 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO

Si es la longitud de onda de la luz utilizada, entonces la rotación del


interferómetro da lugar a un corrimiento de franjas, dado por:
2
2
= 2
(1.18)

Michelson y Morley utilizaron en su experimento luz de longitud de onda


de 5 9 × 10 7 y un camino de = 11 , logrado por múltiples reflexiones.
Tomando para la velocidad de la tierra alrededor del sol 30 , se esperaba
un corrimiento de aproximadamente 0 37 franjas, el cual, como ya se ha dicho
no fue observado.
Capítulo 2

Fundamentos de la relatividad
especial

En este capítulo formularemos los postulados fundamentales sobre los


cuales está basada la teoría especial de la relatividad y obtendremos las
ecuaciones de transformación entre sistemas de referencia inerciales (trans-
formaciones de Lorentz). Concluiremos el capítulo estudiando las propiedades
de las transformaciones de Lorentz y sus consecuencias sobre la medida de
intervalos temporales y espaciales.

2.1. Postulados de la relatividad especial


Como fue anotado en el capítulo anterior, la teoría desarrollada por
Lorentz solucionaba la aparente inconsistencia de la mecánica Newtoniana y
la electrodinámica de Maxwell, manteniendo inmodificados los principios y
postulados físicos sobre los cuales se basaban estas teorias. La aproximación
de Einstein a este problema es diferente, pues está basada sobre dos postula-
dos de carácter fundamental, en el sentido de que estos postulados deben ser
satisfechos por cualquier teoría física que se proponga, independientemente
de las leyes y principios que se postulen para describir esta teoría.
Postulado 1: Las leyes físicas son independientes del sistema de refe-
rencia inercial, con respecto al cual se midan las variables que describen al
sistema físico considerado.
Postulado 2: La velocidad de la luz en el vacío es la misma para todos
los observadores inerciales, independiente de la dirección de propagación y

19
20 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

de la velocidad de la fuente emisora.


El primer postulado propuesto por Einstein es conocido también como
el Principio de Relatividad, el cual generaliza el principio de relatividad
Galileano a todas las leyes de la física. El costo de aceptar este postula-
do es el de abandonar las transformaciones de Galileo, que relacionan las
coordenadas de los eventos medidas por diferentes observadores inerciales y
de paso, se hace necesario revisar las leyes de la mecánica Newtoniana. Pues,
como vimos en la parte final del capítulo anterior, las ecuaciones de Maxwell
no eran invariantes bajo transformaciones de Galileo, indicando que las leyes
del electromagnetismo no obedecían el principio de relatividad de Galileo.
Sin embargo, los experimentos realizados para demostrar este hecho da-
ban todos resultados negativos y no es aventurado pensar que fue esta situación
la que llevó a Einstein a postular, que las leyes de la electrodinámica sí sat-
isfacían el principio de relatividad, pero entonces ésto exigía abandonar las
ecuaciones de transformación de Galileo, como la forma correcta de expresar
las transformaciones entre sistemas de referencia inerciales. Esto implicaba
también que deberían ser modificadas las leyes de la mecánica de Newton,
las cuales sí permanecen invariantes bajo transformaciones de Galileo.
El segundo postulado de la Teoría de la Relatividad establece que la
velocidad de la luz en el vacío es constante, independiente del sistema de
referencia inercial desde el cual ésta sea medida. Cómo llegó Einstein a este
resultado, es un problema que ha sido objeto permanente de debate en la
historia de la ciencia. Ninguno de los experimentos realizados en el siglo XIX
se puede considerar como evidencia directa de la constancia de la velocidad
de la luz en el vacío. Es claro a la luz de este postulado, el resultado negativo
del experimento de Michelson y Morley y podría pensarse, como lo afirma
Grünbaum, que Einstein incorpora este resultado nulo como un axióma, a
través del principio de la constancia de la velocidad de la luz. Aun cuando
en una entrevista realizada por Shankland a Einstein en 1950, le afirma que
él no estaba familiarizado con el experimento de Michelson y Morley cuando
escribió su artículo en 1905, Shankland hace notar que en este artículo Ein-
stein hace referencia a ”intentos fallidos para detectar cualquier movimiento
de la tierra respecto al éter lumínico”, lo que indica según Shankland, que
Einstein tenía referencia de los diferentes experimentos ópticos realizados,
pero no de los detalles própios de cada experimento.
Una aproximación alternativa para buscar los orígenes de este segun-
do postulado, la podemos encontrar en la teoría de la electrodinámica de
Maxwell, pues si aceptamos su validez y el principio de relatividad, podemos
2.1. POSTULADOS DE LA RELATIVIDAD ESPECIAL 21

encontrar el principio de la constancia de la velocidad de la luz, así como


también el postulado de la constancia de la carga eléctrica, el cual juega un
papel igualmente importante en física.
Las ecuaciones de Maxwell, en el sistema M.K.S. racionalizado, para un
observador inercial toman la forma

· = 0 (2.1)

· =0 (2.2)

× = 0 + 0 0 (2.3)

× = (2.4)

con 0 = 4 × 10 7 ( )2 la permeabilidad magnética del vacío y 0 =


8 854 × 10 12 2
· 2 la constante dieléctrica del vacío.
La primera ecuación de Maxwell corresponde a la ley de Gauss y establece
que las cargas son fuente del campo eléctrico, siendo la densidad de carga.
La segunda ecuación afirma que no existen cargas magnéticas aisladas. El
primer término de la tercera ecuación corresponde a la ley de Ampère y
significa que las corrientes eléctricas son fuente del campo magnético, con
la densidad de corriente, mientras que el último término, conocido como
corriente de desplazamiento de Maxwell, establece que variaciones temporales
del campo eléctrico son también fuente del campo magnético. La última
ecuación es la ley de inducción de Faraday, en la cual variaciones temporales
del campo magnético producen campos eléctricos.
Las ecuaciones de campo de Maxwell se completan con una ecuación de
movimiento, la cual establece que la fuerza sobre una partícula de carga en
presencia de un campo electromagnético está dada por :

= + × (2.5)

conocida como la fuerza de Lorentz.


Si tomamos la divergencia de la tercera ecuación de Maxwell, haciendo
uso de la ley de Gauss (primera ecuación) y del hecho que la divergencia
del rotacional siempre es cero, obtenemos la ecuación de continuidad para la
carga eléctrica
+ · =0 (2.6)
22 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Integrando en todo el espacio y aplicando el teorema de Gauss, se llega


al principio de conservación de la carga:
Z
= =0 (2.7)

Este resultado es independiente del estado de movimienento de la carga


y existe muchísima evidencia experimental que lo corrobora. Por ejemplo,
si la carga dependiera de la velocidad, el átomo de hidrógeno podría no ser
eléctricamente neutro, ya que en promedio, la velocidad del electrón en el
átomo es mayor que la velocidad del protón.
Considerando otro sistema de referencia inercial 0 y asumiendo el prin-
cipio de relatividad, las ecuaciones de Maxwell en este nuevo sistema están
dadas por:
0
· 0= 0 0 (2.8)
0 0
· =0 (2.9)
0
0 0 0
× = 0 + 0 0 0
(2.10)
0
0 0
× = 0
(2.11)
en donde las cantidades primadas se refieren a sus valores medidos por el
observador 0 . Siguiendo los mismos pasos anteriores, obtenemos la ecuación
de continuidad en el sistema de referencia 0
0
0 0
0
+ · =0 (2.12)

y el principio de la invarianza de la carga, que para el caso de una partícula


elemental su valor invariante corresponde al valor medido de la carga, cuando
ésta se encuentra en reposo respecto al sistema de referencia inercial 0 .
Una suposición fundamental que está implícita en el principio de relativi-
dad, es que parámetros tales como la carga , la masa, etc., de una partícula
fundamental, cuando son medidos respecto a un sistema de referencia para
el cual la partícula está en reposo, toman el mismo valor numérico cuando se
miden con respecto a otro sistema de referencia inercial 0 cuando la partícu-
la se encuentra en reposo relativo respecto a este sistema 0 . Si aceptamos
esta suposición, entonces el principio de la constacia de la carga eléctrica, se
obtiene de las ecuaciones de Maxwell y del principio de relatividad.
2.1. POSTULADOS DE LA RELATIVIDAD ESPECIAL 23

Consideremos, ahora, las ecuaciones de Maxwell en el vacío ( = 0, =


0), en un sistema de referencia inercial y tomemos el rotacional de la última
ecuación de Maxwell (la ley de inducción de Faraday), entonces, teniendo en
cuenta la identidad vectorial
2
× × = ( · ) (2.13)

y la primera ecuación de Maxwell en el vacío · = 0, obtenemos


2
2
0 0 2
=0 (2.14)

Esta relación corresponde a la ecuación de ondas electromagnéticas (con


una ecuación similar para el vector campo magnético), y describe la radiación
electromagnética producida por algún sistema de cargas aceleradas, y cuya
velocidad de propagación en el vacío, viene dada por:

=1 0 0 (2.15)

siendo esta velocidad de propagación, independiente de la velocidad de la


fuente (sistema de cargas aceleradas). Si ahora asumimos de nuevo la validez
del principio de relatividad y consideramos otro sistema de referencia inercial
0
, obtenemos, siguiendo un razonamiento similar, la ecuación de ondas en
el sistema de referencia 0 :
2 0
02 0 0 0
0 0 02
=0 (2.16)

Esta ecuación describe la propagación de las ondas electromanéticas con


una velocidad ( 00 00 ) 1 2 en el vacío, la cual, como para el caso del sistema de
referencia , es también independiente del movimiento de las cargas fuente.
Si definimos el amperio a través de la ley de Biot-Savart, como la corriente
que circula por dos hilos paralelos infinitos, separados por una distancia de
un metro en el vacío, para que sobre cada hilo se experimente una fuerza
por unidad de longitud de 2 × 10 7 , entonces el valor de la constante
permeabilidad magnética del vacío es:
0 7
0 = 0 = 4 × 10 (2.17)

Por otra parte, si suponemos que la ley de Coulomb es válida en los dos
sistemas de referencia inerciales y 0 , y que la fuerza de Coulomb, entre dos
24 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

partículas iguales en reposo relativo, por ejemplo dos electrones o protones,


es la misma en ambos sistemas de referencia inerciales, entonces 00 = 0 y
por lo tanto la velocidad de la luz es independiente del sistema de referencia
inercial desde el cual ésta sea medida e independiente del movimiento de las
fuentes.
Si aceptamos ahora, que el postulado de la constancia de la velocidad de
la luz es válido, y las ecuaciones de Maxwell son correctas, entonces 00 = 0
y también 00 = 0 .
Del postulado de relatividad también se deduce un principio general, el
cual implica que las unidades fundamentales de longitud, tiempo, masa y
carga eléctrica deben ser definidas en la misma forma en todos los sistemas
de referencia inerciales (salvo a lo más un factor de escala), así como también
las constantes fundamentales de la física: la constante de Planck = 6 626 ×
10 34 · , la constante de gravitación universal de Newton = 6 670 ×
11 2 2
10 · · y la velocidad de la luz en el vacío = 2 998 ×108 · 1 .
Como fue originalmente propuesto por Planck, estas constantes funda-
mentales y ~ = 2 , pueden ser conbinadas para dar las unidades
fundamentales de longitud, tiempo y masa:
3 1 2 35
:= ( ~ ) = 1 616 × 10 (2.18)
5 1 2 44
:= ( ~ ) = 5 39 × 10 (2.19)
:= (~ )1 2
= 2 18 × 10 8
(2.20)
llamadas longitud, tiempo y masa de Planck respectivamente. Actualmente
es práctica usual en la física trabajar con unidades de = ~ = = 1, las
cuales son llamadas unidades fundamentales o naturales.

2.2. Transformaciones de Lorentz


De lo discutido en la sección anterior, las leyes de la electrodinámica son
físicamente compatibles con el principio de la constancia de la velocidad de
la luz, pero a diferencia de las leyes de Newton, las ecuaciones de Maxwell no
permanecen invariantes bajo las transformaciones de Gelileo. Esta situación
nos conduce al problema de encontrar un conjunto de transformaciones de co-
ordenadas compatibles con los postulados de la relatividad especial. Lorentz
a finales del sigloXIX, encontró las transformaciones de coordenadas que de-
jaban invariante a las ecuaciones de Maxwell, pero en ningún momento las
2.2. TRANSFORMACIONES DE LORENTZ 25

consideró como las ecuaciones de transformación entre sistemas de referen-


cia inerciales, pues ellas claramente, no eran compatibles con las leyes de la
mecánica Newtoniana. Estas transformaciones se conocen hoy día como las
transformaciones de Lorentz.
En esta sección mostraremos, que las transformaciones de Lorentz, con-
stituyen el conjunto de ecuaciones de transformación de coordenadas entre
sistemas de referencia inerciales. Estas ecuaciones de transformación serán
deducidas a partir de los postulados fundamentales de la relatividad espe-
cial, junto con algunas suposiciones generales sobre homogeneidad e isotropía
del espacio y del tiempo.
Antes de abordar el problema de obtener las ecuaciones de transformación
de coordenadas, es importante aclarar algunos conceptos sobre la forma como
se definen y miden las coordenadas del espacio y del tiempo y sobre los
postulados de homogeneidad e isotropía.
Al igual que en la mecánica Newtoniana, asumiremos que el espacio físico
es homogéneo e isotrópico, lo cual implica que todos los puntos y todas las di-
recciones espaciales son equivalentes para describir los fenómenos físicos. Esto
significa, en términos más precisos, que las leyes fundamentales de la física
no deben depender de la posición y de la dirección espacial, lo cual también
se traduce en la arbitrariedad para elegir el origen y la dirección de los ejes
espaciales. Adicionalmente se postula que el espacio físico es tridimensional
y obedece los postulados de la geometría euclideana.
La homogeneidad e isotropía del tiempo, significan que las leyes de la física
no deben depender de un instante particular ni de la dirección del tiempo
elegida, es decir, la elección del origen y la escala para medir el tiempo es
arbitraria (homogeneidad) y que las leyes de la física son invariantes bajo
una transformación de la forma (isotropía). Estas propiedades del
espacio y el tiempo deben quedar reflejadas en el sistema de coordenadas
espacio-temporales elegido, así como la forma en que se miden las distancias
espaciales y el intervalo temporal entre eventos físicos.
Un evento es un fenómeno físico independiente del observador (tal como
la colisión entre dos partículas, o la emisión de un fotón por un átomo), el
cual ocurre en un punto del espacio y en un instante de tiempo y puede ser
medido por instrumentos físicos adecuados.
Adicional a los postulados anteriores sobre la estructura del espacio y el
tiempo, suponemos que se puede definir una escala de medida de longitudes,
igual para todos los observadores inerciales, la cual nos permite medir inter-
valos espaciales utilizando un sistema de reglas rígidas. Este procedimiento
26 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

define una métrica para el espacio, que cumple con las propiedades de homo-
geneidad e isotropía y que obedece la geometría euclideana.
El sistema de coordenadas cartesianas espaciales R3 con la métrica usual,
esto es la métrica euclideana

R3 | |2 = 2
1 + 2
2 + 2
3 (2.21)

nos ofrece el modelo matemático natural para describir el espacio físico.


Uno de los aspectos cruciales de la teoría de la relatividad lo constituye el
problema de la medida del tiempo. En efecto, Einstein en su primer artículo,
dedica una buena parte de él a definir la forma como se miden los intervalos
temporales entre eventos físicos. Definida ya la estructura métrica del espacio
y el proceso de medida de intervalos espaciales, podemos utilizar el postulado
de la constancia de la velocidad de la luz para definir el concepto de tiempo
físico, es decir, el método operacional para la medida del tiempo que esté
de acuerdo con los postulados fundamentales de la física y que refleje las
propiedades de homogeneidad e isotropía del tiempo.
En primer lugar se asume, que si dos eventos físicos ocurren en el mismo
punto del espacio y simultáneamente (en el mismo instante de tiempo) para
un observador inercial, entonces estos dos eventos físicos serán simultáneos
para todos los observadores inerciales y ocurrirán también en el mismo pun-
to del espacio. En otras palabras, la simultáneidad de eventos en un mismo
punto del espacio es un hecho físico absoluto, i.e., independiente del obser-
vador. Supongamos además, que se dispone de un conjunto de relojes ideales
e idénticos, es decir, algún dispositivo o fenómeno físico reproducible, que nos
permita determinar una escala de tiempo y situemos uno de estos relojes en
el origen de coordenadas espaciales escogido por un observador inercial. De
acuerdo con la suposición sobre el caracter absoluto de la simultáneidad para
eventos que tienen lugar en el mismo punto del espacio, el observador deter-
minará un tiempo, el marcado por el reloj situado en su origen, para cada
evento que ocurra en el origen de coordenadas. Este tiempo marcado por el
reloj supone haber elegido un instante inicial, = 0, el cual es arbitrario, de
acuerdo con la hipótesis de homogeneidad del tiempo. Ahora, coloquemos en
cada punto del espacio y en reposo relativo al reloj del origen, uno de estos
relojes idénticos y determinemos que el instante de tiempo en que un evento
físico sucede, es el marcado por el reloj situado en el punto del espacio donde
el evento tiene lugar.
2.2. TRANSFORMACIONES DE LORENTZ 27

Figura 2.1: Sincronización de relojes

Hasta este momento se ha definido la medida del tiempo local y falta


entonces “sincronizar” todos los relojes del observador inercial, para que este
observador asigne un único tiempo y así, una única coordenada temporal a
cada evento físico, independiente de la posición espacial en la cual suceda
dicho evento. Para sincronizar los relojes seguiremos el método expuesto por
Einstein en su primer artículo.
Para el reloj situado en el origen de coordenadas, elijamos un instante
cualquiera como el tiempo = 0. Consideremos un segundo reloj situado a
una distancia del origen y enviemos, desde el origen y en la dirección de este
segundo reloj, un rayo de luz en en el instante en que el reloj del origen marca
1 (Figura 2.1). Este segundo reloj marcará un tiempo 2 cuando el rayo de
luz lo alcanza, y se define entonces que los dos relojes están sincronizados, si
se cumple que

2 = 1 + (2.22)

Con estas definiciones de medida de la distancia y del intervalo temporal,


un observador inercial construye su sistema de coordenadas espacio-temporal.
Este procedimiento es consistente y válido para todos los observadores iner-
ciales, puesto que la distancia para puntos en reposo relativo está bien
28 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

definida y es por su definición independiente del observador, así como la ve-


locidad de la luz en el vacío es una constante universal, de acuerdo con el
segundo postulado.
La coordenada temporal para un evento, se le define entonces, como la
lectura del reloj que está situado en el punto del espacio donde el evento
ocurre y de acuerdo con la hipótesis del caracter absoluto de la simultáneidad,
para eventos que suceden en el mismo punto del espacio, este procedimiento
es independiente del observador.
Habiendo definido la forma como un observador inercial construye su
sistema de coordenadas espacio-temporales, abordemos ahora, el problema
de encontrar las ecuaciones que relacionan las coordenadas de un evento,
asignadas por dos observadores inerciales.
Sea p un evento físico, y séan ( ) y ( 0 0 0 0 ) las coordenadas del
evento, medidas por los dos observadores inerciales y 0 . De acuerdo con la
homogéneidad e isotropía del espacio y el tiempo, supongamos sin pérdida de
generalidad, que los dos observadores eligen los ejes coordenados espaciales
paralelos, con la velocidad del sistema 0 respecto a , en la dirección
0
positiva de los ejes , y además, define cada observador el origen de la
coordenada temporal = 0 = 0, en el instante en que los orígenes espaciales
de los sistemas coinciden (Figura 2.2).
El conjunto de transformaciones de coordenadas, que estamos buscando,
lo podemos escribir en la forma general como:
0
= 1( ) (2.23)

0
= 2( ) (2.24)
0
= 3( ) (2.25)
0
= 4( ) (2.26)
con la condición que las funciones séan invertibles, es decir, que se puedan
despejar las coordenadas ( ) en función de las coordenadas primadas
0 0 0 0
( ).

Otra condición general sobre las funciones la impone la primera ley de


Newton la cual implica que una partícula libre debe moverse con velocidad
constante para todos los observadores inerciales. Esta exigencia implica que
las ecuaciones de transformación deben ser lineales en las coordenadas. Así,
2.2. TRANSFORMACIONES DE LORENTZ 29

Figura 2.2: Transformaciones de Lorentz

el sistema de ecuaciones de transformación (2.23), (2.24), (2.25) y (2.26) lo


podemos escribir como:
0
= 00 + 01 + 02 + 03 (2.27)
0
= 10 + 11 + 12 + 13 (2.28)
0
= 20 + 21 + 22 + 23 (2.29)
0
= 30 + 31 + 32 + 33 (2.30)
en donde los coeficientes son constantes independientes de las coorde-
nadas. Estos coeficientes son funciones, a lo sumo, de la velocidad del sis-
tema de referencia 0 respecto a , pues se supone que todos los observadores
eligen las mismas escalas para medir distancias y tiempos. La linealidad im-
plica también que los ejes espaciales de 0 permanecen siempre paralelos a si
mismos y así a los ejes espaciales de . Además, la velocidad del sistema
respecto a 0 es igual a (igual en magnitud y opuesta a la velocidad de 0
respecto a ) y por lo tanto la transformación inversa debe tener la misma
forma cambiando por . Para el caso cuando = 0, la transformación se
reduce a la identidad.
30 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

La condición de existencia de la transformación inversa, por otra parte,


queda garantizada exigiendo que el determinante de los coeficientes sea
diferente de cero.
De la escogencia de los ejes espaciales se obtiene que los planos = 0
y 0 = 0 coinciden permanentemente (todos los ejes espaciales de los dos
sistemas de referencia permanecen paralelos) y por lo tanto la ecuación de
transformación para la coordenada 0 debe reducirse a:
0
= 22 (2.31)
Si invertimos las direcciones de los ejes y de no se debe afectar la
relación anterior, y por lo tanto la transformación inversa de 0 a , para la
coordenada , toma la forma
0 0 0
= 22 = 22 (2.32)
Esto implica, por lo tanto que se debe cumplir que 22 = ±1. Por otra
parte, dado que para 0 se cumple que 0 , entonces

22 =1 (2.33)
Un argumento similar vale para la coordenada , entonces
0 0
= ; = (2.34)
Puesto que la transformación de coordenadas es lineal y las coordenadas
del origen del sistema de referencia 0 , medidas por el observador , están
dadas por = , entonces 0 debe ser de la forma
0
= ( ) (2.35)
donde es un parámetro que, en general, depende de la velocidad. Por
simetría, la transformación inversa para la coordenada tendrá la misma
forma (con cambiada por ), entonces
0 0 0
= ( + ) (2.36)
siendo 0 otra constante dependiente de . Si invertimos las direcciones de
los ejex y en y 0 , entonces las relaciones (2.35) y (2.36) se siguen
cumpliendo, es decir si cambiando y 0 0
tenemos que
0
= ( ) =
0
= ( + ) (2.37)
2.2. TRANSFORMACIONES DE LORENTZ 31

y
0 0 0
= ( + ) =
0 0 0
= ( ) (2.38)
de donde se obtiene que = 0 , pues, del principio de relatividad la física
no debe depender de la dirección elegida para los ejes espaciales. Además, el
parámetro debe ser positivo dado que para = 0, 0 0 si 0.
Para encontrar una expresión explícita para y la forma como la coor-
denada temporal se transforma, apliquemos ahora el segundo postulado de
la constancia de la velocidad de la luz en el vacío.
Supongamos que en el instante = 0 = 0 , cuando los orígenes coinciden,
se emite un pulso de luz en la dirección del eje positivo, entonces se debe
satisfacer que al cabo de un tiempo , medido en , el pulso de luz esté en
un punto del espacio cuya coordenada , medida en , cumpla la ecuación
= (2.39)
De acuerdo con el postulado de la constancia de la velocidad de la luz en
el vacío, para el observador 0 se debe cumplir que el pulso de luz llega
al punto del espacio de coordenada 0 , en un instante 0 , tal que 0 = 0 .
Substituyendo estas dos relaciones, = y 0 = 0 , en las ecuaciones (2.35)
y (2.36), multiplicando las ecuaciones resultantes y eliminando el término 0 ,
obtenemos
1
= ( )= p (2.40)
1 2 2

conocido como el factor gamma de Lorentz. A partir de esta expresión y


eliminando la coordenada 0 entre las ecuaciones (2.35) y (2.36), obtenemos
la ecuación de transformación para la coordenada temporal:
0 2
= ( ) (2.41)
Resumiendo, el conjunto de transformaciones de coordenadas, llamadas
transformaciones de Lorentz (TL), que relacionan las coordenadas espacio-
temporales de un evento físico medidas por dos observadores inerciales, están
dadas por:
0 2
= ( )
0
= ( )
0 (2.42)
=
0
=
32 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Así, el principio de relatividad exige que las leyes de la física deben ser
tales que ellas permanezcan invariantes bajo las tranformaciones de Lorentz
(ecuaciones (2.42)) pues, como veremos en la siguiente sección donde se dis-
cutirán algunas propiedades de las TL, éllas contienen implícitamente al pos-
tulado de la constancia de la velocidad de la luz.
Para encontrar las transfomaciones de Lorentz inversas, es decir, las trans-
formaciones de coordenadas para pasar del sistema 0 al sistema , basta
con invertir las ecuaciones (2.42), o en forma equivalente, cambiando por
en las TL (2.42) y las coordenadas primadas por las no primadas (por la
simetría entre los sistemas y 0 ):

= ( 0+ 0 2
)
= ( 0+ 0
)
(2.43)
= 0
= 0

2.3. Propiedades de las TL


Las ecuaciones de transformación de Lorentz encontradas en la sección
anterior, corresponden a un caso particular de un conjunto de transforma-
ciones más general, que constituyen la expresión matemática del principio de
relatividad y de las propiedades de homogeneidad e isotropía del espacio y
el tiempo. En efecto, el conjunto de transformaciones de coordenadas más
general se puede escribir en la forma:

X
3
0
= + ; =0 1 2 3 (2.44)
=0

con y constantes independientes de las coordenadas. Para simplificar


las expresiones hemos introducido la notación
0 1 2 3
; ; ; (2.45)

de tal manera que la coordenada temporal la medimos en unidades de longi-


tud, dado el carácter de constante universal de la velocidad de la luz . Esta
redefinición de la coordenada temporal nos permite, como veremos más ade-
lante, escribir las transformaciones de Lorentz en una forma más simétrica y
resaltar en forma explícita el papel de la coordenada temporal en la teoría
2.3. PROPIEDADES DE LAS TL 33

de la relatividad. En lo sucesivo utilizaremos índices griegos, que recorren de


0 a 3, para describir las coordenadas de un evento y dejaremos los índices
latinos para describir solamente las coordenadas espaciales.
Las ecuaciones de transformación (2.44) constituyen un conjunto de trans-
formaciones lineales no homogéneas, en donde las cuatro constantes corres-
ponden a la arbitrariedad para elegir el origen de las coordenadas espaciales
( = 1 2 3) y de la coordenada temporal ( = 0) y así representan la homo-
geneidad del espacio-tiempo. Esta propiedad de homogeneidad del espacio y
el tiempo, en términos más formales, se traduce en el principio de invarianza
de la física bajo translaciones espaciales ( ; = 1 2 3)

´= + (2.46)

y translaciones temporales ( 0 )
0
´0 = 0
+ 0
(2.47)

De sta forma, la invarianza de las leyes de la física bajo translaciones


espacio-temporales, nos permiten elegir las coordenadas de los dos sistemas de
referencia inerciales de tal manera que coincidan sus orígenes espaciales para
= 0 = 0, haciendo que el término inhomogéneo del sistema de ecuaciones
(2.44) se anula y en este caso las ecuaciones de transformación se reducen al
sistema lineal homogéneo

X
3
0
= ; =0 1 2 3 (2.48)
=0

Este conjunto de transformaciones, contiene dos casos especiales: Por una


parte están las rotaciones de los ejes espaciales, las cuales reflejan la isotropía
del espacio, es decir, que la leyes físicas no deben depender de la orientación
de los ejes espaciales. Una rotación de los ejes espaciales queda determinada
por tres parámetros, por ejemplo, los tres ángulos de Euler.
Por otra parte, están las llamadas transformaciones de Lorentz puras, car-
acterizadas por las tres componentes de la velocidad relativa de los sistemas
de referencia inerciales.
Así, las transformaciones de Lorentz deducidas en la sección anterior,
constituyen un caso particular del conjunto de transformaciones (2.44), en
donde el movimiento relativo entre los sistemas de referencia es a lo largo
de un eje coordenado, con ejes espaciales paralelos (no hay rotación de ejes)
34 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Figura 2.3: Transformación general de coordenadas

y sin translación de los orígenes espacial y temporal (Figura 2.3). En este


caso basta con un solo parámetro, la magnitud de la velocidad relativa, para
determinar completamente la transformación.

En el caso de general de una transformación de coordenadas que in-


volucre movimiento relativo, cambio de orientación de los ejes espaciales y
translación del origen de coordenadas espacial y temporal, se requieren en-
tonces 10 parámetros para determinar completamente la transformación: Los
tres parámetros = 1 2 3 que determinan el cambio del origen espacial,
0
un parámetro para el desplazamiento del origen temporal, tres parámetros
(e.g. los ángulos de Euler) para determinar una rotación de los ejes espaciales
y tres parámetros (e.g. las tres componentes de la velocidad relativa) para
determinar una transformación pura de Lorentz. Para los objetivos del pre-
sente libro, salvo se especifique lo contrario, es suficiente considerar solamente
transformaciones de Lorentz puras con los ejes 0 en la dirección de la ve-
locidad relativa de los sistemas de referencia y supondremos además, que los
orígenes de los sistemas coinciden para el tiempo cero en ambos sistemas.
Antes de continuar con la discusión de algunas propiedades de las trans-
formaciones de Lorentz, reescribamos las ecuaciones de transformación (2.42)
2.3. PROPIEDADES DE LAS TL 35

Figura 2.4: Composición de transformaciones de Lorentz

en la notación introducida en la ecuación (2.45):


00 0 1
= ( )
01 1 0
= ( )
02 2 (2.49)
=
03 3
=

en donde se ha definido el parámetro adimensional = y así ( ) =


2 1 2
(1 ) .
Como se mencionó al comienzo de esta sección, las ecuaciones de trans-
formación de Lorentz adquieren una forma simétrica en las coordenadas es-
paciales y la temporal. Así, los coeficientes de la transformación de Lorentz
, llamados también elementos de la matriz de transformación de Lorentz,
en la ecuación (2.48) están dados por:
0
0= 11 =
0 1
1 = 0 = (2.50)
2 3
2 = 3 = 1

siendo los demás coeficientes cero.


36 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Consideremos ahora tres sistemas de referencia inerciales , 0 y 00 , con


ejes paralelos, movimiento relativo a lo largo del eje espacial 1 , y orígenes
espaciales coincidentes para = 0 = 00 = 0 (Figura 2.4). Sea la velocidad
del sistema de referencia 0 respecto a y la velocidad del sistema 00
respecto a 0 , y sean ( 0 1 2 3 ), ( 00 01 02 03 ) y ( 000 001 002 003 ) las
coordenadas de un evento físico medidas por los tres observadores , 0 y 00 ,
respectivamente. La relación entre las coordenadas del evento medidas por
y 0 están dadas por la ecuación (2.49) y la relación entre las coordenadas
medidas por 0 y 00 están dadas por las ecuaciones:
000 0 01
= ( )( 00 )
001 0 00
= ( )( 01 )
002 (2.51)
= 02
003
= 03

en donde 0 = . Las ecuaciones de transformación que relacionan las


coordenadas medidas por y 00 se obtienen entonces, componiendo las
dos transformaciones, es decir, remplazando las coordenadas del sistema 0
de la ecuación (2.49), en esta última ecuación (2.51). Despues de reagrupar
términos, las ecuaciones de transformación finales, como era de esperarse,
toman la misma forma:
000 00 1
= ( )( 0 )
001 00 0
= ( )( 1 )
002 2 (2.52)
=
003 3
=
00 00
en donde = y es la velocidad relativa del sistema de referencia
respecto a , la cual está dada por la ecuación
+
= 2
(2.53)
1+

Esta ecuación corresponde a la versión relativista del teorema de adición


de velocidades de Galileo. Notemos si y entonces .
Notemos que las ecuaciones de transformación de Lorentz y el teorema
de adición de velocidades se reducen a las ecuaciones de transformación de
Galileo y al teorema de adición de velocidades Galileano cuando .
Este límite formal, sin embargo, carece de significado físico en la medida que
2.3. PROPIEDADES DE LAS TL 37

la velocidad de la luz en el vacío es una constante universal y por lo tanto


este límite debe entenderse mejor en el siguiente sentido.
Para velocidades pequeñas comparadas con la velocidad de la luz ¿ ,
tanto las ecuaciones de transformación de Lorentz, como el teorema de adi-
ción de velociades, se reducen a las ecuaciones de transformación de Galileo
y al teorema de adición de velocidades galileano, respectivamente. Para ver
esto, es suficiente recordar la expansión en serie de Taylor de la función
( 1) 2
(1 + )=1+ + +··· (2.54)
2!
la cual converge para | | 1. Si aplicamos esta expansión al factor ( )
tenemos
µ 2
¶ 1 2
( ) = 1 2
2
1
= 1+ 2
+··· (2.55)
2
Remplazando esta expansión en las ecuaciones de transformación de Lorentz
2.42 obtenemos
µ ¶
1 2
´ = 1+ 2 +··· ( )
2
µ 2¶
= +O 2 (2.56)

µ 2
¶³ ´
1
´ = 1+ 2
+··· 2
2
µ 2

= +O 2
(2.57)

en donde O ( 2 2 ) representa términos del orden de 2 2 , los cuales son


muy pequeños si 1 y por lo tanto las ecuaciones de transformación
de Galileo corresponden a una aproximación a vajas velocidades de las ecua-
ciones de Lorentz. Un resultado similar se obtiene pata el teorema de adición
de velociades.
Este límite de bajas velocidades juega el papel de un principio de corre-
spondencia, en el sentido de que la “física Newtoniana es una teoría válida”
38 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

para describir los fenómenos, cuando las velocidades típicas involucradas en


los procesos bajo consideración son bajas comparadas con la velocidad de
la luz y por lo tanto, las ecuaciones de la relatividad deben reducirse a las
correspondientes relaciones clásicas, en este límite de velocidades bajas. Es
importante aclarar el significado de la frase “validez de la física Newtonianas
para velocidades ”. Dado que toda medida experimental de una can-
tidad física, lleva consigo un error experimental, entonces las predicciones de
la mecánica clásica para los diferentes observables de un sistema dado, están
en concordancia con los resultados experimentales, dentro del rango de error
experimental. Así, el límite clásico, o el rango de velocidades para el cual la
mecánica clásica es aplicable, depende de la precisión experimental.
El límite formal se puede entender fícamente en el sentido que
representa la vélocidad máxima de propagación de señales físicas, independi-
entemente que esta constante corresponda a la velocidad de la luz en el vacío
y por lo tanto si esto significaría que podemos enviar información a
velocidad infinita, lo que implicaría que tendríamos a disposición un mecan-
ismo instantáneo para calibrar relojes, lo que implicaría a su vez que todos
los observadores inerciales medirían la misma coordenada temporal para un
evento dado. Así podemos entender la hipótesis de Newton de un tiempo
universal independiente del observador, como la hipótesis de una velocidad
infinita para transmitir información. Notemos además que en efecto la tercera
ley de Newton requiere de esta hipótesis, pues esta ley exige que las fuerzas
de acción y reacción sean iguales en todo instante, independientemente de la
posición de los cuerpos que están en interacción.
Retomando las ecuaciones de transformación (2.52), vemos que dos trans-
formaciones de Lorentz sucesivas, conducen a una nueva transformación de
Lorentz, cuyo parámetro (la velocidad relativa) está dado por la ecuación
(2.53). Por otra parte, la transformación de Lorentz inversa, es decir, las
ecuaciones de transformación de coordenadas del sistema 0 al , tienen
la misma forma (ecuación (2.49)), pero cambiando el parámetro por .
Además, la transformación identidad, esto es, del sistema sobre el mismo,
corresponde a una transformación de Lorentz con parámetro = 0, trivial-
mente. Si escribimos formalmente una transformación de Lorentz entre y
0
, como
0
( ):
0 (2.58)
= ( )

entonces, las propiedades encontradas, las podemos resumir formalmente de


2.3. PROPIEDADES DE LAS TL 39

la siguiente manera:

( ) ( ) = ( ) (2.59)
+
= 2
(2.60)
1+

( = 0) = (0) ( )= ( ) (0) = ( ) (2.61)


1
( )= ( ) (2.62)

( ) ( )= ( ) ( )= (2.63)
1
en donde significa la transformación identidad, ( ) la transformación
inversa, y el producto ( ) ( ) representa la composición de dos transfor-
maciones sucesivas.
Un grupo matemático es un conjunto de elementos G, con una operación
interna llamada producto, es decir, el producto de dos elementos de G es de
nuevo un elemento del conjunto y esta operación debe satisfacer las siguientes
propiedades:
i.-Existe un elemento del grupo G, llamado la identidad, tal que la iden-
tidad por cualquier elemento del grupo es el mismo elemento del grupo.
ii.-Para todo elemento del grupo, existe otro elemento en el grupo, tal que
su producto es la identidad.
Un grupo se llama abeliano, si la operación producto es conmutativa. Las
relaciones simbólicas representadas en las ecuaciones (2.59), (2.61), (2.62)
y (2.63), muestran que las transformaciones de Lorentz forman un grupo
matemático, llamado el grupo de Lorentz. Para el caso particular que estamos
considerando, esto es, de transformaciones entre sistemas de referencia con
ejes paralelos y movimiento relativo a lo largo del eje , el grupo es claramente
abeliano, y cada elemento del grupo corresponde, o está caracterizado por el
valor de la velocidad. Puesto que la velocidad puede tomar cualquier valor
entre , el grupo contiene un número infinito no numerable de
elementos, y así este grupo es conocido en la literatura como un grupo de Lie
de un parámetro o grupo continuo, en contraposición con los grupos finitos
o discretos, tales como por ejemplo, los números enteros con la operación
suma. El caso de las transformaciones generales, ecuación (2.44), también
forman un grupo, llamado el grupo de Poincaré, el cual es también un grupo
de Lie pero de diez parámetros, pues como vimos, una transformación general
requiere de 10 parámetros para caracterizarla.
40 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Otra propiedad muy importante de las TL, la cual va a jugar un papel


fundamental en el problema de la causalidad en física, es que las TL dejan
invariante una cantidad, que la llamaremos intervalo o distancia espacio-
temporal entre eventos. Sean 1 y 2 dos eventos físicos cualesquiera y sean
( 01 11 21 31 ) y ( 02 12 22 32 ) las coordenadas de los dos eventos, medidas
por un observador inercial . Definamos el intervalo espacio-tiempo entre los
dos eventos por:
2 0 0 2 1 1 2 2 2 2 3 3 2
12 := ( 2 1) ( 2 1) ( 2 1) ( 2 1) (2.64)

Sea 0 otro observador inercial que se mueve con velocidad respecto a


y sean ( 00
1
01
1
02
1
03
1) y ( 2
00 01
2
02
2
03
2 ) las coordenadas de los dos eventos
0
1 y 2 medidas por . Entonces, para este nuevo observador, el intervalo
espacio-tiempo entre los dos eventos está dado por:
02 00 00 2 01 01 2 02 02 2 03 03 2
12 := ( 2 1) ( 2 1) ( 2 1) ( 2 1) (2.65)

Utilizando las TL (ecuaciones (2.49)) expresemos el intervalo espacio-


tiempo medido por 0 (ecuación (2.65)), en términos de las coordenadas del
observador :
02 0 1 0 1 2 1 0
12 = ( ( 2 2) ( 1 1 )) ( ( 2 2)
1 2 2 2 2 2
( 1 1 )) ( 2 1) ( 32 3 2
1) (2.66)

reagrupando términos obtenemos


02 0 0 2 1 1 2 2 2 2 3 3 2 2
12 =( 2 1) ( 2 1) ( 2 1) ( 2 1) = 12 (2.67)

Este resultado significa que el intervalo espacio-tiempo entre dos eventos


físicos es una cantidad independiente del observador y así es un invariante
físico, lo que implica que el valor numérico del intervalo es siempre el mismo,
sin importar cual observador lo mida.
A las variables físicas que son invariantes bajo transformaciones de Lorentz
se les llama invariantes relativistas o escalares de Lorentz y claramente jue-
gan un papel fundamental, pues al ser independientes del observador, nos
caracterizan propiedades intrínsecas del sistema o de los fenómenos físicos.
Las implicaciones físicas, para el caso particular del intervalo espacio-
tiempo, serán discutidas en el próximo capítulo con mayor detalle. Es impor-
2
tante solamente resaltar en este punto dos aspectos: en primer lugar 12
2.4. CONSECUENCIAS DE LAS TL 41

puede ser positivo, negativo o cero, y en segundo lugar, el último caso cuan-
2
do 12 es cero, corresponde a la expresión matemática del principio de
la constancia de la velocidad de la luz, pues si desde el punto del espacio
y en el instante de tiempo donde ocurre el primer evento, por ejemplo 1 ,
se emite un rayo de luz en dirección del evento 2 , entonces este rayo de
luz alcanza el punto del espacio en el instante de tiempo, en que el segun-
do evento ocurre. Esto se ve fácilmente, pues de la definición del intervalo
espacio-tiempo, ecuación (2.64) o (2.65) y recordando que 0 = , entoces
2 02
despejando de cualquiera de estas dos ecuaciones ( 12 =0= 12 ) im-
plica que =(distancia espacial entre los eventos)/(intervalo temporal entre
los eventos) es un invariante relativista.
Es importante resaltar que el intervalo espacio-tiempo es invariante bajo
las transformaciones generales de coordenadas (ecuación (2.44)), y no sola-
mente bajo las transformaciones de Lorentz puras consideradas, pues por una
parte, el término inhomogéneo de las transformaciones se cancela al tomar
la diferencia de las coordenadas, mientras que las rotaciones de los ejes espa-
ciales dejan invariante la distancia espacial (ver sección 4.1)
1 1 2 2 2 2 3 3 2
( 2 1) +( 2 1) +( 2 1) (2.68)

permaneciendo la coordenada temporal inanalterada.


Otra característica importante que se deriva directamente de las TL, es
que las velocidades relativas entre sistemas de referencia inerciales, deben ser
siempre menores que la velocidad de la luz, pues el factor ( ) diverge para
= y se hace imaginario si , lo cual es inadmisible dado el significado
físico asignado a las coordenadas utilizadas.

2.4. Consecuencias de las TL


Para finalizar el presente capítulo, vamos a considerar dos consecuencias
de las TL que constituyen, tal vez, los dos resultados más sorprendentes de
la teoría especial de la relatividad y por esta razón los más conocidos en la
literatura de divulgación científica.
Consideremos para comenzar el problema de la dilatación temporal. En
primer lugar definamos el concepto de tiempo propio, como el intervalo de
tiempo entre dos eventos 1 y 2 , medido por un mismo reloj. Esto signifi-
ca, equivalentemente, que existe un sistema de referencia inercial, llamémolo
, para el cual los dos eventos ocurren en el mismo punto del espacio. Así,
42 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

las coordenadas de estos dos eventos para el observador están dadas por
( 01 11 21 31 ) y ( 02 12 22 33 ), con
0 0
2 1 = (2.69)

y
2 = 1; =1 2 3 (2.70)
Suponiendo, sin pérdida de generalidad, que el evento 2 ocurre después que el
evento 1 para el observador , i.e. 02 0
1 , y como 2 = 1 ; = 1 2 3, pues
los dos eventos por definición, tienen lugar en el mismo punto del espacio,
es claro que para cualquier otro observador inercial, por ejemplo 0 , los dos
eventos suceden en puntos diferentes del espacio y por lo tanto, dada la in-
2
varianza del intervalo espacio-tiempo 12 entre los dos eventos, el intervalo
de tiempo medido por 0 para estos dos eventos, debe ser mayor que el inter-
valo de tiempo propio. Para probar esta afirmación, sean ( 00 1
01
1
02
1
03
1) y
00 01 02 03 0
( 2 2 2 2 ) las coordenadas de estos eventos y el intervalo de tiempo
medido en 0 , con
0
= 00
2
00
1 (2.71)
Utilizando las TL para remplazar en esta expresión las coordenadas pri-
madas en términos de las no primadas y aplicando la definición de tiempo
propio, obtenemos
0 0 1 0 1
= ( 2 2) ( 1 1) (2.72)

y puesto que en sistema de referencia inercial los dos eventos suceden en


el mismo punto del espacio, i.e. 12 = 11 , llegamos finalmente a la ecuación
de dilatación temporal:

0
= =p (2.73)
1 2 2

pues el factor simpre es mayor que 1, para 6= 0. De paso hemos demostra-


do, que si dos eventos ocurren para un observador en un mismo punto del
espacio, el orden temporal de los eventos (e.g. 02 0
1 0) es el mismo
para todos los observadores, es decir si 02 0
1 0 entonces 00
2
00
1 0
y el tiempo propio es el intervalo de tiempo más pequeño medido por al-
gún observador. Esto justifica el nombre de dilatación temporal y significa
físicamente, que los dos eventos están conectados causalmente, es decir que
2.4. CONSECUENCIAS DE LAS TL 43

el evento posterior pudo ser causado por el primer evento, aún cuando no
necesariamente exista un proceso físico que los ligue.
Notemos además que el intervalo de tiempo entre dos eventos puede hac-
erse tan grande como se quiera, si tomamos velocidades suficientemente cer-
canas a la velocidad de la luz. En efecto dado que 1 para 0 ,
y dado 0, entonces 0 = puede hacerse tan grande como se quiera
haciendo que .
Calculemos, ahora el intervalo espacio-tiempo para estos dos eventos. En
el sistema obtenemos la expresión
2 0 0 2 1 1 2 2 2 2 3 3 2 2 2
12 =( 2 1) ( 2 1) ( 2 1) ( 2 1) = 0 (2.74)

el cual nos indica, que para el caso que estamos considerando, el intervalo
espacio-tiempo nos mide directamente (salvo un factor constante 2 ) el in-
tervalo de tiempo propio. Si calculamos este mismo intervalo, ahora en el
sistema de referencia 0 (ver ecuación (2.65)), por su invarianza, obviamente
obtenemos el mismo resultado. Esto nos muestra, sin ulteriores cálculos, que
el intervalo de tiempo en 0 debe ser mayor que en , pues a 2 02 le es-
tamos restando una cantidad positiva, que nos da la distancia espacial entre
los dos eventos medidos en el sistema 0 .
¿Cuando tiene sentido hablar del intervalo de tiempo propio entre dos
eventos?. Para responder a esta pregunta, consideremos dos eventos físicos
2
cualesquiera 1 y 2 y calculemos el intervalo 12 entre ellos en algún sis-
tema de referencia inercial . Sean ( 1 1 1 1 ) y ( 02 12 22 32 ) las coorde-
0 1 2 3

nadas de los eventos 1 y 2 respectivamente y supongamos para simplificar


los cálculos, pero sin perder generalidad del resultado, que 22 = 21 y 32 = 31 ,
entonces:
2 0 0 2
12 = ( 2 1) ( 12 1 2
1) (2.75)
Por lo tanto, si este intervalo es mayor que cero, esto significa que siempre
es posible encontrar un sistema de referencia inercial 0 , para el cual los dos
eventos ocurren en el mismo punto del espacio, así
2 00 00 2 2 2
12 =( 2 1) = (2.76)

pues, dadas las coordenadas de los dos eventos en , basta con considerar
un sistema de referencia 0 el cual se mueva con una velocidad respecto a
dada por
1 1
2 1
= = 0 0
(2.77)
2 1
44 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Para el caso que estamos considerando, la velocidad del sistema 0 está


a lo largo del eje de las y su dirección depende de la posición relativa entre
los eventos ( 12 1
1 0 o 12 1
1 0) en , y del orden temporal entre
0 0 0 0
ellos, es decir si 2 1 0 o 2 1 0 (ver ecuación (2.77)).
Ahora bien, si el intervalo espacio-tiempo entre los eventos medido en
algún sistema de referencia fuera menor o igual a cero, dada la invarianza
2
de 12 , es obvio que no existe un sistema de referencia para el cual los
dos eventos ocurran en el mismo punto del espacio y por lo tanto, en este
caso, no tiene sentido hablar de tiempo propio entre los eventos. Además,
para esta última situación considerada, como lo veremos en seguida, el orden
temporal entre los eventos puede invertirse o ser simultáneos para algunos
observadores, lo que implica físicamente que los dos eventos no pueden estar
causalmente conectados, pues para que un evento fuera causa del otro, se
necesitaría transmir información a una velocidad mayor a la de la luz.
La segunda consecuencia importante de las TL, se relaciona con la con-
tracción de longitudes. Para entender el significado físico de este fenómeno,
definamos primero lo que se entiende por medir la longitud de un cuerpo.
Consideremos el problema de medir la longitud de una varilla rígida.
Supongamos que para un observador inercial la varilla se encuentra en
reposo y elijamos el eje de las a lo largo de la varilla. Por definición, la
longitud de la varilla está dada por la diferencia de las coordenadas de los
extremos de la varilla:
1 1
0 = 2 1 (2.78)
en donde se ha supuesto, sin pérdida de generalidad, que 12 1
1 . Esta
definición es físicamente consistente, puesto que la varilla está en reposo
para el observador . De la misma manera como definimos tiempo propio,
llamemos a 0 , definido en la ecuación (2.78), longitud propia de la varilla.
En términos generales, definimos la longitud propia de un cuerpo cualquiera,
como la longitud del cuerpo medida en el sistema de referencia, en el cual
el cuerpo se encuentra en reposo. El problema surge cuando el cuerpo al
cual se le quieren medir sus dimensiones, está en movimiento. Consideremos
entonces, otro sistema de referencia 0 el cual se mueve con velocidad
respecto a y definamos la longitud de la varilla en 0 , como la diferencia
de las coordenadas de los extremos de la varilla en un instante dado 0 :
01 01
= 2 1 (2.79)
Esto significa, que el observador 0 mide simultáneamente la posición
de los extremos de la varilla y define su longitud como la diferencia de las
2.4. CONSECUENCIAS DE LAS TL 45

coordenadas espaciales de los dos eventos físicos, cuyas coordenadas están


dadas por ( 00
1
01
1 0 0) y ( 2
00 01
2 0 0) con. Para encontrar la relación entre
las medidas realizadas por los dos observadores, basta con aplicar las TL,
teniendo en cuenta que en el sistema 0 los eventos (coordenadas espacio-
tiempo de los extremos de la varilla) deben ser simultáneos 00 00
1 = 2 . Así, de
la ecuación (2.78) y de las TL inversas (ecuaciones (2.43)), tenemos
01 0 01 0 01 01
0 = ( 2 + ) ( 1 + )= ( 2 1) (2.80)

y aplicando la definición (2.79) para la longitud de la barra medida por 0 ,


llegamos al resultado p
= 0 1 2 2 (2.81)
el cual establece que la longitud física
pen la dirección de movimiento de un
sólido, se vé contraida en un factor 1 2 2 con respecto a la longitud

propia del sólido, en donde es la velocidad del cuerpo respecto al obser-


vador inercial que mide su longitud. De las TL se ve directamente que las
dimensiones transversales al movimiento de un sólido no se alteran en virtud
de su movimiento.
Una consecuencia inmediata de este efecto de la contracción, es que en
física relativista los conceptos de sólido rígido y fluido incomprensible no
son válidos en general. La ecuación (2.81) la habían postulado Fitzgerald
y Lorentz para explicar el resultado negativo del experimento Michelson-
Morley, pues si el brazo del interferómetro a lo largo de la dirección de
movimiento de la tierra se contrayese de acuerdo a esta ecuación, entonces
se puede mostrar fácilmente que no aparecerían franjas de interferencia, pues
los caminos ópticos de los dos rayos de luz serían iguales. El problema con
el razonamiento de Fitzgerald y Lorentz es que los brazos del interferómetro
están en reposo respecto a la tierra y por lo tanto su longitud medida en la
tierra, de acuerdo a la relatividad, es la longitud propia y no debe aparecer
contraída.
Estas dos primeras consecuencias de la teoría de la relatividad, dilat-
ación temporal y contracción de longitudes, a pesar de su caracter bastante
extraño a nuestra intuición clásica, han sido corroboradas en varios exper-
imentos. El primer experimento reportado, fue realizado por Rossi y Hall
(Rossi, B. & Hall, D. B., Phys. Rev., 59,223, 1941) utilizando unas partícu-
las elementales, los muónes , descubiertas en los rayos cósmicos. La gran
mayoría de las partículas elementales conocidas son inestables, es decir, que
estas partículas después de haber sido producidas por algún proceso, decaen
46 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

expontáneamente en otras partículas al cabo de un cierto tiempo, llamado


tiempo propio o tiempo de vida media de la partícula (este tiempo de vida
es característico de cada clase de partícula). Por ejemplo, si producimos un
muón en reposo en el laboratorio, entonces pasados unos 2 2 × 10 6 la
partícula se desintegra en un electrón y en dos neutrinos.
Los rayos cósmicos son haces de partículas, fundamentalmente protones
y electrones de alta energía, los cuales al incidir sobre las capas superiores
de la atmósfera terrestre, producen toda una serie de partículas elementates,
entre otras los muónes, los cuales viajan hacia la tierra con velocidades muy
cercanas a la de la luz: 0 994 . Estos muónes se producen a una al-
tura del orden de los 2000 , y se detectan sobre la superficie de la tierra.
Clásicamente, se espera que estos muónes se desintegren antes de llegar a
la superficie terrestre, pues a la velocidad de 0 994 en un tiempo de vida
de 2 2 × 10 6 alcanzan a avanzar escasamente unos 656 . Dado que para
un observador ligado a la tierra los dos eventos, se crea el muón y luego se
detecta, ocurren en puntos diferentes del espacio, mientras que para un obser-
vador ligado al muón los dos eventos ocurren en el mismo punto del espacio,
y por lo tanto, el intervalo de tiempo medido por este último observador es
un tiempo propio, entonces para el observador terrestre el tiempo entre los
eventos debe estar dilatado en un factor
p
1 1 2 2 9 (2.82)

de acuerdo con la ecuación (2.73). Así, para el observador en reposo con


respecto a la tierra el muón alcanza a sobevivir un tiempo del orden de
2 × 10 5 antes de desintegrarse y por lo tanto, puede recorrer un espacio
aproximado de = 6 000 , antes de desintegrarse, lo que significa
que los mesones si pueden alcanzar la superficie terrestre antes de que ellos
decaigan en otras partículas.
Dado que la llegada de los muónes a la superficie terrestre es un hecho
físico, a esta misma conclusión debe llegar cualquier otro observador inercial.
Por ejemplo, consideremos el observador ligado a la partícula. Puesto que
para él la partícula se encuentra en reposo, su vida media no se ve dilatada y
por lo tanto el muón se desintegra al cabo de 2 2 × 10 6 . Pero ahora, es la
tierra la que se mueve hacia él, con una velocidad de = 0 994 y la distancia
a la superficie tierrestre, desde el lugar donde se producen los muónes, se ve
contraida en un factor p
1 2 2 0 11 (2.83)
2.4. CONSECUENCIAS DE LAS TL 47

de acuerdo con la ecuación (2.81) y por lo tanto la superficie de la tierra se


encuentra a una distancia física de

0 11 × 2 000 = 220 (2.84)

la cual es lo suficientemente corta para que la superficie de la tierra llegue


hasta el punto en el cual se encuentra el muón, antes que este se desintegre.
Esta aparente asimetría en el análisis de un fenómeno físico, visto por
dos observadores inerciales (en un caso el efecto considerado es la dilata-
ción temporal, mientras que para el otro observador es la contracción de
longitudes), no está en contradicción con el principio de relatividad, pues este
principio lo que establece es la invarianza de las leyes físicas para observadores
inerciales. En efecto, dos observadores pueden medir diferentes trayectorias,
longitudes, intervalos de tiempo, energías cinéticas, etc., pero las leyes que
rigen la dinámica de los sistemas si deben ser las mismas.
Es importante resaltar este aspecto, pues es frecuente caer en aparentes
paradojas cuando se aplica el principio de relatividad. De hecho se han con-
struido muchos ejemplos, llamados en física “gedanken Experimenten”, que
ilustran esta situación y que constituyen un buen ejercicio para comprender
mejor los fenómenos relativistas.
Un clásico ejemplo es el de un carro de longitud propia 0 y un garaje
de menor longitud propia 0 con 0 0 . Supongamos que el carro se dirige
hacia el garaje con una velocidad suficiente, para que su longitud medida
por un observador en reposo con respecto al garaje sea menor que 0 , esto es
p
1 2 2 (2.85)
0 0

Entonces, un observador en reposo respecto al garage planea atrapar al carro


dentro del garaje y calcula cerrar la puerta de éste, tan pronto la trompa del
carro alcance la pared del fondo. Para el observador que viaja con el carro,
es el garaje el que aparece contraido y por lo tanto, para él es imposible que
lo atrapen dentro del garaje, pues cuando la pared toque la punta del carro,
el observador del garaje no puede cerrar la puerta. Claramente este análisis
es contradictorio, pues desde el punto de vista físico si el carro puede ser
atrapado por un observador, éste debe ser atrapado por todos, o lo contrario,
es decir no es atrapado por ninguno.
La solución a esta aparente paradoja reposa en el hecho que la simultane-
idad no es un concepto absoluto como hemos visto. Cuando el observador
48 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

ligado al garage cierra la puerta simultáneamente cuando la trompa del car-


ro alcanza a la pared, para el observador en el carro, primero llega la trompa
a la pared y luego se cierra la puerta.
Capítulo 3
La estructura causal del
espacio-tiempo

3.1. Introducción
En este capítulo definiremos la estructura causal del espacio-tiempo. En la
primera parte se hará una breve discusión sobre transformaciones lineales que
dejan invariante la distancia euclideana (rotaciones) con el fin de motivar la
estructura Minkowskiana del espacio-tiempo y el concepto de cuadri-vector.
En la parte final se deducirán las transformaciones de Lorentz a partir de
la invarianza del intervalo espacio-tiempo entre dos eventos y se discutará la
estructura causal del espacio-tiempo.

3.2. Rotaciones en el plano euclideano


Consideremos el plano euclideano
© ª
R2 := = ( 1 2) | R; = 1 2
y el conjunto de transformaciones lineales del plano euclideano sobre si mis-
mo:
: R2 R2 ; 0
= (3.1)
tal que dejen invariante la norma euclideana, definida por
X
2
2
:= = ( 1 )2 + ( 2 )2 (3.2)
=1

49
50 CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

es decir,
0 02 2
= = = (3.3)
En la ecuación (3.2) se ha definido el símbolo de Kronecker (o tensor
métrico euclideano) por:
½
0 6=
:= (3.4)
1 =

Dado que es una transformación lineal de R2 en R2 la podemos escribir


como
X
2
0
= = (3.5)
=1

en donde los coeficientes son constantes. En la última igualdad hemos


introducido la convención de suma de Einstein, en donde se asume una suma
en todo factor en el cual aparezcan dos índices repetidos, uno como subíndice
y el otro como supraíndice y la suma se realiza sobre el rango de valores que
tome el índice. Busquemos entonces la forma más general de estos coeficientes
que representen una transformación lineal y que dejen invariante la distancia
euclideana. Para este fin remplacemos en la ecuación (3.3) la transformación
lineal (3.5):
= ´ ´ = ´2 = 2 = (3.6)
Identificando los coeficientes de las correspondientes coordenadas, obten-
emos el siguiente conjunto de ecuaciones acopladas para los coeficientes:
2 2
11 + 21 =1 (3.7)
2 2
12 + 22 =1 (3.8)
11 12 + 21 22 =0 (3.9)
Además, dado que es una transformación lineal de R2 en R2 , y por lo
tanto = 0 solo si = 0, entonces el determinante de la transformación
debe ser diferente de cero

11 22 12 21 6= 0 (3.10)

Como el sistema de ecuaciones tiene cuatro incognitas podemos encon-


trar tres de éllas en términos de la restante, o equivalentemente podemos
despejar las cuatro incognitas en función de un parámetro. Si llamamos a
3.2. ROTACIONES EN EL PLANO EUCLIDEANO 51

este parámetro y lo definimos como 11 := cos( ) directamente se pueden


despejar los demás coeficientes para obtener:

11 = 22 = cos( ); 12 = 21 = sin( ) (3.11)

Con esto podemos escribir explícitamente las ecuaciones de transforma-


ción en la forma:
01
= 1 cos( ) + 2 sin( ) (3.12)
02 2 1
= cos( ) sin( ) (3.13)
Es de anotar que en el proceso de despejar los coeficientes tenemos que
escoger un signo, pues de la ecuación (3.7), al despejar 21 en términos de 11
surge una raíz. La escogencia hecha de la raíz positiva nos conduce a que el
determinante de los coeficientes tome el valor +1, que para el caso de haber
tomado la raíz negativa nos hubiera dado el valor del determinante igual a
1. Que el determinante de los coeficientes de la transformación lineal es
±1 se puede obtener directamente de las propiedades de las transformaciones
que dejan invariante la norma euclideana de un vector, pues si representamos
los puntos (vectores) de R2 por matrices columna
µ 1 ¶
= 2 (3.14)

entonces, la norma al cuadrado (ecuación (3.2)) se puede escribir como:


µ 1 ¶ µ 1 ¶ µ 1 ¶
2
¡ 1 2 ¢
= 2 = 2 2 = (3.15)

donde significa la transpuesta de la matriz. De esta forma, la invarianza


bajo la transformación lineal de la norma se puede escribir de la siguiente
forma:
= 0 0=( ) ( )= (3.16)
lo que implica que la matriz de transformación debe satisfacer la condición

=1 (3.17)

que fácilmente se ve que conduce al mismo sistema de ecuaciones para los


coeficientes de la matriz . Toda transformación (o matriz) que satisfaga la
ecuación anterior (3.17) se llama ortogonal, y fácilmente se ve que bajo una
52 CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

Figura 3.1: Rotación de los ejes en el plano euclideano

tal transformación, también se preservan los ángulos entre los vectores del
plano euclideano, pues
0 0 0 0
· =( ) = = = · (3.18)

Tomando el determinante en la ecuación (3.17) y teniendo en cuenta que


det = det , obtenemos el resultado general que:

| det |2 = 1 = | det |= ±1 (3.19)

Este resultado tiene una interpretación geométrica que veremos enseguida


(ver Figura 3.1).

Si hacemos una rotación de los ejes coordenados por un ángulo y en


sentido contrario a las agujas del reloj, las componentes de un vector de R2 se
transforman como en la ecuación (3.5) y claramente dejan la norma del vector
invariante. Este resultado muestra entonces, que la transformación lineal que
deja invariante la norma de un vector en R2 queda determinada por un solo
parámetro y puesto que es equivalente a una rotación de los ejes, podemos
escoger como parámetro el ángulo de rotación . De esta forma podemos es-
cribir ( ) para representar esta transformación lineal. Además, si realizamos
3.3. CUADRI-VECTORES Y EL GRUPO DE LORENTZ 53

dos transformaciones (rotaciones) sucesivas ( ) y ( ), la primera en un


ángulo y la segunda en un ángulo , entonces la transformación compuesta
( ) ( ) es equivalente a una sola transformación en un ángulo + .
Adicionalmente, la transformación inversa de ( ) es equivalente a la trans-
formación por un ángulo y la transformación identidad corresponde a la
rotación en un ángulo cero. Resumiendo

( ) ( )= ( + ) (3.20)
1
( )= ( ) (3.21)
(0) = 1 (3.22)
Estas ecuaciones definen un grupo matemático, llamado el grupo de rota-
ciones del plano. Dado que las transformaciones están determinadas por un
único parámetro , que varía continuamente de 0 a 2 , el grupo se llama
continuo o grupo de Lie de un parámetro.

3.3. Cuadri-vectores y el grupo de Lorentz


Definamos el espacio cuadridimensional de cuadri-vectores como:
0 1 2 3
M : ={ =( ) R4 | · :=
} (3.23)

en donde el producto interno Minkowskiano está definido como


0 0 1 1 2 2 3 3
· := = (3.24)

En la última igualdad hemos hecho uso de la convención de suma de Einstein,


en la cual los índices griegos repetidos toman los valores 0 1 2 3 y como es
usual en relatividad, el índice 0 corresponde a la componente temporal del
cuadri-vector. Los elementos de matriz , llamados las componentes del
tensor de Minkowski (nombre que se justificará cuando veamos tensores),
están definidos por

0 6=
:= 1 = =0 (3.25)
1 = =1 2 3
54 CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

El producto interno definido por la ecuación (3.24) induce entonces una


norma
2
:= · = ( 0 )2 ( 1 )2 ( 2 )2 ( 3 )2 = (3.26)

Definamos una Transformación de Lorentz (TL) como una transformación


lineal
: M M
(3.27)
7 =
tal que deje invariante el producto interno Minkowskiano · , esto es

· = · (3.28)

Para encontrar la forma general de una transformación de Lorentz, utilice-


mos primero el hecho que cualquier transformación lineal la podemos escribir
en la forma
= (3.29)
en donde los coeficientes conforman la matriz de transformación de
Lorentz. Remplazando la ecuación (3.29) en (3.28) y comparando coeficientes,
obtenemos las condiciones que deben cumplir los elementos de la matriz de
Lorentz:
= (3.30)
Esta ecuación la podemos escribir en forma equivalente, como el siguiente
sistemas de ecuaciones:
X
3
0 2 2
( 0) ( 0) =1 (3.31)
=1

X
3
0 2
( ) ( )2 = 1; =1 2 3 (3.32)
=1

= 0; 6= (3.33)
Este sistema de ecuaciones es general y contiene todas las posibles trans-
formaciones entre sistemas de coordenadas que dejan invariante el producto
punto Minkowskiano. Estas transformaciones las podemos dividir en tres
categorías: La primera corresponde a las rotaciones de los ejes espaciales,
dejando la coordenada temporal inmodificada y forman el llamado grupo de
3.3. CUADRI-VECTORES Y EL GRUPO DE LORENTZ 55

rotaciones. este grupo representa el hecho que el espacio físico es isotrópico.


Claramente una rotación espacial queda determinada por tres parámetros,
por ejemplo los tres ángulos de Euler. La segunda categoría la constituye la
operación de inversión de los ejes espaciales y el temporal. La última cate-
goría, que es la de interés para nosotros, la conforman las transformaciones
puras de Lorentz, que representan el cambio entre sistemas de referencia in-
erciales, manteniendo tanto los ejes espaciales paralelos (no hay rotaciones
espaciales) así como el sentido de los ejes espaciales y el temporal (sin in-
versión de ejes). Este grupo de transformaciones es conocido en la literatura
como las ”boost” de Lorentz ”, las cuales quedan completamente determi-
nadas por tres parámetros, que pueden ser escogidos para que corresponden
a las tres componentes de la velocidad relativa de los sistemas de referencia.
Antes de continuar desarrollando este último grupo de transformaciones,
es importante aclarar que el conjunto de transformaciones que dejan in-
variante el producto punto Minkowskiano es más general que el dado en
la ecuación (3.29), pues es inmediato ver que bajo una translación de los
ejes epacio-temporales la invarianza del producto punto se mantiene. Es-
tas tranformaciones representan la homogeneidad del espacio-tiempo, o en
otros términos, la arbitrariedad de la elección del origen de coordenadas.
Esta transformación queda determinada por cuatro parámetros (las cuatro
componentes del cuadri-vector translación) y podemos entonces escribir la
transformación de coordenadas más general como

= + (3.34)

llamada transformación de Lorentz inhomogénea. Estas transformaciones


generales constituyen el grupo de Poincare de diez parámetros: Tres ángulos
de rotación + tres componentes de la velocidad relativa + cuatro desplaza-
mientos. El grupo de Poincare es el grupo de simetrias fundamental de la
física y representa la expresión matemática del principio de relatividad y de
las propiedades básicas del espacio y el tiempo, esto es, de la homogenei-
dad e isotropía del espacio físico tridimensional y su estructura geométrica
euclideana y de la homogeneidad e isotropía del tiempo.
Restrinjámonos ahora solamente a las ”boost” de Lorentz y consideremos
un sistema de referencia inercial 0 que se mueve con velocidad constante
respecto al sistema inercial a lo largo del eje 1 y con los ejes espaciales
paralelos. Entonces, dado que en este caso 02 = 2
y 03 =
56 CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

3
, la matriz de transformación de Lorentz se reduce a:
0 0
0 1 0 0
1 1
0 1 0 0
= (3.35)
0 0 1 0
0 0 0 1

y las relaciones (3.31), (3.32) y (3.33), toman la forma:


0 2 1 2
( 0) ( 0) =1 (3.36)
0 2 1 2
( 1) ( 1) = 1 (3.37)
0 0 1 1
0 1 0 1 =0 (3.38)
que es un sistema de tres ecuaciones con cuatro incógnitas y así, los coe-
ficientes por determinar, quedan dados en términos de un parámetro:
la velocidad relativa entre los sistemas de referencia y 0 . Teniendo en
cuenta que las coordenadas del origen del sistema 0 , medidas en el sistema
están dadas por ( 0 1
0 0) y que bajo una T.L. se transforman a las
0
coordenadas ( 0 0 0) en 0 , obtenemos la ecuación:

1 0 1 1 1 0 1 0
0= 0 + 1 = 0 + 1 =

1 1
0 = 1 (3.39)

Entonces, el sistema de ecuaciones (3.36), (3.37) y (3.38) tiene solución


única y está dada por:

0 0
0 0
= (3.40)
0 0 1 0
0 0 0 1

en donde
1
= ( ) := q ; (3.41)
2
1 2

= ( ) := (3.42)
3.3. CUADRI-VECTORES Y EL GRUPO DE LORENTZ 57

Escribiendo explícitamente el sistema de ecuaciones de transformaciones


de Lorentz,
0
= ( 0 1
) (3.43)
1 1 0
= ( ) (3.44)
2 2
= (3.45)
3 3
= (3.46)
vemos la extrecha relación formal con la ecuación (3.13) (rotación de los ejes
1
y 2 ).
No es dificil ver que podemos interpretar formalmente una transformación
de Lorentz, como una rotación en el plano complejo de los ejes ( ) en un
ángulo complejo. Para este fín definamos el parámetro por la siguiente
ecuación:
tanh := = (3.47)

en donde tanh es la tangente hiperbólica. Con esta definición, y utilizando


las identidades para las funciones hiperbólicas, tenemos que:

cosh = ( ); sinh = ( ); (3.48)

Con esta defición (ecuación (3.47)) y las relaciones (3.48) las ecuaciones
de transformación de Lorentz se pueden escribir en la forma:
0 0 1
= cosh sinh (3.49)

1 1 0
= cosh sinh (3.50)
2 2
= (3.51)
3 3
= (3.52)
Recordando la relación cosh = cos( ), vemos la estrecha relación entre
las rotaciones de los ejes coordenados y las transformaciones de Lorentz. Otra
ventaja que tiene expresar las transformaciones de Lorentz en términos del
parámetro , es la expresión para el teorema de adición de las velocidades,
pues dos transformaciones de Lorentz sucesivas, con parámetros tanh 1 =
1 y tanh 2 = 2 , corresponden a una transformación de Lorentz con
58 CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

parámetro = 1 + 2 , pues, de la identidad trigonométrica para la tangente


de la suma de dos ángulos, tenemos:

tanh = tanh( 1 + 2 )
tanh 1 + tanh 2
=
1 + tanh 1 tanh 2
1 + 2
=
1+ 1 2 2
= (3.53)

la cual coincide con la ecuación (2.53).

3.4. Conos de luz y relaciones de causalidad


Puesto que el cuadrado la norma de todo cuadri-vector (c-v) es un inva-
riante relativista y esta norma no es definida positiva, podemos clasificar a
los c-v en en tres grupos disyuntos: Dado un c-v M, definimos:

2
1. si 0 el c-v se llama como de tiempo
2
2. si 0 el c-v se llama como de espacio
2
3. si = 0 el c-v se llama como de luz

Un c-vector como de tiempo, cuya primera componente es mayor que


cero, 0 0, se llama dirigido al futuro, mientras que si 0 0 se llama
dirigido al pasado.
Para entender el significado físico de esta clasificación y sus consecuencias,
consideremos dos eventos físicos, por ejemplo el decaimiento de un núcleo
radiactivo de uranio, situado en el origen de coordenadas ( 01 11 21 31 ) =
(0 0 0 0) para un observador y la fisión de otro núcleo de uranio, situado
en las coordenadas ( 02 12 22 32 ) ( ) medidas por el observador .
Calculemos entonces el intervalo espacio-temporal entre estos dos eventos:
2 0 0 2 1 1 2 2 2 2 3 3 2
=( 2 1) ( 2 1) ( 2 1) ( 2 1)

2 2 2 2 2
= (3.54)
3.4. CONOS DE LUZ Y RELACIONES DE CAUSALIDAD 59

2
Consideremos primero el caso 0 (sin pérdida de generalidad
tomemos 0), y supongamos que en el instante = 0, en el cual ocurre el
primer evento y desde el origen de coordenadas, se envía una señal luminosa
que viaja en la dirección
p del segundo evento. Puesto que la distancia espacial
entre los eventos es 2 + 2 + 2 , el tiempo
0 , que tarda en llegar el rayo
de luz al punto del espacio donde el núcleo se fisiona es menor que , pues de
2
la relación 0 se sigue que
2 2 2
2 + + 2
2
= 0 (3.55)

Esto significa que es posible que el primer evento, la desintegración del núcleo,
pueda ser causa del segundo evento, la fisión del otro núcleo. Si hubieramos
supuesto que 0 la conclusión es la misma, solo que en este caso la fisión
del núcleo pudo ser la causa de la desintegración del otro. El resultado general
que se desprende de este análisis es que eventos, cuya separación o intervalo
espacio-temporal es mayor que cero, son eventos causalmente conectados (lo
que no significa necesariamente que uno de ellos sea causa del otro), y por lo
tanto, la sucesión temporal de eventos causalmente conectados es la misma
2
para todos los observadores. Además, puesto que 0, notemos que
0
siempre es posible encontrar un sistema de referencia para el cual los
dos eventos ocurren en el mismo punto del espacio, pues basta con elegir la
velocidad de este sistema igual a
r
2+ 2+ 2
= 2
(3.56)

en la dirección apropiada (a lo largo de la línea que une a los dos eventos,


tomándola como el eje de las ) y haciendo una transformación de Lorentz,
obtenemos que las coordenadas de los dos eventos en este sistema de refer-
encia 0 son (0 0 0 0) y ( 0 0 0 0) y por lo tanto
2 2 2 2 2 2 2 02
= = (3.57)

Recordando la definición de tiempo propio, como el intervalo de tiempo


medido en un sistema de referencia para el cual los dos eventos ocurren en
el mismo punto del espacio, vemos que el intervalo espacio-temporal para
eventos como de luz, nos da una medida directa del tiempo propio entre los
eventos, sin necesidad de encontrar el sistema de referencia para el cual los
60 CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

dos eventos ocurren en el mismo punto del espacio. Así podemos adoptar la
siguiente definición general de tiempo propio:
2
Si 0 para dos eventos, definimos , intervalo de tiempo propio,
como: r
2
:= 2
(3.58)
2
En el segundo caso, para eventos como de luz donde = 0, obte-
nemos una conclusión similar al caso anterior, en cuanto a que los eventos
están conectados causalmente, solo que para este caso, el fotón que se envía
desde el primer evento en la dirección del segundo, llega en el mismo instante
en que ocurre el segundo evento y en este caso no tiene sentido hablar de
tiempo propio entre los eventos, pues no es posible encontrar un sistema de
referencia para el cual los dos eventos ocurran en el mismo punto del espacio
( 02 + 02
+ 02
= 0), sin que se viole la invariancia de 2
= 0, salvo
02
en el caso trivial que también fuera = 0, caso en el cual los dos eventos
ocurren en el mismo punto del espacio-tiempo para todos los observadores.
2
Para el último caso, de eventos como de espacio 0, encontramos,
realizando un análisis similar a los anteriores, que el fotón enviado desde
el primer evento hacia el segundo, siempre llega después que el evento ha
tenido lugar. Así no es posible que un evento sea causa del otro y en este caso
2
se habla de eventos causalmente desconectados. De la expresión para
se obtiene que siempre es posible encontrar un sistema de referencia para
el cual los eventos ocurren simultáneamente, pero, lógicamente, en puntos
separados del espacio. Además, la sucesión temporal de los eventos depende
del observador, es decir, si para un observador inercia dos eventos P1 y
P2 causalmente desconectados (i.e. como de espacio) son tales que 1 2,
entonces existen observadores inerciales, e.g. ´, tal que ´1 ´2 .

Esta clasificación de eventos divide al espacio-tiempo en cinco regiones


disyuntas. Dado un evento , el cual lo podemos ubicar sin pérdida de
generalidad en el origen de coordenadas de un sistema de referencia , el
conjunto de eventos con coordenadas ( ), medidas en , que satisfacen
la relación
2
= 22 2 2 2
=0 (3.59)
definen el llamado cono de luz del evento ubicado en el origen de coor-
denadas. La razón de llamarse cono de luz surge cuando dibujamos estos
puntos en un gráfico tridimensional, ( ) como se ve en la (Figura 3.2).
3.4. CONOS DE LUZ Y RELACIONES DE CAUSALIDAD 61

Figura 3.2: Estructura causal del espacio-tiempo

Los eventos con coordenadas tales que:


2 2 2 2 2 2
= 0 0 (3.60)

forman el futuro causal de y aquellos con 0 el pasado causal, esto


significa, que todos los eventos situados dentro del cono de luz de están
causalmente conectados con y pueden ser causados por el evento (futuro
causal) o pueden ser causa de (pasado causal). Todos los demás eventos, es
decir aquellos para los cuales se cumple la relación
2 2 2 2 2 2
= 0 (3.61)

conforman la región como de espacio de eventos causalmente desconectados


con el evento .

Esta forma de representar los eventos en un gráfico espacio-temporal, nos


permite visualizar fácilmente muchos procesos físicos como veremos en varios
ejemplos a lo largo del texto. Un primer resultado que podemos obtener,
sin necesidad de recurrir a cálculos explícitos, es que la trayectoria de una
partícula material representada en un gráfico espacio-tiempo, siempre tiene
que estar dentro del cono de luz de cada uno de los puntos (eventos) de la
62 CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

Figura 3.3: Lineas de universo de partículas físicas

trayectoria y la trayectoria de un fotón (rayo de luz) siempre está sobre el


cono de luz de cada uno de los puntos de su trayectoria (ver Figura 3.3).

3.5. Algebra de cuadri-vectores


En esta sección veremos algunas propiedades de carácter matemático
de los c-v, que se desprenden directamente de la definición de la métrica
Minkowskiana, sin necesidad de recurrir a interpretaciones físicas, pero que
van a ser de mucha utilidad para entender algunos resultados de la teoría de
la relatividad.
El espacio cuadridimensional de cuadri-vectores M, admite una estruc-
tura de espacio vectorial con la suma de c-v y el producto de un escalar (los
reales) por un c-v definidos como:

M R =

0 1 2 3 0 1 2 3
+ = ( )+( ) (3.62)
0 0 1
= ( + + 1 2
+ 2 3
+ 3
)
3.5. ALGEBRA DE CUADRI-VECTORES 63

0 1 2 3 0 1 2 3
= ( ) := ( ) (3.63)
o en forma equivalente, utilizando la notación con índices:

( + ) = + (3.64)

( ) = (3.65)
De la definición del producto interno invariante de Lorentz y por las
propiedades del álgebra vectorial definida, se obtienen las siguientes propiedades
del producto interno:
Proposición 4.1 El producto interno Minkowskiano satisface las sigui-
entes propiedades:
· = ·
·( + )= · + · (3.66)
·( )=( )· = ( · ) M R
Su demostración es directa a partir de la definición del producto punto
Minkowskiano (3.24) y del álgebra de vectores definida por las ecuaciones
(3.62) y (3.63). Veamos, como ejemplo del método de demostración, sola-
mente la segunda propiedad. De las definiciones de producto interno y suma
de c-v en notación de componentes, tenemos:

·( + ) = ( + )
= ( + )
= +
= · + · (3.67)

como queriamos probar.


Corolario 4.2 M se cumplen las siguientes identidades:

( ± )2 = 2
+ 2
±2

( + )2 + ( )2 = 2( 2
+ 2
) (3.68)
2 2
( + )·( )=
Estas identidades se deducen directamente de la Proposición 4.1 ante-
rior.
64 CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

Podemos extender formalmente, la definición de vectores ortogonales de


espacios vectoriales reales con producto interno definido positivo, al caso de
c-vectores por medio de la relación · = 0, la cual por ejemplo hace que
todo vector como de luz sea ortogonal a si mismo, pues 2 = = 0.
0 1 2 3
Nota 4.1 Dado un c-v cualquiera M, con = ( ), a la
primera componente del c-v se le llama temporal y a las otras tres compo-
nentes espaciales, justificando de esta forma la notación = ( 0 ).
Entonces, de la definición del producto interno de c-v, la norma de un c-v
la podemos escribir como
2
= ( 0 )2 | |2 (3.69)
con R3 y | | la norma usual ( euclideana) de R3 .
Otras propiedades de interés de los cuadri-vectores son las siguientes:
Proposición 4.2 Si M son c-v como de luz, entonces los vectores
+ y son mutuamente ortogonales y tienen normas opuestas.
Para demostrar la ortogonalidad, basta con utilizar la última de las ecua-
ciones (3.68), pues
2 2
( + )·( )= =0 (3.70)
dado que los c-vectores y son como de luz, i.e. 2 = 0 y 2 = 0. De esta
última propiedad y de la primera de las ecuaciones (3.68) se obtiene también,
que sus normas son opuestas:
( + )2 = 2
+ 2
+2 · =2 · (3.71)
( )2 = 2
+ 2
2 · = 2 · (3.72)
Proposición 4.3 Dos c-v M como de luz y mutuamente ortogo-
nales · = 0 son proporcionales entre si, i.e. = .
Para la demostración basta con tener en cuenta, por hipótesis, las sigu-
ientes relaciones,
0= = 0 0 · (3.73)
2
0= = ( 0 )2 | |2 (3.74)
2 0 2 2
0= =( ) | | (3.75)
Entonces, de las propiedades del producto interno euclideano para las
componentes espaciales de cualquier c-v sabemos que · =| || | cos ,
y así obtenemos de las anteriores relaciones que
0 0
· = = (| |2 )1 2 (| |2 )1 2
cos =1 (3.76)
3.5. ALGEBRA DE CUADRI-VECTORES 65

lo cual significa que las componentes espaciales son paralelas y así propor-
cionales, es decir = . Ahora, de la relación = y remplazándola en
la ecuación (3.73) se obtiene:
0 0 0 0
0= = · = | |2 (3.77)

Teniendo en cuenta que ( 0 )2 =| |2 (relación (3.74)), entonces


0 0
0= ( 0 )2 = 0
( 0 0
) (3.78)

Como el c-v es como de luz se debe cumplir que 0 6= 0 y por lo tanto


la ecuación anterior implica que 0 = 0 , de donde se deduce que los c-v
y son proporcionales:
= (3.79)
como se quería probar.
Nota 4.2 La relación
2 2
( + )·( )= (3.80)

nos permite construir c-v ortogonales a partir de dos c-v cualesquiera y


de igual norma.
Proposición 4.4 Todos los c-v M, ortogonales a un c-v como de
tiempo, son como de espacio y forman un subespacio tridimensional como de
espacio.
Para su demostración consideremos primero que, si
0 0
=0 = · (3.81)

entonces, como = ( 0 ) es como de tiempo, se debe cumplir que 0


6= 0 y
( 0 )2 | |2 y por lo tanto
0 0
| | | · | | · |
= (3.82)
| 0| | 0| ( 2 )1 2

Elevando al cuadrado ambos lados de esta desigualdad


0 0 2
| | | · |2 2 2
= ( 0 )2 = 2
| 0 |2 | |2 | | 2

2
= = ( 0 )2 2
0 (3.83)
66 CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

Utilizando un argumento similar al anterior, se puede probar que todo


vector ortogonal a un vector como de luz es como de espacio, salvo el caso
tratado anteriormente (Proposición 4.3).
Nota 4.3 Claramente existen tres c-v como de espacio ortogonales entre
sí, pero solo hay dos c-v como de espacio mutuamente ortogonales, que sean a
su vez ortogonales a un c-v dado como de luz. Esta situación se puede ilustrar
tomando = (1 1 0 0), el cual es un c-v como de luz y 1 = (0 0 1 0) y
2 = (0 0 0 1) c-vectores como de espacio, ortogonales entre si y ortogonales
al c-v . Ahora, es claro que cualquier otro c-v como de espacio, ortogonal a
1 y 2 , debe tener la segunda componente no nula y por lo tanto ya no sería
ortogonal al c-v . Para probar esto, por contradicción, supongamos que
existe un vector 3 = ( 0 1 2 3 ) como de espacio y ortogonal a los c-v ,
2
1 y 2 . Entonces, de la ortogonalidad con 1 y 2 se obtiene que = 3 = 0,
0 1
y de la ortogonalidad con se tiene que = , por lo tanto la norma del
c-v 3 está dada por:

3 · 3 = ( 0 )2 ( 1 )2 = 0 (3.84)

lo cual implica que 3 sería como de luz, contradiciendo la hipótesis inicial.


Nota 4.4 Análogo a la descomposición de vectores ordinarios en com-
ponentes ortogonales, una de ellas a lo largo de un vector dado , con
= + , en donde es ortogonal a , podemos representar cualquier
c-v M como
= + (3.85)
con un c-v fijo como de tiempo y un único c-v como de espacio ortogonal
a , el cual está completamente determinado por por el c-v , siendo un
parámetro real.
Capítulo 4

Cinemática relativista

4.1. Introducción
En este capítulo se desarrollará la cinemática relativista como una apli-
cación de los cuadri-vectores. En las dos primeras partes definiremos los c-
vectores velocidad y aceleración y en la última parte introduciremos el c-
vector número de onda, como una consecuencia de la invarianza relativista
del producto punto y se discutirá el efecto Doppler y la aberración de la luz
como una consecuencia de las leyes de transformación de los c-vectores.

4.2. Cuadri-vector velocidad


Definamos el c-v posición como un elemento del espacio M el cual de-
scribe el instante de tiempo y posición espacial de un evento físico cualquiera,
cuyas coordenadas para un observador inercial están dadas por =
( 0 1 2 3 ).
Por ejemplo, la trayectoria de una partícula elemental, es decir, su posi-
ción espacial en cada instante de tiempo, la podemos describir por un c-v
posición ( ) como función de algún parámetro y a esta función ( ) se
le llama la línea de universo de la partícula. En física no relativista es usual
utilizar como parámetro la coordenada temporal . Sin embargo es claro
que en el caso relativista este no es el parámetro más adecuado, aún cuan-
do se puede usar, pues él depende del observador. Para describir la línea de
universo de una partícula material es usual, dada su interpretación física di-
recta, utilizar como parámetro al tiempo propio de la partícula, es decir,

67
68 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

el tiempo medido por un reloj que ”viaja con la partícula”, el cual es un


invariante relativista y así es un parámetro independiente del observador. De
lo discutido en el parágrafo anterior, si 1 y 2 son las coordenadas de dos
eventos medidos por un observador , entonces el intervalo espacio-temporal
entre los dos eventos está dado por la expresión:
2 0 0 2 1 1 2 2 2 2 3 3 2
=( 2 1) ( 2 1) ( 2 1) ( 2 1) (4.1)

Si las coordenadas 1 y 2 representan dos posiciones sucesivas de una


2
partícula material, entonces es mayor que cero y nos mide el tiempo
propio entre los dos eventos (ecuación (3.58)). De esta manera ( ) nos
describe la posición espacio-temporal de una partícula en función del tiempo
propio , transcurrido desde un instante inicial arbitrario, es decir (0) nos
representa la posición espacio-temporal de la partícula en = 0. Notemos
que esta descripción de la cuadri-posición en función de solo es posible para
partículas que se mueven a una velocidad menor que la de la luz, pues para
el caso de fotones (u otras partículas con masa en reposo nula), dado que
2
ellas solo se pueden mover a la velocidad de la luz, el intervalo entre dos
puntos de su línea de universo siempre es cero.
La velocidad física de una partícula se define como

= (4.2)

en donde son las coordenadas de posición y el tiempo medido por algún


observador inercial . Podemos generalizar el concepto de velocidad al caso
de cuadri-vectores de una manera independiente del observador, definiendo
el c-v velocidad (c-velocidad) por:

:= (4.3)

en donde ( ) es el c-v posición que describe la línea de universo de una


partícula material y el parámetro tiempo propio. Para encontrar la relación
entre las componentes de la c-velocidad y la velocidad física medida en un
sistema de referencia inercial , basta tener en cuenta la ecuación (3.58). Es
decir, con la notación
0 1 2 3 0
=( )=( )=( ) (4.4)
4.2. CUADRI-VECTOR VELOCIDAD 69

tenemos que para una partícula material el tiempo propio transcurrido entre
dos posiciones sucecivas
0 1 2 3 0
=( )=( ) (4.5)

y
0 0 1
+ = ( + + 1 2
+ 2 3
+ 3
)
0 0
= ( + + ) (4.6)

está dado por la expresión:


p
= ( 0 )2 ( )2 (4.7)

y por lo tanto, derivando con respecto a la coordenada temporal, tenemos


r
= 1 ( )2
1
= ( ) := p (4.8)
1 2 2

en donde = es la velocidad física de la partícula medida en el sistema


de referencia . De esta última ecuación es fácil obtener la relación entre las
componentes de la c-velocidad
0 1 2 3
=( ) (4.9)

y la velocidad física en , pues aplicando la regla de la cadena para las


derivadas se obtiene
0
= = ( )

= ( ) = ( )( ) (4.10)

Entonces
0 1 2 3
= ( ) ; = ( ) ; = ( ) ; = ( ) (4.11)

Por ejemplo, para una partícula en reposo = 0 tenemos que el cuadri-


vector velocidad está dado por

= ( 0) (4.12)
70 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

Puesto que para determinar unívocamente la velocidad de una partícula


se requieren tres parámetros, por ejemplo, las tres componentes de la ve-
locidad respecto a algún sistema de referencia y la c-velocidad tiene cuatro
componentes, entonces estas componentes no pueden ser todas independi-
entes y debe existir una relación entre ellas. Esta relación se puede obtener
teniendo en cuenta el hecho de que la norma al cuadrado de todo c-v es un
invariante relativista, así
2 2 2 2 2
= = ( )( )= (4.13)

Esta relación indica que todo c-v velocidad es como de tiempo y geométri-
camente representa el c-v tangente a la línea de universo de una partícula
material, generalizando de esta forma los conceptos usuales de curva y su
vector tangente (velocidad).
Notemos que el valor de la norma al cuadrado del c-v velocidad se hubiera
podido obtener directamente, sin realizar ningún cálculo, pues, dado que esta
norma es un invariante, siempre podemos escoger un sistema de referencia
inercial particular, por ejemplo, aquel para el cual la partícula está momen-
táneamente en reposo, en donde = ( 0), y asi directamente se obtiene
2 2
que = . Este ejemplo ilustra uno de los hechos que hacen del cálculo
con c-vectores una herramienta muy poderosa y en general más simple.
Otra propiedad muy importante de los c-vectores es que todos se transfor-
man, por definición, de la misma forma bajo una transformación de Lorentz,
lo cual nos permite obtener de una manera más simple, pero más general, las
leyes de transformación entre sistemas de referencia inerciales de las variables
físicas. Por ejemplo, el teorema de adición de velocidades se sigue directa-
mente del hecho que siendo un c-v, entonces sus componentes medidas en
dos sistemas de referencia y 0 están relacionadas por las ecuaciones de
transformación de Lorentz (ecuaciones (3.43), (3.44), (3.45) y (3.46)):
0 0 1
= ( )( ) (4.14)
1 1 0
= ( )( ) (4.15)
2 2
= (4.16)
3 3
= (4.17)
En donde es la velocidad del sistema de referencia 0 respecto al sis-
tema y = . Hemos colocado explícitamente el argumento del factor
4.2. CUADRI-VECTOR VELOCIDAD 71

, para distinguirlo del asociado a la velocidad física de la partícula.


Teniendo en cuenta la relación entre las componentes de la c-velocidad y la
velocidad física (ecuación (4.11)), válidas en cualquier sistema de referencia,
la ecuación (4.14) nos da directamente la ley de transformación del factor
de la partícula:
( ) = ( ) ( )(1 2
) (4.18)

y teniendo en cuenta esta relación, se obtiene, de las otras tres ecuaciones


(4.15), (4.16) y (4.17), el teorema de adición de velocidades o equivalente-
mente la ley de transformación de las componentes de la velocidad física entre
dos sistemas de referencia inerciales:

0 ( ) = ( )( ( ) ( )) (4.19)

entonces
0 = (4.20)
(1 2 )
y similarmente
p
1 2 2
0 = (4.21)
(1 2 )
p
1 2 2
0 = (4.22)
(1 2 )

Para finalizar esta sección, daremos dos resultados importantes, que serán
de utilidad en la dinámica relativista.
Proposición 5.1 Cualquier c-vector = ( 0 ) como de tiempo ( 2
0), y dirigido al futuro ( 0 0), puede ser expresado como un multiplo de
una c-velocidad .
Para esto basta tomar
2
= (4.23)

Proposición 5.2 Dado un c-vector como de tiempo, siempre es posible


encontrar un sistema de referencia para el cual las componentes del c-vector
sean ( 0 0).
Teniendo en cuenta la Proposición 5.1, basta con probar que se cumple
para una c-velocidad. Sea = ( )( ) en un sistema de referencia y
0
consideremos un segundo sistema de referencia cuya c-velocidad respecto
72 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

al sistema sea , entonces claramente las componentes de la c-velocidad


respecto a 0 son ( 0). La velocidad física del sistema es entonces . En
efecto, si escogemos el eje temporal de 0 paralelo a , podemos eliminar
sus componentes espaciales; en caso que el c-vector esté dirigido al pasado
podemos aplicar los mismos argumentos a la velocidad . Esta situación de
elección de los ejes nos permite, en muchas situaciones simplificar cálculos,
pues por ejemplo si es un c-vector cualquiera no nulo, siempre podemos
absorber dos de sus componentes espaciales (digamos 2 y 3 ) rotando los
ejes espaciales del sistema de referencia y escoger el eje 0 o 0 a lo largo
del vector y eliminar una componente más, bien sea 1 (como en el caso
anterior) si es un c-vector como de tiempo, o 0 si es un c-vector
como de espacio.

4.3. Cuadri-vector aceleración


De manera similar a la c-velocidad, definimos el c-v aceleración como la
derivada de la c-velocidad respecto al tiempo propio

0 1 2 3
=( ) := (4.24)

Para encontrarar la relación de las componentes de la c-aceleración con


la aceleración física, i.e., con la derivada de la velocidad respecto al tiempo

= (4.25)

medida en un sistema de referencia, basta con utilizar la relación (4.8) en


la ecuación que relaciona las componentes de la c-velocidad con (ecuación
(4.11)) medidas en algún sistema de referencia :

= = ( )( )
( ) ( )
= ( )( + ( ) ) (4.26)

Consideremos un sistema de referencia inercial para el cual la partícula


se encuentra momentáneamente en reposo, i.e., = 0, entonces para este
sistema las componentes de la c-aceleración toman la forma

= (0 ) (4.27)
4.3. CUADRI-VECTOR ACELERACIÓN 73

A esta aceleración física se le llama aceleración propia y es un invariante


relativista, pues la norma al cuadrado del c-v aceleración está dada por
2
= | |2 (4.28)

Esta relación indica también que la c-aceleración es un c-vector como de


espacio. Además, los c-vectores velocidad y aceleración son ortogonales pues,
en el sistema de referencia propio de la partícula el c-vector velocidad tiene
componentes ( 0) y por lo tanto el producto interno entre los c-vectores
velocidad y aceleración, que es también un invariante, está dado por:

· = =0 (4.29)

Este resultado se puede obtener directamente, sin hacer uso de un sistema


particular de referencia, pues dado que 2 = 2 , se tiene entonces que

2
0= =2 · =2 · (4.30)

Podemos proceder de manera similar como se hizo para obtener las leyes
de transformación de las componentes de la velocidad entre sistemas de ref-
erencia inerciales y calcular las ecuaciones de transformación para la acel-
eración. Sin embargo, dado que estas expresiones no son de mucha utilidad,
pospondremos la interpretación física de la aceleración para el siguiente capí-
tulo sobre dinámica relativista y nos limitaremos en este punto a dar un
ejemplo sobre la cinemática de un sistema con aceleración propia constante.

4.3.1. Viaje interestelar


Este ejemplo ilustra uno de los resultados más sorprendentes de la teoría
especial de la relatividad, conocido históricamente como la paradoja de los
mellizos de Langevan. Como veremos, este resultado no es de ninguna manera
una paradoja, pero si es ilustrativo plantearlo en estos términos, pues nos
permite entender de manera más precisa el principio de relatividad y evitar un
error muy común que se presenta cuando se analizan situaciones o fenómenos
desde el punto de vista de diferentes observadores inerciales.
Supongamos que un mellizo parte en un viaje espacial mientras que el
otro permanece en la tierra, entonces como veremos en el siguiente ejemplo
numérico que vamos a tratar, el mellizo viajero regresa a la tierra al cabo
de unos cuantos años medidos por relojes de la nave espacial, mientras que
74 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

para el mellizo que permaneció en la tierra habrían transcurrido miles años


medidos por relojes del sistema de referencia de la tierra. Claramente no hay
simetría en el análisis de la situación vista por los dos mellizos, pues el mellizo
viajero no constituye un sistema de referencia inercial y por lo tanto no es
válido (como se plantea en la paradoja) suponer que visto desde la tierra,
es el mellizo de la nave a quien le transcurren miles de años. Esta situación
asimétrica se mantiene aún en el caso extremo donde el viaje se realice a
velocidad constante, pues si el mellizo viajero regresa a la tierra, éste tiene
que frenarse e invertir la velocidad en algún momento, lo cual implica que el
sistema de referencia cohete no puede considerarse como un sistema inercial.
Consideremos un cohete que parte del reposo en la tierra con una acel-
eración propia constante igual a (la aceleración de la gravedad sobre la
superficie de la tierra) y viaja hacia el centro de la galaxia. Supongamos que
la mitad del viaje lo realiza acelerando y la otra mitad frenando, también
con aceleración propia . Tomaremos como sistema de referencia inercial la
tierra, con su origen de coordenadas en la tierra, el origen del tiempo en el
instante en que la nave parte y como eje x la dirección del movimiento de la
nave. Entonces las componentes de la c-velocidad y c-aceleración de la nave
con respecto al sistema tierra están dadas por:
0 0
= ( )=( 0 0) (4.31)
0 0
= ( )=( 0 0) (4.32)

las cuales satisfacen las siguientes relaciones:


2 2 0 2 2
= =( ) (4.33)
0 0
· =0= (4.34)
2 2 0 2 2
= =( ) (4.35)
0
De la ecuación (4.34) despejamos
0 0
= (4.36)

y reemplazamos en la ecuación (4.35), entonces


µ ¶2
2 2
= [1 0
] (4.37)
4.3. CUADRI-VECTOR ACELERACIÓN 75

Utilizando la ecuación (4.33) obtenemos


0
= (4.38)

y de esta ecuación y la (4.36) se llega a la relación:


0
= (4.39)

Diferenciando con respecto al tiempo propio la ecuación (4.38) y haciendo


uso de la ecuación (4.39), obtenemos una ecuación diferencial para :
2 0 2
0
2
= = = 2
(4.40)

entonces
2 2

2 2
=0 (4.41)
cuya solución está dada en términos de funciones hiperbólicas, como se puede
probar por sustitución directa,

= 1 sinh( )+ 2 cosh( ) (4.42)

con 1 y 2 constantes de integración, las cuales se pueden determinar uti-


lizando las condiciones iniciales: la nave parte del reposo con aceleración
propia , i.e.,

( = 0) = 0 (4.43)
| =0 = (4.44)

Entonces, de la primera condición se obtiene que 2 = 0 y de la segunda


condición
= 1 cosh(0) 1 = (4.45)
Así, obtenemos las siguientes ecuaciones diferenciales para las coorde-
nadas ( 0 ) de la nave, medidas desde el sistema tierra:

= = sinh( ) (4.46)
0
0
= = cosh( ) (4.47)
76 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

en donde la segunda ecuación se obtiene de la ecuación (4.33).


Integrando estas ecuaciones tenemos
2
0
= sinh( )+ 1 (4.48)

2
1
= cosh( )+ 2

en donde 1 y 2 son constantes de integración. Aplicando las condiciones


iniciales 1 = 0 = 0 para = 0 determinamos las constantes de integración
y obtenemos la ecuación para la trayectoria o línea de universo de la nave,
en términos del parámetro (tiempo propio de la nave):
0 2 1
= sinh( ) (4.49)

2 1
= (cosh( ) 1) (4.50)
En la Figura 4.1 se muestra un gráfico de la línea de universo de la nave,
en el sistema de referencia tierra. En este diagrama la línea de universo de
la tierra es el eje y también se ha dibujado allí, el cono futuro del evento
P, es decir, del evento: partida de la nave en la tierra. La línea de universo
del cohete siempre tiene que estar dentro del cono de luz del evento P y en
todo punto la tangente a la línea de universo es menor de 45 , con respecto
al eje , indicando que la velocidad del cohete siempre es menor que , como
lo exige la relatividad. Notemos además, que la línea de universo del cohete
intercepta a la línea de universo de la tierra en dos puntos: en el instante del
lanzamiento de cohete y luego en el instante en que éste regresa a la tierra.

A partir de estas ecuaciones podemos obtener toda la información que


se quiera respecto al viaje. Por ejemplo, calculemos la distancia a la cual se
encuentra el cohete de la tierra y su velocidad al cabo de 40 años medidos en
la tierra. Para este fin es más conveniente trabajar en unidades de = 1, y
medir las distancias en años-luz, es decir la unidad de longitud corresponde
a la distancia que recorre la luz en un año. En esta unidades el valor de
la aceleración de la gravedad es ' 1 1 ( ˜ ). Como estamos
trabajando con unidades de = 1 tenemos que 0 = = 40 ˜ , entonces,
despejando de la ecuación (4.49)

= sinh 1 ( 0
) = sinh 1 (40) ' 4 38 ˜ (4.51)
4.3. CUADRI-VECTOR ACELERACIÓN 77

Figura 4.1: Línea de universo del cohete

y remplazando este valor del tiempo transcurrido en la nave (tiempo propio)


en la ecuación (4.50), obtenemos la distancia a la cual se encuentra la nave
de la tierra:

= [cosh(4 38) 1] ˜ = 39 01 ˜ (4.52)

La velocidad de la nave en cualquier instante la podemos obtener derivan-


do las ecuaciones (4.49) y (4.50), y de la relación entre las componentes de
su c-velocidad y su velocidad física tenemos que:

= ( 0 ) = ( )(1 ) (4.53)
= (cosh( ) sinh( ) 0 0) (4.54)

por lo tanto, despejando la velocidad = ( 0 0) de esta relación, tenemos


que la velocidad de la nave en ese punto de la trayectoria es:

= tanh( ) = tanh(4 38) = 0 9997 (4.55)

El centro de la galaxia se encuentra aproximadamente a unos 30000 de


la tierra, puesto que la mitad del viaje se hace acelerando y la otra mitad
desacelerando, entonces por simetría, el tiempo propio para que la nave llegue
78 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

al centro de la galaxia es el doble del tiempo necesario para recorrer los


primeros 15000 . Despejando de la ecuación (4.50) tenemos:

= cosh 1 (15000 + 1) = 10 309 ˜ (4.56)

y por tanto el tiempo medido en la nave para realizar este viaje es de


20 618 ˜ , tiempo perfectamente razonable para un viaje interestelar. Aho-
ra, si este viajero regresa a la tierra siguiendo el mismo plan de vuelo, entonces
el viaje completo le llevaría un tiempo de 41 236 ˜ , mientras que el tiempo
transcurrido en la tierra sería de
0
= 4 sinh(10 3) = 60003 9 ˜ (4.57)

Este ejemplo muestra la famosa paradoja de los mellizos de Langevan,


pero ilustra también claramente la asimetría de la situación.
En el relato de la paradoja se afirma que dada la relatividad de los sis-
temas de referencia, esto es, la equivalencia de todos los sistemas de referen-
cia inerciales para describir los fenómenos físicos, podemos considerar el viaje
visto desde la nave espacial y ver que es la tierra la que se aleja de la nave
y por lo tanto se espera, que cuando la tierra regrese a la nave, entonces sea
el mellizo que permanecio en la nave al que le han transcurrido 60003 9 ˜ ,
mientras que al viajero de la tierra tan solo le habrían pasado 41 2 ˜ . La
falsedad de este último razonamiento radica en el hecho que la nave espacial
está acelerada y por lo tanto no es un sistema de referencia inercial, a diferen-
cia del sistema tierra, lo que hace inválido aplicar el principio de relatividad
restringida.
Este efecto de retraso temporal de relojes, que se encuentran sometidos a
una aceleración, se ha probado experimentalmente utilizando relojes atómi-
cos (de alta precisión), uno de los cuales permanece en la tierra y el otro viaja
en un avión alrededor de la tierra. Si bien, el efecto del retardo temporal del
reloj viajero es muy pequeño, del orden de millonésimas de segundo, este
tipo de relojes ha permitido hacer estas medidas con la suficiente precisión,
mostrando este espectacular efecto relativista. Es de anotar que para el cál-
culo del retardo temporal en este experimento terrestre, es necesario tener en
cuenta los efectos asociados al campo gravitacional, es decir hay que trabajar
en el contexto de la teoría general de la relatividad, sin que se invalide de
ninguna manera las predicciones de la teoría especial de la relatividad.
Una última conclusión que se desprende de este ejemplo, es que los viajes
interestelares son físicamente posibles, pues basta con lograr aceleraciones
4.4. CUADRI-VECTOR DE ONDA 79

suficientes durante un tiempo adecuado, para que un viajero en un tiempo


razonable atraviese nuestra galaxia, o incluso viaje a otras galaxias, pero
definitivamente no pretenda regresar a la tierra, pues en la tierra podrían
haber transcurrido varios millones de años.

4.4. Cuadri-vector de onda


Una de las contribuciones más importantes de las ecuaciones de Maxwell
lo constituye la propagación de las ondas electromagnéticas. Debido a que la
ecuación de ondas en el vacío (ver por ejemplo la ecuación (2.14)) es lineal,
vale el principio de superposición y así cualquier onda electromagnética se
puede escribir como una suma o superposición de ondas planas de la forma
±( · )
( )= (4.58)

en donde es la amplitud del campo (por ejemplo el campo eléctrico,


magnético, potencial vectorial o potencial escalar), la frecuencia de la onda,
el vector de onda y el signo ± indica el sentido de propagación de la onda.
La cantidad
= · (4.59)
se llama la fase de la onda y debe ser un invariante relativista, esto es, debe
ser la misma para todos los observadores inerciales. Si definimos el c-vector
de onda como
:= ( ) (4.60)
entonces la fase de la onda se puede escribir como el producto interno Min-
kowskiano entre el c-vector de onda y el c-vector posición = ( ):

= · (4.61)

la cual es un invariante relativista. De las propiedades de transformación de


los c-vectores se tiene que las componentes del c-vector de onda, medidas por
dos observadores inerciales y 0 están relacionadas por las ecuaciones de
transformación:
0
= ( )( ) (4.62)
0
= ( )( 2
) (4.63)
0
= (4.64)
80 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

0
= (4.65)
De las propiedades de los c-vectores sabemos que la norma Minkowskiana
de todo c-vector es un invariante relativista y por lo tanto se espera que
ésta tenga un significado físico. Si tomamos la norma del c-vector de onda
obtenemos ¯ ¯2
2
2 ¯ ¯
= 2 ¯ ¯ =0 (4.66)
pues, si tenemos en cuenta la relación
¯ ¯ de dispersión para las ondas electro-
¯ ¯
magnéticas en el vacío, = ¯ ¯, vemos que el c-vector de onda es un
c-vector nulo o como de luz, y cuya norma nos da la relación de dispersión
para ondas electromagnéticas en el vacío.
Consideremos como ejemplo una onda electromagnética plana de fre-
cuencia , que se propaga respecto al sistema a lo largo del eje , i.e.,
0
=( 0). Entonces, para un observador que se mueve respecto a
con velocidad a lo largo de los ejes paralelos 0 , tenemos
0 0 0
= ( ) = 2
( ) = (4.67)

En primer lugar, la dirección de propagación de la onda para el observador


0
está dada por la relación
0 0
= 2
( ) = ( ) (4.68)

en donde la última igualdad se obtuvo utilizando la relación de dispersión


para la onda en el sistema . En el límite de bajas velocidades, es decir, para
velocidades del observador 0 tales que ¿ , podemos aproximar el factor
( ) 1, y obtenemos el fenómeno clásico de la aberración de la luz estelar,
discutida en el capítulo segundo.
El efecto Doppler es un fenómeno asociado a las ondas en general y cor-
responde al cambio en la frecuencia medida por un observador con respecto
a la frecuencia emitida por la fuente, debido a los movimientos relativos del
observador y/o de la fuente y en el caso particular de ondas que requieran
un medio para propagarse, tales como las sonoras o elásticas, también de-
pende de la velocidad del medio. En física no relativista el efecto Doppler
se puede entender fácilmente si tenemos encuenta que, por ejemplo, cuando
la fuente se está moviendo en dirección del observador, el tiempo entre dos
pulsos recibidos es menor que el tiempo entre la emisión de estos dos pulsos,
4.4. CUADRI-VECTOR DE ONDA 81

dando lugar así a una frecuencia detectada mayor a la frecuencia emitida,


fenómeno llamado corrimiento hacia el azul. La misma situación se presenta
si es el observador el que se acerca a la fuente. Cuando la fuente se aleja
del observador, la frecuencia detectada es menor que la emitida y el efecto se
llama corrimiento al rojo. En el caso relativista se presenta una situación sim-
ilar, pero el factor de corrimiento se ve corregido debido al comportamiento
del tiempo para diferentes observadores. En las ecuaciones de transforma-
ción para el c-vector de onda ( (4.62) a la (4.65)), está contenido el efecto
Doppler relativista para la situación más general posible. Para encontrar las
relaciones estandar del efecto Doppler relativista que se tratan usualmente
en los textos de relatividad especial, vamos a considerar casos particulares
de las ecuaciones de transformación (4.62) a la (4.65).
Supongamos que la fuente está en reposo respecto al observador y que
emite un frente de ondas de frecuencia a lo largo del eje , entonces las
componentes del c-vector de onda son ( 0 0). De la ecuación (4.62),
y teniendo en cuenta que = , para el observador 0 tenemos

0
= ( )( )= ( )(1 ) (4.69)

en donde el signo de la velocidad es positivo si el observador se aleja de


la fuente y negativo si se acerca. Para el caso de movimiento del observador
transversal a la dirección de propagación, consideremos que el observador
emite un frente de ondas de frecuencia en la dirección , entonces el
c-vector de onda toma la forma = ( 0 0). A partir de la ecuación
(4.62) la frecuencia medida por el observador 0 es
0
= ( ) (4.70)

Una situación más general de interés se presenta cuando el tren de ondas


emitido por la fuente viaja en el plano formando un ángulo con respecto
al eje de las , entonces el c-vector de onda es = ( 0), con
¯ ¯ q ¯ ¯
¯ ¯ 2 2; ¯ ¯
tan = ; ¯ ¯= + ¯ ¯= (4.71)

0
Entonces para el observador se tiene que

0
= ( )( ) = ( ) (1 cos ) (4.72)
82 CAPÍTULO 4. CINEMÁTICA RELATIVISTA

Claramente esta última relación contiene, como casos particulares, las


situaciones descritas anteriormente. Cuando = 0 obtenemos la ecuación
(4.69) y para = 90 se reduce a la ecuación (4.70).
Notemos que el efecto Doppler transversal, ecuación (4.70), es de ori-
gen estrictamente relativista puesto que es una consecuencia de la dilatación
temporal, situación que obviamente no se presenta en el tratamiento clásico.
Parte II
Dinámica relativista

83
Capítulo 5
Dinámica relativista

En este capítulo se desarrollarán las leyes de la dinámica relativista uti-


lizando desde un principio, la formulación de cuadrivectores, la cual permite
formular las leyes de la dinámica relativista como una generalización de las
leyes fundamentales de la mecánica Newtoniana.

5.1. Ecuaciones de movimiento


Definamos el cuadri-vector momentun por

:= 0 = 0 (5.1)

en donde 0 es la masa inercial propia de la partícula, es decir, la masa


inercial medida en el sistema de referencia en reposo de la partícula. 0
también es llamada masa en reposo y es su cuadri-velocidad. Por definición,
la masa en reposo de una partícula es un invariante relativista que caracteriza
a la partícula, pues si tomamos la norma del c-v momentun, ecuación (5.1),
obtenemos:
2
= 20 2 (5.2)
dado que la norma al cuadrado del c-v velocidad es 2 .
A partir de esta definición del c-momento de una partícula, podemos
mantener la misma definición de la segunda ley de Newton, pero formulada
para las cantidades c-vectoriales. Así, la ecuación de movimiento relativista
está dada por
= = 0 (5.3)

85
86 CAPÍTULO 5. DINÁMICA RELATIVISTA

en donde es la c-aceleración y es la c-fuerza. Para interpretar las compo-


nentes del c-momento y c-fuerza en términos de variables dinámicas físicas,
específicamente, en términos de su cantidad de movimiento lineal (momen-
tun), de su energía y de la fuerza, consideremos en primer lugar el c-momento
(ecuación (5.1)) y hagamos uso del hecho que a bajas velocidades comparadas
con la velocidad de la luz, i.e. ¿ , las ecuaciones de la relatividad deben
reducirse a las ecuaciones de la mecánica Newtoniana. Teniendo en cuenta
que las componentes de la c-velocidad están relacionadas con la velocidad de
la partícula a través de la ecuación = ( )( ), entonces (ver capítulo
anterior) las componentes del c-momentun serán

=( 0 ( ) 0 ( ) ) =: ( ) (5.4)

En esta última ecuación hemos definido las cantidades (con unidades


de energía) y (con unidades de momento) por
2
= (5.5)

= (5.6)
con
0
:= 0 ( )= p (5.7)
1 2 2

llamada masa inercial relativista de la partícula, nombre que será justificado


en el siguiente análisis. Teniendo en cuenta que en el límite de bajas veloci-
dades el factor ( ) lo podemos expandir en una serie en potencias de ( ),
reteniendo términos hasta orden ( )2 ,
2
1 4 4
( )=1+ 2
+ O( ) (5.8)
2
entonces, las componentes espaciales del c-momentun toman la forma
2
1 4 4
= 0 (1 + 2
+ O( )) 0 (5.9)
2
la cual, en el límite de bajas velocidades se reduce a la definición del mo-
mentum clásico. Así, la definición del momentum relativista de una partícula
por la ecuación (5.6), nos conduce a interpretar la masa relativista (ecuación
(5.7)) como la inercia de una partícula, la cual depende de su velocidad.
5.1. ECUACIONES DE MOVIMIENTO 87

Para interpretar la componente temporal del c-momento, consideremos


de nuevo el límite de bajas velocidades de la ecuación (5.5). Remplazando la
expansión (5.8) en la definición (5.7) tenemos
2
2 1 4 4 2 1 2
= 0 0 (1 + 2
+ O( )) 0 + 0 (5.10)
2 2
la cual, salvo el término constante 0 2 , corresponde a la definición newtoni-
ana de energía cinética. Así, este resultado nos conduce a definir la cantidad
2 2
:= 0 (5.11)

como la energía cinética relativista de una partícula. Esta definición tiene


sentido en cuanto que la función depende de la velocidad de la partícula,
se anula para = 0 y en el límite de bajas velocidades se reduce a la energía
2
cinética clásica. La cantidad = se define como la energía total de la
partícula y a la cantidad dinámica
2
0 := 0 (5.12)

la definimos como su energía en reposo. Esta cantidad 0 adquiere el sentido


físico de una energía, solamente si es posible transformar esta forma de en-
ergía (asociada a la masa y no a su estado de movimiento) en otras formas
de energía. Einstein, en su segundo artículo de 1905 sobre relatividad, titu-
lado ”Depende la inercia de un cuerpo de su contenido de energía” postula
que esta forma de energía, asociada a la masa en reposo de una partícula, es
posible transformarla en otras formas de energía, dándole así sentido físico a
esta definición y sugiere que esta transformación de masa en energía se puede
medir en el decaimiento radioactivo de las sales de radio. Este postulado le
valió a Einstein el ganarse el dudoso honor de ser ”el padre de la bomba
atómica”.
Otro resultado que apoya las definiciones anteriores, nos lo da la inter-
pretación física de las componentes de la c-fuerza, definida por la ecuación
de movimiento (5.3). Haciendo uso de la relación \ = ( ) y de la
definición (5.4) de las componentes del c-momento, tenemos

= = ( )

= ( )( ) = ( )( ) (5.13)
88 CAPÍTULO 5. DINÁMICA RELATIVISTA

En la última igualdad hemos definido la cantidad

= (5.14)

la cual identificamos como la fuerza física que actúa sobre la partícula, pro-
duciendo, de acuerdo con la definión newtoniana de fuerza, un cambio por
unidad de tiempo en el momentum de la partícula. Para sustentar aún más
esta definición de fuerza y de paso la definición de energía total dada, con-
sideremos la relación de ortogonalidad entre la c-velocidad y la c-aceleración
(ecuación (4.29)) · = 0, entonces

· = =0 (5.15)

y de esta ecuación y de la definición de las componentes de la c-velocidad,


obtenemos la relación
2 2 2
( ) ( ) · =0

= · (5.16)
Esto implica que si adoptamos la definición clásica de trabajo

= · (5.17)

entonces se obtiene que


= · = (5.18)
esto significa, que si el trabajo realizado por una fuerza sobre una partícula
es diferente de cero, entonces la partícula cambia su energía total, de acuerdo
con la ecuación (5.18).
Esta última relación nos permite escribir las componentes de la c-fuerza,
definidas en la ecuación (5.13), en la forma
1
= ( )( · ) (5.19)

la cual nos da una interpretación directa de las componentes de la c-fuerza; la


componente temporal representa el trabajo por unidad de tiempo que realiza
la fuerza física sobre la partícula, mientras que las componentes espaciales
forman el vector fuerza.
5.2. LEYES DE CONSERVACIÓN 89

5.2. Leyes de conservación


La dinámica Newtoniana está basada sobre tres postulados fundamen-
tales: La primera ley de Newton o el princio de inercia, la cual también
se puede formular de manera equivalente, como el principio de relatividad
Galileano, siendo el primer postulado de la teoría especial de la relatividad
la generalización de esta primera ley. La segunda ley, que postula la ecuación
de movimiento para una partícula sometida a una fuerza ( = ), se ex-
tiende al caso relativista a través de la ecuación (5.3). La tercera ley llamada
de acción y reacción, que postula el comportamiento de la interacción entre
sistemas, esto es, que la fuerza ejercida sobre una partícula es el resultado
de la interacción de esta partícula con algún sistema y por tanto, sobre este
sistema también interacciona la partícula, efectuando sobre él una fuerza de
la misma magnitud pero de sentido contrario a la ejercida por el sistema
sobre la partícula. Claramente esta ley implica que la acción y la reacción
son eventos simultaneos y por lo tanto no puede ser válida para el caso rel-
ativista en general. Sin embargo, para el caso particular en que coincidan
los puntos de aplicación de las fuerzas de acción y reacción, sí se cumple
la tercera ley de Newton, una situación que se puede presentar cuando los
sistemas que interactúan son partículas puntuales y la interacción entre ellas
se pueda aproximar por una interacción de contacto. Puesto que las inter-
acciones fundamentales (gravitacional, electromagnética, fuerte o nuclear y
débil) que rigen todos los procesos físicos son interacciones a distancia, y
por lo tanto en sentido riguroso, ninguna de estas interacciones fundamen-
tales puede satisfacer la tercera ley de Newton, es claro que el postulado de
Newton sobre la acción y la reacción, deja de ser una ley fundamental en la
naturaleza y su validez queda restringida a sistemas cuyas velocidades típi-
cas séan pequeñas comparadas con la velocidad de la luz, o para interaciones
puntuales de contacto. Es importante anotar en este punto que, en el marco
de la mecánica Newtoniana, la tercera ley de Newton juega un papel funda-
mental para establecer los teoremas de conservación del momentum y de la
energía mecánica.
Esto nos conduce entonces, a postular un principio de conservación para
la energía y el momentun de un sistema relativista, el cual como veremos,
generaliza las leyes de conservación de la mecánica Newtoniana y adiciona
una nueva forma de energía, llamada energía en reposo, que está asociada a
toda partícula material y que constituye uno de los aportes más importantes
de la teoría especial de la relatividad.
90 CAPÍTULO 5. DINÁMICA RELATIVISTA

Para un sistema aislado de partículas, con c-momentos , =1 2 , el


c-momento total del sistema , defido como
X
:= (5.20)
=1

es una constante de movimiento. Dado que la componente temporal del c-


momento representa la energía total del sistema y las componentes espaciales
corresponden a las componentes del vector momento, entonces el postulado
de la conservación del cuadrimomento asegura que la energía total y el mo-
mentun total de un sistema aislado son constantes del movimiento. Esto
es, si expresamos la ecuación (5.20) en componentes, con =( )y
=( ), obtenemos que la energía total del sistema , definida como la
suma de las energías de las partículas individuales
X
:= (5.21)
=1

y el momentun total del sistema, definido como la suma vectorial de los


momentos individuales de las partículas
X
:= (5.22)
=1

se conservan. Notemos que la ley de conservación de la energía (ecuación


(5.21)) se puede reformular como el postulado de la conservación de la masa
2
inercial, pues de la definición de energía total de una partícula = ,
tenemos que X
= (5.23)
=1

Existe toda una serie de consecuencias interesantes de los postulados de


la dinámica relativista, que las vamos a exponer a través de ejemplos sobre
procesos que se presentan al nivel de las partículas elementales. Es impor-
tante en este punto de la discusión hacer algunas anotaciones respecto a la
diferencia, tanto en las aplicaciones como en la metodología de trabajo, en-
tre la dinámica Newtoniana y la relativista. En mecánica Newtoniana, por lo
general se conocen las fuerzas (su forma funcional), por ejemplo la fuerza de
la gravedad, de Coulomb, del tipo oscilador armónico, de rozamiento, etc.,
y a partir de ellas , utilizando la segunda ley de Newton se encuentran las
5.2. LEYES DE CONSERVACIÓN 91

trayectorias de las partículas y las leyes de conservación permiten determinar


constantes de movimiento, simplificando así el problema dinámico.

En el caso de la relatividad la situación se modifica un poco, pues, sal-


vo el caso de la fuerza de Lorentz, que describe la fuerza que actúa sobre
una partícula cargada inmersa en un campo electromanético, la cual nos per-
mite describir el movimiento de la carga solucionando la ecuación dinámica
de movimiento, las otras interacciones fundamentales no admiten, por una
parte, una descripción clásica funcional de la fuerza que esté de acuerdo con
los principios de la relatividad y por otra parte, es conocido que el tratamien-
to de las interacciones fundamentales (incluyendo la electromagnética) debe
hacerse en en marco de la teoría cuántica de campos. El caso de la electrod-
inámica es especial, pues esta interacción fundamental admite una descrip-
ción clásica dada por las ecuaciones de Maxwell, las cuales son ecuaciones
relativistas que describen correctamente los fenómenos electromagnéticos a
nivel macroscópico. La diferencia de la electrodinámica clásica con la ley
de gravitación universal de Newton, la cual también describe correctamente
los fenómenos gravitacionales a escalas macroscópicas, radica en el hecho que
esta última no es una teoría relativista, pues la fuerza gravitacional Newtoni-
ana es una interacción a distancia e independiente del tiempo. Esta situación
fue precisamente la que condujo a Einstein a buscar una teoría de la gra-
vitación que estuviera de acuerdo con los principios de la relatividad y que
en el límite de bajas velocidades se redujera a la teoría Newtoniana de la
gravedad, logrando su objetivo en 1915, cuando formuló la Teoría General de
la Relatividad.

Si bien, las aplicaciones fundamentales de la teoría especial de la relativi-


dad de dan en el marco de las partículas elementales y como fue enfatizado
en el parágrafo anterior, para su descripción dinámica se requiere de una
teoría cuántica de campos, es posible como veremos, obtener toda una se-
rie de resultados importantes a partir de la dinámica relativista a partir de
los principios de conservación, sin necesidad de recurrir a una descripción
completa de las interacciones que rigen estos procesos.

Antes de entrar a estudiar las principales consecuencias de los postulados


de la dinámica relativista, a través de fenómenos y procesos físicos, daremos
algunas definiciones y propiedades y unos resultados generales que serán de
utilidad más adelante.
92 CAPÍTULO 5. DINÁMICA RELATIVISTA

5.3. Propiedades del c-momentun


Un primer resultado general que se deriva de la formulación cuadri-vec-
torial de la relatividad surge debido al hecho de que la norma de cualquier
c-vector en un invariante relativista y por lo tanto las cuatro componentes que
conforman un c-vector no son independientes. Así por ejemplo, esta restric-
ción sobre las componentes del c-momentun de una partícula, nos conduce
a una relación entre su energía total y la magnitud de su momentun, pues
dado = ( ) tenemos
2 2 2
= | |2 = (5.24)

Para calcular el valor de este invariente, basta con determinar el c-mo-


mentun de la partícula en un sistema de referencia particular, por ejemplo, en
el sistema de reposo instantaneo de la partícula, para el cual el c-momentun
toma la forma
= ( 0 0) (5.25)
y por lo tanto su norma al cuadrado se reduce a
2 2 2 2 2
= 0 = 0 (5.26)

Esto significa que para una partícula de masa en reposo 0 , energía total
y momentun medidas en un sistema de referencia , se cumple la relación
2 2
| |2 = 2 2
0 (5.27)

o en forma equivalente
2 2
= 0+ | |2 2
(5.28)
Dos conclusiones importantes se desprenden de este análisis: La primera
tiene que ver con el hecho de que el cuadrivector-momentun de una partícula
física debe ser como de tiempo, pues 20 2 0 y la segunda conclusión es
que su norma nos caracteriza a la partícula, pues está dada por la masa
en reposo de dicha partícula, que es un invariante relativista por definición.
Más adelante cuando discutamos el concepto de fotón o partículas de masa
en reposo nula, volveremos sobre la ecuación (5.28).
Consideremos ahora dos partículas de c-momentos 1 y 2 , con masas en
reposo 01 y 02 respectivamente y sea la velocidad relativa entre ellas.
5.3. PROPIEDADES DEL C-MOMENTUN 93

Entonces el producto interno Minkowskiano entre sus c-momentos, que es un


invariante relativista, está dado por
2 2 2
1 · 2 = 01 2 = 1 02 = 01 02 ( ) (5.29)
p
en donde ( ) = 1 2 2 es el factor de la velocidad relativa. Para
obtener esta expresión, basta con calcular el producto interno en el sistema
de referencia propio de una de las partículas (segunda o tercera igualdad de la
ecuación (5.29)), mientras que la última igualdad de esta ecuación se deduce
del hecho que es la velocidad de una de las partículas medida en el sistema
de referencia de la otra (i.e. la velocidad relativa).
En mecánica Newtoniana se define una colisión elástica entre dos partícu-
las, cuando la energía cinética del sistema es la misma antes y después de
la colisión. Así, en una colisión inelástica parte de la energía cinética de las
partículas se transforma en otras formas de energía, como por ejemplo, calor,
ondas mecánicas, etc.. Consideremos ahora una colisión relativista entre dos
partículas puntuales, con c-momentos 1 y 2 antes de la colisión y 01 y 02
después de la colisión. De la hipótesis de conservación del c-momentun se
obtiene que
0 0
1+ 2 = 1+ 2 (5.30)
elevando al cuadrado y utilizando las propiedades del producto interno Min-
kowskiano (ecuación (3.68)) obtenemos
2 2 02 02 0 0
1 + 2 +2 1 · 2 = 1 + 2 +2 1 · 2 (5.31)

Uno de los hechos más interesantes que surge en relatividad y que no


tiene su contraparte clásica, es que en un proceso de colisión (interacción)
entre partículas, es posible que algunas o todas de las partículas iniciales que
intervienen en el proceso se aniquilen y surjan otras diferentes. Que este he-
cho sea posible es una consecuencia de la equivalencia masa-energía (ecuación
(5.12)). Es importante reiterar que los parámetros que caracterizan una clase
de partículas (electrones, protones, etc.) son su masa en reposo, carga eléctri-
ca, spin, y otros números cuánticos. En los procesos que son de interés para
nosotros, solo va a intervenir la masa en reposo de las partículas y por lo
tanto, este único parámetro es suficiente para caracterizar dinámicamente a
una partícula dada.
Retomando la discusión de la colisión entre dos partículas, considere-
mos el caso particular en el cual las partículas que intervienen en el proceso
94 CAPÍTULO 5. DINÁMICA RELATIVISTA

(ecuaciones (5.30) y (5.31)) son las mismas antes y después de la colisión. Si


01 y 02 son las masas en reposo de las partículas, entonces de la relación
(5.26) se tiene que
2 02 2 2
1 = 1 = 01 (5.32)
2 02 2 2
2 = 2 = 02 (5.33)
y por lo tanto la ecuación (5.31) se reduce a la igualdad
0 0
1 · 2 = 1 · 2 (5.34)
Teniendo presente el resultado de la ecuación (5.29), aplicandolo a ambos
miembros de la ecuación (5.34), se llega a que
2 2
01 02 ( )= 01 02 ( 0) (5.35)
con y 0 las velocidades relativas entre las partículas antes y después de la
colisión, de donde se obtiene que
0
= (5.36)

Por lo tanto, llegamos a la conclusión general que la magnitud de la


velocidad relativa entre las partículas no cambia. Esta situación nos conduce
a hacer la siguiente definición:
Una colisión entre partículas se llama elástica, si las partículas que inter-
vienen en el proceso son las mismas antes y después de la colisión, o equiv-
alentemente, si las masas en reposo de las partículas que intervienen en la
colisión no cambian. Con esta definición, el resultado expresado en la ecuación
(5.36) se conoce como el lema de la colisión elástica para dos partículas. Esta
definición de colisión elástica tiene relación con la correspondiente definición
Newtoniana de colisión elástica, pues en el límite de bajas velocidades se re-
duce a la conservación de la energía cinética. Para ver esto, basta con tener
en cuenta la definición de energía cinética relativista como la diferencia entre
la energía total y de reposo. Si llamamos y las energías totales antes y
después de la colisión, entonces de la conservación de la energía total se tiene
2 2 0 2 0 2
= 1 + 2 = 1 + 2 = (5.37)

Por lo tanto, la energía cinética del sistema antes y después de la colisión


es la misma:
2 2 2 2
= 01 02 = 01 02 = (5.38)
5.4. SISTEMA CENTRO DE MASA 95

5.4. Sistema centro de masa


Como vimos en la Proposición 4.6, dado un c-vector como de tiempo
siempre es posible encontrar un sistema de referencia 0 , para el cual sus
componentes se reducen a ( 0 0), dejando además el signo de la primera
componente invariante, puesto que o está dirigido al futuro ( 0 0) o
0
dirigido al pasado ( 0). Si es otro c-vector como de tiempo, sincrono
con , i.e., 0 0 0, entonces en el sistema de referencia 0 se cumple

( + )2 = ( 0
+ 0 2
) 2
= 2
+ 2
+2 0 0
0 (5.39)

por lo tanto, se llega al siguiente resultado importante que lo enunciaremos


como un lema:
Lema 5.1 La suma de dos c-vectores como de tiempo y sincronos, es un
c-vector como de tiempo y sincrono con cada uno de los sumandos.
Por inducción este resultado es válido para una suma cualquiera de c-
vectores como de tiempo sincronos.
Consideremos ahora un sistema de un número finito de partículas no in-
teractuantes, salvo colisiones puntuales mutuas, con masas en reposo 0 =
1 2 y c-momentos y sea un sistema de referencia inercial cualquiera.
Definamos la masa relativista total ¯ del sistema y su c-momentun total ¯
como X
¯ := (5.40)
=1
X X
¯ := = ( ) = (¯ ) (5.41)
=1 =1

en donde hemos definido el momentun total del sistema en la última igual-


dad de la ecuación (5.41). De los postulados de conservación todas las canti-
dades definidas, ¯ y por tanto ¯ y , son constantes en el tiempo. Por el lema
anterior, el c-momentun total del sistema es un c-vector como de tiempo y
dirigido al futuro pues ¯ 0. Por las propiedades dadas en la Proposi-
ción 5.1 y Proposición 5.2, podemos encontrar un sistema de referencia
que lo llamaremos o sistema de referencia centro de masa, para el cual
el c-momentun total ¯ no tenga componentes espaciales, esto es, un sistema
para el cual = 0. La velocidad del sistema de referencia centro de
masa respecto a está dada por

= (5.42)
¯
96 CAPÍTULO 5. DINÁMICA RELATIVISTA

A diferencia de la mecánica Newtoniana, el vector centro de masa de un


sistema de partículas relativistas es dependiente del sistema de referencia
inercial, lo cual se puede entender fácilmente si tenemos en cuenta que la
masa inercial de las partículas depende de la velocidad de las mismas. Sin
embargo, este vector centro de masa siempre está en reposo en el sistema
de referencia . Para ver esto, definamos para un sistema de referencia
inercial , el vector posición centro de masa del sistema como
P
:= P=1 (5.43)
=1

entonces
P P P
=1 + =1 =1
= = = (5.44)
¯ ¯
en donde se han utilizado las definiciones (5.42), (5.43) y (5.44), el hecho de
que ¯ es una constante
P de movimiento y además que para interacciones pun-
tuales (colisión) =1 = 0 entre colisiones. Este resultado significa
que para cualquier sistema de referencia, el centro de masa del sistema se
mueve con la velocidad del sistema centro de masa, lo que no significa que
el vector posición centro de masa sea el mismo para todos los observadores
inerciales. Por esta razón, es usual definir el centro de masa del sistema como
el vector posición medido en el sistema .
Definida la velocidad (ecuación (5.42)), la c-velocidad del centro de
masa está dada por
= ( )( ) (5.45)
entonces, de la definición de c-momentun total (ecuación (5.41)), velocidad
del centro de masa (ecuación (5.42) y la definición de c-velocidad del centro
de masa (ecuación (5.45)), tenemos que
1
¯= (¯ ) = ¯( )= ¯ ( ) (5.46)
Tomando la norma al cuadrado de esta ecuación
¯2 = ¯ 2 2
( ) 2
(5.47)
la cual debe ser un invariante relativista, nos conduce a la definición de la
masa total del sistema de partículas en el sistema de referencia centro de
masa :
¯
:= (5.48)
( )
5.5. ENERGÍA UMBRAL 97

Por lo tanto, podemos escribir el c-momentun total del sistema como

¯= (5.49)

en donde y para el sistema de partículas, juegan el papel de 0


y para una partícula simple. Es importante aclarar que , la masa en
reposo del sistema en , excede a la suma de las masas en reposo de las
partículas del sistema, pues a ella contribuyen también las energías cinéticas
de las partículas individuales, puesto que la energía cinética del sistema en
está dada por
2
= ¯0 2 (5.50)
en donde hemos definido
X
¯ 0 := 0 (5.51)
=1

5.5. Energía umbral


La primera patícula fundamental que se identificó fue el electrón, el cual
era el responsable de la conducción eléctrica. Luego a comienzos de la década
de los treinta, se identificaron el protón y el neutrón como los constituyentes
del núcleo atómico. Por esta época Yukawa desarrolló un modelo para la in-
teracción nuclear, en el cual surgía una nueva partícula fundamental, el pión,
que luego fue observada experimentalmente. Esta época se puede consider-
ar como el comienzo de la física de las partículas fundamentales y ya en la
década de los sesenta, se conocian cientos de nuevas partículas, las cuales
se podían producir en el laboratorio como producto de las colisiones entre
partículas aceleradas a altas energías (por ejemplo electrones contra elec-
trones o protones). Cuando chocan dos partículas con energía cinética sufi-
ciente, se pueden generar nuevas y más masivas partículas, como el resutaldo
de la transformación de energía cinética en energía en reposo de las nuevas
partículas. La pregunta dinámica que surge es ¿Cual en la energía mínima
necesaria de las partículas incidentes, para producir una nueva partícula de
una masa dada?. La respuesta a esta pregunta la constituye el llamado prob-
lema de la energía umbral, que es una de las aplicaciones más importantes
de la dinámica relativista.
Para introducir el concepto de energía umbral, consideremos por ejem-
2
plo un electrón de masa en reposo 0 y energía total = , que choca
98 CAPÍTULO 5. DINÁMICA RELATIVISTA

contra otro electrón en reposo y como producto de la colisión surge, además


de los dos electrones iniciales, una nueva partícula de masa en reposo 0 .
El problema es encontrar la energía mínima necesaria del electrón incidente,
llamada energía umbral, para que esta reacción pueda suceder. La respuesta
no es simplemente ( + 0 ) 2 , i.e., que la energía cinética del electrón inci-
dente sea justamente la energía en reposo de la nueva partícula, pues dado
que el momentun del sistema debe conservarse, el producto de la colisión en
general, debe poseer alguna energía cinética y por lo tanto parte de la en-
ergía inicial debe gastarse en esta energía cinética y la otra parte debe suplir
la energía en reposo de la nueva partícula. De cualquier manera, la energía
mínima (umbral) se tendrá cuando las partículas resultantes de la colisión
estén en reposo en el sistema de referencia del centro de masa del sistema.
Esta última afirmación define el concepto de energía umbral.
Tomemos por el momento el caso general de dos partícula de masas en
reposo 01 y 02 y c-momentos 1 y 2 respectivamente, que al chocar pro-
ducen una nueva partícula de masa en reposo 0 . Entonces, el c-momentun
total del sistema está dado por:
¯= 1 + 2 (5.52)
Elevando al cuadrado esta expresión y teniendo en cuenta la ecuación
(5.29) y la definición (5.48), tenemos
2 2 2 2 2
01 + 02 +2 01 2 = ¯2 = 2 2
(5.53)
De esta relación se obtiene que la energía de la partícula incidente, en el
sistema de referencia del laboratorio, será mínima cuando sea mínima,
lo cual ocurre cuando todas las partículas emergentes estén en reposo en el
sistema de referencia centro de masa. Puesto que en este caso la masa del
sistema centro de masa coincide con la suma de las masas en reposo de las
partículas que salen, el límite de mínima energía (5.53) se reduce a
2 2 2
01 + 02 +2 01 02 ( )=( 01 + 02 + 0) (5.54)
siendo la velocidad de incidencia de la partícula 2. Dadas las masas de las
partículas iniciales y la masa de la nueva partícula, podemos obtener de esta
ecuación la velocidad de la partícula incidente y así la energía umbral. Para
el ejemplo de los dos electrones, que al colisionar crean una nueva partícula
de masa en reposo 0 , podemos despejar de la ecuación (5.54) el factor ( ):
2
2 0 0
( )=1+ + 2
(5.55)
0 0
5.5. ENERGÍA UMBRAL 99

y por lo tanto la energía umbral está dada por


2
2 2 2 0 2
= 0 ( ) = 0 +2 0 + (5.56)
0

Esta ecuación es fundamental cuando se diseñan experimentos para bus-


car nuevas partículas. Como ejemplo, tomemos el caso del último de los
quarks buscado por los físicos de altas energías, el quark top , el cual fue
detectado en el año de 1995 en el Fermilab (Estados Unidos). Es importante
anotar que el cálculo que vamos a mostrar, es tan solo un estimado de la
mínima energía a partir de la cual podría detectarse el quark, pues en la
reacción donde aparece el quark, también pueden aparecer otras partículas y
por lo tanto, para un cálculo más exacto se debe tener en cuenta estos efec-
tos adicionales. El quark top se espera que aparezca en una colisión protón-
antiproón ( ¯) y supongamos para simplificar, que después de la colisión
permanece el par ( ¯) y el quark . Las predicciones teóricas de la exis-
tencia del quark , así como su posible masa, dependen del modelo teórico
utilizado, pues por ejemplo, tomando los modelos más aceptados en julio de
1994 (tomados del Particle Physics Booklet, July 1994, American Institute
2
of Physics) la masa predicha para el quark oscilaba entre 62 , pasando
2 2 2
por 131 y 174 , hasta el valor más alto de 169 , calculado
a partir del modelo estandar electro-débil. Tomando para la masa del protón
2
0 = 0 94 , que es la misma masa del antiprotón, obtenemos de la
ecuación (5.56) la energía umbral en el sistema laboratorio para la creación
del quark top
= 32557 (5.57)
2
asumiendo una masa para el quark top de 174 . Es importante anotar
que esta energía umbral calculada, corresponde a la energía con la que deben
incidir, por ejemplo los protones sobre los antiprotones estacionarios, para
que esta reacción pueda ocurrir. En la práctica, las energías alcanzadas hasta
el presente en los grandes aceleradores están en el orden de los cientos de Gev.
Sin embargo, en la mayoría de los aceleradores los experimentos se realizan
en el sistema centro de masa directamente, pues tanto los protones como los
antiprotones (o electrones) son acelerados a las mismas energías en un anillo,
viajando en direcciones opuestas y por lo tanto la energía a la cual ellos son
acelerados debe ser del orden de la energía umbral en el sistema centro de
masa, que para nuestro caso corresponde a energías del orden de la masa en
reposo de la partícula que se quiere encontrar, estos es a energías del orden de
100 CAPÍTULO 5. DINÁMICA RELATIVISTA

los 200 . Para ilustrar esta situación, calculemos la energía disponible en


un experimento de dispersión de protones contra protones (o antiprotones)
en dos casos: En el primer caso, los protones son acelerados hasta alcanzar
una energía de 100 y chocan contra un blanco de protones en reposo
(por ejemplo un gas de hidrógeno a baja temperatura, para el cual podemos
despreciar la energía cinética típica de las partículas del gas). En un segundo
experimento, los protones son acelerados a energías del orden de 50 , se
divide el rayo en dos partes y se hacen chocar los dos haces de protones
frontalmente. Sean y los c-momentos iniciales de los protones y sea
la energía del sistema en el centro de masa. De acuerdo a las ecuaciones (5.47)
y (5.48) la cantidad

( + )2 = 2 2
= 2 2
(5.58)

es un invariante, la cual puede ser evaluada en cualquier sistema de refe-


rencia. Para el primer caso, protones chocando con un blanco estacionario
=( 1 1) y = ( 0 0), tenemos
2 2 4 2 2
=2 0 +2 1 0 '2 1 0 (5.59)
2 2
pues, 0 ¿ . Con 1 = 100 y 0 = 0 94 , la energía
disponible es del orden de 13 7 .
Para el segundo experimento, = ( 2 2) y = ( 2 ), por lo
tanto, la energía disponible está dada por:
2 2
=4 2 = = 100 (5.60)

Para alcanzar esta energía en el experimento de blanco estacionario, sería


necesario acelerar los protones hasta una energía del orden de
2
1 ' 2
' 5319 (5.61)
2 0

5.6. Fotones y partículas de masa en reposo


cero
En esta sección vamos a introducir el concepto de partícula de masa en
reposo cero, y en particular el concepto de fotón, como la partícula porta-
dora de la interacción electromagnética. El concepto de fotón o quantum
5.6. FOTONES Y PARTÍCULAS DE MASA EN REPOSO CERO 101

de energía está estrechamente relacionado con la teoría cuántica, pero como


veremos enseguida su origen es estrictamente relativista. No está dentro de
los objetivos de este libro discutir la formulación de la teoría cuántica de
campos, pues no es necesario tener un conocimiento en física cuántica, para
entender los ejemplos y procesos que vamos a desarrollar a lo largo del pre-
sente capítulo. Sin embargo, haremos un breve recuento de los principales
hechos históricos que contribuyeron al desarrollo del concepto de fotón.
En la segunda mitad del siglo XIX, cuando la teoría de Maxwell se consol-
ida con los experimentos de Herz sobre ondas electromagnéticas, se plantean
varios problemas en diferentes áreas de la física, que finalmente conducen
al desarrollo de la mecánica cuántica. En el campo de la espectroscopia se
tenía el problema de explicar la estructura y en particular, el espectro de
emisión y absorción de radiación electromagnética por átomos. En el exper-
imento de Herz sobre las ondas electromagnéticas, se reporta un fenómeno
curioso que luego, en experimentos más detallados conducen al descubrim-
iento del efecto fotoelectrico, esto es, la producción de una corriente eléctrica
(fotocorriente) en un material, debido a la incidencia de radiación electro-
magnética. El problema surge, cuando todos los intentos teóricos basados
sobre la electrodinámica de Maxwell, fallan para explicar las características
de este efecto. Hacia finales del siglo XIX, Max Planck trabajando sobre el
espectro de radiación de cuerpo negro, introduce la hipótesis de la emision
y absorción discreta de energía de los osciladores del cuerpo negro, el cual
se puede modelar por una cavidad cerrada, en la cual se encuentra radiación
electromanética en equilibrio térmico a una temperatura dada. Esta ra-
diación a su vez, está en equilibrio termodinámico con el material que con-
forma la cavidad que está emitiendo y absorviendo continuamente radiación
electromagnética. Contrario a la situación clásica, para la cual se espera que
un oscilador pueda absorber o emitir energía en cualquier cantidad, Planck
postuló que cada oscilador podía enmitir o absorber energía únicamente en
valores discretos, múltiplos de una cantidad fundamental
= (5.62)
en donde es la frecuencia de la radiación electromagnética emitida o absorvi-
da y se conoce como la constante de Planck, cuyo valor actual 6 626075(40)×
1034 · . Seis años después en 1905, Einstein extiende esta hipótesis y postu-
la que la radiación electromagnética energía está cuantizada y no solamente
los osciladores materiales que emiten y absorven la radiación. Así una onda
electromagnética de frecuencia transporta su energía en paquetes o quantos
102 CAPÍTULO 5. DINÁMICA RELATIVISTA

de energía, llamados fotones, de valor . Con esta hipótesis, Einstein expli-


ca el efecto fotoeléctrico y predice además que de acuerdo a la equivalencia
masa-energía, los fotones deben transferir momentun al igual que cualquier
otra partícula. La diferencia con las partículas usuales, tales como el electrón
o el protón, está en su masa en reposo, como veremos enseguida.
Partiendo de la definición de las componentes del c-momentun (ver ecua-
ción (5.4))
=( ) (5.63)
y de sus propiedades, ecuación (5.24) o equivalentemente ecuación (5.28), se
tiene la relación, entre la energía total de la partícula , su energía en reposo
0 y su momentun :
2
= 02 + | |2 2 (5.64)
Esta relación nos permite considerar el caso de una partícula de energía en
reposo nula, i.e., 0 = 0. Esto implica por una parte, que su masa en reposo
es cero 0 = 0 y además, que la norma del c-momentun de esta partícula es
un c-vector como de luz, pues su norma se anula
2
= 2 2
| |2 = 0 (5.65)

Estas partículas se llaman partículas de masa en reposo nula y su principal


característica es que sus líneas de universo siempre están sobre el cono de luz y
por lo tanto no existe ningún observador inercial para el cual estas partículas
estén en reposo. La ecuación (5.65) nos da la relación entre el momentun
físico y la energía total de las partículas de masa en reposo nula. El fotón,
que es la partícula asociada al campo electromagnético, es un caso particular
de partícula de masa en reposo nula.
Consideremos ahora el c-vector de onda

=( ) (5.66)

definido en el capítulo anterior (sección (4.4)), que nos representa una onda
electromagnética plana de frecuencia y número de onda y postulemos,
de acuerdo a Einstein, que esta onda transporta su energía y momentun en
quantos o fotones, cuyo c-vector momentun está dado por:

:= ~ = (~ ~ ) (5.67)

en donde se ha introducido la constante ~, relacionada con la constante de


Planck por ~ = 2 . De esta relación se sigue que el fotón transporta una
5.6. FOTONES Y PARTÍCULAS DE MASA EN REPOSO CERO 103

energía total
=~ = (5.68)
pues = 2 , de acuerdo al postulado original de Einstein y un momentun
físico
=~ (5.69)
que de acuerdo a las propiedades del c-vector de onda (ecuación (4.66)),
la energía (ecuación (5.68)) y el momentun físico (ecuación (5.69)), deben
cumplir la relación
~2 2 = 2 2 | |2 = 0 (5.70)
la cual nos define una partícula de masa en reposo nula, teniendo en cuenta
la ecuación (5.65). Las partículas de masa en reposo cero pueden tener tam-
bién otras características que las diferencian entre si, tales como la carga,
momento magnético, etc.. A parte del fotón, en la naturaleza se encuentran
otras partículas de masa en reposo cero, como por ejemplo los neutrinos. Es
importante anotar que la física busca permanentemente nuevos experimen-
tos para determinar si estos neutrinos son realmente partículas de masa en
reposo cero, o si estos poseen una masa en reposo. Hasta el presente se ha
determinado que la masa es reposo de estos neutrinos, si la tienen, es in-
2
ferior a 17 , que al compararla con la masa del electrón (la partícula
2
estable de menor masa en reposo conocida) 0 = 0 51 , es realmente
muy pequeña. De hecho para el fotón también se han realizado experimentos
para imponerle cotas superiores a su masa en reposo. Como ya se ha dicho
en la introducción de esta sección, el caracter dual que presentan las ondas
electromagnéticas, esto es, para cierto tipo de fenómenos, como el efecto foto-
electrico o el efecto Compton (que discutiremos más adelante), para los cuales
la luz interacciona como partículas, contrasta con otros fenómenos típicos del
caracter ondulatorio de la luz, como los efectos de interferencia o difracción.
Esta dualidad es una característica general de toda la materia cuyo estu-
dio le corresponde a la mecánica cuántica. Esta dualidad es tal vez, uno de
los aspectos más interesantes que presenta la naturaleza y su interpretación
ha sido objeto de muchos trabajos. La teoría de la relatividad no pretende
conciliar estas ideas y de hecho, este comportamiento dual aparentemente
contradictorio, no se presenta como un problema en el contexto de la teoría
de la relatividad, pues tanto las ondas electromagnéticas, como las partículas
de masa en reposo cero (y en particular los fotones) son conceptos relativistas
y su relación física se establece solo a través del postulado de cuantización
104 CAPÍTULO 5. DINÁMICA RELATIVISTA

de la energía de Planck, el cual en ningún momento entra en contradicción


con los principios básicos de la relatividad.
Para finalizar esta sección, retomaremos algunos resultados generales de la
dinámica relativista, que siguen siendo válidos si alguna o todas las partículas
que intervienen en el proceso son de masa en reposo nula, como por ejemplo
la emisión de un fotón por un átomo.
En primer lugar consideremos el caso de dos partículas de c-momentun
1 y 2 , para el cual el producto interno Minkowskiano está dado por la
relación invariante ecuación (5.29). Si una de las partículas es un fotón, e.g.,
la partícula 2, entonces 02 = 0 y podemos escribir esta relación en la forma:

1 · 2 = 01 2 (5.71)

en donde 1 = ( 1 1 ) y 2 = ( 2 2 ), con 2 la energía del fotón en el sis-


tema de referencia propio de la partícula 1. En el caso en que las dos partículas
sean fotones, la relación (5.29) se vuelve indeterminada. Para encontrar la
relación correcta, supongamos que 1 = ( 1 1) y 2 = ( 2 2 ). Como
1 y 2 son c-vcectores nulos, se debe cumplir que | | = , para = 1 2,
entonces de la definición de producto interno Minkowskiano se tiene:

2 1 2
1 · 2 = 1 2 1 · 2 = 2
(1 cos ) (5.72)

en donde es el ángulo formado por los vectores momentun de las partículas,


que para el caso de fotones, sería el ángulo entre las direcciones de propa-
gación de las ondas electromagnéticas o fotones.
Otra relación que permanece válida para el caso de partículas de masa
en reposo cero, se refiere al problema de la energía umbral, ecuación (5.53).
2
Si por ejemplo la partícula que choca es un fotón, entonces 2 = ~ ,
02 = 0 y por lo tanto
= 01 (5.73)
Capítulo 6

Aplicaciones de la dinámica
relativista

6.1. Introducción
En este capítulo daremos algunos ejemplos de procesos dinámicos, los
cuales ilustran los fenómenos y aplicaciones más importantes de la teoría
especial de la relatividad y más específicamente, de los postulados de conser-
vación de la energía y el momentun.
Restringiremos nuestra discusión a procesos de colisión entre partículas
puntuales, i.e., consideraremos únicamente interacciones de contacto, sin en-
trar en los detalles de las interacciones (fuerzas) que rigen estos procesos.
Como se mencionó al comienzo del capítulo anterior, de las cuatro inter-
acciones fundamentales que determinan la dinámica de todos los procesos
conocidos, solamente la interacción electromagnética admite una descripción
clásica relativista. Dejaremos para el capítulo sobre electrodinámica, el pro-
blema de formular las ecuaciones de movimiento de partículas cargadas en
campos electromagnéticos.

6.2. Colisiones elásticas


El ejemplo más importante de una colisión elástica, tanto por su impor-
tancia histórica como por sus aplicaciones prácticas, lo constituye el proceso
de dispersión Compton. Este proceso, llamado también efecto Compton, jugó
un papel fundamental en el desarrollo de la mecánica cuántica, pues éste ofre-

105
106 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

Figura 6.1: Efecto Compton

ció una de las primeras pruebas directas del carácter corpuscular de la luz y
de paso también, una prueba más de la dinámica relativista. A. H. Compton
recibió el premio nobel en 1927 por el estudio de este efecto (ver, por ejemplo,
el artículo original: Compton A.H., 1923, Phys. Rev. 22,409).

6.2.1. Efecto Compton


La dispersión Compton es el proceso de colisión elástico entre una partí-
cula de masa en reposo cero (e.g., un fotón) contra una partícula masiva (e.g.,
un electrón). El experimento original se realizo haciendo colisionar fotones
de alta energía (como rayos X o rayos gama) contra electrones practicamente
en reposo, es decir, electrones con energías cinéticas mucho menores que las
energías típicas de los fotones.

Tomemos el eje en la dirección de incidencia del fotón (ver Figura 6.1),


entonces su c-momentun inicial se puede escribir como
=( ) (6.1)
con = la energía, siendo la frecuencia del fotón incidente y =
(0 0 ) su momentun, en donde se ha hecho uso de la relación (5.65). El
6.2. COLISIONES ELÁSTICAS 107

Figura 6.2: Lineas de universo del efecto Compton

c-momentun inicial del electrón en reposo está dado por:

=( 0 0) (6.2)

Sean
0 0 0 0 0
=( ) =( ) (6.3)
los correspondientes c-momentos del fotón y del electrón después de la col-
isión. Sin pérdida de generalidad, supongamos que el plano en el cual se
realiza la colisión es el y sea el ángulo que forma la dirección de
dispersión del fotón con respecto al eje y el ángulo de dispersión del
electrón respecto al eje . Entonces de la conservación del c-momentun total
del sistema, tenemos
+ = 0 + 0 (6.4)

En la Figura 6.2 se muestran las líneas de universo del electrón y el fotón


en el sistema de referencia del laboratorio. La línea de universo del fotón,
dibujada a 45 en un plano paralelo al plano , intercepta a la línea
de universo del electrón en reposo, evento P. En este punto el electrón es
dispersado, siguiendo una línea de universo dentro del cono de luz del evento
108 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

P, mientras que el fotón es dispersado en otra dirección, siguiendo una línea


de universo sobre el cono de luz del evento P.
Puesto que experimentalmente se mide la frecuencia (energía) o longi-
tud de onda del fotón dispersado, en función del ángulo de dispersión y de
la frecuencia o longitud de onda del fotón incidente, despejemos 0 de la
ecuación (6.4) y tomando la norma al cuadrado de esta ecuación resultante,
obtenemos:
0 2
( + ) = ( 0 )2 (6.5)
Teniendo en cuenta que
2 02
= =0 (6.6)
y
2 02 2 2
= = 0 (6.7)
llegamos finalmente a la relación:
0 0
· + ·( )=0 (6.8)

Utilizando la ecuación (5.72) para el producto punto entre c-vectores nulos


y de las expresiones (ecuaciones (6.1) a la (6.2)) para los c-momentun del
electrón y los fotones inicial y final, obtenemos
0
0
2
(1 cos ) + 0( )=0 (6.9)

Expresando las energías de los fotones en términos de la longitud de onda


asociada,
= = (6.10)
y
0 0 0
= =
obtenemos finalmente, la expresión estandar para la dispersión Compton, la
cual nos da la diferencia entre las longitudes de onda dispersada e incidente,
en función del ángulo de dispersión :
0
= (1 cos ) (6.11)

A la cantidad := 0 se le llama longitud de onda de Compton


asociada al electrón. En la (Figura 6.3) se reproducen los resultados originales
de Compton.
6.2. COLISIONES ELÁSTICAS 109

Figura 6.3: Resultados experimentales de Compton

En 1950 Cross y Ramsey (Cross W.G. and Ramsey N.F., 1950, Phys. Rev.
80,929) midieron por primera vez al electrón dispersado simultáneamente con
el fotón, en un experimento de coincidencia, obteniendo resultados en con-
cordancia con la teoría. Para calcular el ángulo de dispersión del electrón,
en función del ángulo de dispersión del fotón y de la energía del fotón in-
cidente, despejemos la velocidad del electrón de las componentes espaciales
de la ecuación (6.4) y eliminando 0 en esta expresión, con la ayuda de la
ecuación (6.9), obtenemos:
2
0 sin
tan = 2 )(1
(6.12)
( + 0 cos )
en donde es el ángulo de dispersión del electrón, medido con respecto a la
dirección de incidencia del fotón. En el experimento de coincidencia de Cross
y Ramsey se midió un ángulo = 31 3 , para una energía del fotón incidente
de 2 6 y un ángulo = 30 0 para el fotón dispersado.

6.2.2. Efecto Compton inverso


Como otro ejemplo de colisión elástica, consideremos la dispersión de un
fotón de muy baja energía por una partícula, por ejemplo un protón, de alta
110 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

energía. Después de la colisión la partícula masiva le cede parte de su energía


cinética al fotón, el cual se dispersa con una frecuencia mayor dependiente
del ángulo de dispersión. Por esta razón, a este proceso lo llamaremos efecto
Compton inverso. El desarrollo matemático es similar al del efecto Comp-
ton tratado en el parágrafo precedente, aun cuando algo más complejo, pues
la partícula está inicialmente en moviento. Para discutir un fenómeno in-
teresante que se puede presentar con los rayos cósmicos y los fotones de la
radiación cósmica de fondo, vamos a restringir la discución a un caso partic-
ular de este proceso de dispersión.
Supongamos que la energía del fotón inicial es mucho menor que la
2 2
energía total de la partícula incidente = , i.e., ¿ y consid-
eraremos solamente el caso de máxima transferencia de energía en el proceso
de colisión, que de acuerdo con la relación (ecuación (6.11)) se obtiene para
el caso de dispersión frontal, es decir = 180. Sea = ( ) el c-
momentun del fotón y = ( ) el c-momentun del protón antes de
0 0 0 0
la colisión y sean =( )y =( 0 0
) los correspondientes c-
momentos después de la colisión. De manera similar al caso tratado para
el efecto Compton, despejamos 0 de la ecuación de conservación (6.4) y
elevando al cuadrado, obtenemos
0 0
· + ·( )=0 (6.13)
¯ ¯
Teniendo en cuenta que | | = , ¯ 0¯= 0
y utilizando la aproxi-
mación
q 2 4
2 2 4 0
| | = 0 (6.14)
2
obtenemos, para la energía del fotón dispersado
¯ ¯
¯ ¯
( +¯ ¯ )
0
= 2 4
(6.15)
2 + | | 1+ 0

El modelo estandar de la cosmología describe la estructura y evolución


del universo actual, postulando su origen a partir de un estado inicial de
altísima densidad y temperatura (en principio infinitas). Una de las predic-
ciones fundamentales del modelo estandar de la cosmología es la existencia
de un fondo de radión cósmica (radiación electromagnética con un espec-
tro de cuerpo negro), el cual se ha ido enfriando debido a la expansión del
6.3. COLISIONES INELÁSTICAS 111

universo, alcanzando una temperatura actual del orden de 2 73 . Esta ra-


diación cósmica de fondo se puede modelar como un gas de fotones, con una
cierta distribución de energías. En promedio un fotón típico de este fondo de
radiación tiene una energía media dada por

= (6.16)

en donde es la temperatura absoluta de 2 73 y


23 1 5 1
= 1 380 × 10 · = 8 617 × 10 · (6.17)

es la constante de Boltzmann.
Por otra parte, los rayos cósmicos son haces de partículas elementales
(en su mayoría electrones y protones) de alta energía 1020 , cuya
fuente, aun cuando no está completamente determinada, parece ser de origen
galáctico. Un protón típico de estos rayos cósmicos, puede entonces dispersar
elásticamente un fotón del fondo de radión cósmica y suministrarle entonces
una energía, que de acuerdo a la relación (5.39), es del orden de

0 1020
' 9 2 20 4
' 2 6 × 1018 (6.18)
1 + (0 938 × 10 ) (10 · 2 37 × 10 )
Es decir, el fotón dispersado puede adquirir energías típicas de los rayos
gama.

6.3. Colisiones inelásticas


Las aplicaciones más importantes de la dinámica relativista se encuentran
en los procesos de dispersión inelásticos, tales como la absorción y emisión de
fotones y la creación de nuevas partículas. Cuando colisionan dos partículas,
se pueden producir muchos tipos de efectos que podemos esquematizar en los
siguientes tipos de reacciones:
+ =
+ = + +
(6.19)
+ = +
+ = + + +···
La primera reacción por ejemplo, representa un proceso en el cual las
partículas que chocan se aniquilan, para dar lugar a una nueva partiícula (por
112 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

partícula queremos significar tanto las partículas elementales, como aquellas


que presentan estructura interna o están conformadas por otras partículas
elementales, tales como los átomos, moléculas o núcleos). La segunda reac-
ción representa un proceso en el cual las partículas iniciales sobreviven a la
colisión, dando lugar a una nueva partícula. En el tercer caso, una de las
partículas que entra en la reacción se aniquila, dando lugar a la creación de
otra y en la última reacción las partículas iniciales desaparencen y surgen
varias partículas nuevas.
¿Que leyes físicas determinan cuál o cuáles reacciones pueden ocurrir?.
En primer lugar están las leyes de conservación, las cuales determinan si
un proceso dado puede o no suceder. Tomemos como ejemplo un fotón que
choca contra un electrón inicialmente en reposo y captura al fotón, saliendo
el electrón con cierta energía cinética. Sean
=( 0 0) (6.20)
y
=( ˆ) (6.21)
los c-momentos iniciales del electrón y el fotón respectivamente, con ˆ un
vector unitario en la dirección de movimiento del fotón incidente y sea
0
=( ˆ) (6.22)
el c-momentun del electrón depués de la colisión. Al aplicar el postulado
de la conservación del c-momentun, + = 0 , obtenemos un resultado
inconsistente, pues basta con elevar al cuadrado esta expresión:
2 2
0 +2 0 = ( + )2 = 02
= 2 2
0 (6.23)
la cual implica que 0 = 0 o = 0. Esto significa que este proceso es
prohibido, pues viola el principio de conservación del c-momentun. En se-
gundo lugar existen otros principios de conservación los cuales, en general,
dependen de la interacción (fuerte, electromagnética, débil o gravitacional)
que media el proceso de colisión y que de igual manera, a los principios fun-
damenta de conservación de la energía y momentun, restringen los procesos
que puedan ocurrir en una colisión entre partículas. Algunos de estos prin-
cipios de conservación son de validez general, tal como la conservación de la
carga eléctrica, mientras que otros, como la conservación del número barióni-
co o la paridad, solamente se cumplen para unas interacciones pero no para
otras. Por ejemplo, la interacción electromagnética conserva la paridad, pero
la interacción bébil no la conserva.
6.3. COLISIONES INELÁSTICAS 113

6.3.1. Absorción de un fotón por un átomo


Antes de entrar en el problema de absorción de un fotón por un átomo,
es importante aclarar la diferencia, desde el punto de vista de la dinámica
relativista, entre un átomo y una partícula elemental. La partícula elemental
está caracterizada por su masa propia y eventualmente por otros números
cuánticos como la carga, el spin, el isospin, etc, y basta que uno de estos
parámetros sea diferente para que se tenga otra partícula elemental difer-
ente. Un átomo, por otra parte, está caracterizado por su número atómico
(i.e., el número de electrones o protones el cual determina sus propiedades
químicas) y su número de nucleones (protones más neutrones del núcleo) el
cual determina los diferentes isópos de un mismo elemento químico. La masa
propia de los átomos no es estrictamente un parámetro que determine un
tipo particular de átomos, pues dado que los atómos presentan estructura
interna, (como los diferentes niveles de energía) la energía cinética de las
partículas que lo constituyen y la energía potencial de interacción entre ellas
contribuyen también a la masa propia de los átomos. Es de anotar, que si
bien la contribución a la masa de los átomos debida a esta energía interna,
es muy pequeña comparada con la suma de las masas de las partículas que lo
conforman, si hacen una diferencia fundamental, cuando se trata el problema
dinámico de la emisión y absorción de fotones por átomos, como veremos en
esta sección.
Así, un átomo que a emitido o absorbido un fotón, tendrá una masa
propia diferente antes y después del proceso, sin que cambien necesariamente
sus propiedades químicas y por lo tanto desde el punto de vista de la dinámica
relativista relativista, estos átomos son partículas diferentes antes y después
de la emisión o absorción de un fotón. Esta misma situación sigue siendo
válida, aún en el caso en que el átomo se ionise (pierda uno o varios de sus
electrones) y también cuando estamos tratando con otras estructuras como
los núcleos atómicos. Por esta razón, una partícula elemental (sin estructura
interna) aislada, tal como un electrón, no puede emitir o absorber un fotón in-
dividual, sin violar los principios de conservación fundamentales como vimos
en el ejemplo tratado anteriormente.
Consideremos una partícula no elemental (átomo, molécula, ión o núcleo)
con masa en reposo 0 , sobre la cual incide un fotón de frecuencia , el
cual es absorbido por la partícula. En la Figura 6.4 se muestra el proceso
de absorción de un fotón por un átomo. La línea de universo del átomo
inicialmente en reposo, intercepta a la línea de universo del fotón, evento P.
114 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

Figura 6.4: Lineas de universo del átomo y el fotón capturado

El átomo captura al fotón y se dispersa siguiendo una línea de universo recta,


la cual está dentro del cono de luz futuro del evento P.

Sea 00 la masa de la partícula después de la colisión y calculemos,


suponiendo que la partícula inicial está en reposo, la velocidad con que sale la
partícula final. Llamemos = ( 0 0) y = ( ˆ ) los c-momentos
iniciales de la partícula y el fotón respectivamente, en donde = y ˆ es
un vector unitario en la dirección de propagación del fotón. El c-momentun
final del sistema será 0 = ( 0 0
ˆ ), pues por la conservación del momen-
tun, la dirección de movimiento de la partícula final es la misma que la del
fotón incidente, siendo su velocidad y
0
p
= 00 1 2 2 (6.24)

De la conservación del c-momentun + = 0 podemos despejar directa-


mente, elevando al cuadrado esta expresión, la masa en reposo de la partícula
final r
0 2
0 = 0 1+ 2
(6.25)
0
Escribiendo explícitamente en componentes la ecuación de conservación
6.3. COLISIONES INELÁSTICAS 115

del c-momentun
2 0 2
0 + =
0 (6.26)
=
podemos calcular la masa relativista y la velocidad de la partícula final:

0
= 0 + (6.27)

= (6.28)
= 0
2+

Las partículas con estructura interna, como los átomos, moléculas y nú-
cleos, poseen niveles de energía internos con = 0 1 2 , (en donde el
nivel 0 se le llama estado base o fundamental del sistema) y por lo tanto el
proceso de absorción de fotones por este tipo de partículas es selectivo, esto
es, la partícula solo puede absorber fotones de ciertos valores de energía que
cumplan con la condición que ' , estrictamente , pues
parte de la energía del fotón incidente debe gastarse en la energía cinética
final del átomo (lo cual se deduce de las ecuaciones (6.27) y (6.28)).
En un átomo, por ejemplo, la diferencia típica entre niveles de energía
está en el rango de los electronvoltios. Puesto que la masa propia de los
2
átomos oscila entre 1 (para el átomo de hidrógeno) hasta los cientos de
2
gigaelectronvoltios (para átomos pesados), la fracción 0 es del orden
8
de 10 , calculada para el caso de un átomo de hidrógeno, mientras que la
diferencia entre niveles de energía es inferior a 13 6 (valor que corresponde
a la energía de ionización del átomo de hidrógeno).
De la ecuación (6.25) vemos que la masa propia del átomo exitado (que
ha absorbido el fotón) es tan solo una fracción del orden de 10 8 mayor que
la masa del átomo inicial. Por otra parte, la velocidad del átomo exitado está
dada por la ecuación (6.28)), obteniendose
8
= 10 (6.29)

en donde para estos cálculos, hemos asumido un valor típico de 10 para


la energía del fotón incidente.
Es de anotar que si incide un fotón sobre un átomo con una energía
mayor a la de ionización, el fotón puede ser capturado por el átomo, o más
exactamente por un electrón del átomo, el cual se desprende del sistema con
una energía cinética igual al exceso de energía del fotón sobre la energía de
116 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

ionización. Este proceso, diferente al que estamos considerando, es la base del


efecto fotoeléctrico el cual, como yá se ha mencionado anteriormente, jugó
un papel fundamental en el desarrollo de la mecánica cuántica. Si llamamos
la energía de ligadura del electrón al átomo, o a la estructura de átomos
para el caso de un sólido (llamada también función trabajo del material), y
= a la energía del fotón incidente, entonces si este fotón es absorbido
por el sólido, el electrón se puede desprender del material, con una energía
cinética dada por
= (6.30)
La energía cinética de los electrones desprendidos, llamados fotoelec-
trones, se puede medir utilizando un contravoltaje. La ecuación (6.30) pre-
senta dos características importantes probadas experimentalmente, las cuales
no pueden ser explicadas con un modelo ondulatorio de la luz: La primera
característica es la relación líneal entre la frecuencia de la luz incidente, sin
importar cual sea la intensidad de ella (la intensidad de la luz, en el modelo
ondulatorio es proporcional al cuadrado de la amplitud de los campos elec-
tromagnéticos, mientras que en el modelo corpuscular de la luz, la intensidad
es proporcional a la densidad de fotones). La segunda característica impor-
tante, es la existencia de una frecuencia umbral 0 , por debajo de la cual no
hay corriente de fotoelectrones, la cual se obtiene cuando =0= 0
y que depende del material, pues la función trabajo es una propiedad del
material, más no de la radiación electromagnética incidente.

6.3.2. Emisión de un fotón por un átomo exitado


Consideremos ahora el proceso inverso al descrito en la sección anterior.

Supongamos que un átomo exitado de masa propia 0 , inicialmente en


reposo, emite un fotón de frecuencia , esto es, de energía = .
En la Figura 6.5 se muestran las líneas de universo del proceso de emisión
de un fotón por un átomo. El átomo exitado, inicialmente en reposo, emite
un fotón: evento P. El fotón emitido sigue una línea de universo que está
sobre el cono de luz futuro del evento P, en tanto que la línea de universo
del átomo dispersado es descrito por la línea recta, interior al cono de luz del
evento P.
De manera similar al caso tratado en la sección anterior, la energía del
fotón emitido no puede ser exactamente igual a la diferencia entre dos niveles
6.3. COLISIONES INELÁSTICAS 117

Figura 6.5: Lineas de universo del átomo y el fotón emitido

de energía del átomo, de hecho debe ser ahora menor 0,


pues por conservación de momentun el átomo, al emitir el fotón, debe sufrir
un retroceso y por lo tanto parte de la energía suministrada por el átomo
al realizar la transición, debe ser transformada a energía cinética del átomo
final. Es de anotar que esta energía 0 corresponde también a la diferencia
entre las energías en reposo de los átomos inicial y final, i.e.,
2 0 2
0 = 0 0 (6.31)
Una variable de interés en este proceso es la relación entre la energía
del fotón emitido, con respecto a la diferencia entre dos niveles internos de
energía del átomo, o equivalentemente, a la energía de un fotón emitido por
el átomo, si este no sufriera retroceso. Sean
=( 0 0) (6.32)
el c-momentun del átomo inicial y
=( ˆ) (6.33)
y
0 0 0
=( ˆ) (6.34)
118 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

los c-momentos finales del fotón y el átomo, en donde ˆ es la dirección de


propagación del fotón y la velocidad de retroceso del átomo. De la ecuación
de conservación del c-momentun, escrita en la forma 0 = y elevando al
cuadrado esta ecuación, se obtiene la relación:
02 2 2 2
0 = 0 2 0 (6.35)

Remplazando la masa en reposo del átomo final, en términos de 0, se


llega finalmente a
0
= 0 (1 2
) (6.36)
2 0

Para ganar una idea de las magnitudes de las variables físicas involu-
cradas, tomemos de nuevo el caso del átomo de hidrógeno y supongamos
que 0 ' 10 y 0 2'1 , entonces la energía del fotón emitido será
12
una fracción del orden de 10 veces menor, que la frecuencia de un fotón
emitido sin retroceso.
Como se discutió anteriormente, el efecto del retroceso causa una dis-
minución en la frecuencia del fotón emitido con respecto a la frecuencia de
la transición y la fración en la cual cambia esta frecuencia, es inversamente
proporcional a la masa del átomo (ver ecuación (6.36)). Si el átomo emisor
está ligado a una estructura, por ejemplo a una red de átomos como en un
sólido, entonces la masa efectiva que absorbe el momentun de retroceso será
ahora del orden de 1023 veces la masa del átomo emisor y la energía del
fotón emitido, prácticamente coincide con la energía propia de la correspon-
diente transición entre niveles de energía del átomo. Este efecto de emisión
sin retroceso fue descubierto por Mö bauer, quien recibió el premio nobel en
1961 y este efecto es actualmente una fuente de muchas aplicaciones en física
atómica, estado sólido y física nuclear.

6.4. Sistemas de masa variable


Puesto que la masa inercial de una patícula medida por un observador
depende de la velocidad, se puede considerar que todo sistema relativista
es, de hecho, un sistema de masa variable. Sin embargo en relatividad, el
equivalente al caso de la mecánica clásica de un sistema de masa variable,
corresponde a un sistema cuya masa propia sea variable. Un ejemplo de un
sistema de masa propia variable, lo constituye el cohete fotónico, esto es,
6.4. SISTEMAS DE MASA VARIABLE 119

un cohete para el cual el sistema de propulsión transforma masa en energía


radiante (fotones).
Retomemos el ejemplo discutido en el capítulo anterior de una nave espa-
cial que realiza un viaje al centro de nuestra galaxia, con aceleración propia
constante igual a la aceleración de la gravedad y supongamos que esta
nave dispone de un cohete de propulsión que transforma masa en reposo en
fotones y los radía con un ciento por ciento de eficiencia, directamente ha-
cia atrás y perfectamente colimados. Calculemos entonces qué fracción de
la masa propia inicial es gastada para realizar el viaje hasta el centro de la
galaxia, suponiendo (como en el ejemplo del capítulo cuarto, sección (4.4.3))
que durante la mitad del viaje acelera y la otra mitad frena, con aceleración
propia constante . Sea la masa propia del cohete en un instante dado (la
cual es variable) y = su c-momentun, en donde
0 0
=( )=( 0 0) (6.37)

es la c-velocidad del cohete, el cual se mueve a lo largo del eje y

=( ) (6.38)

el c-momentun de la radiación. Por conservación de la energía, el cambio en


la energía del cohete es igual al cambio en la energía radiada, entonces
0
( )= (6.39)

Como la energía radiada es en forma de fotones, se debe tener que:

= (6.40)

y por conservación del momentun tenemos:

= ( ) (6.41)

Entonces, de estas relaciones obtenemos la ecuación:


0
= ( ) (6.42)

la cual se puede escribir en la forma:


0
( + )
= 0
(6.43)
+
120 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

Integrando esta ecuación y teniendo en cuenta las expresiones para 0 y


(ecuación (4.46)) se llega, finalmente a la expresión para la masa propia
del cohete, en función del tiempo propio :
= 0 (6.44)
en donde 0 es la masa propia inicial de la nave. De acuerdo a la ecuación
(4.56), el tiempo propio para que la nave realice la mitad del viaje es de
10 3 ˜ y por lo tanto ' 29700, de donde se sigue que la masa propia
de la nave a la mitad del viaje es de 1 2 = 0 29700 y la masa propia al
final del viaje hasta el centro de la galaxia será
= 0 (29700)2 ' 10 9
0 (6.45)
Esto significa que la gran mayoria de la masa de la nave (109 ) debe ser
gastada como combustible.

6.5. Creación y aniquilación de partículas


Una de las aplicaciones más importantes de la equivalencia entre la masa
y la energía, es la posibilidad de generar nuevas partículas en procesos de
colisión inelástica, o también a partir del decaimiento (aniquilación) espon-
táneo de una partícula inestable. Como ya se mencionó en la sección (6.6.3)
sobre colisiones inelásticas, la posibilidad de una determinada reacción, por
ejemplo la creación de un antiprotón a partir de la colisión entre dos pro-
tones depende, en primer lugar, de los principios de conservación dinámicos
de energía-momentun y en segundo lugar, que la interación que media el
proceso permita este tipo de reacción. La teoría física fundamental que de-
scribe estos procesos se llama teoría cuántica de campos y ella nos permite
predecir, no solo que reacciones son posibles, sino también la probabilidad
con que un determinado proceso puede ocurrir. La probabilidad para que
un cierto proceso ocurra signica lo siguiente: cuando dos partículas colision-
an, o una partícula inestable se desintegra, como resultado de esta reacción
pueden surgir diferentes productos, todos permitidos por las diferentes leyes
de conservación y cada uno de ellos con una probabilidad de ocurrencia, o
equivalentemente, con un porcentaje de ocurrencia. Por ejemplo el barión 0
puede decaer en 6 formas diferentes, cada una de ellas con diferente proba-
bilidad:
0
+ (63 9 ± 0 5) % (6.46)
6.5. CREACIÓN Y ANIQUILACIÓN DE PARTÍCULAS 121

0 0
+ (35 8 ± 0 5) % (6.47)
0 3
+ (1 75 ± 0 15) × 10 % (6.48)
0 4
+ + (8 4 ± 1 4) × 10 % (6.49)
0 4
+ +¯ (8 32 ± 0 14) × 10 % (6.50)
0 4
+ +¯ (1 57 ± 0 35) × 10 % (6.51)
El porcentaje entre paréntesis significa que, de cada 100 eventos de de-
caimiento del barión 0 , por ejemplo, decáe en un protón y en un pión aprox-
imadamente 64 veces, el cual es el evento más probable, miéntras que el úl-
timo proceso, decaimiento en un protón, un muón y un neutrino muónico es
el menos probable, con una ocurrencia de un evento por cada 10000, aprox-
imadamente. La masa del barión 0 es de 1115 684 y su vida media,
esto es el tiempo propio que la partícula permanece desde su creación hasta
que ella decáe, es de 2 632 × 10 10 . A su vez esta partícula, el barión 0 , es
producido en otra reacción, como por ejemplo
+ + 0
+ + (6.52)
Si las masas del pión + , el neutrón y el mesón + son 140 2
,
2 2
940 y 494 respectivamente, calculemos por ejemplo la energía
cinética umbral del mesón + , para que al chocar con el neutrón en reposo,
se cree el barión 0 a un ángulo de 90 , medidos con respecto a la dirección
de incidencia del pión. De la conservación del c-momentun, tenemos
+ = + (6.53)
Puesto que no estamos interesados en la información para la partícula + ,
despejemos su c-momentun de la ecuación anterior y tomemos el cuadrado
de la expresión resultante (con la notación =( ), 0 la masa en
reposo del pión y similarmente para las otras partículas):
2 2 2 2 2 2 2 2
0 = 0 + 0 + 0 +2 · 2 · · (6.54)
Puesto que en el sistema de laboratorio =( ), = ( 0 0)
y =( ) y además · = 0 dado que el ángulo de dispersión del
0
barión es de 90 , entonces podemos despejar la energía total de esta
expresión, para obtener
2 2 2 2 2 2 2 2
0 0 0 0 +2 0
= 2)
(6.55)
2( 0
122 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA

por lo tanto, para que séa mínimo se requiere que la energía del barión
0 2
sea mínima y para esto basta tomar = 0 , entonces

2 2 2 2
0 0 0 0 +2 0 0 2
( )= = 1149 (6.56)
2( 0 0)

y por lo tanto la energía cinética umbral del pión incidente será de

= 1149 140 = 1009 '1 (6.57)


Parte III
Electrodinámica relativista

123
Capítulo 7

Tensores

7.1. Introducción
Uno de los elementos fundamentales de toda teoría física lo constituye el
modelo matemático adecuado para describir las variables físicas y las leyes
que rigen su comportamiento. En el capítulo 3 se definieron los conceptos
de cuadri-vector y de invariante relativista, el primero como una cantidad
con cuatro componentes que bajo una transformación de Lorentz, sus com-
ponentes se transforman de acuerdo a una ley definida (ecuación (3.29)) y
el segundo como una cantidad invariante bajo una TL, es decir una canti-
dad que toma el mismo valor numérico en todos los sistemas de referencia
inerciales, el cual llamaremos en lo sucesivo escalar de Lorentz. Para muchos
de los fenómenos físicos conocidos estos objetos matemáticos, escalares y c-
vectores, son suficientes para definir las variables que permiten describir los
procesos físicos. Sin embargo, existe toda una serie de variables dinámicas,
tales como por ejemplo el momento de inercia de un sólido rígido, las cuales
requieren para su descripción otros objetos matemáticos llamados tensores.
El objetivo fundamental del presente capítulo es introducir el concepto de
tensor y dar las herramientas fundamentales del álgebra y del cálculo tenso-
rial.
Existen varios caminos posibles para definir el concepto de tensor, por
ejemplo, la aproximación algebráica, la cual es una extensión del álgebra
lineal y de los espacios vectoriales. Otro camino más cercano a sus aplica-
ciones físicas, es a través de la definición de un tensor por sus propiedades
de transformación bajo un cambio de coordenadas. Este será el camino que

125
126 CAPÍTULO 7. TENSORES

seguiremos en este capítulo.


Es importante anotar en este punto, que las variedades diferenciales con-
stituyen el marco matemático natural para definir de manera rigurosa y
general el concepto de tensor. Pero no abordaremos aquí esta teoría, pues
está más allá del alcance del presente libro y además para los objetivos que
perseguimos, formular la electrodinámica clásica en forma relativista explíci-
ta, no es necesario desarrollar este formalismo matemático en toda su exten-
sión. Sin embargo, vale la pena resaltar que los resultados del análisis ten-
sorial que presentaremos son válidos en el caso general y sirven como punto
de partida para un estudio más riguroso de geometría diferencial, necesario
para abordar el estudio de la Teoría General de la Relatividad desarrollada
por Einstein en 1916.

7.2. Definiciones fundamentales


En esta sección introduciremos los conceptos fundamentales del cálcu-
lo tensorial. Los objetos matemáticos fundamentales con los cuales tratare-
mos son los escalares, los vectores y los tensores, los cuales son en general
funciones de las coordenadas. Estos objetos serán definidos en términos de
sus propiedades de transformación, cuando cambiamos de sistemas de co-
ordenadas. Aun cuando todas las definiciones que daremos, así como sus
propiedades, son generales, nos restringiremos exclusivamente a transforma-
ciones de Lorentz, pero mantendremos en lo posible una notación general.
Definición 8.1 Sean y 0 dos sistemas de referencia inerciales y sean
= ( 0 1 2 3 ) y 0 = ( 00 01 02 03 ) las coordenadas de un evento
físico medidas en y 0 respectivamente. Entonces una transformación de
Lorentz de las coordenadas está definida como:
0
7 = (7.1)

tal que el producto punto Minkowskiano queda invariante bajo esta transfor-
mación de coordenadas.
Definición8.2 Un escalar de Lorentz es una cantidad (en general una fun-
ción de las coordenadas) que es invariante bajo transformaciones de Lorentz.
Ejemplos de escalares de Lorentz son: la masa propia de una partícula, el
intervalo de tiempo propio entre dos eventos, la norma de todo cuadri-vector,
el producto interno de cuadri-vectores, etc.
7.2. DEFINICIONES FUNDAMENTALES 127

Definición 8.3 Un cuadri-vector (c-v) V es una cantidad cuyas com-


ponentes, que denotaremos por = 0 1 2 3, medidas por el observador
inercial , se transforman bajo una transformación de Lorentz de las coor-
denadas (ecuación (7.1)), de la misma manera que las coordenadas, es decir:
0
= (7.2)
donde 0 denota las componentes del cuadri-vector V medidas en el sis-
tema de referencia 0 . A las cantidades se le llaman las componentes
contravariantes del cuadri-vector V. Esta denominación de las componentes
contravariantes será justificada más adelante.
Ejemplos de c-v contravariantes son: el c-v posición , cuyas componentes
son las coordenadas de un evento físico, las diferenciales de coordenadas ,
la c-velocidad , la c-aceleración , el c-momentum , la c-fuerza , etc.
Las componentes de un c-v y 0 relacionadas por una transforma-
ción de Lorentz, representan el mismo objeto matemático ”medido” en dos
sistemas de referencia inerciales y 0 respectivamente. Asi V es el c-v y
son las componentes de en el sistema y 0 sus componentes en el
sistema 0 .
Definición 8.4 Un tensor T de segundo orden dos veces contravariante,
es un conjunto de 16 componentes ; = 0 1 2 3 medidas en un sistema
de referencia , tales que bajo una transformación de Lorentz (ecuación (7.1))
sus componentes se transforman como:
0
= (7.3)
donde 0 denota las componentes del tensor T en el sistemade referencia
0
.
Definición 8.5 La definición anterior se generaliza al caso de un tensor
T contravariante de orden , como un objeto de 4 componentes, medidas
en un sistema de referencia , cuyas componentes se transforman bajo una
transformación de Lorentz (7.1) en la forma:
0 1 2 = 1
1
2
2
··· 1 2
(7.4)

Así, podemos definir un tensor de orden cero como un escalar y un tensor


contravariante de orden uno como un c-vector.
En el siguiente capítulo veremos ejemplos de tensores de segundo orden
con significado físico, tales como el tensor campo electromagnético y el tensor
128 CAPÍTULO 7. TENSORES

energía-momentun. Por ahora trabajaremos con estas cantidades como obje-


tos matemáticos abstractos, sin asignarles ningún significado. Es de anotar
que en física no aparecen cantidades que se describan por tensores de orden
mayor al segundo, salvo en el caso de la Teoría General de la Relatividad,
en donde se requiere del tensor de Riemann, el cual es un tensor de cuarto
orden y cuyo significado está ligado al concepto geométrico de curvatura de
la variedad espacio-tiempo.

7.2.1. Componentes covariantes


Las transformaciones de Lorentz las definimos como el conjunto de trans-
formaciones de coordenadas, tales que dejen invariante el intervalo espacio-
tiempo (ver capítulo 4, ecuaciones (3.25) a la (3.30)), es decir, si y + ,
son las coordenadas de dos eventos físicos medidas por un observador iner-
cial , entonces la distancia espacio-tiempo entre estos dos eventos, definida
como:
2
= (7.5)
es invariante bajo una transformación de coordenadas, es decir:
2 0 0
= = (7.6)

en donde la matriz de Minkowski (llamado también tensor métrico de


Minkowski, por las razones que veremos en seguida) está definido por:

1; = =0
:= 1; = =1 2 3 (7.7)
0; 6=

Así, para que bajo una transformación de Lorentz el escalar de Lorentz


2
permanezca invariante, esto es:
2 0 0
= = = (7.8)

se debe cumplir que la matriz de Minkowski satisfaga la relación:

= (7.9)
7.2. DEFINICIONES FUNDAMENTALES 129

Como el determinante de la matriz de Minkowski es diferente de cero, i.e.,


det( ) = 1, entonces existe la matriz de transformación inversa ( ) 1 ,
cuyas componentes que denotaremos por , satisfacen la siguiente relación:
1
=1 (7.10)
la cual, escrita en términos de componentes toma la forma:
= (7.11)
en donde son los elementos de la matriz identidad.
Los elementos de la matriz inversa de Minkowsky coinciden numérica-
mente con , como se puede probar directamente. Además, la matriz de
Minkowski y su inversa son matrices simétricas, i.e. = y = .
Por otra parte, la inversa de una transformación de Lorentz está dada
por:
0
= (7.12)
con
1
=( ) = (7.13)
Los elementos de la transformación inversa de Lorentz se pueden obtener
a partir de la relación:
= (7.14)
pues
= = = (7.15)
en donde se ha hecho uso de la ecuación (7.9). Por ejemplo, si considera-
mos el caso particular de una transformación de Lorentz entre sistemas de
referencia inerciales y 0 , con ejes espaciales paralelos y la velocidad de
0
en la dirección del eje positivo, entonces los elementos de la matriz de
transformación de Lorentz están dados por (ver la ecuación (3.40))
0 0
0 0
= (7.16)
0 0 1 0
0 0 0 1
por lo tanto aplicando la relación (7.14), tenemos
0 0
0 0
= = (7.17)
0 0 1 0
0 0 0 1
130 CAPÍTULO 7. TENSORES

la cual corresponde a la transformación del sistema de referencia 0 al , que


equivale como vimos en el capítulo 3, a cambiar la velocidad por .
Definición 8.6 Definamos las “componentes” covariantes de un c-v
como
:= (7.18)

Esta definición tiene sentido, pues dado que la matriz de Minkowski


posee una inversa, la relación entre las componentes contravariantes y co-
variantes de un c-v es una relación biyectiva (uno a uno y sobre) y por lo
tanto es un isomorfismo, es decir, dadas las componentes contravariantes
de un c-v, sus componentes covariantes están unívocamente definidas
(ecuación (7.18)) y viceversa; es decir, dadas las componentes covariantes ,
entonces sus correspondientes componentes contravariantes se obtienen de la
transformación inversa, así
= (7.19)
Este resultado nos permite identificar a las componentes covariantes
y a las contravariantes de un c-v, como representaciones de un mismo
objeto abstracto V.
Podemos generalizar esta operación, que se conoce en el marco del análisis
tensorial como subir y bajar índices, al caso de tensores de cualquier rango.
Así por ejemplo, las componentes covariantes de un tensor de segundo orden
están relacionadas con sus componentes contravariantes por la ecuación:
= (7.20)
o también, podemos definir las componentes de un tensor de segundo orden
una vez contravariante y una vez covariante, con las siguientes posibilidades:
= ; = (7.21)
De esta forma, , , ,y son todas diferentes representa-
ciones de un mismo tensor de segundo rango T. Es importante anotar que el
orden de los índices en una ecuación tensorial debe ser preservado, dado que
en general 6= y por esta razón las componentes mixtas y
del tensor T son diferentes en general.
Para encontrar como se transformanlas componentes covariantes de cual-
quier tensor, bajo una transformación de Lorentz, consideremos primero el
caso particular de un c-v:
0 0 0
= = = = (7.22)
7.2. DEFINICIONES FUNDAMENTALES 131

Ahora, de la relación (7.14) multiplicándola por a ambos lados y


sumando sobre el índice , obtenemos

= = = (7.23)

Remplazando esta relación en el último término de la ecuación (7.22),


tenemos
0
= = (7.24)

Esta ecuación nos da la ley de transformación de las componentes covari-


antes de un c-v.
De lo visto hasta ahora, es fácil generalizar esta ecuación para obtener la
ley general de transformación de las componentes covariantes y contravari-
antes de un tensor cualquiera T, r-veces contravariante y s-veces covariante:
0 1 2
1 2
= 1
1
2
2
··· 1
1
2
2
··· 1 2
1 2
(7.25)

7.2.2. Algebra tensorial


Denotemos por el conjunto de todos los tensores 11 22 de orden
= + , r-veces contravariante y s-veces covariante. Así, en esta notación
un escalar es un elemento de 00 , un c-vector contravariante es un elemento
de 10 y uno covariante de 01 , etc.
Definición 8.7 Suma de tensores: Dados dos tensores T S defini-
mos la suma y la multiplicación por un escalar , por:
1 2
1 2
:= ( + ) 1 2
1 2
:= 1 2
1 2
+ 1 2
1 2
(7.26)
1 2
1 2
:= ( ) 1 2
1 2
:= 1 2
1 2
(7.27)
Notemos que estas operaciones no son más que la generalización directa
de la suma y el producto por un escalar de vectores cartesianos, en donde el
vector resultante de estas operaciones se obtiene como la suma componente
a componente y por el producto del escalar por cada componente del vector.
Cuando se define una opreación con tensores, hay que demostrar que esta
operación está bien definida, es decir, que la operación preserva el caracter
132 CAPÍTULO 7. TENSORES

tensorial. Esto significa que por ejemplo, para las operaciones definidas en las
ecuaciones (7.26) y (7.27), para la suma y multiplicación por un escalar de
tensores de un mismo rango, las componentes resultantes 11 y 11 se
¡¢
transforman efectivamente como las componentes de un tensor del tipo ,
es decir:
T S = Q=T+S P= T (7.28)
La demostración general de este resultado es muy sencilla y por esta razón
ilustraré el método para el caso particular de un tensor mixto de segundo
1
rango. Sean T S 1 con componentes para un observador inercial dadas
por y respectivamente y sea

= + (7.29)

Debemos probar que bajo una transformación de coordenadas, las compo-


nentes se transforman como un tensor del tipo 11 . Así, para un sistema
de referencia 0 tenemos, aplicando la ley de transformación (7.25) para las
componentes de los tensores 0 y 0
0 0 0
= +
= +
= ( + )
= (7.30)

lo cual implica que las cantidades se transforman como las componentes


1
de un tensor del tipo 1 , como se quería probar. Un procedimiento similar
se puede hacer para el producto de un escalar por un tensor. ¡¢
Este resultado muestra que el conjunto de todos los tensores del tipo
forman un espacio vectorial.
Definición 8.8 Producto tensorial: Dados dos tensores T yS ,
definimos el producto tensorial como:
1 2 +1 + +1 +2 +
1 2 +1 +
:= 1 2
1 2 +1 +2 +
(7.31)
+ ¡ + ¢ +
el cual es un tensor de + +
, es decir W + .
Esta operación no tiene su correspondiente en el cálculo vectorial ordi-
nario y representa lo que en álgebra matricial se llama un producto directo.
Como en el caso anterior, hay que probar que esta operación está bien definida
y para este fin consideremos el caso particular del producto de dos c-vectores,
7.2. DEFINICIONES FUNDAMENTALES 133

1
uno covariante y el otro contravariante. Sea T 0 y llamemos sus compo-
0
nentes , y 1 con componentes . Entonces, de la definición 8.8 el
producto está dado por
= (7.32)
y debemos probar que las componentes del producto se transforman
como:
0
= (7.33)
de acuerdo con la ecuación (7.25). Sean 0 y 0 las componentes de los
c-vectores y medidas en el sistema de referencia 0 , entonces en este
sistema de referencia las componentes del producto están dadas por:
0 0 0
= (7.34)

Puesto que T y S son c-vectores, sus componentes se transforman de


acuerdo con la relación:
0 0
= ; = (7.35)

Remplazando estas expresiones en la ecuación (7.34), tenemos


0 0 0
= = = = (7.36)

como se quería demostrar.


La siguiente operación que vamos a definir es fundamental en el cálculo
tensorial, pues nos permite obtener a partir de un tensor dado de rango ,
un tensor de rango 2. Así, si partimos de un tensor de rango par, por
aplicaciones sucesivas de esta operación, podemos obtener un tensor de rango
cero, es decir un escalar de Lorentz o en términos más físicos, un invariante
relativista.
Definición 8.9 Contracción de Indices: Dado un tensor 1 defin-
imos la contracción del índice contravariante (1 ) con el índice
covariante (1 ) por:
( ) 1
( )(
1 2
1 2
) := 1 2
1 2 1 (7.37)

Es decir, dado un tensor mixto de orden = + , contravariante


y covariante, al sumar sobre dos índices repetidos, uno contrava-
riante y otro covariante, obtenemos un tensor de orden 2, 1
134 CAPÍTULO 7. TENSORES

contravariante y 1 covariante. Para demostrar que esta opera-


ción está bien definida consideremos, sin pérdida de generalidad, un tensor
2
de de rango 4, 2 contravariante y 2 covariante 2
y contraigamos por ejemplo, el primer índice contravariante con el segundo
covariante:
( ) 1
( )( )= := 1 (7.38)
Entonces, veamos que las componentes que resultan , después de realiza-
da la operación de contracción, se transforman como las componentes de un
tensor mixto de rango 2. Si denotamos como es costumbre, por cantidades
primadas las componentes de los tensores en el sistema de referencia 0 y
aplicamos las correspondientes leyes de transformación de tensores, tenemos
entonces
0 0
= =
= =
= (7.39)
lo cual demuestra que la operación de contracción de índices está bien defini-
da. En la segunda igualdad hemos utilizado la ley de transformación para
el tensor 0 , la cual se aplica independientemente del hecho que el tensor
tenga dos índices repetidos sobre los cuales se suma. Para obtener la tercera
igualdad se ha utilizadoel hecho que los elementos de la transformación
y , corresponden a la transformación de Lorentz de a 0 y a su inversa
respectivamente y por lo tanto satisfacen la relación (7.15). Finalmente, al
sumar sobre el índice repetido , por la definición de la delta de Kronecker
, todos los términos son cero, salvo aquel para el cual = , obteniendose
de esta forma la cuarta iguldad.
Antes de continuar con otras operaciones entre tensores, mostremos que
las componentes de la matriz de Minkowski , su inversa y la delta
de Kronecker son tensores de segundo rango, lo que justifica el nombre
de tensor métrico de Minkowski y además , y corresponden a
diferentes representaciones del mismo objeto matemático, el tensor métrico
, con la particularidad que las componentes de este tensor métrico toman
los mismos valores numéricos en todos los sistemas de referencia inerciales.
El papel especial de este objeto matemático lo podemos ver, si retornamos
a la definición del intervalo espacio-tiempo entre dos puntos de la variedad
espacio-tiempo:
2
= (7.40)
7.2. DEFINICIONES FUNDAMENTALES 135

El escalar 2 es obtenido a partir del producto de tres tensores ( ,


y ) seguida de una doble contracción sobre índices, y por lo visto hasta
ahora, estas operaciones están bien definidas. También, podemos probar di-
rectamente el carácter tensorial de , pues dado que 2 es un invariante,
entonces
2 0 0 0
=
=
=
= (7.41)
en donde hemos denotado por 0 a las componentes del tensor métrico
medidas en el sistema de referencia 0 , las cuales están relacionadas con sus
componentes en el sistema por:
0
= (7.42)
Un cálculo directo, aplicando las propiedades de las transformaciones de
Lorentz, muestra que las componentes del tensor en el sistema 0 coinciden
con sus componentes en . Un procedimiento similar se puede seguir para
probar que y también se transforman como tensores de segundo rango
(dos veces contravariante y mixto respectivamente) y que sus componentes
son las mismas en todos los sistema de referencia inerciales.
Un caso particular que surge de la combinación de las operaciones, pro-
ducto tensorial y contracción de índices, es la generalización de la Defini-
ción 8.6, llamada subir y bajar índices, pues el producto tensorial del tensor
métrico de segundo orden (sea de sus componentes contravariantes , co-
variantes o mixtas ) con un tensor cualquiera T de orden n, seguida de
una contracción de índices, produce de nuevo un tensor de orden ; por ejem-
plo, consideremos un tensor T de cuarto orden del tipo 22 . Al multiplicar
2 4
este tensor T por el tensor métrico 0 , produce un tensor del tipo 2,
3
que al contraer dos índices conduce a otro tensor del tipo 1 . Resumiendo
tenemos:
= (7.43)
Otro caso particular de la combinación de estas dos operaciones tensori-
ales, producto tensorial seguida de una contracción, es el producto punto de
dos c-vectores, pues
· = = = = (7.44)
136 CAPÍTULO 7. TENSORES

Por ejemplo, consideremos el c-vector momentun de una partícula de


masa en reposo 0 , cuyas componentes contravariantes en algún sistema de
referencia inercial , están dadas por = ( 0 1 2 3) ( ).
Entonces podemos calcular sus correspondientes componentes covariantes en
este sistema como
= =( 0 1 2 3) =( ) (7.45)
Aplicando ahora cualquiera de las expresiones dadas en la ecuación (7.44),
obtenemos que su norma al cuadrado está dada por
2 2 2 2 2 2 2 2
= · = = 0 (7.46)

7.2.3. Propiedades de simetría de tensores


En esta sección definiremos los conceptos de tensores simétricos y anti-
simétricos e introduciremos la operación tensorial de simetrización (y anti-
simetrización) de las componentes de un tensor, la cual es de utilidad para
generalizar algunas operaciones del cálculo vectorial usual, como veremos en
la última sección del presente capítulo.
Definición 8.10 Un tensor de segundo rango del tipo 20 , con compo-
nentes en un sistema de referencia , se llama simétrico si
= (7.47)
y antisimétrico si
= (7.48)
Esta definición es válida también, para las componentes covariantes de un
tensor de segundo rango y puede ser generalizada a cualquier par de índices
de un tensor de rango 2. Por ejemplo, para un tensor R de cuarto rango
del tipo 04 , simétrico en su primera y tercera componente y antisimétrico en
la segunda y cuarta componente, se tiene que
= ; = (7.49)
Es fácil probar, a partir de las propiedades de transformación de las com-
ponentes, que el carácter simétrico o antisimétrico de un tensor es independi-
ente del sistema de referencia, pues si = en un sistema de referencia
, entonces de las propiedades de transformación (ecuación (7.3)) tenemos
0 0
= = = = (7.50)
7.2. DEFINICIONES FUNDAMENTALES 137

como se quería probar.


Dado un tensor de segundo rango con componentes en un sistema de
referencia, siempre se puede escribir este tensor como la suma de un tensor
simétrico más uno antisimétrico, es decir

= + (7.51)

con = y = . Para demostrar esta afirmación basta con


tomar
1
:= ( + ) (7.52)
2
y
1
:= ( ) (7.53)
2
en donde al tensor se le llama la parte simétrica del tensor y al
tensor su parte antisimétrica. Claramente estas mismas relaciones son
válidas para índices covariantes. De estas ecuaciones ( (7.52) y (7.53)) se
deduce además, que un tensor es simétrico si su parte antisimétrica es cero
y es antisimétrico si su parte simétrica es cero:
1
= = ( )=0 (7.54)
2
1
= = ( + )=0 (7.55)
2
Un ejemplo de un tensor simétrico es el tensor métrico de Minkowski,
pues por su definición = .
Las ecuaciones (7.52) y (7.53) nos conducen a la siguiente definición de
dos nuevas operaciones tensoriales:
Definición 8.11 Dado un tensor T de segundo rango del tipo 20 , con
componentes en un sistema de referencia , definamos un nuevo tensor
que lo denotaremos como ( ) , por la operación
( ) 1
:= ( + ) (7.56)
2
el cual por definición es simétrico, es decir ( ) = ( ) . A esta operación se
le conoce en la literatura como simetrización de un tensor. Claramente, si el
tensor es simétrico, entonces el tensor simetrizado coincide con el tensor
original, esto es ( ) = y si el tensor es antisimétrico, el tensor
( )
simetrizado es cero: = 0.
138 CAPÍTULO 7. TENSORES

Similarmente, definimos la operación de antisimetrización de un tensor


dado , que lo denotaremos como [ ] , por:

[ ] 1
:= ( ) (7.57)
2
De la misma manera se tiene que si un tensor es simétrico, entonces el
tensor antisimetrizado es cero y si es antisimétrico, entonces [ ] = .
Claramente estas operaciones son válidas también para tensores del tipo 02 .
Tanto las definiciones de simetría y antisimetría dadas (Definición 8.10),
así como las operaciones de simetrización y antisimetrización (Definición
8.11), se pueden generalizar a tensores de orden mayor. Antes de consider-
ar este problema, se introducirán algunos elementos básicos de la teoría de
permutaciones.
Consideremos el conjunto {1 2 } de los primeros números naturales
y denotemos por ( 1 2 ) un arreglo ordenado de ellos, sin que ninguno
se repita. Existen entonces ! = 1 · 2 · 3 · · formas diferentes de ordenar
en este arreglo los pimeros números naturales. Por ejemplo, si tomamos el
conjunto {1 2 3}, podemos construir 3! = 6 arreglos diferentes:

(1 2 3); (1 3 2); (2 1 3); (2 3 1); (3 1 2); (3 2 1) (7.58)

Dado un arreglo ( 1 2 ), definimos una permutación sobre este


arreglo, como el arreglo obtenido al permutar los elementos del arreglo orig-
inal. Denotaremos simbólicamente esta operación de permutación por

( 1 2 )=( (1) (2) ( )) (7.59)

en donde es una función (uno a uno y sobre)

: {1 2 } {1 2 }
(7.60)
7 ( )=

Por ejemplo, el arreglo (3 2 1) se puede obtener a partir del primer arreglo


(1 2 3) permutando los números 1 y 3:

(1 2 3) ( 1 2 3) =( (1) (2) (3) ) = (3 2 1) (7.61)

Definamos ahora una transposición como una permutación

+1 (7.62)
7.2. DEFINICIONES FUNDAMENTALES 139

obtenida, al permutar dos números consecutivos y +1 del arreglo original:

+1 ( 1 2 +1 )=( 1 2 +1 ) (7.63)

Claramente, cualquier arreglo de los números {1 2 } se puede obtener


por una permutación sobre un arreglo dado, incluyendo como caso par-
ticular, la permutación identidad que no cambia el arreglo original. Además,
cualquier permutación dada se puede obtener aplicando sucesivamente trans-
posiciones. Es decir, toda permutación se puede descomponer, o factorizar,
como el producto de transposiciones:

= +1 +1
··· +1
(7.64)

En el ejemplo ilustrado en la ecuación (7.58), se puede obtener el segundo


arreglo (1 3 2) a partir del primer arreglo (1 2 3), aplicando la transposición
2 3 , esto es:
2 3 (1 2 3) = (1 3 2) (7.65)
pero también es posible obtener este mismo arreglo en otra forma, por apli-
cación sucesiva de las transposiciones siguientes:

3 1 2 1 2 3 1 3 1 2 (1 2 3) = 3 1 2 1 2 3 1 3 (2 1 3)
= 3 1 2 1 2 3 (2 3 1)
= 3 1 2 1 (3 2 1)
= 3 1 (3 2 1)
= (1 3 2) (7.66)

Este ejemplo muestra que no hay una única forma de obtener una per-
mutación dada por transposiciones sucesivas. Sin embargo, el número definido
por: ½
+1
( 1) = (7.67)
1
sí es independiente de las transposiciones realizadas para obtener la per-
mutación dada. Este número es llamado el signo de la permutación, siendo
igual al número de las transposiciones realizadas. Esto significa que si
una permutación dada se factoriza en un número par (impar) de transposi-
ciones, entonces, cualquier otra factorización de la misma permutación, con-
tendrá también un número par (impar) de transposiciones. Una permutación
140 CAPÍTULO 7. TENSORES

se llama par(impar) si el signo es +1( 1). Así en nuestro ejemplo anteri-


or, la permutación (1 2 3) = (1 3 2) se puede escribir en términos de
transposiciones, como = 2 3 , en cuyo caso = 1 y el signo de la
permutación es ( 1) = 1, o también se puede factorizar en la forma
= 3 1 2 1 2 3 1 3 1 2 , con = 5 y por lo tanto el mismo signo de
la permutación ( 1)5 = 1.
Con estos elementos básicos de la teoría de permutaciones, podemos ex-
tender las operaciones anteriores de simetrización y antisimetrización a ten-
sores de orden superior.
Definición 8.12 Dado un tensor de rango del tipo 0 , con compo-
nentes 1 ··· en un sistema de referencia , definamos dos nuevos tensores,
uno completamente simétrico en todos sus índices que denotaremos como
( 1 ··· )
y el otro completamente antisimétrico en todos sus índices que de-
notaremos como [ 1 ··· ] , por las operaciones

( 1 ··· ) 1X ( 1 ··· )
:= (7.68)
!

[ 1 ··· ] 1X ( 1 ··· )
:= ( 1) (7.69)
!
en donde la suma se realiza sobre todas las permutaciones de los índices
( 1 · · · ). La misma definición vale para índices covariantes.
Por ejemplo, consideremos un tensor del tipo 03 y construyamos los
tensores ( ) y [ ] por las operaciones definidas en las ecuaciones (7.64)
y (7.69):
1
( ) := ( + + + + + ) (7.70)
3!
1
[ ] := ( + + ) (7.71)
3!
Es fácil comprobar directamente que el nuevo tensor ( ) es comple-
tamente simétrico bajo cualquier permutación de sus índices; por ejemplo
(031) = (013) = , mientras que el tensor [ ] es completamente anti-
simétrico bajo permutación de sus índices, pues por ejemplo [031] = [013] ,
pero [031] = [310] dado que en el primer caso los índices [013] correspon-
den a una permutación par de los índices originales [031], mientras que en el
segundo caso el arreglo de índices [310] es una permutación par del arreglo
7.2. DEFINICIONES FUNDAMENTALES 141

original [031]. Notemos que las definiciones dadas para tensores de segundo
rango son un caso particular de la Definición 8.12. Un ejemplo de esta op-
eración de antisimetrización de tensores, lo constituye la generalización del
producto cruz usual del cálculo vectorial tridimensional.
Sean y las componentes de dos c-vectores en un sistema de referen-
cia . Definamos un nuevo vector como el producto tensorial antisimetrizado
de estos dos c-vectores:

[ ] 1
:= = { } (7.72)
2

Un tensor de segundo rango en n dimensiones tiene 2 componentes


independientes. En el caso particular de las 4 dimensiones del espacio-tiempo
2
= 16 componentes independientes. Si el tensor es simétrico entonces
= y su número de componentes independientes se reduce a:
2
( + 1)
+ = (7.73)
2 2

Ahora, si el tensor es antisimétrico = su número de compo-


nentes independientes está dado por:
2
( 1)
= (7.74)
2 2
pues en este caso las componentes con índices repetidos son cero. En el ca-
so de vectores tridimensionales cartesianos = 3, y por lo tanto el número
de componentes independientes de un tensor antisimétrico de segundo rango
es tres. Así, podemos identificar a las tres componentes independientes que
surgen de la operación definida en la ecuación (7.72), a su vez con las compo-
nentes de un nuevo vector, el cual se conoce como el producto cruz del cálculo
vectorial usual. Notemos que esta identificación no es posible para otras di-
mensiones del espacio, pues por ejemplo, en cuatro dimensiones el número
de componentes independientes de un tensor antisimétrico de segundo rango
es de seis y por lo tanto estas componentes no pueden ser identificadas con
las componentes de nigún c-vector.
Para finalizar esta sección consideraremos un ejemplo especial de un ten-
sor de cuarto rango completamente antisimétrico, el cual jugará un papel
importante en el capítulo octavo sobre las ecuaciones de Maxwell. Definamos
142 CAPÍTULO 7. TENSORES

el tensor , llamado tensor de Levi-Civita, por la ecuación:

+1 ´ 0123
:= 1 ´ 0123 (7.75)
0 ´

Este tensor, al igual que el tensor métrico de Minkowski, tiene la partic-


ularidad que en todos los sistemas de referencia inerciales sus componentes
tienen el mismo valor numérico. Para probar que es un tensor con esta
característica, se debe mostrar que sus componentes se transforman, bajo
una transformación de Lorentz, en la forma
0
= (7.76)

Para esto, es suficiente notar lo siguiente: si en la ecuación anterior reem-


plazamos los índices , , y por 0, 1, 2 y 3 respectivamente, entonces la
ecuación (7.76) toma la forma
0123 0 1 2 3
1= = = det | | (7.77)

De lo visto en el capítulo 3 sobre las propiedades de las transformaciones


de Lorentz, es fácil deducir que toda transformación de Lorentz propia, es
decir que no involucra inversión de los ejes espaciales o inversión de la co-
ordenada temporal, tiene determinante igual a 1. Así, la ecuación (7.77)
es una identidad y por lo tanto las componentes del tensor de Levi-
Civita deben transformarse de acuerdo con la ecuación (7.76), como se quería
mostrar.

7.3. Transformación general de coordenadas


Antes de continuar con la generalización de los operadores vectoriales
usuales del cálculo diferencial (gradiente, divergencia y rotacional), veamos el
caso general de transformaciones de coordenadas que contienen, lógicamente,
el caso particular de las transformaciones de Lorentz que hemos considerado
hasta ahora.
Sean y 0 dos sistemas de referencia y llamemos y 0 las coordenadas
de un punto medidas en los sistemas de referencia y 0 respectivamente.
Supongamos, sin pérdida de generalidad, que nuestro espacio es de cuatro
dimensiones. Entonces, un cambio general de coordenadas entre los sistemas
7.3. TRANSFORMACIÓN GENERAL DE COORDENADAS 143

y 0 se puede expresar como un conjunto de cuatro ecuaciones, en donde


las nuevas coordenas primadas son funciones continuas, con inversa continua,
de las coordenadas no primadas. Así la transformación de coordenadas y su
inversa, se pueden escribir como:
0 0
= ( ) (7.78)
0
= ( ) (7.79)

Notemos que si exigimos que las transformaciones de coordenas sean lin-


eales, entonces estas ecuaciones se reducen a la forma:
0
= (7.80)
0
= (7.81)
con los coeficientes de la transformaciones (y los de la transformación
inversa ) constantes, independientes de las coordenadas. Las componentes
del vector desplazamiento infinitesimal en el sistema de coordenadas
0 1 2 3
están dadas por =( ), mientras que las correspondientes
componentes medidas en 0 son 0 = ( 00 01 02 03
). Para encontrar
la relación entre las componentes del vector en los dos sistemas, basta
con tomar la diferencial total de cada una de las funciones en las ecuaciones
(7.78) y (7.79), así:
0
0
= (7.82)

0
= 0
(7.83)
Estas ecuaciones definen la ley de transformación (y su inversa) para las
componentes de cualquier vector en los dos sistemas de referencia:
0
0
= (7.84)

0
= 0
(7.85)
En el caso particular de transformaciones lineales (ecuaciones (7.80) y
(7.81)), la ley de transformación para las componentes de un vector toma la
forma:
0
= (7.86)
144 CAPÍTULO 7. TENSORES

0
= (7.87)
la cual se obtiene del caso general si hacemos la siguiente identificación:
0
= (7.88)

= 0
(7.89)
Finalmente, puesto que las transformaciones de coordenadas deben ser
invertibles se debe cumplir que
0

0
= (7.90)

Esta relación se obtiene directamente, si aplicamos la regla de la cadena para


las derivadas a la transformación idéntica 0 ( ( 0 )) 0
, la cual para el
caso particular de transformaciones lineales, toma la forma = . Así,
teniendo en cuenta las ecuaciones (7.88) y (7.89), toda el álgebra y los con-
ceptos del cálculo tensorial desarrollados en este capítulo, para el caso partic-
ular de transformaciones de Lorentz, son válidos para el caso más general de
transformaciones arbitrarias de coordenadas. Las restricciones que impong-
amos sobre el conjunto de transformaciones de coordenadas entre sistemas,
nos determinan las propiedades matemáticas (o físicas, según sea el caso) del
espacio sobre el cual estamos trabajando. Por ejemplo, si consideramos que
los sistemas de referencia físicamente significativos son los inerciales y que
el principio de la constancia de la velocidad de la luz en el vacío se cumple,
entonces solamente las ecuaciones de transformación de coordenadas admisi-
bles son aquellas que dejan el intervalo espacio-tiempo invariante, obteniendo
entonces el caso particular de transformaciones de Lorentz que hemos estado
considerando en este capítulo. Otra posibilidad sería por ejemplo, aceptar el
principio de la constancia de la velocidad de la luz, pero postular que las leyes
de la física son válidas en todos los sistemas de referencia, séan inerciales o no.
Para este caso más general ya no estamos restringidos a transformaciones de
coordenadas lineales, como en el caso anterior que corresponde a la relativi-
dad especial, aún cuando se sigue exigiendo que el intervalo espacio-tiempo
permanezca invariante, esto es
2 0 0 0
= = (7.91)
En este caso, bajo una transformación admisible de coordenadas, las com-
ponentes del tensor métrico (denotado ahora por ) son en general funciones
7.4. OPERADORES VECTORIALES 145

de las coordenadas y por tanto, a diferencia del tensor métrico de Minkows-


ki, sus componentes varían de un sistema de coordenadas (o de referencia)
a otro. Este último ejemplo adquiere todo su significado en la teoría general
de la relatividad, cuyo estudio está más allá del alcance del presente libro.

7.4. Operadores vectoriales


En el cálculo vectorial usual sobre R3 se define el operador gradiente
como:
=( ) (7.92)

el cual al actuar sobre una función escalar produce un vector en la dirección


del máximo cambio de la función. Por función escalar se entiende, una función
de valor real y variable vectorial, es decir una función de la forma

: R3 7 R (7.93)

tal que, a un vector = ( ) de R3 le asocia un número real ( ).


Así, al actuar el operador gradiente sobre la función ( ) da como
3
resultado un vector sobre cada punto de R , con sus componentes dadas por

=( ) (7.94)

Si consideramos ahora una función vectorial ( ), es decir una fun-


ción de valor vectorial y variable vectorial:

: R3 7 R3 (7.95)

con componentes ( ), entonces podemos hacer actuar el operador


gradiente sobre en la forma

· = + + (7.96)

para obtener una función real llamada la divergencia. También es posible


obtener un vector a partir del operador gradiente, actuando éste sobre una
función vectorial en la forma:

× =( ) (7.97)
146 CAPÍTULO 7. TENSORES

conocida como el rotacional de una función vectorial. Notemos que las tres
operaciones definidas a partir del operador , el gradiente, la divergencia y
el rotacional, se pueden considerar como una extención de las operaciones
usuales del álgebra vectorial: el producto de un vector por un escalar, el
producto interno entre vectores y el producto cruz, respectivamente. Por
esta razón es usual considerar para todos los efectos al operador como un
vector, con el cual podemos construir todo tipo de operaciones permitidas
dentro del cálculo vectorial usual, solamente teniendo presente el orden en el
cual entra en la expresiones, pues el vector actua sobre funciones. Así
por ejemplo, podemos construir expresiones tales como
2 2 2
2
= · = 2
+ 2
+ 2
(7.98)

conocida como el operador Laplaciano.


Definamos entonces el cuadri-vector gradiente como un operador difer-
encial, tal que al actuar sobre una función escalar de las coordenadas ( ),
produce el c-vector , cuyas componentes en un sistema de referencia
están dadas por:
( ) =( 0 1 2 3
) (7.99)
A las componentes de las denotaremos también como ,o .
Veamos entonces, que las componentes de se transforman como las com-
ponentes covariantes de un c-vector bajo una transformación de coordenadas.
Sean y 0 las coordenadas de un evento, medidas en los sistemas de ref-
erencia y 0 respectivamente y relacionadas por una transformación de
Lorentz, entonces las componentes covariantes de un c-vector V, en los dos
sistemas de referencia, están relacionadas por:
0
= 0
(7.100)

de acuerdo con las ecuaciones (7.88) y (7.89) de la sección anterior. Bajo


una transformación de coordenadas por definición, una función escalar per-
manece invariante, es decir ( ) = ( 0 ). Teniendo en cuenta que bajo la
transformación de coordenadas se tiene 0 = 0 ( ) y aplicando la regla
de la cadena a la función ( 0 ( )), obtenemos para las componentes del
operador gradiente, medidas en los dos sistemas de referencia, la relación
0 0
( ) 0
= 0
(7.101)
7.4. OPERADORES VECTORIALES 147

Puesto que esta relación es general e independiente de la función escalar ,


podemos concluir que las componentes del operador gradiente se transforman,
bajo un cambio de coordenadas, como las componentes covariantes de un c-
vector, es decir
0
= (7.102)
A partir de esta definición, podemos construir los operadores de uso más
frecuente en física, siguiendo los mismos procedimientos que en el caso del
cálculo vectorial tridimensional estandar. Consideremos un campo vectorial
( ), esto es, una función vectorial de las coordenadas y calculemos el pro-
ducto interno Minkowskiano entre este campo vectorial y el vector gradiente:

· = (7.103)

que corresponde a la generalización del operador divergencia tridimensional.


Un ejemplo de esta operación de uso muy frecuente en física, es la llamada
ecuación de continuidad:
0
=0 0
+ ˜ =0 (7.104)

en donde el simbolo significa el operador gradiente tridimensional. Clara-


mente esta ecuación, por provenir de un producto interno entre c-vectores,
es invariante bajo transformaciones de coordenadas, es decir
0 0
=0= (7.105)

lo que significa que la ecuación de continuidad escrita de esta manera, au-


tomáticamente satisface el principio de relatividad. Ahora, si definimos un
nuevo operador (conocido en la literatura como el D’Alembertiano ¤) como el
producto interno del operador gradiente consigo mismo, obtenemos un oper-
ador que es un invariante (un escalar) bajo transformaciones de coordenadas,
asi
2
¤= = = 02
2
(7.106)
la cual nos permite escribir directamente la ecuación de ondas como:

¤ =0 (7.107)

Es conocido del álgebra vectorial, que el producto cruz entre vectores


es una operación que solo tiene sentido para vectores cartesianos en tres
148 CAPÍTULO 7. TENSORES

dimensiones y por lo tanto en la forma usual como ella se define, no es posible


generalizarla a vectores definidos en otras dimensiones espaciales. Realmente
el producto cruz usual es un caso particular de tensores de segundo rango,
como fue discutido al final de la sección 5.2.3.
La operación de antisimetrizar un tensor de segundo rango (ecuación
(7.57)) nos permite generalizar el producto cruz del cálculo verctorial usual
en tres dimensiones, al caso de varias dimensiones, obteniendose no un vec-
tor axial como en el caso tridimensional, sino un tensor de segundo rango
antisimétrico. Así por ejemplo, el “rotacional” de una función vectorial
está dado por:
[ ] = (7.108)
Si aplicamos esta definición al caso particular de un vector tridimen-
sional usual, con componentes A = ( ) ( 1 2 3) y
=( ) , entonces las siguientes tres componentes in-
dependientes del tensor [ ]

[1 2] =

[3 1] = (7.109)

[2 3] =

corresponden a las componentes , y del rotacional × A respectiva-


mente, en el cálculo vectorial ususal.
Capítulo 8

Electrodinámica

8.1. Introducción
En el segundo capítulo sobre los fundamentos de la teoría especial de la
relatividad, vimos como las ecuaciones de Maxwell no permanecían invari-
antes bajo transformaciones de Galileo, indicando que si se aceptan las leyes
de la electrodinámica, entonces ellas son válidas únicamente en un sistema de
referencia privilegiado y por lo tanto, a través de experimentos electromag-
néticos se podría determinar el movimiento absoluto. Los resultados negativos
de estos experimentos planteaban una inconsistencia entre los principios de
la mecánica Newtoniana y las leyes del electromagnetismo, las cuales con-
dujeron a muchos teóricos de la época, a desarrollar elaboradas teorias que
permitieran coexistir, sin aparente contradicción, a estos dos grandes pilares
de la física del siglo XIX.
La relatividad especial, basada sobre los potulados de la constancia de la
velocidad de la luz en el vacío y el principio de relatividad, es una teoría inde-
pendiente de los fenómenos eléctricos y mecánicos y por esta razón constituye
uno de los pilares fundamentales de la física. En efecto podemos partir por
ejemplo, de la validez de la ley de Coulomb para la fuerza entre dos partículas
cargadas en reposo respecto a algún observador inercial (o equivalentemente,
del campo eléctrico producido por una carga en reposo) y del carácter invari-
ante de la carga eléctrica y encontrar, utilizando los principios de la dinámica
relativista, la necesidad de introducir un campo dependiente de la velocidad
de la partícula que lo produce, conocido como el campo magnético. Contin-
uando con este procedimiento, más algunas hipótesis de origen experimental,

149
150 CAPÍTULO 8. ELECTRODINÁMICA

tales como la conservación de la carga, se pueden encontrar las leyes de la elec-


trodinámica que rigen el comportamiento de los campos electromagnéticos,
así como la fuerza sobre las partículas cargadas en campos electromagnéticos.
Este método de trabajo para mostrar el caracter relativista de la electrod-
inámica ha sido extensivamente utilizado en la literatura (ver por ejemplo el
exelente tratado en el libro de Rosser) y por esta razón presentaré en este
capítulo otro método de trabajo, el cual nos permite encontrar de manera
directa las propiedades de transformación de los campos electromagnéticos
entre sistemas de referencia inerciales.
El objetivo fundamental de este capítulo es entonces, escribir las leyes
de la electrodinámica en forma explícita covariante, es decir, de tal manera
que su invarianza relativista sea manifiesta. Como una consecuencia de es-
ta formulación de las ecuaciones de Maxwell, obtendremos las ecuaciones de
transformación de los campos eléctricos y magnéticos bajo transformaciones
de Lorentz. Para este fin, haremos uso del formalismo tensorial desarrolla-
do en el capítulo anterior, postulando en primer lugar, que las leyes de la
electrodinámica, constituidas por las ecuaciones de Maxwell, la ecuación de
continuidad para la carga y la ley de la fuerza de Lorentz, son válidas y luego
reescribiremos estas ecuaciones en términos de cantidades tensoriales.

8.2. Ecuaciones de Maxwell


Las leyes de la electrodinámica están constituidas por dos conjuntos de
ecuaciones. El primer conjunto lo conforman las ecuaciones de Maxwell que
están dadas por (en unidades cgs):

· =4 (8.1)

· =0 (8.2)

1 4
× = + (8.3)

1
× = (8.4)

las cuales nos determinan los campos eléctrico y magnético en términos


de sus fuentes (cargas y corrientes), con la densidad volumétrica de carga y
8.2. ECUACIONES DE MAXWELL 151

la densidad de corriente eléctrica. La primera de estas ecuaciones es cono-


cida como la ley de Gauss y establece que las cargas eléctricas son fuente
del campo eléctrico, mientras que la tercera ecuación, la correspondiente ley
de Gauss para el campo magnético, nos dice que no existen fuentes para el
campo magnético, es decir, que en la naturaleza no existen cargas magnéticas
aisladas, conocidas en la literatura como monopolos magnéticos. La segunda
de las ecuaciones de Maxwell contiene dos términos: por una parte está la
ley de Ampere, esto es, que las corrientes eléctricas (representadas en el tér-
mino 4 ) producen campos magnéticos y por otra parte está el término
1 , introducido por Maxwell, que nos dice que campos eléctricos vari-
ables en el tiempo son también una fuente de campo magnético. La última de
las ecuaciones de Maxwell es la ley de inducción de Faraday, la cual establece
que campos magnéticos variables en el tiempo inducen campos eléctricos.
El segundo conjunto de ecuaciones que conforman las leyes de la electrod-
inámica, lo constituyen la ecuación de continuidad y la ley de la fuerza de
Lorentz:
· + =0 (8.5)

= + × (8.6)
en donde es la carga de la partícula y su velocidad. La primera de estas
ecuaciones, la ecuación de continuidad, establece que la carga eléctrica es
conservada en la naturaleza. Es decir, si en una región del espacio la densi-
dad de carga eléctrica varía ( 6= 0), es porque esta entrando o saliendo
carga de esa región ( · 6= 0). Es de anotar que esta ley de conservación de
la carga está contenida en las ecuaciones de Maxwell y por lo tanto no con-
stituye una ley independiente de la electrodinámica, pues basta con tomar la
divergencia de la segunda ecuación de Maxwell y teniendo en cuenta la ley de
Gauss (primera ecuación) se llega directamente a la ecuación de continuidad.
Sin embargo, es usual y útil, para claridad en la discusión, mantener ex-
plícitamente esta ecuación de continuidad. Finalmente, la ley de la fuerza de
Lorentz nos da la ecuación de movimiento para una carga puntual inmersa
en un campo electromagnético.
Las ecuaciones de Maxwell muestran como los campos eléctricos y mag-
néticos son en realidad aspectos diferentes de un solo fenómeno. Sin embargo,
hasta el siglo XVIII los fenómenos eléctricos y los magnéticos, conocidos por
la humanidad desde tiempos remotos, se consideraban como fenómenos com-
pletamente independientes entre si, situación que se puede entender ahora, si
152 CAPÍTULO 8. ELECTRODINÁMICA

consideramos el caso particular de campos electromagnéticos independientes


del tiempo, con sus fuentes de cargas y corrientes estacionarias. Bajo estas
condiciones (campos y densidades de carga y corriente independientes del
tiempo), las ecuaciones de Maxwell (ecuaciones (8.1) a la (8.4)) se pueden
separar en dos conjuntos independientes: El primer conjunto de ecuaciones,
dado por:
· =4 (8.7)
× =0 (8.8)
describe las leyes de la electrostática. La primera ecuación, la ley de Gauss,
describe que la única fuente del campo eléctrico son las cargas (estacionarias),
mientras que la segunda ecuación nos dice que el campo producido por estas
cargas es conservativo. Estas dos ecuaciones son equivalentes a la ley de
Coulomb. El segundo conjunto de ecuaciones
4
× = (8.9)

· =0 (8.10)
constituido por la ley de Ampere (con densidad de corriente estacionaria ,
i.e. · = 0) y la ley de Gauss para el campo magnético, describen las leyes
de la magnetostática y muestran que la única fuente del campo magnético
también son las cargas eléctricas, pero ahora en movimiento (corrientes). Si
bien sabemos que el origen de los campos electrostáticos y magnetostáticos
son las cargas, los conjuntos de ecuaciones (8.7), (8.8) y (8.9), (8.10) para los
campos y no establecen ninguna relación entre estos campos, es decir, si
bien y tienen en últimas las mismas fuentes por origen, son conceptual
y fenomenológicamente diferentes. Veremos en la siguiente sección, como la
relatividad especial nos permite establecer una relación entre el campo mag-
nético y el eléctrico, aún en el caso particular de campos independientes del
tiempo.

8.3. Campo magnético como un efecto rela-


tivista
Antes de entrar al tema central del presente capítulo, mostraremos en
esta sección la estrecha relación que existe entre los fenómenos eléctricos y
8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 153

magnéticos (para campos independientes del tiempo) como una aplicación de


los postulados fundamentales de la teoría especial de la relatividad. Veamos
entonces, como surge el concepto de campo magnético como una necesidad
para mantener la invarianza de las leyes físicas, si suponemos que la ley de
Coulomb, la cual nos da la fuerza entre dos partículas cargadas en reposo, es
válida. Coulomb fue el primero en describir cuantitativamente la fuerza entre
partículas cargadas estacionarias a través de la ley de fuerzas:
1 2
12 = 2
ˆ (8.11)

en donde 1 y 2 miden las cargas eléctricas de las partículas, es la distancia


entre en ellas, con ˆ un vector unitario en la dirección del radio vector que
une la carga 1 con la carga 2, y es una constante de proporcionalidad
que depende del sistema de unidades elegido ( = 1 en el sistema cgs que
usaremos en el presente capítulo). Entonces 12 nos mide la fuerza que la
carga 2 experimenta debido a la carga 1 , siendo esta fuerza atractica o
repulsiva dependiendo del signo de las cargas: repulsiva si las cargas son
del mismo signo y atractiva en caso contrario. Además, esta expresión de la
fuerza satisface por su definición la tercera ley de Newton, esto es 12 = 21 .
En esta relación (ecuación (8.11)) se ha expresado la fuerza sobre la carga 2
debido a la carga 1 y en este sentido podemos escribir la ley de Coulomb en
la forma:
12 = 2 1 ( ) (8.12)
en donde la cantidad 1( ), definida como
1
1( ) := 2
ˆ (8.13)

es el campo eléctrico producido por la carga 1 en el punto (hemos elegido el


origen del sistema de coordenadas espaciales en la posición de la carga 1 para
simplicar las expresiones). Estas expresiones para la fuerza (ecuación (8.11))
y el campo eléctrico (ecuación (8.13)) son válidas para un observador inercial
, con respecto al cual la carga 1 está en reposo. Es un hecho experimental,
que la fuerza sobre la carga de prueba 2 es independiente del estado de
movimiento de la carga de prueba, lo cual está implícito en la expresión para
la fuerza de Coulomb, pues ella depende solamente de la posición instantánea
de la carga 2 . Además, tanto la fuerza de Coulomb como el campo eléctrico
producido por la carga 1 , son independientes del tiempo siempre y cuando la
154 CAPÍTULO 8. ELECTRODINÁMICA

Figura 8.1: Interacción Coulombiana normal al movimiento

carga 1 permanezca en reposo. Experimentalmente determinamos la fuerza


12 sobre la carga de prueba 2 en el sistema de referencia inercial , midiendo
la rata de cambio del momentun 2 de la carga 2 , es decir midiendo 2 ,
así como también las otras variables cinemáticas y dinámicas que entran en la
definición de la fuerza de Coulomb, tales como la distancia entre la carga 1 y
la de prueba, la velocidad (nula en este caso) de la carga 1 y el momentun 2
de 2 . Si consideramos otro sistema de referencia inercial 0 , el cual se mueve
0
con velocidad a lo largo de los ejes con respecto a , entonces todas las
cantidades cinemáticas y dinámicas deben transformarce de acuerdo con los
principios de la relatividad especial y a partir de estas cantidades podemos
determinar la fuerza sobre la carga de prueba, pero ahora estando las cargas
1 y 2 en moviento.

Nuestro primer objetivo es determinar la fuerza sobre una carga de prue-


ba 2 , medida por un observador inercial , debida a una carga 1 que se
mueve con velocidad constante. Para simplificar los cálculos y sin pérdida
de generalidad, consideraremos dos situaciones particulares: En la primera,
ilustrada en la Figura 8.1, la carga de prueba 2 se encuentra en reposo con
respecto al sistema y está situada sobre el eje en las coordenadas (0 0),
8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 155

Figura 8.2: Interacción Coulombiana en la dirección de movimiento

mientras que la carga 1 se mueve con velocidad a lo largo del eje positivo
de las y pasa por el origen de coordenadas en el instante = 0. La segunda
situación, mostrada en la Figura 8.2, se diferencia de la anterior solamente en
que ahora la carga de prueba, que la denotaremos ahora por 3 , se situa en
reposo respecto al sistema sobre el eje de las en las coordenadas ( 0 0).
Debido a que la carga 1 se está moviendo, debemos pasarnos a un sistema
de referencia inercial 0 con respecto al cual esta carga se encuentre en reposo,
con el fin de poder aplicar la ley de Coulomb. Considerados un sistema de
referencia inercial 0 , que se mueva con velocidad a lo largo del eje positivo
, siendo la velocidad de la carga 1 respecto a . Entonces, para todo
instante 0 la carga 1 se encuentra en reposo en el origen de coordenadas
de 0 , mientras que la carga de prueba 2 pasa por el punto de coordenadas
(0 0 0) en el instante 0 = 0 y la carga 3 pasa por el punto de coordenadas
( 0 0 0) en 0 = 0. Bajo estas condiciones, las fuerzas sobre las cargas 2 y
3 están dadas por la ley de Coulomb (ecuación (8.11)). Entonces, sobre la
carga 2 la fuerza en el instante 0 = 0 solo tiene componente y está dada
por:
0 0 1 2
12 = 0; 12 = 02
; 0 12 = 0 (8.14)
0
mientras que para la carga 3 la fuerza de Coulomb, en = 0, tiene solo
156 CAPÍTULO 8. ELECTRODINÁMICA

componente :
0 1 3 0 0
13 = 02
; 13 = 0; 13 =0 (8.15)
Retornemos ahora al sistema de referencia inercial . Para este fin, recor-
demos la definición de las componentes del c-vector fuerza (ecuación (5.19))

0 1 2 3 1
=( ) = ( )( · ) (8.16)

en donde es la velocidad de la partícula sobre la cual esta actuando la


fuerza física . Bajo la transformación de Lorentz que estamos considerando,
las componentes de la c-fuerza medidas por 0 están relacionadas con las
correspondientes componentes de la c-fuerza medidas en , por las relaciones:
0 00 01
= ( )( + ) (8.17)
1 01 00
= ( )( + ) (8.18)
2 02
= (8.19)
3 03
= (8.20)
siendo la velocidad de respecto a 0 , = y ( ) = ( ). Teniendo
en cuenta la ecuación (8.16) y recordando la forma como el factor ( 0 ) se
transforma (ver ecuación (4.18)), las ecuaciones de transformación para las
componentes de la fuerza física están dadas por:
0 0 0
+ 2 ·
= 0 (8.21)
1+ 2

0
= ³ 0
´ (8.22)
( ) 1+ 2

0
= ³ 0
´ (8.23)
( ) 1+ 2

Dado que la velocidad 0 de las cargas 2 y 3, que las denotaremos por


0
1 y 02 respectivamente, están dadas por:
0
1 =( 0 0) (8.24)
0
2 =( 0 0) (8.25)
8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 157

0
con respecto al sistema de referencia , tenemos que las componentes de la
fuerza física respecto a son:
0
12 = 12 =0 (8.26)
0 1 2
12 = ( ) 12 = ( ) 02
(8.27)
0
12 = 12 =0 (8.28)
para la carga 2, y
0 1 3
13 = 13 = 02
(8.29)
0
13 = 13 =0 (8.30)
0
13 = 13 =0 (8.31)
para la carga 3 . Puesto que bajo la transformación de Lorentz considerada
0
= y 0 = ( ) , obtenemos que las componentes no nulas de la fuerza
en , sobre las cargas de prueba 2 y 3 , están dadas por:
1 2
12 = ( ) 2
(8.32)

1 1 3
13 = 2(
(8.33)
) 2
respectivamente. A partir de estos resultados, es fácil intuir la forma general
para la fuerza eléctrica en un instante dado sobre una partícula de prueba 2
en reposo en un punto de coordenadas ( ), debido a una carga 1 que se
desplaza a velocidad constante a los largo del eje de las y que pasa por
el origen de coordenadas en ese instante:
( )
= 1 2 2( 2
(8.34)
( ) + 2+ 2 )3 2

en donde es el vector posición instantáneo que une la carga 1 con la


carga de prueba 2 . Así, podemos definir el campo eléctrico producido por
una partícula móvil, situada instantáneamente en el origen de coordenadas,
como:
( )
= 1 2 (8.35)
( ( ) + 2 + 2 )3 2
2

Notemos en primer lugar, que el campo eléctrico sigue siendo radial, aún
cuando ya no es esféricamente simétrico como en el caso del campo eléctrico
158 CAPÍTULO 8. ELECTRODINÁMICA

Figura 8.3: Interacción entre cargas con movimiento arbitrario

producido por una carga en reposo, pues de la ecuación anterior se deduce


que el campo eléctrico se intensifica en un factor ( ) para puntos del es-
pacio situados en el plano perpendicular a la dirección de movimiento de la
partícula, mientras que se hace un factor 1 2 ( ) más pequeño para puntos
situados a lo largo de la dirección de movimiento de la carga 1 .

Consideremos ahora dos cargas 1 y 2 como se muestra en la Figura 8.3,


en donde la carga 1 se mueve con velocidad a lo largo del eje positivo
con respecto al sistema de referencia y la carga 2 se mueve con velocidad
=( ) respecto a y supongamos que en el instante = 0, la carga
1 pasa por el origen de coordenadas y 2 por el punto ( ) . Similar al
0
caso anteriormente discutido, sea un sistema de referencia inercial que
se desplaza con velocidad en la dirección positiva de las respecto a .
Entonces, con respecto al observador 0 la carga 1 se encuentran en reposo
en el origen de coordenadas de 0 y 2 pasa por el punto de coordenadas
( 0 0 0 ) en el instante 0 = 0, moviendose con una velocidad 0 . De la ley
de Coulomb, las componentes de la fuerza medidas por el observador inercial
0
están dadas por:
0
0 1 2
12 = 02 02 + 02 )3 2
(8.36)
( +
8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 159

0
0 1 2
12 = 02 02 + 02 )3 2
(8.37)
( +
0
0 1 2
12 = 02 02 + 02 )3 2
(8.38)
( +
las cuales son independientes de la velocidad 0 de la carga de prueba. Apli-
cando las ecuaciones (8.21), (8.22) y (8.23) para la transformación de las
componentes de la fuerza y teniendo en cuenta la ley de transformación de
velocidades:
0
= (8.39)
1 2

0
= ¡ ¢ (8.40)
( ) 1 2

0
= ¡ ¢ (8.41)
( ) 1 2

obtenemos para las componentes de la fuerza sobre la carga de prueba 2,


medidas por el observador inercial :

( ) ³ ´
1 2
12 = 2 2 2+ 2 )3 2
+ 2
+ 2
(8.42)
( ( ) +

( ) ³ ´
1 2
12 = 2 2 2+ 2 )3 2
1 2
(8.43)
( ( ) +
( ) ³ ´
1 2
12 = 2 2 2+ 2 )3 2
1 2
(8.44)
( ( ) +
Sabemos que la fuerza de Coulomb sobre una carga de prueba es indepen-
diente del estado de movimiento de dicha carga de prueba. Sin embargo,
comparando la ecuación (8.32) con las ecuaciones (8.42), (8.43) y (8.44) para
la fuerza sobre la carga de prueba 2 , la primera cuando 2 está en reposo y la
segunda cuando está en movimiento, vemos que en el segundo caso aparecen
unos términos extras a la fuerza eléctrica (de Coulomb). Para ver esto de
una manera más directa, notemos que la fuerza sobre la carga de prueba 2
(ecuaciones (8.42), (8.43) y (8.44)) la podemos escribir en la forma:

( ) ( )
12 = 12 + 12 ;= 2 + 2 × (8.45)
160 CAPÍTULO 8. ELECTRODINÁMICA

en donde es el campo eléctrico producido por la carga 1 dado por (ecuación


(8.35)):
1 ( )
= 2( 2+ 2+ 2 )3 2
(8.46)
( )

siendo la velocidad de la carga de prueba 2 y definimos el campo magnético


producido por la carga 1 , como:

1 ( ) 1
: = × 2( 2
( ) + 2+ 2 )3 2

1
= × (8.47)

siendo la velocidad de la carga 1 . Teniendo en cuenta que la velocidad de


la carga 1 , en el caso considerado está dada por = ( 0 0), es fácil ver por
un cálculo directo, que la expresión general dada por la ecuación (8.45) se
reduce a la expresión para fuerza, encontrada en las ecuaciones (8.42), (8.43)
y (8.44). En la ecuación (8.45) se dividió explícitamente la fuerza que actua
sobre la carga de prueba en dos términos: El primero corresponde a la fuerza
Coulombiana que actua sobre la carga 2 , la cual es independiente del estado
de movimiento de dicha carga de prueba, mientras que el segundo término sí
es dependiente de la velocidad de dicha carga. Además, este segundo término
se anula si cualquiera de las cargas, la carga fuente 1 o la de prueba 2 están
en reposo. Este resultado nos muestra la estrecha relación entre los fenómenos
eléctricos y magnéticos. Es importante tener en mente, que en todo nuestro
análisis hemos trabajo bajo la suposición que las cargas no están sometidas
a aceleraciones, pues para considerar esta situación es necesario trabajar con
las leyes completas de la electrodinámica.
Es posible continuar con este método de trabajo y obtener la ley de Biot-
Sabart y la ley de Ampere para corrientes estacionarias, pero dejaremos estos
temas de lado, para concentrarnos en el objetivo fundamental del presente
capítulo.
En la siguiente sección escribiremos las ecuaciones de Maxwell en forma
explícita relativista y encontraremos las leyes generales de transformación
de los campos electromagnéticos, entre sistemas de referencia inerciales y
mostraremos, cómo los resultados anteriormente obtenidos, corresponden a
casos particulares de estas leyes de transformación.
8.4. ECUACIONES DE MAXWELL COVARIANTES 161

8.4. Ecuaciones de Maxwell covariantes


Consideremos en primer lugar la ecuación de continuidad (8.5), la cual
podemos escribir en forma explícitamente covariante, como:
=0 (8.48)
teniendo encuenta lo establecido en la última sección del capítulo anterior y
donde el c-vector corriente se ha definido en la forma:
0 1 2 3
:= ( )=( ) (8.49)
La componente temporal 0 representa la densidad de carga (siendo la
carga un invariante relativista) y las componentes espaciales = 1 2 3
corresponden a las componentes del vector densidad de corriente eléctrica.
Esta definición del c-vector corriente nos da inmediatamente, las ecuaciones
de transformación para las densidades de carga y corriente, medidas por dos
observadores inerciales. En efecto, dados dos sistemas de referencia inerciales
y 0 , con =( ) y 0 = ( 0 0 ) las componentes del c-vector corri-
ente medidas por los dos observadores, entonces y 0 están relacionadas
por (ver ecuación (7.2)):
0
= (8.50)
Para el caso particular de dos sistemas de referencia inerciales, con la
velocidad del sistema 0 respecto a , a lo largo del eje positivo de las y
ejes espaciales paralelos, tenemos que las ecuaciones de transformación para
las componentes de la densidad de corriente están dadas por:
00 0 1
= ( )( ) (8.51)
01 1 0
= ( )( (8.52)
02 2
= (8.53)
03 3
= (8.54)
en donde hemos utilizado las ecuaciones (2.49)
p para los elementos de la trans-
2
formación de Lorentz , siendo ( ) = 1 1 y = . Remplazando
las componentes 0 y en términos de las densidades de carga ( 0 =
y 00 = 0 ) y de corriente ( = ( ) y 0 = 0 ( 0 0 0 ))
obtenemos las relaciones:
0
= ( )( 2
) (8.55)
162 CAPÍTULO 8. ELECTRODINÁMICA

0 = ( )( ) (8.56)
0 = (8.57)
0 = (8.58)
En las ecuaciones de Maxwell escritas en la forma tradicional (ecuaciones
(8.1) a la (8.4)) los campos eléctricos y magnéticos son vectores carte-
sianos usuales y por lo tanto no corresponden a ninguna cantidad relativista,
es decir a un escalar de Lorentz, o a un c-vector, o a un tensor. Por otra parte,
para describir los campos electromagnéticos producidos por alguna distribu-
ción de cargas y corrientes, es necesario conocer seis cantidades independi-
entes, esto es, las tres componentes del campo eléctrico y las tres del campo
magnético. Esta situación nos conduce a postular, que el objeto matemático
(relativista) adecuado para describir al campo electromagnético, es un tensor
de segundo orden antisimétrico, pues por lo discutido en el capítulo anteri-
or (sección 8.2.3), este tensor posee solo seis componentes independientes.
Estos argumentos nos motivan a definir el tensor campo electromagnético
F medido por un observador inercial , como un tensor de segundo rango
antisimétrico cuyas componente contravariantes están definidas por:
12 21 23 32 31 13
= = = = = =
01 10 02 20 03 30
= = = = = = (8.59)
=0 =0 1 2 3

Con esta definición, podemos escribir las dos primeras ecuaciones de


Maxwell (ecuaciones (8.1) y (8.2)) en la forma:
4
= (8.60)

la cual es una ecuación covariante relativista, pues el lado izquierdo es el


producto del operador gradiente por el tensor electromagnético con-
traido en su primer índice , para obtener así un c-vector contravariante, el
cual es proporcional al c-vector densidad de corriente. Esto significa que esta
ecuación tiene la misma forma en todos los sistemas de referencia inerciales,
es decir, en un sistema de referencia 0 , para el cual 0 y 0 son las corre-
spondientes componentes del tensor campo electromagnético y densidad de
corriente, las dos primeras ecuaciones de Maxwell tienen la forma:
0 0 4 0
= (8.61)
8.4. ECUACIONES DE MAXWELL COVARIANTES 163

en donde las componentes de la densidad de corriente 0 medidas en 0 ,


están relacionadas con las medidas en , por las ecuaciones de transformación
(8.50) ( o las ecuaciones (8.51), (8.52), (8.53) y (8.54) o también las ecuaciones
(8.55), (8.56), (8.57) y (8.58) en el caso particular usual). Las componentes del
tensor campo electromagnético medidas por los dos observadores inerciales
y 0 están relacionadas por las ecuaciones de transformación (ver el capítulo
anterior ecuación (7.3)):
0
= (8.62)

Estas relaciones nos dan entonces, las ecuaciones de transformación para


los campos eléctricos y magnéticos medidas por dos observadores inerciales.
Consideremos de nuevo, el caso particular de transformaciones de Lorentz
entre sistemas de referencia con ejes paralelos y velocidad relativa a lo largo
de los ejes 0 , en donde los elementos de la transformación de Lorentz están
dados por (ecuación (2.50)):

0 1
0 = 1 = (8.63)

0 1
1 = 0 = (8.64)

2 3
2 = 3 =1 (8.65)
p
2
con = y = 1 y los demás elementos cero. Sean

=( ) (8.66)

=( ) (8.67)

0
=( 0 0 0 ) (8.68)

0
=( 0 0 0 ) (8.69)

las componentes de los campos eléctricos y magnéticos medidas por y ´


respectivamente. Entonces aplicando las ecuaciones de transformación (8.62),
con los elementos de la transformación de Lorentz dados por las ecuaciones
(8.63), (8.64) y (8.65) y la definición (8.59) de las componentes del tensor
164 CAPÍTULO 8. ELECTRODINÁMICA

electromagnético, tenemos (para las componentes no nulas de F):


0 01 0 1
0 = =
0 1 00
= 0 + 00 11 01 + 00 12 02 + 00 13 03
0
+ 01 10 10 + 01 11 11 + 01 12 12 + 01 13 13
+ 02 10 20 + 02 11 21 + 02 12 22 + 02 13 23
+ 03 10 30 + 03 11 31 + 03 12 32 + 03 13 33
= 00 11 01 + 01 10 10
2 2
= 2
= (8.70)

Un cálculo similar se puede hacer para las demás componentes, pero por
brevedad, aquí solo presentaremos los téminos no nulos que surgen en la
transformación:
0 02 0 2 0 2 02 0 2 12
0 = = = 0 2 + 1 2
= ( ) (8.71)

0 03 0 3 0 3 03 0 3 13
0 = = = 0 3 + 1 3
= ( + ) (8.72)

0 23 2 3 2 3 23
0 = = = 2 3
= (8.73)

0 31 3 1 3 1 30 3 1 31
0 = = = 3 0 + 3 1
= ( + ) (8.74)

0 12 1 2 1 2 02 1 2 12
0 = = = 0 2 + 1 2
= ( ) (8.75)

Antes de considerar aplicaciones de estas ecuaciones de transformación


de los campos, las cuales serán dadas más adelante, escribamos las otras
ecuaciones de Maxwell en notación tensorial.
8.4. ECUACIONES DE MAXWELL COVARIANTES 165

Las ecuaciones de Maxwell homogéneas (las dos últimas ecuaciones (8.3)


y (8.4)), con la ayuda del tensor de Levi-Civita introducido en el capítulo
anterior (ecuación (7.75)), las podemos escribir en la forma:

=0 (8.76)

en donde en esta última ecuación se ha utilizado el tensor de Minkowski para


bajar los índices del tensor electromagnético F, esto es:

= (8.77)

las cuales nos representa las componentes covariantes del tensor campo elec-
tromagnético. Para recordar más fácilmente la relación entre las componentes
contravariantes del tensor F, definidas en la ecuación (8.59) y su relación con
las componentes covariantes, definidas en la ecuación (8.77), es útil escribir
estas componentes en forma matricial:
00 01 02 03
10 11 12 13
( ) = 20 21 22 23
30 31 32 33

0
0
= (8.78)
0
0

Aplicando, ahora, la ecuación (8.77), tenemos:

00 01 02 03
10 11 12 13
( ) =
20 21 22 23
30 31 32 33

0
0
= (8.79)
0
0

Ilustremos como se aplicó la ecuación (8.77) para llegar a la ecuación an-


terior, calculando explícitamente dos términos, por ejemplo 02 y 21 . Recor-
dando, para simplificar, que los elementos del tensor métrico de Minkowski
166 CAPÍTULO 8. ELECTRODINÁMICA

se anulan si los índices son diferentes, vemos que de los 16 sumandos que
aparecen por la doble suma en la ecuación (8.77), solo un término es no nulo:
02
02 = 0 2 = 00 22 = (8.80)
21
21 = 2 1 = 22 11 = (8.81)
Veamos ahora que efectivamente la ecuación (8.76) reproduce las ecua-
ciones de Maxwell homogeneas. Notemos en primer lugar que la ecuación
(8.76) contiene cuatro ecuaciones, una para cada = 0 1 2 3 y cada una
a su vez (debido a la triple suma sobre los índices repetidos , y ) está
conformada por 64 sumandos. Sin embargo, dado que las componentes del
tensor de Levi-Civita se anulan para cualquier par de índices repetidos, en
cada ecuación sobreviven solo cuatro sumandos. Así, para = 0 los términos
no nulos son:
0123 0132 0213
0 = 1 23 + 1 32 + 2 13 +
0231 0312 0321
2 31 + 3 12 + 3 21

= 2 +2 +2 =2 · (8.82)

obteniendo la ecuación de Maxwell para la divergencia del campo magné-


tico. Para la última ecuación de Maxwell, la ley de Faraday, consideremos
explícitamente solo el caso de = 1, pues el resultado se puede extrapolar
fácilmente a = 2 y 3. Entonces, para = 1 los términos no nulos son:
1023 1032 1203
0 = 0 23 + 0 32 + 2 03 +
1230 1302 1320
2 30 + 3 02 + 3 20
2
= 2 +2 2 = 2( × ) (8.83)

en donde hemos utilizado el hecho que 0 = , obteniendo así la componente


de la ley de Faraday.
Finalmente consideremos la ecuación de la Fuerza de Lorentz (segunda
ecuación en (8.6)), la cual podemos escribir en forma covariante como:

= = = (8.84)

en donde es el c-momentun de la partícula de carga , el tiempo propio,


sus coordenadas de posición y las componentes mixtas del tensor
8.4. ECUACIONES DE MAXWELL COVARIANTES 167

campo electromagnético definidas por:

= (8.85)

Desarrollemos explícitamente la ecuación (8.84), para interpretar los tér-


minos que de ella surgen, pues si bien afirmamos que esta ecuación es equiv-
alente a la fuerza de Lorentz, notemos que, siendo la fuerza de Lorentz una
ecuación vectorial, contiene tres ecuaciones escalares independientes, mien-
tras que la ecuación (8.84) es cuadri-vectorial y por tanto contiene cuatro
ecuaciones. En primer lugar calculemos, utilizando la ecuación (8.85), las
componentes mixtas del tensor campo electromagnético:
0 0 0 0
0 1 2 3
1 1 1 1
0 1 2 3
( ) = 2 2 2 2
0 1 2 3
3 3 3 3
0 1 2 3
0
0
= (8.86)
0
0

Remplazando estas cantidades en la ecuación (8.84), y desarrollandola


explícitamente en componentes, tenemos:
1 2 3
0
= ( + + ) (8.87)

0 2 3
1
= ( + ) (8.88)
0 1 3
2
= ( + ) (8.89)
0 1 2
3
= ( + ) (8.90)
Para interpretar estas ecuaciones, recordemos el significado físico de las
componentes de la cuadri-fuerza dado en el capítulo 5 (ver ecuación (5.19)).
Las componentes de la c-fuerza se pueden escribir en la forma:
1
= ( )( · ) (8.91)
168 CAPÍTULO 8. ELECTRODINÁMICA

en donde = es la fuerza física sobre la partícula, su velocidad y la


componente temporal representa el trabajo por unidad de tiempo que realiza
la fuerza física sobre la partícula. Recordando que
1
= ( ) := p (8.92)
1 2 2

(ver capítulo 4 ecuación (4.8)), podemos reescribir las ecuaciones (8.87),


(8.88), (8.89) y (8.90), en la forma siguiente:
1
· = · (8.93)

= + × (8.94)
Notemos que el factor de Lorentz ( ) se cancela. La componente tem-
poral de la c-fuerza, corresponde al hecho de que solo el campo eléctrico
realiza trabajo sobre las partículas, una situación que está contemplada en
la expresión para la fuerza de Lorentz, puesto que la fuerza debida al campo
magnético es de la forma × y por lo tanto:

· =( + × )· = · (8.95)

Resumiendo, las leyes de la electrodinámica (que incluyen las ecuaciones


de Maxwell, la ecuación de continuidad y la fuerza de Lorentz) escritas en
forma relativista covariante son:

= 4 (8.96)

=0 (8.97)
=0 (8.98)

= (8.99)
Veamos ahora, algunas aplicaciones sencillas de estas ecuaciones y de las
propiedades de transformación de los campos. Consideremos en primer lugar
los ejemplos tratados en la sección anterior. Supongamos que una partícula
de carga 1 se mueve con velocidad constante respecto a un sistema de
referencia inercial , a lo largo del eje positivo de las y pasa por el origen
en el intante = 0. Sea 0 otro sistema de referencia inercial, el cual se
8.4. ECUACIONES DE MAXWELL COVARIANTES 169

mueve con velocidad respecto a en la dirección del eje positivo de las


. Entonces, la carga 1 se encuentra en reposo en el origen de 0 y por lo
tanto el campo electromagnético, en un punto de coordenadas ( 0 0 0 ) y en
cualquier instante, producido por 1 se reduce a:
0 1 0 0
= 03
; =0 (8.100)

de acuerdo con la ley de Coulomb, en donde 0 = ( 0 0 0 ) y 0 = ( 02 + 02 +


02 1 2
) . Para calcular el campo electromagnético medido por el observador
inercial , calculamos primero las componentes del tensor campo electro-
magnético en 0 y luego aplicamos las propiedades de transformación del
tensor 0 . De la ecuación (8.100) tenemos (en notación matricial):
0 0 0
0 1
03
1
03
1
03
0
0
1
03 0 0 0
( )= 0 (8.101)
1
03 0 0 0
0
1
03 0 0 0

Aplicando las ecuaciones de transformación para las componentes del ten-


sor 0 (ecuación (8.62)), pero teniendo en cuenta que ahora estamos trans-
formando del sistema 0 al :
0
= (8.102)

en donde los elementos de la transformación de Lorentz están dados por


las ecuaciones (8.63), (8.64) y (8.65), cambiando = por , y teniendo
en cuenta que ( ) = ( ).
Consideremos primero los término 0 = 1 2 3 que corresponden a las
componentes del campo eléctrico medido en . Entonces, como 02 = 03 = 0
y = 0 para 6= 0 y 6= y teniendo en cuenta que 0 = 0 =1 2 3
(no hay campo magnético en 0 ), tenemos que los términos no nulos de la
ecuación (8.102) son:
0 0 0
=
0 00 0 01
= 0 + 1
0 00 0 010
= 0 + 1 0 (8.103)

Notemos que en el primer término de la última igualdad no hay suma


sobre el índice , pues está repetido tres veces. Esto surgió del hecho que
170 CAPÍTULO 8. ELECTRODINÁMICA

= 0 si 6= ; = 1 2 3. Remplazando explícitamente los diferentes


términos, tenemos que las componentes del campo eléctrico medidas por el
observador están dadas por:
2 2 2
= ( ) 0 ( ) 0 = 0 (8.104)

= ( ) 0 (8.105)
= ( ) 0 (8.106)
Notemos que en el instante = 0 medido en , la carga está en el origen
y la relación entre las coordenadas del punto donde estamos observando el
campo eléctrico es ( 0 0 0 ) = ( ( ) ) en ese instante. Entonces, si ex-
presamos el campo eléctrico medido por en términos de las coordenadas
de , obtenemos el resultado ya encontrado en la sección anterior, ecuación
(8.35). Calculemos ahora las componentes del campo magnético en el sistema
de referencia . Procediendo de forma similar, escribamos primero las compo-
nentes no nulas de la ecuación (8.102) que corresponden al campo magnético,
notando que 6= ; = 1 2 3 y no hay suma sobre tres índices repetidos:
0
=
00 00
= 0 + 0 (8.107)

Remplazando, tenemos que las componentes del campo magnético son:


23
= =0 (8.108)
31
= = ( ) 0 (8.109)
12
= = ( ) 0 (8.110)
Este resultado lo podemos escribir en forma condensada como:

1
= × (8.111)

en completo acuerdo con el resultado obtenido en la sección anterior, ecuación


(8.47), teniendo en cuenta las ecuaciones (8.104), (8.105) y (8.106) y que la
velocidad está dada por:
= ( 0 0) (8.112)
8.5. TRANSFORMACIONES GAUGE 171

8.5. Transformaciones Gauge


Hay dos teoremas del cálculo diferencial en varias variables, que nos per-
miten escribir las ecuaciones de Maxwell en forma más compacta:
Teorema 9.1: Sea una función vectoria tal que su rotacional es cero,
i.e., × = 0, entonces la función se puede escribir como el gradiente de
una función escalar ( ), esto es:

= ( ) (8.113)

Teorema 9.2: Sea una función vectorial tal que su divergencia es cero,
i.e., · = 0 , entonces la función se puede escribir como el rotacional de
una función vectorial ( ), esto es:

= × ( ) (8.114)

Apliquemos estos dos resultados del cálculo vectorial a los campos eléctrico
y magnético. La tercera ecuación de Maxwell (8.3) establece que

· =0 (8.115)

entonces podemos escribir el campo magnético como el rotacional de una


función vectorial, es decir:
= × (8.116)
en donde la función vectorial se le llama el potencial vectorial.
Ahora, si reemplazamos el campo magnético en la última de las ecuaciones
(8.4) en términos del potencial vectorial , tenemos:

×( + )=0 (8.117)

esto significa, de acuerdo con el Teorema 9.2, que la función vectorial +


la podemos escribir como el gradiente de una función escalar , es
decir
+ = (8.118)
en donde es el potencial escalar. El signo menos en la ecuación anterior
permite interpretar directamente al potencial , para el caso de campos
independientes del tiempo, como el trabajo por unidad de carga realizado
172 CAPÍTULO 8. ELECTRODINÁMICA

por el campo eléctrico, llamado potencial electrostático, el cual es un campo


conservativo.
Estos dos teoremas del cálculo vectorial, corresponden a casos particulares
de un teorema más general de tensores:
Teorema 9.3: Sean las componentes covariantes de un tensor de
segundo rango antisimétrico, tal que

=0 (8.119)

entonces el tensor se puede escribir como el “rotacional” (ver ecuación


(7.108)) de una función cuadri-vectorial , es decir

= [ ] = (8.120)

Como vimos en la sección 9.4 de este capítulo, las dos ecuaciones de


Maxwell homogeneas ( · = 0 y × + = 0) se pueden escribir
en la forma
=0 (8.121)
en donde es el tensor campo electromagnético. Entonces, de acuerdo con
el Teorema 9.3, el tensor campo electromagnético se puede escribir en
la forma
= = (8.122)

en donde el cuadri-vector , definido como:

:= ( ) (8.123)

es llamado el cuadri-potencial,con el potencial vectorial y el potencial


escalar definidos en la ecuaciones (8.116) y (8.118) respectivamente.
Con esta definición del c-potencial , podemos escribir las ecuaciones
de Maxwell inhomogeneas (ver ecuación (8.60)):

= 4 (8.124)

en términos del c-potencial . Remplazando la ecuación (8.122) en la ecuación


anterior y teniendo en cuenta que = y = , obten-
emos:
= 4 (8.125)
8.5. TRANSFORMACIONES GAUGE 173

De esta manera, esta última ecuación es equivalente a las ecuaciones de


campo de Maxwell, pues dadas las fuentes de los campos y resolviendo la
ecuación (8.125), conocemos el c-potencial y así los campos electromag-
néticos.
Por otra parte, de la ecuación de definición de en términos del poten-
cial c-vectorial, notemos que podemos cambiar , adicionandole una función
cualquiera de la forma , sin que cambia el tensor campo electromagnético
. Es decir, si realizamos la transformación
˜ = + (8.126)

en donde es una función cualquiera de las coordenadas, la ecuación (8.122)


nos conduce a:
˜ ˜
˜ =

= ( + ) ( + )
2 2
= +

= = (8.127)

lo cual significa que la función permanece invariante bajo la transfor-


mación (8.126) y así también los campos electromagnéticos y . A la
transformación (8.126) se le llama una transformación “gauge”. Este tipo de
transformaciones juega un papel fundamental en la teoría cuántica de campos
y en las llamadas teorias de unificación de las interacciones fundamentales
de la naturaleza.
Para finalizar este capítulo, veamos como esta característica de la teoría
electromagnética (cuando se formulan las ecuaciones de Maxwell en términos
del c-potencial), de permanecer los campos físicos y invariantes bajo
una transformación gauge, nos permite simplicar las ecuaciones que rigen el
comportamiento del c-potencial .
Dado que el c-potencial no está definido de manera única, entonces,
podemos imponer sobre él una condición o ecuación de ligadura, llamada la
elección de un gauge particular, la cual por lo establecido anteriormente, no
cambia la física, es decir no cambian los campos y . Así, podemos escoger
la función arbitraria en la ecuación (8.126), de tal manera que el potencial
174 CAPÍTULO 8. ELECTRODINÁMICA

c-vectorial cumpla con la ecuación:

=0 (8.128)

llamado el gauge de Lorentz, de tal manera que la ecuación (8.125) se sim-


plifica, reduciendose a la ecuación:

¤ = (8.129)

que es la ecuación de ondas inhomogénea. Recordando la definición del oper-


ador ¤, ecuación (7.106), vemos que la teoría electromagnética de Maxwell,
expresada por la ecuación (8.129) contiene al postulado de la constancia de
la velocidad de la luz, pues dado que el operador ¤ definido por:
2
1 2
¤= 2 2
(8.130)

es un invariante bajo transformaciones de Lorentz, entonces el coeficiente


1 2 , que representa la velocidad de propagación de los campos electromag-
néticos, es una constante independiente del observador. Este último resultado
ilustra con toda claridad y sin restarle meritos a la genialidad de Albert Ein-
stein, como la teoría de la relatividad especial estaba ya presente en la física.
Capítulo 9

Revisión bibliográfica

La literatura disponible sobre relatividad es tal vez de las más amplias,


tanto en el campo especializado como en el divulgativo. Se listarán a con-
tinuación algunas referencias, desde literatura de divulgación, pasando por
textos elementales, obras de valor histórico, hasta textos y libros avanzados
que, sin pretender ser exaustivas, si cubren globalmente la temática de la
teoría especial de la relatividad.

Referencias de caracter divulgativo

1. Bucker R. B., Geometry, Relativity and the fourth dimension. Dover


Publications, Inc. N. Y. 1977

2. Lilley S., Discovering Relativity for yourself. Cambridge University


Press 1981

3. Russell B., ABC de la Relatividad. Ed. Ariel Barcelona 1978

4. Williams L. P., La Teoría de la Relatividad. Alianza Universidad 1977

Textos elementales a nivel universitario sobre relatividad especial

1. Mook D. E. and Vargish T., La Relatividad. Espacio, Tiempo y


Movimiento. McGraw Hill 1993

2. Resnick R., Introducción a la Teoría Especial de la Relatividad. Limusa


1981

175
176 CAPÍTULO 9. REVISIÓN BIBLIOGRÁFICA

3. Skinner R., Relativity for Scientist and Engineers. Dover Publishing


N. Y. 1982

4. Smith J. H., Introducción a la Relatividad Especial. Ed. Reverté 1978

Textos universitarios de relatividad a nivel intermedio

1. Enrique L., Física Relativista. Buenos Aires 1955

2. French A. P., Special Relativity. Massachusetts Institute of Technol-


ogy 1968

3. Rindler W., Essential Relativity. Special, General and Cosmology.


Springer-Verlag 1977

4. Taylor E. F. and Wheeler J. A., Spacetime Physics. Freeman, San


Francisco 1966

Libros y textos avanzados sobre relatividad

Algunos de ellos incluyen, también, elementos básicos de la Relatividad


General:

1. Aharoni J., The Special Theory of Relativity. Oxford University Press


1965

2. Bressan A., Relativistic Theories of Materials. Springer-Verlag 1978

3. Fock V., The Theory of Space Time and Gravitation, Pergamon Press
1959

4. Gill T. P., The Doppler E ect. Academic Press 1965

5. Kopczynski W. and Trautman A., Spacetime and Gravitation.


John Wiley & Sons 1992

6. Matveev A. N., Mechanics and Theory of Relativity. Mir Publishers


Moscow 1989

7. Rosser W. G. V., An Introduction to the Theory of Relativity. But-


terworth, London 1964
177

8. Ugarov V. A., Special Theory of Relativity. Mir Publishers Moscow


1979

Libros avanzados de relatividad


con un fuerte énfasis en aspectos matemáticos

1. Hagendorn R., Relativistic Kinematics. W. A. Benjamin, Inc. 1963

2. Misner C. W., Thorne K. S. and Wheeler J. A., Gravitation.


W. H. Freeman and Co. 1973

3. Naber G. L., The Geometry of Minkowski Spacetime. Springer-Verlag


1992

4. Woodhouse N. M. J., Special Relativity. Springer-Verlag 1992

Libros clásicos de relatividad


y obras formales de carácter histórico

1. Born M., Einstein’s Theory of Relativity. Dover Publications, Inc.


1965 (1 ed. 1920)

2. Einstein A., The Principle of Relativity. Dover N. Y. 1958

3. Poincaré H., La Mécanique Nouvelle. Conference Mémoire et note sur


la Théorie de la Relativité. Editions Jacques Gabay 1989

4. Rocard J. M., Newton et la Relativité. Press University France 1986

5. Sard R. D., Relativistic Mechanics. W. A. Benjamin, Inc. 1970

6. Silberstein L., The Theory of Relativity. Great Britain 1914

7. Synge J. L., Relativity: The Special Theory. North-Holland Publish-


ing Company 1958

8. Whittaker Sir E. T., History of the Theories Aether and Electricity.


Harper and Row, N. Y. 1960

También podría gustarte