Está en la página 1de 180

Sobre la teora especial de la relatividad

Juan Manuel Tejeiro Sarmiento


Profesor Titular
Observatorio Astronmico Nacional
Facultad de Ciencias
Universidad Nacional de Colombia
2004

ii

ndice general
Introduccin

VII

Cinemtica relativista

1. Modelo mecnico del mundo


1.1. Introduccin . . . . . . . . . . . . . . . . . .
1.2. Leyes de Newton y principio de relatividad
1.3. Luz y ter: El retorno al espacio absoluto .
1.3.1. Un experimento crucial . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

3
3
4
9
14

2. Fundamentos de la relatividad especial


2.1. Postulados de la relatividad especial . .
2.2. Transformaciones de Lorentz . . . . . .
2.3. Propiedades de las TL . . . . . . . . . .
2.4. Consecuencias de las TL . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

19
19
24
31
40

3. La estructura causal del espacio-tiempo


3.1. Introduccin . . . . . . . . . . . . . . . .
3.2. Rotaciones en el plano euclideano . . . .
3.3. Cuadri-vectores y el grupo de Lorentz .
3.4. Conos de luz y relaciones de causalidad
3.5. Algebra de cuadri-vectores . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

47
47
47
51
55
59

.
.
.
.
.

65
65
65
69
70
75

4. Cinemtica relativista
4.1. Introduccin . . . . . . . .
4.2. Cuadri-vector velocidad .
4.3. Cuadri-vector aceleracin
4.3.1. Viaje interestelar .
4.4. Cuadri-vector de onda . .

.
.
.
.
.

.
.
.
.
.

iii

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

iv

II

NDICE GENERAL

Dinmica relativista

5. Dinmica relativista
5.1. Ecuaciones de movimiento . . . . . . . . . .
5.2. Leyes de conservacin . . . . . . . . . . . .
5.3. Propiedades del c-momentun . . . . . . . .
5.4. Sistema centro de masa . . . . . . . . . . .
5.5. Energa umbral . . . . . . . . . . . . . . . .
5.6. Fotones y partculas de masa en reposo cero

79
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

81
81
84
87
90
93
96

6. Aplicaciones de la dinmica relativista


6.1. Introduccin . . . . . . . . . . . . . . . . . . . . . .
6.2. Colisiones elsticas . . . . . . . . . . . . . . . . . .
6.2.1. Efecto Compton . . . . . . . . . . . . . . .
6.2.2. Efecto Compton inverso . . . . . . . . . . .
6.3. Colisiones inelsticas . . . . . . . . . . . . . . . . .
6.3.1. Absorcin de un fotn por un tomo . . . .
6.3.2. Emisin de un fotn por un tomo exitado
6.4. Sistemas de masa variable . . . . . . . . . . . . . .
6.5. Creacin y aniquilacin de partculas . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

101
101
101
102
105
107
108
111
113
115

III

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

Electrodinmica relativista

7. Tensores
7.1. Introduccin . . . . . . . . . . . . . . . . . .
7.2. Definiciones fundamentales . . . . . . . . .
7.2.1. Componentes covariantes . . . . . .
7.2.2. Algebra tensorial . . . . . . . . . . .
7.2.3. Propiedades de simetra de tensores
7.3. Transformacin general de coordenadas . .
7.4. Operadores vectoriales
.

117
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

119
119
120
122
125
130
136
138

8. Electrodinmica
8.1. Introduccin . . . . . . . . . . . . . . . . . . .
8.2. Ecuaciones de Maxwell . . . . . . . . . . . . .
8.3. Campo magntico como un efecto relativista .
8.4. Ecuaciones de Maxwell covariantes . . . . . .
8.5. Transformaciones Gauge . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

143
143
144
146
154
163

9. Bibliografa

169

Prefacio
Segunda edicin de las notas de clase sobre relatividad especial.

vi

PREFACE

Introduccin
La teora de la relatividad (especial y general) es considerada como uno
de los ms grandes logros de la mente humana y forma parte, de lo que
podemos llamar la cultura del hombre del siglo XX. A pesar del estigma
de incomprensibilidad que siempre ha rodeado a la teora de la relatividad,
en el sentido que su comprensin est al alcance solamente de unos pocos
especialistas, esta teora cientfica ha sido la de mayor impacto y difusin a
nivel de divulgacin y ha tenido influencia definitiva sobre nuestra imagen
del mundo.
El desarrollo de la teora de la relatividad ha estado marcado por circunstancias particulares que la diferencian de otros desarrollos de la fsica
contempornea, a las cuales me referir en esta introduccin, con el fin de
mostrar, por una parte el estado actual de la teora y por otra, el papel
fundamental que ha jugado y juega esta teora en el desarrollo de la fsica
actual.
La formulacin de la Teora Especial de la Relatividad dada por Einstein
en 1905 es completa, es decir, a parte de ejemplos y aplicaciones de la teora,
o de su reformulacin en trminos de modelos matemticos ms sofisticados,
todo los elementos bsicos que hoy conocemos de la teora especial de la relatividad estn contenidos en los trabajos originales de Einstein. Adems, el
estilo del primer trabajo publicado por Einstein sobre el tema, a diferencia
de otros trabajos en fsica terica, se caracteriz por su sencillez en la exposicin, con muy poco contenido matemtico y la ausencia de referencias a
artculos y trabajos anteriores. Su conclusin fundamental, la necesidad de
reformular el concepto absoluto de simultaneidad y con l, el concepto de
tiempo en fsica, muestra la genialidad de Einstein, no por la complejidad de
sus razonamientos ni la complejidad en los clculos, sino por la profundidad
de sus conclusiones, las cuales modificaron de manera radical e irreversible
nuestros conceptos bsicos de espacio y tiempo. No es cierto, como sostienen
varios historiadores de la fsica, que el trabajo de Einstein no fue comprendido en su tiempo, pues pocos meses despus de su publicacin fsicos de
vii

viii

INTRODUCCIN

Cracovia afirmaban que haba nacido un nuevo Copernico y ya para 1909,


los principales fsicos de esa poca tales como Planck, von Laue y otros,
reconocieron la genialidad de Einstein y la importancia de sus trabajos.
Es importante resaltar en este punto que de hecho todas las ecuaciones
bsicas de la teora especial de la relatividad, tales como la contraccin
de longitudes, aumento de la masa con la velocidad, la equivalencia masaenerga, etc., ya eran conocidas en la literatura y por lo tanto, la fsica si
estaba preparada para entender y asimilar las ideas de Einstein. Para comprender esto, basta con recordar que la teora electromagntica de Maxwell
es una teora relativista y por lo tanto era de esperar que un estudio minucioso de las ecuaciones de Maxwell (recordemos el excelente trabajo realizado por Lorentz sobre el electrn, el cual fue publicado en 1904) condujera a
todas estas ecuaciones relativistas, aun cuando su interpretacin estuviera
fuertemente influenciada por el concepto del ter.
Claramente, el impacto de la teora especial de la relatividad de Einstein
no se poda esperar que fuera muy grande a nivel experimental y tecnolgico, pues de hecho la posibilidad de probar experimentalmente la teora en
forma directa era muy difcil y ms significativo an, era su escasa o prcticamente nula aplicabilidad. Esto, debido a que los fenmenos relativistas
son relevantes en situaciones que involucren velocidades comparables a la
velocidad de la luz en el vaco (aproximadamente 300,000km/s), lo cual solo
vino a ser posible con el desarrollo de los grandes aceleradores de partculas
a mediados del siglo XX.
En 1916 Einstein publica la Teora General de la Relatividad, la cual
corresponde a la formulacin relativista de la ley de gravitacin universal de
Newton. Estos trabajos, a diferencia de sus primeras publicaciones sobre la
teora especial de la relatividad, si requirieron de una estructura matemtica
muy compleja: la geometra diferencial y el clculo tensorial. Dos predicciones fundamentales surgen de estos trabajos, el corrimiento del perihelio
de Mercurio, efecto que ya haba sido observado, ms no explicado por los
astrnomos y la desviacin de la luz por el sol, cuya corroboracin se da en
1919, aprovechando un eclipse total de sol que tuvo lugar el 29 de Mayo.
Ms significativo an para el desarrollo de la teora general de la relatividad, puede ser el descubrimiento de Hubble de la expansin del universo en
1929, si bien Einstein no haba predicho este efecto, si estaba contenido en
sus ecuaciones de la relatividad general. Este punto de la historia marca el
comienzo de la cosmologa actual, la cual es una de las reas de investigacin
ms activas que tenemos hoy da.
Retomando de nuevo el desarrollo de la teora especial de la relatividad,
el papel fundamental que ella juega en la fsica se comienza a reconocer

ix
y a explotar tan solo con el desarrollo de la mecnica cuntica relativista
formulada por Dirac en 1925. En efecto, hasta 1925 se conocan solamente
dos partculas elementales: el electrn y el protn. Como una consecuencia
fundamental de su recin desarrollada teora relativista del electrn, Dirac
predice la existencia del positrn, que es una partcula fundamental de la
misma masa del electrn pero de carga opuesta. Este hecho es posteriormente generalizado y se establece un resultado general de la naturaleza y
es que a toda partcula fundamental le corresponde una antipartcula. Estos
desarrollos condujeron entonces a la teora cuntica de campos, que constituye el marco terico para entender las interacciones fundamentales de la
naturaleza (electromagntica, fuerte y dbil), que rigen el comportamiento
de la materia a escala microscpica.
Hoy da la teora especial de la relatividad es reconocida como una teora
fundamental de la fsica, cuyo alcance va ms all de sus posibles aplicaciones experimentales o tecnolgicas, pues ella se enmarca en el contexto de
las propiedades fundamentales del espacio-tiempo, independientemente de
cualquier modelo fsico utilizado para describir los fenmenos. En general,
las leyes fsicas que rigen el comportamiento de los sistemas se formulan en
trminos de relaciones (ecuaciones diferenciales) entre las variables fsicas
necesarias para describir un sistema. Estas variables fsicas se describen por
funciones del espacio y el tiempo (posicin, momentun, energa, etc.), cuyo
comportamiento est regido por los principios de la teora especial de la
relatividad.
El objetivo fundamental de este libro es presentar los principios bsicos y los resultados fundamentales de la teora especial de la relatividad,
con nfasis en una formulacin covariante, es decir una formulacin que nos
permite desde un principio, exhibir en forma explcita el carcter relativista
de una teora. Para este fin se han organizado los temas en tres grupos: El
primer grupo lo conforman los tres primeros captulos, la presente introduccin, un captulo sobre los fundamentos de la mecnica Newtoniana, con
una breve discusin sobre el problema del ter, esto con el fin de motivar los
postulados bsicos de la teora especial de la relatividad y sus principales
consecuencias, desarolladas en el tercer captulo. El segundo grupo lo constituye el cuerpo central del libro, comenzando con una formulacin exhaustiva
del concepto de cuadri-vector y la estructura causal del espacio-tiempo para
formular los principios y leyes de la dinmica relativista, dedicando un captulo a sus principales aplicaciones. El ltimo tema est destinado a formular
la teora electromagntica (ecuaciones de Maxwell) en forma explcita relativista, para lo cual se dedica un captulo a la formulacin y lgebra de
tensores sobre el espacio de Minkowski en forma sencilla, es decir sin re-

INTRODUCCIN

currir a todo el formalismo matemtico de las variedades y la geometra


diferencial, pero manteniendo la validz general, tanto en la notacin como
en los resultados fundamentales.

Parte I

Cinemtica relativista

Captulo 1

Modelo mecnico del mundo


1.1.

Introduccin

En este captulo presentaremos en forma resumida la situacin de la


fsica a comienzos del siglo XX, destacando los hechos ms relevantes, que
nos permitan motivar y entender mejor los conceptos y postulados fundamentales, sobre los cuales est basada la teora especial de la relatividad,
formulada en 1905 por el fsico alemn Albert Einstein.
En la primera seccin revisaremos las leyes y conceptos fundamentales
de la mecnica Newtoniana, dedicando el resto del captulo a presentar una
breve descripcin de algunas de las teoras del ter, con el fn de entender el
problema central que se debata en la fsica en la segunda mitad del sigloXIX,
en cuanto a la aparente inconsistencia entre la mecnica Newtoniana y la
recin desarrollada teora electromagntica.
La teora de la mecnica formulada por Newton en el siglo XVI y enriquecida por la contribucin de muchos fsicos y matemticos a lo largo de
los dos siglos siguientes, se constituy en la teora fundamental que permita
entender, explicar y predecir todos los fenmenos fsicos conocidos. Fue en
la primera mitad del siglo XIX que aparecieron fenmenos relacionados con
el electromagnetismo y con la luz que comenzaron a complicar la imgen
(explicacin) mecnica del mundo. Esta situacin se torn ms crtica en la
segunda mitad del siglo con el desarrollo de la teora de la electrodinmica
de Maxwell, pues su aparente incompatibilidad con la mecnica newtoniana, reflejada no slo en consideraciones tericas sino tambin en resultados
experimentales, hacan pensar que alguna de las dos teoras, la mecnica o la
electrodinmica, debera ser abandonada o revisada, lo cual no era un problema fcil, pues ambas teoras presentaban una enorme cantidad de pruebas
3

CAPTULO 1. MODELO MECNICO DEL MUNDO

experimentales y desarrollos tecnolgicos que sustentaban su validez.

1.2.

Leyes de Newton y principio de relatividad

Para comprender mejor los problemas que se le planteaban a la fsica


en el siglo XIX y preparar el terreno para entender los cambios de interpretacin necesarios que se dieron con el desarrollo de la teora especial de
la relatividad, en esta seccin revisaremos brevemente algunos conceptos
fundamentales de la mecnica newtoniana, cuyo punto de partida son las
tres leyes de Newton:
Ley de la inercia- Toda partcula permanece en estado de reposo o
movimiento rectilneo uniforme respecto a cualquier sistema de referencia
inercial, mientras no acten fuerzas externas sobre l, o equivalentemente el
momentum de una partcula libre de fuerzas permanece constante, en donde
la cantidad dinmica de momentum se define como
p = mv

(1.1)

siendo m la masa inercial de la partcula y v su velocidad.


Ecuacin de movimiento- La fuerza aplicada sobre la partcula es
igual a la rata de cambio de su momentum
F =

dv
dp
=m
dt
dt

(1.2)

en donde la ltima igualdad se deduce del hecho que la masa inercial de una
partcula puntual es constante e independiente de su estado de movimiento.
Interaccin entre partculas- La fuerza que una partcula A ejerce
sobre otra partcula B es igual en magnitud y en sentido opuesto a la fuerza
que la partcula B ejerce sobre A.
Para la formulacin de estas leyes hay toda una serie de supuestos bsicos
necesarios, tales como la estructura geomtrica del espacio, el concepto de
tiempo, observador y sistema de referencia, magnitudes fsicas y el concepto
de medida. Sin embargo, no es objeto del presente libro entrar a discutir
exhaustivamente estos conceptos, sino nos centraremos nicamente en aquellos aspectos que son relevantes para plantear y motivar la formulacin de
la teora especial de la relatividad.
Definamos, en primer lugar, el concepto de observador como un sistema
fsico (reglas o patrn de medida espacial y relojes o patrn de medida temporal), que permite determinar la posicin y el instante de tiempo respecto
a un origen arbitrario, de un fenmeno fsico (que en lo sucesivo llamaremos

1.2. LEYES DE NEWTON Y PRINCIPIO DE RELATIVIDAD

evento). A este conjunto de reglas y relojes lo denominaremos sistema de


referencia, cuya representacin matemtica se puede realizar por el espacio
R R3 , con R los nmeros reales que representa el tiempo y R3 el espacio
euclidiano tridimensional que representa el espacio fsico. Dotar al espacio
y al tiempo con esta estructura matemtica supone (como lo asumi explcitamente Newton) que el espacio es absoluto, homogneo e isotrpico y
obedece la geometra euclideana y el tiempo es absoluto y homogneo y por
lo tanto son conceptos independientes del observador.
En segundo lugar, Newton asumi que sus leyes se cumplen en el espacio
absoluto, es decir que sus leyes son vlidas para un observador, cuyo sistema
de coordenadas est fijo respecto al espacio absoluto. A este observador particular se le llama sistema de referencia inercial y lo denotaremos por .
Elegir un sistema de referencia inercial es, en principio, escoger una coordenada temporal t y un sistema de coordenadas cartesianas (x, y, z) para
determinar el instante y la posicin de un evento. Que el origen de la coordenada temporal es arbitrario, refleja el hecho que el tiempo es homogneo,
mientras que el origen y la orientacin arbitrarias de las coordenadas espaciales ponen de manifiesto la homogeneidad e isotropa del espacio. Si la
primera ley de Newton es vlida en , entonces una partcula P , sobre la
cual no actan fuerzas, debe viajar en una lnea recta respecto al sistema
. As por ejemplo, si elegimos el origen del tiempo y los ejes espaciales de
tal manera, que la partcula pase por el origen espacial en el instante t = 0
y se mueva en la direccin del eje x positivo, entonces su posicin, en un
instante de tiempo cualquiera t,est dada por
x = ux t ; y = 0 ; z = 0

(1.3)

u = (ux , uy , uz ) = (ux , 0, 0)

(1.4)

con
la velocidad de la partcula.
Consideremos otro sistema de referencia 0 , con respecto al cual la
partcula P permanece en reposo en su origen de coordenadas espaciales,
y elijamos los ejes espaciales de 0 paralelos a los del sistema de referencia inercial y el origen del tiempo de tal manera los relojes comiencen
a contar el tiempo, t = t0 = 0, cuando los orgenes de los dos sistemas se
cruzan. Entonces, podemos determinar las coordenadas espaciales y el tiempo de cualquier evento fsico, bien sea con respecto al sistema inercial o
con respecto al sistema de referencia 0 . Si llamamos (t, x, y, z) las coordenadas de un evento fsico cualquiera, medidas respecto a y (t0 , x0 , y0 , z 0 ) las
correspondientes coordenadas, medidas respecto a 0 , podemos encontrar la

CAPTULO 1. MODELO MECNICO DEL MUNDO

Figura 1.1: Transformaciones de Galileo


relacin entre las coordenadas del evento, medidas por los dos sistemas de
referencia 0 y . Estas relaciones son llamadas ecuaciones de transformacin de Galileo.
Es fcil encontrar las ecuaciones de transformacin de Galileo (Figura
1.1), pues teniendo encuenta que las ecuaciones (1.3) nos dan la posicin,
respecto al sistema inercial , del origen de coordenadas del sistema 0 ,
entonces, las coordenadas (t0 , x0 , y0 , z 0 ) de cualquier evento medidas por 0 ,
estn relacionadas con las coordenadas (t, x, y, z) del mismo evento medidas
por , por las ecuaciones:
t0 = t

x0 = x vt

y0 = y

z0 = z

(1.5)

en donde se ha hecho el cambio ux = v, para rescatar la notacin usual


utilizada en la literatura.
As, en lo sucesivo v denotar la velocidad del sistema de referencia 0
respecto a . La eleccin de los dos sistemas coordenados de y 0 con
los ejes coordenados paralelos y la misma orientacin, as como la velocidad
relativa de los dos sistemas a lo largo de los ejes x, x0 no representa prdida alguna de generalidad y su justificacin se encuentra en la hiptesis de
isotropa del espacio, la cual implica que la fsica no depende de la orientacin
de los ejes coordenados, o equivalentemente, que el espacio es isotrpico.

1.2. LEYES DE NEWTON Y PRINCIPIO DE RELATIVIDAD

Adems, en las ecuaciones de tranformacin de Galileo est implcita, tambin, la hiptesis de homogeneidad del espacio y el tiempo, pues la eleccin
del origen del tiempo para los dos sistemas, en el instante en que los orgenes espaciales coinciden, es arbitraria, indicando que cualquier instante
de tiempo y todos los puntos del espacio son equivalentes para describir los
fenmenos fsicos. La primera ecuacin de transformacin, t0 = t, representa
el carcter absoluto del tiempo, y significa que (salvo la eleccin arbitraria
del origen) el instante en el cual ocurre un evento fsico es independiente del
observador y adems, esta ecuacin lleva tambin la hiptesis implcita, que
existe algn mecanismo fsico apropiado que permite transmitir informacin
instantneamente. Otra forma de expresar este carcter absoluto del tiempo,
es a travs del concepto de simultaneidad: Si dos eventos, que ocurren en
puntos diferentes del espacio para un observador, son simultneos, entonces
estos dos eventos son tambin simultneos para cualquier otro observador,
sin importar su estado de movimiento relativo respecto al primer observador.
Como veremos ms adelante, la simultaneidad es uno de los conceptos fundamentales que debe ser cuestionado y se torna en un punto muy importante
para la formulacin de la teora de la relatividad.
Una primera consecuencia de las transformaciones de Galileo, es que las
leyes de la mecnica son vlidas en todos los sistemas de referencia que se
muevan con respecto al sistema de referencia inercial, el cual se encuentra en
reposo con respecto al espacio absoluto. La demostracin de este resultado
es directa, pues, si una partcula libre posee una velocidad
u = (ux , uy , uz ) = (

dx dy dz
, , )
dt dt dt

(1.6)

respecto al sistema de referencia inercial , entonces, se obtiene de las ecuaciones de transformacin de Galileo (1.5), que las componentes de la velocidad de la partcula, medidas en el sistema de referencia 0 estn dadas
por:
dx0
uy0 = uy
uz0 = uz
(1.7)
ux0 = 0 = ux v
dt
Este resultado se conoce con el nombre de teorema de adicin de velocidades de Galileo. As, puesto que la velocidad relativa v entre los sistemas de
referencia y 0 es constante, entoces, la partcula libre tambin se mueve
con velocidad constante u0 = (u0x0 , uy0 , uz 0 ) respecto al sistema 0 . De manera similar, se deduce que la segunda ley de Newton tambin se satisface,
pues, utilizando el resultado anterior (ecuacin (1.7)), tenemos que
F0 =

du
dp
dp0
du0
=m
=
=F
=
m
0
dt
dt
dt
dt

(1.8)

CAPTULO 1. MODELO MECNICO DEL MUNDO

con el resultado adicional, que no slo la forma de la segunda ley de Newton


F = dp
dt es la misma, como queramos probar, sino que tanto la fuerza que
acta sobre la partcula, como su aceleracin, toman el mismo valor en los
dos sistemas de referencia. Que la tercera ley de Newton tambin se cumple
para el sistema de referencia , se obtiene de este resultado y del carcter
absoluto de la simultaneidad, pues, la igualdad de las fuerzas de accin y
reaccin es instantnea, independiente de la posicin relativa de los puntos
de aplicacin de las fuerzas.
Esta invarianza de las leyes de la mecnica bajo transformaciones de
Galileo, constituye el Principio de Relatividad Galileano. En la formulacin
inicial de las leyes de Newton, se postul que ellas eran vlidas para un
observador en reposo con respecto al espacio absoluto, que lo llamamos observador inercial o sistema de referencia inercial, y mostramos, que si este
postulado se cumpla, entonces las leyes de Newton tambin eran vlidas
en cualquier sistema de referencia que se moviera con velocidad constante
respecto al observador inercial. Esto justifica extender el nombre de sistema
de referencia inercial, para todos los observadores con movimiento relativo
constante, respecto al observador inercial inicialmente en reposo relativo al
espacio absoluto. As, podemos dar otras formas equivalentes de enunciar el
principio de relatividad galileano: Las leyes de la mecnica son las mismas
en todos los sistemas de referencia inerciales, o tambin, no es posible, a
travs de experimentos mecnicos, determinar la velocidad del sistema de
referencia inercial con respecto al espacio absoluto.
Esta ltima forma equivalente de enunciar el principio de relatividad
Galileano, le quita todo el sentido fsico al espacio absoluto, pues elimina
su estatus privilegiado de ser el nico sistema de referencia con respecto
al cual se cumplen las leyes de la mecnica y por lo tanto, el espacio absoluto queda como un concepto empricamente vaco, por lo menos en lo
que a fenmenos mecnicos se refiere. Esta situacin, reconocida desde un
principio por Newton, lo condujo a buscar experimentos alternativos que le
permitieran determinar el movimiento con respecto al espacio absoluto. El
ejemplo ms conocido en la literatura lo constituye su experimento del balde
rotante, en el cual, la curvatura que toma la superficie del agua del balde,
cuando ste se encuentra en rotacin, se la atribuye a su movimiento de
rotacin respecto al espacio absoluto, pues este fenmeno, sostena Newton,
tena lugar an en el caso que el balde se encontrara solo en el universo.
Crticas a este anlisis son igualmente abundantes en la literatura, siendo
la de Mach la ms conocida, pues parte del anlisis que llev a Einstein a
formular los principios de la Teora General de la Relatividad est basado
sobre los trabajos de Mach.

1.3. LUZ Y TER: EL RETORNO AL ESPACIO ABSOLUTO

No es objeto de la presente seccin profundizar ms sobre este tema,


pues volveremos sobre el problema del espacio absoluto, cuando discutamos
las teorias del eter y los fenmenos electromagnticos. Sin embargo, es importante dejar claro un aspecto referente a este tema: Dada la imposibilidad
de determinar el movimiento absoluto (a velocidad constante) a travs de
fenmenos mecnicos, Newton recurri, entonces, a sistemas de referencia
acelerados, para los cuales las leyes de la mecnica ya no permanecen invariantes y claramente, los efectos de la aceleracin si son detectables (las, no
bien llamadas fuerzas ficticias, tales como la fuerza centrfuga o la fuerza de
coriolis, que surgen en sistemas de referencia acelerados), pero an, en este
caso de sistemas de referencia no inerciales, cualquier referencia al espacio
absoluto sigue siendo superflua.

1.3.

Luz y ter: El retorno al espacio absoluto

Hasta comienzos del siglo XIX todos los fenmenos fsicos, incluidos los
de la ptica, admitan una explicacin mecnica. Esto nos permite comprender, en gran parte, por qu esta imgen mecnica del mundo se extendi
hasta finales del siglo XIX, tratando de explicar fenmenos tales como la
propagacin de las ondas de luz, y todos aquellos fenmenos relacionados
con la teora electromagntica de Maxwell. Un ejemplo, que ilustra muy bien esta concepcin, lo podemos encontrar en la siguiente cita debida a Lord
Kelvin: No estar contento hasta que pueda construir un modelo mecnico del objeto que estoy estudiando. Si lo puedo lograr significa que lo he
entendido, de lo contrario no..
En este pargrafo describiremos brevemente dos desarrollos de la fsica
del siglo XIX, el carcter ondulatorio de la luz descubierto por Young y
Fresnel y la electrodinmica de Maxwell, que constituyen, en mi opinin, el
punto de partida ms directo para formular los principios y conceptos de la
teora especial de la relatividad.
El sonido es la propagacin de ondas longitudinales en un medio material,
en donde la velocidad de propagacin est dada por la ecuacin debida a
Newton:
s
v=

(1.9)

en donde Y es el mdulo de elasticidad del medio y la densidad del medio.


Adems, la velocidad del sonido es independiente de la fuente, pero depende de la velocidad del medio en el cual se transmite. De manera similar,

10

CAPTULO 1. MODELO MECNICO DEL MUNDO

se trabajaron modelos para explicar los fenmenos de la luz, como los desarrollados por Hook y Huygens, en donde la luz se consideraba como alguna
forma de onda longitudinal, que se propagaba a travs del espacio. Newton
trabaj este modelo por algn tiempo, pero dada la imposibilidad de explicar la polarizacin de la luz, desarroll el modelo corpuscular, capaz de
explicar este efecto y de dar cuenta de otras propiedades conocidas de la luz,
desplazando al modelo ondulatorio de Huygens.
La teora corpuscular de la luz permaneci vigente hasta comienzos del
siglo XIX, cuando Young y Fresnel explicaron los nuevos fenmenos de interferencia y difraccin, con base en la teora ondulatoria, relegando a la
teora corpuscular Newtoniana, a un captulo ms de la historia de la fsica. Sin embargo, de la misma manera que el sonido necesita de un medio
para propagarse, se vi la fsica avocada a postular un medio material para
la propagacin de las ondas de luz. Este medio material, que optaron por
llamar ter, debera ser de naturaleza diferente a la materia conocida hasta entonces. Es importante anotar, que el ter en la fsica no era una idea
completamente original, pues ya haba sido usado antes para explicar muchos otros fenmenos. Por ejemplo, Newton, sugiere que el ter puede estar
asociado con la gravitacin, con los fenmenos elctricos y magnticos, con
la propagacin del calor etc.. A este respecto, Young aclara, que el ter a
travs del cual se propaga la luz no necesariamente es el mismo que el ter
elctrico, y por esta razn Young propone llamarlo ter lumnico.
Una vez aceptado que la luz es un fenmeno ondulatorio, comenzaron a
desarrollarse teoras y modelos mecnicos del ter, para explicar el mecanismo de propagacin de las ondas de luz en este medio. Young y Fresnel
fueron los primeros en encontrar que las ondas de luz deben ser transversales, para poder explicar el fenmeno de polarizacin. Este hecho exiga,
entonces, un esfuerzo terico muy grande para comprender el mecanismo
de transmisin de ondas transversales en un medio elstico, dado que sto requera que el medio de transmisin, el ter, tuviera un coeficiente de
rigidez muy grande, pues, como lo demostr Poisson, ondas longitudinales
y transversales se podan propagar en un slido, con
v = (/)1/2

(1.10)

la velocidad de las ondas transversales y


vk = ([k + 4/3]/)1/2

(1.11)

la velocidad de las ondas longitudinales, siendo el mdulo de rigidez, k el


mdulo de elasticidad volumtrico y la densidad del slido. Una dificultad,

1.3. LUZ Y TER: EL RETORNO AL ESPACIO ABSOLUTO

11

de este modelo mecnico del ter, era la ausencia de componente longitudinal de las ondas de luz, lo que llev a Cauchy a sugerir, que el eter deba
tener una compresibilidad negativa, de tal manera que el factor k + 4/3,
en la ecuacin (1.11), se anulara. Estas teoras estaban basadas sobre las
propiedades conocidas de los medios elsticos, pero la combinacin tan inusual de las propiedades que debera tener el ter, condujeron a MacCullagh a
postular, que este medio era un nuevo tipo de sustancia elstica, diferente
a las conocidas y asocindole otras propiedades desarroll una teora ms
sofisticada, con un sistema de ecuaciones, muy parecido a las ecuaciones de
Maxwell, que fue intensamente trabajado en la segunda mitad del siglo XIX.
A diferencia de las propiedades mecnicas del ter, anteriormente discutidas, para las cuales era difcil proponer experimentos directos que las
verificaran, el teorema de adicin de velocidades de Galileo, que se cumple
tambin para las ondas en un medio mecnico, permiti proponer y realizar
toda una serie de experimentos para medir la velocidad de la luz, desde
un sistema de referencia mvil respecto al ter. La situacin se plantea de
la siguiente forma: De la teora de propagacin de las ondas en un medio
elstico, sabemos que:
(1.12)
u0 = u v
en donde u es la velocidad de propagacin de las ondas, medida en sistema
de referencia inercial , el cual est en reposo con respecto al medio de
propagacin (el ter para el caso de ondas de luz), u0 es la velocidad de las
ondas, medida por un observador en un sistema de referencia inercial 0 ,
que se mueve con velocidad v respecto a .
En 1728 Bradley descubri el fenmeno de aberracin de la luz, que consiste en el cambio aparente de posicin de las estrellas en diferentes pocas
del ao (Figura 1.2). Este efecto se explica fcilmente, si se supone que el
ter est en reposo respecto al sol, pues, dado que la tierra se mueve con
una velocidad aproximada de 30km/s en su rbita alrededor del sol y, por
lo tanto, si tomamos una estrella colocada perpendicularmente al plano de
translacin de la tierra, el telescopio debe inclinarse un ngulo adicional dado por vc sin , en donde v es la velocidad orbital de la tierra, c la velocidad
de la luz respecto al ter y mide la posicin angular instntanea de la
estrella respecto a la tierra. Esta interpretacin fue capaz de dar el valor
correcto de la aberracin observada, a primer orden en v/c.
Es de anotar, que los experimentos de aberracin de la luz estelar no
eran capaces de dar el valor de la velocidad absoluta de la tierra respecto al
ter, sino solamente cambios de la velocidad relativa de la tierra respecto al
ter. Arago en 1810 propuso una modificacin al experimento de aberracin,

12

CAPTULO 1. MODELO MECNICO DEL MUNDO

Figura 1.2: Aberracin de la luz estelar

que s permitira medir la velocidad absoluta de la tierra respecto al ter,


pues de acuerdo con la teora clsica, si la luz atravesaba un medio refractivo
(como el agua o un vidrio), el cual estuviera movindose respecto al ter,
entonces la velocidad de la luz respecto a este medio variaba, dependiendo de
la direccin relativa de movimiento del medio y el ter, es decir, el ndice de
refracin del medio dependera de la direccin relativa de movimiento. Arago
coloc un prisma en el telescopio y observ diferentes estrellas, esperando
encontrar variaciones del ngulo de aberracin. El resultado negativo de su
experimento, condujo a Fresnel a proponer la teora del arrastre parcial del
ter por los medios materiales en movimiento y mostr que este arrastre
parcial del ter haca inobservable el efecto del viento de ter en medios
materiales, en rdenes de magnitud de v/c.
Basados sobre este mismo principio, se realizaron toda una serie de experimentos como los de Hoek, de Mascart y Jamin, Airy, Fizeau, etc, obtenindose tambin resultados negativos. Sin embargo, no se poda estar seguro
que las condiciones experimentales fueran lo suficientemente adecuadas para
medir los pequeos efectos que se estaban buscando. Adems se agregaba
la dificultad que al utilizar luz blanca, el ndice de refracin de la luz en un
medio dependa de la frecuencia y por tanto cada color (frecuencia) sufra un
arrastre diferente. Los problemas de la teora del ter no se centraban ni-

1.3. LUZ Y TER: EL RETORNO AL ESPACIO ABSOLUTO

13

camente en la determinacin de la velocidad absoluta de la tierra respecto


al ter, sino tambin tenan que dar cuenta de los dems efectos conocidos,
tales como las leyes de reflexin, refraccin, polarizacin, cristales pticos,
etc, lo cual conduca a complicar cada vez ms el modelo mecnico del ter.
Un elemento adicional que se sumaba a esta historia del ter, lo constituye el desarrollo de las teoras de la electricidad y el magnetismo, que
culminan hacia mediados del siglo XIX con las ecuaciones de Maxwell y con
el descubrimiento, tal vez el ms importante de ese siglo, que la luz son ondas
electromagnticas. A partir de este momento el ter se asoci como el medio
de propagacin de los campos elctricos y magnticos. Pero un punto ms
importante para nuestra discusin de los orgenes de la teora especial de
la relatividad, lo constituye el hecho de que las leyes del electromagnetismo
de Maxwell no satisfacen el principio de relatividad de Galileo. Lo que resta
de esta seccin lo dedicaremos a explicar el significado de este hecho y sus
implicaciones.
Que las leyes del electromagnetismo de Maxwell no satisfacen el principio de relatividad de Galileo significa que las ecuaciones de Maxwell no
permanecen invariantes, cuando se realiza una transformacin de Galileo
entre dos sistemas de referencia inerciales, o en otros trminos equivalentes,
si suponemos que las ecuaciones de Maxwell son vlidas en un sistema de referencia inercial , entonces ellas cambiarn para cualquier otro observador
inercial 0 , que se mueva con respecto a . Este cambio se refleja en que a
las ecuaciones de Maxwell le aparecen nuevos trminos, que van a depender
de la velocidad relativa de los sistemas. Estos nuevos trminos dependientes
de la velocidad en las leyes de la electrodinmica deben producir efectos observables y por tanto, deben permitir determinar la velocidad del sistema de
referencia 0 del observador, respecto al nico sistema de referencia inercial
para el cual las ecuaciones de Maxwell toman su forma ms simple.
Esta situacin de las leyes del electromagnetismo rescataba entonces el
concepto de espacio absoluto, identificado a su vez con el sistema de reposo
del ter, pero ahora y a diferencia del caso de la mecnica de Newton, dndole
un significado fsico: Las leyes de la electrodinmica son vlidas solamente
en el sistema de referencia en reposo con respecto al espacio absoluto.
Para ilustrar esta situacin, consideremos dos cargas +q y q, unidas
por una varilla rgida aislante (Figura 1.3). Si este sistema est en reposo
respecto al espacio absoluto , la nica fuerza entre las cargas es la elctrica,
dada por la ley de Coulomb. Pero si estas cargas se encuentran en reposo en
otro sistema de referencia inercial 0 que se mueva respecto a una velocidad v, entonces aparecer un campo magntico y as, una fuerza, adicional
a la fuerza elctrica, debida al movimiento de las cargas, que producir, por

14

CAPTULO 1. MODELO MECNICO DEL MUNDO

Figura 1.3: Experimento de Truton-Noble


lo tanto, un par de fuerzas que tender a hacer girar el sistema. Este experimento, con resultado negativo, fue llevado a cabo por Trouton y Noble,
2
esperando encontrar una fuerza magntica que dependa de la relacin vc2 ,
siendo v la velocidad de la tierra. Es de anotar, que el diseo experimental utilizado para realizar este experimento, permita medir cantidades del
orden de magnitud de v 2 /c2 108 .

1.3.1.

Un experimento crucial

El experimento ms notable, y de referencia obligada en todo tratado de


relatividad, lo constituye el realizado por Michelson y Morley en 1887. Es
interesante notar, que Einstein no hace referencia alguna a este experimento
en sus primeros artculos, en donde desarrolla la teora especial de la relatividad, y de hecho, varios historiadores de la ciencia afirman que ni siquiera
lo conoca. La importancia histrica de este experimento y su obligatoria
referencia, la podemos entender por dos aspectos: primero, el diseo del
experimento permita medir, con una precisin suficiente (corrimientos del
patrn de interferencia menores a 1/100 de franja), evitando as, el problema
que se presentaba en todos los otros experimentos realizados hasta entonces,
en cuanto a que, el orden de magnitud de los efectos esperados, eran siempre
menores o del mismo orden que el error experimental, dejando siempre un

1.3. LUZ Y TER: EL RETORNO AL ESPACIO ABSOLUTO

15

velo de duda sobre los resultados obtenidos. Segundo, el resultado negativo


del experimento de Michelson y Morley gener toda una serie de trabajos
tericos, que impulsaron el desarrollo de la fsica y abrieron el camino para
la formulacin de la teora de la relatividad. Tal vez, el ms importante de
estos trabajos fue el realizado por Lorentz, que culmin con su libro sobre la
teora del electrn publicado en 1905. Es interesante, ms no sorprendente,
anotar como, en este libro, se encuentran todas las ecuaciones que describen
los fenmenos ms significativos que predice la relatividad, como por ejemplo, las transformaciones entre sistemas de referencia inerciales (llamadas hoy
transformaciones de Lorentz), las ecuaciones de contraccin de longitudes y
dilatacin del tiempo, la equivalencia masa-energa, la variacin de la masa
inercial con la velocidad, etc, solamente que su interpretacin, en trminos
de las propiedades del ter, era incorrecta, en cuanto a que, estos efectos
esperados, siempre se compensaban con otros debidos al ter, de tal manera que ninguno de ellos resultaba ser observable. Este trabajo terico de
Lorentz resolva, as, la aparente inconsistencia entre los dos grandes pilares
de la fsica conocidos hasta entoces, la mecnica de Newton y la electrodinmica de Maxwell, pero dejaba el problema fundamental sin resolver: el
espacio absoluto y la indetectabilidad del ter.
Anotbamos en el pargrafo anterior, que no es una sorpresa que el trabajo de Lorentz contenga todas las ecuaciones relativistas, pues est basado sobre la electrodinmica de Maxwell, que como veremos en un captulo
posterior, es una teora relativista. Igualmente, esta anotacin nos permite
tambin entender, por qu no era necesario que Einstein conociera el experimento de Michelson y Morley para desarrollar la teora de la relatividad.
En efecto, basta con recordar el ttulo del primer artculo publicado por
Einstein sobre el tema:Zur Elektrodinamik der bewegten Krper (Sobre
la electrodinmica de los cuerpos en movimiento).
El experimento de Michelson-Morley fue realizado en 1887, utilizando
como principio fsico el fenmeno de interferencia de la luz. El diseo experimental es bosquejado en la (Figura 1.4). De la fuente S sale un haz de
luz que incide sobre un espejo semitransparente A, el cual divide al haz en
dos rayos mutuamente perpendiculares, los cuales se reflejan en los espejos
planos B y C, retornando al espejo A, en donde, el rayo proveniente del
espejo C es desviado hacia el objetivo O, mientras que el rayo reflejado en
B atraviesa el espejo A y llega al objetivo O, donde se observan franjas de
interferencia, las cuales dependen de la diferencia de caminos pticos entre
los dos rayos de luz.
Supongamos, sin prdida de generalidad y para simplicar el anlisis, que

16

CAPTULO 1. MODELO MECNICO DEL MUNDO

Figura 1.4: Experimento de Michelson y Morley


los caminos AB y AC de los dos haces de luz son iguales. Sea v la velocidad
de la tierra respecto al ter y paralela al brazo AC del interfermetro. As,
la velocidad del viento del ter respecto al interfermetro, fijo a la tierra,
est en la direccin de CA (ver Figura 1.4), suponiendo que no hay arrastre
parcial del ter. De acuerdo con las teoras del ter, la velocidad de la luz
relativa al laboratorio es cv, cuando va de A hacia C y c+v cuando regresa
1
de C hacia A, mientras que la velocidad del otro rayo de luz es (c2 v2 ) 2
en la direccin de A hacia B y de B hacia A.
Entonces, si la longitud de cada uno de los brazos del interfermetro es
L, la diferencia de tiempos de llegada de los dos rayos est dada por:
2Lc
2L

2
2
v
c v2
1
2L
1
(
p
)
2
2
c 1 v /c
1 v2 /c2

t = tACA tABA =
=

c2

(1.13)

Utilizando la expansin en serie

(1 + x)r = 1 + rx +

1
r(r 1)x2 +
2!

(1.14)

la cual es convergente para |x| < 1, se desarrolla cada fraccin hasta trminos

1.3. LUZ Y TER: EL RETORNO AL ESPACIO ABSOLUTO

17

del orden de v 2 /c2 , obteniendo:


t ' L

v2
c2

(1.15)

Si rotamos el interfermetro 90 , el tiempo para recorrer el camino ABA


ser ahora mayor que el tiempo para el camino ACA, y la diferencia de
2
tiempos t estar dada por t ' L vc2 . Por lo tanto, el cambio total en la
2
diferencia de tiempos al rotar el interfermetro es igual a 2L vc2 . Si es la
longitud de onda de la luz utilizada, entonces la rotacin del interfermetro
da lugar a un corrimiento de n franjas, dado por:
n=

2L v2
c2

(1.16)

Michelson y Morley utilizaron en su experimento luz de longitud de onda


de 5,9 107 m y un camino de L = 11m, logrado por mltiples reflexiones.
Tomando para la velocidad de la tierra alrededor del sol 30km/s, se esperaba
un corrimiento de aproximadamente 0,37 franjas, el cual, como ya se ha dicho
no fue observado.

18

CAPTULO 1. MODELO MECNICO DEL MUNDO

Captulo 2

Fundamentos de la
relatividad especial
En este captulo formularemos los postulados fundamentales sobre los
cuales est basada la teora especial de la relatividad y obtendremos las ecuaciones de transformacin entre sistemas de referencia inerciales (transformaciones de Lorentz). Concluiremos el captulo estudiando las propiedades de
las transformaciones de Lorentz y sus consecuencias sobre la medida de intervalos temporales y espaciales.

2.1.

Postulados de la relatividad especial

Como fue anotado en el captulo anterior, la teora desarrollada por


Lorentz solucionaba la aparente inconsistencia de la mecnica Newtoniana y
la electrodinmica de Maxwell, manteniendo inmodificados los principios y
postulados fsicos sobre los cuales se basaban estas teorias. La aproximacin
de Einstein a este problema es diferente, pues est basada sobre dos postulados de carcter fundamental, en el sentido de que estos postulados deben ser
satisfechos por cualquier teora fsica que se proponga, independientemente
de las leyes y principios que se postulen para describir esta teora.
Postulado 1: Las leyes fsicas son independientes del sistema de referencia inercial, con respecto al cual se midan las variables que describen al
sistema fsico considerado.
Postulado 2: La velocidad de la luz en el vaco es la misma para todos
los observadores inerciales, independiente de la direccin de propagacin y
de la velocidad de la fuente emisora.
El primer postulado propuesto por Einstein es conocido tambin como
19

20 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL


el Principio de Relatividad, el cual generaliza el principio de relatividad
Galileano a todas las leyes de la fsica. El costo de aceptar este postulado
es el de abandonar las transformaciones de Galileo, que relacionan las coordenadas de los eventos medidas por diferentes observadores inerciales, y de
paso, se hace necesario revisar las leyes de la mecnica Newtoniana. Pues,
como vimos en la parte final del captulo anterior, las ecuaciones de Maxwell
no eran invariantes bajo transformaciones de Galileo, indicando que las leyes
del electromagnetismo no obedecan el principio de relatividad de Galileo.
Sin embargo, los experimentos realizados para demostrar este hecho daban
todos resultados negativos, y no es aventurado pensar que fue esta situacin
la que llev a Einstein a postular, que las leyes de la electrodinmica s satisfacan el principio de relatividad, pero entonces sto exiga abandonar las
ecuaciones de transformacin de Galileo, como la forma correcta de expresar
las transformaciones entre sistemas de referencia inerciales. Esto implicaba
tambin que deberan ser modificadas las leyes de la mecnica de Newton,
las cuales s permanecen invariantes bajo transformaciones de Galileo.
El segundo postulado de la Teora de la Relatividad establece que la
velocidad de la luz en el vaco es constante, independiente del sistema de
referencia inercial desde el cual sta sea medida. Cmo lleg Einstein a este
resultado, es un problema que ha sido objeto permanente de debate en la
historia de la ciencia. Ninguno de los experimentos realizados en el siglo XIX
se puede considerar como evidencia directa de la constancia de la velocidad
de la luz en el vaco. Es claro a la luz de este postulado, el resultado negativo
del experimento de Michelson y Morley y podra pensarse, como lo afirma
Grnbaum, que Einstein incorpora este resultado nulo como un axima, a
travs del principio de la constancia de la velocidad de la luz. Aun cuando
en una entrevista realizada por Shankland a Einstein en 1950, le afirma que
l no estaba familiarizado con el experimento de Michelson y Morley cuando
escribi su artculo en 1905, Shankland hace notar que en este artculo Einstein hace referencia a intentos fallidos para detectar cualquier movimiento
de la tierra respecto al ter lumnico, lo que indica segn Shankland, que
Einstein tena referencia de los diferentes experimentos pticos realizados,
pero no de los detalles prpios de cada experimento.
Una aproximacin alternativa para buscar los orgenes de este segundo postulado, la podemos encontrar en la teora de la electrodinmica de
Maxwell, pues, si aceptamos su validez y el principio de relatividad, podemos
encontrar el principio de la constancia de la velocidad de la luz, as como
tambin el postulado de la constancia de la carga elctrica, el cual juega un
papel igualmente importante en fsica.
Las ecuaciones de Maxwell, en el sistema M.K.S. racionalizado, para un

2.1. POSTULADOS DE LA RELATIVIDAD ESPECIAL

21

observador inercial toman la forma


E = /0

(2.1)

B =0

(2.2)

B = 0 J + 0 0

E
t

(2.3)

B
(2.4)
t
con 0 = 4 107 N w/(amp)2 la permeabilidad magntica del vaco y
0 = 8, 854 1012 coulomb2 /N w m2 la constante dielctrica del vaco. La
primera ecuacin corresponde a la ley de Gauss, y establece que las cargas
son fuente del campo elctrico, siendo la densidad de carga. La segunda
ecuacin afirma que no existen cargas magnticas aisladas. El primer trmino
de la tercera ecuacin corresponde a la ley de Ampre y significa que las
corrientes elctricas son fuente del campo magntico, con J la densidad
de corriente, mientras que el ltimo trmino, conocido como corriente de
desplazamiento de Maxwell, establece que variaciones temporales del campo
elctrico son tambin fuente del campo magntico. La ltima ecuacin es la
ley de induccin de Faraday, en la cual variaciones temporales del campo
magntico producen campos elctricos. Las ecuaciones de campo de Maxwell
se completan con una ecuacin de movimiento, la cual establece que la fuerza
sobre una partcula de carga q en presencia de un campo electromagntico
est dada por :
F = q E + qu B
(2.5)
E =

conocida como la fuerza de Lorentz.


Si tomamos la divergencia de la tercera ecuacin de Maxwell, haciendo
uso de la ley de Gauss (primera ecuacin) y del hecho que la divergencia
del rotacional siempre es cero, obtenemos la ecuacin de continuidad para
la carga elctrica

+J =0
(2.6)
t
Integrando en todo el espacio y aplicando el teorema de Gauss, se llega
al principio de conservacin de la carga:
Z
dQ
d
dV =
=0
(2.7)
dt
dt
Este resultado es independiente del estado de movimienento de la carga
y existe muchsima evidencia experimental que lo corrobora. Por ejemplo,

22 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL


si la carga dependiera de la velocidad, el tomo de hidrgeno podra no ser
elctricamente neutro, ya que en promedio, la velocidad del electrn en el
tomo es mayor que la velocidad del protn.
Considerando otro sistema de referencia inercial 0 y asumiendo el principio de relatividad, las ecuaciones de Maxwell en este nuevo sistema estn
dadas por:
0
(2.8)
E 0 = 0 /0
0

B0 = 0
0

B 0 = 0 J 0 + 0 0

(2.9)
E0
t0

(2.10)

B0
(2.11)
t0
en donde las cantidades primadas se refieren a sus valores medidos por el
observador 0 . Siguiendo los mismos pasos anteriores, obtenemos la ecuacin
de continuidad en el sistema de referencia 0
0

E0 =

0
0
+ J0 = 0
t0

(2.12)

y el principio de la invarianza de la carga, que para el caso de una partcula


elemental su valor invariante corresponde al valor medido de la carga, cuando sta se encuentra en reposo respecto al sistema de referencia inercial 0 .
Una suposicin fundamental que est implcita en el principio de relatividad,
es que parmetros tales como la carga , la masa, etc., de una partcula fundamental, cuando son medidos respecto a un sistema de referencia para el
cual la partcula est en reposo, toman el mismo valor numrico cuando se
miden con respecto a otro sistema de referencia inercial 0 cuando la partcula se encuentra en reposo relativo respecto a este sistema 0 . Si aceptamos
esta suposicin, entonces el principio de la constacia de la carga elctrica, se
obtiene de las ecuaciones de Maxwell y del principio de relatividad.
Consideremos, ahora, las ecuaciones de Maxwell en el vaco ( = 0,
J = 0), en un sistema de referencia inercial y tomemos el rotacional de
la ltima ecuacin de Maxwell (la ley de induccin de Faraday), entonces,
teniendo en cuenta la identidad vectorial
E = ( E) 2 E

(2.13)

y la primera ecuacin de Maxwell en el vaco E = 0, obtenemos


2 E 0 0

2E
=0
t2

(2.14)

2.1. POSTULADOS DE LA RELATIVIDAD ESPECIAL

23

Esta relacin corresponde a la ecuacin de ondas electromagnticas (con


una ecuacin similar para el vector campo magntico), y describe la radiacin electromagntica producida por algn sistema de cargas aceleradas,
y cuya velocidad de propagacin en el vaco, viene dada por:

(2.15)
c = 1/ 0 0
siendo esta velocidad de propagacin, independiente de la velocidad de la
fuente (sistema de cargas aceleradas). Si ahora asumimos de nuevo la validez
del principio de relatividad y consideramos otro sistema de referencia inercial
0 , obtenemos, siguiendo un razonamiento similar, la ecuacin de ondas en
el sistema de referencia 0 :
02 E 0 00 00

2E0
=0
t02

(2.16)

Esta ecuacin describe la propagacin de las ondas electromanticas con


una velocidad (00 00 )1/2 en el vaco, la cual, como para el caso del sistema de
referencia , es tambin independiente del movimiento de las cargas fuente.
Si definimos el amperio a travs de la ley de Biot-Savart, como la corriente que circula por dos hilos paralelos infinitos, separados por una distancia
de un metro en el vaco, para que sobre cada hilo se experimente una fuerza
por unidad de longitud de 2 107 N w, entonces el valor de la constante
permeabilidad magntica del vaco es:
00 = 0 = 4 107 N w/m

(2.17)

Por otra parte, si suponemos que la ley de Coulomb es vlida en los dos
sistemas de referencia inerciales y 0 , y que la fuerza de Coulomb, entre dos
partculas iguales en reposo relativo, por ejemplo dos electrones o protones,
es la misma en ambos sistemas de referencia inerciales, entonces 00 = 0 y
por lo tanto la velocidad de la luz es independiente del sistema de referencia
inercial desde el cual sta sea medida e independiente del movimiento de las
fuentes.
Si aceptamos ahora, que el postulado de la constancia de la velocidad de
la luz es vlido, y las ecuaciones de Maxwell son correctas, entonces 00 = 0 y
tambin 00 = 0 . Esto implica que las unidades fundamentales de longitud,
tiempo, masa y carga elctrica deben ser definidas en la misma forma en
todos los sistemas de referencia inerciales, as como tambin las constantes
fundamentales de la fsica: la constante de Planck h = 6, 626 1034 J s, la
constante de gravitacin universal de Newton G = 6, 670 1011 N w m2
kg 2 y la velocidad de la luz en el vaco c = 2, 998 108 m s1 .

24 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL


Como fue originalmente propuesto por Planck, estas constantes fundamentales c, G y ~ = h/2, pueden ser conbinadas para dar las unidades
fundamentales de longitud, tiempo y masa:
Lp := (G~/c3 )1/2 = 1, 616 1035 m

(2.18)

Tp := (G~/c5 )1/2 = 5, 39 1044 s

(2.19)

Mp := (~c/G)1/2 = 2, 18 108 kg

(2.20)

llamadas longitud, tiempo y masa de Planck respectivamente. Actualmente


es prctica usual en la fsica trabajar con unidades de c = ~ = G = 1, las
cuales son llamadas unidades fundamentales o naturales.

2.2.

Transformaciones de Lorentz

De lo discutido en la seccin anterior, las leyes de la electrodinmica


son fsicamente compatibles con el principio de la constancia de la velocidad de la luz, pero a diferencia de las leyes de Newton, las ecuaciones de
Maxwell no permanecen invariantes bajo las transformaciones de Gelileo.
Esta situacin nos conduce al problema de encontrar un conjunto de transformaciones de coordenadas compatibles con los postulados de la relatividad especial. Lorentz a finales del sigloXIX, encontr las transformaciones
de coordenadas que dejaban invariante a las ecuaciones de Maxwell, pero en
ningn momento las consider como las ecuaciones de transformacin entre
sistemas de referencia inerciales, pues ellas claramente, no eran compatibles
con las leyes de la mecnica Newtoniana. Estas transformaciones se conocen
hoy da como las transformaciones de Lorentz.
En esta seccin mostraremos, que las transformaciones de Lorentz, constituyen el conjunto de ecuaciones de transformacin de coordenadas entre
sistemas de referencia inerciales, deducindolas a partir de los postulados
fundamentales de la relatividad especial, junto con algunas suposiciones generales sobre homogeneidad e isotropa del espacio y del tiempo.
Antes de abordar el problema de obtener las ecuaciones de transformacin de coordenadas, es importante aclarar algunos conceptos sobre la forma
como se definen y miden las coordenadas del espacio y del tiempo, y sobre
los postulados de homogeneidad e isotropa.
Al igual que en la mecnica Newtoniana, asumiremos que el espacio fsico es homogneo e isotrpico, lo cual implica que todos los puntos y todas
las direcciones espaciales son equivalentes para describir los fenmenos fsicos. Esto significa, en trminos ms precisos, que las leyes fundamentales

2.2. TRANSFORMACIONES DE LORENTZ

25

de la fsica no deben depender de la posicin y de la direccin espacial, lo


cual energa se traduce en la arbitrariedad para elegir el origen y la direccin de los ejes espaciales. Adicionalmente se postula que el espacio fsico
es tridimensional y obedece los postulados de la geometra euclideana. La
homogeneidad e isotropa del tiempo, significan que las leyes de la fsica
no deben depender de un instante particular ni de la direccin del tiempo
elegida, es decir, la eleccin del origen y la escala para medir el tiempo es
arbitraria (homogeneidad) y que las leyes de la fsica son invariantes bajo
una transformacin de la forma t t (isotropa). Estas propiedades del
espacio y el tiempo deben quedar reflejadas en el sistema de coordenadas
espacio-temporales elegido, as como la forma en que se miden las distancias
espaciales y el intervalo temporal entre eventos fsicos.
Un evento es un fenmeno fsico independiente del observador (tal como
la colisin entre dos partculas, o la emisin de un fotn por un tomo), el
cual ocurre en un punto del espacio y en un instante de tiempo y puede ser
medido por instrumentos fsicos adecuados.
Adicional a los postulados anteriores sobre la estructura del espacio y el
tiempo, suponemos que se puede definir una escala de medida de longitudes,
igual para todos los observadores inerciales, la cual nos permite medir intervalos espaciales utilizando un sistema de reglas rgidas. Este procedimiento
define una mtrica para el espacio, que cumple con las propiedades de homogeneidad e isotropa y que obedece la geometra euclideana. El sistema
de coordenadas cartesianas espaciales R3 con la mtrica usual, esto es la
mtrica euclideana
x R3 |x|2 = x21 + x22 + x23

(2.21)

nos ofrece el modelo matemtico natural para describir el espacio fsico.


Uno de los aspectos cruciales de la teora de la relatividad lo constituye el
problema de la medida del tiempo. En efecto, Einstein en su primer artculo,
dedica una buena parte de l a definir la forma como se miden los intervalos
temporales entre eventos fsicos. Definida ya la estructura mtrica del espacio
y el proceso de medida de intervalos espaciales, podemos utilizar el postulado
de la constancia de la velocidad de la luz para definir el concepto de tiempo
fsico, es decir, el mtodo operacional para la medida del tiempo que est
de acuerdo con los postulados fundamentales de la fsica y que refleje las
propiedades de homogeneidad e isotropa del tiempo.
En primer lugar se asume, que si dos eventos fsicos ocurren en el mismo
punto del espacio y simultneamente (en el mismo instante de tiempo) para
un observador inercial, entonces estos dos eventos fsicos sern simultneos

26 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Figura 2.1: Sincronizacin de relojes

para todos los observadores inerciales y ocurrirn tambin en el mismo punto del espacio. En otras palabras, la simultneidad de eventos en un mismo
punto del espacio es un hecho fsico absoluto, i.e., independiente del observador. Supongamos adems, que se dispone de un conjunto de relojes ideales
e idnticos, es decir, algn dispositivo o fenmeno fsico reproducible, que
nos permita determinar una escala de tiempo y situemos uno de estos relojes
en el origen de coordenadas espaciales escogido por un observador inercial.
De acuerdo con la suposicin sobre el caracter absoluto de la simultneidad
para eventos que tienen lugar en el mismo punto del espacio, el observador
determinar un tiempo, el marcado por el reloj situado en su origen, para
cada evento que ocurra en el origen de coordenadas. Este tiempo marcado
por el reloj supone haber elegido un instante inicial, t = 0, el cual es arbitrario, de acuerdo con la hiptesis de homogeneidad del tiempo. Ahora,
coloquemos en cada punto del espacio y en reposo relativo al reloj del origen,
uno de estos relojes idnticos, y determinemos que el instante de tiempo en
que un evento fsico sucede, es el marcado por el reloj situado en el punto
del espacio donde el evento tiene lugar.
Hasta este momento se ha definido la medida del tiempo local y falta
entonces sincronizar todos los relojes del observador inercial, para que este

2.2. TRANSFORMACIONES DE LORENTZ

27

observador asigne un nico tiempo y as, una nica coordenada temporal a


cada evento fsico, independiente de la posicin espacial en la cual suceda
dicho evento. Para sincronizar los relojes seguiremos el mtodo expuesto por
Einstein en su primer artculo.
Para el reloj situado en el origen de coordenadas, elijamos un instante
cualquiera como el tiempo t = 0. Consideremos un segundo reloj situado a
una distancia d del origen y enviemos, desde el origen y en la direccin de este
segundo reloj, un rayo de luz en en el instante en que el reloj del origen marca
t1 (Figura 2.1). Este segundo reloj marcar un tiempo t2 cuando el rayo de
luz lo alcanza, y se define entonces que los dos relojes estn sincronizados,
si se cumple que
t2 = t1 +

d
c

(2.22)

Con estas definiciones de medida de la distancia y del intervalo temporal, un observador inercial construye su sistema de coordenadas espaciotemporal. Este procedimiento es consistente y vlido para todos los observadores inerciales, puesto que la distancia d para puntos en reposo relativo
est bien definida y es por su definicin independiente del observador, as como la velocidad de la luz en el vaco c es una constante universal, de acuerdo
con el segundo postulado.
La coordenada temporal para un evento, se le define, entonces, como la
lectura del reloj que est situado en el punto del espacio donde el evento
ocurre, y de acuerdo con la hiptesis del caracter absoluto de la simultneidad, para eventos que suceden en el mismo punto del espacio, este procedimiento es independiente del observador.
Habiendo definido la forma como un observador inercial construye su
sistema de coordenadas espacio-temporales, abordemos, ahora, el problema
de encontrar las ecuaciones que relacionan las coordenadas de un evento,
asignadas por dos observadores inerciales.
Sea p un evento fsico, y san (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) las coordenadas
del evento, medidas por los dos observadores inerciales y 0 . De acuerdo
con la homogneidad e isotropa del espacio y el tiempo, supongamos, sin
prdida de generalidad, que los dos observadores eligen los ejes coordenados
espaciales paralelos, con v, la velocidad del sistema 0 respecto a , en
la direccin positiva de los ejes x, x0 , y adems, define cada observador, el
origen de la coordenada temporal t = t0 = 0, en el instante en que los
orgenes espaciales de los sistemas coinciden (Figura 2.2).
El conjunto de transformaciones de coordenadas, que estamos buscando,

28 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Figura 2.2: Transformaciones de Lorentz


lo podemos escribir en la forma general como:
t0 = f1 (t, x, y, z)

(2.23)

x0 = f2 (t, x, y, z)

(2.24)

y 0 = f3 (t, x, y, z)

(2.25)

z 0 = f4 (t, x, y, z)

(2.26)

con la condicin que las funciones fi san invertibles, es decir, que se puedan
despejar las coordenadas (t, x, y, z) en funcin de las coordenadas primadas
(t0 , x0 , y 0 , z 0 ).
Otra condicin general sobre las funciones fi la impone la primera ley de
Newton la cual implica que una partcula libre debe moverse con velocidad
constante para todos los observadores inerciales. Esta exigencia implica que
las ecuaciones de transformacin deben ser lineales en las coordenadas. As,
el sistema de ecuaciones de transformacin (2.23), (2.24), (2.25) y (2.26) lo
podemos escribir como:
t0 = a00 t + a01 x + a02 y + a03 z

(2.27)

x0 = a10 t + a11 x + a12 y + a13 z

(2.28)

2.2. TRANSFORMACIONES DE LORENTZ

29

y0 = a20 t + a21 x + a22 y + a23 z

(2.29)

z 0 = a30 t + a31 x + a32 y + a33 z

(2.30)

en donde los coeficientes ai,j son constantes independientes de las coordenadas. Estos coeficientes ai,j son funciones, a lo sumo, de la velocidad del
sistema de referencia 0 respecto a , pues se supone que todos los observadores eligen las mismas escalas para medir distancias y tiempos. La
linealidad implica tambin que los ejes espaciales de 0 permanecen siempre
paralelos a si mismos y as a los ejes espaciales de . Adems, la velocidad
del sistema respecto a 0 es igual a v (igual en magnitud y opuesta a
la velocidad de 0 respecto a ), y por lo tanto la transformacin inversa
debe tener la misma forma cambiando v por v. Para el caso cuando v = 0,
la transformacin se reduce a la identidad. La condicin de existencia de la
transformacin inversa, por otra parte, queda garantizada exigiendo que el
determinante de los coeficientes aij sea diferente de cero.
De la escogencia de los ejes espaciales se obtiene que los planos y = 0
y y0 = 0 coinciden permanentemente (todos los ejes espaciales de los dos
sistemas de referencia permanecen paralelos) y por lo tanto la ecuacin de
transformacin para la coordenada y 0 debe reducirse a:
y 0 = a22 y

(2.31)

Si invertimos las direcciones de los ejes x y z de no se debe afectar la


relacin anterior, y por lo tanto la transformacin inversa de 0 a , para
la coordenada y, toma la forma
y = a022 y 0 = a22 y 0

(2.32)

Esto implica, por lo tanto que se debe cumplir que a22 = 1. Por otra
parte, dado que para v 0 se cumple que y0 y, entonces
a22 = 1

(2.33)

Un argumento similar vale para la coordenada z, entonces


y0 = y ; z 0 = z

(2.34)

Puesto que la transformacin de coordenadas es lineal y las coordenadas


del origen del sistema de referencia 0 , medidas por el observador , estn
dadas por x = vt, entonces x0 debe ser de la forma
x0 = (x vt)

(2.35)

30 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL


donde es un parmetro que, en general, depende de la velocidad. Por
simetra, la transformacin inversa para la coordenada x tendr la misma
forma (con v cambiada por v), entonces
x = 0 (x0 + vt0 )

(2.36)

siendo 0 otra constante dependiente de v. Si invertimos las direcciones de


los ejex x y z en y 0 , entonces las relaciones (2.35) y (2.36) se siguen
cumpliendo, es decir si cambiando x x y x0 x0 tenemos que
x0 = (x vt)

x = 0 (x0 + vt0 )

= (x + vt)

(2.37)

x = (x vt )

(2.38)

de donde se obtiene que = 0 , pues, del principio de relatividad la fsica


no debe depender de la direccin elegida para los ejes espaciales. Adems,
el parmetro debe ser positivo dado que para t = 0, x0 > 0 si x > 0.
Para encontrar una expresin explcita para y la forma como la coordenada temporal se transforma, apliquemos ahora el segundo postulado de la
constancia de la velocidad de la luz en el vaco. Si en el instante t = 0 = t0 ,
cuando los orgenes coinciden, se emite un pulso de luz en la direccin del eje
x positivo, entonces se debe satisfacer que al cabo de un tiempo t, medido en
, el pulso de luz est en un punto del espacio cuya coordenada x, medida
en , cumpla x = ct. De acuerdo con el postulado de la constancia de la
velocidad de la luz en el vaco, para el observador 0 se debe cumplir que
el pulso de luz llega al punto del espacio de coordenada x0 , en un instante
t0 , tal que x0 = ct0 . Substituyendo estas dos relaciones, x = ct y x0 = ct0 ,
en las ecuaciones (2.35) y (2.36), multiplicando las ecuaciones resultantes y
eliminando el trmino tt0 , obtenemos
1
= (v) = p
1 v 2 /c2

(2.39)

conocido como el factor gamma de Lorentz. A partir de esta expresin y


eliminando la coordenada x0 entre las ecuaciones (2.35) y (2.36), obtenemos
la ecuacin de transformacin para la coordenada temporal:
t0 = (t vx/c2 )

(2.40)

2.3. PROPIEDADES DE LAS TL

31

Resumiendo, el conjunto de transformaciones de coordenadas, llamadas


transformaciones de Lorentz (TL), que relacionan las coordenadas espaciotemporales de un evento fsico medidas por dos observadores inerciales, estn
dadas por:
t0 = (t vx/c2 )
x0 = (x vt)
(2.41)
y0 = y
z0 = z
As, el principio de relatividad exige que las leyes de la fsica deben ser
tales que ellas permanezcan invariantes bajo las tranformaciones de Lorentz
(ecuaciones (2.41)), pues, como veremos en la siguiente seccin donde se
discutirn algunas propiedades de las TL, llas contienen implcitamente
al postulado de la constancia de la velocidad de la luz. Para encontrar las
transfomaciones de Lorentz inversas, es decir, las transformaciones de coordenadas para pasar del sistema 0 al sistema , basta con invertir las
ecuaciones (2.41), o en forma equivalente, cambiando v por v en las TL
(2.41) y las coordenadas primadas por las no primadas (por la simetra entre
los sistemas y 0 ):
t = (t0 + vx0 /c2 )
x = (x0 + vt0 )
(2.42)
y = y0
z = z0

2.3.

Propiedades de las TL

Las ecuaciones de transformacin de Lorentz encontradas en la seccin


anterior, corresponden a un caso particular de un conjunto de transformaciones ms general, que constituyen la expresin matemtica del principio
de relatividad y de las propiedades de homogeneidad e isotropa del espacio
y el tiempo. En efecto, el conjunto de transformaciones de coordenadas ms
general se puede escribir en la forma:
0

x =

3
X

x + a ; , = 0, 1, 2, 3

(2.43)

=0

con y a constantes independientes de las coordenadas. Para simplificar


las expresiones hemos introducido la notacin
ct x0 ; x x1 ; y x2 ; z x3

(2.44)

32 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL


de tal manera que la coordenada temporal la medimos en unidades de longitud, dado el carcter de constante universal de la velocidad de la luz c. Esta
redefinicin de la coordenada temporal nos permite, como veremos ms adelante, escribir las transformaciones de Lorentz en una forma ms simtrica
y resaltar en forma explcita el papel de la coordenada temporal en la teora
de la relatividad. En lo sucesivo utilizaremos ndices griegos, que recorren
de 0 a 3, para describir las coordenadas de un evento y dejaremos los ndices
latinos para describir solamente las coordenadas espaciales.
Las ecuaciones de transformacin (2.43) constituyen un conjunto de
transformaciones lineales no homogneas, en donde las cuatro constantes
a corresponden a la arbitrariedad para elegir el origen de las coordenadas
espaciales ( = 1, 2, 3) y de la coordenada temporal ( = 0), y as representan la homogeneidad del espacio-tiempo. Esta propiedad de homogeneidad
del espacio y el tiempo, en trminos ms formales, se traduce en el principio de invarianza de la fsica bajo translaciones espaciales (ai ; i = 1, 2, 3) y
translaciones temporales (a0 ).
De sta forma, la invarianza de las leyes de la fsica bajo translaciones
espacio-temporales, nos permiten elegir las coordenadas de los dos sistemas
de referencia inerciales de tal manera que coincidan sus orgenes espaciales
para t = t0 = 0, haciendo que el trmino inhomogneo del sistema de ecuaciones (2.43) se anula, y en este caso las ecuaciones de transformacin se
reducen al sistema lineal homogneo
0

x =

3
X

, = 0, 1, 2, 3

(2.45)

=0

Este conjunto de transformaciones, contiene dos casos especiales: Por una


parte estn las rotaciones de los ejes espaciales, las cuales reflejan la isotropa
del espacio, es decir, que la leyes fsicas no deben depender de la orientacin
de los ejes espaciales. Una rotacin de los ejes espaciales queda determinada
por tres parmetros, por ejemplo, los tres ngulos de Euler. Por otra parte,
estn las llamadas transformaciones de Lorentz puras, caracterizadas por
las tres componentes de la velocidad relativa de los sistemas de referencia
inerciales.
As, las transformaciones de Lorentz deducidas en la seccin anterior,
constituyen un caso particular del conjunto de transformaciones (2.43), en
donde el movimiento relativo entre los sistemas de referencia es a lo largo
de un eje coordenado, con ejes espaciales paralelos (no hay rotacin de ejes)
y sin translacin de los orgenes espacial y temporal (Figura 2.3). En este
caso basta con un solo parmetro, la magnitud de la velocidad relativa, para

2.3. PROPIEDADES DE LAS TL

33

Figura 2.3: Transformacin general de coordenadas

determinar completamente la transformacin.

En el caso de general de una transformacin de coordenadas que involucre movimiento relativo, cambio de orientacin de los ejes espaciales
y translacin del origen de coordenadas espacial y temporal, se requieren
entonces 10 parmetros para determinar completamente la transformacin:
Los tres parmetros ai , i = 1, 2, 3 que determinan el cambio del origen espacial, un parmetro a0 para el desplazamiento del origen temporal, tres
parmetros (e.g. los ngulos de Euler) para determinar una rotacin de los
ejes espaciales y tres parmetros (e.g. las tres componentes de la velocidad relativa) para determinar una transformacin pura de Lorentz. Para los
objetivos del presente libro, salvo se especifique lo contrario, es suficiente
considerar solamente transformaciones de Lorentz puras con los ejes xx0 en
la direccin de la velocidad relativa de los sistemas de referencia y supondremos adems, que los orgenes de los sistemas coinciden para el tiempo
cero en ambos sistemas.
Antes de continuar con la discusin de algunas propiedades de las transformaciones de Lorentz, reescribamos las ecuaciones de transformacin (2.41)

34 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL

Figura 2.4: Composicin de transformaciones de Lorentz


en la notacin introducida en la ecuacin (2.44):
x00 = (x0 x1 )
x01 = (x1 x0 )
x02 = x2
x03 = x3

(2.46)

en donde se ha definido el parmetro adimensional = v/c y as (v) =


(1 2 )1/2 . Como se mencion al comienzo de esta seccin, las ecuaciones de
transformacin de Lorentz adquieren una forma simtrica en las coordenadas
espaciales y la temporal. As, los coeficientes de la transformacin de Lorentz
, llamados tambin elementos de la matriz de transformacin de Lorentz,
en la ecuacin (2.45) estn dados por:
00 = 11 =
= 10 =
2
2 = 33 = 1

01

(2.47)

siendo los dems coeficientes cero.


Consideremos ahora tres sistemas de referencia inerciales , 0 y 00 , con
ejes paralelos, movimiento relativo a lo largo del eje espacial x1 , y orgenes

2.3. PROPIEDADES DE LAS TL

35

espaciales coincidentes para t = t0 = t00 = 0 (Figura 2.4). Sea v la velocidad


del sistema de referencia 0 respecto a y w la velocidad del sistema 00
respecto a 0 , y sean (x0 , x1 , x2 , x3 ), (x00 , x01 , x02 , x03 ) y (x000 , x001 , x002 , x003 ) las
coordenadas de un evento fsico medidas por los tres observadores , 0 y 00 ,
respectivamente. La relacin entre las coordenadas del evento medidas por
y 0 estn dadas por la ecuacin (2.46) y la relacin entre las coordenadas
medidas por 0 y 00 estn dadas por las ecuaciones:
x000 = (w)(x00 0 x01 )
x001 = (w)(x01 0 x00 )
x002 = x02
x003 = x03

(2.48)

en donde 0 = w/c. Las ecuaciones de transformacin que relacionan las


coordenadas medidas por y 00 se obtienen entonces, componiendo las
dos transformaciones, es decir, remplazando las coordenadas del sistema 0
de la ecuacin (2.46), en esta ltima ecuacin (2.48). Despues de reagrupar
trminos, las ecuaciones de transformacin finales, como era de esperarse,
toman la misma forma:
x000 = (u)(x0 00 x1 )
x001 = (u)(x1 00 x0 )
x002 = x2
x003 = x3

(2.49)

en donde 00 = u/c y u es la velocidad relativa del sistema de referencia 00


respecto a , la cual est dada por la ecuacin
u=

w+v
1 + wv/c2

(2.50)

Esta ecuacin corresponde a la versin relativista del teorema de adicin


de velocidades de Galileo. Notemos si v < c y w < c entonces u < c.
Notemos que las ecuaciones de transformacin de Lorentz y el teorema
de adicin de velocidades se reducen a las ecuaciones de transformacin de
Galileo y al teorema de adicin de velocidades Galileano cuando c .
Este lmite formal, sin embargo, carece de significado fsico en la medida
que la velocidad de la luz en el vaco es una constante universal y por lo
tanto este lmite debe entenderse mejor en el siguiente sentido.
Para velocidades pequeas comparadas con la velocidad de la luz v c,
tanto las ecuaciones de transformacin de Lorentz, como el teorema de adicin de velociades, se reducen a las ecuaciones de transformacin de Galileo

36 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL


y al teorema de adicin de velocidades galileano, respectivamente. Para ver
esto, es suficiente recordar la expansin en serie de Taylor de la funcin
(1 + xr ) = 1 + rx +

r (r 1) 2
x +
2!

(2.51)

la cual converge para |x| < 1. Si aplicamos esta expansin al factor (v)
tenemos
1/2

v2
(v) =
1 2
c
1 v2
= 1+
+
(2.52)
2 c2
Remplazando esta expansin en las ecuaciones de transformacin de
Lorentz 2.41 obtenemos

1 v2
+ (x vt)
x =
1+
2 c2
2
v
= x vt + O 2
(2.53)
c

v
1 v2
+

x
t =
1+
2 c2
c2
2
v
= t+O
c2

(2.54)

en donde O v 2 /c2 representa trminos del orden de v 2 /c2 , los cuales son
muy pequeos si v/c << 1 y por lo tanto las ecuaciones de transformacin de Galileo corresponden a una aproximacin a vajas velocidades de las
ecuaciones de Lorentz. Un resultado similar se obtiene pata el teorema de
adicin de velociades.
Este lmite de bajas velocidades juega el papel de un principio de correspondencia, en el sentido de que la fsica Newtoniana es una teora vlida
para describir los fenmenos, cuando las velocidades tpicas involucradas en
los procesos bajo consideracin son bajas comparadas con la velocidad de
la luz y por lo tanto, las ecuaciones de la relatividad deben reducirse a las
correspondientes relaciones clsicas, en este lmite de velocidades bajas. Es
importante aclarar el significado de la frase validez de la fsica Newtonianas
para velocidades v << c. Dado que toda medida experimental de una cantidad fsica, lleva consigo un error experimental, entonces las predicciones

2.3. PROPIEDADES DE LAS TL

37

de la mecnica clsica para los diferentes observables de un sistema dado,


estn en concordancia con los resultados experimentales, dentro del rango
de error experimental. As, el lmite clsico, o el rango de velocidades para el
cual la mecnica clsica es aplicable, depende de la precisin experimental.
El lmite formal c se puede entender fcamente en el sentido que c
representa la vlocidad mxima de propagacin de seales fsicas, independientemente que esta constante corresponda a la velocidad de la luz en el
vaco, y por lo tanto si c esto significara que podemos enviar informacin a velocidad infinita, lo que implicara que tendramos a disposicin
un mecanismo instantneo para calibrar relojes, lo que implicara que todos
los observadores inerciales mediran la misma coordenada temporal para un
evento dado. As podemos entender la hiptesis de Newton de un tiempo
universal independiente del observador, como la hiptesis de una velocidad
infinita para transmitir informacin. Notemos adems que en efecto la tercera ley de Newton requiere de esta hiptesis, pues esta ley exige que las
fuerzas de accin y reaccin sean iguales en todo instante, independientemente de la posicin de los cuerpos que estn en interaccin.
Retomando las ecuaciones de transformacin (2.49), vemos que dos transformaciones de Lorentz sucesivas, conducen a una nueva transformacin de
Lorentz, cuyo parmetro (la velocidad relativa) est dado por la ecuacin
(2.50). Por otra parte, la transformacin de Lorentz inversa, es decir, las
ecuaciones de transformacin de coordenadas del sistema 0 al , tienen
la misma forma (ecuacin (2.46)), pero cambiando el parmetro v por v.
Adems, la transformacin identidad, esto es, del sistema sobre el mismo,
corresponde a una transformacin de Lorentz con parmetro v = 0, trivialmente. Si escribimos formalmente una transformacin de Lorentz entre y
0 , como
L(v) : 0
(2.55)
x x0 = L(v)x
entonces, las propiedades encontradas, las podemos fresumir formalmente
de la siguiente manera:
L(w) L(v) = L(u)
w+v
u =
1 + wv/c2
L(v = 0) = id L(0) L(v) = L(v) L(0) = L(v)

(2.56)
(2.57)
(2.58)

L1 (v) = L(v)

(2.59)

L(v) L(v) = L(v) L(v) = id

(2.60)

38 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL


en donde id significa la transformacin identidad, L1 (v) la transformacin
inversa, y el producto L(w) L(v) representa la composicin de dos transformaciones sucesivas.
Un grupo matemtico es un conjunto de elementos G, con una operacin interna llamada producto, es decir, el producto de dos elementos de G
es de nuevo un elemento del conjunto y esta operacin debe satisfacer las
siguientes propiedades:
i.-Existe un elemento del grupo G, llamado la identidad, tal que la identidad por cualquier elemento del grupo es el mismo elemento del grupo.
ii.-Para todo elemento del grupo, existe otro elemento en el grupo, tal
que su producto es la identidad.
Un grupo se llama abeliano, si la operacin producto es conmutativa. Las
relaciones simblicas representadas en las ecuaciones (2.56), (2.58), (2.59)
y (2.60), muestran que las transformaciones de Lorentz forman un grupo
matemtico, llamado el grupo de Lorentz. Para el caso particular que estamos considerando, esto es, de transformaciones entre sistemas de referencia
con ejes paralelos y movimiento relativo a lo largo del eje x, el grupo es
claramente abeliano, y cada elemento del grupo corresponde, o est caracterizado por el valor de la velocidad. Puesto que la velocidad puede tomar
cualquier valor entre c < v < c, el grupo contiene un nmero infinito no
numerable de elementos, y as este grupo es conocido en la literatura como
un grupo de Lie de un parmetro o grupo continuo, en contraposicin con
los grupos finitos o discretos, tales como por ejemplo, los nmeros enteros
con la operacin suma. El caso de las transformaciones generales, ecuacin
(2.43), energa forman un grupo, llamado el grupo de Poincar, el cual es
energa un grupo de Lie pero de diez parmetros, pues como vimos, una
transformacin general requiere de 10 parmetros para caracterizarla.
Otra propiedad muy importante de las TL, la cual va a jugar un papel
fundamental en el problema de la causalidad en fsica, es que las TL dejan
invariante una cantidad, que la llamaremos intervalo o distancia espaciotemporal entre eventos. Sean 1 y 2 dos eventos fsicos cualesquiera y sean
(x01 , x11 , x21 , x31 ) y (x02 , x12 , x22 , x32 ) las coordenadas de los dos eventos, medidas
por un observador inercial . Definamos el intervalo espacio-tiempo entre
los dos eventos por:
2
S12
:= (x02 x01 )2 (x12 x11 )2 (x22 x21 )2 (x32 x31 )2

(2.61)

Sea 0 otro observador inercial que se mueve con velocidad v respecto


01 02 03
00 01 02 03
a y sean (x00
1 , x1 , x1 , x1 ) y (x2 , x2 , x2 , x2 ) las coordenadas de los dos
0
eventos 1 y 2 medidas por . Entonces, para este nuevo observador, el

2.3. PROPIEDADES DE LAS TL

39

intervalo espacio-tiempo entre los dos eventos est dado por:


02
00 2
01
01 2
02
02 2
03
03 2
:= (x00
S12
2 x1 ) (x2 x1 ) (x2 x1 ) (x2 x1 )

(2.62)

Utilizando las TL (ecuaciones (2.46)) expresemos el intervalo espaciotiempo medido por 0 (ecuacin (2.62)), en trminos de las coordenadas del
observador :
02
= ((x02 x12 ) (x01 x11 ))2 ((x12 x02 )
S12

(x11 x21 ))2 (x22 x21 )2 (x32 x31 )2

(2.63)

reagrupando trminos obtenemos


02
2
= (x02 x01 )2 (x12 x11 )2 (x22 x21 )2 (x32 x31 )2 = S12
(2.64)
S12

Este resultado significa que el intervalo espacio-tiempo entre dos eventos


fsicos es una cantidad independiente del observador y as es un invariante
fsico, lo que implica que el valor numrico del intervalo es siempre el mismo,
sin importar cual observador lo mida. A las variables fsicas que son invariantes bajo transformaciones de Lorentz se les llama invariantes relativistas
o escalares de Lorentz, y claramente juegan un papel fundamental, pues al
ser independientes del observador, nos caracterizan propiedades intrnsecas
del sistema o de los fenmenos fsicos.
Las implicaciones fsicas, para el caso particular del intervalo espaciotiempo, sern discutidas en el prximo captulo con mayor detalle. Es im2
portante solamente resaltar en este punto dos aspectos: en primer lugar S12
puede ser positivo, negativo o cero, y en segundo lugar, el ltimo caso cuan2 es cero, corresponde a la expresin matemtica del principio de la
do S12
constancia de la velocidad de la luz, pues si desde el punto del espacio y en
el instante donde ocurre el primer evento, por ejemplo 1 , se emite un rayo
de luz en direccin del evento 2 , entonces este rayo de luz alcanza el punto
del espacio en el instante de tiempo, en que el segundo evento ocurre. Esto
se ve fcilmente, pues de la definicin del intervalo espacio-tiempo, ecuacin
(2.61) o (2.62), y recordando que x0 = ct, entoces despejando c de cualquiera
2 = 0 = S 02 ) implica que c =(distancia espade estas dos ecuaciones (S12
12
cial entre los eventos)/(intervalo temporal entre los eventos) es un invariante
relativista.
Es importante resaltar que el intervalo espacio-tiempo es invariante bajo las transformaciones generales de coordenadas (ecuacin (2.43)), y no
solamente bajo las transformaciones de Lorentz puras consideradas, pues
por una parte, el tmino inhomogneo de las transformaciones se cancela al

40 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL


tomar la diferencia de las coordenadas, mientras que las rotaciones de los
ejes espaciales dejan invariante la distancia espacial (ver seccin 4.1)
(x12 x11 )2 + (x22 x21 )2 + (x32 x31 )2

(2.65)

permaneciendo la coordenada temporal inanalterada.


Otra caracterstica importante que se deriva directamente de las TL, es
que las velocidades relativas entre sistemas de referencia inerciales, deben
ser siempre menores que la velocidad de la luz, pues el factor (v) diverge
para v = c y se hace imaginario si v > c, lo cual es inadmisible dado el
significado fsico asignado a las coordenadas utilizadas.

2.4.

Consecuencias de las TL

Para finalizar el presente captulo, vamos a considerar dos consecuencias


de las TL que constituyen, tal vez, los dos resultados ms sorprendentes de
la teora especial de la relatividad y por esta razn los ms conocidos en la
literatura de divulgacin cientfica.
Consideremos para comenzar el problema de la dilatacin temporal. En
primer lugar definamos el concepto de tiempo propio, como el intervalo de
tiempo entre dos eventos 1 y 2 , medido por un mismo reloj. Esto significa, equivalentemente, que existe un sistema de referencia inercial, llammolo , para el cual los dos eventos ocurren en el mismo punto del espacio.
As, las coordenadas de estos dos eventos para el observador estn dadas
por (x01 , x11 , x21 , x31 ) y (x02 , x12 , x22 , x33 ), con x02 x01 = c y xi2 = xi1 ; i = 1, 2, 3.
Suponiendo, sin prdida de generalidad, que el evento 2 ocurre despus que
el evento 1 para el observador , i.e. x02 > x01 , y como xi2 = xi1 ; i = 1, 2, 3,
pues los dos eventos por definicin, tienen lugar en el mismo punto del espacio, es claro que para cualquier otro observador inercial, por ejemplo 0 ,
los dos eventos suceden en puntos diferentes del espacio, y por lo tanto,
2 entre los dos evendada la invarianza del intervalo espacio-tiempo S12
0
tos, el intervalo de tiempo medido por para estos dos eventos, debe ser
mayor que el intervalo de tiempo propio. Para probar esta afirmacin, sean
01 02 03
00 01 02 03
0
(x00
1 , x1 , x1 , x1 ) y (x2 , x2 , x2 , x2 ) las coordenadas de estos eventos y t
0
el intervalo de tiempo medido en , con
00
ct0 = x00
2 x1

(2.66)

Utilizando las TL para remplazar en esta expresin las coordenadas primadas en trminos de las no primadas y aplicando la definicin de tiempo

2.4. CONSECUENCIAS DE LAS TL

41

propio, obtenemos
ct0 = (x02 x12 ) (x01 x11 )

(2.67)

y puesto que en sistema de referencia inercial los dos eventos suceden en


el mismo punto del espacio, i.e. x12 = x11 , llegamos finalmente a la ecuacin
de dilatacin temporal:

t0 = = p
1 v 2 /c2

(2.68)

pues el factor simpre es mayor que 1, para v 6= 0. De paso hemos demostrado, que si dos eventos ocurren para un observador en un mismo punto del
espacio, el orden temporal de los eventos (e.g. x02 x01 > 0) es el mismo
00
para todos los observadores, es decir si x02 x01 > 0 entonces x00
2 x1 > 0,
y el tiempo propio es el intervalo de tiempo ms pequeo medido por algn observador. Esto justifica el nombre de dilatacin temporal, y significa
fsicamente, que los dos eventos estn conectados causalmente, es decir, que
el evento posterior pudo ser causado por el primer evento, an cuando no
necesariamente exista un proceso fsico que los ligue. Notemos adems que
el intervalo de tiempo entre dos eventos puede hacerse tan grande como se
quiera, si tomamos velocidades suficientemente cercanas a la velocidad de la
luz, pues 1 < para 0 v < c, y por lo tanto dado > 0, entonces
t0 = puede hacerse tan grande como se quiera haciendo que v c.
Calculemos, ahora el intervalo espacio-tiempo para estos dos eventos. En
el sistema obtenemos la expresin
2
S12
= (x02 x01 )2 (x12 x11 )2 (x22 x21 )2 (x32 x31 )2 = c2 2 > 0 (2.69)

el cual nos indica, que para el caso que estamos considerando, el intervalo
espacio-tiempo nos mide directamente (salvo un factor constante c2 ) el intervalo de tiempo propio. Si calculamos este mismo intervalo, ahora en el
sistema de referencia 0 (ver ecuacin (2.62)), por su invarianza, obviamente
obtenemos el mismo resultado. Esto nos muestra, sin ulteriores clculos, que
el intervalo de tiempo en 0 debe ser mayor que en , pues a c2 t02 le estamos restando una cantidad positiva, que nos da la distancia espacial entre
los dos eventos medidos en el sistema 0 .
Cuando tiene sentido hablar del intervalo de tiempo propio entre dos
eventos?. Para responder a esta pregunta, consideremos dos eventos fsicos
2 entre ellos en algn
cualesquiera 1 y 2 y calculemos el intervalo S12
0
1
2
3
sistema de referencia inercial . Sean (x1 , x1 , x1 , x1 ) y (x02 , x12 , x22 , x32 ) las

42 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL


coordenadas de los eventos 1 y 2 respectivamente, y supongamos para
simplificar los clculos, pero sin perder generalidad del resultado, que x22 =
x21 y x32 = x31 , entonces:
2
= (x02 x01 )2 (x12 x11 )2
S12

(2.70)

Por lo tanto, si este intervalo es mayor que cero, esto significa que siempre
es posible encontrar un sistema de referencia inercial 0 , para el cual los dos
eventos ocurren en el mismo punto del espacio, as
2
00 2
2
2
S12
= (x00
2 x1 ) = c

(2.71)

pues, dadas las coordenadas de los dos eventos en , basta con considerar
un sistema de referencia 0 el cual se mueva con una velocidad v respecto a
dada por
x1 x11
v
(2.72)
= = 20
c
x2 x01

Para el caso que estamos considerando, la velocidad del sistema 0


est a lo largo del eje de las x y su direccin depende de la posicin relativa
entre los eventos (x12 x11 > 0 o x12 x11 < 0) en , y del orden temporal
entre ellos, es decir si x02 x01 > 0 o x02 x01 < 0 (ver ecuacin (2.72)).
Ahora bien, si el intervalo espacio-tiempo entre los eventos medido en algn
2 ,
sistema de referencia fuera menor o igual a cero, dada la invarianza de S12
es obvio que no existe un sistema de referencia para el cual los dos eventos
ocurran en el mismo punto del espacio, y por lo tanto, en este caso, no tiene
sentido hablar de tiempo propio entre los eventos. Adems, para esta ltima
situacin considerada, como lo veremos en seguida, el orden temporal entre
los eventos puede invertirse o ser simultneos para algunos observadores, lo
que implica fsicamente que los dos eventos no pueden estar causalmente
conectados, pues para que un evento fuera causa del otro, se necesitara
transmir informacin a una velocidad mayor a la de la luz.
La segunda consecuencia importante de las TL, se relaciona con la contraccin de longitudes. Para entender el significado fsico de este fenmeno,
definamos primero lo que se entiende por medir la longitud de un cuerpo. Consideremos el problema de medir la longitud de una varilla rgida.
Supongamos que para un observador inercial la varilla se encuentra en
reposo y elijamos el eje de las x a lo largo de la varilla. Por definicin, la
longitud de la varilla est dada por la diferencia de las coordenadas de los
extremos de la varilla:
(2.73)
L0 = x12 x11

2.4. CONSECUENCIAS DE LAS TL

43

en donde se ha supuesto, sin prdida de generalidad, que x12 > x11 . Esta
definicin es fsicamente consistente, puesto que la varilla est en reposo
para el observador . De la misma manera como definimos tiempo propio,
llamemos a L0 , definido en la ecuacin (2.73), longitud propia de la varilla.
En trminos generales, definimos la longitud propia de un cuerpo cualquiera,
como la longitud del cuerpo medida en el sistema de referencia, en el cual
el cuerpo se encuentra en reposo. El problema surge, cuando el cuerpo al
cual se le quieren medir sus dimensiones, est en movimiento. Consideremos
entonces, otro sistema de referencia 0 , el cual se mueve con velocidad v
respecto a y definamos la longitud de la varilla en 0 , como la diferencia
de las coordenadas de los extremos de la varilla en un instante dado t0 :
01
L = x01
2 x1

(2.74)

Esto significa, que el observador 0 mide simultneamente la posicin de


los extremos de la varilla, y define su longitud como la diferencia de las coordenadas espaciales de los dos eventos fsicos, cuyas coordenadas estn dadas
01
00 01
por (x00
1 , x1 , 0, 0) y (x2 , x2 , 0, 0). Para encontrar la relacin entre las medidas realizadas por los dos observadores, basta con aplicar las TL, teniendo
en cuenta que en el sistema 0 los eventos (coordenadas espacio-tiempo de
los extremos de la varilla) deben ser simultneos. As, de la ecuacin (2.73)
y de las TL inversas (ecuaciones (2.42)), tenemos
0
01
0
01
01
L0 = (x01
2 + t ) (x1 + t ) = (x2 x1 )

(2.75)

y aplicando la definicin (2.74) para la longitud de la barra medida por 0 ,


llegamos al resultado
p
(2.76)
L = L0 1 v 2 /c2

el cual esptablece que la longitud fsica p


en la direccin de movimiento de
un slido, se v contraida en un factor 1 v 2 /c2 con respecto a la longitud propia del slido, en donde v es la velocidad del cuerpo respecto al
observador inercial que mide su longitud. De las TL se ve directamente que
las dimensiones transversales al movimiento de un slido no se alteran en
virtud de su movimiento. Una consecuencia inmediata de este efecto de la
contraccin, es que en fsica relativista los conceptos de slido rgido y fluido incomprensible no son vlidos, en general. La ecuacin (2.76) la haban
postulado Fitzgerald y Lorentz para explicar el resultado negativo del experimento Michelson-Morley, pues si en brazo del interfermetro a lo largo
de la direccin de movimiento de la tierra se contrayese de acuerdo a esta
ecuacin, entonces se puede mostrar fcilmente que no apareceran franjas

44 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL


de interferencia, pues los caminos pticos de los dos rayos de luz seran
iguales. El problema con el razonamiento de Fitzgerald y Lorentz es que los
brazos del interfermetro estn en reposo respecto a la tierra, y por lo tanto
su longitud medida en la tierra, de acuerdo a la relatividad, es la longitud
propia y no debe aparecer contrada.
Estas dos primeras consecuencias de la teora de la relatividad, dilatacin temporal y contraccin de longitudes, a pesar de su caracter bastante
extrao a nuestra intuicin clsica, han sido corroboradas en varios experimentos. El primer experimento reportado, fue realizado por Rossi y Hall
(Rossi, B. & Hall, D. B., Phys. Rev., 59,223, 1941) utilizando unas partculas elementales, los muones , descubiertas en los rayos csmicos. La gran
mayora de las partculas elementales conocidas son inestables, es decir, que
estas partculas despus de haber sido producidas por algn proceso, decaen
expontneamente en otras partculas al cabo de un cierto tiempo, llamado
tiempo propio o tiempo de vida media de la partcula (este tiempo de vida
es caracterstico de cada clase de partcula). Por ejemplo, si producimos un
mun en reposo en el laboratorio, entonces pasados unos 2, 2 106 s
la partcula se desintegra en un electrn y en dos neutrinos. Los rayos csmicos son haces de partculas, fundamentalmente protones y electrones de
alta energa, los cuales al incidir sobre las capas superiores de la atmsfera
terrestre, producen toda una serie de partculas elementates, entre otras, los
muones, los cuales viajan hacia la tierra con velocidades muy cercanas a la
de la luz: v 0,994c. Estos muones se producen a una altura del orden de
los 2000m, y se detectan sobre la superficie de la tierra. Clsicamente, se
espera que estos muones se desintegren antes de llegar a la superficie terrestre, pues a la velocidad de 0,994c en un tiempo de vida de 2, 2 106 s
alcanzan a avanzar escasamente unos 656m. Dado que para un observador
ligado a la tierra los dos eventos, se crea el mun y luego se detecta, ocurren
en puntos diferentes del espacio, mientras que para un observador ligado al
mun los dos eventos ocurren en el mismo punto del espacio, y por lo tanto,
el intervalo de tiempo medido por este ltimo observador es un tiempo propio, entonces, para el observador terrestre, el tiempo entre los eventos debe
estar dilatado en un factor
p
(2.77)
1/ 1 v 2 /c2 9

de acuerdo con la ecuacin (2.68). As, para el observador en reposo con


respecto a la tierra el mun alcanza a sobevivir un tiempo del orden de
t 2 105 s antes de desintegrarse y por lo tanto, puede recorrer un
espacio aproximado de d = vt 6,000m, antes de desintegrarse, lo que
significa que los mesones si pueden alcanzar la superficie terrestre antes de

2.4. CONSECUENCIAS DE LAS TL

45

que ellos decaigan en otras partculas. Dado que la llegada de los muones a
la superficie terrestre es un hecho fsico, a esta misma conclusin debe llegar
cualquier otro observador inercial. Por ejemplo, consideremos el observador
ligado a la partcula. Puesto que para l la partcula se encuentra en reposo,
su vida media no se ve dilatada y por lo tanto el mun se desintegra al
cabo de 2, 2 106 s. Pero ahora, es la tierra la que se mueve hacia l,
con una velocidad de v = 0,994c y la distancia a la superficie tierrestre,
desde
el lugar donde se producen los muones, se ve contraida en un factor
p
1 v 2 /c2 0,11 de acuerdo con la ecuacin (2.76) y por lo tanto la
superficie de la tierra se encuentra a una distancia de 0, 112,000m = 220m,
la cual es lo suficientemente corta para que la superficie de la tierra llegue
hasta el punto en el cual se encuentra el mun, antes que este se desintegre.
Esta aparente asimetra en el anlisis de un fenmeno fsico, visto por
dos observadores inerciales (en un caso el efecto considerado es la dilatacin temporal, mientras que para el otro observador es la contraccin de
longitudes), no est en contradiccin con el principio de relatividad, pues
este principio lo que establece es la invarianza de las leyes fsicas para observadores inerciales. En efecto, dos observadores pueden medir diferentes
trayectorias, longitudes, intervalos de tiempo, energas cinticas, etc., pero
las leyes que rigen la dinmica de los sistemas si deben ser las mismas.
Es importante resaltar este aspecto, pues es frecuente caer en aparentes
paradojas cuando se aplica el principio de relatividad. De hecho se han construido muchos ejemplos, llamados en fsica gedanken Experimenten, que
ilustran esta situacin y que constituyen un buen ejercicio para comprender
mejor los fenmenos relativistas. Un clsico ejemplo es el de un carro de
longitud propia L0 y un garaje de menor longitud propia d0 con d0 < L0 .
Supongamos que el carro se dirige hacia el garaje con una velocidad v suficiente, para que su longitud medida porpun observador en reposo con respecto
al garaje sea menor que d0 , esto es L0 1 v2 /c2 < d0 . Entonces, un observador en reposo respecto al garage planea atrapar al carro dentro del garaje
y calcula cerrar la puerta de ste, tan pronto la trompa del carro alcance la
pared del fondo. Para el observador que viaja con el carro, es el garaje el que
aparece contraido y por lo tanto, para l es imposible que lo atrapen dentro
del garaje, pues cuando la pared toque la punta del carro, el observador del
garaje no puede cerrar la puerta. Claramente este anlisis es contradictorio, pues desde el punto de vista fsico si el carro puede ser atrapado por
un observador, este debe ser atrapado por todos, o lo contrario, es decir no
es atrapado por ninguno. La solucin a esta aparente paradoja reposa en
el hecho que la simultaneidad no es un concepto absoluto como hemos visto. Cuando el observador ligado al garage cierra la puerta simultneamente

46 CAPTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL


cuando la trompa del carro alcanza a la pared, para el observador en el carro,
primero llega la trompa a la pared, y luego, se cierra la puerta.

Captulo 3

La estructura causal del


espacio-tiempo
3.1.

Introduccin

En este captulo definiremos la estructura causal del espacio-tiempo. En


la primera parte se har una breve discusin sobre transformaciones lineales que dejan invariante la distancia euclideana (rotaciones) con el fin de
motivar la estructura Minkowskiana del espacio-tiempo y el concepto de
cuadri-vector. En la parte final se deducirn las transformaciones de Lorentz
a partir de la invarianza del intervalo espacio-tiempo entre dos eventos y se
discutar la estructura causal del espacio-tiempo.

3.2.

Rotaciones en el plano euclideano

Consideremos el plano euclideano

R2 := x = (x1 , x2 ) | xi R; i = 1, 2

y el conjunto de transformaciones lineales del plano euclideano sobre si mismo:


(3.1)
T : R2 R2 ; x x0 = T x
tal que dejen invariante la norma euclideana, definida por
2

x :=

2
X

ij xi xj = (x1 )2 + (x2 )2

i,j=1

47

(3.2)

48CAPTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO


es decir,
x0 = T x

x02 = x2

(3.3)

En la ecuacin (3.2) se ha definido el smbolo de Kronecker ij (o tensor


mtrico euclideano) por:

0 si i 6= j
(3.4)
ij :=
1 si i = j
Dado que T es una transformacin lineal de R2 en R2 la podemos escribir
como
2
X
aji xi = aji xi
(3.5)
x0j =
i=1

aji

son constantes. En la ltima igualdad hemos


en donde los coeficientes
introducido la convencin de suma de Einstein, en donde se asume una
suma en todo factor en el cual aparezcan dos ndices repetidos, uno como
subndice y el otro como suprandice y la suma se realiza sobre el rango
de valores que tome el ndice. Busquemos entonces la forma ms general
de estos coeficientes que representen una transformacin lineal y que dejen
invariante la distancia euclideana. Para este fin remplacemos en la ecuacin
(3.3) la transformacin lineal (3.5):
ij ajk ail xk xl = ij xi xj = x2 = x2 = ij xi xj

(3.6)

Identificando los coeficientes de las correspondientes coordenadas, obtenemos el siguiente conjunto de ecuaciones acopladas para los coeficientes:
a211 + a221 = 1

(3.7)

a212 + a222 = 1

(3.8)

a11 a12 + a21 a22 = 0

(3.9)

Adems, dado que T es una transformacin lineal de R2 en R2 , y por lo


tanto T x = 0 solo si x = 0, entonces el determinante de la transformacin
debe ser diferente de cero
a11 a22 a12 a21 6= 0

(3.10)

Como el sistema de ecuaciones tiene cuatro incognitas podemos encontrar tres de llas en trminos de la restante, o equivalentemente podemos
despejar las cuatro incognitas en funcin de un parmetro. Si llamamos a

3.2. ROTACIONES EN EL PLANO EUCLIDEANO

49

este parmetro y lo definimos como a11 := cos(),directamente se pueden


despejar los dems coeficientes para obtener:
a11 = a22 = cos();

a12 = a21 = sin()

(3.11)

Con esto podemos escribir explcitamente las ecuaciones de transformacin en la forma:


(3.12)
x01 = x1 cos() + x2 sin()
x02 = x2 cos() x1 sin()

(3.13)

Es de anotar que en el proceso de despejar los coeficientes tenemos que


escoger un signo, pues de la ecuacin (3.7), al despejar a21 en trminos de a11
surge una raz. La escogencia hecha de la raz positiva nos conduce a que el
determinante de los coeficientes tome el valor +1, que para el caso de haber
tomado la raz negativa nos hubiera dado el valor del determinante igual a
1. Que el determinante de los coeficientes de la transformacin lineal T es
1 se puede obtener directamente de las propiedades de las transformaciones
que dejan invariante la norma euclideana de un vector, pues si representamos
los puntos (vectores) de x R2 por matrices columna
1
x
x=
(3.14)
x2
entonces, la norma al cuadrado (ecuacin (3.2)) se puede escribir como:

1 1
1
x1
x
x
2
2
(3.15)
x = x x
=
= x x
2
2
x
x
x2

donde significa la transpuesta de la matriz. De esta forma, la invarianza


bajo la transformacin lineal T de la norma se puede escribir de la siguiente
forma:
(3.16)
x x = x0 x0 = (T x) (T x) = x T T x
lo que implica que la matriz de transformacin debe satisfacer la condicin
TT = 1

(3.17)

que fcilmente se ve que conduce al mismo sistema de ecuaciones para los


coeficientes de la matriz T . Toda transformacin (o matriz) que satisfaga la
ecuacin anterior (3.17) se llama ortogonal, y fcilmente se ve que bajo una
tal transformacin, tambin se preservan los ngulos entre los vectores del
plano euclideano, pues
x0 y0 x0 y0 = (T x) T y = x T T y = x y = x y

(3.18)

50CAPTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

Figura 3.1: Rotacin de los ejes en el plano euclideano


Tomando el determinante en la ecuacin (3.17) y teniendo en cuenta que
det T = det T , obtenemos el resultado general que:
| det T |2 = 1 = | det T |= 1

(3.19)

Este resultado tiene una interpretacin geomtrica que veremos enseguida (ver Figura 3.1).
Si hacemos una rotacin de los ejes coordenados x, y por un ngulo y en
sentido contrario a las agujas del reloj, las componentes de un vector de R2
se transforman como en la ecuacin (3.5) y claramente dejan la norma del
vector invariante. Este resultado muestra entonces, que la transformacin
lineal que deja invariante la norma de un vector en R2 queda determinada por un solo parmetro y puesto que es equivalente a una rotacin de
los ejes, podemos escoger como parmetro el ngulo de rotacin . De esta
forma podemos escribir T () para representar esta transformacin lineal.
Adems, si realizamos dos transformaciones (rotaciones) sucesivas T () y
T (), la primera en un ngulo y la segunda en un ngulo , entonces la
transformacin compuesta T () T () es equivalente a una sola transformacin en un ngulo + . Adicionalmente, la transformacin inversa de T ()
es equivalente a la transformacin por un ngulo y la transformacin

3.3. CUADRI-VECTORES Y EL GRUPO DE LORENTZ

51

identidad corresponde a la rotacin en un ngulo cero. Resumiendo


T () T () = T ( + )

(3.20)

T 1 () = T ()

(3.21)

T (0) = 1

(3.22)

Estas ecuaciones definen un grupo matemtico, llamado el grupo de rotaciones del plano. Dado que las transformaciones estn determinadas por un
nico parmetro , que vara continuamente de 0 a 2, el grupo se llama
continuo o grupo de Lie de un parmetro.

3.3.

Cuadri-vectores y el grupo de Lorentz

Definamos el espacio cuadridimensional de cuadri-vectores como:


M : = {x = (x0 , x1 , x2 , x3 ) R4 | x y :=
producto interno M inkowskiano}

(3.23)

en donde el producto interno Minkowskiano est definido como


x y := x0 y 0 x1 y1 x2 y 2 x3 y 3 = x y

(3.24)

En la ltima igualdad hemos hecho uso de la convencin de suma de Einstein,


en la cual los ndices griegos repetidos toman los valores 0, 1, 2, 3 y como es
usual en relatividad, el ndice 0 corresponde a la componente temporal del
cuadri-vector. Los elementos de matriz , llamados las componentes del
tensor de Minkowski (nombre que se justificar cuando veamos tensores),
estn definidos por

6=
0 si
1 si
==0
(3.25)
:=

1 si = = 1, 2, 3
El producto interno definido por la ecuacin (3.24) induce entonces una
norma
x2 := x x = (x0 )2 (x1 )2 (x2 )2 (x3 )2 = x x

(3.26)

Definamos una Transformacin de Lorentz (TL) como una transformacin lineal


L : M
M
(3.27)
,
x 7 x = Lx

52CAPTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO


tal que deje invariante el producto interno Minkowskiano x y, esto es
x, y , = x y

(3.28)

Para encontrar la forma general de una transformacin de Lorentz, utilicemos primero el hecho que cualquier transformacin lineal la podemos
escribir en la forma
(3.29)
x, = x
en donde los coeficientes conforman la matriz de transformacin de
Lorentz. Remplazando la ecuacin (3.29) en (3.28) y comparando coeficientes, obtenemos las condiciones que deben cumplir los elementos de la
matriz de Lorentz:
(3.30)
=
Esta ecuacin la podemos escribir en forma equivalente, como el siguiente
sistemas de ecuaciones:
(00 )2
(0k )2

3
X
(i0 )2 = 1
i=1

3
X
(ik )2 = 1;

i=1

(3.31)

= 0;

k = 1, 2, 3
6=

(3.32)
(3.33)

Este sistema de ecuaciones es general y contiene todas las posibles transformaciones entre sistemas de coordenadas que dejan invariante el producto
punto Minkowskiano. Estas transformaciones las podemos dividir en tres
categoras: La primera corresponde a las rotaciones de los ejes espaciales,
dejando la coordenada temporal inmodificada y forman el llamado grupo de
rotaciones. este grupo representa el hecho que el espacio fsico es isotrpico.
Claramente una rotacin espacial queda determinada por tres parmetros,
por ejemplo los tres ngulos de Euler. La segunda categora la constituye la
operacin de inversin de los ejes espaciales y el temporal. La ltima categora, que es la de inters para nosotros, la conforman las transformaciones
puras de Lorentz, que representan el cambio entre sistemas de referencia inerciales, manteniendo tanto los ejes espaciales paralelos (no hay rotaciones
espaciales) as como el sentido de los ejes espaciales y el temporal (sin inversin de ejes). Este grupo de transformaciones es conocido en la literatura
como las boost de Lorentz , las cuales quedan completamente determinadas por tres parmetros, que pueden ser escogidos para que corresponden
a las tres componentes de la velocidad relativa de los sistemas de referencia.

3.3. CUADRI-VECTORES Y EL GRUPO DE LORENTZ

53

Antes de continuar desarrollando este ltimo grupo de transformaciones,


es importante aclarar que el conjunto de transformaciones que dejan invariante el producto punto Minkowskiano es ms general que el dado en
la ecuacin (3.29), pues es inmediato ver que bajo una translacin de los
ejes epacio-temporales la invarianza del producto punto se mantiene. Estas tranformaciones representan la homogeneidad del espacio-tiempo, o en
otros trminos, la arbitrariedad de la eleccin del origen de coordenadas.
Esta transformacin queda determinada por cuatro parmetros (las cuatro
componentes del cuadri-vector translacin) y podemos entonces escribir la
transformacin de coordenadas ms general como
x, = x + a

(3.34)

llamada transformacin de Lorentz inhomognea. Estas transformaciones


generales constituyen el grupo de Poincare de diez parmetros: Tres ngulos
de rotacin + tres componentes de la velocidad relativa + cuatro desplazamientos. El grupo de Poincare es el grupo de simetrias fundamental de la
fsica y representa la expresin matemtica del principio de relatividad y de
las propiedades bsicas del espacio y el tiempo, esto es, de la homogeneidad e isotropa del espacio fsico tridimensional y su estructura geomtrica
euclideana y de la homogeneidad e isotropa del tiempo.
Restrinjmonos ahora solamente a las boost de Lorentz y consideremos
un sistema de referencia inercial 0 que se mueve con velocidad constante v
respecto al sistema inercial a lo largo del eje x1 y con los ejes espaciales
paralelos. Entonces, dado que en este caso x02 y , = y x2 y x03 z , =
z x3 , la matriz de transformacin de Lorentz se reduce a:
0

0 01 0 0
10 11 0 0

=
(3.35)
0
0 1 0
0
0 0 1
y las relaciones (3.31), (3.32) y (3.33), toman la forma:
(00 )2 (10 )2 = 1

(3.36)

(01 )2 (11 )2 = 1

(3.37)

00 01 10 11 = 0

(3.38)

que es un sistema de tres ecuaciones con cuatro incgnitas y as, los coeficientes por determinar, quedan dados en trminos de un parmetro:

54CAPTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO


la velocidad relativa v entre los sistemas de referencia y 0 . Teniendo en
cuenta que las coordenadas del origen del sistema 0 , medidas en el sistema
estn dadas por (x0 , vc x1 , 0, 0) y que bajo una T.L. se transforman a las
coordenadas (x,0 , 0, 0, 0) en 0 , obtenemos la ecuacin:
v
0 = 10 x0 + 11 x1 = 10 x0 + 11 x0
c
v
10 = 11
c

=
(3.39)

Entonces, el sistema de ecuaciones (3.36), (3.37) y (3.38) tiene solucin


nica y est dada por:

0 0

0 0

=
0
0
1 0
0
0
0 1

(3.40)

en donde
1
= (v) := q
1
v
= (v) :=
c

v2
c2

(3.41)
(3.42)

Escribiendo explcitamente el sistema de ecuaciones de transformaciones


de Lorentz,
(3.43)
x,0 = (x0 x1 )
x,1 = (x1 x0 )

(3.44)

x,2 = x2

(3.45)

x,3 = x3

(3.46)

vemos la extrecha relacin formal con la ecuacin (3.13) (rotacin de los ejes
x1 y x2 ).
No es dificil ver que podemos interpretar formalmente una transformacin de Lorentz, como una rotacin en el plano complejo de los ejes (ict, x) en
un ngulo complejo. Para este fn definamos el parmetro por la siguiente
ecuacin:
v
(3.47)
tanh := =
c

3.4. CONOS DE LUZ Y RELACIONES DE CAUSALIDAD

55

en donde tanh es la tangente hiperblica. Con esta definicin, y utilizando


las identidades para las funciones hiperblicas, tenemos que:
cosh = (v);

sinh =

v
(v);
c

(3.48)

Con esta deficin (ecuacin (3.47)) y las relaciones (3.48) las ecuaciones
de transformacin de Lorentz se pueden escribir en la forma:
x,0 = x0 cosh x1 sinh

(3.49)

x,1 = x1 cosh x0 sinh

(3.50)

x,2 = x2

(3.51)

x,3 = x3

(3.52)

Recordando la relacin cosh = cos(i), vemos la estrecha relacin entre


las rotaciones de los ejes coordenados y las transformaciones de Lorentz. Otra
ventaja que tiene expresar las transformaciones de Lorentz en trminos del
parmetro , es la expresin para el teorema de adicin de las velocidades,
pues dos transformaciones de Lorentz sucesivas, con parmetros tanh 1 =
v1 /c y tanh 2 = v2 /c, corresponden a una transformacin de Lorentz con
parmetro = 1 +2 , pues, de la identidad trigonomtrica para la tangente
de la suma de dos ngulos, tenemos:
tanh = tanh(1 + 2 )
tanh 1 + tanh 2
=
1 + tanh 1 tanh 2
v1 /c + v2 /c
=
1 + v1 v2 /c2
v
=
c

(3.53)

la cual coincide con la ecuacin (2.50).

3.4.

Conos de luz y relaciones de causalidad

Puesto que el cuadrado la norma de todo cuadri-vector (c-v) es un invariante relativista y esta norma no es definida positiva, podemos clasificar a
los c-v en en tres grupos disyuntos: Dado un c-v x M, definimos:
1. si x2 > 0 el c-v se llama como de tiempo

56CAPTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO


2. si x2 < 0 el c-v se llama como de espacio
3. si x2 = 0 el c-v se llama como de luz
Un c-vector x como de tiempo, cuya primera componente es mayor que
cero, x0 > 0, se llama dirigido al futuro, mientras que si x0 < 0 se llama
dirigido al pasado.
Para entender el significado fsico de esta clasificacin y sus consecuencias, consideremos dos eventos fsicos, por ejemplo el decaimiento de un ncleo radiactivo de uranio, situado en el origen de coordenadas (x01 , x11 , x21 , x31 ) =
(0, 0, 0, 0) para un observador y la fisin de otro ncleo de uranio, situado
en las coordenadas (x02 , x12 , x22 , x32 ) (ct, x, y, z) medidas por el observador .
Calculemos entonces el intervalo espacio-temporal entre estos dos eventos:
S 2 = (x02 x01 )2 (x12 x11 )2 (x22 x21 )2 (x32 x31 )2
= c2 t2 x2 y 2 z 2

(3.54)

Consideremos primero el caso S 2 > 0 (sin prdida de generalidad


tomemos t > 0), y supongamos que en el instante t = 0, en el cual ocurre el
primer evento y desde el origen de coordenadas, se enva una seal luminosa
que viaja en la direccin
p del segundo evento. Puesto que la distancia espacial
entre los eventos es x2 + y2 + z 2 , el tiempo t0 , que tarda en llegar el rayo
de luz al punto del espacio donde el ncleo se fisiona es menor que t, pues
de la relacin S 2 > 0 se sigue que
t2 >

x2 + y2 + z 2
= t20
c2

(3.55)

Esto significa que es posible que el primer evento, la desintegracin del ncleo, pueda ser causa del segundo evento, la fisin del otro ncleo. Si hubieramos supuesto que t < 0 la conclusin es la misma, solo que en este caso la
fisin del ncleo pudo ser la causa de la desintegracin del otro. El resultado
general que se desprende de este anlisis es que eventos, cuya separacin
o intervalo espacio-temporal es mayor que cero, son eventos causalmente
conectados (lo que no significa necesariamente que uno de ellos sea causa
del otro), y por lo tanto, la sucesin temporal de eventos causalmente conectados es la misma para todos los observadores. Adems, puesto que S 2 > 0,
notemos que siempre es posible encontrar un sistema de referencia 0 para
el cual los dos eventos ocurren en el mismo punto del espacio, pues basta
con elegir la velocidad de este sistema igual a
r
x2 + y 2 + z 2
(3.56)
v=
t2

3.4. CONOS DE LUZ Y RELACIONES DE CAUSALIDAD

57

en la direccin apropiada (a lo largo de la lnea que une a los dos eventos,


tomndola como el eje de las x) y haciendo una transformacin de Lorentz,
obtenemos que las coordenadas de los dos eventos en este sistema de referencia 0 son (0, 0, 0, 0) y (ct0 , 0, 0, 0), y por lo tanto
S 2 = c2 t2 x2 y 2 z 2 = c2 t02

(3.57)

Recordando la definicin de tiempo propio, como el intervalo de tiempo


medido en un sistema de referencia para el cual los dos eventos ocurren en
el mismo punto del espacio, vemos que el intervalo espacio-temporal para
eventos como de luz, nos da una medida directa del tiempo propio entre los
eventos, sin necesidad de encontrar el sistema de referencia para el cual los
dos eventos ocurren en el mismo punto del espacio. As podemos adoptar la
siguiente definicin general de tiempo propio:
Si S 2 > 0 para dos eventos, definimos , intervalo de tiempo propio,
como:
r
S 2
(3.58)
:=
c2
En el segundo caso, para eventos como de luz donde S 2 = 0, obtenemos una conclusin similar al caso anterior, en cuanto a que los eventos
estn conectados causalmente, solo que para este caso, el fotn que se enva
desde el primer evento en la direccin del segundo, llega en el mismo instante
en que ocurre el segundo evento y en este caso no tiene sentido hablar de
tiempo propio entre los eventos, pues no es posible encontrar un sistema de
referencia para el cual los dos eventos ocurran en el mismo punto del espacio
(x02 + y02 + z 02 = 0), sin que se viole la invariancia de S 2 = 0, salvo
en el caso trivial que tambin fuera t02 = 0, caso en el cual los dos eventos
ocurren en el mismo punto del espacio-tiempo para todos los observadores.
Para el ltimo caso, de eventos como de espacio S 2 < 0, encontramos,realizando un anlisis similar a los anteriores, que el fotn enviado
desde el primer evento hacia el segundo, siempre llega despus que el evento
ha tenido lugar. As no es posible que un evento sea causa del otro y en
este caso se habla de eventos causalmente desconectados. De la expresin
para S 2 se obtiene que siempre es posible encontrar un sistema de referencia para el cual los eventos ocurren simultneamente, pero, lgicamente, en
puntos separados del espacio. Adems, la sucesin temporal de los eventos
depende del observador, es decir, si para un observador inercia dos eventos P1 y P2 causalmente desconectados (i.e. como de espacio) son tales que
t1 < t2 , entonces existen observadores inerciales, e.g. , tal que t1 > t2 .

58CAPTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

Figura 3.2: Estructura causal del espacio-tiempo


Esta clasificacin de eventos divide al espacio-tiempo en cinco regiones
disyuntas. Dado un evento p , el cual lo podemos ubicar sin prdida de
generalidad en el origen de coordenadas de un sistema de referencia , el
conjunto de eventos con coordenadas (ct, x, y, z), medidas en , que satisfacen la relacin
(3.59)
S 2 = c2 t2 x2 y 2 z 2 = 0
definen el llamado cono de luz del evento p ubicado en el origen de coordenadas. La razn de llamarse cono de luz surge cuando dibujamos estos
puntos en un grfico tridimensional, (ct, x, y) como se ve en la (Figura 3.2).
Los eventos con coordenadas tales que:
S 2 = c2 t2 x2 y 2 z 2 > 0

ct > 0

(3.60)

forman el futuro causal de p y aquellos con ct < 0 el pasado causal, esto


significa, que todos los eventos situados dentro del cono de luz de p estn
causalmente conectados con p y pueden ser causados por el evento p (futuro
causal) o pueden ser causa de p (pasado causal). Todos los dems eventos,
es decir aquellos para los cuales se cumple la relacin
S 2 = c2 t2 x2 y 2 z 2 < 0

(3.61)

3.5. ALGEBRA DE CUADRI-VECTORES

59

Figura 3.3: Lineas de universo de partculas fsicas


conforman la regin como de espacio de eventos causalmente desconectados
con el evento p.
Esta forma de representar los eventos en un grfico espacio-temporal, nos
permite visualizar fcilmente muchos procesos fsicos como veremos en varios
ejemplos a lo largo del texto. Un primer resultado que podemos obtener,
sin necesidad de recurrir a clculos explcitos, es que la trayectoria de una
partcula material representada en un grfico espacio-tiempo, siempre tiene
que estar dentro del cono de luz de cada uno de los puntos (eventos) de la
trayectoria y la trayectoria de un fotn (rayo de luz) siempre est sobre el
cono de luz de cada uno de los puntos de su trayectoria (ver Figura 3.3).

3.5.

Algebra de cuadri-vectores

En esta seccin veremos algunas propiedades de carcter matemtico


de los c-v, que se desprenden directamente de la definicin de la mtrica
Minkowskiana, sin necesidad de recurrir a interpretaciones fsicas, pero que
van a ser de mucha utilidad para entender algunos resultados de la teora
de la relatividad.
El espacio cuadridimensional de cuadri-vectores M, admite una estruc-

60CAPTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO


tura de espacio vectorial con la suma de c-v y el producto de un escalar (los
reales) por un c-v definidos como:
x, y M

x + y = (x0 , x1 , x2 , x3 ) + (y0 , y 1 , y 2 , y3 )
0

(3.62)
3

= (x + y , x + y , x + y , x + y )
x = (x0 , x1 , x2 , x3 ) := (x0 , x1 , x2 , x3 )

(3.63)

o en forma equivalente, utilizando la notacin con ndices:


(x + y) = x + y

(3.64)

(x) = x

(3.65)

De la definicin del producto interno invariante de Lorentz y por las


propiedades del lgebra vectorial definida, se obtienen las siguientes propiedades
del producto interno:
Proposicin 4.1 El producto interno Minkowskiano satisface las siguientes propiedades:
xy =yx
x (y + z) = x y + x z

(3.66)

x (y) = (x) y = (x y) x, y, z M R
Su demostracin es directa a partir de la definicin del producto punto
Minkowskiano (3.24) y del lgebra de vectores definida por las ecuaciones
(3.62) y (3.63). Veamos, como ejemplo del mtodo de demostracin, solamente la segunda propiedad. De las definiciones de producto interno y suma
de c-v en notacin de componentes, tenemos:
x (y + z) = x (y + z)

= x (y + z )
= x y + x z
= xy+xz

como queriamos probar.


Corolario 4.2 x, y M se cumplen las siguientes identidades:
(x y)2 = x2 + y 2 2xy

(3.67)

3.5. ALGEBRA DE CUADRI-VECTORES


(x + y)2 + (x y)2 = 2(x2 + y 2 )

61
(3.68)

(x + y) (x y) = x2 y2

Estas identidades se deducen directamente de la Proposicin 4.1 anterior.


Podemos extender formalmente, la definicin de vectores ortogonales de
espacios vectoriales reales con producto interno definido positivo, al caso de
c-vectores por medio de la relacin x y = 0, la cual por ejemplo hace que
todo vector como de luz sea ortogonal a si mismo, pues x2 = xx = 0.
Nota 4.1 Dado un c-v cualquiera x M, con x = (x0 , x1 , x2 , x3 ),
a la primera componente del c-v se le llama temporal y a las otras tres
componentes espaciales, justificando de esta forma la notacin x = (x0 , x).
Entonces, de la definicin del producto interno de c-v, la norma de un
c-v la podemos escribir como
x2 = (x0 )2 | x |2

(3.69)

con x R3 y | x | la norma usual ( euclideana) de R3 .


Otras propiedades de inters de los cuadri-vectores son las siguientes:
Proposicin 4.2 Si x, y M son c-v como de luz, entonces los vectores
x + y y x y son mutuamente ortogonales y tienen normas opuestas.
Para demostrar la ortogonalidad, basta con utilizar la ltima de las ecuaciones (3.68), pues
(x + y) (x y) = x2 y 2 = 0

(3.70)

dado que los c-vectores x y y son como de luz, i.e. x2 = 0 y y 2 = 0. De


esta ltima propiedad y de la primera de las ecuaciones (3.68) se obtiene
tambin, que sus normas son opuestas:
(x + y)2 = x2 + y2 + 2x y = 2x y

(3.71)

(x y)2 = x2 + y 2 2x y = 2x y

(3.72)

Proposicin 4.3 Dos c-v x, y M como de luz y mutuamente ortogonales x y = 0 son proporcionales entre si, i.e. x = y.
Para la demostracin basta con tener en cuenta, por hiptesis, las siguientes relaciones,
(3.73)
0 = xy = x0 y0 x y
0 = x2 = (x0 )2 | x |2
0 = y 2 = (y0 )2 | y |2

(3.74)
(3.75)

62CAPTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO


Entonces, de las propiedades del producto interno euclideano para las
componentes espaciales de cualquier c-v sabemos que xy =| x || y | cos x y,
y as obtenemos de las anteriores relaciones que
x y = x0 y0 = (| x |2 )1/2 (| y |2 )1/2

cos x y = 1

(3.76)

lo cual significa que las componentes espaciales son paralelas y as proporcionales, es decir x = y. Ahora, de la relacin x = y y remplazndola en
la ecuacin (3.73) se obtiene:
0 = xy = x0 y0 x y = x0 y0 | x |2

(3.77)

Teniendo en cuenta que (x0 )2 =| x |2 (relacin (3.74)), entonces


0 = x0 y 0 (x0 )2 = x0 (y 0 x0 )

(3.78)

Como el c-v x es como de luz se debe cumplir que x0 6= 0 y por lo tanto


la ecuacin anterior implica que y 0 = x0 , de donde se deduce que los c-v x
y y son proporcionales:
y = x
(3.79)
como se quera probar.
Nota 4.2 La relacin
(x + y) (x y) = x2 y 2

(3.80)

nos permite construir c-v ortogonales a partir de dos c-v cualesquiera x y y


de igual norma.
Proposicin 4.4 Todos los c-v x M, ortogonales a un c-v z como de
tiempo, son como de espacio y forman un subespacio tridimensional como
de espacio.
Para su demostracin consideremos primero que, si
xz = 0 x0 z 0 = x z

(3.81)

entonces, como z = (z 0 , z) es como de tiempo, se debe cumplir que z 0 6= 0


y (z 0 )2 >| z |2 y por lo tanto
0 0
x z
|x z|
|x z|
=
<
(3.82)
|z 0 |
|z 0 |
(z 2 )1/2
Elevando al cuadrado ambos lados de esta desigualdad
0 0 2
x z
|x z|2
x2 z 2
0 2
=
(x
)
<

= x2
|z|2
|z|2
|z 0 |2

3.5. ALGEBRA DE CUADRI-VECTORES


= x2 = (x0 )2 x2 < 0

63
(3.83)

Utilizando un argumento similar al anterior, se puede probar que todo


vector ortogonal a un vector como de luz es como de espacio, salvo el caso
tratado anteriormente (Proposicin 4.3).
Nota 4.3 Claramente existen tres c-v como de espacio ortogonales entre
s, pero solo hay dos c-v como de espacio mutuamente ortogonales, que sean a
su vez ortogonales a un c-v dado como de luz. Esta situacin se puede ilustrar
tomando e = (1, 1, 0, 0), el cual es un c-v como de luz y e1 = (0, 0, 1, 0) y
e2 = (0, 0, 0, 1) c-vectores como de espacio, ortogonales entre si y ortogonales
al c-v e . Ahora, es claro que cualquier otro c-v como de espacio, ortogonal
a e1 y e2 , debe tener la segunda componente no nula y por lo tanto ya no
sera ortogonal al c-v e . Para probar esto, por contradiccin, supongamos
que existe un vector e3 = (x0 , x1 , x2 , x3 ) como de espacio y ortogonal a los
c-v e , e1 y e2 . Entonces, de la ortogonalidad con e1 y e2 se obtiene que
x2 = x3 = 0, y de la ortogonalidad con e se tiene que x0 = x1 , por lo tanto
la norma del c-v e3 est dada por:
e3 e3 = (x0 )2 (x1 )2 = 0

(3.84)

lo cual implica que e3 sera como de luz, contradiciendo la hiptesis inicial.


Nota 4.4 Anlogo a la descomposicin de vectores v ordinarios en componentes ortogonales, una de ellas a lo largo de un vector dado w, con
v = v + w, en donde v es ortogonal a w, podemos representar cualquier
c-v x M como
x = y + z
(3.85)
con z un c-v fijo como de tiempo y y un nico c-v como de espacio ortogonal
a z, el cual est completamente determinado por por el c-v x, siendo un
parmetro real.

64CAPTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO

Captulo 4

Cinemtica relativista
4.1.

Introduccin

En este captulo se desarrollar la cinemtica relativista como una aplicacin de los cuadri-vectores. En las dos primeras partes definiremos los
c-vectores velocidad y aceleracin y en la ltima parte introduciremos el cvector nmero de onda, como una consecuencia de la invarianza relativista
del producto punto y se discutir el efecto Doppler y la aberracin de la luz
como una consecuencia de las leyes de transformacin de los c-vectores.

4.2.

Cuadri-vector velocidad

Definamos el c-v posicin x como un elemento del espacio M el cual describe el instante de tiempo y posicin espacial de un evento fsico cualquiera,
cuyas coordenadas para un observador inercial estn dadas por x =
(x0 , x1 , x2 , x3 ). Por ejemplo, la trayectoria de una partcula elemental, es
decir, su posicin espacial en cada instante de tiempo, la podemos describir
por un c-v posicin x(s) como funcin de algn parmetro s, y a esta funcin
x(s) se le llama la lnea de universo de la partcula. En fsica no relativista
es usual utilizar como parmetro s la coordenada temporal t. Sin embargo
es claro que en el caso relativista este no es el parmetro ms adecuado, an
cuando se puede usar, pues l depende del observador. Para describir la lnea
de universo de una partcula material es usual, dada su interpretacin fsica
directa, utilizar como parmetro s al tiempo propio de la partcula, es decir,
el tiempo medido por un reloj que viaja con la partcula, el cual es un invariante relativista y as es un parmetro independiente del observador. De
lo discutido en el pargrafo anterior, si x1 y x2 son las coordenadas de dos
65

66

CAPTULO 4. CINEMTICA RELATIVISTA

eventos medidos por un observador , entonces el intervalo espacio-temporal


entre los dos eventos est dado por la expresin:
S 2 = (x02 x01 )2 (x12 x11 )2 (x22 x21 )2 (x32 x31 )2

(4.1)

Si las coordenadas x1 y x2 representan dos posiciones sucesivas de una


partcula material, entonces S 2 es mayor que cero y nos mide el tiempo
propio entre los dos eventos (ecuacin (3.58)). De esta manera x( ) nos
describe la posicin espacio-temporal de una partcula en funcin del tiempo
propio , transcurrido desde un instante inicial arbitrario, es decir x(0) nos
representa la posicin espacio-temporal de la partcula en = 0. Notemos
que esta descripcin de la cuadri-posicin en funcin de solo es posible
para partculas que se mueven a una velocidad menor que la de la luz, pues
para el caso de fotones (u otras partculas con masa en reposo nula), dado
que ellas solo se pueden mover a la velocidad de la luz, el intervalo s2 entre
dos puntos de su lnea de universo siempre es cero.
La velocidad fsica de una partcula se define como
u=

dr
dt

(4.2)

en donde r son las coordenadas de posicin y t el tiempo medido por algn


observador inercial . Podemos generalizar el concepto de velocidad al caso
de cuadri-vectores de una manera independiente del observador, definiendo
el c-v velocidad (c-velocidad) por:
U :=

dx
d

(4.3)

en donde x( ) es el c-v posicin que describe la lnea de universo de una


partcula material y el parmetro tiempo propio. Para encontrar la relacin
entre las componentes de la c-velocidad y la velocidad fsica medida en un
sistema de referencia inercial , basta tener en cuenta que (ver ecuacin
(3.58) con la notacin x = (x0 , x1 , x2 , x3 ) = (x0 , r) = (ct, r)) para una
partcula material el tiempo propio est dado por la expresin:
p
(4.4)
cd = (dx0 )2 (dr)2
y por lo tanto tenemos

d
dt
dt
d

dr 2
)
dt
1
= (u) := p
1 u2 /c2

1(

(4.5)

4.2. CUADRI-VECTOR VELOCIDAD

67

en donde u = dr/dt es la velocidad fsica de la partcula medida en el sistema


de referencia . De esta ltima ecuacin es fcil obtener la relacin entre las
componentes de la c-velocidad U = (U 0 , U 1 , U 2 , U 3 ) y la velocidad fsica u
en , pues aplicando la regla de la cadena para las derivadas se obtiene
U =
=

d
d 0
x =
(x , x)
d
d
dt d
(ct, r) = (u)(c, u)
d dt

(4.6)

Entonces
U 0 = (u)c;

U 1 = (u)ux ;

U 2 = (u)uy ;

U 3 = (u)uz

(4.7)

Por ejemplo, para una partcula en reposo u = 0 y el c-v velocidad


est dado por U = (c, 0). Puesto que para determinar unvocamente la
velocidad de una partcula se requieren tres parmetros, por ejemplo, las
tres componentes de la velocidad respecto a algn sistema de referencia,
y la c-velocidad tiene cuatro componentes, entonces estas componentes no
pueden ser todas independientes y debe existir una relacin entre ellas. Esta
relacin se puede obtener teniendo en cuenta el hecho de que la norma al
cuadrado de todo c-v es un invariante relativista, as
U 2 = U U = 2 (u)(c2 u2 ) = c2

(4.8)

Esta relacin indica que todo c-v velocidad es como de tiempo y geomtricamente representa el c-v tangente a la lnea de universo de una partcula
material, generalizando de esta forma los conceptos usuales de curva y su
vector tangente (velocidad). Notemos que el valor de la norma al cuadrado
del c-v velocidad se hubiera podido obtener directamente, sin realizar ningn
clculo, pues, dado que esta norma es un invariante, siempre podemos escoger un sistema de referencia inercial particular, por ejemplo, aquel para
el cual la partcula est momentneamente en reposo, en donde U = (c, 0),
y asi directamente se obtiene que U 2 = c2 . Este ejemplo ilustra uno de los
hechos que hacen del clculo con c-vectores una herramienta muy poderosa
y en general ms simple.
Otra propiedad muy importante de los c-vectores es que todos se transforman, por definicin, de la misma forma bajo una transformacin de
Lorentz, lo cual nos permite obtener de una manera ms simple, pero ms
general, las leyes de transformacin entre sistemas de referencia inerciales
de las variables fsicas. Por ejemplo, el teorema de adicin de velocidades

68

CAPTULO 4. CINEMTICA RELATIVISTA

se sigue directamente del hecho que siendo U un c-v, entonces sus componentes medidas en dos sistemas de referencia y 0 estn relacionadas
por las ecuaciones de transformacin de Lorentz (ecuaciones (3.43), (3.44),
(3.45) y (3.46)):
(4.9)
U ,0 = (v)(U 0 U 1 )
U ,1 = (v)(U 1 U 0 )
,2

(4.10)

(4.11)

U ,3 = U 3

(4.12)

=U

En donde v es la velocidad del sistema de referencia 0 respecto al sistema y = v/c. Hemos colocado explcitamente el argumento del factor
, para distinguirlo del asociado a la velocidad fsica u de la partcula.
Teniendo en cuenta la relacin entre las componentes de la c-velocidad y la
velocidad fsica (ecuacin (4.7)), vlidas en cualquier sistema de referencia,
la ecuacin (4.9) nos da directamente la ley de transformacin del factor
de la partcula:
vux
(4.13)
(u, ) = (v)(u)(1 2 )
c
y teniendo en cuenta esta relacin, se obtiene, de las otras tres ecuaciones
(4.10), (4.11) y (4.12), el teorema de adicin de velocidades o equivalentemente la ley de transformacin de las componentes de la velocidad fsica
entre dos sistemas de referencia inerciales:
ux0 (u, ) = (v)((u)ux c(u))
entonces
ux0 =

ux v
x
(1 vu
c2 )

(4.14)

(4.15)

y similarmente
uy0 =
uz0 =

p
1 v2 /c2
x
(1 vu
)
c2
p
2
uz 1 v /c2
x
(1 vu
)
c2
uy

(4.16)
(4.17)

Para finalizar esta seccin, daremos dos resultados importantes, que


sern de utilidad en la dinmica relativista.
Proposicin 5.1 Cualquier c-vector w = (w0 , w) como de tiempo (w2 >
0), y dirigido al futuro (w0 > 0), puede ser expresado como un multiplo de
una c-velocidad U .

4.3. CUADRI-VECTOR ACELERACIN


Para esto basta tomar

69

w2
U
w=
c

(4.18)

Proposicin 5.2 Dado un c-vector w como de tiempo, siempre es posible


encontrar un sistema de referencia para el cual las componentes del c-vector
sean (w0 , 0).
Teniendo en cuenta la Proposicin 5.1, basta con probar que se cumple
para una c-velocidad. Sea U = (u)(c, u) en un sistema de referencia y
consideremos un segundo sistema de referencia 0 cuya c-velocidad respecto
al sistema sea U , entonces claramente las componentes de la c-velocidad
U respecto a 0 son (c, 0). La velocidad fsica del sistema es entonces u. En
efecto, si escogemos el eje temporal de 0 paralelo a u, podemos eliminar
sus componentes espaciales; en caso que el c-vector U est dirigido al pasado
podemos aplicar los mismos argumentos a la velocidad u. Esta situacin de
eleccin de los ejes nos permite, en muchas situaciones, simplificar clculos,
pues por ejemplo si W es un c-vector cualquiera no nulo, siempre podemos
absorber dos de sus componentes espaciales (digamos W 2 y W 3 ) rotando los
ejes espaciales del sistema de referencia y escoger el eje t0 o x0 a lo largo
del vector W y eliminar una componente ms, bien sea W 1 (como en el caso
anterior) si W es un c-vector como de tiempo, o W 0 si W es un c-vector
como de espacio.

4.3.

Cuadri-vector aceleracin

De manera similar a la c-velocidad, definimos el c-v aceleracin como la


derivada de la c-velocidad respecto al tiempo propio
A = (A0 , A1 , A2 , A3 ) :=

dU
d

(4.19)

Para encontrarar la relacin de las componentes de la c-aceleracin con


la aceleracin fsica, i.e., con la derivada de la velocidad respecto al tiempo
a = du/dt medida en un sistema de referencia, basta con utilizar la relacin
(4.5) en la ecuacin que relaciona las componentes de la c-velocidad con u
(ecuacin (4.7)) medidas en algn sistema de referencia :
dt d
dU
=
(u)(c, u)
d
d dt
d(u) d(u)
,
u + (u)a)
= (u)(
dt
dt

A =

(4.20)

70

CAPTULO 4. CINEMTICA RELATIVISTA

Consideremos un sistema de referencia inercial para el cual la partcula


se encuentra momentneamente en reposo, i.e., u = 0, entonces para este
sistema las componentes de la c-aceleracin toman la forma
A = (0, a)

(4.21)

A esta aceleracin fsica a se le llama aceleracin propia y es un invariante relativista, pues la norma al cuadrado del c-v aceleracin est dada
por
(4.22)
A2 = | a |2
Esta relacin indica tambin que la c-aceleracin es un c-v como de espacio. Adems, los c-vectores velocidad y aceleracin son ortogonales pues, en
el sistema de referencia propio de la partcula el c-v velocidad tiene componentes (c, 0) y por lo tanto el producto interno entre los c-vectores velocidad
y aceleracin, que es tambin un invariante, est dado por:
U A = U A = 0

(4.23)

Este resultado se puede obtener directamente, sin hacer uso de un sistema


particular de referencia, pues dado que U 2 = c2 , se tiene entonces que
0=

d
d 2
U = 2U
U = 2U A
d
d

(4.24)

Podemos proceder de manera similar como se hizo para obtener las leyes
de transformacin de las componentes de la velocidad entre sistemas de referencia inerciales y calcular las ecuaciones de transformacin para la aceleracin, sin embargo, dado que estas expresiones no son de mucha utilidad,
pospondremos la interpretacin fsica de la aceleracin para el siguiente captulo sobre dinmica relativista y nos limitaremos en este punto a dar un
ejemplo sobre la cinemtica de un sistema con aceleracin propia constante.

4.3.1.

Viaje interestelar

Este ejemplo ilustra uno de los resultados ms sorprendentes de la teora


especial de la relatividad, conocido histricamente como la paradoja de los
mellizos de Langevan. Como veremos, este resultado no es de ninguna manera una paradoja, pero si es ilustrativo plantearlo en estos trminos, pues
nos permite entender de manera ms precisa el principio de relatividad y
evitar un error muy comn que se presenta cuando se analizan situaciones
o fenmenos desde el punto de vista de diferentes observadores inerciales.

4.3. CUADRI-VECTOR ACELERACIN

71

Supongamos que un mellizo parte en un viaje espacial mientras que el


otro permanece en la tierra, entonces como veremos en el siguiente ejemplo
numrico que vamos a tratar, el mellizo viajero regresa a la tierra al cabo
de unos cuantos aos medidos por relojes de la nave espacial, mientras que
para el mellizo que permaneci en la tierra habran transcurrido miles aos
medidos por relojes del sistema de referencia de la tierra. Claramente no
hay simetra en el anlisis de la situacin vista por los dos mellizos, pues el
mellizo viajero no constituye un sistema de referencia inercial y por lo tanto
no es vlido (como se plantea en la paradoja) suponer que visto desde la
tierra, es el mellizo de la nave a quien le transcurren miles de aos.
Consideremos un cohete que parte del reposo en la tierra con una aceleracin propia constante igual a g (la aceleracin de la gravedad sobre la
superficie de la tierra) y viaja hacia el centro de la galaxia. Supongamos que
la mitad del viaje lo realiza acelerando y la otra mitad frenando, tambin
con aceleracin propia g. Tomando como sistema de referencia inercial la
tierra, con su origen de coordenadas en la tierra, el origen del tiempo en el
instante en que la nave parte y como eje x la direccin del movimiento de la
nave, entonces las componentes de la c-velocidad y c-aceleracin de la nave
estn dadas por:
U

= (U 0 , U ) = (U 0 , Ux , 0, 0)
0

A = (A , A) = (A , Ax , 0, 0)

(4.25)
(4.26)

las cuales satisfacen las siguientes relaciones (usando unidades con c = 1):
U 2 = 1 = (U 0 )2 Ux2

(4.27)

U A = 0 = U 0 A0 Ux Ax

(4.28)

A2 = g 2 = (A0 )2 A2x

(4.29)

En unidades de c = 1, el valor de la aceleracin de la gravedad es g '


no luz). De la ecuacin (4.28) despejamos A0
1al1 (al a
A0 = Ax Ux /U 0

(4.30)

y reemplazamos en la ecuacin (4.29), entonces


g 2 = A2x [1 (

Ux 2
) ]
U0

(4.31)

Utilizando la ecuacin (4.27) obtenemos


Ax = gU 0

(4.32)

72

CAPTULO 4. CINEMTICA RELATIVISTA

y de esta ecuacin y la (4.30) se llega a la relacin:


A0 = gUx

(4.33)

Diferenciando con respecto al tiempo propio la ecuacin (4.32) y haciendo uso de la ecuacin (4.33), obtenemos una ecuacin diferencial para
Ux :
d2 Ux
dU 0
= gA0 = g 2 Ux
=
g
(4.34)
d 2
d
entonces
d2 Ux
g 2 Ux = 0
(4.35)
d 2
cuya solucin est dada en trminos de funciones hiperblicas, como se puede
probar por sustitucin directa,
Ux = C1 sinh(g ) + C2 cosh(g )

(4.36)

con C1 y C2 constantes de integracin, las cuales se pueden determinar


utilizando las condiciones iniciales: la nave parte del reposo con acelerax
cin propia g, i.e., Ux ( = 0) = 0 y dU
d | =0 = g. Entonces, de la primera
condicin se obtiene que C2 = 0 y de la segunda condicin
g = C1 g cosh(0) C1 = 1

(4.37)

As, obtenemos las siguientes ecuaciones diferenciales para las coordenadas (x0 , x) de la nave, medidas desde el sistema tierra:
Ux =
U0 =

dx
= sinh(g )
d
dx0
= cosh(g )
d

(4.38)
(4.39)

en donde la segunda ecuacin se obtiene de la ecuacin (4.27). Integrando estas ecuaciones con las condiciones iniciales x = x0 = 0 para = 0,
obtenemos la ecuacin para la trayectoria o lnea de universo de la nave, en
trminos del parmetro (tiempo propio de la nave):
x0 = g 1 sinh(g )

(4.40)

x = g 1 (cosh(g ) 1)

(4.41)

En la Figura 4.1 se muestra un grfico de la lnea de universo de la nave, en


el sistema de referencia tierra. En este diagrama la lnea de universo de la

4.3. CUADRI-VECTOR ACELERACIN

73

Figura 4.1: Lnea de universo del cohete


tierra es el eje ct y tambin se ha dibujado all, el cono futuro del evento P,
es decir, del evento: partida de la nave en la tierra. La lnea de universo del
cohete siempre tiene que estar dentro del cono de luz del evento P y en todo
punto la tangente a la lnea de universo es menor de 45o , con respecto al
eje ct, indicando que la velocidad del cohete siempre es menor que c, como
lo exige la relatividad. Notemos adems, que la lnea de universo del cohete
intercepta a la lnea de universo de la tierra en dos puntos: en el instante del
lanzamiento de cohete y luego en el instante en que ste regresa a la tierra.
A partir de estas ecuaciones podemos obtener toda la informacin que
se quiera respecto al viaje. Por ejemplo, calculemos la distancia a la cual se
encuentra el cohete de la tierra y su velocidad al cabo de 40 aos medidos
en la tierra. Como estamos trabajando con unidades de c = 1 tenemos que
nos, entonces, despejando de la ecuacin (4.40)
x0 = t = 40a
= sinh1 (gx0 ) = sinh1 (40) ' 4, 38a
nos

(4.42)

y remplazando este valor del tiempo transcurrido en la nave (tiempo propio)


en la ecuacin (4.41), obtenemos la distancia a la cual se encuentra la nave
de la tierra:
x = [cosh(4,38) 1]a
nos luz = 39,01a
nos luz

(4.43)

74

CAPTULO 4. CINEMTICA RELATIVISTA

La velocidad de la nave en cualquier instante la podemos obtener derivando las ecuaciones (4.40) y (4.41), y de la relacin entre las componentes de
su c-velocidad y su velocidad fsica:
U = (U 0 , U ) = (u)(1, u)
U

= (cosh(g ), sinh(g ), 0, 0)

(4.44)
(4.45)

por lo tanto, despejando la velocidad u = (ux , 0, 0) de esta relacin, tenemos


que la velocidad de la nave en ese punto de la trayectoria es:
ux = tanh(g ) = tanh(4,38) = 0,9997

(4.46)

El centro de la galaxia se encuentra aproximadamente a unos 30000 aosluz de la tierra, puesto que la mitad del viaje se hace acelerando y la otra
mitad desacelerando, entonces por simetra, el tiempo propio para que la
nave llegue al centro de la galaxia es el doble del tiempo necesario para
recorrer los primeros 15000 aos-luz. Despejando de la segunda (4.41)
tenemos:
nos
(4.47)
= cosh1 (15000 + 1) = 10,309a
y por tanto el tiempo medido en la nave para realizar este viaje es de
20,6a
nos, tiempo perfectamente razonable para un viaje interestelar. Ahora,
si este viajero regresa a la tierra siguiendo el mismo plan de vuelo, entonces
el viaje completo le llevara un tiempo de 41,2a
nos, mientras que el tiempo
transcurrido en la tierra sera de
nos
x0 = 4 sinh(10,3) = 60003,9a

(4.48)

Este ejemplo muestra la famosa paradoja de los mellizos de Langevan,


pero ilustra tambin claramente la asimetra de la situacin. En el relato de
la paradoja se afirma que dada la relatividad de los sistemas de referencia,
esto es, la equivalencia de todos los sistemas de referencia inerciales para
describir los fenmenos fsicos, podemos considerar el viaje visto desde la
nave espacial y ver que es la tierra la que se aleja de la nave y por lo tanto
se espera, que cuando la tierra regrese a la nave, entonces sea el mellizo que
permanecio en la nave al que le han transcurrido 60003,9a
nos, mientras que
al viajero de la tierra tan solo le habran pasado 41,2a
nos.
La falsedad de este ltimo razonamiento radica en el hecho que la nave
espacial est acelerada y por lo tanto no es un sistema de referencia inercial,
a diferencia del sistema tierra, lo que hace invlido aplicar el principio de
relatividad restringida. Este efecto de retraso temporal de relojes, que se
encuentran sometidos a una aceleracin, se ha probado experimentalmente

4.4. CUADRI-VECTOR DE ONDA

75

utilizando relojes atmicos (de alta precisin), uno de los cuales permanece
en la tierra y el otro viaja en un avin alrededor de la tierra. Si bien, el
efecto del retardo temporal del reloj viajero es muy pequeo, del orden de
millonsimas de segundo, este tipo de relojes ha permitido hacer estas medidas con la suficiente precisin, mostrando este espectacular efecto relativista.
Es de anotar que para el clculo del retardo temporal en este experimento
terrestre, es necesario tener en cuenta los efectos asociados al campo gravitacional, es decir hay que trabajar en el contexto de la teora general de
la relatividad, sin que se invalide de ninguna manera las predicciones de la
teora especial de la relatividad.
Una ltima conclusin que se desprende de este ejemplo, es que los viajes
interestelares son fsicamente posibles, pues basta con lograr aceleraciones
suficientes durante un tiempo adecuado, para que un viajero en un tiempo
razonable atraviese nuestra galaxia, o incluso viaje a otras galaxias, pero
definitivamente no pretenda regresar a la tierra, pues en la tierra podran
haber transcurrido varios millones de aos.

4.4.

Cuadri-vector de onda

Una de las contribuciones ms importantes de las ecuaciones de Maxwell


lo constituye la propagacin de las ondas electromagnticas. Debido a que la
ecuacin de ondas en el vaco (ver por ejemplo la ecuacin (2.14)) es lineal,
vale el principio de superposicin y as cualquier onda electromagntica se
puede escribir como una suma o superposicin de ondas planas de la forma
(t, r) = Aei(tkr)

(4.49)

en donde A es la amplitud del campo (por ejemplo el campo elctrico,


magntico, potencial vectorial o potencial escalar), la frecuencia de la
onda, k el vector de onda y el signo indica el sentido de propagacin de
la onda. La cantidad
= t k r
(4.50)
se llama la fase de la onda y debe ser un invariante relativista, esto es, debe
ser la misma para todos los observadores inerciales. Si definimos el c-vector
de onda k como
k := (/c, k)
(4.51)
entonces la fase de la onda se puede escribir como el producto interno
Minkowskiano entre el c-vector de onda y el c-vector posicin x = (ct, r):
=kx

(4.52)

76

CAPTULO 4. CINEMTICA RELATIVISTA

la cual es un invariante relativista. De las propiedades de transformacin de


los c-vectores se tiene que las componentes del c-vector de onda, medidas
por dos observadores inerciales y 0 estn relacionadas por las ecuaciones
de transformacin:
0 = (v)( vkx )
(4.53)
v
kx0 = (v)(kx 2 )
(4.54)
c
ky0 = ky

(4.55)

kz0 = kz

(4.56)

De las propiedades de los c-vectores sabemos que la norma Minkowskiana


de todo c-vector es un invariante relativista y por lo tanto se espera que
sta tenga un significado fsico. Si tomamos la norma del c-vector de onda
obtenemos
2 2
(4.57)
k 2 = 2 k = 0
c
pues, si tenemos en cuenta la relacin
de dispersin para las ondas electro
magnticas en el vaco, c = / k, vemos que el c-vector de onda es un
c-vector nulo o como de luz, y cuya norma nos da la relacin de dispersin
para ondas electromagnticas en el vaco.
Consideremos como ejemplo una onda electromagntica plana de frecuencia , que se propaga respecto al sistema a lo largo del eje y, i.e.,
k = (o, ky , 0). Entonces, para un observador 0 que se mueve respecto a
con velocidad v a lo largo de los ejes paralelos xx0 , tenemos
0 = (v)

kx0 =

v
(v)
c2

ky0 = ky

(4.58)

En primer lugar, la direccin de propagacin de la onda para el observador 0 est dada por la relacin
kx0 /ky0 =

v
(v) = (v)
2
c
ky
c

(4.59)

en donde la ltima igualdad se obtuvo utilizando la relacin de dispersin


para la onda en el sistema . En el lmite de bajas velocidades, es decir,
para velocidades del observador 0 tales que v c, podemos aproximar el
factor (v) 1, y obtenemos el fenmeno clsico de la aberracin de la luz
estelar, discutida en el captulo segundo.
El efecto Doppler es un fenmeno asociado a las ondas en general y corresponde al cambio en la frecuencia medida por un observador con respecto

4.4. CUADRI-VECTOR DE ONDA

77

a la frecuencia emitida por la fuente, debido a los movimientos relativos del


observador y/o de la fuente y en el caso particular de ondas que requieran
un medio para propagarse, tales como las sonoras o elsticas, tambin depende de la velocidad del medio. En fsica no relativista el efecto Doppler
se puede entender fcilmente si tenemos encuenta que, por ejemplo, cuando la fuente se est moviendo en direccin del observador, el tiempo entre
dos pulsos recibidos es menor que el tiempo entre la emisin de estos dos
pulsos, dando lugar as a una frecuencia detectada mayor a la frecuencia
emitida, fenmeno llamado corrimiento hacia el azul. La misma situacin se
presenta si es el observador el que se acerca a la fuente. Cuando la fuente
se aleja del observador, la frecuencia detectada es menor que la emitida y
el efecto se llama corrimiento al rojo. En el caso relativista se presenta una
situacin similar, pero el factor de corrimiento se ve corregido debido al
comportamiento del tiempo para diferentes observadores. En las ecuaciones
de transformacin para el c-vector de onda ( (4.53) a la (4.56)), est contenido el efecto Doppler relativista para la situacin ms general posible.
Para encontrar las relaciones estandar del efecto Doppler relativista que se
tratan usualmente en los textos de relatividad especial, vamos a considerar
casos particulares de las ecuaciones de transformacin (4.53) a la (4.56).
Supongamos que la fuente est en reposo respecto al observador y que
emite un frente de ondas de frecuencia a lo largo del eje x, entonces las
componentes del c-vector de onda son (/c, kx , 0, 0). De la ecuacin (4.53),
y teniendo en cuenta que kx = /c, para el observador 0 tenemos
v
0 = (v)( vkx ) = (v)(1 )
c

(4.60)

en donde el signo de la velocidad v es positivo si el observador se aleja de


la fuente y negativo si se acerca. Para el caso de movimiento del observador
transversal a la direccin de propagacin, consideremos que el observador
emite un frente de ondas de frecuencia en la direccin y, entonces el
c-vector de onda toma la forma k = (/c, 0, ky , 0). A partir de la ecuacin
(4.53) la frecuencia medida por el observador 0 es
0 = (v)

(4.61)

Una situacin ms general de inters se presenta cuando el tren de ondas


emitido por la fuente viaja en el plano xy formando un ngulo con respecto
al eje de las x, entonces el c-vector de onda es k = (/c, kx , ky , 0), con
q



(4.62)
tan = ky /kx ;
k = kx2 + ky2 ;
k = /c

78

CAPTULO 4. CINEMTICA RELATIVISTA

Entonces para el observador 0 se tiene que


0 = (v)( vkx ) = (v)(1

v
cos )
c

(4.63)

Claramente esta ltima relacin contiene, como casos particulares, las


situaciones descritas anteriormente. Cuando = 0 obtenemos la ecuacin
(4.60) y para = 90 se reduce a la ecuacin (4.61).
Notemos que el efecto Doppler transversal, ecuacin (4.61), es de origen
estrictamente relativista puesto que es una consecuencia de la dilatacin
temporal, situacin que obviamente no se presenta en el tratamiento clsico.

Parte II

Dinmica relativista

79

Captulo 5

Dinmica relativista
En este captulo se desarrollarn las leyes de la dinmica relativista utilizando desde un principio, la formulacin de cuadrivectores, la cual permite
formular las leyes de la dinmica relativista como una generalizacin de las
leyes fundamentales de la mecnica Newtoniana.

5.1.

Ecuaciones de movimiento

Definamos el cuadri-vector momentun por


p := m0 U = m0

dx
d

(5.1)

en donde m0 es la masa inercial propia de la partcula, es decir, la masa


inercial medida en el sistema de referencia en reposo de la partcula. m0
tambin es llamada masa en reposo y U es su cuadri-velocidad. Por definicin, la masa en reposo de una partcula es un invariante relativista que
caracteriza a la partcula, pues si tomamos la norma del c-v momentun,
ecuacin (5.1), obtenemos:
(5.2)
p2 = m20 c2
dado que la norma al cuadrado del c-v velocidad es c2 .
A partir de esta definicin del c-momento de una partcula, podemos
mantener la misma definicin de la segunda ley de Newton, pero formulada
para las cantidades c-vectoriales. As, la ecuacin de movimiento relativista
est dada por
dp
= m0 A
(5.3)
f=
d
81

82

CAPTULO 5. DINMICA RELATIVISTA

en donde A es la c-aceleracin y f es la c-fuerza. Para interpretar las componentes del c-momento y c-fuerza en trminos de variables dinmicas fsicas,
especficamente, en trminos de su cantidad de movimiento lineal (momentun), de su energa y de la fuerza, consideremos en primer lugar el c-momento
(ecuacin (5.1)) y hagamos uso del hecho que a bajas velocidades comparadas con la velocidad de la luz, i.e. v c, las ecuaciones de la relatividad
deben reducirse a las ecuaciones de la mecnica Newtoniana. Teniendo en
cuenta que las componentes de la c-velocidad estn relacionadas con la velocidad de la partcula a travs de la ecuacin U = (u)(c, u), entonces (ver
captulo anterior) las componentes del c-momentun sern
p = (m0 (u)c, m0 (u)u) =: (E/c, p)

(5.4)

En esta ltima ecuacin hemos definido las cantidades E (con unidades


de energa) y p (con unidades de momento) por

con

E = mc2

(5.5)

p = mu

(5.6)

m0
m := m0 (u) = p
1 u2 /c2

(5.7)

llamada masa inercial relativista de la partcula, nombre que ser justificado


en el siguiente anlisis. Teniendo en cuenta que en el lmite de bajas velocidades el factor (u) lo podemos expandir en una serie en potencias de (u/c),
reteniendo trminos hasta orden (u/c)2 ,
1 u2
+ O(u4 /c4 )
(5.8)
2 c2
entonces, las componentes espaciales del c-momentun toman la forma
(u) = 1 +

1 u2
+ O(u4 /c4 )) m0 u
(5.9)
2 c2
la cual, en el lmite de bajas velocidades se reduce a la definicin del momentum clsico. As, la definicin del momentum relativista de una partcula
por la ecuacin (5.6), nos conduce a interpretar la masa relativista (ecuacin
(5.7)) como la inercia de una partcula, la cual depende de su velocidad.
Para interpretar la componente temporal del c-momento, consideremos
de nuevo el lmite de bajas velocidades de la ecuacin (5.5). Remplazando
la expansin (5.8) en la definicin (5.7) tenemos
p = m0 u(1 +

E = m0 c20 (1 +

1 u2
1
+ O(u4 /c4 )) m0 c2 + m0 u2
2
2c
2

(5.10)

5.1. ECUACIONES DE MOVIMIENTO

83

la cual, salvo el trmino constante m0 c2 , corresponde a la definicin newtoniana de energa cintica. As, este resultado nos conduce a definir la cantidad
K := mc2 m0 c2

(5.11)

como la energa cintica relativista de una partcula. Esta definicin tiene


sentido en cuanto que la funcin K depende de la velocidad de la partcula,
se anula para u = 0 y en el lmite de bajas velocidades se reduce a la energa
cintica clsica. La cantidad E = mc2 se define como la energa total de la
partcula y a la cantidad dinmica
E0 := m0 c2

(5.12)

la definimos como su energa en reposo. Esta cantidad E0 adquiere el sentido fsico de una energa, solamente si es posible transformar esta forma de
energa (asociada a la masa y no a su estado de movimiento) en otras formas
de energa. Einstein, en su segundo artculo de 1905 sobre relatividad, titulado Depende la inercia de un cuerpo de su contenido de energa postula
que esta forma de energa, asociada a la masa en reposo de una partcula, es
posible transformarla en otras formas de energa, dndole as sentido fsico
a esta definicin y sugiere que esta transformacin de masa en energa se
puede medir en el decaimiento radioactivo de las sales de radio. Este postulado le vali a Einstein el ganarse el dudoso honor de ser el padre de la
bomba atmica.
Otro resultado que apoya las definiciones anteriores, nos lo da la interpretacin fsica de las componentes de la c-fuerza, definida por la ecuacin
de movimiento (5.3). Haciendo uso de la relacin d\d = (u)d/dt y de la
definicin (5.4) de las componentes del c-momento, tenemos
f =

dp
dp
= (u)
d
dt

dm
dm dp
, ) = (u)(c
, f)
dt dt
dt
En la ltima igualdad hemos definido la cantidad
= (u)(c

f=

dp
dt

(5.13)

(5.14)

la cual identificamos como la fuerza fsica que acta sobre la partcula, produciendo, de acuerdo con la definin newtoniana de fuerza, un cambio por
unidad de tiempo en el momentum de la partcula. Para sustentar an ms

84

CAPTULO 5. DINMICA RELATIVISTA

esta definicin de fuerza y de paso la definicin de energa total E dada, consideremos la relacin de ortogonalidad entre la c-velocidad y la c-aceleracin
(ecuacin (4.23)) U A = 0, entonces
f U = f U = 0

(5.15)

y de esta ecuacin y de la definicin de las componentes de la c-velocidad,


obtenemos la relacin
2 (u)c2

dm
2 (u)f u = 0
dt

dE
=f u
dt
Esto implica que si adoptamos la definicin clsica de trabajo

(5.16)

dW = f dr

(5.17)

dW = f udt = dE

(5.18)

entonces se obtiene que


esto significa, que si el trabajo realizado por una fuerza sobre una partcula
es diferente de cero, entonces la partcula cambia su energa total, de acuerdo
con la ecuacin (5.18).
Esta ltima relacin nos permite escribir las componentes de la c-fuerza,
definidas en la ecuacin (5.13), en la forma
1
f = (u)( f u, f )
c

(5.19)

la cual nos da una interpretacin directa de las componentes de la c-fuerza;


la componente temporal representa el trabajo por unidad de tiempo que
realiza la fuerza fsica f sobre la partcula, mientras que las componentes
espaciales forman el vector fuerza.

5.2.

Leyes de conservacin

La dinmica Newtoniana est basada sobre tres postulados fundamentales: La primera ley de Newton o el princio de inercia, la cual tambin
se puede formular de manera equivalente, como el principio de relatividad
Galileano, siendo el primer postulado de la teora especial de la relatividad
la generalizacin de esta primera ley. La segunda ley, que postula la ecuacin

5.2. LEYES DE CONSERVACIN

85

de movimiento para una partcula sometida a una fuerza (F = ma), se extiende al caso relativista a travs de la ecuacin (5.3). La tercera ley llamada
de accin y reaccin, que postula el comportamiento de la interaccin entre
sistemas, esto es, que la fuerza ejercida sobre una partcula es el resultado
de la interaccin de esta partcula con algn sistema y por tanto, sobre este
sistema tambin interacciona la partcula, efectuando sobre l una fuerza de
la misma magnitud pero de sentido contrario a la ejercida por el sistema
sobre la partcula. Claramente esta ley implica que la accin y la reaccin
son eventos simultaneos y por lo tanto no puede ser vlida para el caso relativista en general. Sin embargo, para el caso particular en que coincidan
los puntos de aplicacin de las fuerzas de accin y reaccin, s se cumple
la tercera ley de Newton, una situacin que se puede presentar cuando los
sistemas que interactan son partculas puntuales y la interaccin entre ellas
se pueda aproximar por una interaccin de contacto. Puesto que las interacciones fundamentales (gravitacional, electromagntica, fuerte o nuclear y
dbil) que rigen todos los procesos fsicos son interacciones a distancia, y
por lo tanto en sentido riguroso, ninguna de estas interacciones fundamentales puede satisfacer la tercera ley de Newton, es claro que el postulado
de Newton sobre la accin y la reaccin, deja de ser una ley fundamental
en la naturaleza y su validez queda restringida a sistemas cuyas velocidades
tpicas san pequeas comparadas con la velocidad de la luz, o para interaciones puntuales de contacto. Es importante anotar en este punto que, en el
marco de la mecnica Newtoniana, la tercera ley de Newton juega un papel
fundamental para establecer los teoremas de conservacin del momentum y
de la energa mecnica.
Esto nos conduce entonces, a postular un principio de conservacin para
la energa y el momentun de un sistema relativista, el cual como veremos,
generaliza las leyes de conservacin de la mecnica Newtoniana y adiciona
una nueva forma de energa, llamada energa en reposo, que est asociada a
toda partcula material y que constituye uno de los aportes ms importantes
de la teora especial de la relatividad.
Para un sistema aislado de partculas, con c-momentos pi , i = 1, 2, ..., el
c-momento total del sistema p , defido como
X
pi
(5.20)
p :=
i=1

es una constante de movimiento. Dado que la componente temporal del cmomento representa la energa total del sistema y las componentes espaciales
corresponden a las componentes del vector momento, entonces el postulado de la conservacin del cuadrimomento asegura que la energa total y el

86

CAPTULO 5. DINMICA RELATIVISTA

momentun total de un sistema aislado son constantes del movimiento. Esto


es, si expresamos la ecuacin (5.20) en componentes, con pi = (Ei /c, pi ) y
p = (E/c, p), obtenemos que la energa total del sistema E, definida como
la suma de las energas de las partculas individuales
X
Ei
(5.21)
E :=
i=1

y el momentun total del sistema, definido como la suma vectorial de los


momentos individuales de las partculas
X
pi
(5.22)
p :=
i=1

se conservan. Notemos que la ley de conservacin de la energa (ecuacin


(5.21)) se puede reformular como el postulado de la conservacin de la masa
inercial, pues de la definicin de energa total de una partcula E = mc2 ,
tenemos que
X
mi = cte.
(5.23)
i=1

Existe toda una serie de consecuencias interesantes de los postulados


de la dinmica relativista, que las vamos a exponer a travs de ejemplos
sobre procesos que se presentan al nivel de las partculas elementales. Es
importante en este punto de la discusin hacer algunas anotaciones respecto
a la diferencia, tanto en las aplicaciones como en la metodologa de trabajo,
entre la dinmica Newtoniana y la relativista. En mecnica Newtoniana, por
lo general se conocen las fuerzas (su forma funcional), por ejemplo la fuerza
de la gravedad, de Coulomb, del tipo oscilador armnico, de rozamiento, etc.,
y a partir de ellas , utilizando la segunda ley de Newton se encuentran las
trayectorias de las partculas y las leyes de conservacin permiten determinar
constantes de movimiento, simplificando as el problema dinmico.
En el caso de la relatividad la situacin se modifica un poco, pues, salvo
el caso de la fuerza de Lorentz, que describe la fuerza que acta sobre una
partcula cargada inmersa en un campo electromantico, la cual nos permite describir el movimiento de la carga solucionando la ecuacin dinmica
de movimiento, las otras interacciones fundamentales no admiten, por una
parte, una descripcin clsica funcional de la fuerza que est de acuerdo
con los principios de la relatividad y por otra parte, es conocido que el
tratamiento de las interacciones fundamentales (incluyendo la electromagntica) debe hacerse en en marco de la teora cuntica de campos. El caso
de la electrodinmica es especial, pues esta interaccin fundamental admite

5.3. PROPIEDADES DEL C-MOMENTUN

87

una descripcin clsica dada por las ecuaciones de Maxwell, las cuales son
ecuaciones relativistas que describen correctamente los fenmenos electromagnticos a nivel macroscpico. La diferencia de la electrodinmica clsica
con la ley de gravitacin universal de Newton, la cual tambin describe
correctamente los fenmenos gravitacionales a escalas macroscpicas, radica en el hecho que esta ltima no es una teora relativista, pues la fuerza
gravitacional Newtoniana es una interaccin a distancia e independiente del
tiempo. Esta situacin fue precisamente la que condujo a Einstein a buscar
una teora de la gravitacin que estuviera de acuerdo con los principios de
la relatividad y que en el lmite de bajas velocidades se redujera a la teora
Newtoniana de la gravedad, logrando su objetivo en 1915, cuando formul
la Teora General de la Relatividad.
Si bien, las aplicaciones fundamentales de la teora especial de la relatividad de dan en el marco de las partculas elementales y como fue enfatizado
en el pargrafo anterior, para su descripcin dinmica se requiere de una
teora cuntica de campos, es posible como veremos, obtener toda una serie de resultados importantes a partir de la dinmica relativista a partir de
los principios de conservacin, sin necesidad de recurrir a una descripcin
completa de las interacciones que rigen estos procesos.
Antes de entrar a estudiar las principales consecuencias de los postulados
de la dinmica relativista, a travs de fenmenos y procesos fsicos, daremos
algunas definiciones y propiedades y unos resultados generales que sern de
utilidad ms adelante.

5.3.

Propiedades del c-momentun

Un primer resultado general que se deriva de la formulacin cuadrivectorial de la relatividad surge debido al hecho de que la norma de cualquier
c-vector en un invariante relativista y por lo tanto las cuatro componentes
que conforman un c-vector no son independientes. As por ejemplo, esta restriccin sobre las componentes del c-momentun de una partcula, nos conduce a una relacin entre su energa total y la magnitud de su momentun,
pues dado p = (E/c, p) tenemos
p2 = E 2 /c2 | p |2 = Invariante

(5.24)

Para calcular el valor de este invariente, basta con determinar el cmomentun de la partcula en un sistema de referencia particular, por ejemplo, en el sistema de reposo instantaneo de la partcula, para el cual el

88

CAPTULO 5. DINMICA RELATIVISTA

c-momentun toma la forma


p = (E0 /c, 0)

(5.25)

y por lo tanto su norma al cuadrado se reduce a


p2 = E02 /c2 = m20 c2

(5.26)

Esto significa que para una partcula de masa en reposo m0 , energa


total E y momentun p medidas en un sistema de referencia , se cumple la
relacin
(5.27)
E 2 /c2 | p |2 = m20 c2
o en forma equivalente
E 2 = E02 + | p |2 c2

(5.28)

Dos conclusiones importantes se desprenden de este anlisis: La primera


tiene que ver con el hecho de que el cuadrivector-momentun de una partcula
fsica debe ser como de tiempo, pues m20 c2 > 0 y la segunda conclusin es
que su norma nos caracteriza a la partcula, pues est dada por la masa
en reposo de dicha partcula, que es un invariante relativista por definicin.
Ms adelante cuando discutamos el concepto de fotn o partculas de masa
en reposo nula, volveremos sobre la ecuacin (5.28).
Consideremos ahora dos partculas de c-momentos p1 y p2 , con masas en
reposo m01 y m02 respectivamente y sea v la velocidad relativa entre ellas.
Entonces el producto interno Minkowskiano entre sus c-momentos, que es
un invariante relativista, est dado por
(5.29)
p1 p2 = c2 m01 m2 = c2 m1 m02 = c2 m01 m02 (v)
p
en donde (v) = 1 v2 /c2 es el factor de la velocidad relativa. Para
obtener esta expresin, basta con calcular el producto interno en el sistema
de referencia propio de una de las partculas (segunda o tercera igualdad
de la ecuacin (5.29)), mientras que la ltima igualdad de esta ecuacin se
deduce del hecho que v es la velocidad de una de las partculas medida en
el sistema de referencia de la otra (i.e. la velocidad relativa).
En mecnica Newtoniana se define una colisin elstica entre dos partculas, cuando la energa cintica del sistema es la misma antes y despus de
la colisin. As, en una colisin inelstica parte de la energa cintica de las
partculas se transforma en otras formas de energa, como por ejemplo, calor,
ondas mecnicas, etc.. Consideremos ahora una colisin relativista entre dos
partculas puntuales, con c-momentos p1 y p2 antes de la colisin y p01 y p02

5.3. PROPIEDADES DEL C-MOMENTUN

89

despus de la colisin. De la hiptesis de conservacin del c-momentun se


obtiene que
(5.30)
p1 + p2 = p01 + p02
elevando al cuadrado y utilizando las propiedades del producto interno
Minkowskiano (ecuacin (3.68)) obtenemos
02
0
0
p21 + p22 + 2p1 p2 = p02
1 + p2 + 2p1 p2

(5.31)

Uno de los hechos ms interesantes que surge en relatividad y que no


tiene su contraparte clsica, es que en un proceso de colisin (interaccin)
entre partculas, es posible que algunas o todas de las partculas iniciales
que intervienen en el proceso se aniquilen y surjan otras diferentes. Que
este hecho sea posible es una consecuencia de la equivalencia masa-energa
(ecuacin (5.12)). Es importante reiterar que los parmetros que caracterizan una clase de partculas (electrones, protones, etc.) son su masa en reposo, carga elctrica, spin, y otros nmeros cunticos. En los procesos que
son de inters para nosotros, solo va a intervenir la masa en reposo de las
partculas y por lo tanto, este nico parmetro es suficiente para caracterizar
dinmicamente a una partcula dada.
Retomando la discusin de la colisin entre dos partculas, consideremos el caso particular en el cual las partculas que intervienen en el proceso
(ecuaciones (5.30) y (5.31)) son las mismas antes y despus de la colisin. Si
m01 y m02 son las masas en reposo de las partculas, entonces de la relacin
(5.26) se tiene que
2 2
(5.32)
p21 = p02
1 = m01 c
2 2
p22 = p02
2 = m02 c

(5.33)

y por lo tanto la ecuacin (5.31) se reduce a la igualdad


p1 p2 = p01 p02

(5.34)

Teniendo presente el resultado de la ecuacin (5.29), aplicandolo a ambos


miembros de la ecuacin (5.34), se llega a que
c2 m01 m02 (v) = c2 m01 m02 (v 0 )

(5.35)

con v y v0 las velocidades relativas entre las partculas antes y despus de la


colisin, de donde se obtiene que
v = v0

(5.36)

90

CAPTULO 5. DINMICA RELATIVISTA

Por lo tanto, llegamos a la conclusin general que la magnitud de la


velocidad relativa entre las partculas no cambia. Esta situacin nos conduce
a hacer la siguiente definicin:
Una colisin entre partculas se llama elstica, si las partculas que intervienen en el proceso son las mismas antes y despus de la colisin, o
equivalentemente, si las masas en reposo de las partculas que intervienen
en la colisin no cambian. Con esta definicin, el resultado expresado en
la ecuacin (5.36) se conoce como el lema de la colisin elstica para dos
partculas. Esta definicin de colisin elstica tiene relacin con la correspondiente definicin Newtoniana de colisin elstica, pues en el lmite de
bajas velocidades se reduce a la conservacin de la energa cintica. Para ver
esto, basta con tener en cuenta la definicin de energa cintica relativista
como la diferencia entre la energa total y de reposo. Si llamamos Ei y Ef las
energas totales antes y despus de la colisin, entonces de la conservacin
de la energa total se tiene
Ei = m1 c2 + m2 c2 = m01 c2 + m02 c2 = Ef

(5.37)

Por lo tanto, la energa cintica del sistema antes y despus de la colisin


es la misma:
Ki = Ei m01 c2 m02 c2 = Ef m01 c2 m02 c2 = Kf

5.4.

(5.38)

Sistema centro de masa

Como vimos en la Proposicin 4.6, dado un c-vector V como de tiempo


siempre es posible encontrar un sistema de referencia 0 , para el cual sus
componentes se reducen a (V 0 , 0), dejando adems el signo de la primera
componente invariante, puesto que V o est dirigido al futuro (V 0 > 0) o
dirigido al pasado (V 0 < 0). Si W es otro c-vector como de tiempo, sincrono
con V , i.e., V 0 W 0 > 0, entonces en el sistema de referencia 0 se cumple
(V + W )2 = (V 0 + W 0 )2 W 2 = V 2 + W 2 + 2V 0 W 0 > 0

(5.39)

por lo tanto, se llega al siguiente resultado importante que lo enunciaremos


como un lema:
Lema 5.1 La suma de dos c-vectores como de tiempo y sincronos, es un
c-vector como de tiempo y sincrono con cada uno de los sumandos.
Por induccin este resultado es vlido para una suma cualquiera de cvectores como de tiempo sincronos.

5.4. SISTEMA CENTRO DE MASA

91

Consideremos ahora un sistema de un nmero finito de partculas no


interactuantes, salvo colisiones puntuales mutuas, con masas en reposo m0i ,
i = 1, 2, ... y c-momentos pi y sea un sistema de referencia inercial
cualquiera. Definamos la masa relativista total m
del sistema y su c-momentun
total p como
X
mi
(5.40)
m
:=
i=1

p :=

X
i=1

X
pi =
(mi c, pi ) = (mc,
p)

(5.41)

i=1

en donde hemos definido el momentun total del sistema p en la ltima igualdad de la ecuacin (5.41). De los postulados de conservacin todas las cantidades definidas, p y por tanto m
y p, son constantes en el tiempo. Por
el lema anterior, el c-momentun total del sistema es un c-vector como de
tiempo y dirigido al futuro pues mc
> 0. Por las propiedades dadas en la
Proposicin 5.1 y Proposicin 5.2, podemos encontrar un sistema de
referencia que lo llamaremos CM o sistema de referencia centro de masa,
para el cual el c-momentun total p no tenga componentes espaciales, esto es,
un sistema para el cual p = 0. La velocidad uCM del sistema de referencia
centro de masa respecto a est dada por
uCM =

p
m

(5.42)

A diferencia de la mecnica Newtoniana, el vector centro de masa de un


sistema de partculas relativistas es dependiente del sistema de referencia
inercial, lo cual se puede entender fcilmente si tenemos en cuenta que la
masa inercial de las partculas depende de la velocidad de las mismas. Sin
embargo, este vector centro de masa siempre est en reposo en el sistema
de referencia CM . Para ver esto, definamos para un sistema de referencia
inercial , el vector posicin centro de masa del sistema como
P
ri mi
(5.43)
rCM := Pi=1
i=1 mi
entonces

drCM
=
dt

dri
i=1 dt mi

+
m

dmi
i=1 ri dt

i=1 pi

= uCM

(5.44)

en donde se han utilizado las definiciones (5.42), (5.43) y (5.44), el hecho


de que m
es una constante de movimiento y adems que para interacciones

92

CAPTULO 5. DINMICA RELATIVISTA

P
puntuales (colisin) i=1 ri dmi /dt = 0 entre colisiones. Este resultado significa que para cualquier sistema de referencia, el centro de masa del sistema
se mueve con la velocidad del sistema centro de masa, lo que no significa que
el vector posicin centro de masa sea el mismo para todos los observadores
inerciales. Por esta razn, es usual definir el centro de masa del sistema como
el vector posicin rCM medido en el sistema CM .
Definida la velocidad uCM (ecuacin (5.42)), la c-velocidad del centro de
masa est dada por
UCM = (uCM )(c, uCM )
(5.45)
entonces, de la definicin de c-momentun total (ecuacin (5.41)), velocidad
del centro de masa (ecuacin (5.42) y la definicin de c-velocidad del centro
de masa (ecuacin (5.45)), tenemos que
p = (mc,
p) = m(c,
uCM ) = m
1 (uCM )UCM

(5.46)

Tomando la norma al cuadrado de esta ecuacin


2 2 (uCM )c2
p2 = m

(5.47)

la cual debe ser un invariante relativista, nos conduce a la definicin de la


masa total del sistema de partculas en el sistema de referencia centro de
masa CM :
m

(5.48)
mCM :=
(uCM )
Por lo tanto, podemos escribir el c-momentun total del sistema como
p = mCM UCM

(5.49)

en donde mCM y UCM para el sistema de partculas, juegan el papel de m0


y U para una partcula simple. Es importante aclarar que mCM , la masa en
reposo del sistema en CM , excede a la suma de las masas en reposo de las
partculas del sistema, pues a ella contribuyen tambin las energas cinticas
de las partculas individuales, puesto que la energa cintica del sistema en
CM est dada por
KCM = mCM c2 m
0 c2
(5.50)
en donde hemos definido
m
0 :=

n
X
i=1

m0i

(5.51)

5.5. ENERGA UMBRAL

5.5.

93

Energa umbral

La primera patcula fundamental que se identific fue el electrn, el cual


era el responsable de la conduccin elctrica. Luego a comienzos de la dcada
de los treinta, se identificaron el protn y el neutrn como los constituyentes
del ncleo atmico. Por esta poca Yukawa desarroll un modelo para la
interaccin nuclear, en el cual surga una nueva partcula fundamental, el
pin, que luego fue observada experimentalmente. Esta poca se puede considerar como el comienzo de la fsica de las partculas fundamentales y ya
en la dcada de los sesenta, se conocian cientos de nuevas partculas, las
cuales se podan producir en el laboratorio como producto de las colisiones
entre partculas aceleradas a altas energas (por ejemplo electrones contra
electrones o protones). Cuando chocan dos partculas con energa cintica
suficiente, se pueden generar nuevas y ms masivas partculas, como el resutaldo de la transformacin de energa cintica en energa en reposo de
las nuevas partculas. La pregunta dinmica que surge es Cual en la energa mnima necesaria de las partculas incidentes, para producir una nueva
partcula de una masa dada?. La respuesta a esta pregunta la constituye el
llamado problema de la energa umbral, que es una de las aplicaciones ms
importantes de la dinmica relativista.
Para introducir el concepto de energa umbral, consideremos por ejemplo un electrn de masa en reposo m0 y energa total E = mc2 , que choca
contra otro electrn en reposo y como producto de la colisin surge, adems
de los dos electrones iniciales, una nueva partcula de masa en reposo M0 .
El problema es encontrar la energa mnima necesaria del electrn incidente,
llamada energa umbral, para que esta reaccin pueda suceder. La respuesta
no es simplemente (m + M0 )c2 , i.e., que la energa cintica del electrn incidente sea justamente la energa en reposo de la nueva partcula, pues dado
que el momentun del sistema debe conservarse, el producto de la colisin
en general, debe poseer alguna energa cintica y por lo tanto parte de la
energa inicial debe gastarse en esta energa cintica y la otra parte debe
suplir la energa en reposo de la nueva partcula. De cualquier manera, la
energa mnima (umbral) se tendr cuando las partculas resultantes de la
colisin estn en reposo en el sistema de referencia del centro de masa del
sistema. Esta ltima afirmacin define el concepto de energa umbral.
Tomemos por el momento el caso general de dos partcula de masas en
reposo m01 y m02 y c-momentos p1 y p2 respectivamente, que al chocar producen una nueva partcula de masa en reposo M0 . Entonces, el c-momentun

94

CAPTULO 5. DINMICA RELATIVISTA

total del sistema est dado por:


p = p1 + p2

(5.52)

Elevando al cuadrado esta expresin y teniendo en cuenta la ecuacin


(5.29) y la definicin (5.48), tenemos
m201 c2 + m202 c2 + 2m01 m2 c2 = p2 = m2CM c2

(5.53)

De esta relacin se obtiene que la energa de la partcula incidente, en el


sistema de referencia del laboratorio, ser mnima cuando mCM sea mnima,
lo cual ocurre cuando todas las partculas emergentes estn en reposo en el
sistema de referencia centro de masa. Puesto que en este caso la masa del
sistema centro de masa coincide con la suma de las masas en reposo de las
partculas que salen, el lmite de mnima energa (5.53) se reduce a
m201 + m202 + 2m01 m02 (v) = (m01 + m02 + M0 )2

(5.54)

siendo v la velocidad de incidencia de la partcula 2. Dadas las masas de las


partculas iniciales y la masa de la nueva partcula, podemos obtener de esta
ecuacin la velocidad de la partcula incidente y as la energa umbral. Para
el ejemplo de los dos electrones, que al colisionar crean una nueva partcula
de masa en reposo M0 , podemos despejar de la ecuacin (5.54) el factor
(v):
2M0 M02
(v) = 1 +
+ 2
(5.55)
m0
m0
y por lo tanto la energa umbral est dada por
EU = m0 (v)c2 = m0 c2 + 2M0 c2 +

M02 2
c
m0

(5.56)

Esta ecuacin es fundamental cuando se disean experimentos para buscar nuevas partculas. Como ejemplo, tomemos el caso del ltimo de los
quarks buscado por los fsicos de altas energas, el quark top , el cual fue
detectado en el ao de 1995 en el Fermilab (Estados Unidos). Es importante
anotar que el clculo que vamos a mostrar, es tan solo un estimado de la
mnima energa a partir de la cual podra detectarse el quark, pues en la
reaccin donde aparece el quark, tambin pueden aparecer otras partculas
y por lo tanto, para un clculo ms exacto se debe tener en cuenta estos
efectos adicionales. El quark top se espera que aparezca en una colisin
protn-antipron (p p) y supongamos para simplificar, que despus de la
colisin permanece el par (p p) y el quark . Las predicciones tericas de

5.5. ENERGA UMBRAL

95

la existencia del quark , as como su posible masa, dependen del modelo


terico utilizado, pues por ejemplo, tomando los modelos ms aceptados en
julio de 1994 (tomados del Particle Physics Booklet, July 1994, American
Institute of Physics) la masa predicha para el quark oscilaba entre 62Gev/c2 ,
pasando por 131Gev/c2 y 174Gev/c2 , hasta el valor ms alto de 169Gev/c2 ,
calculado a partir del modelo estandar electro-dbil. Tomando para la masa
del protn m0 = 0,94Gev/c2 , que es la misma masa del antiprotn, obtenemos de la ecuacin (5.56) la energa umbral en el sistema laboratorio para
la creacin del quark top
(5.57)
EU = 32557Gev
asumiendo una masa para el quark top de 174Gev/c2 . Es importante anotar
que esta energa umbral calculada, corresponde a la energa con la que deben
incidir, por ejemplo los protones sobre los antiprotones estacionarios, para
que esta reaccin pueda ocurrir. En la prctica, las energas alcanzadas hasta
el presente en los grandes aceleradores estn en el orden de los cientos de
Gev. Sin embargo, en la mayora de los aceleradores los experimentos se
realizan en el sistema centro de masa directamente, pues tanto los protones
como los antiprotones (o electrones) son acelerados a las mismas energas
en un anillo, viajando en direcciones opuestas y por lo tanto la energa a
la cual ellos son acelerados debe ser del orden de la energa umbral en el
sistema centro de masa, que para nuestro caso corresponde a energas del
orden de la masa en reposo de la partcula que se quiere encontrar, estos es
a energas del orden de los 200Gev. Para ilustrar esta situacin, calculemos
la energa disponible en un experimento de dispersin de protones contra
protones (o antiprotones) en dos casos: En el primer caso, los protones son
acelerados hasta alcanzar una energa de 100GeV y chocan contra un blanco
de protones en reposo (por ejemplo un gas de hidrgeno a baja temperatura,
para el cual podemos despreciar la energa cintica tpica de las partculas
del gas). En un segundo experimento, los protones son acelerados a energas
del orden de 50GeV , se divide el rayo en dos partes y se hacen chocar los dos
haces de protones frontalmente. Sean p y q los c-momentos iniciales de los
protones y sea ECM la energa del sistema en el centro de masa. De acuerdo
a las ecuaciones (5.47) y (5.48) la cantidad
2
(p + q)2 = m2CM c2 = ECM
/c2

(5.58)

es un invariante, la cual puede ser evaluada en cualquier sistema de referencia. Para el primer caso, protones chocando con un blanco estacionario
p = (E1 /c, p1 ) y q = (mp0 c, 0), tenemos
2
= 2m2p0 c4 + 2E1 mp0 c2 ' 2E1 mp0 c2
ECM

(5.59)

96

CAPTULO 5. DINMICA RELATIVISTA

pues, mp0 c2 E. Con E1 = 100GeV y mp0 c2 = 0,94GeV , la energa


disponible es del orden de 13,7GeV .
Para el segundo experimento, p = (E2 /c, p2 ) y q = (E2 /c, p ), por lo
tanto, la energa disponible est dada por:
2
= 4E22 = ECM = 100GeV
ECM

(5.60)

Para alcanzar esta energa en el experimento de blanco estacionario, sera


necesario acelerar los protones hasta una energa del orden de
E1 '

5.6.

2
ECM
' 5319GeV
2mp0 c2

(5.61)

Fotones y partculas de masa en reposo cero

En esta seccin vamos a introducir el concepto de partcula de masa en


reposo cero, y en particular el concepto de fotn, como la partcula portadora de la interaccin electromagntica. El concepto de fotn o quantum
de energa est estrechamente relacionado con la teora cuntica, pero como
veremos enseguida su origen es estrictamente relativista. No est dentro de
los objetivos de este libro discutir la formulacin de la teora cuntica de
campos, pues no es necesario tener un conocimiento en fsica cuntica, para
entender los ejemplos y procesos que vamos a desarrollar a lo largo del presente captulo. Sin embargo, haremos un breve recuento de los principales
hechos histricos que contribuyeron al desarrollo del concepto de fotn.
En la segunda mitad del siglo XIX, cuando la teora de Maxwell se consolida con los experimentos de Herz sobre ondas electromagnticas, se plantean
varios problemas en diferentes reas de la fsica, que finalmente conducen
al desarrollo de la mecnica cuntica. En el campo de la espectroscopia se
tena el problema de explicar la estructura y en particular, el espectro de
emisin y absorcin de radiacin electromagntica por tomos. En el experimento de Herz sobre las ondas electromagnticas, se reporta un fenmeno
curioso que luego, en experimentos ms detallados conducen al descubrimiento del efecto fotoelectrico, esto es, la produccin de una corriente elctrica
(fotocorriente) en un material, debido a la incidencia de radiacin electromagntica. El problema surge, cuando todos los intentos tericos basados
sobre la electrodinmica de Maxwell, fallan para explicar las caractersticas
de este efecto. Hacia finales del siglo XIX, Max Planck trabajando sobre
el espectro de radiacin de cuerpo negro, introduce la hiptesis de la emision y absorcin discreta de energa de los osciladores del cuerpo negro, el

5.6. FOTONES Y PARTCULAS DE MASA EN REPOSO CERO

97

cual se puede modelar por una cavidad cerrada, en la cual se encuentra radiacin electromantica en equilibrio trmico a una temperatura T dada.
Esta radiacin a su vez, est en equilibrio termodinmico con el material
que conforma la cavidad que est emitiendo y absorviendo continuamente
radiacin electromagntica. Contrario a la situacin clsica, para la cual se
espera que un oscilador pueda absorber o emitir energa en cualquier cantidad, Planck postul que cada oscilador poda enmitir o absorber energa
nicamente en valores discretos, mltiplos de una cantidad fundamental
E = h

(5.62)

en donde es la frecuencia de la radiacin electromagntica emitida o


absorvida y h se conoce como la constante de Planck, cuyo valor actual
6,626075(40) 1034 J s. Seis aos despus en 1905, Einstein extiende esta
hiptesis y postula que la radiacin electromagntica energa est cuantizada y no solamente los osciladores materiales que emiten y absorven la
radiacin. As una onda electromagntica de frecuencia transporta su energa en paquetes o quantos de energa, llamados fotones, de valor h. Con
esta hiptesis, Einstein explica el efecto fotoelctrico y predice adems que
de acuerdo a la equivalencia masa-energa, los fotones deben transferir momentun al igual que cualquier otra partcula. La diferencia con las partculas
usuales, tales como el electrn o el protn, est en su masa en reposo, como
veremos enseguida.
Partiendo de la definicin de las componentes del c-momentun (ver ecuacin (5.4))
(5.63)
p = (E/c, p)
y de sus propiedades, ecuacin (5.24) o equivalentemente ecuacin (5.28),
se tiene la relacin, entre la energa total de la partcula E, su energa en
reposo E0 y su momentun p:
E 2 = E02 + |p|2 c2

(5.64)

Esta relacin nos permite considerar el caso de una partcula de energa


en reposo nula, i.e., E0 = 0. Esto implica por una parte, que su masa en
reposo es cero m0 = 0 y adems, que la norma del c-momentun de esta
partcula es un c-vector como de luz, pues su norma se anula
p2 = E 2 /c2 |p|2 = 0

(5.65)

Estas partculas se llaman partculas de masa en reposo nula y su principal caracterstica es que sus lneas de universo siempre estn sobre el cono

98

CAPTULO 5. DINMICA RELATIVISTA

de luz y por lo tanto no existe ningn observador inercial para el cual estas
partculas estn en reposo. La ecuacin (5.65) nos da la relacin entre el
momentun fsico y la energa total de las partculas de masa en reposo nula.
El fotn, que es la partcula asociada al campo electromagntico, es un caso
particular de partcula de masa en reposo nula.
Consideremos ahora el c-vector de onda
k = (/c, k)

(5.66)

definido en el captulo anterior (seccin (4.4)), que nos representa una onda
electromagntica plana de frecuencia y nmero de onda k y postulemos,
de acuerdo a Einstein, que esta onda transporta su energa y momentun en
quantos o fotones, cuyo c-vector momentun est dado por:
p := ~k = (~/c, ~k)

(5.67)

en donde se ha introducido la constante ~, relacionada con la constante de


Planck por ~ = h/2. De esta relacin se sigue que el fotn transporta una
energa total
E = ~ = h
(5.68)
pues = 2, de acuerdo al postulado original de Einstein y un momentun
fsico
p = ~k
(5.69)
que de acuerdo a las propiedades del c-vector de onda (ecuacin (4.57)),
la energa (ecuacin (5.68)) y el momentun fsico (ecuacin (5.69)), deben
cumplir la relacin
(5.70)
~2 k 2 = E 2 /c2 |p|2 = 0
la cual nos define una partcula de masa en reposo nula, teniendo en cuenta
la ecuacin (5.65). Las partculas de masa en reposo cero pueden tener tambin otras caractersticas que las diferencian entre si, tales como la carga,
momento magntico, etc.. A parte del fotn, en la naturaleza se encuentran
otras partculas de masa en reposo cero, como por ejemplo los neutrinos.
Es importante anotar que la fsica busca permanentemente nuevos experimentos para determinar si estos neutrinos son realmente partculas de masa
en reposo cero, o si estos poseen una masa en reposo. Hasta el presente se
ha determinado que la masa es reposo de estos neutrinos, si la tienen, es
inferior a 17kev/c2 , que al compararla con la masa del electrn (la partcula
estable de menor masa en reposo conocida) m0 = 0,51M ev/c2 , es realmente
muy pequea. De hecho para el fotn tambin se han realizado experimentos

5.6. FOTONES Y PARTCULAS DE MASA EN REPOSO CERO

99

para imponerle cotas superiores a su masa en reposo. Como ya se ha dicho


en la introduccin de esta seccin, el caracter dual que presentan las ondas
electromagnticas, esto es, para cierto tipo de fenmenos, como el efecto
fotoelectrico o el efecto Compton (que discutiremos ms adelante), para los
cuales la luz interacciona como partculas, contrasta con otros fenmenos
tpicos del caracter ondulatorio de la luz, como los efectos de interferencia
o difraccin. Esta dualidad es una caracterstica general de toda la materia
cuyo estudio le corresponde a la mecnica cuntica. Esta dualidad es tal
vez, uno de los aspectos ms interesantes que presenta la naturaleza y su
interpretacin ha sido objeto de muchos trabajos. La teora de la relatividad no pretende conciliar estas ideas y de hecho, este comportamiento dual
aparentemente contradictorio, no se presenta como un problema en el contexto de la teora de la relatividad, pues tanto las ondas electromagnticas,
como las partculas de masa en reposo cero (y en particular los fotones) son
conceptos relativistas y su relacin fsica se establece solo a travs del postulado de cuantizacin de la energa de Planck, el cual en ningn momento
entra en contradiccin con los principios bsicos de la relatividad.
Para finalizar esta seccin, retomaremos algunos resultados generales
de la dinmica relativista, que siguen siendo vlidos si alguna o todas las
partculas que intervienen en el proceso son de masa en reposo nula, como
por ejemplo la emisin de un fotn por un tomo.
En primer lugar consideremos el caso de dos partculas de c-momentun
p1 y p2 , para el cual el producto interno Minkowskiano est dado por la
relacin invariante ecuacin (5.29). Si una de las partculas es un fotn, e.g.,
la partcula 2, entonces m02 = 0 y podemos escribir esta relacin en la forma:
p1 p2 = cm01 E2

(5.71)

en donde p1 = (m1 c, p1 ) y p2 = (E2 /c, p2 ), con E2 la energa del fotn


en el sistema de referencia propio de la partcula 1. En el caso en que
las dos partculas sean fotones, la relacin (5.29) se vuelve indeterminada. Para encontrar la relacin correcta, supongamos que p1 = (E1 /c, p1 ) y
p2 = (E2 /c, p2 ). Como p1 y p2 son c-vcectores nulos, se debe cumplir que
|pi | = Ei /c, para i = 1, 2, entonces de la definicin de producto interno
Minkowskiano se tiene:
p1 p2 = E1 E2 /c2 p1 p2 =

E1 E2
(1 cos )
c2

(5.72)

en donde es el ngulo formado por los vectores momentun de las partculas, que para el caso de fotones, sera el ngulo entre las direcciones de
propagacin de las ondas electromagnticas o fotones.

100

CAPTULO 5. DINMICA RELATIVISTA

Otra relacin que permanece vlida para el caso de partculas de masa


en reposo cero, se refiere al problema de la energa umbral, ecuacin (5.53).
Si por ejemplo la partcula que choca es un fotn, entonces m2 = ~/c2 ,
m02 = 0 y por lo tanto
(5.73)
mCM = m01

Captulo 6

Aplicaciones de la dinmica
relativista
6.1.

Introduccin

En este captulo daremos algunos ejemplos de procesos dinmicos, los


cuales ilustran los fenmenos y aplicaciones ms importantes de la teora
especial de la relatividad y ms especficamente, de los postulados de conservacin de la energa y el momentun. Restringiremos nuestra discusin a
procesos de colisin entre partculas puntuales, i.e., consideraremos nicamente interacciones de contacto, sin entrar en los detalles de las interacciones (fuerzas) que rigen estos procesos. Como se mencion al comienzo del
captulo anterior, de las cuatro interacciones fundamentales que determinan
la dinmica de todos los procesos conocidos, solamente la interaccin electromagntica admite una descripcin clsica relativista. Dejaremos para el
captulo sobre electrodinmica, el problema de formular las ecuaciones de
movimiento de partculas cargadas en campos electromagnticos.

6.2.

Colisiones elsticas

El ejemplo ms importante de una colisin elstica, tanto por su importancia histrica como por sus aplicaciones prcticas, lo constituye el proceso
de dispersin Compton. Este proceso, llamado energa efecto Compton, jug
un papel fundamental en el desarrollo de la mecnica cuntica, pues ste
ofreci una de las primeras pruebas directas del carcter corpuscular de la
luz y de paso tambin, una prueba ms de la dinmica relativista. A. H.
Compton recibi el premio nobel en 1927 por el estudio de este efecto (ver,
101

102 CAPTULO 6. APLICACIONES DE LA DINMICA RELATIVISTA

Figura 6.1: Efecto Compton


por ejemplo, el artculo original: Compton A.H., 1923, Phys. Rev. 22,409).

6.2.1.

Efecto Compton

La dispersin Compton es el proceso de colisin elstico entre una partcula de masa en reposo cero (e.g., un fotn) contra una partcula masiva (e.g.,
un electrn). El experimento original se realizo haciendo colisionar fotones
de alta energa (como rayos X o rayos gama) contra electrones practicamente
en reposo, es decir, electrones con energas cinticas mucho menores que las
energas tpicas de los fotones.
Tomemos el eje z en la direccin de incidencia del fotn (ver Figura 6.1),
entonces su c-momentun inicial se puede escribir como
p = (E /c, p )

(6.1)

con E = h la energa, siendo la frecuencia del fotn incidente y p =


(0, 0, E /c) su momentun, en donde se ha hecho uso de la relacin (5.65). El
c-momentun inicial del electrn en reposo est dado por:
pe = (me0 c, 0)

(6.2)

6.2. COLISIONES ELSTICAS

103

Figura 6.2: Lineas de universo del efecto Compton


Sean
p0 = (E0 /c, p0 )

p0e = (me c, p0e )

(6.3)

los correspondientes c-momentos del fotn y del electrn despus de la colisin. Sin prdida de generalidad, supongamos que el plano en el cual se
realiza la colisin es el x z y sea el ngulo que forma la direccin de
dispersin del fotn con respecto al eje z y el ngulo respecto al eje z de
dispersin del electrn. Entonces de la conservacin del c-momentun total
del sistema, tenemos
(6.4)
p + pe = p0 + p0e
En la Figura 6.2 se muestran las lneas de universo del electrn y el fotn
en el sistema de referencia del laboratorio. La lnea de universo del fotn,
dibujada a 45o en un plano paralelo al plano ct z, intercepta a la lnea
de universo del electrn en reposo, evento P. En este punto el electrn es
dispersado, siguiendo una lnea de universo dentro del cono de luz del evento
P, mientras que el fotn es dispersado en otra direccin, siguiendo una lnea
de universo sobre el cono de luz del evento P.
Puesto que experimentalmente se mide la frecuencia (energa) o longitud de onda del fotn dispersado, en funcin del ngulo de dispersin y de
la frecuencia o longitud de onda del fotn incidente, despejemos p0e de la

104 CAPTULO 6. APLICACIONES DE LA DINMICA RELATIVISTA


ecuacin (6.4) y tomando la norma al cuadrado de esta ecuacin resultante,
obtenemos:
(6.5)
(p + pe p0 )2 = (p0e )2

Teniendo en cuenta que

p2 = p02
=0

(6.6)

2 2
p2e = p02
e = me0 c

(6.7)

y
llegamos finalmente a la relacin:
p p0 + pe (p0 p ) = 0

(6.8)

Utilizando la ecuacin (5.72) para el producto punto entre c-vectores


nulos y de las expresiones (ecuaciones (6.1) a la (6.2)) para los c-momentun
del electrn y los fotones inicial y final, obtenemos
E E0
(1 cos ) + me0 (E0 E ) = 0
(6.9)
c2
Expresando las energas de los fotones en trminos de la longitud de onda
asociada, E = h = hc/ y E0 = h 0 = hc/0 , obtenemos finalmente, la
expresin estandar para la dispersin Compton, la cual nos da la diferencia
entre las longitudes de onda dispersada e incidente, en funcin del ngulo
de dispersin :
(6.10)
0 = e (1 cos )

A la cantidad e := h/me0 c se le llama longitud de onda de Compton asociada al electrn. En la (Figura 6.3) se reproducen los resultados originales
de Compton.
En 1950 Cross y Ramsey (Cross W.G. and Ramsey N.F., 1950, Phys.
Rev. 80,929) midieron por primera vez al electrn dispersado simultneamente con el fotn, en un experimento de coincidencia, obteniendo resultados
en concordancia con la teora. Para calcular el ngulo de dispersin del
electrn, en funcin del ngulo de dispersin del fotn y de la energa del
fotn incidente, despejemos la velocidad del electrn de las componentes
espaciales de la ecuacin (6.4) y eliminando E0 en esta expresin, con la
ayuda de la ecuacin (6.9), obtenemos:
tan =

me0c c2 sin
(E + me0 c2 )(1 cos )

(6.11)

en donde es el ngulo de dispersin del electrn, medido con respecto a


la direccin de incidencia del fotn. En el experimento de coincidencia de
Cross y Ramsey se midi un ngulo = 31,3 , para una energa del fotn
incidente de 2,6M ev y un ngulo = 30,0 para el fotn dispersado.

6.2. COLISIONES ELSTICAS

105

Figura 6.3: Resultados experimentales de Compton

6.2.2.

Efecto Compton inverso

Como otro ejemplo de colisin elstica, consideremos la dispersin de


un fotn de muy baja energa por una partcula, por ejemplo un protn,
de alta energa. Despus de la colisin la partcula masiva le cede parte de
su energa cintica al fotn, el cual se dispersa con una frecuencia mayor
dependiente del ngulo de dispersin. Por esta razn, a este proceso lo llamaremos efecto Compton inverso. El desarrollo matemtico es similar al del
efecto Compton tratado en el pargrafo precedente, aun cuando algo ms
complejo, pues la partcula est inicialmente en moviento. Para discutir un
fenmeno interesante que se puede presentar con los rayos csmicos y los
fotones de la radiacin csmica de fondo, vamos a restringir la discucin a
un caso particular de este proceso de dispersin.
Supongamos que la energa del fotn inicial E es mucho menor que la
energa total de la partcula incidente Ep = mp c2 , i.e., E mp c2 y consideraremos solamente el caso de mxima transferencia de energa en el proceso
de colisin, que de acuerdo con la relacin (ecuacin (6.10)) se obtiene para
el caso de dispersin frontal, es decir = 180. Sea p = (E /c, p ) el cmomentun del fotn y pp = (Ep /c, pp ) el c-momentun del protn antes de
la colisin y sean p0 = (E0 /c, p0 ) y p0p = (Ep0 /c, p0p ) los correspondientes
c-momentos despus de la colisin. De manera similar al caso tratado para

106 CAPTULO 6. APLICACIONES DE LA DINMICA RELATIVISTA


el efecto Compton, despejamos p0p de la ecuacin de conservacin (6.4) y
elevando al cuadrado, obtenemos
p p0 + pp (p0 p ) = 0

Teniendo en cuenta que |p | = E /c, p0 = E0 /c y utilizando la
imacin
q
m2p0 c4
|pp | c = Ep2 m2p0 c4 Ep
2Ep
obtenemos, para la energa del fotn dispersado


E (Ep + Pp c)
Ep

E0 =
2
2E + Ep |pp | c
1 + mp0 c4 /E E p

(6.12)
aprox(6.13)

(6.14)

El modelo estandar de la cosmologa describe la estructura y evolucin


del universo actual, postulando su origen a partir de un estado inicial de
altsima densidad y temperatura (en principio infinitas). Una de las predicciones fundamentales del modelo estandar es la existencia de un fondo de
radin csmica (radiacin electromagntica con un espectro de cuerpo negro), el cual se ha ido enfriando debido a la expansin del universo, alcanzando una temperatura actual del orden de 2,73 K. Esta radiacin csmica de
fondo se puede modelar como un gas de fotones, con una cierta distribucin
de energas. En promedio un fotn tpico de este fondo de radiacin tiene
una energa media dada por
E = kB T

(6.15)

en donde T es la temperatura absoluta de 2,73 K y


kB = 1,380 1023 J K 1 = 8,617 105 eV K 1

(6.16)

es la constante de Boltzmann.
Por otra parte, los rayos csmicos son haces de partculas elementales
(en su mayora electrones y protones) de alta energa E 1020 eV , cuya
fuente, aun cuando no est completamente determinada, parece ser de origen
galctico. Un protn tpico de estos rayos csmicos, puede entonces dispersar
elsticamente un fotn del fondo de radin csmica y suministrarle entonces
una energa, que de acuerdo a la relacin (5.39), es del orden de
E0 '

1020 eV
1 + (0,938

109 )2 /(1020

2,37 104 )

' 2,6 1018 eV

(6.17)

Es decir, el fotn dispersado puede adquirir energas tpicas de los rayos


gama.

6.3. COLISIONES INELSTICAS

6.3.

107

Colisiones inelsticas

Las aplicaciones ms importantes de la dinmica relativista se encuentran en los procesos de dispersin inelsticos, tales como la absorcin y
emisin de fotones y la creacin de nuevas partculas. Cuando colisionan
dos partculas, se pueden producir muchos tipos de efectos que podemos
esquematizar en los siguientes tipos de reacciones:
A+B =C
A+B =A+B+C
A+B =A+C
A+B =C +D+F +

(6.18)

La primera reaccin por ejemplo, representa un proceso en el cual las


partculas que chocan se aniquilan, para dar lugar a una nueva particula (por partcula queremos significar tanto las partculas elementales, como
aquellas que presentan estructura interna o estn conformadas por otras
partculas elementales, tales como los tomos, molculas o ncleos). La segunda reaccin representa un proceso en el cual las partculas iniciales sobreviven a la colisin, dando lugar a una nueva partcula. En el tercer caso,
una de las partculas que entra en la reaccin se aniquila, dando lugar a la
creacin de otra y en la ltima reaccin las partculas iniciales desaparencen y surgen varias partculas nuevas. Que leyes fsicas determinan cul o
cules reacciones pueden ocurrir?. En primer lugar estn las leyes de conservacin, las cuales determinan si un proceso dado puede o no suceder.
Tomemos como ejemplo un fotn que choca contra un electrn inicialmente
en reposo y captura al fotn, saliendo el electrn con cierta energa cintica.
n) los c-momentos iniciales del elecSean p = (me0 c, 0) y q = (E /c, E /c
trn y el fotn respectivamente, con n
un vector unitario en la direccin
n) el c-momentun del
de movimiento del fotn incidente y sea p0 = (mc, mv
electrn depus de la colisin. Al aplicar el postulado de la conservacin del
c-momentun, p + q = p0 , obtenemos un resultado inconsistente, pues basta
con elevar al cuadrado esta expresin:
m2e0 c2 + 2me0 E = (p + q)2 = p02 = m2e0 c2

(6.19)

la cual implica que me0 = 0 o E = 0. Esto significa que este proceso es


prohibido, pues viola el principio de conservacin del c-momentun. En segundo lugar existen otros principios de conservacin los cuales, en general,
dependen de la interaccin (fuerte, electromagntica, dbil o gravitacional)
que media el proceso de colisin y que de igual manera, a los principios fundamenta de conservacin de la energa y momentun, restringen los procesos

108 CAPTULO 6. APLICACIONES DE LA DINMICA RELATIVISTA


que puedan ocurrir en una colisin entre partculas. Algunos de estos principios de conservacin son de validez general, tal como la conservacin de
la carga elctrica, mientras que otros, como la conservacin del nmero barinico o la paridad, solamente se cumplen para unas interacciones pero no
para otras. Por ejemplo, la interaccin electromagntica conserva la paridad,
pero la interaccin bbil no la conserva.

6.3.1.

Absorcin de un fotn por un tomo

Antes de entrar en el problema de absorcin de un fotn por un tomo, es


importante aclarar la diferencia, desde la ptica de la dinmica relativista,
entre un tomo y una partcula elemental. La partcula elemental est caracterizada por su masa propia y eventualmente por otros nmeros cunticos
como la carga, el spin, el isospin, etc, y basta que uno de estos parmetros
sea diferente para que se tenga otra partcula elemental diferente. Un tomo,
por otra parte, est caracterizado por su nmero atmico (i.e., el nmero
de electrones o protones el cual determina sus propiedades qumicas) y su
nmero de nucleones (protones ms neutrones del ncleo) el cual determina
los diferentes ispos de un mismo elemento qumico. La masa propia de los
tomos no es estrictamente un parmetro que determine un tipo particular
de tomos, pues dado que los atmos presentan estructura interna, (como
los diferentes niveles de energa) la energa cintica de las partculas que
lo constituyen y la energa potencial de interaccin entre ellas contribuyen
tambin a la masa propia de los tomos. Es de anotar, que si bien la contribucin a la masa de los tomos debida a esta energa interna, es muy
pequea comparada con la suma de las masas de las partculas que lo conforman, si hacen una diferencia fundamental, cuando se trata el problema
dinmico de la emisin y absorcin de fotones por tomos, como veremos en
esta seccin. As, un tomo que a emitido o absorbido un fotn, tendr una
masa propia diferente antes y despus del proceso, sin que cambien necesariamente sus propiedades qumicas y por lo tanto desde el punto de vista de la
dinmica relativista relativista, estos tomos son partculas diferentes antes
y despus de la emisin o absorcin de un fotn. Esta misma situacin sigue
siendo vlida, an en el caso en que el tomo se ionise (pierda uno o varios
de sus electrones) y tambin cuando estamos tratando con otras estructuras
como los ncleos atmicos. Por esta razn, una partcula elemental (sin estructura interna) aislada, tal como un electrn, no puede emitir o absorber
un fotn individual, sin violar los principios de conservacin fundamentales
como vimos en el ejemplo tratado anteriormente.
Consideremos una partcula no elemental (tomo, molcula, in o ncleo)

6.3. COLISIONES INELSTICAS

109

Figura 6.4: Lineas de universo del tomo y el fotn capturado


con masa en reposo M0 , sobre la cual incide un fotn de frecuencia , el
cual es absorbido por la partcula. En la Figura 6.4 se muestra el proceso
de absorcin de un fotn por un tomo. La lnea de universo del tomo
inicialmente en reposo, intercepta a la lnea de universo del fotn, evento
P. El tomo captura al fotn y se dispersa siguiendo una lnea de universo
recta, la cual est dentro del cono de luz futuro del evento P.
Sea M00 la masa de la partcula despus de la colisin y calculemos,
suponiendo que la partcula inicial est en reposo, la velocidad con que
n) los csale la partcula final. Llamemos p = (M0 c, 0) y q = (E /c, E /c
momentos iniciales de la partcula y el fotn respectivamente, en donde E =
h y n
es un vector unitario en la direccin de propagacin del fotn. El cn), pues por la conservacin
momentun final del sistema ser p0 = (M 0 c, M 0 v
del momentun, la direccin de movimiento de la partcula final es la misma
que la del fotn incidente, siendo v su velocidad y
p
M 0 = M00 / 1 v 2 /c2

(6.20)

De la conservacin del c-momentun p + q = p0 podemos despejar directamente, elevando al cuadrado esta expresin, la masa en reposo de la

110 CAPTULO 6. APLICACIONES DE LA DINMICA RELATIVISTA


partcula final
M00

= M0

2E
M0 c2

1+

(6.21)

Escribiendo explcitamente en componentes la ecuacin de conservacin


del c-momentun
M0 c2 + E = M 0 c2
(6.22)
E /c = M 0 v
podemos calcular la masa relativista y la velocidad de la partcula final:
M 0 = M0 +
=

E
c

v
c=

E
M0 c2 +E

(6.23)
(6.24)

Las partculas con estructura interna, como los tomos, molculas y ncleos, poseen niveles de energa internos Ei con i = 0, 1, 2, ..., (en donde
el nivel E0 se le llama estado base o fundamental del sistema) y por lo
tanto el proceso de absorcin de fotones por este tipo de partculas es selectivo, esto es, la partcula solo puede absorber fotones de ciertos valores
de energa que cumplan con la condicin que Ej Ek ' E , estrictamente
E > Ej Ek , pues parte de la energa del fotn incidente debe gastarse
en la energa cintica final del tomo (lo cual se deduce de las ecuaciones
(6.23) y (6.24)). En un tomo por ejemplo, la diferencia tpica entre niveles
de energa est en el rango de los electronvoltios. Puesto que la masa propia
de los tomos oscila entre 1GeV /c2 (para el tomo de hidrgeno) hasta los
cientos de gigaelectronvoltios (para tomos pesados), la fraccin E /M0 c2 es
del orden de 108 , calculada para el caso de un tomo de hidrgeno, mientras que la diferencia entre niveles de energa es inferior a 13,6eV (valor que
corresponde a la energa de ionizacin del tomo de hidrgeno).
De la ecuacin (6.21) vemos que la masa propia del tomo exitado (que
ha absorbido el fotn) es tan solo una fraccin del orden de 108 mayor que
la masa del tomo inicial. Por otra parte, la velocidad del tomo exitado
est dada por la ecuacin (6.24)), obteniendose
v = 108 c

(6.25)

en donde para estos clculos, hemos asumido un valor tpico de 10eV para
la energa E del fotn incidente.
Es de anotar que si incide un fotn sobre un tomo con una energa
mayor a la de ionizacin, el fotn puede ser capturado por el tomo, o ms

6.3. COLISIONES INELSTICAS

111

exactamente por un electrn del tomo, el cual se desprende del sistema con
una energa cintica igual al exceso de energa del fotn sobre la energa de
ionizacin. Este proceso, diferente al que estamos considerando, es la base del
efecto fotoelctrico el cual, como y se ha mencionado anteriormente, jug
un papel fundamental en el desarrollo de la mecnica cuntica. Si llamamos
la energa de ligadura del electrn al tomo, o a la estructura de tomos
para el caso de un slido (llamada tambin funcin trabajo del material), y
E = h a la energa del fotn incidente, entonces si este fotn es absorbido
por el slido, el electrn se puede desprender del material, con una energa
cintica dada por
(6.26)
Ke = h
La energa cintica de los electrones desprendidos, llamados fotoelectrones, se puede medir utilizando un contravoltaje. La ecuacin (6.26) presenta dos caractersticas importantes probadas experimentalmente, las cuales
no pueden ser explicadas con un modelo ondulatorio de la luz: La primera
caracterstica es la relacin lneal entre la frecuencia de la luz incidente, sin
importar cual sea la intensidad de ella (la intensidad de la luz, en el modelo
ondulatorio es proporcional al cuadrado de la amplitud de los campos electromagnticos, mientras que en el modelo corpuscular de la luz, la intensidad
es proporcional a la densidad de fotones). La segunda caracterstica importante, es la existencia de una frecuencia umbral 0 , por debajo de la cual no
hay corriente de fotoelectrones, la cual se obtiene cuando Ke = 0 = h 0
y que depende del material, pues la funcin trabajo es una propiedad del
material, ms no de la radiacin electromagntica incidente.

6.3.2.

Emisin de un fotn por un tomo exitado

Consideremos ahora el proceso inverso al descrito en la seccin anterior.


Supongamos que un tomo exitado de masa propia M0 , inicialmente en
reposo, emite un fotn de frecuencia , esto es, de energa E = h.
En la Figura 6.5 se muestran las lneas de universo del proceso de emisin
de un fotn por un tomo. El tomo exitado, inicialmente en reposo, emite
un fotn: evento P. El fotn emitido sigue una lnea de universo que est
sobre el cono de luz futuro del evento P, en tanto que la lnea de universo
del tomo dispersado es descrito por la lnea recta, interior al cono de luz
del evento P.
De manera similar al caso tratado en la seccin anterior, la energa del
fotn emitido no puede ser exactamente igual a la diferencia entre dos niveles
de energa del tomo, de hecho debe ser ahora menor E < Ej Ek E0 ,

112 CAPTULO 6. APLICACIONES DE LA DINMICA RELATIVISTA

Figura 6.5: Lineas de universo del tomo y el fotn emitido


pues por conservacin de momentun el tomo, al emitir el fotn, debe sufrir
un retroceso y por lo tanto parte de la energa suministrada por el tomo
al realizar la transicin, debe ser transformada a energa cintica del tomo
final. Es de anotar que esta energa E0 corresponde tambin a la diferencia
entre las energas en reposo de los tomos inicial y final, i.e.,
E0 = M0 c2 M00 c2

(6.27)

Una variable de inters en este proceso es la relacin entre la energa


del fotn emitido, con respecto a la diferencia entre dos niveles internos de
energa del tomo, o equivalentemente, a la energa de un fotn emitido por
el tomo, si este no sufriera retroceso. Sean p = (M0 c, 0) el c-momentun
n) y p0 = (M 0 c, M 0 v
n) los c-momentos
del tomo inicial y q = (E /c, E /c
finales del fotn y el tomo, en donde n
es la direccin de propagacin del
fotn y v la velocidad de retroceso del tomo. De la ecuacin de conservacin
del c-momentun, escrita en la forma p0 = p q y elevando al cuadrado esta
ecuacin, se obtiene la relacin:
M002 c2 = M02 c2 2M0 E

(6.28)

Remplazando la masa en reposo del tomo final, en trminos de E0 , se

6.4. SISTEMAS DE MASA VARIABLE

113

llega finalmente a
E = E0 (1

E0
)
2M0 c2

(6.29)

Para ganar una idea de las magnitudes de las variables fsicas involucradas, tomemos de nuevo el caso del tomo de hidrgeno y supongamos
que E0 ' 10eV y M0 c2 ' 1GeV , entonces la energa del fotn emitido ser
una fraccin del orden de 1012 veces menor, que la frecuencia de un fotn
emitido sin retroceso. Como se discuti anteriormente, el efecto del retroceso
causa una disminucin en la frecuencia del fotn emitido con respecto a la
frecuencia de la transicin y la fracin en la cual cambia esta frecuencia, es
inversamente proporcional a la masa del tomo (ver ecuacin (6.29)). Si el
tomo emisor est ligado a una estructura, por ejemplo a una red de tomos
como en un slido, entonces la masa efectiva que absorbe el momentun de
retroceso ser ahora del orden de 1023 veces la masa del tomo emisor y la
energa del fotn emitido, prcticamente coincide con la energa propia de
la correspondiente transicin entre niveles de energa del tomo. Este efecto de emisin sin retroceso fue descubierto por Mbauer, quien recibi el
premio nobel en 1961 y este efecto es actualmente una fuente de muchas
aplicaciones en fsica atmica, estado slido y fsica nuclear.

6.4.

Sistemas de masa variable

Puesto que la masa inercial de una patcula medida por un observador


depende de la velocidad, se puede considerar que todo sistema relativista
es, de hecho, un sistema de masa variable. Sin embargo en relatividad, el
equivalente al caso de la mecnica clsica de un sistema de masa variable,
corresponde a un sistema cuya masa propia sea variable. Un ejemplo de un
sistema de masa propia variable, lo constituye el cohete fotnico, esto es,
un cohete para el cual el sistema de propulsin transforma masa en energa
radiante (fotones).
Retomemos el ejemplo discutido en el captulo anterior de una nave
espacial que realiza un viaje al centro de nuestra galaxia, con aceleracin
propia constante igual a la aceleracin de la gravedad g y supongamos que
esta nave dispone de un cohete de propulsin que transforma masa en reposo
en fotones y los rada con un ciento por ciento de eficiencia, directamente
hacia atrs y perfectamente colimados. Calculemos entonces qu fraccin de
la masa propia inicial es gastada para realizar el viaje hasta el centro de la
galaxia, suponiendo (como en el ejemplo del captulo cuarto, seccin (4.4.3))
que durante la mitad del viaje acelera y la otra mitad frena, con aceleracin

114 CAPTULO 6. APLICACIONES DE LA DINMICA RELATIVISTA


propia constante g. Sea M la masa propia del cohete en un instante dado
(la cual es variable) y P = M U su c-momentun, en donde
U = (U 0 , U ) = (U 0 , Ux , 0, 0)

(6.30)

es la c-velocidad del cohete, el cual se mueve a lo largo del eje x y


prad = (Erad /c, prad )

(6.31)

el c-momentun de la radiacin. Por conservacin de la energa, el cambio en


la energa del cohete es igual al cambio en la energa radiada, entonces
d(M U 0 ) = dErad /c

(6.32)

Como la energa radiada es en forma de fotones, se debe tener que:


dErad = cdprad

(6.33)

y por conservacin del momentun tenemos:


dprad = d(M Ux )

(6.34)

Entonces, de estas relaciones obtenemos la ecuacin:


dM U 0 = d(M Ux )

(6.35)

la cual se puede escribir en la forma:


dM
d(U 0 + Ux )
=
M
U 0 + Ux

(6.36)

Integrando esta ecuacin y teniendo en cuenta las expresiones para U 0 y


Ux (ecuacin (4.38)) se llega, finalmente a la expresin para la masa propia
del cohete, en funcin del tiempo propio :
M = M0 e g/c

(6.37)

en donde M0 es la masa propia inicial de la nave. De acuerdo a la ecuacin


(4.47), el tiempo propio para que la nave realice la mitad del viaje es de
10,3a
nos y por lo tanto e g/c ' 29700, de donde se sigue que la masa propia
de la nave a la mitad del viaje es de M1/2 = M0 /29700 y la masa propia al
final del viaje hasta el centro de la galaxia ser
Mf inal = M0 /(29700)2 ' 109 M0

(6.38)

Esto significa que la gran mayoria de la masa de la nave (109 ) debe ser
gastada como combustible.

6.5. CREACIN Y ANIQUILACIN DE PARTCULAS

6.5.

115

Creacin y aniquilacin de partculas

Una de las aplicaciones ms importantes de la equivalencia entre la masa


y la energa, es la posibilidad de generar nuevas partculas en procesos de
colisin inelstica, o tambin a partir del decaimiento (aniquilacin) espontneo de una partcula inestable. Como ya se mencion en la seccin (6.6.3)
sobre colisiones inelsticas, la posibilidad de una determinada reaccin, por
ejemplo la creacin de un antiprotn a partir de la colisin entre dos protones depende, en primer lugar, de los principios de conservacin dinmicos
de energa-momentun y en segundo lugar, que la interacin que media el
proceso permita este tipo de reaccin. La teora fsica fundamental que describe estos procesos se llama teora cuntica de campos y ella nos permite
predecir, no solo que reacciones son posibles, sino tambin la probabilidad
con que un determinado proceso puede ocurrir. La probabilidad para que
un cierto proceso ocurra signica lo siguiente: cuando dos partculas colisionan, o una partcula inestable se desintegra, como resultado de esta reaccin
pueden surgir diferentes productos, todos permitidos por las diferentes leyes
de conservacin y cada uno de ellos con una probabilidad de ocurrencia,
o equivalentemente, con un porcentaje de ocurrencia. Por ejemplo el barin 0 puede decaer en 6 formas diferentes, cada una de ellas con diferente
probabilidad:
0 p +

0 n + 0
0 n +
0

p + +
0

p + e + e

p + +

(63,9 0,5) %

(6.39)

(35,8 0,5) %

(6.40)

(1,75 0,15) 103 %


4

(8,4 1,4) 10

(6.41)
(6.42)

(6.43)

(6.44)

(8,32 0,14) 10

(1,57 0,35) 10

El porcentaje entre parntesis significa que, de cada 100 eventos de decaimiento del barin 0 , por ejemplo, dece en un protn y en un pin
aproximadamente 64 veces, el cual es el evento ms probable, mintras que
el ltimo proceso, decaimiento en un protn, un mun y un neutrino munico es el menos probable, con una ocurrencia de un evento por cada 10000,
aproximadamente. La masa del barin 0 es de 1115,684M eV y su vida media, esto es el tiempo propio que la partcula permanece desde su creacin
hasta que ella dece, es de 2, 632 1010 s. A su vez esta partcula, el barin
0 , es producido en otra reaccin, como por ejemplo
+ + n K + + 0

(6.45)

116 CAPTULO 6. APLICACIONES DE LA DINMICA RELATIVISTA


Si las masas del pin + , el neutrn n y el mesn K + son 140M eV /c2 ,
940M eV /c2 y 494M eV /c2 respectivamente, calculemos por ejemplo la energa cintica umbral del mesn + , para que al chocar con el neutrn en
reposo, se cree el barin 0 a un ngulo de 90 , medidos con respecto a la
direccin de incidencia del pin. De la conservacin del c-momentun, tenemos
(6.46)
p + pn = pK + p
Puesto que no estamos interesados en la informacin para la partcula K + , despejemos su c-momentun de la ecuacin anterior y tomemos el
cuadrado de la expresin resultante (con la notacin p = (E /c, p ), m0
la masa en reposo del pin y similarmente para las otras partculas):
m2K0 c2 = m20 c2 + m2n0 c2 + m20 c2 + 2p pn 2p p pn p

(6.47)

Puesto que en el sistema de laboratorio p = (E /c, p ), pn = (mn0 c, 0)


y p = (E /c, p ) y adems p p = 0 dado que el ngulo de dispersin
del barin 0 es de 90 , entonces podemos despejar la energa total E de
esta expresin, para obtener
E =

m2K0 c2 m20 c2 m2n0 c2 m20 c2 + 2mn0 E


2(mn0 E /c2 )

(6.48)

por lo tanto, para que E sa mnimo se requiere que la energa del barin
0 sea mnima y para esto basta tomar E = m0 c2 , entonces
m2K0 m20 m2n0 m20 + 2mn0 m0 2
c = 1149M eV
2(mn0 m0 )
(6.49)
y por lo tanto la energa cintica umbral del pin incidente ser de
E (umbral) =

Kumbral = 1149M eV 140M eV = 1009M eV ' 1Gev

(6.50)

Parte III

Electrodinmica relativista

117

Captulo 7

Tensores
7.1.

Introduccin

Uno de los elementos fundamentales de toda teora fsica lo constituye el


modelo matemtico adecuado para describir las variables fsicas y las leyes
que rigen su comportamiento. En el captulo 3 se definieron los conceptos
de cuadri-vector y de invariante relativista, el primero como una cantidad
con cuatro componentes que bajo una transformacin de Lorentz, sus componentes se transforman de acuerdo a una ley definida (ecuacin (3.29)) y
el segundo como una cantidad invariante bajo una TL, es decir una cantidad que toma el mismo valor numrico en todos los sistemas de referencia
inerciales, el cual llamaremos en lo sucesivo escalar de Lorentz. Para muchos
de los fenmenos fsicos conocidos estos objetos matemticos, escalares y cvectores, son suficientes para definir las variables que permiten describir los
procesos fsicos. Sin embargo, existe toda una serie de variables dinmicas,
tales como por ejemplo el momento de inercia de un slido rgido, las cuales
requieren para su descripcin otros objetos matemticos llamados tensores.
El objetivo fundamental del presente captulo es introducir el concepto de
tensor y dar las herramientas fundamentales del lgebra y del clculo tensorial.
Existen varios caminos posibles para definir el concepto de tensor, por
ejemplo, la aproximacin algebrica, la cual es una extensin del lgebra
lineal y de los espacios vectoriales. Otro camino ms cercano a sus aplicaciones fsicas, es a travs de la definicin de un tensor por sus propiedades
de transformacin bajo un cambio de coordenadas. Este ser el camino que
seguiremos en este captulo.
Es importante anotar en este punto, que las variedades diferenciales con119

120

CAPTULO 7. TENSORES

stituyen el marco matemtico natural para definir de manera rigurosa y


general el concepto de tensor. Pero no abordaremos aqu esta teora, pues
est ms all del alcance del presente libro y adems para los objetivos
que perseguimos, formular la electrodinmica clsica en forma relativista
explcita, no es necesario desarrollar este formalismo matemtico en toda su
extensin. Sin embargo, vale la pena resaltar que los resultados del anlisis
tensorial que presentaremos son vlidos en el caso general y sirven como
punto de partida para un estudio ms riguroso de geometra diferencial,
necesario para abordar el estudio de la Teora General de la Relatividad
desarrollada por Einstein en 1916.

7.2.

Definiciones fundamentales

En esta seccin introduciremos los conceptos fundamentales del clculo


tensorial. Los objetos matemticos fundamentales con los cuales trataremos son los escalares, los vectores y los tensores, los cuales son en general
funciones de las coordenadas. Estos objetos sern definidos en trminos de
sus propiedades de transformacin, cuando cambiamos de sistemas de coordenadas. Aun cuando todas las definiciones que daremos, as como sus
propiedades, son generales, nos restringiremos exclusivamente a transformaciones de Lorentz, pero mantendremos en lo posible una notacin general.
Definicin 8.1 Sean y 0 dos sistemas de referencia inerciales y sean

x = (x0 , x1 , x2 , x3 ) y x0 = (x00 , x01 , x02 , x03 ) las coordenadas de un evento


fsico medidas en y 0 respectivamente. Entonces una transformacin de
Lorentz de las coordenadas est definida como:
x 7 x0 = x

(7.1)

tal que el producto punto Minkowskiano queda invariante bajo esta transformacin de coordenadas.
Definicin8.2 Un escalar de Lorentz es una cantidad (en general una
funcin de las coordenadas) que es invariante bajo transformaciones de
Lorentz.
Ejemplos de escalares de Lorentz son: la masa propia de una partcula, el
intervalo de tiempo propio entre dos eventos, la norma de todo cuadri-vector,
el producto interno de cuadri-vectores, etc.
Definicin 8.3 Un cuadri-vector (c-v) V es una cantidad cuyas componentes, que denotaremos por V , = 0, 1, 2, 3, medidas por el observador
inercial , se transforman bajo una transformacin de Lorentz de las coordenadas (ecuacin (7.1)), de la misma manera que las coordenadas, es

7.2. DEFINICIONES FUNDAMENTALES

121

decir:
V 0 = V

(7.2)

donde V denota las componentes del cuadri-vector V medidas en el sistema de referencia 0 . A las cantidades V se le llaman las componentes
contravariantes del cuadri-vector V. Esta denominacin de las componentes
contravariantes ser justificada ms adelante.
Ejemplos de c-v contravariantes son: el c-v posicin x, cuyas componentes
son las coordenadas de un evento fsico, las diferenciales de coordenadas dx ,
la c-velocidad U , la c-aceleracin A , el c-momentum p , la c-fuerza f ,
etc.
Las componentes de un c-v V y V 0 relacionadas por una transformacin de Lorentz, representan el mismo objeto matemtico medido en dos
sistemas de referencia inerciales y 0 respectivamente. Asi V es el c-v y
V son las componentes de V en el sistema y V 0 sus componentes en el
sistema 0 .
Definicin 8.4 Un tensor T de segundo orden dos veces contravariante,
es un conjunto de 16 componentes T ; , = 0, 1, 2, 3 medidas en un sistema
de referencia , tales que bajo una transformacin de Lorentz (ecuacin
(7.1)) sus componentes se transforman como:
T 0 = T

(7.3)

donde T 0 denota las componentes del tensor T en el sistemade referencia


0 .
Definicin 8.5 La definicin anterior se generaliza al caso de un tensor
T contravariante de orden r, como un objeto de 4r componentes, medidas
en un sistema de referencia , cuyas componentes se transforman bajo una
transformacin de Lorentz (7.1) en la forma:

T 01 2 ...r = 11 22 rr T 1 2 ... r

(7.4)

As, podemos definir un tensor de orden cero como un escalar y un tensor


contravariante de orden uno como un c-vector.
En el siguiente captulo veremos ejemplos de tensores de segundo orden
con significado fsico, tales como el tensor campo electromagntico y el tensor energa-momentun. Por ahora trabajaremos con estas cantidades como
objetos matemticos abstractos, sin asignarles ningn significado. Es de anotar que en fsica no aparecen cantidades que se describan por tensores de
orden mayor al segundo, salvo en el caso de la Teora General de la Relatividad, en donde se requiere del tensor de Riemann, el cual es un tensor

122

CAPTULO 7. TENSORES

de cuarto orden y cuyo significado est ligado al concepto geomtrico de


curvatura de la variedad espacio-tiempo.

7.2.1.

Componentes covariantes

Las transformaciones de Lorentz las definimos como el conjunto de transformaciones de coordenadas, tales que dejen invariante el intervalo espaciotiempo (ver captulo 4, ecuaciones (3.25) a la (3.30)), es decir, si x y
x + dx , son las coordenadas de dos eventos fsicos medidas por un observador inercial , entonces la distancia espacio-tiempo entre estos dos
eventos, definida como:
(7.5)
ds2 = dx dx
es invariante bajo una transformacin de coordenadas, es decir:
ds2 = dx dx = dx0 dx0

(7.6)

en donde la matriz de Minkowski (llamado tambin tensor mtrico de


Minkowski, por las razones que veremos en seguida) est definido por:

1; si = = 0
:=
1; si = = 1, 2, 3
(7.7)

0; si 6=
As, para que bajo una transformacin de Lorentz el escalar de Lorentz
ds2 permanezca invariante, esto es:
ds2 = dx0 dx0 = dx dx = dx dx

(7.8)

se debe cumplir que la matriz de Minkowski satisfaga la relacin:


=

(7.9)

Como el determinante de la matriz de Minkowski es diferente de cero,


i.e., det( ) = 1, entonces existe la matriz de transformacin inversa
( )1 , cuyas componentes que denotaremos por , satisfacen la siguiente relacin:
(7.10)
1 = 1
la cual, escrita en trminos de componentes toma la forma:
=

(7.11)

7.2. DEFINICIONES FUNDAMENTALES

123

en donde son los elementos de la matriz identidad.


Los elementos de la matriz inversa de Minkowsky coinciden numricamente con , como se puede probar directamente. Adems, la matriz de
Minkowski y su inversa son matrices simtricas, i.e. = y = .
Por otra parte, la inversa de una transformacin de Lorentz est dada
por:
(7.12)
x = x0
con
= ( )1 =

(7.13)

Los elementos de la transformacin inversa de Lorentz se pueden obtener


a partir de la relacin:
(7.14)
=
pues

= = =

(7.15)

en donde se ha hecho uso de la ecuacin (7.9). Por ejemplo, si consideramos el caso particular de una transformacin de Lorentz entre sistemas de
referencia inerciales y 0 , con ejes espaciales paralelos y v la velocidad de
0 en la direccin del eje x positivo, entonces los elementos de la matriz de
transformacin de Lorentz estn dados por (ver la ecuacin (3.40))

0 0

0 0

(7.16)
=
0
0
1 0
0
0
0 1
por lo tanto aplicando la relacin (7.14), tenemos


= =
0
0
0
0

0
0
1
0

0
0

0
1

(7.17)

la cual corresponde a la transformacin del sistema de referencia 0 al ,


que equivale como vimos en el captulo 3, a cambiar la velocidad v por v.
Definicin 8.6 Definamos las componentes covariantes de un c-v V
como
(7.18)
V := V

124

CAPTULO 7. TENSORES

Esta definicin tiene sentido, pues dado que la matriz de Minkowski


posee una inversa, la relacin entre las componentes contravariantes y
covariantes de un c-v es una relacin biyectiva (uno a uno y sobre) y por
lo tanto es un isomorfismo, es decir, dadas las componentes contravariantes
V de un c-v, sus componentes covariantes V estn unvocamente definidas
(ecuacin (7.18)) y viceversa; es decir, dadas las componentes covariantes
V , entonces sus correspondientes componentes contravariantes se obtienen
de la transformacin inversa, as
V = V

(7.19)

Este resultado nos permite identificar a las componentes covariantes V


y a las contravariantes V de un c-v, como representaciones de un mismo
objeto abstracto V.
Podemos generalizar esta operacin, que se conoce en el marco del anlisis tensorial como subir y bajar ndices, al caso de tensores de cualquier
rango. As por ejemplo, las componentes covariantes de un tensor de segundo orden estn relacionadas con sus componentes contravariantes por la
ecuacin:
(7.20)
T = T
o tambin, podemos definir las componentes de un tensor de segundo orden
una vez contravariante y una vez covariante, con las siguientes posibilidades:
T

= T

= T

(7.21)

De esta forma, T , T , T , y T son todas diferentes representaciones de un mismo tensor de segundo rango T. Es importante anotar que
el orden de los ndices en una ecuacin tensorial debe ser preservado, dado
que en general T 6= T y por esta razn las componentes mixtas T y

del tensor T son diferentes en general.


Para encontrar como se transformanlas componentes covariantes de cualquier
tensor, bajo una transformacin de Lorentz, consideremos primero el caso
particular de un c-v:
V 0 = V

V0 = V 0 = V

(7.22)

Ahora, de la relacin (7.14) multiplicndola por a ambos lados y


sumando sobre el ndice , obtenemos

= = =

(7.23)

7.2. DEFINICIONES FUNDAMENTALES

125

Remplazando esta relacin en el ltimo trmino de la ecuacin (7.22),


tenemos
(7.24)
V0 = V = V
Esta ecuacin nos da la ley de transformacin de las componentes covariantes de un c-v.
De lo visto hasta ahora, es fcil generalizar esta ecuacin para obtener la
ley general de transformacin de las componentes covariantes y contravariantes de un tensor cualquiera T, r-veces contravariante y s-veces covariante:
0 ...

... r
2
r
T 1 1 2 ...
= 11 22 rr 11 22 rr T1122...
s
s

7.2.2.

(7.25)

Algebra tensorial

... r
Denotemos por rs el conjunto de todos los tensores T1122...
de orden
s
n = r + s, r-veces contravariante y s-veces covariante. As, en esta notacin
un escalar es un elemento de 00 , un c-vector contravariante es un elemento
de 10 y uno covariante de 01 , etc.
Definicin 8.7 Suma de tensores: Dados dos tensores T, S rs definimos la suma y la multiplicacin por un escalar R, por:
... r
... r
... r
... r
:= (T + S)1122...
:= T1122...
+ S1122...
Q1122...
s
s
s
s

(7.26)

... r
... r
... r
P1122...
:= (T )1122...
:= T1122...
s
s
s

(7.27)

Notemos que estas operaciones no son ms que la generalizacin directa


de la suma y el producto por un escalar de vectores cartesianos, en donde el
vector resultante de estas operaciones se obtiene como la suma componente
a componente y por el producto del escalar por cada componente del vector.
Cuando se define una opreacin con tensores, hay que demostrar que esta
operacin est bien definida, es decir, que la operacin preserva el caracter
tensorial. Esto significa que por ejemplo, para las operaciones definidas en las
ecuaciones (7.26) y (7.27), para la suma y multiplicacin por un escalar de
... r
... r
y P11...
tensores de un mismo rango, las componentes resultantes Q11...
s
s
se
transforman
efectivamente
como
las
componentes
de
un
tensor
del
tipo
rn
s , es decir:
T, S rs = Q = T + S rs

P =T rs

(7.28)

126

CAPTULO 7. TENSORES

La demostracin general de este resultado es muy sencilla y por esta


razn ilustrar el mtodo para el caso particular de un tensor mixto de
segundo rango. Sean T, S 11 con componentes para un observador inercial
dadas por T y S respectivamente y sea
Q = T + S

(7.29)

Debemos probar que bajo una transformacin de coordenadas, las componentes Q se transforman como un tensor del tipo 11 . As, para un sistema
de referencia 0 tenemos, aplicando la ley de transformacin (7.25) para las
0
componentes de los tensores T 0
y S ,
0
Q0 = T 0
+S

T +

(T + S )

(7.30)

lo cual implica que las cantidades Q se transforman como las componentes


de un tensor del tipo 11 , como se quera probar. Un procedimiento similar
se puede hacer para el producto de un escalar por un tensor.
rnEste resultado muestra que el conjunto de todos los tensores del tipo
forman un espacio vectorial.
s
Definicin 8.8 Producto tensorial: Dados dos tensores T rs y S
pq , definimos el producto tensorial como:
...

...

...

r+1
r+p
1 2 ... r
r+1 r+2
r+p
W1122...srs+1
... s+q := T 1 2 ... s S s+1 s+2 ... s+q

(7.31)

r+p
r+p
el cual es un tensor de r+p
s+q s+q , es decir W s+q .
Esta operacin no tiene su correspondiente en el clculo vectorial ordinario y representa lo que en lgebra matricial se llama un producto directo. Como en el caso anterior, hay que probar que esta operacin est bien
definida y para este fin consideremos el caso particular del producto de dos
c-vectores, uno covariante y el otro contravariante. Sea T 10 y llamemos sus componentes T , y S 01 con componentes S . Entonces, de la
definicin 8.8 el producto est dado por
W = T S

(7.32)

y debemos probar que las componentes del producto W se transforman


como:
(7.33)
W 0 = W

7.2. DEFINICIONES FUNDAMENTALES

127

de acuerdo con la ecuacin (7.25). Sean T 0 y S0 las componentes de los


c-vectores T y S medidas en el sistema de referencia 0 , entonces en este
sistema de referencia las componentes del producto estn dadas por:
W 0 = T 0 S0

(7.34)

Puesto que T y S son c-vectores, sus componentes se transforman de


acuerdo con la relacin:
T 0 = T ; S0 = S

(7.35)

Remplazando estas expresiones en la ecuacin (7.34), tenemos


W 0 = T 0 S0 = T S = T S = W

(7.36)

como se quera demostrar.


La siguiente operacin que vamos a definir es fundamental en el clculo
tensorial, pues nos permite obtener a partir de un tensor dado de rango
n, un tensor de rango n 2. As, si partimos de un tensor de rango par,
por aplicaciones sucesivas de esta operacin, podemos obtener un tensor de
rango cero, es decir un escalar de Lorentz o en trminos ms fsicos, un
invariante relativista.
Definicin 8.9 Contraccin de Indices: Dado un tensor T r1s definimos la contraccin del ndice contravariante i (1 i r) con el ndice
covariante j (1 j s) por:
( )

...i ...r
1 2 ......r
r1
C( i) (T12...
... ) := T ...... s1
j

1 2

1 2

(7.37)

Es decir, dado un tensor mixto de orden n = r + s, r veces contravariante y s veces covariante, al sumar sobre dos ndices repetidos,
uno contravariante y otro covariante, obtenemos un tensor de orden n 2,
r 1 veces contravariante y s 1 veces covariante. Para demostrar que
esta operacin est bien definida consideremos, sin prdida de generalidad,
un tensor de de rango 4, 2 veces contravariante y 2 veces covariante

22 y contraigamos por ejemplo, el primer ndice contravariante con


T
el segundo covariante:
()

C() (T
) = T
:= T

11

(7.38)

Entonces, veamos que las componentes que resultan T , despus de realizada la operacin de contraccin, se transforman como las componentes de

128

CAPTULO 7. TENSORES

un tensor mixto de rango 2. Si denotamos como es costumbre, por cantidades


primadas las componentes de los tensores en el sistema de referencia 0 y
aplicamos las correspondientes leyes de transformacin de tensores, tenemos
entonces
0

= T
T0 = T

= T
= T

= T

(7.39)

lo cual demuestra que la operacin de contraccin de ndices est bien definida. En la segunda igualdad hemos utilizado la ley de transformacin para
0
el tensor T
, la cual se aplica independientemente del hecho que el tensor
tenga dos ndices repetidos sobre los cuales se suma. Para obtener la tercera
igualdad se ha utilizadoel hecho que los elementos de la transformacin
y , corresponden a la transformacin de Lorentz de a 0 y a su inversa
respectivamente y por lo tanto satisfacen la relacin (7.15). Finalmente, al
sumar sobre el ndice repetido , por la definicin de la delta de Kronecker
, todos los trminos son cero, salvo aquel para el cual = , obteniendose
de esta forma la cuarta iguldad.
Antes de continuar con otras operaciones entre tensores, mostremos que
las componentes de la matriz de Minkowski , su inversa y la delta
de Kronecker son tensores de segundo rango, lo que justifica el nombre
de tensor mtrico de Minkowski y adems , y corresponden a
diferentes representaciones del mismo objeto matemtico, el tensor mtrico
, con la particularidad que las componentes de este tensor mtrico toman
los mismos valores numricos en todos los sistemas de referencia inerciales.
El papel especial de este objeto matemtico lo podemos ver, si retornamos
a la definicin del intervalo espacio-tiempo entre dos puntos de la variedad
espacio-tiempo:
ds2 = dx dx

(7.40)

El escalar ds2 es obtenido a partir del producto de tres tensores ( , dx


y dx ) seguida de una doble contraccin sobre ndices, y por lo visto hasta
ahora, estas operaciones estn bien definidas. Tambin, podemos probar
directamente el carcter tensorial de , pues dado que ds2 es un invariante,

7.2. DEFINICIONES FUNDAMENTALES

129

entonces
ds2 = 0 dx0 dx0
= dx dx
= dx dx
= dx dx

(7.41)

en donde hemos denotado por 0 a las componentes del tensor mtrico


medidas en el sistema de referencia 0 , las cuales estn relacionadas con sus
componentes en el sistema por:
0 =

(7.42)

Un clculo directo, aplicando las propiedades de las transformaciones de


Lorentz, muestra que las componentes del tensor en el sistema 0 coinciden
con sus componentes en . Un procedimiento similar se puede seguir para
probar que y tambin se transforman como tensores de segundo rango
(dos veces contravariante y mixto respectivamente) y que sus componentes
son las mismas en todos los sistema de referencia inerciales.
Un caso particular que surge de la combinacin de las operaciones, producto tensorial y contraccin de ndices, es la generalizacin de la Definicin 8.6, llamada subir y bajar ndices, pues el producto tensorial del tensor
mtrico de segundo orden (sea de sus componentes contravariantes ,
covariantes o mixtas ) con un tensor cualquiera T de orden n, seguida
de una contraccin de ndices, produce de nuevo un tensor de orden n; por
ejemplo, consideremos un tensor T de cuarto orden del tipo 22 . Al multiplicar este tensor T por el tensor mtrico 20 , produce un tensor
del tipo 42 , que al contraer dos ndices conduce a otro tensor del tipo 31 .
Resumiendo tenemos:

= T
(7.43)
T
Otro caso particular de la combinacin de estas dos operaciones tensoriales, producto tensorial seguida de una contraccin, es el producto punto
de dos c-vectores, pues
V V = V V = V V = V V = V V

(7.44)

Por ejemplo, consideremos el c-vector momentun p de una partcula de


masa en reposo m0 , cuyas componentes contravariantes en algn sistema de
referencia inercial , estn dadas por p = (p0 , p1 , p2 , p3 ) (E/c, px , py , pz ).

130

CAPTULO 7. TENSORES

Entonces podemos calcular sus correspondientes componentes covariantes


en este sistema como
p = p = (p0 , p1 , p2 , p3 ) = (E/c, px , py , pz )

(7.45)

Aplicando ahora cualquiera de las expresiones dadas en la ecuacin


(7.44), obtenemos que su norma al cuadrado est dada por
p2 = p p = E 2 /c2 p2x p2y p2z = m20 c2

7.2.3.

(7.46)

Propiedades de simetra de tensores

En esta seccin definiremos los conceptos de tensores simtricos y antisimtricos e introduciremos la operacin tensorial de simetrizacin (y antisimetrizacin) de las componentes de un tensor, la cual es de utilidad para
generalizar algunas operaciones del clculo vectorial usual, como veremos en
la ltima seccin del presente captulo.
Definicin 8.10 Un tensor T de segundo rango del tipo 20 , con componentes T en un sistema de referencia , se llama simtrico si
T = T

(7.47)

T = T

(7.48)

y antisimtrico si
Esta definicin es vlida tambin, para las componentes covariantes de un
tensor de segundo rango y puede ser generalizada a cualquier par de ndices
de un tensor de rango n 2. Por ejemplo, para un tensor R de cuarto rango
del tipo 04 , simtrico en su primera y tercera componente y antisimtrico
en la segunda y cuarta componente, se tiene que
R = R ; R = R

(7.49)

Es fcil probar, a partir de las propiedades de transformacin de las


componentes, que el carcter simtrico o antisimtrico de un tensor es independiente del sistema de referencia, pues si T = T en un sistema de
referencia , entonces de las propiedades de transformacin (ecuacin (7.3))
tenemos
T 0 = T = T = T = T 0
como se quera probar.

(7.50)

7.2. DEFINICIONES FUNDAMENTALES

131

Dado un tensor de segundo rango con componentes T en un sistema de


referencia, siempre se puede escribir este tensor como la suma de un tensor
simtrico ms uno antisimtrico, es decir
T = S + A

(7.51)

con S = S y A = A . Para demostrar esta afirmacin basta con


tomar
1
(7.52)
S := (T + T )
2
y
1
A := (T T )
(7.53)
2
en donde al tensor S se le llama la parte simtrica del tensor T y al
tensor A su parte antisimtrica. Claramente estas mismas relaciones son
vlidas para ndices covariantes. De estas ecuaciones ( (7.52) y (7.53)) se
deduce adems, que un tensor es simtrico si su parte antisimtrica es cero
y es antisimtrico si su parte simtrica es cero:
1
(7.54)
T = T A = (T T ) = 0
2
1
(7.55)
T = T S = (T + T ) = 0
2
Un ejemplo de un tensor simtrico es el tensor mtrico de Minkowski,
pues por su definicin = .
Las ecuaciones (7.52) y (7.53) nos conducen a la siguiente definicin de
dos nuevas operaciones tensoriales:
Definicin 8.11 Dado un tensor T de segundo rango del tipo 20 , con
componentes T en un sistema de referencia , definamos un nuevo tensor
que lo denotaremos como T () , por la operacin
1
T () := (T + T )
2

(7.56)

el cual por definicin es simtrico, es decir T () = T () . A esta operacin


se le conoce en la literatura como simetrizacin de un tensor. Claramente,
si el tensor T es simtrico, entonces el tensor simetrizado coincide con el
tensor original, esto es T () = T y si el tensor T es antisimtrico, el
tensor simetrizado es cero: T () = 0.
Similarmente, definimos la operacin de antisimetrizacin de un tensor
dado T , que lo denotaremos como T [] , por:
1
T [] := (T T )
2

(7.57)

132

CAPTULO 7. TENSORES

De la misma manera se tiene que si un tensor T es simtrico, entonces


el tensor antisimetrizado es cero y si T es antisimtrico, entonces T [] =
T . Claramente estas operaciones son vlidas tambin para tensores del
tipo 02 .
Tanto las definiciones de simetra y antisimetra dadas (Definicin 8.10),
as como las operaciones de simetrizacin y antisimetrizacin (Definicin
8.11), se pueden generalizar a tensores de orden mayor. Antes de considerar este problema, se introducirn algunos elementos bsicos de la teora de
permutaciones.
Consideremos el conjunto {1, 2, ..., r} de los r primeros nmeros naturales y denotemos por (n1 , n2 , ..., nr ) un arreglo ordenado de ellos, sin que
ninguno se repita. Existen entonces r! = 1 2 3 ... r formas diferentes
de ordenar en este arreglo los r pimeros nmeros naturales. Por ejemplo, si
tomamos el conjunto {1, 2, 3}, podemos construir 3! = 6 arreglos diferentes:
(1, 2, 3); (1, 3, 2); (2, 1, 3); (2, 3, 1); (3, 1, 2); (3, 2, 1)

(7.58)

Dado un arreglo (n1 , n2 , ..., nr ), definimos una permutacin P sobre


este arreglo, como el arreglo obtenido al permutar los elementos del arreglo
original. Denotaremos simblicamente esta operacin de permutacin por
P (n1 , n2 , ..., nr ) = (n(1) , n(2) , ..., n(r) )

(7.59)

en donde es una funcin (uno a uno y sobre)


: {1, 2, ..., r} {1, 2, ..., r}
ni
7 (ni ) = nj

(7.60)

Por ejemplo, el arreglo (3, 2, 1) se puede obtener a partir del primer arreglo
(1, 2, 3) permutando los nmeros 1 y 3:
P (1, 2, 3) P (n1 , n2 , n3 ) = (n(1) , n(2) , n(3) ) = (3, 2, 1)

(7.61)

Definamos ahora una transposicin como una permutacin


Pni ni+1

(7.62)

obtenida, al permutar dos nmeros consecutivos ni y ni+1 del arreglo original:


Pni ni+1 (n1 , n2 , ..., ni , ni+1 , ..., nr ) = (n1 , n2 , ..., ni+1 , ni , ..., nr )

(7.63)

7.2. DEFINICIONES FUNDAMENTALES

133

Claramente, cualquier arreglo de los nmeros {1, 2, ..., r} se puede obtener


por una permutacin P sobre un arreglo dado, incluyendo como caso particular, la permutacin identidad que no cambia el arreglo original. Adems,
cualquier permutacin dada se puede obtener aplicando sucesivamente transposiciones. Es decir, toda permutacin se puede descomponer, o factorizar,
como el producto de transposiciones:
P = Pni ni+1 Pnj nj+1 Pnk nk+1

(7.64)

En el ejemplo ilustrado en la ecuacin (7.58), se puede obtener el segundo


arreglo (1, 3, 2) a partir del primer arreglo (1, 2, 3), aplicando la transposicin
P23 , esto es:
P23 (1, 2, 3) = (1, 3, 2)
(7.65)
pero tambin es posible obtener este mismo arreglo en otra forma, por aplicacin sucesiva de las transposiciones siguientes:
P31 P21 P23 P13 P12 (1, 2, 3) = P31 P21 P23 P13 (2, 1, 3)
= P31 P21 P23 (2, 3, 1)
= P31 P21 (3, 2, 1)
= P31 (3, 2, 1)
= (1, 3, 2)

(7.66)

Este ejemplo muestra que no hay una nica forma de obtener una permutacin dada por transposiciones sucesivas. Sin embargo, el nmero definido
por:

+1
si N es par
N
(7.67)
=
(1)
1
si N es impar
s es independiente de las transposiciones realizadas para obtener la permutacin dada. Este nmero es llamado el signo de la permutacin, siendo
N igual al nmero de las transposiciones realizadas. Esto significa que si
una permutacin dada se factoriza en un nmero par (impar) de transposiciones, entonces, cualquier otra factorizacin de la misma permutacin, contendr tambin un nmero par (impar) de transposiciones. Una permutacin
se llama par(impar) si el signo es +1(1). As en nuestro ejemplo anterior, la permutacin P (1, 2, 3) = (1, 3, 2) se puede escribir en trminos de
transposiciones, como P = P23 , en cuyo caso N = 1 y el signo de la
permutacin es (1)N = 1, o tambin se puede factorizar en la forma
P = P31 P21 P23 P13 P12 , con N = 5 y por lo tanto el mismo signo
de la permutacin (1)5 = 1.

134

CAPTULO 7. TENSORES

Con estos elementos bsicos de la teora de permutaciones, podemos


extender las operaciones anteriores de simetrizacin y antisimetrizacin a
tensores de orden superior.
Definicin 8.12 Dado un tensor T de rango r del tipo r0 , con componentes T 1 r en un sistema de referencia , definamos dos nuevos tensores, uno completamente simtrico en todos sus ndices que denotaremos
como T (1 r ) y el otro completamente antisimtrico en todos sus ndices
que denotaremos como T [1 r ] , por las operaciones
1 X P (1 r )
T (1 r ) :=
T
(7.68)
r!
P

T [1 r ] :=

1X
(1)N T P (1 r )
r!

(7.69)

en donde la suma se realiza sobre todas las permutaciones de los ndices


(1 , , r ). La misma definicin vale para ndices covariantes.
Por ejemplo, consideremos un tensor T del tipo 03 y construyamos
los tensores T() y T[] por las operaciones definidas en las ecuaciones
(7.64) y (7.69):
T() :=

1
(T + T + T + T + T + T )
3!

(7.70)

1
(T T + T T + T T )
(7.71)
3!
Es fcil comprobar directamente que el nuevo tensor T() es completamente simtrico bajo cualquier permutacin de sus ndices; por ejemplo
T(031) = T(013) = etc, mientras que el tensor T[] es completamente antisimtrico bajo permutacin de sus ndices, pues por ejemplo T[031] = T[013] ,
pero T[031] = T[310] dado que en el primer caso los ndices [013] corresponden
a una permutacin par de los ndices originales [031], mientras que en el
segundo caso el arreglo de ndices [310] es una permutacin par del arreglo
original [031]. Notemos que las definiciones dadas para tensores de segundo
rango son un caso particular de la Definicin 8.12. Un ejemplo de esta
operacin de antisimetrizacin de tensores, lo constituye la generalizacin
del producto cruz usual del clculo vectorial tridimensional.
Sean A y B las componentes de dos c-vectores en un sistema de referencia . Definamos un nuevo vector como el producto tensorial antisimetrizado
de estos dos c-vectores:
T[] :=

1
C := A[ B ] = {A B A B }
2

(7.72)

7.2. DEFINICIONES FUNDAMENTALES

135

Un tensor de segundo rango C en n dimensiones tiene n2 componentes


independientes. En el caso particular de las 4 dimensiones del espacio-tiempo
n2 = 16 componentes independientes. Si el tensor es simtrico entonces
C = C y su nmero de componentes independientes se reduce a:
n2 n
n(n + 1)
+n=
2
2

(7.73)

Ahora, si el tensor es antisimtrico C = C su nmero de componentes independientes est dado por:


n(n 1)
n2 n
=
2
2

(7.74)

pues en este caso las componentes con ndices repetidos son cero. En el caso
de vectores tridimensionales cartesianos n = 3, y por lo tanto el nmero de
componentes independientes de un tensor antisimtrico de segundo rango
es tres. As, podemos identificar a las tres componentes independientes que
surgen de la operacin definida en la ecuacin (7.72), a su vez con las componentes de un nuevo vector, el cual se conoce como el producto cruz del
clculo vectorial usual. Notemos que esta identificacin no es posible para
otras dimensiones del espacio, pues por ejemplo, en cuatro dimensiones el
nmero de componentes independientes de un tensor antisimtrico de segundo rango es de seis y por lo tanto estas componentes no pueden ser
identificadas con las componentes de nign c-vector.
Para finalizar esta seccin consideraremos un ejemplo especial de un
tensor de cuarto rango completamente antisimtrico, el cual jugar un papel
importante en el captulo octavo sobre las ecuaciones de Maxwell. Definamos
el tensor , llamado tensor de Levi-Civita, por la ecuacin:

on par de 0123
+1 si es permutaci
:=
1 si es permutaci
on impar de 0123

0 en los dem
as casos

(7.75)

Este tensor, al igual que el tensor mtrico de Minkowski, tiene la particularidad que en todos los sistemas de referencia inerciales sus componentes
tienen el mismo valor numrico. Para probar que es un tensor con esta
caracterstica, se debe mostrar que sus componentes se transforman, bajo
una transformacin de Lorentz, en la forma
0 =

(7.76)

136

CAPTULO 7. TENSORES

Para esto, es suficiente notar lo siguiente: si en la ecuacin anterior reemplazamos los ndices , , y por 0, 1, 2 y 3 respectivamente, entonces la
ecuacin (7.76) toma la forma
1 = 0123 = 0 1 2 3 = det ||

(7.77)

De lo visto en el captulo 3 sobre las propiedades de las transformaciones


de Lorentz, es fcil deducir que toda transformacin de Lorentz propia,
es decir que no involucra inversin de los ejes espaciales o inversin de la
coordenada temporal, tiene determinante igual a 1. As, la ecuacin (7.77)
es una identidad y por lo tanto las componentes del tensor de LeviCivita deben transformarse de acuerdo con la ecuacin (7.76), como se quera
mostrar.

7.3.

Transformacin general de coordenadas

Antes de continuar con la generalizacin de los operadores vectoriales


usuales del clculo diferencial (gradiente, divergencia y rotacional), veamos
el caso general de transformaciones de coordenadas que contienen, lgicamente, el caso particular de las transformaciones de Lorentz que hemos
considerado hasta ahora.
Sean y 0 dos sistemas de referencia y llamemos x y x0 las coordenadas de un punto medidas en los sistemas de referencia y 0 respectivamente. Supongamos, sin prdida de generalidad, que nuestro espacio es de
cuatro dimensiones. Entonces, un cambio general de coordenadas entre los
sistemas y 0 se puede expresar como un conjunto de cuatro ecuaciones,
en donde las nuevas coordenas primadas son funciones continuas, con inversa continua, de las coordenadas no primadas. As la transformacin de
coordenadas y su inversa, se pueden escribir como:
x0 = x0 (x )

(7.78)

x = x (x0 )

(7.79)

Notemos que si exigimos que las transformaciones de coordenas sean


lineales, entonces estas ecuaciones se reducen a la forma:
x0 = x

(7.80)

x = x0

(7.81)

7.3. TRANSFORMACIN GENERAL DE COORDENADAS

137

con los coeficientes de la transformaciones (y los de la transformacin inversa ) constantes, independientes de las coordenadas. Las componentes
del vector desplazamiento infinitesimal dx en el sistema de coordenadas
estn dadas por dx = (dx0 , dx1 , dx2 , dx3 ), mientras que las correspondientes componentes medidas en 0 son dx0 = (dx00 , dx01 , dx02 , dx03 ). Para
encontrar la relacin entre las componentes del vector dx en los dos sistemas, basta con tomar la diferencial total de cada una de las funciones en
las ecuaciones (7.78) y (7.79), as:
dx0 =

x0
dx
x

(7.82)

x 0
dx
(7.83)
x0
Estas ecuaciones definen la ley de transformacin (y su inversa) para las
componentes de cualquier vector en los dos sistemas de referencia:
dx =

V 0 =

x0
V
x

(7.84)

x 0
V
(7.85)
x0
En el caso particular de transformaciones lineales (ecuaciones (7.80) y
(7.81)), la ley de transformacin para las componentes de un vector toma la
forma:
(7.86)
V 0 = V
V =

V = V 0

(7.87)

la cual se obtiene del caso general si hacemos la siguiente identificacin:

x0
x

(7.88)

x
(7.89)
x0
Finalmente, puesto que las transformaciones de coordenadas deben ser
invertibles se debe cumplir que
=

x0 x
=
x x0

(7.90)

Esta relacin se obtiene directamente, si aplicamos la regla de la cadena para


las derivadas a la transformacin idntica x0 (x (x0 )) x0 , la cual para

138

CAPTULO 7. TENSORES

el caso particular de transformaciones lineales, toma la forma = .


As, teniendo en cuenta las ecuaciones (7.88) y (7.89), toda el lgebra y los
conceptos del clculo tensorial desarrollados en este captulo, para el caso
particular de transformaciones de Lorentz, son vlidos para el caso ms general de transformaciones arbitrarias de coordenadas. Las restricciones que
impongamos sobre el conjunto de transformaciones de coordenadas entre
sistemas, nos determinan las propiedades matemticas (o fsicas, segn sea
el caso) del espacio sobre el cual estamos trabajando. Por ejemplo, si consideramos que los sistemas de referencia fsicamente significativos son los
inerciales y que el principio de la constancia de la velocidad de la luz en
el vaco se cumple, entonces solamente las ecuaciones de transformacin de
coordenadas admisibles son aquellas que dejan el intervalo espacio-tiempo
invariante, obteniendo entonces el caso particular de transformaciones de
Lorentz que hemos estado considerando en este captulo. Otra posibilidad
sera por ejemplo, aceptar el principio de la constancia de la velocidad de
la luz, pero postular que las leyes de la fsica son vlidas en todos los sistemas de referencia, san inerciales o no. Para este caso ms general ya no
estamos restringidos a transformaciones de coordenadas lineales, como en el
caso anterior que corresponde a la relatividad especial, an cuando se sigue
exigiendo que el intervalo espacio-tiempo permanezca invariante, esto es
0
dx0 dx0
ds2 = g dx dx = g

(7.91)

En este caso, bajo una transformacin admisible de coordenadas, las


componentes del tensor mtrico (denotado ahora por g) son en general funciones de las coordenadas y por tanto, a diferencia del tensor mtrico de
Minkowski, sus componentes varan de un sistema de coordenadas (o de referencia) a otro. Este ltimo ejemplo adquiere todo su significado en la teora
general de la relatividad, cuyo estudio est ms all del alcance del presente
libro.

7.4.

Operadores vectoriales

En el clculo vectorial usual sobre R3 se define el operador gradiente


como:

(7.92)
=( , , )
x y z
el cual al actuar sobre una funcin escalar produce un vector en la direccin del mximo cambio de la funcin. Por funcin escalar se entiende, una

7.4. OPERADORES VECTORIALES

139

funcin de valor real y variable vectorial, es decir una funcin de la forma


f : R3 7 R

(7.93)

tal que, a un vector x = (x, y, z) de R3 le asocia un nmero real f (x, y, z).


As, al actuar el operador gradiente sobre la funcin f (x, y, z) da como
resultado un vector sobre cada punto de R3 , con sus componentes dadas por
f = (

f f f
,
,
)
x y z

(7.94)

Si consideramos ahora una funcin vectorial F (x, y, z), es decir una funcin de valor vectorial y variable vectorial:
F : R3 7 R3

(7.95)

con componentes (Fx , Fy , Fz ), entonces podemos hacer actuar el operador


gradiente sobre F en la forma
F =

Fz
Fx Fy
+
+
x
y
z

(7.96)

para obtener una funcin real llamada la divergencia. Tambin es posible


obtener un vector a partir del operador gradiente, actuando ste sobre una
funcin vectorial en la forma:
F =(

Fy Fx Fz Fy
Fx
Fz

)
y
z z
x x
y

(7.97)

conocida como el rotacional de una funcin vectorial. Notemos que las tres
operaciones definidas a partir del operador , el gradiente, la divergencia y
el rotacional, se pueden considerar como una extencin de las operaciones
usuales del lgebra vectorial: el producto de un vector por un escalar, el
producto interno entre vectores y el producto cruz, respectivamente. Por
esta razn es usual considerar para todos los efectos al operador como un
vector, con el cual podemos construir todo tipo de operaciones permitidas
dentro del clculo vectorial usual, solamente teniendo presente el orden en
el cual entra en la expresiones, pues el vector actua sobre funciones.
As por ejemplo, podemos construir expresiones tales como
2 = =

2
2
2
+
+
x2 y 2 z 2

conocida como el operador Laplaciano.

(7.98)

140

CAPTULO 7. TENSORES

Definamos entonces el cuadri-vector gradiente como un operador diferencial, tal que al actuar sobre una funcin escalar de las coordenadas (x ),
produce el c-vector , cuyas componentes en un sistema de referencia
estn dadas por:

(7.99)
() = ( 0 , 1 , 2 , 3 )
x x x x
A las componentes de las denotaremos tambin como /x , o .
Veamos entonces, que las componentes de se transforman como las
componentes covariantes de un c-vector bajo una transformacin de coordenadas. Sean x y x0 las coordenadas de un evento, medidas en los sistemas
de referencia y 0 respectivamente y relacionadas por una transformacin
de Lorentz, entonces las componentes covariantes de un c-vector V, en los
dos sistemas de referencia, estn relacionadas por:
V0 = V

x
V
x0

(7.100)

de acuerdo con las ecuaciones (7.88) y (7.89) de la seccin anterior. Bajo


una transformacin de coordenadas por definicin, una funcin escalar permanece invariante, es decir (x ) = (x0 ). Teniendo en cuenta que bajo la
transformacin de coordenadas se tiene x0 = x0 (x ) y aplicando la regla
de la cadena a la funcin (x0 (x )), obtenemos para las componentes del
operador gradiente, medidas en los dos sistemas de referencia, la relacin
0 (x0 )

x
=
x0
x0 x

(7.101)

Puesto que esta relacin es general e independiente de la funcin escalar


, podemos concluir que las componentes del operador gradiente se transforman, bajo un cambio de coordenadas, como las componentes covariantes
de un c-vector, es decir
(7.102)
0 = v
A partir de esta definicin, podemos construir los operadores de uso ms
frecuente en fsica, siguiendo los mismos procedimientos que en el caso del
clculo vectorial tridimensional estandar. Consideremos un campo vectorial (x ), esto es, una funcin vectorial de las coordenadas y calculemos
el producto interno Minkowskiano entre este campo vectorial y el vector
gradiente:
(7.103)
=
que corresponde a la generalizacin del operador divergencia tridimensional.
Un ejemplo de esta operacin de uso muy frecuente en fsica, es la llamada

7.4. OPERADORES VECTORIALES

141

ecuacin de continuidad:
= 0

0
=0
+
x0

(7.104)

en donde el simbolo significa el operador gradiente tridimensional. Claramente esta ecuacin, por provenir de un producto interno entre c-vectores,
es invariante bajo transformaciones de coordenadas, es decir
= 0 = 0 0

(7.105)

lo que significa que la ecuacin de continuidad escrita de esta manera, automticamente satisface el principio de relatividad. Ahora, si definimos un
nuevo operador (conocido en la literatura como el DAlembertiano ) como
el producto interno del operador gradiente consigo mismo, obtenemos un
operador que es un invariante (un escalar) bajo transformaciones de coordenadas, asi
2
2
(7.106)
= = =
x02
la cual nos permite escribir directamente la ecuacin de ondas como:
= 0

(7.107)

Es conocido del lgebra vectorial, que el producto cruz entre vectores


es una operacin que solo tiene sentido para vectores cartesianos en tres
dimensiones y por lo tanto en la forma usual como ella se define, no es posible
generalizarla a vectores definidos en otras dimensiones espaciales. Realmente
el producto cruz usual es un caso particular de tensores de segundo rango,
como fue discutido al final de la seccin 5.2.3.
La operacin de antisimetrizar un tensor de segundo rango (ecuacin
(7.57)) nos permite generalizar el producto cruz del clculo verctorial usual
en tres dimensiones, al caso de varias dimensiones, obteniendose no un vector axial como en el caso tridimensional, sino un tensor de segundo rango
antisimtrico. As por ejemplo, el rotacional de una funcin vectorial
est dado por:
(7.108)
[ ] =
Si aplicamos esta definicin al caso particular de un vector tridimensional usual, con componentes A = (Ax , Ay , Az ) (A1 , A2 , A3 ) Ai y
= (/x, /y, /z) j , entonces las siguientes tres componentes

142

CAPTULO 7. TENSORES

independientes del tensor [i Aj]


[1 A2] =
[3 A1] =
[2 A3] =

Ax Ay

y
x
Ax
Az

x
z
Ay
Az

z
y

(7.109)

corresponden a las componentes del rotacional ( A)z , ( A)y y ( A)x


respectivamente, en el clculo vectorial ususal.

Captulo 8

Electrodinmica
8.1.

Introduccin

En el segundo captulo sobre los fundamentos de la teora especial de


la relatividad, vimos como las ecuaciones de Maxwell no permanecan invariantes bajo transformaciones de Galileo, indicando que si se aceptan las
leyes de la electrodinmica, entonces ellas son vlidas nicamente en un
sistema de referencia privilegiado y por lo tanto, a travs de experimentos
electromagnticos se podra determinar el movimiento absoluto. Los resultados negativos de estos experimentos planteaban una inconsistencia entre
los principios de la mecnica Newtoniana y las leyes del electromagnetismo,
las cuales condujeron a muchos tericos de la poca, a desarrollar elaboradas teorias que permitieran coexistir, sin aparente contradiccin, a estos
dos grandes pilares de la fsica del siglo XIX.
La relatividad especial, basada sobre los potulados de la constancia de
la velocidad de la luz en el vaco y el principio de relatividad, es una teora
independiente de los fenmenos elctricos y mecnicos y por esta razn constituye uno de los pilares fundamentales de la fsica. En efecto podemos
partir por ejemplo, de la validez de la ley de Coulomb para la fuerza entre
dos partculas cargadas en reposo respecto a algn observador inercial (o
equivalentemente, del campo elctrico producido por una carga en reposo)
y del carcter invariante de la carga elctrica y encontrar, utilizando los
principios de la dinmica relativista, la necesidad de introducir un campo
dependiente de la velocidad de la partcula que lo produce, conocido como el
campo magntico. Continuando con este procedimiento, ms algunas hiptesis de origen experimental, tales como la conservacin de la carga, se pueden
encontrar las leyes de la electrodinmica que rigen el comportamiento de los
143

144

CAPTULO 8. ELECTRODINMICA

campos electromagnticos, as como la fuerza sobre las partculas cargadas


en campos electromagnticos. Este mtodo de trabajo para mostrar el caracter relativista de la electrodinmica ha sido extensivamente utilizado en
la literatura (ver por ejemplo el exelente tratado en el libro de Rosser) y por
esta razn presentar en este captulo otro mtodo de trabajo, el cual nos
permite encontrar de manera directa las propiedades de transformacin de
los campos electromagnticos entre sistemas de referencia inerciales.
El objetivo fundamental de este captulo es entonces, escribir las leyes
de la electrodinmica en forma explcita covariante, es decir, de tal manera
que su invarianza relativista sea manifiesta. Como una consecuencia de esta
formulacin de las ecuaciones de Maxwell, obtendremos las ecuaciones de
transformacin de los campos elctricos y magnticos bajo transformaciones
de Lorentz. Para este fin, haremos uso del formalismo tensorial desarrollado en el captulo anterior, postulando en primer lugar, que las leyes de la
electrodinmica, constituidas por las ecuaciones de Maxwell, la ecuacin de
continuidad para la carga y la ley de la fuerza de Lorentz, son vlidas y
luego reescribiremos estas ecuaciones en trminos de cantidades tensoriales.

8.2.

Ecuaciones de Maxwell

Las leyes de la electrodinmica estn constituidas por dos conjuntos de


ecuaciones. El primer conjunto lo conforman las ecuaciones de Maxwell que
estn dadas por (en unidades cgs):
E = 4

(8.1)

B =0

(8.2)

B =

1 E 4
+
J
c t
c

E =

1 B
c t

(8.3)
(8.4)

las cuales nos determinan los campos elctrico E y magntico B en trminos de sus fuentes (cargas y corrientes), con la densidad volumtrica de
carga y J la densidad de corriente elctrica. La primera de estas ecuaciones
es conocida como la ley de Gauss y establece que las cargas elctricas son
fuente del campo elctrico, mientras que la tercera ecuacin, la correspondiente ley de Gauss para el campo magntico, nos dice que no existen fuentes
para el campo magntico, es decir, que en la naturaleza no existen cargas

8.2. ECUACIONES DE MAXWELL

145

magnticas aisladas, conocidas en la literatura como monopolos magnticos. La segunda de las ecuaciones de Maxwell contiene dos trminos: por
una parte est la ley de Ampere, esto es, que las corrientes elctricas (representadas en el trmino 4 J/c) producen campos magnticos y por otra
parte est el trmino 1/c E/t, introducido por Maxwell, que nos dice que
campos elctricos variables en el tiempo son tambin una fuente de campo
magntico. La ltima de las ecuaciones de Maxwell es la ley de induccin
de Faraday, la cual establece que campos magnticos variables en el tiempo
inducen campos elctricos.
El segundo conjunto de ecuaciones que conforman las leyes de la electrodinmica, lo constituyen la ecuacin de continuidad y la ley de la fuerza
de Lorentz:

=0
(8.5)
J +
t
dp
q
= qE + u B
dt
c

(8.6)

en donde q es la carga de la partcula y u su velocidad. La primera de


estas ecuaciones, la ecuacin de continuidad, establece que la carga elctrica
es conservada en la naturaleza. Es decir, si en una regin del espacio la
densidad de carga elctrica vara (/t 6= 0), es porque esta entrando o
saliendo carga de esa regin ( J 6= 0). Es de anotar que esta ley de
conservacin de la carga est contenida en las ecuaciones de Maxwell y por lo
tanto no constituye una ley independiente de la electrodinmica, pues basta
con tomar la divergencia de la segunda ecuacin de Maxwell y teniendo en
cuenta la ley de Gauss (primera ecuacin) se llega directamente a la ecuacin
de continuidad. Sin embargo, es usual y til, para claridad en la discusin,
mantener explcitamente esta ecuacin de continuidad. Finalmente, la ley
de la fuerza de Lorentz nos da la ecuacin de movimiento para una carga
puntual inmersa en un campo electromagntico.
Las ecuaciones de Maxwell muestran como los campos elctricos y magnticos son en realidad aspectos diferentes de un solo fenmeno. Sin embargo,
hasta el siglo XVIII los fenmenos elctricos y los magnticos, conocidos por
la humanidad desde tiempos remotos, se consideraban como fenmenos completamente independientes entre si, situacin que se puede entender ahora, si
consideramos el caso particular de campos electromagnticos independientes
del tiempo, con sus fuentes de cargas y corrientes estacionarias. Bajo estas
condiciones (campos y densidades de carga y corriente independientes del
tiempo), las ecuaciones de Maxwell (ecuaciones (8.1) a la (8.4)) se pueden
separar en dos conjuntos independientes: El primer conjunto de ecuaciones,

146

CAPTULO 8. ELECTRODINMICA

dado por:
E = 4

(8.7)

E =0

(8.8)

describe las leyes de la electrosttica. La primera ecuacin, la ley de Gauss,


describe que la nica fuente del campo elctrico son las cargas (estacionarias), mientras que la segunda ecuacin nos dice que el campo producido por
estas cargas es conservativo. Estas dos ecuaciones son equivalentes a la ley
de Coulomb. El segundo conjunto de ecuaciones
B =

4
J
c

B =0

(8.9)
(8.10)

constituido por la ley de Ampere (con densidad de corriente estacionaria J,


i.e. J = 0) y la ley de Gauss para el campo magntico, describen las leyes
de la magnetosttica y muestran que la nica fuente del campo magntico
tambin son las cargas elctricas, pero ahora en movimiento (corrientes). Si
bien sabemos que el origen de los campos electrostticos y magnetostticos
son las cargas, los conjuntos de ecuaciones (8.7), (8.8) y (8.9), (8.10) para los
campos E y B no establecen ninguna relacin entre estos campos, es decir, si
bien E y B tienen en ltimas las mismas fuentes por origen, son conceptual
y fenomenolgicamente diferentes. Veremos en la siguiente seccin, como
la relatividad especial nos permite establecer una relacin entre el campo
magntico y el elctrico, an en el caso particular de campos independientes
del tiempo.

8.3.

Campo magntico como un efecto relativista

Antes de entrar al tema central del presente captulo, mostraremos en


esta seccin la estrecha relacin que existe entre los fenmenos elctricos y
magnticos (para campos independientes del tiempo) como una aplicacin de
los postulados fundamentales de la teora especial de la relatividad. Veamos
entonces, como surge el concepto de campo magntico como una necesidad
para mantener la invarianza de las leyes fsicas, si suponemos que la ley de
Coulomb, la cual nos da la fuerza entre dos partculas cargadas en reposo,
es vlida. Coulomb fue el primero en describir cuantitativamente la fuerza
entre partculas cargadas estacionarias a travs de la ley de fuerzas:
f12 = k

q1 q2
r
r2

(8.11)

8.3. CAMPO MAGNTICO COMO UN EFECTO RELATIVISTA

147

en donde q1 y q2 miden las cargas elctricas de las partculas, r es la distancia


entre en ellas, con r un vector unitario en la direccin del radio vector que
une la carga 1 con la carga 2, y k es una constante de proporcionalidad
que depende del sistema de unidades elegido (k = 1 en el sistema cgs que
usaremos en el presente captulo). Entonces f12 nos mide la fuerza que la
carga q2 experimenta debido a la carga q1 , siendo esta fuerza atractica o
repulsiva dependiendo del signo de las cargas: repulsiva si las cargas son
del mismo signo y atractiva en caso contrario. Adems, esta expresin de la
fuerza satisface por su definicin la tercera ley de Newton, esto es f12 = f21 .
En esta relacin (ecuacin (8.11)) se ha expresado la fuerza sobre la carga
q2 debido a la carga q1 y en este sentido podemos escribir la ley de Coulomb
en la forma:
(8.12)
f12 = q2 E1 (r)
en donde la cantidad E1 (r), definida como
E1 (r) :=

q1
r
r2

(8.13)

es el campo elctrico producido por la carga q1 en el punto r (hemos elegido


el origen del sistema de coordenadas espaciales en la posicin de la carga q1
para simplicar las expresiones). Estas expresiones para la fuerza (ecuacin
(8.11)) y el campo elctrico (ecuacin (8.13)) son vlidas para un observador inercial , con respecto al cual la carga q1 est en reposo. Es un hecho
experimental, que la fuerza sobre la carga de prueba q2 es independiente
del estado de movimiento de la carga de prueba, lo cual est implcito en
la expresin para la fuerza de Coulomb, pues ella depende solamente de la
posicin instantnea de la carga q2 . Adems, tanto la fuerza de Coulomb
como el campo elctrico producido por la carga q1 , son independientes del
tiempo siempre y cuando la carga q1 permanezca en reposo. Experimentalmente determinamos la fuerza f12 sobre la carga de prueba q2 en el sistema
de referencia inercial , midiendo la rata de cambio del momentun p2 de
la carga q2 , es decir midiendo dp2 /dt, as como tambin las otras variables
cinemticas y dinmicas que entran en la definicin de la fuerza de Coulomb,
tales como la distancia entre la carga q1 y la de prueba, la velocidad (nula
en este caso) de la carga q1 y el momentun p2 de q2 . Si consideramos otro
sistema de referencia inercial 0 , el cual se mueve con velocidad v a lo largo
de los ejes x, x0 con respecto a , entonces todas las cantidades cinemticas
y dinmicas deben transformarce de acuerdo con los principios de la relatividad especial y a partir de estas cantidades podemos determinar la fuerza
sobre la carga de prueba, pero ahora estando las cargas q1 y q2 en moviento.

148

CAPTULO 8. ELECTRODINMICA

Figura 8.1: Interaccin Coulombiana normal al movimiento

Nuestro primer objetivo es determinar la fuerza sobre una carga de prueba q2 , medida por un observador inercial , debida a una carga q1 que se
mueve con velocidad constante. Para simplificar los clculos y sin prdida
de generalidad, consideraremos dos situaciones particulares: En la primera,
ilustrada en la Figura 8.1, la carga de prueba q2 se encuentra en reposo
con respecto al sistema y est situada sobre el eje y en las coordenadas
(0, y, 0), mientras que la carga q1 se mueve con velocidad v a lo largo del eje
positivo de las x y pasa por el origen de coordenadas en el instante t = 0.
La segunda situacin, mostrada en la Figura 8.2, se diferencia de la anterior solamente en que ahora la carga de prueba, que la denotaremos ahora
por q3 , se situa en reposo respecto al sistema sobre el eje de las x en las
coordenadas (x, 0, 0).
Debido a que la carga q1 se est moviendo, debemos pasarnos a un sistema de referencia inercial 0 con respecto al cual esta carga se encuentre
en reposo, con el fin de poder aplicar la ley de Coulomb. Considerados un
sistema de referencia inercial 0 , que se mueva con velocidad v a lo largo del
eje positivo x, siendo v la velocidad de la carga q1 respecto a . Entonces,
para todo instante t0 la carga q1 se encuentra en reposo en el origen de coordenadas de 0 , mientras que la carga de prueba q2 pasa por el punto de
coordenadas (0, y 0 , 0) en el instante t0 = 0 y la carga q3 pasa por el punto

8.3. CAMPO MAGNTICO COMO UN EFECTO RELATIVISTA

149

Figura 8.2: Interaccin Coulombiana en la direccin de movimiento


de coordenadas (x0 , 0, 0) en t0 = 0. Bajo estas condiciones, las fuerzas sobre
las cargas q2 y q3 estn dadas por la ley de Coulomb (ecuacin (8.11)). Entonces, sobre la carga q2 la fuerza en el instante t0 = 0 solo tiene componente
y y est dada por:
q1 q2 0
0
0
= 0; fy12
= 02 ; fz12
=0
(8.14)
fx12
y
mientras que para la carga q3 la fuerza de Coulomb, en t0 = 0, tiene solo
componente x:
q1 q3 0
0
0
= 02 ; fy13
= 0; fz13
=0
(8.15)
fx13
x
Retornemos ahora al sistema de referencia inercial . Para este fin,
recordemos la definicin de las componentes del c-vector fuerza (ecuacin
(5.19))
1
(8.16)
f = (f 0 , f 1 , f 2 , f 3 ) = (u)( f u, f )
c
en donde u es la velocidad de la partcula sobre la cual esta actuando la
fuerza fsica f . Bajo la transformacin de Lorentz que estamos considerando, las componentes de la c-fuerza medidas por 0 estn relacionadas con
las correspondientes componentes de la c-fuerza medidas en , por las relaciones:
(8.17)
f 0 = (v)(f 00 + f 01 )

150

CAPTULO 8. ELECTRODINMICA
f 1 = (v)(f 01 + f 00 )

(8.18)

f 2 = f 02

(8.19)

f 3 = f 03

(8.20)

siendo v la velocidad de respecto a 0 , = v/c y (v) = (v). Teniendo


en cuenta la ecuacin (8.16) y recordando la forma como el factor (u0 ) se
transforma (ver ecuacin (4.13)), las ecuaciones de transformacin para las
componentes de la fuerza fsica f estn dadas por:
fx =

fy =

fz =

u01

v 0
f u0
c2
0
x
1 + vu
c2

fx0 +

f0
y
(v) 1 +

f0
z
(v) 1 +

(8.21)

vu0x
c2

(8.22)

vu0x
c2

(8.23)

Dado que la velocidad u0 de las cargas q2 y q3 , que las denotaremos por


y u02 respectivamente, estn dadas por:
u01 = (v, 0, 0)

(8.24)

u02 = (v, 0, 0)

(8.25)

con respecto al sistema de referencia 0 , tenemos que las componentes de la


fuerza fsica respecto a son:
0
=0
fx12 = fx12
0
= (v)
fy12 = (v) fy12
0
fz12 = fz12
=0

para la carga q2 , y
0
fx13 = fx13
=

q1 q3
x02

(8.26)
q1 q2
y02

(8.27)
(8.28)
(8.29)

0
=0
fy13 = fy13

(8.30)

0
=0
fz13 = fz13

(8.31)

8.3. CAMPO MAGNTICO COMO UN EFECTO RELATIVISTA

151

para la carga q3 . Puesto que bajo la transformacin de Lorentz considerada


y0 = y y x0 = (v)x, obtenemos que las componentes no nulas de la fuerza
en , sobre las cargas de prueba q2 y q3 , estn dadas por:
q1 q2
y2

(8.32)

1 q1 q3
2 (v) x2

(8.33)

fy12 = (v)
fx13 =

respectivamente. A partir de estos resultados, es fcil intuir la forma general


para la fuerza elctrica en un instante dado sobre una partcula de prueba
q2 en reposo en un punto de coordenadas (x, y, z), debido a una carga q1 que
se desplaza a velocidad constante v a los largo del eje de las x y que pasa
por el origen de coordenadas en ese instante:
f = q1 q2

(v)r
+ y 2 + z 2 )3/2

( 2 (v)x2

(8.34)

en donde r es el vector posicin instantneo que une la carga q1 con la


carga de prueba q2 . As, podemos definir el campo elctrico producido por
una partcula mvil, situada instantneamente en el origen de coordenadas,
como:
(v)r
(8.35)
E = q1 2
2
( (v)x + y 2 + z 2 )3/2
Notemos en primer lugar, que el campo elctrico sigue siendo radial,
an cuando ya no es esfricamente simtrico como en el caso del campo
elctrico producido por una carga en reposo, pues de la ecuacin anterior se
deduce que el campo elctrico se intensifica en un factor (v) para puntos
del espacio situados en el plano perpendicular a la direccin de movimiento
de la partcula, mientras que se hace un factor 1/ 2 (v) ms pequeo para
puntos situados a lo largo de la direccin de movimiento de la carga q1 .
Consideremos ahora dos cargas q1 y q2 como se muestra en la Figura 8.3,
en donde la carga q1 se mueve con velocidad v a lo largo del eje x positivo
con respecto al sistema de referencia y la carga q2 se mueve con velocidad
u = (ux , uy , uz ) respecto a y supongamos que en el instante t = 0, la carga
q1 pasa por el origen de coordenadas y q2 por el punto (x, y, z) . Similar al
caso anteriormente discutido, sea 0 un sistema de referencia inercial que
se desplaza con velocidad v en la direccin positiva de las x respecto a .
Entonces, con respecto al observador 0 la carga q1 se encuentran en reposo
en el origen de coordenadas de 0 y q2 pasa por el punto de coordenadas

152

CAPTULO 8. ELECTRODINMICA

Figura 8.3: Interaccin entre cargas con movimiento arbitrario


(x0 , y 0 , z 0 ) en el instante t0 = 0, moviendose con una velocidad u0 . De la ley
de Coulomb, las componentes de la fuerza medidas por el observador inercial
0 estn dadas por:
q1 q2 x0
0
fx12
= 02
(8.36)
(x + y02 + z 02 )3/2
0
fy12
=

q1 q2 y 0
(x02 + y 02 + z 02 )3/2

(8.37)

0
=
fz12

q1 q2 z 0
(x02 + y02 + z 02 )3/2

(8.38)

las cuales son independientes de la velocidad u0 de la carga de prueba. Aplicando las ecuaciones (8.21), (8.22) y (8.23) para la transformacin de las
componentes de la fuerza y teniendo en cuenta la ley de transformacin de
velocidades:
ux v
(8.39)
u0x =
x
1 vu
c2
u0y =
u0z =

u
y
(v) 1

u
z
(v) 1

vux
c2
vux
c2

(8.40)
(8.41)

8.3. CAMPO MAGNTICO COMO UN EFECTO RELATIVISTA

153

obtenemos para las componentes de la fuerza sobre la carga de prueba q2 ,


medidas por el observador inercial :
fx12 =

vuy
(v)q1 q2
vuz
x
+
y
+
z
c2
c2
( 2 (v)x2 + y 2 + z 2 )3/2

vux
(v)q1 q2 y
1

c2
( 2 (v)x2 + y2 + z 2 )3/2

vux
(v)q1 q2 z
1

= 2
c2
( (v)x2 + y 2 + z 2 )3/2

(8.42)

fy12 =

(8.43)

fz12

(8.44)

Sabemos que la fuerza de Coulomb sobre una carga de prueba es independiente del estado de movimiento de dicha carga de prueba. Sin embargo,
comparando la ecuacin (8.32) con las ecuaciones (8.42), (8.43) y (8.44)
para la fuerza sobre la carga de prueba q2 , la primera cuando q2 est en
reposo y la segunda cuando est en movimiento, vemos que en el segundo
caso aparecen unos trminos extras a la fuerza elctrica (de Coulomb). Para
ver esto de una manera ms directa, notemos que la fuerza sobre la carga
de prueba q2 (ecuaciones (8.42), (8.43) y (8.44)) la podemos escribir en la
forma:
u
(elec)
(mag)
(8.45)
f12 = f12 + f12 ; = q2 E + q2 B
c
en donde E es el campo elctrico producido por la carga q1 dado por
(ecuacin (8.35)):
q1 (v)r
(8.46)
E= 2
( (v)x2 + y 2 + z 2 )3/2
siendo u la velocidad de la carga de prueba q2 y definimos el campo magntico B producido por la carga q1 , como:
B

(v)q1 r
1
= v 2
c
( (v)x2 + y 2 + z 2 )3/2
1
vE
=
c
:

(8.47)

siendo v la velocidad de la carga q1 . Teniendo en cuenta que la velocidad de


la carga q1 , en el caso considerado est dada por v = (v, 0, 0), es fcil ver por
un clculo directo, que la expresin general dada por la ecuacin (8.45) se
reduce a la expresin para fuerza, encontrada en las ecuaciones (8.42), (8.43)
y (8.44). En la ecuacin (8.45) se dividi explcitamente la fuerza que actua
sobre la carga de prueba en dos trminos: El primero corresponde a la fuerza
Coulombiana que actua sobre la carga q2 , la cual es independiente del estado

154

CAPTULO 8. ELECTRODINMICA

de movimiento de dicha carga de prueba, mientras que el segundo trmino


s es dependiente de la velocidad de dicha carga. Adems, este segundo
trmino se anula si cualquiera de las cargas, la carga fuente q1 o la de prueba
q2 estn en reposo. Este resultado nos muestra la estrecha relacin entre
los fenmenos elctricos y magnticos. Es importante tener en mente, que
en todo nuestro anlisis hemos trabajo bajo la suposicin que las cargas
no estn sometidas a aceleraciones, pues para considerar esta situacin es
necesario trabajar con las leyes completas de la electrodinmica.
Es posible continuar con este mtodo de trabajo y obtener la ley de BiotSabart y la ley de Ampere para corrientes estacionarias, pero dejaremos estos
temas de lado, para concentrarnos en el objetivo fundamental del presente
captulo.
En la siguiente seccin escribiremos las ecuaciones de Maxwell en forma
explcita relativista y encontraremos las leyes generales de transformacin
de los campos electromagnticos, entre sistemas de referencia inerciales y
mostraremos, cmo los resultados anteriormente obtenidos, corresponden a
casos particulares de estas leyes de transformacin.

8.4.

Ecuaciones de Maxwell covariantes

Consideremos en primer lugar la ecuacin de continuidad (8.5), la cual


podemos escribir en forma explcitamente covariante, como:
J = 0

(8.48)

teniendo encuenta lo establecido en la ltima seccin del captulo anterior y


donde el c-vector corriente J se ha definido en la forma:
J := (J 0 , J 1 , J 2 , J 3 ) = (c, J)

(8.49)

La componente temporal J 0 representa la densidad de carga (siendo la


carga un invariante relativista) y las componentes espaciales J i , i = 1, 2, 3
corresponden a las componentes del vector densidad de corriente elctrica.
Esta definicin del c-vector corriente nos da inmediatamente, las ecuaciones
de transformacin para las densidades de carga y corriente, medidas por dos
observadores inerciales. En efecto, dados dos sistemas de referencia inerciales
y 0 , con J = (c, J) y J 0 = (c0 , J 0 ) las componentes del c-vector corriente medidas por los dos observadores, entonces J y J 0 estn relacionadas
por (ver ecuacin (7.2)):
(8.50)
J 0 = J

8.4. ECUACIONES DE MAXWELL COVARIANTES

155

Para el caso particular de dos sistemas de referencia inerciales, con v la


velocidad del sistema 0 respecto a , a lo largo del eje positivo de las x y
ejes espaciales paralelos, tenemos que las ecuaciones de transformacin para
las componentes de la densidad de corriente estn dadas por:
J 00 = (v)(J 0 J 1 )

(8.51)

J 01 = (v)(J 1 J 0

(8.52)

(8.53)

J 03 = J 3

(8.54)

02

=J

en donde hemos utilizado las ecuaciones (2.46)


p para los elementos de la trans
formacin de Lorentz , siendo (v) = 1/ 1 2 y = v/c. Remplazando las componentes J 0 y J en trminos de las densidades de carga (J 0 = c
y J 00 = c0 ) y de corriente ( j i = J (Jx , Jy , Jz ) y j 0i = J 0 (Jx0 , Jy0 , Jz 0 ))
obtenemos las relaciones:
v
(8.55)
0 = (v)( 2 Jx )
c
Jx0 = (v)(Jx v)

(8.56)

Jy0 = Jy

(8.57)

Jz0 = Jz

(8.58)

En las ecuaciones de Maxwell escritas en la forma tradicional (ecuaciones


(8.1) a la (8.4)) los campos elctricos E y magnticos B son vectores cartesianos usuales y por lo tanto no corresponden a ninguna cantidad relativista,
es decir a un escalar de Lorentz, o a un c-vector, o a un tensor. Por otra parte,
para describir los campos electromagnticos producidos por alguna distribucin de cargas y corrientes, es necesario conocer seis cantidades independientes, esto es, las tres componentes del campo elctrico y las tres del campo
magntico. Esta situacin nos conduce a postular, que el objeto matemtico
(relativista) adecuado para describir al campo electromagntico, es un tensor
de segundo orden antisimtrico, pues por lo discutido en el captulo anterior (seccin 8.2.3), este tensor posee solo seis componentes independientes.
Estos argumentos nos motivan a definir el tensor campo electromagntico
F medido por un observador inercial , como un tensor de segundo rango
antisimtrico cuyas componente contravariantes estn definidas por:
F 12 = F 21 = Bz
F 01 = F 10 = Ex
F = 0

F 23 = F 32 = Bx
F 02 = F 20 = Ey

F 31 = F 13 = By
F 03 = F 30 = Ez
= 0, 1, 2, 3

(8.59)

156

CAPTULO 8. ELECTRODINMICA

Con esta definicin, podemos escribir las dos primeras ecuaciones de


Maxwell (ecuaciones (8.1) y (8.2)) en la forma:
F =

4
J
c

(8.60)

la cual es una ecuacin covariante relativista, pues el lado izquierdo es el


producto del operador gradiente por el tensor electromagntico F contraido en su primer ndice , para obtener as un c-vector contravariante, el
cual es proporcional al c-vector densidad de corriente. Esto significa que esta
ecuacin tiene la misma forma en todos los sistemas de referencia inerciales,
es decir, en un sistema de referencia 0 , para el cual F 0 y J 0 son las correspondientes componentes del tensor campo electromagntico y densidad
de corriente, las dos primeras ecuaciones de Maxwell tienen la forma:
0 F 0 =

4 0
J
c

(8.61)

en donde las componentes de la densidad de corriente J 0 medidas en 0 , estn relacionadas con las medidas en , por las ecuaciones de transformacin
(8.50) ( o las ecuaciones (8.51), (8.52), (8.53) y (8.54) o tambin las ecuaciones (8.55), (8.56), (8.57) y (8.58) en el caso particular usual). Las componentes del tensor campo electromagntico medidas por los dos observadores
inerciales y 0 estn relacionadas por las ecuaciones de transformacin
(ver el captulo anterior ecuacin (7.3)):
F 0 = F

(8.62)

Estas relaciones nos dan entonces, las ecuaciones de transformacin para


los campos elctricos y magnticos medidas por dos observadores inerciales.
Consideremos de nuevo, el caso particular de transformaciones de Lorentz
entre sistemas de referencia con ejes paralelos y velocidad relativa a lo largo
de los ejes xx0 , en donde los elementos de la transformacin de Lorentz estn
dados por (ecuacin (2.47)):
00 = 11 =

(8.63)

01 = 10 =

(8.64)

22

33

=
=1
p
con = v/c y = 1 2 y los dems elementos cero. Sean
E = (Ex , Ey , Ez )

(8.65)

(8.66)

8.4. ECUACIONES DE MAXWELL COVARIANTES

157

B = (Bx , By , Bz )

(8.67)

E 0 =(Ex0 , Ey0 , Ez0 )

(8.68)

B 0 = (Bx0 , By0 , Bz0 )

(8.69)

las componentes de los campos elctricos y magnticos medidas por y respectivamente. Entonces aplicando las ecuaciones de transformacin (8.62),
con los elementos de la transformacin de Lorentz dados por las ecuaciones
(8.63), (8.64) y (8.65) y la definicin (8.59) de las componentes del tensor
electromagntico, tenemos (para las componentes no nulas de F):
Ex0 = F

0 01

= 0 1 F

= 00 10 F 00 + 00 11 F 01 + 00 12 F 02 + 00 13 F 03
+01 10 F 10 + 01 11 F 11 + 01 12 F 12 + 01 13 F 13
+02 10 F 20 + 02 11 F 21 + 02 12 F 22 + 02 13 F 23
+03 10 F 30 + 03 11 F 31 + 03 12 F 32 + 03 13 F 33
= 00 11 F 01 + 01 10 F 10
= 2 Ex 2 2 Ex
= Ex

(8.70)

Un clculo similar se puede hacer para las dems componentes, pero por
brevedad, aqu solo presentaremos los tminos no nulos que surgen en la
transformacin:
Ey0 = F

0 02

= 0 2 F = 00 22 F 02 + 01 22 F 12

= (Ey Bz )
Ez0 = F

0 03

= 0 3 F = 00 33 F 03 + 01 33 F 13

= (Ez + By )

Bx0 = F
=

0 23

(8.72)

= 2 3 F = 22 33 F 23

Bx

By0 = F

(8.71)

0 31

(8.73)
= 3 1 F = 33 10 F 30 + 33 11 F 31

= (By + Ez )

(8.74)

158

CAPTULO 8. ELECTRODINMICA
Bz0 = F

0 12

= 1 2 F = 10 22 F 02 + 11 22 F 12

= (Bz Ey )

(8.75)

Antes de considerar aplicaciones de estas ecuaciones de transformacin


de los campos, las cuales sern dadas ms adelante, escribamos las otras
ecuaciones de Maxwell en notacin tensorial.
Las ecuaciones de Maxwell homogneas (las dos ltimas ecuaciones (8.3)
y (8.4)), con la ayuda del tensor de Levi-Civita introducido en el captulo
anterior (ecuacin (7.75)), las podemos escribir en la forma:
F = 0

(8.76)

en donde en esta ltima ecuacin se ha utilizado el tensor de Minkowski


para bajar los ndices del tensor electromagntico F, esto es:
F = F

(8.77)

las cuales nos representa las componentes covariantes del tensor campo electromagntico. Para recordar ms fcilmente la relacin entre las componentes contravariantes del tensor F, definidas en la ecuacin (8.59) y su
relacin con las componentes covariantes, definidas en la ecuacin (8.77), es
til escribir estas componentes en forma matricial:
00

F
F 01 F 02 F 03

10

F
F 11 F 12 F 13

(F ) =
F 20 F 21 F 22 F 23

30

F
F 31 F 32 F 33

0
E
E
E

x
y
z

Ex
0
Bz
By
=
(8.78)
Ey Bz
0
Bx

Ez
By
Bx
0
Aplicando, ahora, la ecuacin (8.77), tenemos:

F00 F01 F02 F03

F10 F11 F12 F13


(F ) =
F
F21 F22 F23

20

F30 F31 F32 F33

0 Ex Ey Ez

Ex
0
Bz
By
=
E
B
0
Bx

y
Ez
By
Bx
0

(8.79)

8.4. ECUACIONES DE MAXWELL COVARIANTES

159

Ilustremos como se aplic la ecuacin (8.77) para llegar a la ecuacin anterior, calculando explcitamente dos trminos, por ejemplo F02 y F21 . Recordando, para simplificar, que los elementos del tensor mtrico de Minkowski
se anulan si los ndices son diferentes, vemos que de los 16 sumandos que
aparecen por la doble suma en la ecuacin (8.77), solo un trmino es no nulo:
F02 = 0 2 F = 00 22 F 02 = Ey

(8.80)

F21 = 2 1 F = 22 11 F 21 = Bz

(8.81)

Veamos ahora que efectivamente la ecuacin (8.76) reproduce las ecuaciones de Maxwell homogeneas. Notemos en primer lugar que la ecuacin
(8.76) contiene cuatro ecuaciones, una para cada = 0, 1, 2, 3 y cada una
a su vez (debido a la triple suma sobre los ndices repetidos , y ) est
conformada por 64 sumandos. Sin embargo, dado que las componentes del
tensor de Levi-Civita se anulan para cualquier par de ndices repetidos, en
cada ecuacin sobreviven solo cuatro sumandos. As, para = 0 los trminos
no nulos son:
0 = 0123 1 F23 + 0132 1 F32 + 0213 2 F13 +
0231 2 F31 + 0312 3 F12 + 0321 3 F21
By
Bz
Bx
+2
+2
= 2 B
= 2
x
y
z

(8.82)

obteniendo la ecuacin de Maxwell para la divergencia del campo magntico. Para la ltima ecuacin de Maxwell, la ley de Faraday, consideremos
explcitamente solo el caso de = 1, pues el resultado se puede extrapolar
fcilmente a = 2 y 3. Entonces, para = 1 los trminos no nulos son:
0 = 1023 0 F23 + 1032 0 F32 + 1203 2 F03 +
1230 2 F30 + 1302 3 F02 + 1320 3 F20
Ey
Ez
2 Bx
Bx
+2
2
=
2( E)x
= 2
ct
y
z
c t

(8.83)

en donde hemos utilizado el hecho que x0 = ct, obteniendo as la componente


x de la ley de Faraday.
Finalmente consideremos la ecuacin de la Fuerza de Lorentz (segunda
ecuacin en (8.6)), la cual podemos escribir en forma covariante como:
f =

q
q
dx
dp
= F
= F
d
c
d
c

dx

(8.84)

160

CAPTULO 8. ELECTRODINMICA

en donde p es el c-momentun de la partcula de carga q, el tiempo propio,


x sus coordenadas de posicin y F las componentes mixtas del tensor
campo electromagntico definidas por:
F

= F

(8.85)

Desarrollemos explcitamente la ecuacin (8.84), para interpretar los trminos que de ella surgen, pues si bien afirmamos que esta ecuacin es equivalente a la fuerza de Lorentz, notemos que, siendo la fuerza de Lorentz una
ecuacin vectorial, contiene tres ecuaciones escalares independientes, mientras que la ecuacin (8.84) es cuadri-vectorial y por tanto contiene cuatro
ecuaciones. En primer lugar calculemos, utilizando la ecuacin (8.85), las
componentes mixtas F del tensor campo electromagntico:

(F

0
F0

) =
F

0
F0

Ex
=
E

y
Ez

0
1
2
3

F1
F1
F1
F1
Ex
0
Bz
By

0
1
2
3

F2
F2
F2
F2

Ey
Bz
0
Bx

0
1
2
3

F
F3
F3
F3

Ez
By
Bx
0

0
3
1
2
3

(8.86)

Remplazando estas cantidades en la ecuacin (8.84), y desarrollandola


explcitamente en componentes, tenemos:
dx1
dx2
dx3
q
f 0 = (Ex
+ Ey
+ Ez
)
c
d
d
d

(8.87)

dx0
dx2
dx3
q
+ Bz
By
)
f 1 = (Ex
c
d
d
d

(8.88)

dx0
dx1
dx3
q
f 2 = (Ey
Bz
+ Bx
)
c
d
d
d

(8.89)

dx0
dx1
dx2
q
f 3 = (Ez
+ By
Bx
)
(8.90)
c
d
d
d
Para interpretar estas ecuaciones, recordemos el significado fsico de las
componentes de la cuadri-fuerza dado en el captulo 5 (ver ecuacin (5.19)).
Las componentes de la c-fuerza se pueden escribir en la forma:
1
f = (u)( f u, f )
c

(8.91)

8.4. ECUACIONES DE MAXWELL COVARIANTES

161

en donde f = dp/dt es la fuerza fsica sobre la partcula, u su velocidad


y la componente temporal representa el trabajo por unidad de tiempo que
realiza la fuerza fsica f sobre la partcula. Recordando que
1
dt
= (u) := p
d
1 u2 /c2

(8.92)

(ver captulo 4 ecuacin (4.5)), podemos reescribir las ecuaciones (8.87),


(8.88), (8.89) y (8.90), en la forma siguiente:
q
1
f u= Eu
c
c

(8.93)

f = q E + qu B

(8.94)

Notemos que el factor de Lorentz (u) se cancela. La componente temporal de la c-fuerza, corresponde al hecho de que solo el campo elctrico
realiza trabajo sobre las partculas, una situacin que est contemplada en
la expresin para la fuerza de Lorentz, puesto que la fuerza debida al campo
magntico es de la forma qu B y por lo tanto:
q
f u = (q E + u B) u = E u
c

(8.95)

Resumiendo, las leyes de la electrodinmica (que incluyen las ecuaciones


de Maxwell, la ecuacin de continuidad y la fuerza de Lorentz) escritas en
forma relativista covariante son:
F = 4J

(8.96)

F = 0

(8.97)

(8.98)

J = 0
dx

q
(8.99)
f = F
c
d
Veamos ahora, algunas aplicaciones sencillas de estas ecuaciones y de las
propiedades de transformacin de los campos. Consideremos en primer lugar
los ejemplos tratados en la seccin anterior. Supongamos que una partcula
de carga q1 se mueve con velocidad constante v respecto a un sistema de
referencia inercial , a lo largo del eje positivo de las x y pasa por el origen
en el intante t = 0. Sea 0 otro sistema de referencia inercial, el cual se
mueve con velocidad v respecto a en la direccin del eje positivo de las
x. Entonces, la carga q1 se encuentra en reposo en el origen de 0 y por lo

162

CAPTULO 8. ELECTRODINMICA

tanto el campo electromagntico, en un punto de coordenadas (x0 , y 0 , z 0 ) y


en cualquier instante, producido por q1 se reduce a:
q1
(8.100)
E 0 = 03 r0 ; B 0 = 0
r
de acuerdo con la ley de Coulomb, en donde r0 = (x0 , y 0 , z 0 ) y r0 = (x02 +y 02 +
z 02 )1/2 . Para calcular el campo electromagntico medido por el observador
inercial , calculamos primero las componentes del tensor campo electromagntico en 0 y luego aplicamos las propiedades de transformacin del
0 . De la ecuacin (8.100) tenemos (en notacin matricial):
tensor F

q1 x0
q1 y0
q1 z 0

0
03
03
03

r
r
r

q1 x0

0
0
0
03
0
r
(8.101)
(F ) =
0

qr103y
0
0
0

q1 z0

0
0
0
r03
Aplicando las ecuaciones de transformacin para las componentes del
tensor F 0 (ecuacin (8.62)), pero teniendo en cuenta que ahora estamos
transformando del sistema 0 al :
F = F 0

(8.102)

en donde los elementos de la transformacin de Lorentz estn dados por


las ecuaciones (8.63), (8.64) y (8.65), cambiando = v/c por , y teniendo
en cuenta que (v) = (v).
Consideremos primero los trmino F 0i , i = 1, 2, 3 que corresponden a las
componentes del campo elctrico medido en . Entonces, como 02 = 03 = 0
y i = 0 para 6= 0 y 6= i y teniendo en cuenta que F 0ij = 0, i, j = 1, 2, 3
(no hay campo magntico en 0 ), tenemos que los trminos no nulos de la
ecuacin (8.102) son:
F 0i = 0 i F 0
= 00 i F 00 + 01 i F 01
= 00 ii F 00i + 01 i0 F 010

(8.103)

Notemos que en el primer trmino de la ltima igualdad no hay suma


sobre el ndice i, pues est repetido tres veces. Esto surgi del hecho que
ij = 0 si i 6= j; i, j = 1, 2, 3. Remplazando explcitamente los diferentes
trminos, tenemos que las componentes del campo elctrico medidas por el
observador estn dadas por:
Ex = 2 (v)Ex0 2 2 (v)Ex0 = Ex0

(8.104)

8.5. TRANSFORMACIONES GAUGE

163

Ey = (v)Ey0

(8.105)

Ez = (v)Ez0

(8.106)

Notemos que en el instante t = 0 medido en , la carga est en el origen


y la relacin entre las coordenadas del punto donde estamos observando el
campo elctrico es (x0 , y0 , z 0 ) = ((v)x, y, z) en ese instante. Entonces, si expresamos el campo elctrico medido por en trminos de las coordenadas
de , obtenemos el resultado ya encontrado en la seccin anterior, ecuacin
(8.35). Calculemos ahora las componentes del campo magntico en el sistema de referencia . Procediendo de forma similar, escribamos primero las
componentes no nulas de la ecuacin (8.102) que corresponden al campo
magntico, notando que i 6= j; i, j = 1, 2, 3 y no hay suma sobre tres ndices
repetidos:
F ij = i j F 0
= i0 jj F 00j + ii j0 F 0i0

(8.107)

Remplazando, tenemos que las componentes del campo magntico son:


Bx = F 23 = 0

(8.108)

By = F 31 = (v)Ez0

(8.109)

Bz = F

12

= (v)Ey0

(8.110)

Este resultado lo podemos escribir en forma condensada como:


1
B = vE
c

(8.111)

en completo acuerdo con el resultado obtenido en la seccin anterior, ecuacin


(8.47), teniendo en cuenta las ecuaciones (8.104), (8.105) y (8.106) y que la
velocidad est dada por:
v = (v, 0, 0)
(8.112)

8.5.

Transformaciones Gauge

Hay dos teoremas del clculo diferencial en varias variables, que nos
permiten escribir las ecuaciones de Maxwell en forma ms compacta:
Teorema 9.1: Sea F una funcin vectoria tal que su rotacional es cero,
i.e., F = 0, entonces la funcin F se puede escribir como el gradiente
de una funcin escalar (r), esto es:
F = (r)

(8.113)

164

CAPTULO 8. ELECTRODINMICA

Teorema 9.2: Sea F una funcin vectorial tal que su divergencia es cero,
i.e., F = 0 , entonces la funcin F se puede escribir como el rotacional
de una funcin vectorial (r), esto es:
F = (r)

(8.114)

Apliquemos estos dos resultados del clculo vectorial a los campos elctrico
y magntico. La tercera ecuacin de Maxwell (8.3) establece que
B =0

(8.115)

entonces podemos escribir el campo magntico como el rotacional de una


funcin vectorial, es decir:
B =A
(8.116)
en donde la funcin vectorial A se le llama el potencial vectorial.
Ahora, si reemplazamos el campo magntico en la ltima de las ecuaciones (8.4) en trminos del potencial vectorial A, tenemos:
(E +

A
)=0
t

(8.117)

esto significa, de acuerdo con el Teorema 9.2, que la funcin vectorial


E + A/t la podemos escribir como el gradiente de una funcin escalar ,
es decir
A
=
(8.118)
E+
t
en donde es el potencial escalar. El signo menos en la ecuacin anterior
permite interpretar directamente al potencial , para el caso de campos
independientes del tiempo, como el trabajo por unidad de carga realizado
por el campo elctrico, llamado potencial electrosttico, el cual es un campo
conservativo.
Estos dos teoremas del clculo vectorial, corresponden a casos particulares de un teorema ms general de tensores:
Teorema 9.3: Sean T las componentes covariantes de un tensor de
segundo rango antisimtrico, tal que
T = 0

(8.119)

entonces el tensor T se puede escribir como el rotacional (ver ecuacin


(7.108)) de una funcin cuadri-vectorial W , es decir
T = [ W] = W W

(8.120)

8.5. TRANSFORMACIONES GAUGE

165

Como vimos en la seccin 9.4 de este captulo, las dos ecuaciones de


Maxwell homogeneas ( B = 0 y E + B/t = 0) se pueden escribir
en la forma
F = 0

(8.121)

en donde F es el tensor campo electromagntico. Entonces, de acuerdo con


el Teorema 9.3, el tensor campo electromagntico F se puede escribir en
la forma
A
A
F = A A =

(8.122)
x
x
en donde el cuadri-vector A , definido como:
A := (, A)

(8.123)

es llamado el cuadri-potencial,con A el potencial vectorial y el potencial


escalar definidos en la ecuaciones (8.116) y (8.118) respectivamente.
Con esta definicin del c-potencial A , podemos escribir las ecuaciones
de Maxwell inhomogeneas (ver ecuacin (8.60)):
F = 4J

(8.124)

en trminos del c-potencial A . Remplazando la ecuacin (8.122) en la


ecuacin anterior y teniendo en cuenta que F = F y J = J ,
obtenemos:
A A = 4J

(8.125)

De esta manera, esta ltima ecuacin es equivalente a las ecuaciones de


campo de Maxwell, pues dadas las fuentes de los campos J y resolviendo
la ecuacin (8.125), conocemos el c-potencial A y as los campos electromagnticos.
Por otra parte, de la ecuacin de definicin de F en trminos del potencial c-vectorial, notemos que podemos cambiar A , adicionandole una
funcin cualquiera de la forma , sin que cambia el tensor campo electromagntico F . Es decir, si realizamos la transformacin
A

A = A +

(8.126)

en donde es una funcin cualquiera de las coordenadas, la ecuacin (8.122)

166

CAPTULO 8. ELECTRODINMICA

nos conduce a:
F =
=
=
=

A
A

x
x

(A + ) (A + )

x
x

2
2

A
+

x
x
x x
x x

A A = F
x
x

(8.127)

lo cual significa que la funcin F permanece invariante bajo la transformacin (8.126) y as tambin los campos electromagnticos E y B. A la
transformacin (8.126) se le llama una transformacin gauge. Este tipo
de transformaciones juega un papel fundamental en la teora cuntica de
campos y en las llamadas teorias de unificacin de las interacciones fundamentales de la naturaleza.
Para finalizar este captulo, veamos como esta caracterstica de la teora
electromagntica (cuando se formulan las ecuaciones de Maxwell en trminos
del c-potencial), de permanecer los campos fsicos E y B invariantes bajo
una transformacin gauge, nos permite simplicar las ecuaciones que rigen el
comportamiento del c-potencial A .
Dado que el c-potencial A no est definido de manera nica, entonces,
podemos imponer sobre l una condicin o ecuacin de ligadura, llamada
la eleccin de un gauge particular, la cual por lo establecido anteriormente,
no cambia la fsica, es decir no cambian los campos E y B. As, podemos
escoger la funcin arbitraria en la ecuacin (8.126), de tal manera que el
potencial c-vectorial A cumpla con la ecuacin:
A = 0

(8.128)

llamado el gauge de Lorentz, de tal manera que la ecuacin (8.125) se simplifica, reduciendose a la ecuacin:
A = J

(8.129)

que es la ecuacin de ondas inhomognea. Recordando la definicin del operador , ecuacin (7.106), vemos que la teora electromagntica de Maxwell,
expresada por la ecuacin (8.129) contiene al postulado de la constancia de
la velocidad de la luz, pues dado que el operador definido por:
=

2
1 2

2
2
c t

(8.130)

8.5. TRANSFORMACIONES GAUGE

167

es un invariante bajo transformaciones de Lorentz, entonces el coeficiente


1/c2 , que representa la velocidad de propagacin de los campos electromagnticos, es una constante independiente del observador. Este ltimo resultado ilustra con toda claridad y sin restarle meritos a la genialidad de Albert
Einstein, como la teora de la relatividad especial estaba ya presente en la
fsica.

168

CAPTULO 8. ELECTRODINMICA

Captulo 9

Bibliografa
La literatura disponible sobre relatividad es tal vez de las ms amplias,
tanto en el campo especializado como en el divulgativo. Se listarn a continuacin algunas referencias, desde literatura de divulgacin, pasando por
textos elementales, obras de valor histrico, hasta textos y libros avanzados
que, sin pretender ser exaustivas, si cubren globalmente la temtica de la
teora especial de la relatividad.
Referencias de caracter divulgativo:
Bucker R. B., Geometry, Relativity and the fourth dimension. Dover Publications, Inc. N. Y. 1977
Lilley S., Discovering Relativity for yourself. Cambridge University Press
1981
Russell B., ABC de la Relatividad. Ed. Ariel Barcelona 1978
Williams L. P., La Teora de la Relatividad. Alianza Universidad 1977
Textos elementales, a nivel universitario, sobre relatividad especial:
Mook D. E. and Vargish T., La Relatividad. Espacio, Tiempo y Movimiento. McGraw Hill 1993
Resnick R., Introduccin a la Teora Especial de la Relatividad. Limusa
1981
Skinner R., Relativity for Scientist and Engineers. Dover Publishing N. Y.
1982
Smith J. H., Introduccin a la Relatividad Especial. Ed. Revert 1978
Textos universitarios de relatividad a nivel intermedio:
Enrique L., Fsica Relativista. Buenos Aires 1955
French A. P., Special Relativity. Massachusetts Institute of Technology
1968
169

170

CAPTULO 9. BIBLIOGRAFA

Rindler W., Essential Relativity. Special, General and Cosmology. Springer-Verlag 1977
Taylor E. F. and Wheeler J. A., Spacetime Physics. Freeman, San Francisco 1966
Libros y textos avanzados sobre relatividad. Algunos de ellos incluyen, tambin, elementos bsicos de la Relatividad General:
Aharoni J., The Special Theory of Relativity. Oxford University Press 1965
Bressan A., Relativistic Theories of Materials. Springer-Verlag 1978
Fock V., The Theory of Space Time and Gravitation, Pergamon Press 1959
Gill T. P., The Doppler Eect. Academic Press 1965
Kopczynski W. and Trautman A., Spacetime and Gravitation. John
Wiley & Sons 1992
Matveev A. N., Mechanics and Theory of Relativity. Mir Publishers Moscow
1989
Rosser W. G. V., An Introduction to the Theory of Relativity. Butterworth, London 1964
Ugarov V. A., Special Theory of Relativity. Mir Publishers Moscow 1979
Libros avanzados de relatividad, con un fuerte nfasis en aspectos matemticos:
Hagendorn R., Relativistic Kinematics. W. A. Benjamin, Inc. 1963
Misner C. W., Thorne K. S. and Wheeler J. A., Gravitation. W. H.
Freeman and Co. 1973
Naber G. L., The Geometry of Minkowski Spacetime. Springer-Verlag 1992
Woodhouse N. M. J., Special Relativity. Springer-Verlag 1992
Libros clsicos de relatividad y obras formales de carcter histrico:
Born M., Einsteins Theory of Relativity. Dover Publications, Inc. 1965 (1a
ed. 1920)
Einstein A., The Principle of Relativity. Dover N. Y. 1958
Poincar H., La Mcanique Nouvelle. Conference Mmoire et note sur la
Thorie de la Relativit. Editions Jacques Gabay 1989
Rocard J. M., Newton et la Relativit. Press University France 1986
Sard R. D., Relativistic Mechanics. W. A. Benjamin, Inc. 1970
Silberstein L., The Theory of Relativity. Great Britain 1914
Synge J. L., Relativity: The Special Theory. North-Holland Publishing
Company 1958
Whittaker Sir E. T., History of the Theories Aether and Electricity. Harper and Row, N. Y. 1960

También podría gustarte