Está en la página 1de 141

GRAVITACION Y COSMOLOGIA

JUAN MANUEL TEJEIRO S.


OBSERVATORIO ASTRONOMICO

ENERO DEL 2000


ii
Introducción

En este capítulo se presentarán los elementos fundamentales del cálculo en var-


iedades.

0.1 Espacios topológicos


En esta sección se darán algunas definiciones fundamentales sobre espacios
topológicos y espacios métricos.
Definition 1 Definicion 1.1 Un espacio topológico T es una pareja (T, A),
con T un conjunto y A una familia de subconjuntos de T , llamados los abiertos,
tales que:
T-1: φ, T ∈ A, es decir, el vacío φ y todo el conjunto T son abiertos.
T-2: Dada cualquier colección de abiertos aα ∈ A,con α ∈ I, siendo I un
conjunto de índices, entonces ∪α∈I aα ∈ A, es decir, unión arbitraria de abiertos
es un abierto.
T-3: Dada cualquier colección finita de abiertos ai ∈ A, i = 1, 2, ..., n,
entonces ∩ni=1 ai ∈ A, es decir, intersección finita de abiertos es abierto.
A la familia de abiertos A se le llama la topología de T . Claramente a
todo conjunto se le puede asociar una topología, pues basta con definir como
los abiertos de T a cualquier subconjunto de T . Esta topología es conocida
en la literatura como la topología discreta. Otra posibilidad para definir una
topología sobre cualquier conjunto es la llamada topología trivial, cuyos abier-
tos se reducen al conjunto vacío y a todo el espacio. Estos dos casos extremos
de espacios topológicos no son de utilidad práctica, pero nos sirven para ilus-
trar situaciones y conceptos especiales que surgen en el estudio de los espacios
topológicos. Un ejemplo no trivial de una topología lo constituye los números
reales R con la llamada topología usual, en donde los abiertos están conforma-
dos por todos los intervalos abiertos de la forma (a, b) ⊂ R, con la identificación
(a, a) = φ y (−∞, ∞) = R.
Definition 2 Sean T y R espacios topológicos. Una función
f : T −→ R (1)
se dice continua, si para cualquier abierto b de R, la imagen inversa f −1 (b) es
un abierto de T .

iii
iv INTRODUCCIÓN

Más adelante veremos la relación entre esta definición de continuidad, con la


definición usual utilizada en espacios métricos, cuando relacionemos la estruc-
tura topológica de un espacio con su estructura métrica.

Definition 3 Sean T y R espacios topológicos. Una función

ϕ : T −→ R (2)

se llama un homeomorfismo, si la función ϕ es continua con inversa

ϕ−1 : R −→ T (3)

continua.

Así, todo homeomorfismo ϕ entre espacios topológicos transforma abiertos


de un espacio topológico en abiertos del otro espacio, y en este caso diremos
que los dos espacios topológicos son homeomorfos. Veamos dos ejemplos que
ilustran porqué los espacios topológicos extremos, el discreto y el trivial, no son
de interes práctico. Dada una función

ϕ : T −→ R (4)

con R un espacio topológico cualquiera y T el espacio topológico discreto, en-


tonces toda función ϕ es trivialmente continua, pues dado cualquier abierto de
R su imagen inversa es un subconjunto de T , que por definición es un abierto,
mientras que si T tiene la topología trivial, entonces ninguna función ϕ es con-
tinua, dado que los únicos abiertos de T son el vacío y todo el espacio.

Definition 4 Un espacio topológico T se llama de Hausdorf o separable, si para


todo par de puntos p, q ∈ T , con p 6= q, existen abiertos U y V de T , con p ∈ U
y q∈ V tal que U ∩ V = φ.

Claramente el espacio topológico discreto es de Hausdorff, así como los


números reales con la topología usual, mientras que un espacio topológico con
la topología trivial no es un espacio topológico de Hausdorff.

Definition 5 Sea T un espacio topológico y C ⊂ T un subconjunto cualquiera


de T . Un recubrimiento abierto de C es una colección de abiertos aα de T con
α ∈ I, siendo I un conjunto de índices, tal que C ⊂ ∪α∈I aα .

Definition 6 Un subconjunto C ⊂ T , de un espacio topológico T se llama com-


pacto, si dado cualquier recubrimiento abierto de C, existe un subrecubrimiento
finito ai , i = 1, 2, ..., n de C, esto es C ⊂ ∪ni=1 aα .

Definition 7 Un subconjunto A ⊂ T , de un espacio topológico T se llama


cerrado, si su complemento, i.e., T \A, es abierto.
0.2. ESPACIOS MÉTRICOS v

Claramente, dependiendo de la estructura topológica del espacio, hay con-


juntos que son abiertos y cerrados a la vez, por ejemplo cualquier subconjunto
de un espacio topológico discreto. También existen subconjuntos que no son ni
abiertos ni cerrados, por ejemplo, en los reales con la topología usual, cualquier
intervalo semicerrado, es decir de la forma [a, b) o (a, b], no es abierto ni cerrado.
Ahora, en todo espacio topológico el vacío y todo el espacio son subconjuntos
abiertos y cerrados a la vez, pues ellos son mutuamente complementarios. Se
puede mostrar que en un espacio topológico de Hausdorff los únicos conjuntos
abiertos y cerrados simultáneamente son el vacío y todo el espacio.
En el espacio de los números reales R con la topología usual, cualquier in-
tervalo cerrado de la forma [a, b] es compacto, mientras que cualquier intervalo
abierto no lo es. Más generalmente, en R con la topología usual, todo subcon-
junto cerrado y acotado es compacto.
En la siguiente sección se darán las definiciones fundamentales de espacios
métricos y su relación con la estructura topológica.

0.2 Espacios métricos


Definition 8 Un espacio métrico M es un conjunto de puntos con una función,
llamada métrica,
d : M × M −→ R
(5)
(x, y) 7−→ d(x, y)
tal que:
M-1: ∀x, y ∈ M, se tiene que d(x, y) ≥ 0, y d(x, y) = 0 ⇐⇒ x = y.
M-2: ∀x, y ∈ M, se tiene que d(x, y) = d(y, x).
M-3: ∀x, y, z ∈ M, se satisface la desigualdad triangular, i.e.,

d(x, z) ≤ d(x, y) + d(y, z) (6)

Uno de los ejemplos más importantes de espacio métrico lo constituye Rn


con la llamada métrica usual o euclideana, definida como:
p
d(x, y) := (x1 − y 1 )2 + · · · + (xn − y n )2 (7)

en donde x = (x1 , ..., xn ), y = (y 1 , ..., y n ). Sobre Rn también es posible definir


otras métricas, de hecho infinitas métricas, pues la función
à n !1/p
X
i i p
dp (x, y) = (x − y ) (8)
i=1

para cada entero p satisface las propiedaes M −1 a M −3. El caso particular p =


2, corresponde a la métrica usual. Un caso particular de una métrica, definida
como d(x, y) = 0 si x = y, y d(x, y) = 1, ∀x 6= y muestra que todo conjunto
es metrizable. Esta métrica es trivial y se utiliza solamente para construir
contraejemplos.
vi INTRODUCCIÓN

Definition 9 Sea M un espacio métrico. Una bola abierta B(x; r) de radio r


y centro x ∈ M es el conjunto de todos los puntos y ∈ M tales que d(x, y) < r.

Un subconjunto A ⊂ M se llama acotado si para todo par de puntos x, y ∈ A


existe un número real positivo r tal que d(x, y) < r. Claramente para todo
conjunto acotado de un espacio métrico se puede construir una bola centrada
en cualquiera de los puntos que contenga al conjunto.

Definition 10 Sean M y N espacios métricos con métricas dM y dN respec-


tivamente. Una función f : M → N se dice continua en un punto x ∈ M si
dado cualquier real positivo > 0 simpre es posible encontrar un número real
δ > 0 tal que dM (y, x) < δ implica que dN (f (x), d(y)) < . Una función entre
espacios métricos continua con inversa continua se llama un homeomorfismo.

Para conectar la estructura de espacio métrico con la estructura de espacio


topológico definamos:

Definition 11 Sea A ⊂ M , con M un espacio métrico. Entonces A es un


subconjunto abierto de M si ∀x ∈ A existe una bola abierta B(x, r) contenida
en A.

Es fácil probar, entonces, que los abiertos de un espacio métrico satisfacen


las propiedades T − 1, T − 2 y T − 3 de la definición 1 y por lo tanto definen
una topología sobre M , llamada la topología inducida. Así, toda métrica induce
una topología, pero no toda topología proviene de alguna métrica. Por ejemplo,
la métrica trivial d(x, y) = 0 si x = y, y d(x, y) = 1, ∀x 6= y induce la topología
trivial, pero ninguna métrica induce la topología discreta. Además, la topología
usual sobre Rn es la inducida por la métrica usual. De esta forma, cuando se
trabaja con espacios métricos siempre se asume la topología inducida por la
correspondiente métrica.

0.3 Espacios vectoriales


Definition 12 Un grupo (G, ◦) es un conjunto de elementos G sobre el cual está
definida una operación interna ◦, es decir, una función de la forma:

◦: G×G −→ G
(9)
(g1 , g2 ) 7−→ g = g1 ◦ g2

tal que
G-1: Exista un elemento e ∈ G, llamado la identidad, con la propiedad que
para todo elemento g ∈ G, se cumpla que e ◦ g = g ◦ e = g.
G-2: Para todo elemento g ∈ G, exista un elemento g −1 ∈ G, llamado el
elemento inverso, tal que: g ◦ g −1 = g −1 ◦ g = e.
G-3: ∀g1 , g2 , g3 ∈ G se cumple la asociatividad:

g1 ◦ (g2 ◦ g3 ) = (g1 ◦ g2 ) ◦ g3
0.3. ESPACIOS VECTORIALES vii

En general se tiene que g1 ◦ g2 6= g2 ◦ g1 , y cuando la igualdad se cumple para


todos los elementos del grupo, este se llama un grupo conmutativo o Abeliano.
Ejemplos de grupos, los números reales R con la suma, o los números enteros
Z con la suma. Otro ejemplo de mucha importancia en física, lo constituye el
conjunto de transformaciones de simetría sobre un sistema, con la operación de
grupo como la composición de transformaciones. Por una operación de simetría
sobre un sistema entendemos una transformación que deja invariante al sistema.
Por ejemplo, consideremos una molécula de amoniaco N H3 , constituida por
tres átomos de hidrógeno y uno de nitrógeno. La configuración espacial de esta
molécula es una pirámide cuya base es un triángulo equilátero determinado por
los tres hidrógenos y el vértice lo determina el átomo de nitrógeno. Si rotamos
esta molécula en un águlo de 120◦ o de 240◦ alrededor de un eje que pase por el
átomo de nitrógeno y que sea perpendicular al plano determinado por los tres
hidrógenos, entonces la configuración espacial de la molécula no cambia y se
dice que la molécula posee el grupo de simetría conformado por los elementos:

G = {R(0◦ ), R(120◦ ), R(240◦ )} (10)

en donde R(θ◦ ) significa rotar la molécula θ◦ alrededor de su eje de simetría. El


elemento identidad es R(0◦ ) que significa no rotar, el producto de dos rotaciones
es otra rotación, R(θ◦ ) ◦ R(ϕ◦ ) = R(θ◦ + ϕ◦ ), e identificando R(0◦ ) ≡ R(360◦ ),
los elementos del grupo R(120◦ ) y R(240◦ ) son mutuamente inversos. Este
ejemplo lo podemos generalizar al caso de las simetrías de un polígono regular
de n lados. En este caso el grupo de simetrías, rotaciones del polígono alrededor
de un eje que pasa por su centro, tiene n elementos:

360◦ 360◦ 360◦


G = {R(0◦ ), R( ), R(2 ) · · · R((n − 1) )} (11)
n n n
Consideremos ahora el caso límite de un polígono regular de infinitos lados,
es decir el círculo. En este caso el grupo de simetrías contiene un número infinito
no numerable de elementos y cada uno de los elementos está representado por
una función R(θ◦ ) que representa una rotación en un ángulo θ◦ , en donde θ◦ es
un parámetro que toma valores en el intervalo [0, 360] y de nuevo se ha hecho
la identificación R(0◦ ) ≡ R(360◦ ).
Estos ejemplos de grupos tratados, ilustran los tipos de grupos más comunes
que encontramos en diversas aplicaciones: Grupos con un número finito de
elementos, como las rotaciones de un polígono regular de n lados, o grupos
con un número infinito de elementos, pero numerable, como los enteros con la
suma, y grupos con un número infinito no numerable de elementos. Esta última
clase de grupos, caracterizados por un parámetro continuo (o varios parámetros
continuos, como el grupo de rotaciones tridimensional) constituyen una clase
particular de grupos llamados de Lie, los cuales juegan un papel muy importante
en la matemática y en especial en la física. Volveremos sobre ellos más adelante.

Definition 13 Un cuerpo o campo (G, +, ×) es un conjunto de elementos G


sobre el cual están definidas dos operación internas +, y ×, llamadas suma
viii INTRODUCCIÓN

y multiplicación respectivamente, tal que (G, +) forma un grupo abeliano, y la


operación × satisface las siguientes propiedades:
C-1: Exista un elemento 1 ∈ G, llamado la identidad multiplicativa, con la
propiedad que para todo elemento g ∈ G, se cumpla que 1 × g = g × 1 = g.
C-2: Para cualesquiera tres elementos g1 , g2 , g3 ∈ G, se cumple que la mul-
tiplicación se distribuye sobre la suma, i.e., g1 × (g2 + g3 ) = g1 × g2 + g1 × g3 .
C-3: La multiplicación es asociativa y conmutativa, es decir, ∀g1 , g2 , g3 ∈ G,
se cumple que: g1 × g2 = g2 × g1 , y g1 × (g2 × g3 ) = (g1 × g2 ) × g3 = g1 × g2 × g3 .

El ejemplo más común, e importante de un campo lo constituyen los números


reales con la suma y la multiplicación usuales. El concepto de campo es útil
para nosotros en el contexto de la siguiente definición:

Definition 14 Un espacio vectorial V, sobre un campo K, es un conjunto de


elementos, llamados vectores, con una operación interna + (suma de vectores)
tal que:
V-1: La suma de vectores es conmutativa: ∀x, y ∈ V, se tiene que x + y =
y + x.
V-2: La suma de vectores es asociativa: ∀x, y, z ∈ V, se tiene que x+(y+z) =
(x + y) + z.
V-3: Existe el vector nulo 0 ∈ V, tal que ∀x ∈ V se cumple 0 + x = x.
V-4: ∀x ∈ V, existe el vector −x ∈ V, tal que x + (−x) ≡ x − x = 0.
Esto significa que el conjunto V con la suma de vectores forma un grupo
abeliano. Sobre V está definida una operación externa (multiplicación por un
escalar) con el campo K, llamado los escalares, es decir una función de la forma

·: K×G −→ G
(12)
(λ, g) 7−→ h = λ · g ≡ λg

tal que:
V-5: λ(x + y) = λx + λy, para todo par de vectores x, y ∈ V y todo escalar
λ ∈ K.
V-6: (α + β)x = αx + βy, para todo vector x, y todo par de escalares α, β.
V-6: α(βx) = (αβ)x, para todo vector x, y todo par de escalares α, β.
V-7: 1x = x, 0x = 0 y (−1)x = −x, en donde 1 es la identidad multiplicativa
de K, 0 ∈ K la identidad aditiva y −1 ∈ K el inverso aditivo de 1.

El ejemplo más importante de espacio vectorial es Rn sobre los reales. Para


construir otros ejemplos importantes por sus aplicaciones, consideremos V y W
dos espacios vectoriales sobre el cuerpo de los reales, y definamos una transfor-
mación lineal T como una función
T : V −→ W
(13)
v 7−→ w = T (v)

tal que:

T (αv + βu) = αT (v) + βT (u); ∀v, u ∈ V y ∀α, β ∈ < (14)


0.3. ESPACIOS VECTORIALES ix

Definamos sobre el conjunto de todas las transformaciones lineales de V en


W, i.e.,
L(V, W) := {T : V → W | T es < − lineal} (15)
una suma y el producto por un real como:

(T1 + T2 )(v) := T1 (v) + T2 (v); ∀T1 , T2 ∈ L(V, W) y ∀v ∈ V (16)

(αT )(v) := αT (v); ∀T ∈ L(V, W) , ∀v ∈ V y ∀α ∈ < (17)


entonces, claramente T1 + T2 y αT también son transformaciones lineales, i.e.,

T1 + T2 , αT ∈ L(V, W) (18)

y por lo tanto el conjunto L(V, W) con estas operaciones es un espacio vectorial


real. Un caso de particular importancia es el espacio vectorial L(V, <), llamado
el espacio vectorial dual de V, que se denota por V ∗ y sobre el cual volveremos
más adelante.

Definition 15 Un conjunto {v1 , v2, ..., vr } de r vectores de V, con vi 6= 0,


∀i = 1, 2, ..., r, se llama linealmente independiente si dada cualquier combi-
nación lineal
Xr
αi v i = 0 (19)
i=1

implica que todos los αi = 0.

Definition 16 Al número máximo de vectores linealmente independientes de


V se le lllama la dimensión del espacio vectorial, y por lo tanto forman una
base, i.e., cualquier vector del espacio se puede escribir como una combinación
lineal de estos vectores. Así, si {ei }, i = 1, 2, ..., n forman una base del espacio
vectorial V entonces todo v ∈ V lo podemos escribir como

v = v 1 e1 + v 2 e2 + · · · + v n en (20)

y los números v 1 , i = 1, 2, ..., n se le llaman las componentes del vector v en la


base {ei }.

Definition 17 Sea V un espacio vectorial real. Definamos una norma sobre V


como una función
k · k V −→ R
(21)
v 7−→ kvk
tal que:
N-1: kvk > 0, si v 6= 0 y kvk = 0 si v = 0
N-2: kλvk =| λ | kvk
N-3: kv + wk ≤ kvk + kwk
x INTRODUCCIÓN

Toda norma sobre un espacio vectorial induce una métrica definida por:

d(v, w) := kv − wk (22)
La última estructura de gran importacia que se puede definir sobre un espacio
vectorial es el producto punto, llamado también producto escalar o interno:
Definition 18 Sea V un espacio vectorial real. Definamos un producto interno
sobre V como una función
h·, ·i V ×V −→ R
(23)
v, w 7−→ hv, wi
tal que:
P-1: hv, vi > 0 si v 6= 0 y hv, vi = 0 si v = 0.
P-2: hv, wi = hw, vi
P-3: hλv, wi = λ hv, wi
P-4: hv + w, zi = hv, zi + hw, zi
Las propiedades P-3 y P-4 significan que el producto punto es lineal en
su primera componente, y P-2 implica que también es lineal en la segunda
componente. Dado un producto punto sobre un espacio vectorial real, entonces
sobre él se induce una norma definida por:
p
kvk := hv, vi (24)

y así se induce también una métrica y por ende una topología.


Con estas definiciones podemos introducir el concepto de base ortonormal
{ei } i = 1, 2, ..., n de un espacio vectorial, en donde los vectores de la base
satisfacen la relación:
hei , ej i = δ ij (25)
siendo δ ij el delta de Kronecker definido como 1 si i = j y cero en los demás
casos. De la desigualdad triangular, propiedad N-3 de la norma, de obtiene la
desigualdad de Cauchy-Schwarz:

| hv, wi |≤ kvkkwk (26)


la cual a su vez, nos permite definir el concepto de ángulo θ entre dos vectores
v y w a través de la relación:
hv, wi
cos θ := (27)
kvkkwk
lo cual justifica el nombre de base ortonormal, es decir vectores mutuamente
ortogonales y de norma unitaria.
Para finalizar esta introducción veamos el concepto de espacio vectorial dual.
Para este fin sea L(V,R) el conjunto de todas las transformaciones lineales del
espacio vectorial sobre los reales, es decir:
L(V, <) := {f : V →< | f es lineal} (28)
0.3. ESPACIOS VECTORIALES xi

y definamos sobre este conjunto la suma de fuciones y el producto de un número


real por una función como:
(f + g)(v) := f (v) + g(v) (29)
(λf )(v) := λf (v) (30)
∀f, g ∈ L(V,<), ∀v ∈ V ∀λ ∈ <, entonces estas dos operaciones definen una
estructura de espacio vectorial real sobre el espacio de funciones L(V,R). Este
espacio claramente no es vacío, pues hv, ·i ∈ L(V,R), ∀v ∈ V, en donde hv, ·i
significa el producto punto manteniendo la primera componente fija. Para cono-
cer una función f del espacio L(V,R) es necesario conocer lo que la función le
hace a cada vector v ∈ V, pero dado que el producto punto es lineal en cada
componente, entonces para conocer f es suficiente conocer lo que la función le
hace a los vectores de una base, pues sea {ei } i = 1, 2, ..., n una base ortonormal
de V, entonces si v ∈ V tenemos que
n
X
v= αi ei (31)
i=1

en donde los coeficientes están dados por las proyecciones del vector v sobre los
vectores de la base, es decir αj = hej , vi, entonces si f es una función real lineal
sobre el espaccio vectorial tenemos
n
X n
X
f (v) = f ( αi ei ) = αi f (ei ) (32)
i=1 i=1

de esta forma conocer f (v) ∀v ∈ V es equivalente a conocer f (ei ) ∀i = 1, 2, ..., n.


Por otra parte, el teorema de representación de Ritz establece que para cada
función f ∈ L(V,R) existe un vector w ∈ V tal que f (v) = hw, vi, entonces dada
una base ortonormal {ei }de V las funciones hej , ·i := e∗i definen una única base
para el espacio L(V,<), llamada la base dual, pues
* n + n
X X
hw, vi = β k ek , v = β k hek , vi (33)
k=1 k=1
n
* n
+ n X
n
X X X
= βk ek , αi e i = β k αi hek , ei i
k=1 i=1 k=1 i=1
Xn Xn n
X
= β k αi δ ki = β i αi
k=1 i=1 i=1

En resumen, dado cualquier espacio vectorial real V, existe el espacio vec-


torial dual V ∗ , el espacio de las transformaciones lineales de V sobre los reales,
con la misma dimensión y dada cualquier base {ei }i=1,...,n de V existe una única
base {e∗j }j=1,...,n , la base dual, definida por la relación:
he∗k , ei i = δ ki (34)
∗∗
Se puede probar que el dual del dual V de un espacio vectorial V es isomorfo
al espacio vectorial original y por lo tanto se hace la identificación V ≡ V ∗∗ .
xii INTRODUCCIÓN
Variedades

0.4 Variedades diferenciales


Definition 19 Denotemos por Rn el espacio vectorial euclideano, i.e. al con-
junto de n-plas (x1 , x2 , · · ·, xn ) con la métrica usual.

Definition 20 Una función


ϕ: A ⊆ Rn −→ Rm
0 (35)
x 7−→ x = ϕ(x)

con A abierto de Rn , se llama de clase C r si las coordenadas x0 = (x01 , x02 , · ·


·, x0m ) del punto imagen ϕ(x) son funciones r-veces continuamente diferencia-
bles. Si la función ϕ es de clase C r para todo r ≥ 0, entonces se dice que ϕ es
suave o de clase C ∞ .

Definition 21 Sea M un espacio topológico. Definimos una carta coordenada


Cα = (ϕα , Uα ) sobre M como un homeomorfismo:

ϕα : Uα ⊆ M −→ Rn
(36)
p 7−→ x = ϕα (p)

en donde Uα es un abierto de M, x = (x1 , · · ·, xn ) se llaman las coordenadas


del punto p y n es la dimensión de la carta.

Definition 22 Sea M un espacio topológico. Un atlas A de clase C r sobre M


es una colección de cartas {Cα = (ϕα , Uα )}α∈I tal que:
A-i- Los abiertos Uα cubren M, i.e.:
[
M= Uα (37)
α∈I

A-ii- Si Uα ∩ Uβ 6= φ entonces

ϕβ ◦ ϕ−1
α : ϕα (Uα ∩ Uβ ) ⊆ Rn −→ ϕβ (Uα ∩ Uβ ) ⊂ Rn
(38)
x = ϕα (p) 7−→ y = ϕβ (p)

es un difeomorfismo de clase C r .

xiii
xiv VARIEDADES

Figure 1:

Figure 2:
0.4. VARIEDADES DIFERENCIALES xv

−1
Las funciones ϕβ ◦ ϕ−1 α y su inversa ϕα ◦ ϕβ nos dan las ecuaciones de
transformación entre las diferentes coordenadas.
Dos atlas A y B de clase C r sobre un espacio topológico M se llaman com-
patibles si la unión de los atlas es de nuevo un atlas de clase C r , así la unión
de todos los atlas compatibles sobre un espacio topológico forma una clase de
equivalencia de atlas, o un atlas maximal.

Definition 23 Una C r −variedad diferenciable M es un espacio topológico de


Hausdorff con un atlas maximal.

NOTA 1: Cada Uα es una vecindad coordenada local, es decir, si p ∈ Uα ⊂


M, entonces las coordenadas de p son las coordenadas del punto imagen φα (p) ∈
Rn , asi notaremos φα (p) = (x1 , x2 , ..., xn ) con xi = xi (p).
La condición A-ii exige que las vecindades coordenadas sean compatibles, es
decir: si p ∈ Uα ∩Uβ , entonces φα (p) = (x1 , x2 , ..., xn ) y φβ (p) = (x01 , x02 , ..., x0n )
son dos coordenadas diferentes para el mismo punto, y que las cartas (φα , Uα )
y (φα , Uα ) estén relacionadas por:

(φα ◦ φ−1 01 02 0n 1 2 n
β )(x , x , ..., x ) = (x , x , ..., x )

(φβ ◦ φ−1 1 2 n 01 02 0n
α )(x , x , ..., x ) = (x , x , ..., x )

Es decir, las coordenadas xi = xi (x0 j ) son funciones de clase C r de las


coordenadas x0 j y viceversa x0 j = x0 j (xi ).
NOTA 2: Otro atlas ∆0 sobre M se dice C r -compatible con ∆, C r -atlas,
sobre M si ∆ ∪ ∆0 es de nuevo un C r -atlas sobre M . El atlas consistente
de la unión de todos los atlas compatibles con un atlas dado se llama el atlas
maximal de M. Así un atlas maximal sobre M es el conjunto de todos los
posibles sistemas coordenados que cubren a M. La compatibilidad de atlas es
una relación de equivalencia. Una de estas clases de equivalencia es llamada
una estructura diferenciable. Dada una variedad M es interesante preguntarse
si ésta admite una única estructura diferenciable. Milnor en 1956 demostró que
S 7 posee 28 estructuras diferenciales diferentes. En 1984 se demostro que Rn
admite un número infinito de estructuras diferenciables.
NOTA 3: Una C r -variedad con frontera se define de la misma manera cam-
biando Rn por 12 Rn := {x ∈ Rn | xn ≥ 0}. El contorno de M, denotado por
∂M se define como el conjunto de todos los puntos de M cuya imagen bajo
φα están sobre el contorno de 12 Rn . ∂M es una C r -variedad sin frontera de
dimensión n − 1.
Consideremos algunos ejemplos de variedades diferenciables:
R2 es una variedad bidimensional. Las coordenadas rectangulares (x, y :
−∞ < x, y < ∞) cubren todo R2 . Las coordenadas polares (r, θ) cubren solo
la vecindad cordenada (r > 0; 0 < θ < 2π). Así se necesitan por lo menos dos
de tales cartas para para cubrir R2. .
El cilindro bidimensional C 2 es una variedad obtenida a partir de R2 iden-
tificando los puntos (x, y) con (x + 2π, y). Entonces (x, y) son coordenadas en
xvi VARIEDADES

la vecindad (0 < x < 2π, −∞ < y < ∞), así se necesitan por los menos dos de
tales vecindades coordenadas para cubrir C 2. . Similarmente la cinta de Möbius
es obtenida identificando (x, y) con (x + 2π, −y)
La 2-esfera unidad S 2 : {(x1 , x2 , x3 ) ∈ R3 / (x1 )2 + (x2 )2 + (x3 )2 = 1} es una
variedad. Las coordenadas en cada punto de las regiones x1 > 0 y x1 < 0 son:

(x2 , x3 ); −1 < x2 < 1; −1 < x3 < 1

Así se necesitan seis de tales cartas para cubrir S 2 .


Problema:
Mostrar que no se puede cubrir S 2 con un solo sistema de coordenadas. Otro
ejemplo que generaliza a S 2 es la n-esfera definida por

S n := {x ∈ Rn+1 | (x0 )2 + (x1 )2 + · · · + (xn )2 = 1} (39)

Para definir una estructura de variedad diferenciable, consideremos el hiperplano


H de Rn+1 definido por x0 = 0, consideremos el atlas definido por las dos cartas
(ϕ1 , U1 ) y (ϕ2 , U2 ), las dos proyecciones estereográficas de la n−esfera sobre este
plano H, definidas por:
ϕ1 : U1 = S n \{e0 } −→ H ≡ Rn
0 (40)
x 7−→ ϕ1 (x) = x−x
1−xo
e0

ϕ2 : U2 = S n \{−e0 } −→ H ≡ Rn
0 (41)
x 7−→ ϕ2 (x) = x−x
1+xo
e0

en donde e0 = (1, 0, ..., 0) ∈ S n el ”polo norte ”de la n-esfera y −e0 el polo


sur. Es decir U1 cubre la esfera menos el polo norte y U2 cubre la esfera menos
el polo sur. Estas dos cartas son C ∞ compatibles pues de transformación de
coordenadas
y
ϕ2 ◦ ϕ−11 (y) = ; y ∈ Rn y y 6= 0 (42)
kyk
es infinitamente diferenciable.
No es difícil probar que la variedad S n , a diferencia de Rn requiere por lo
menos dos cartas coordenadas para cubrir la variedad.

Definition 24 Una variedad M se dice orientable si existe un atlas

∆ = {φα , Uα }α∈Λ

tal que en toda intersección no vacia Uα ∩ Uβ de abiertos, el determinante de


la matriz (∂xi /∂x0 j ) es positivo, en donde (x1 , x2 , ..., xn ) y (x01 , x02 , ..., x0n ) son
coordenadas en Uα y Uβ respectivamente.

Definition 25 Un atlas ∆ = {φα , Uα }α∈Λ se dice localmente finito si todo


punto p de la variedad M tiene una vecindad abierta la cual intersecta solo un
número finito de vecindades Uβ .Una variedad M se llama paracompacta si para
todo atlas ∆ = {φα , Uα }α∈Λ existe un atlas localmente finito Γ = {ψ β , Vβ }β∈Λ
con cada Vβ contenido en algún Uα .
0.5. ESPACIO TANGENTE xvii

En lo sucesivo por variedad entenderemos una C r -variedad de Hausdorff


paracompacta.
A partir de variedades dadas es posible construir nuevas variedades dife-
renciables tomando el producto cartesianos entre ellas, pues dadas M y N
variedades suaves de dimensiones m y n respectivamente, sean A = {(Uα , ϕα )}
y B = {(Vβ , ψ β )} sus atlas maximales, entonces

M × N := {(p, q) | p ∈ M, q ∈ N } (43)

el producto cartesiano es una variedad n + m dimensional, con el atlas maximal


definido como:
C := {(Uα × Vβ , ϕα × ψ β )} (44)
en donde

ϕα × ψ β : Uα × Vβ ⊂ M × N −→ Rm × Rn
(45)
(p, q) 7−→ (ϕα (p), ψ β (q))

Con esta definición podemos construir otras variedades de interés en física,


como por ejemplo el cilindro bidimensional R × S 1 , o el toro S 1 × S 1 .

0.5 Espacio tangente


El concepto de variedad surgió como una generalización de la teoría de super-
ficies en R3 . Así, por una parte se hace necesario generalizar el concepto de
plano tangente a una superficie, y por otra parte, la noción de vector tangente
a una variedad nos permitirá generalizar también los conceptos de derivadas di-
reccionales en Rn . Existen varios caminos equivalentes para definir el concepto
de vector tangente a una variedad. En estas notas seguiremos un camino, que si
bien puede parecer abstracto en un comienzo, nos permitirá construir los con-
ceptos necesarios para introducir la noción de derivada direccional sobre una
variedad y de tensor, en una forma más directa.

Definition 26 Sea M una variedad suave n−dimensional y

f: M −→ R
(46)
p 7−→ f (p)

una función de valor real definida sobre la variedad. Entonces la función f se


dice de clase C k en un punto p ∈ M si para toda vecindad coordenada (Uα , ϕα )
de p la función

fα := f ◦ ϕ−1
α : ϕα (Uα ) ⊂ Rn −→ R
(47)
x = ϕα (q) 7−→ fα (x) = f (q)

es de clase C k en el punto p ∈ Uα ⊂ M.
xviii VARIEDADES

Llamemos
F(M, R) := {f : M −→ R} (48)
al conjunto de todas las funciones de valor real definidas sobre la variedad. Sobre
este conjunto podemos construir una estructura de espacio vectorial definiendo
la suma de funciones y el producto de un real por una función en la forma:

(f + g)(p) := f (p) + g(p), ∀f, g ∈ F(M, R), ∀p ∈ M (49)

(λf )(p) := λf (p), ∀f ∈ F(M, R), ∀p ∈ M, ∀λ ∈ R (50)


La noción de diferenciabilidad de una función solo tiene sentido para fun-
ciones definidas sobre los reales (más generalmente sobre espacios de Banach)
y por esta razón, la definición dada de diferenciabilidad se hace a través de las
cartas coordenadas. Por lo tanto, para que esta definición de diferenciabilidad
tenga sentido es necesario mostrar que ella no depende de la carta coordenada
utilizada. Así, sea (Uβ , ϕβ ) otra carta con p ∈ Uβ , entonces

fβ = f ◦ ϕ−1 −1 −1 −1
β = f ◦ ϕα ◦ (ϕα ◦ ϕβ ) = fα ◦ (ϕα ◦ ϕβ ) (51)

dado que las cartas son compatibles, esta relación implica que si la función f es
diferenciable con respecto a la carta (Uα , ϕα ) entonces también lo es respecto a la
carta (Uβ , ϕβ ), y viceversa. Esta demostración de la independencia de las cartas
es el ingrediente fundamental para todas las definiciones u operaciones que se
realicen sobre una variedad, en las cuales se involucren las cartas coordenadas.

Definition 27 Sea M una variedad suave y p ∈ M. Un vector tangente vp a


la variedad M en el punto p es una función

vp : F(M, R) −→ R
(52)
f 7−→ vp (f )

tal que:
T-1: vp es R−lineal, i.e., vp (f + λg) = vp (f ) + λvp (g), ∀f, g ∈ F(M, R), y
∀λ ∈ R
T-2: vp es Leibnitziana, i.e., vp (f g) = f (p)vp (g) + vp (f )g(p).
Definamos por Tp M al conjunto de todos los vectores tangentes a un punto
p ∈ M como el espacio tangente a la variedad en el punto p.

Lemma 28 El espacio tangente Tp M es un espacio vectorial real.

Para ver esto basta con definir la suma de vectores y el producto de un


escalar (real) por un vector, y mostrar que estas operaciones están bien definidas,
es decir satisfacen las propiedades T-1 y T-2. Sean vp , wp ∈ Tp M, entonces
definamos la suma y el producto por:

(vp + wp )(f ) := vp (f ) + wp (f ), ∀f ∈ F(M, R) (53)

(λvp )(f ) := λvp (f ), ∀f ∈ F(M, <), ∀λ ∈ R (54)


0.5. ESPACIO TANGENTE xix

La linealidad, propiedad T-1, es directa de probar pues

(vp + λwp )(f + µg) = vp (f + µg) + λwp (f + µg)


= vp (f ) + µvp (g) + λwp (f ) + λµwp (g)
= (vp + λwp )f + µ(vp + λwp )g (55)

por definición, luego vp + λwp ∈ Tp M. Para probar T-2, apliquemos vp + λwp


al producto f g, entonces, por definición de suma de vectores tenemos

(vp + λwp )(f g) = vp (f g) + λwp (f g) (56)

puesto que vp y wp son vectores para los cuales vale T-2, y por lo tanto

(vp + λwp )(f g) = f (p)vp (g) + vp (f )g(p) + λg(p)wp (g) + λwp (f )g(p)(57)
= f (p)(vp + λwp )(g) + (vp + λwp )(f )g(p)

como se quería probar.


Para mostrar que el espacio tangente tiene la misma dimensión que la var-
iedad, veamos algunas definiciones y resultados importantes.

Definition 29 Sea M una variedad suave y (Uα , ϕα ) una vecindad coordenada


de p ∈ M y sea (x1 , ..., xn ) = ϕα (p) las coordenadas del punto p. Sea f ∈
F(M, R) y definamos la ”derivada parcial ” de la función f con respecto a las
coordenadas xi , i = 1, ..., n en el punto p por

∂f ∂(fα )
∂i f (p) ≡ (p) := (ϕα (p)) (58)
∂xi ∂xi
entonces

Lemma 30 Las funciones


¯
∂ ¯¯
: F(M, R) −→ R (59)
∂xi ¯p

son vectores tangentes de Tp M.

Para demostrar este lema veamos que las funciones ∂i |p satisfacen T-1 y
T-2. Para este fin basta con recordar que las derivadas parciales son lineales y
satisfacen la regla del producto. Sean f, g ∈ F(M, R) y λ ∈ R, entonces de la
definición 29 tenemos
∂(f + λg) ∂(fα + λgα )
(p) = (ϕα (p)) (60)
∂xi ∂xi
∂(fα ) ∂(gα )
= i
(ϕα (p)) + λ (ϕα (p))
∂x ∂xi
∂f ∂g
= i
(p) + i (p)
∂x ∂x
xx VARIEDADES

lo cual prueba la linealidad, en donde en el segundo paso se ha hecho uso de la


linealidad de las derivadas parciales. Para la propiedad T-2

∂(f g) ∂(fα gα )
(p) = (ϕα (p)) (61)
∂xi ∂xi
∂(gα ) ∂(fα )
= fα (ϕα (p))( i
(ϕα (p)) + (ϕα (p))gα (ϕα (p))
∂x ∂xi
∂(g) ∂(f )
= f (p) i (p) + (p)g(p)
∂x ∂xi
en donde para el tercer paso se ha utilizado la regla de la derivada de un producto
de funciones.
∂f
El siguiente resultado muestra que las derivadas parciales ∂x i (p) definidas

anteriormente son objetos locales, es decir solo dependen del comportamiento


de las fuciones f en una vecindad del punto p ∈ M.

Lemma 31 Sea vp ∈ Tp M un vector tangente y f, g ∈ F(M, R), entonces:


i.- Si f = g en alguna vecindad del punto p ∈ M, entonces vp (f ) = vp (g)
ii.- Si la función f es constante en una vecindad del punto p entonces vp (f ) =
0.

La prueba de este lema es sencilla pues toda transformación lineal transforma


el cero en cero, y así

0 = vp (0) = vp (f − g) = vp (f ) − vp (g) (62)

además, si f = c = cons. entonces como

vp (1) = vp (1 · 1) = 1 · vp (1) + vp (1) · 1 = 2vp (1) (63)

se tiene que vp (1) = 0, y por lo tanto

vp (f ) = vp (c) = cvp (1) = 0 (64)

El siguiente teorema constituye el resultado central de esta sección.

Theorem 32 Sea (Uα , ϕα ) una vecindad coordenada de un punto p ∈ M, en-


tonces los vectores coordenados ∂i |p i = 1, 2, ..., n conforman una base para el
espacio tangente Tp M.

Así, Tp M es un espacio vectorial real de la misma dimensión que la var-


iedad. Para probar este resultado veamos primero el concepto de funciones
coordenadas. Las funciones
πi : Rn −→ R
(65)
x 7−→ xi

para i = 1, 2, ..., n que a un punto de Rn le asocia su i−ésima coordenada


se llaman funciones proyección o funciones coordenadas, las cuales son suaves.
0.5. ESPACIO TANGENTE xxi

Entonces dada una carta (Uα , ϕα ) de una variedad M definimos las funciones
coordenadas por
xi : M −→ R
(66)
p 7−→ xi (p)
las cuales asocian a cada punto p de la variedad la coordenada i−ésima bajo
la carta (Uα , ϕα ) pertenecen al espacio de las funciones reales definidas sobre
la variedad, i.e., xi ∈ F(M, R). Con esta definición podemos probar que los
vectores tangente ∂i |p i = 1, 2, ..., n son linealmente independientes, pues

∂(xjα ) ∂xj
∂i xj |p = i
(ϕα (p)) = = δ ji (67)
∂x ∂xi
y por lo tanto cualquier combinación lineal nula de los vectores ∂i |p
n
X
αi ∂i |p = 0 (68)
i=1

al aplicarlas a las funciones coordenadas implican que αi = 0, ∀i = 1, 2, ..., n.


Falta entonces probar que cualquier vector vp ∈ Tp M se puede escribir como
una combinación lineal de los vectores coordenados ∂i |p i = 1, 2, ..., n, esto es
n
X ¯
∂ ¯¯
vp = vpi (xi ) ∂i |p ≡ vpi (69)
i=1
∂xi ¯p

en donde en la última igualdad hemos utilizado la convención de suma de Ein-


stein, es decir, toda expresión con dos índices iguales, uno como superíndice y
otro como subíndice implican una suma sobre los valores que toma el índice.
Las cantidades reales vpi (xi ) ≡ vpi son las componentes del vector tangente en la
base coordenada. Para probar esto último haremos uso del siguiente resultado
del cálculo. Si F : Rn → R es una función suave en el punto a, entonces existen
n funciones suaves Hk tales que para todo x ∈ Rn se tiene que
n
X
F (x) = F (a) + (xk − ak )Hk (x) (70)
k=1

con ¯
∂F ¯¯
Hk (a) = (71)
∂xk ¯x=a
Sea f ∈ F(M, R), entonces aplicando este resultado a la función fα = f ◦ ϕα
con a = ϕα (p) tenemos que para todo q ∈ Uα
n
X
f (q) = f (p) + (xk ◦ ϕα (q) − xk ◦ ϕα (p))Hk (ϕα (q)) (72)
k=1

Sea vp ∈ Tp M entonces, aplicando el vector tangente vp a la función f , us-


ando el último resultado, la linealidad, la propiedad Leibnitziana y la propiedad
xxii VARIEDADES

ii del Lema 5.3, obtenemos


n
X ¯
vp (f ) = vp (f (p)) + [ {(xk ◦ ϕα (q) − xk ◦ ϕα (p))}¯q=p vp (Hk ◦ ϕα )
k=1
+ Hk ◦ ϕα |p vp (xk ◦ ϕα (q) − xk ◦ ϕα (p))]
n
X
= [Hk ◦ ϕα (p)]vp (xk ◦ ϕα ) (73)
k=1

de la ecuación (71) Hk ◦ϕα es justamente ∂i f |p y por lo tanto para toda función


f ∈ F(M, R) tenemos que
¯
∂f ¯¯
vp (f ) = vpi (74)
∂xi ¯p

como se quería probar. Los coeficientes de la expansión vpi son los valores de la
función vp aplicada a las funciones coordenadas xi .
Otra forma equivalente de introducir los vectores tangente es a través del
concepto de derivada direccional. Para este fin definamos primero el concepto
de curva sobre una variedad.

Definition 33 Sea M una variedad suave. Una curva suave sobre la variedad
es una función
λ : I ⊂ R −→ M
(75)
t 7−→ λ(t)
en donde I es un intervalo de los reales que contiene al cero y λ(0) = p, y si
(Uα , ϕα ) es una vecindad coordenada del punto p, entonces la curva

λα : I⊂R −→ Rn
(76)
t 7−→ λα (t) = ϕα ◦ λ(t)

sobre Rn es suave.

Sea un vector tangente vp ∈ Tp M con componentes vpi = vp (xi ) en la base


coordenada (Uα , ϕα ), i.e.,
¯
vp = vpi ∂i ¯p (77)

y definamos una curva λ por la curva en Rn definida como

xi (λ(t)) = xi (p) + tvpi (78)

entonces esta curva pasa por el punto p ∈ M (i.e., pasa por el punto xi (p) =
ϕα (p) ∈ Rn ) para t = 0 y en este punto las componentes del vector tangente
son ¯
dxi ¯¯
vpi = (79)
dt ¯t=0
0.5. ESPACIO TANGENTE xxiii

Figure 3:

así sobre la variedad M la curva pasa por p y tiene vector tangente vp ∈ Tp M.


Sea f ∈ F(M, R) una función de valor real sobre la variedad, entonces
¯ ¯
i dxi ¯¯ ∂f ¯¯
vp (f ) = vp ∂i f |p = (80)
dt ¯t=o ∂xi ¯p
¯ ¯ ¯
dxi (λ(t)) ¯¯ ∂f ¯¯ ∂f ¯¯
= ¯ =
dt t=o ∂xi ¯
p λ ∂t ¯

es decir (∂/∂t)λ ∈ Tp M y representa la derivada direccional de la función f a


lo largo de la curva λ.
De las ecuaciones diferenciales ordinarias se sigue que, dado un vector tan-
gente vp ∈ Tp M existe una única curva λ que pasa por el punto p ∈ M y cuyo
vector tangente en el punto p es vp . Así se puede visualizar a un vector tangente
vp ∈ Tp M como una ”flecha ” en el punto p apuntando en la dirección de una
curva λ(t) con vector tangente vp en el punto p = λ(0). En particular, dada
una base coordenada para el espacio tangente ∂i |p las correspondientes curvas
son las curvas coordenadas (ver Figura 4).
Sea {Eα }α=1,2,...,n una base para el espacio tangente Tp M, entonces cualquier
vector v ∈ Tp M (en lo sucesivo escribiremos en negrilla los vectores) se puede
escribir como
v = v α Eα (81)
en donde v α son las componentes del vector el la base {Eα }. En particular si uno
escoge los vectores base coordenados ∂i |p entonces las componentes v i = v(xi )
son las derivadas de las funciones coordenadas xi en la dirección del vector v.
Definamos, ahora, el espacio vectorial dual de Tp M.

Definition 34 5.4 Sea M una variedad suave y Tp M el espacio tangente en


un punto p. Una 1-forma ω (vector covariante cuyo nombre se justificará más
xxiv VARIEDADES

Figure 4:

adelante) en el punto p es una función lineal de valor real sobre Tp M, i.e.,

ω: Tp M −→ R
(82)
v 7−→ ω(v) ≡ hω, vi

tal que:
i.- hω, x + zi = hω, xi + hω, zi ; ∀x, z ∈ Tp M
ii.- hω, αxi = α hω, xi ; ∀x ∈ Tp M y ∀α ∈ R.

Esto significa que las 1-formas sobre Tp M pertenecen al conjunto de L(V,R),


es decir al conjunto de las transformaciones lineales de Tp M sobre los reales,
y por tanto las 1-formas ω pertenecen al espacio vectorial dual Tp∗ M del es-
pacio tangente. Así, dada una base {Eα }α=1,2,...,n del espacio Tp M existe una
única base (dual) {Eβ }β=1,2,...,n del espacio Tp∗ M, el cual lo llamaremos espacio
cotangente, definida por: ­ β ®
E , Eα = δ βα (83)
Así, si ω ∈Tp∗ M es una 1-forma y x ∈Tp M es un vector, entonces

ω = ω β Eβ (84)

x = xα Eα (85)
y por lo tanto, aplicando linealidad y la relación 1-83, tenemos
­ ®
hω, xi = ω β Eβ , xα Eα (86)
­ ®
= ω β xα Eβ , Eα
= ω β xα δ βα
= ω α xα
0.6. TENSORES xxv

Definition 35 Cada función f ∈ F(M) define una 1-forma df en p dada por:

< df , X >= Xf , ∀X ∈ Tp M. (87)


A la 1-forma df la denominaremos la diferencial de f en p.
Si φα (p) = (x1 , x2 , ..., xn ) son las coordenadas locales entonces las diferen-
ciales {dx1¯, dx2 , ..., n
¯ dx } en p¯ forman la base de 1-formas dual a la base coorde-
∂ ¯ ∂ ¯ ∂ ¯
nada { ∂x 1 ,
p ∂x2 p
, ..., ∂xn p } de Tp M, pués se cumple que:


< dxi ,>= δ ij (88)
∂xj
En terminos de esta base {dxi } de Tp∗ M la diferencial de una función f ∈ F(M)
se puede escribir de la siguiente forma:
∂f i
df = dx (89)
∂xi
Observación:
Si df 6= 0, entonces las superficies f = cte son variedades de dimensión
n-1. El subespacio de Tp M consistente en todos los vectores X tales que
< df , X >=0 está formado por todos los vectores tangentes a las curvas que
están en la superficie f = cte en el punto p. Así df se puede pensar como
perpendicular o normal a la superficie f = cte en p.

0.6 TENSORES
Definition 36 Definimos el producto cartesiano Πsr de la siguiente forma:

Πsr := Tp∗ × Tp∗ × Tp∗ × · · · × Tp∗ × Tp × Tp × Tp × · · · × Tp (90)


| {z } | {z }
r−veces s−veces

Donde intervienen r factores Tp∗ y s factores Tp , es decir:


Πsr = {(η 1 , ..., η r , Y1 , ..., Ys ) | η i ∈ Tp∗ , Yj ∈ Tp } (91)
Definition 37 Un tensor T del tipo (r, s) en p ∈ M es una funcional multi-
lineal sobre Πsr , es decir:
T : Πsr −→ R
(η1 , ..., η r , Y1 , ..., Ys ) −→ T(η 1 , ..., ηr , Y1 , ..., Ys )
lineal en cada componente.
El espacio de todos los tensores es llamado el producto tensorial Tsr :
Tsr := Tp ⊗ Tp ⊗ · · · ⊗ Tp ⊗ Tp∗ ⊗ Tp∗ ⊗ · · · ⊗ Tp∗ (92)
Tsr = {f : Πsr → R | f es lineal en todas sus componentes}
Donde intervienen r factores Tp∗ y s factores Tp .Tenemos que en particular T01 =
Tp y T10 = Tp∗ .
xxvi VARIEDADES

Definition 38 Sean T y T0 ∈ Tsr (p) dos tensores del mismo tipo y definimos
la suma por:
(T + T0 )(η 1 , ..., η r , Y1 , ..., Ys ) : = T(η1 , ..., η r , Y1 , ..., Ys ) (93)
0 1 r
+T (η , ..., η , Y1 , ..., Ys )
y el producto por un escalar α ∈ R como:
(αT)(η 1 , ..., η r , Y1 , ..., Ys ) := αT(η1 , ..., η r , Y1 , ..., Ys ) (94)
Con estas reglas Tsr (p)
forma un espacio vectorial real de dimensión r + s.
Sean Xi ∈ Tp (i = 1, ..., r) y ω j ∈ Tp∗ (j = 1, ..., s). Denotemos por

X1 ⊗ X1 ⊗ · · · ⊗ Xr ⊗ ω 1 ⊗ ω 2 ⊗ · · · ⊗ ω s
al elemento de Tsr (p) el cual transforma al elemento (η1 , ..., η r , Y1 , ..., Ys ) ∈ Πrs
en el número
1
(X1 ⊗X1 ⊗ · · · ⊗Xr ⊗ω 1 ⊗ω 2 ⊗ · · · ⊗ω s )(η , ..., η r , Y1 , ..., Ys ) (95)
: =< η 1 , X1 > · · · < η r , Xr >< ω 1 , Y1 > · · · < ω s , Ys >
Similarmente, si R ∈ Tsr (p) y S ∈ Tqp (p), entonces denotaremos por R ⊗ S al
r+p
elemento de Ts+q (p) el cual transforma al elemento (η 1 , ..., ηs+q , Y1 , ..., Yr+p )
en el número real
1
(R ⊗ S)(η , ..., η s+q , Y1 , ..., Yr+p ) (96)
1 s+r
: = R(η , ..., η s , Y1 , ..., Yr )S(η , ..., η s+q , Yr+1 , ..., Yr+p
Con este producto ⊗ el espacio de los tensores en p forma un álgebra sobre R.
Lemma 39 Sean {Eα } y {Eα } bases duales de Tp y Tp∗ respectivamente. En-
tonces
{Eα1 ⊗Eα2 ⊗ · · · ⊗Eαr ⊗Eβ 1 ⊗Eβ 2 ⊗ · · · ⊗Eβ s } (97)
con αi , β i = 1, 2, ...n es una base de Tsr (p). De esta forma, dado T ∈ Tsr (p)
escribimos:
T = T α1 ····α β1 β2
β 1 ···β s Eα1 ⊗Eα2 ⊗ · · · ⊗Eαr ⊗E ⊗E ⊗ · · · ⊗E
r βs
(98)

Donde T α1 ····αβr1 β 2 ···β s son las componentes de T en esta base.


Usualmente T se llama un tensor r veces contravariante y s veces covariante,
y las componentes están dadas por:
T α1 ····α α1 αr
β 1 ···β s = T(E , ..., E , Eβ 1 , ..., Eβ s )
r
(99)

El álgebra del espacio vectorial Tsr (p) se puede escribir en términos de las com-
ponentes de los tensores en una base dada de la siguiente forma:
(T + S)α1 ····αβr1 ···β s = T α1 ····αβr1 ···β s + S α1 ····αβr1 ···β s (100)
(αT)α1 ····αβr1 ···β s = αT α1 ····αβr1 ···β s
0.6. TENSORES xxvii

y el álgebra del producto ⊗ como:


α1 ····αr+p αr+1 ····αr+p
(T ⊗ S) β 1 ···β s+q = T α1 ····αβr1 ···β s S β s+1 ···β s+q (101)

Si {E0α } y {E0α } son otro par de bases duales de Tp y Tp∗ , ellas pueden ser
expandidas en términos de las bases {Eα } y {Eα } en la forma:
Eα0 = φα0α Eα (102)
0 0
Eα = φαα Eα (103)
0
Donde φα0α y φαα son matrices n × n no singulares. Puesto que las bases {E0α }
y {E0α } son duales, entonces:
0 0 0
δ β α0 = < Eβ , Eα0 >=< φβ β Eβ , φα0α Eα > (104)
0 0
= φβ β φα0α < Eβ , Eα >= φβ β φα0α δ β α
0
= φβ α φα0α
0
Es decir φα0α y φαα son matrices mutuamente inversas.
Las componentes de un tensor T ∈ Tsr (p) con respecto a las bases {E0α } y

{E } son:
α0 ····α0 0 0
T 1 βr0 ···β 0 = T(Eα1 , ..., Eαr , Eβ 01 , ..., Eβ 0s ) (105)
1 s

y están relacionadas con las componentes de T en las bases duales {Eα } y { Eα }


por:
α0 ····α0 0 0 β β
T 1 βr0 ···β 0 = φα1α1 · · · φαrαr φβ 0 1 · · · φβ 0 s T α1 ····αβr1 ···β s (106)
1 s 1 s

Definition 40 La contracción de un tensor T del tipo (r, s) con componentes


T α1 ····αβr1 ···β s con respecto a las bases duales {Eα } y {Eα } sobre el primer índice
contravariante y el primer índice covariante es definido como el tensor C11 (T)
del tipo (r − 1, s − 1) cuyas componentes en las bases dadas sonT α1 ····ααr1 β 2 ···β s ,
es decir:
C11 (T) := T α1 ····ααr1 β 2 ···β s Eα2 ⊗ · · · ⊗Eαr ⊗Eβ 2 ⊗ · · · ⊗Eβ s (107)
Veamos que esta operación de contracción es independiente de las bases
usadas. Sean {E0α } y {E0α } otras bases duales, entonces:
α01 ····α0r 0 0
C01
1 (T) : =T α01 ···β 0s Eα2
0 ⊗ · · · ⊗Eα0r ⊗Eβ 2 ⊗ · · · ⊗Eβ s
α01 α2 ····αr α02 0 β β α01 α2 ····αr
= T α01 β 2 ···β s φ α2 · · · φαrαr φβ 0 2 · · · φβ 0 s T α01 β 2 ···β s ×
2 s
γ γ β 02 β 0s
×φα0 2 · · · φα0r r φ η2 ···φ ηs Eγ 2 ⊗ · · · ⊗Eγ r ⊗Eη2 ⊗ · · · ⊗Eηs
2
0 γ 0 γ β 0 β 0 α01 α2 ····αr
= φα2α2 φα0 2 · · · φαrαr φα0r r φβ 0 2 φβη22 φβ 0 s φβ sηs T α01 β 2 ···β s ×
2 2 s
η2 ηs
×Eγ 2 ⊗ · · · ⊗Eγ r ⊗E ⊗ · · · ⊗E
α01 α2 ····αr
= δ α2γ 2 · · · δ αγrr δ βη22 φβ sηs T η2
α01 β 2 ···β s Eγ 2 ⊗ · · · ⊗Eγ r ⊗E ⊗ · · · ⊗E
ηs

α01 α2 ····αr
= T α01 β 2 ···β s Eα2 ⊗ · · · ⊗Eαr ⊗Eβ 2 ⊗ · · · ⊗Eβ s = C11 (T )
xxviii VARIEDADES

Similarmente se define la contracción sobre cualquier par de índices n y m, es


decir Cnm (T ).

Definition 41 La parte simétrica de un tensor T del tipo (2, 0) es el tensor


S(T) ∈ T02 (p) definido por:

S(T)(η 1 , η 2 ) : = (108)
1
{T(η 1 , η 2 ) + T(η2 , η1 )}; ∀η1 , η2 ∈ Tp∗
2!

Si denotamos las componentes de S(T)αβ por Tαβ , entonces:

αβ α
S(T) ≡ T (αβ) = S(T)(E , Eβ ) (109)
1
= {T(Eα , Eβ ) + T(Eβ , Eα )}
2!
1 © αβ ª
= T + T βα
2!
En general, se pueden definir las componentes simétricas de un tensor T ∈Tsr (p)
sobre cualquier número de índices covariantes o contravariantes, de la siguiente
manera:
1 X
T α1 ····α(βr := Tβ 1 ···β s α1 ····αr
(110)
1 ···β s ) s!
(β 1 ···β s )

en donde la suma es sobre todas las permutaciones de los índices β 1 · · · β s , por


ejemplo:
1 © α ª
T α(βγη) = T βγη + T αβηγ + T αγ βη + T αβγη + T αη βγ + T αηγβ (111)
3!
Un tensor se llama simétrico con respecto a ciertos índices si él coincide con
su correspondiente parte simétrica, por ejemplo:

Tαβ = T(αβ) ⇐⇒ Tβα = Tαβ (112)

Definition 42 Similarmente a como se define la parte simétrica, definimos la


parte antisimétrica A(T) de un tensor T ∈ T02 (p) por:

αβ 1 © αβ ª
A(T) ≡ T [αβ] := T − T βα (113)
2!
y más generalmente de cualquier tensor T ∈ Tsr (p) como:

[α1 ····αr ] 1 X
T β 1 ···β s := (−1)p T α1 ····αr β 1 ···β s (114)
r!
(α1 ····αr )

donde p es el orden de la permutación.


0.6. TENSORES xxix

Por ejemplo:
1
T [βγη] = {T βγη − T βηγ + T γ βη − T βγη + T η βγ − T ηγβ } (115)
3!
Un tensor se llama antisimétrico en ciertos índices, si éste es igual a su parte
antisimétrica. Si T αβ = T [αβ] es antisimétrico, entonces T (αβ) = 0. Además,
dado T ∈ T02 (p), se cumple siempre que;

T αβ = T (αβ) + T [αβ] (116)

Un subconjunto particularmente importante de tensores son los del tipo


(0, q) los cuales son antisimétricos en todas sus q posiciones: Aq (p) ⊂ Tq0 (p).
Claramente q ≤ n, con n la dimensión de la variedad. Al conjunto Aq (p) se le
llama el espacio de las q-formas sobre M en p. Si A y B son dos p- y q- formas,
podemos definir la (p + q)-forma A ∧ Q, en donde ∧ es el producto tensorial
antisimetrizado,
A ∧ B :=A(A ⊗ B) (117)
es decir, A ∧ B es el tensor de tipo (0, p + q) cuyas componentes están dadas
por:

(A ∧ B) α1 ····αp β 1 ···β q := A[α1 ····αp Bβ 1 ···β q ] (118)


Por ejemplo, dados A, B ∈ A1 (p), entonces:

(A ∧ B)αβ = A[α Bβ] (119)


1
= {Aα Bβ − Aβ Bα }
2!
Por otro lado:

(B ∧ A)αβ = B[α Aβ] (120)


1
= {Bα Aβ − Bβ Aα }
2!
= (−1)1·1 (A ∧ B)αβ

En general :
p·q
(A ∧ B) = (−1) (B ∧ A) (121)
donde A es una p-forma y B es una q-forma.
Si consideramos los escalares como 0-formas, el producto ∧ llamado producto
n
exterior, define un álgebra sobre el espacio de las formas, Λ(p) = ∪ A(p),
p=0
llamada el álgebra de Grassmann de las formas. Además, si {Eα } es una base
de las 1-formas, entonces Eα1 ∧ · · · ∧Eαp es una base de las p-formas, es decir,
si A es una p-forma entoces podemos expresar A como

A = Aα1 ...αp Eα1 ∧ · · · ∧Eαp (122)

donde Aα1 ...αp = A [α1 ...αp ]


xxx VARIEDADES

Definition 43 Un C k -campo tensorial T del tipo (r, s) sobre un subconjunto


U ⊂ M es una función que asigna un elemento de Tsr (p) para cada p ∈ U, tal
que las componentes de T con repecto a alguna base cordenada definida sobre
algun subconjunto abierto de U son funciones de clase C k .
Denotaremos, como caso particular, por Ξ(M) al campo vectorial del tipo
T01 (p).

0.7 Transformaciones entre variedades,


Definition 44 Sean M y N variedades m y n dimensionales. Una función
φ : M −→ N se llama de clase Ck si dados sistemas de coordenados (ψ α , Uα ) y
(ϕβ , Vβ ) enM y N respectivamente, las coordenadas de φ(p) son funciones de
clase Ck de las coordenadas de p:
ϕβ ◦ φ ◦ ψ −1
α : ψ α (Uα ) ⊆ R
m
−→ Rn
(123)
ψ α (p) 7−→ ϕβ (φ(p))

Notemos que si m > n, entonces la funcion ϕβ ◦φ◦ψ −1 α no es uno a uno. Así,


en general, esta función no tiene inversa, y en caso de que existiera ésta no será de
clase Cr . Por ejemplo, sean M = N = R y sea φ(x) = x3 , entonces φ(x) ∈ C ∞ ,
y sin embargo φ−1 (x) no es diferenciable en x = 0.
Definition 45 Sea f ∈ F(N ) y φ : M −→ N . Entonces la función φ induce
una función φ̃
φ̃ : F(N ) −→ F(M)
(124)
f 7−→ φ̃f
definida por: φ̃f (p) := f (φ(p)).
De esta manera, φ transforma puntos de M en N y φ̃ convierte funciones
de F(N ) en funciones de F(M) linealmente, pues:
φ̃(αf + g)(p) = (αf + g)φ(p) (125)
= αf (φ(p)) + g(φ(p))
= αφ̃f (p) + φ̃g(p)
Si λ(t) es una curva sobre M que pasa por p ∈ M, entonces la imagen
φ(λ(t)) sobre N es una curva que pasa por φ(p).
Definition 46 Dada φ : M −→ N definamos la transformación
φ∗ : Tp M −→ Tφ(p) N
X −→ φ∗ X
de la siguiente manera: para cada f ∈ F(N ) definida en el punto en φ(p) y
cada X ∈ Tp M definimos φ∗ X ∈ Tφ(p) N así:

φ∗ X(f ) |φ(p) := X(φ̃f ) |p = X(f ◦ φ) |p (126)


0.7. TRANSFORMACIONES ENTRE VARIEDADES, xxxi

Figure 5:

Claramente φ∗ es lineal, pues:

φ∗ (αX + Y)(f ) | φ(p) = (αX + Y)(φ̃f ) |p (127)


= αX(φ̃f ) |p +Y(φ̃f ) |p
= αφ∗ X(f ) |φ(p) +φ∗ Y(f ) |φ(p)

∂ ∂
Así, si ( ∂t )λ |p es el vector tangente a la curva λ en p ∈ M , entonces φ∗ ( ∂t )λ |φ(p) es
el vector tangente a la curva φ◦λ en φ(p) ∈ N . φ∗ recibe el nombre de diferencial
de φ en p y en algunos textos se nota como dφ.

Definition 47 Dada φ : M → N y usando la definición de φ∗ definimos la


función φ∗ :
φ∗ : Tφ(p)

N −→ Tp∗ M
De tal manera que la contracción de un vector y una 1-forma sea preservada bajo

transformaciones. Es decir, dado Y ∈ Tφ(p) N , entonces definimos φ∗ Y ∈ Tp∗ M
de manera que:
< φ∗ Y, X >|p =< Y, φ∗ X >|φ(p) (128)

Ahora, si consideramos las funciones F(M) como cero formas, identificare-


mos φ̃ ≡ φ∗ .

Theorem 48 Una consecuencia de la definición de φ∗ es que:

φ∗ (df ) = d(φ∗ f ) (129)

Demostracion:
Sean X ∈Tp M y f ∈ F(N ), entonces:
xxxii VARIEDADES

< φ∗ (df ), X >|p =< df, φ∗ X >|φ(p) (130)


= φ∗ Xf |φ(p) = X(φ̃f ) |p
≡ X(φ∗ f ) |p =< d(φ∗ f ), X >|p

Como esto vale para todo X ∈ Tp M se sigue que:

φ∗ (df ) = d(φ∗ f ) (131)

La transformacion φ∗ puede ser extendida naturalmente a tensores con-


travariantes de M a N por las reglas:

φ∗ : T0r (p) −→ T0r (φ(p)) (132)

T −→ φ∗ T
definida por:

φ∗ T(η1 ...η r ) := T(φ∗ η 1 ...φ∗ η r ) |p ; ∀η i ∈ Tφ(p)



N (133)

De la misma manera φ∗ se generaliza a tensores covariantes de N a M así:

φ∗ : Ts0 (φ(p)) −→ Ts0 (p) (134)

T −→ φ∗ T
definida por:

φ∗ T(X1 ...Xs ) |p = T(φ∗ X1 ...φ∗ Xs ) |φ(p) (135)

Definition 49 La transformación φ : M −→ N se dice de rango s en p si la


dimensión de φ∗ (Tp M) es s. Así, si en p, s = m, entonces φ se llama inyectiva
y en este caso se debe cumplir que m ≤ n. Si en p, s = n, φ se llama sobreyectiva
y se tiene que m ≥ n.

Definition 50 Una C r −transformación φ : M −→ N se llama una inmersión


si ∀p ∈ M, existe una vecindad U alrededor de p, tal que:

φ−1 : φ(U) ⊂ N −→ M (136)

es de clase Cr .

Por lo tanto si φ es una inmersión de M en N , entonces m ≤ n. Además, por


el teorema de la función implícita φ es una inmersión si y solo si, φ es inyectiva
en todo punto p ∈ M, por lo tanto

φ∗ : Tp M →φ∗ (Tp M) ⊂ Tφ(p) N (137)

es un isomorfismo. La imagen φ(M) es una subvariedead inmersa en N .


0.8. CÁLCULO EN VARIEDADES xxxiii

i
Por ejemplo, toda curva λ : I ⊂ R −→ M es una inmersión si dx (λ(t))
dt 6= 0.
Así una subvariedad inmersa en N puede intersectarse a si misma. Esto significa
que φ : M −→ N no necesariamente es una función 1-1 de M sobre N , aún
cuando φ si es uno a uno cuando se restringe a una vencidad suficientemente
pequeña de M.

Definition 51 Una inmersión φ : M → N se llama una inclusión si φ : M →


φ(M) ⊂ N es un homeomorfismo. De esta manera una inclusion es una inmer-
sión que además es 1-1. Pero no toda inmersión uno a uno es una inclusión.

Definition 52 Una transformación φ : M → N se llama un Cr -difeomorfismo


si φ es una Cr -transformación, uno a uno, y φ−1 : N → M es una Cr -
transformación.

En este caso m = n y φ es inyectiva y sobre.


Por el teorema de la función implícita se ve que si φ∗ es biyectiva en p,
entonces φ es un difeomorfismo en una vecindad U de p.
Si φ : M → N es un difeomorfismo, entonces

φ∗ : Tp M → Tφ(p) N (138)

y
(φ−1 )∗ : Tp∗ M → Tφ(p)

N (139)
son isomorfismos, y entonces podemos definir una transformación :

φ∗ : Tsr (p) −→ Tsr (φ(p)) (140)

por:

T(η 1 ...η s , X1 ...Xr ) | p =: φ∗ T((φ−1 )∗ η1 ...(φ−1 )∗ η s , φ∗ X1 ...φ∗ Xr )(141)


∀η i ∈ Tp∗ M y Xi ∈ Tp M

Esta transformación envía tensores del tipo (r, s) sobre M a tensores del tipo
(r, s) sobre N y preserva las relaciones de simetría y el álgebra tensorial. Por
ejemplo c(φ∗ T) = φ∗ (cT).

0.8 Cálculo en variedades


En esta sección veremos tres operaciones de derivadas las cuales juegan un papel
fundamental para el cálculo diferencial sobre variedades.

0.8.1 Derivada exterior


Definition 53 El operador diferenciación exterior d es un operador lineal

d : Λr −→ Λr+1 (142)
xxxiv VARIEDADES

definido por la forma en que el actúa sobre una 0-forma f ∈F(M)


< df, X >:= Xf ; ∀X ∈ Tp M (143)
y actuando sobre un campo de r-formas A = Aα1 ···αr dxα1 ∧ · · · dxα r
da el
campo de (r+1)-formas
dA := dAα1 ···αr ∧dxα1 ∧ · · · ∧ dxαr (144)
Veamos que esta definición de dA es independiente de la base escogida.
Consideremos otra base {x0 α }:
A = A0α1 ···αr dx0α1 ∧ · · · dx0α r
(145)
Donde las componentes A0α1 ···αr están dadas por:
∂xα1 ∂xαr
A0α1 ···αr = · · · Aα ···α (146)

∂x 1 ∂x0αr 1 r
Así dA en la coordenada primada está dada por:
dA = dA0α1 ···αr ∧dx0α1 ∧ · · · dx0α r =
∂xα1 ∂xαr
= d( 0α1 · · · 0αr Aα1 ···αr ) ∧ dx0α1 ∧ · · · ∧ dx0αr
∂x ∂x
∂xα1 ∂xαr
= · · · 0αr dAα1 ···αr ∧dx0α1 ∧ · · · ∧dx0αr
∂x0α1 ∂x
∂ 2 xα1 ∂xα2 ∂xαr
+ 0β · · · Aα ···α dx0β 1 ∧dx0α1 ∧ · · · ∧dx0αr
∂x 1 ∂x0α1 ∂x0α2 ∂x0αr 1 r
∂xα1 ∂ 2 xαr
· · · + 0α1 · · · 0β Aα ···α dx0β 1 ∧dx0α1 ∧ · · · ∧dx0αr (147)
∂x ∂x 1 ∂x0αr 1 r
Analicemos ahora un término que contenga segundas derivadas:
∂ 2 xαr
dx0β 1 ∧dx0α1 (148)
∂x0β 1 ∂x0α1
∂ 2 xαr
es simétrico en β 1 y α1 , mientras que dx0β 1 ∧dx0α1 es antisimétrico,
∂x0β 1 ∂x0α1
por lo tanto:
∂ 2 xαr
dx0β 1 ∧dx0α1 = 0 (149)
∂x0β 1 ∂x0αr
Entonces:
∂xα1 ∂xαr
dA = · · · dAα1 ···αr ∧dx0α1 ∧ · · · ∧ dx0α r
∂x0α1 ∂x0αr
∂xα1 ∂xαr ∂x0α1 σ1 ∂x0αr σr
= · · · dA α1 ···αr ∧ dx ∧ · · · ∧ dx
∂x0α1 ∂x0αr ∂xσ1 ∂xσr
∂xα1 ∂x0α1 ∂xαr ∂x0αr
= 0α σ
· · · 0αr dAα1 ···αr ∧dxσ1 ∧ · · · ∧ dxσr
∂x 1 ∂x 1 ∂x ∂xσr
= δα αr σ1
σ 1 · · · δ σ r dAα1 ···αr ∧dx ∧ · · · ∧ dx
1 σr

α1 αr
= dAα1 ···αr ∧dx ∧ · · · ∧ dx (150)
0.8. CÁLCULO EN VARIEDADES xxxv

Notemos que esta definición no sería independiente de las coordenadas si en


vez de usar el producto exterior ∧ se hiciera para el producto tensorial.
De la definición se sigue que:

d(A ∧ B) = dA ∧ B + (−1)r A ∧ dB; ∀A ∈ Λr ; ∀B ∈ Λs (151)

Dada una 0-forma f , tenemos que en una base coordenada:

∂f
df = dxi (152)
∂xi
entonces:
∂2f
d(df ) = j
dxj ∧dxi
i | {z }
(153)
|∂x{z∂x} antisimétrico
simétrico

Theorem 54 Para toda p-forma:

d(dA) = 0 (154)

La demostración se deja como problema.

0.8.2 Derivada de Lie


Lemma 55 Dado un campo vectorial X sobre M, existe una única curva max-
imal λ(t) sobre M que pasa a través de cada p ∈ M tal que λ(0) = p y cuyo
vector tangente en el punto λ(t) es el vector X |λ(t) .

Demostración:
Si {xi } son coordenadas locales, tal que la curva λ(t) tiene coordenadas xi (t),
y el vector X tiene componentes X i en esta base, entonces la curva λ es solución
del sistema de ecuaciones diferenciales:

dxi
= X i (xi (t) · · · xn (t)) (155)
dt
Cuya solución está garantizada por el teorema general de existencia y unicidad
de las ecuaciones diferenciales ordinarias.

Definition 56 El flujo de un campo vectorial X sobre M es una transforma-


cion:
φ : M × R −→ M

(p, t) −→ φ(p, t) := λp (t)


donde λp (t) es la curva integral maximal del campo X que en t = 0 pasa por
p∈M .
xxxvi VARIEDADES

Si en φ(p, t), p es mantenido fijo, entonces φ(p, t) es justamente la curva inte-


gral λp (t). Por otro lado, si mantenemos t = cte, φ(p, t) define un difeomorfismo:

φt : M −→ M

p −→ φt (p)
el cual envía un punto p de la variedad al punto φt (p), el cual está localizado
una distancia paramétrica t sobre la curva integral λp (t).

Lemma 57 φt es un grupo local uniparamétrico de difeomorfismos, es decir φt


satisface:
i.- φ0 es la identidad:

φ0 = id : M −→ M (156)

ii.- La ley de composición:


φt ◦ φs = φt+s (157)
iii.- Existe un inverso:
φ−1
t = φ−t (158)

De la definición de un C r −difeomorfismo se sigue que si φt es un difeomor-


fismo, entonces:
(φt )∗ : Tsr (p) −→ Tsr (φt (p))
T −→ (φt )∗ T |φt (p)
Esta última relación nos permite definir la derivada de Lie de un tensor a lo
largo un campo vectorial:

Definition 58 La derivada de Lie, LX T, de un campo tensorial T con respecto


al campo vectorial X es definida por:

1
LX T |p := lim {T |p −(φt )∗ T |φt (p) } (159)
t→0 t

Lemma 59 Dados T1 , T2 ∈ Tsr (M ), X, Y campos vectoriales sobre M y f ∈


F(M), la derivada de Lie cumple las siguientes propiedades:
1.- LX es R-lineal:

LX (T1 + λT2 ) = LX T1 + λLX T2

2.- LX es una derivación, es decir, satisface la regla de Leibniz:

LX (T1 ⊗ T2 ) = LX (T1 ) ⊗ T2 + T1 ⊗ (LX T2 )

3.- LX (Tsr (M )) ⊆ Tsr (M )


0.8. CÁLCULO EN VARIEDADES xxxvii

1. Lemma 60 4.- LX conmuta con la operación de contracción.


5.- LX f = Xf =< df , X >
6.- Definiendo el conmutador de dos campos vectoriales por

[X, Y](f ) := X(Yf ) − Y(Xf )

entonces el conmutador [X, Y] satisface la identidad de Jacobi:

[[X, Y], Z] + [[Y, Z], X] + [[Z, X], Y] = 0

Esta operacion de conmutación forma la llamada álgebra de Lie del espacio


ℵ(M )
7.- Es fácil comprobar esta álgebra si trabajamos en una base coordenada
{xi }, donde X=X i ∂i y Y=Y i ∂i , entonces:

∂Y j i ∂X
j
∂f
[X, Y]f = (X i − Y ) (160)
∂xi ∂xi ∂xj
Así, el vector [X, Y] tiene como componentes en la base coordenada {xi }:

∂Y j i ∂X
j

[X, Y] = (X i − Y ) (161)
∂xi ∂xi ∂xj
entonces:
LX Y = [X, Y] (162)

8.- LX+λY T =LX T + λLY T


9.- L[X,Y] = [LX , LY ] = LX ◦ LY − LY ◦ LX
10.- Las siguientes tres proposiciones son equivalentes:
i.- [X, Y] = 0
ii.- LX ◦ LY = LY ◦ LX
iii.- Si φs y ψ t son los difeomorfismos generados por los campos X y Y
respectivamente, entonces:

φs ◦ ψ t = ψ t ◦ φs (163)

11.- Dado T ∈ Tsr (M ) y una base coordenada {xi }, entonces:

∂T α 1 ···αr
β 1 ···β s ∂X α1
(LX T)αβ11····α
···β s
r
= X i − T iαβ21···α r
···β s − ···
∂xi ∂xi
αr
α ···α i ∂X ∂X i
· · · − T β 11···β sr−1 + T αiβ1 2···α r
···β s
∂xi ∂xβ 1
∂X i
+···Tα 1 ···αr
β 1 ···β s−1 i (164)
∂xβ s
xxxviii VARIEDADES

Para una prueba de estas propiedades ver por ejemplo ”Foundations of Dif-
ferential Geometry ”, S. Kobayashi y K. Nomizu. Interscience Publishers. John
Wiley & Sons.New York
Veamos la interpretación geométrica de LX T.
De la propiedad 10 se sigue que si la derivada de Lie de dos campos vectoriales
se anula, o equivalentemente, los campos conmutan, entonces si un vector v ∈
Tp M se desplaza una distancia paramétrica t a lo largo de la curva integral de
X y luego una distancia s a lo largo de la curva integral del campo Y se llega
a un punto q, el cual también se obtiene, si primero se desplaza s a lo largo de
la curva integral de Y y luego una distancia t a lo largo de X
La derivada de Lie de un campo tensorial LX T depende, no solamente de
la dirección del campo vectorial X en p, sino también de la dirección de X
en puntos vecinos y en este sentido es un objeto no local , por lo tanto no es
la generalización adecuada del concepto de derivada sobre Rn para escribir las
ecuaciones de campo para la física

0.8.3 Conexión y derivada covariante


La generalización adecuada de derivada parcial sobre una variedad es la derivada
covariante, la cual requiere para su definición de una estructura adicional definida
sobre la variedad llamada la conexión.

Definition 61 Una conexión ∇ en un punto p ∈ M es una función la cual


asigna a cada campo vectorial X en p un operador diferencial ∇X definido por

∇X : Ξ(M) −→ Ξ(M)
Y 7−→ ∇X Y

tal que:
c-1. ∇X YT es un tensor en el argumento X, i.e.

∇f X+gY Z = f ∇X Z + g∇Y Z (165)

∀f, g ∈ F(M), ∀X, Y, Z ∈ Ξ(M)


esto quiere decir que el opreador ∇X (derivada) en p depende solamente de la
dirección de X en el punto p.
c-2. ∇X Y es lineal en Y, es decir

∇X (αY + Z) = α∇X Y + ∇X Z (166)

∀α ∈ R, ∀X, Y, Z ∈ Ξ(M)
c-3.
∇X f Y = X(f )Y + f ∇X Y (167)
∀f ∈ F(M), ∀X, Y ∈ Ξ(M)
Entonces decimos que ∇X Y es la derivada covariante del campo vectorial Y
con respecto a la conexión ∇ en la dirección del vector X en el punto p.
0.8. CÁLCULO EN VARIEDADES xxxix

De la propiedad c-1 ∇Y es un campo tensorial del tipo (1, 1), la derivada


covariante de Y, el cual cuando se contrae con el campo vectorial X produce el
vector ∇X Y, así la propiedad c-3 se puede escribir como
∇(f Y) = df ⊗ Y + f ∇Y (168)
α
Dadas las bases duales {Eα } y {E } en alguna vecindad U ⊂ M, denotare-
mos a las componentes de ∇Y en estas bases como Y;βα , así

∇Y = Y;βα Eα ⊗ Eβ (169)
Si n es la dimensión de la variedad, la conexión está determinada por las n3
funciones Γαβγ sobre U ⊂ M:
­ α ®
Γα
βγ = E , ∇Eβ Eγ (170)
o equivalentemente
∇Eγ = Γα β
βγ E ⊗ Eα (171)
Así, para un campo vectorial Y su derivada covariante está dada por:
∇Y = ∇(Y α Eα )
= dY α ⊗ Eα + Y α Γβγα Eγ ⊗ Eβ (172)
α
Si tomamos una base dual coordenada {∂α } y {dx } las componentes de
∇Y están dadas por:
∂Y α
Y;βα = + Γαβγ Y
γ
(173)
∂xβ
0 0
Bajo un cambio de base {Eα },{Eα } −→ {Eα },{E α } la ley de transformación
de las componentes de la conexión se pueden encontrar con la ayuda de las
propiedes c-1, c-2 y c-3 en la definición de conexión:
0
D 0 0
E
α
Γβγ = E α , ∇E0 Eγ
β
D ¡ ¢E
= Φσ E , ∇Φβρ Eρ Φγ τ Eτ
α σ

D ¡ τ ¢E
ρ
= Φα σ
σ E , Φβ ∇Eρ Φγ Eτ
D ¢E
ρ¡ ¡ τ¢
= Φα σ Eσ
, Φ β E ρ Φγ E τ + Φ γ
τ
∇ Eρ E τ
α ρ ©­ σ ¡ τ¢ ® τ
­ σ ®ª
= Φσ Φβ E , Eρ Φγ Eτ + Φγ E , ∇Eρ Eτ
ρ ¡ τ¢ σ ρ
= Φα σ Φβ Eρ Φγ hE , Eτ i + Φα σ Φβ Φγ Γρτ
τ σ

ρ ¡ ¢ ρ
= Φα σ Φβ Eρ Φγ
τ
δ στ + Φασ Φβ Φγ Γρτ
τ σ

ρ ¡ ¢ ρ
= Φα σ Φβ Eρ Φγ
σ
+ Φα σ Φβ Φγ Γρτ
τ σ
(174)
Si se utilizan bases coordenadas, {∂α },{dxα } y {∂α0 },{dx0α }, entonces Φα
σ =
∂x /∂xσ y Φγ τ = ∂xτ /∂x0γ , y tenemos que la ley de transformación de las

componentes de la conexión toma la forma:


0
α ∂x0α ∂xρ ∂ 2 xσ ∂x0α ∂xρ ∂xτ σ
Γβγ = + Γ (175)
∂xσ ∂x0β ∂x0ρ ∂x0γ ∂xσ ∂x0β ∂x0γ ρτ
xl VARIEDADES

Debido al primer término en la anterior ecuación las componentes de la


conexión no se transforman como las componentes de un tensor.
La derivada covariante puede ser extendida a tensores arbitrarios por las
siguientes reglas:
q
i.- Si T ∈ Trq entonces ∇T ∈ Tr+1
ii.- ∇ es lineal y conmuta con las contracciones.
iii.- ∇ es Leipniziana, es decir ∀T, S campos tensoriales cualesquiera se
cumple que:
∇(T ⊗ S) = ∇T ⊗ S + T ⊗ ∇S (176)
iv.- ∀f ∈ F(M) entonces
∇f = df (177)
Para encontrar las componentes de la derivada covariante de un tensor arbi-
trario consideremos las bases duales {Eα } y {Eβ }, entonces teniendo en cuenta
las propiedades ii y iii anteriores, se puede probar que (problema)

∇Eβ Eγ = −Γγβα Eα (178)

y de esta relación, se obtienen las componentes en una base coordenada de la


derivada covariante de un tensor:
···αr
∂Tβα11···β
···αr
Tβα11···β s ;γ
= + Γα
s σα2 ···αr
γσ Tβ 1 ···β s + ... +
1
(179)
∂xγ
α1 ···αr−1 σ
Γα
γσ Tβ 1 ···β s
r
− Γσγβ 1 T α 1 ···αr
σβ 2 ···β s −
···αr
... − Γσγβ s T βα11···β s−1 σ

0.8.4 Transporte paralelo


Sea T un campo vectorial y λ una curva sobre la variedad M, entonces definimos
DT
= ∇∂t T (180)
∂t
como la derivada covariante del campo T a lo largo de la curva λ, así si X es el
vector tangente a la curva λ(t) entonces
DTα1 ····αβr1 ···β s
= Tα1 ····αβr1 ···β s ;γ X γ (181)
∂t
Consideremos el caso particular de un campo vectorial Y y escojamos una
base coordenada, en donde la curva λ tiene coordenadas xα (t) y X α = dxα /dt,
entonces
DY ∂Y α γ dx
β
= + Γαβγ Y (182)
∂t ∂t dt
Definition 62 Un tensor T se dice transportado paralelamente a lo largo de la
curva λ si
DT
=0 (183)
∂t
0.8. CÁLCULO EN VARIEDADES xli

Dada la curva λ(t) con puntos extremos p y q, se sigue de la teoría de


las ecuaciones diferenciales que si la conexión ∇ es por lo menos de clase C 1 ,
entonces se obtiene un único tensor en el punto q transportando paralelamente
al tensor dado en el punto p a lo largo de la curva λ. Así el transporte paralelo
a lo largo de la curva λ es una transformación lineal del espacio Tsr (p) a Tsr (q),
la cual preserva el álgebra tensorial y la operación de contracción y así, en
particular, si transportamos paralelamente una base de Tp al punto q obtenemos
un isomorfismo entre Tp y Tq . Si la curva es cerrada los puntos p y q pueden
coincidir. El caso particular de transportar paralelamente el vector tangente a
la curva a lo largo de ella misma nos conduce a la siguiente definición:

Definition 63 Sea X el vector tangente a la curva λ, entonces la curva es una


geodésica si su vector tangente es transportado paralelamente a lo largo de la
curva, i.e. µ ¶
D ∂
= ∇X X = 0 (184)
∂t ∂t λ

La condición que el vector tangente a la curva no cambie cuando se trans-


porta paralelamente se puede reemplazar por una condición más débil, pues lo
que se exige es que el vector tangente permanezca paralelo a si mismo cuando
se transporta a lo largo de la curva, es decir

∇X X = f X (185)

con f una función arbitraria sobre la curva. Sin embargo, no es difícil probar
que por una reparametrización de la curva siempre se puede encontrar un f = 0.
Consideremos una base coordenada {∂/∂xα } y {dxα }, entonces la ecuación
de las geodésicas, teniendo en cuenta las ecuaciones 182 y 184, toma la forma

d2 xα β
α dx dx
γ
+ Γβγ =0 (186)
dt2 dt dt

Dados el punto y la velocidad inicial de la curva geodésica λ(0) y λ̇(0) existe


una única geodésica maximal λ(t) como una consecuencia de los teoremas de
existencia y unicidad de las ecuaciones diferenciales ordinarias, en otras pal-
abras, dado el punto p ∈ M y Xp ∈ Tp M existe una única curva maximal λ(t)
tal que λ(0) = 0 y (∂/∂t)λ |t=0 = Xp y la cual depende continuamente de los
valores iniciales. Este resultado nos permite definir una base coordenada espe-
cial, llamadas coordenadas normales de Riemann, las cuales son de gran utilidad
cuando se trabaja localmente, es decir, en una vecindad de un punto de la var-
iedad. Para construir estas coordenadas es necesario definir la transformación
exponencial:

Definition 64 Definimos la transformación exponencial

exp : Tp M −→ M
X 7−→ q = exp(X)
xlii VARIEDADES

por la relación
exp(X) := λ(1) (187)
en donde λ(t) es la única geodésica que pasa por el punto p y tiene vector tan-
gente X.

Como se puede demostrar, la transformación exponencial siempre existe y es


1-a-1en alguna vecindad del punto p. Puesto que Tp M es un espacio vectorial
real n-dimensional, este es isomorfo a Rn , y lo podemos identificar con él, y
así usar la transformación exponencial para definir una carta coordenada en
la vecindad del punto p ∈ M, llamada coordenadas normales de Riemann.
Asociándole el origen de Rn al punto p, estas coordenadas tienen la propiedad
que las geodésicas a través del punto p son transformadas en líneas rectas que
pasan a través del origen de Rn . De la ecuación de las geodésicas en coordenadas
de Riemann (ver ecuación 186) se deduce que las componentes de la conexión se
anulan, y es por esta razón que las coordenadas normales de Riemann tienen una
especial utilidad para efectos de cálculo, además, como veremos más adelante
también tienen un significado físico.

Definition 65 Dada una conexión ∇ sobre la variedad M definimos la torsión


como una transformación

T : Ξ(M) × Ξ(M) −→ Ξ(M)


(X, Y) 7−→ T (X, Y)

definida por
T (X, Y) := ∇X Y − ∇Y X − [X, Y] (188)

Dos primeras propiedades que se pueden deducir de la definición de la torsión


son:
T (X, Y) = −T (Y, X) (189)

T (f X, gY) = f gT (X, Y) ; ∀f, g ∈ F(M) (190)

Problema: demostrar estas propiedades.


Ayuda:
∇f X gY = f ∇X gY = f X(g)Y + f g∇X Y (191)

[f X, gY] = Lf X gY
= f X(g)Y + gLf X Y
= f X(g)Y − gLY f X (192)

Definition 66 Definamos el tensor torsión T ∈ T21 por:

T(ω, X, Y) := hω, T(X, Y)i (193)


0.8. CÁLCULO EN VARIEDADES xliii

A partir de esta definición, y tomando una base coordenada, veamos que las
componentes del tensor torsión están dadas por:
α
Tβγ = Γα α
βγ − Γγβ (194)

Para demostrar esta relación consideremos las bases duales coordenadas


{∂/∂xα } y {dxα }. De la definición del tensor torsión tenemos

hω, T(X, Y)i = hω, ∇X Y − ∇Y X − [X, Y]i (195)

entonces, de las expresiones para las derivadas covariante y de Lie de un tensor


en componentes
∂Y α β
∇X Y = X + Γα β γ
βγ Y X (196)
∂xβ
µ ¶
∂X α β α β γ ∂
∇Y X = β
Y + Γβγ X Y (197)
∂x ∂xα
µ α α

∂Y β β ∂X ∂
[X, Y] = LX Y = X −Y (198)
∂xβ ∂xβ ∂xα
entonces
¡¡ ¢ β¢ ∂
∇X Y − ∇Y X − [X, Y] = Γα α
βγ − Γγβ X (199)
∂xα
a partir de la cual se llega a la ecuación 194. Si tomamos una base cualquiera
{Eα } y {Eβ } el tensor torsión toma la forma
¡ ¢
T = Γα α β
βγ − Γγβ Eα ⊗ E ⊗ E
γ
(200)

Definition 67 Una conexión ∇ se llama libre de torsión si T ≡ 0, o equiva-


lentemente las componentes son simétricas en sus índices inferiores, i.e. si

Γα α
βγ = Γγβ (201)

En lo sucesivo trabajaremos con conecciones libres de torsión, y por lo tanto


en este caso se tiene la siguiente relación entre la derivada de Lie y la derivada
covariante:
LX Y = ∇X Y − ∇Y X (202)
que para el caso de un tensor cualquiera, en componentes coordenadas, toma la
forma (problema):

(LX T)α 1 ···αr


β 1 ···β s
···αr
= Tβα11···β s ;σ
X σ − Tβσα 2 ···αr
1 ···β s
α1
X;σ −···
α ···α σαr α1 ···αr σ
−Tβ 12···β sr−1 X;σ + Tσβ 2 ···β s
X;β 1
+
···αr
· · · + Tβα11···β s−1 σ
σ
X;β s
(203)

También podemos encontrar la relación entre la derivada covariante y la


exterior:
(dA)αβ···γδ = (−1)p A[αβ···γ;δ] (204)
xliv VARIEDADES

o equivalentemente

dA = Aαβ···γ;δ dxδ ∧dxα ∧dxβ ∧ · · · ∧dxγ (205)

en donde A es una p-forma. Problema: Demostrar esta relación por inducción.


A pesar de estas relaciones entre las derivadas exterior y de Lie con la derivada
covariante, las primeras son independientes de la conexión definida sobre la
variedad.

0.8.5 Tensor de Riemann


Volvamos al concepto de transporte paralelo a lo largo de una curva. Con-
sideremos una curva cerrada λ y supongamos que partimos de un punto p y
transportamos paralelamente al vector Xp a lo largo de la curva regresando al
punto inicial. Entonces obtendremos el vector X0p que en general será difer-
ente al vector inicial. Si consideramos ahora, otra curva δ(t) cerrada que pase
también por el punto p y transportamos de nuevo al vector Xp a lo largo de
esta nueva curva, obtendremos un vector X00p , que, en general, será diferente a
Xp y X0p . Esta no integrabilidad del transporte paralelo corresponde al hecho
que, en general, las derivadas covariantes no conmutan. El tensor curvatura de
Riemann nos da una ”medida” de esta no conmutatividad.

Definition 68 Definamos la función curvatura por la relación:

R : Ξ(M) × Ξ(M) × Ξ(M) −→ Ξ(M)


(X, Y, Z) 7−→ R(X, Y, Z)

definida por

R(X, Y, Z) := ∇X (∇Y Z) − ∇Y (∇X Z) − ∇[X,Y] Z (206)

Problema: A partir de esta definición mostrar que la función curvatura es


lineal en las tres entradas X, Y y Z.

Definition 69 Definamos el tensor de Riemann R ∈ T13 por la relación:

R : Ξ∗ (M) × Ξ(M) × Ξ(M) × Ξ(M) −→ R


(ω, X, Y, Z) 7−→ R(ω, X, Y, Z)

definido por
R(ω, X, Y, Z) = hω, R(X, Y, Z)i (207)

Problema: Eligiendo una base coordenada mostrar que las componentes del
tensor de Riemann están dadas por

α
∂Γα
δβ ∂Γαγβ
Rβγδ = − + Γα σ α σ
γσ Γδβ − Γσδ Γγβ (208)
∂xγ ∂xδ
0.8. CÁLCULO EN VARIEDADES xlv

Problema: A partir de la definición mostrar que el tensor de Riemann tiene


las siguiente propiedades de simetría:
α α α
Rβγδ = −Rβδγ ⇐⇒ Rβ(γδ) =0 (209)
α α α α
R[βγδ] = 0 ⇐⇒ Rβγδ + Rγδβ + Rδβγ =0 (210)
Además la derivada covariante del tensor de Riemann satisface las identi-
dades de Bianchi:
α
Rβ[γδ;η] =0 (211)
es decir
α α α
Rβγδ;η + Rβηγ;δ + Rβηγ;δ =0 (212)
Una contracción del tensor de Riemann nos conduce a otro tensor, el cual
juega un papel importante, no solo en la geometría, sino también el la física.

Definition 70 Definimos el tensor de Ricci por:


σ
Rβδ := Rβσδ (213)

Nota: Se puede probar que el transporte paralelo de un vector cualquiera


a lo largo de toda curva cerrada sobre la variedad es localmente integrable, es
decir si Xp = X0p para cada p ∈ M, sí y solamente sí Rβγδα
= 0, ∀p ∈ M; en
este caso se dice que la conexión es plana.

0.8.6 Tensor métrico


Definition 71 Un tensor métrico g en un punto p ∈ M es un tensor simétrico
del tipo T20 (p).

Así, una métrica sobre M es un campo tensorial simétrico g.


Ahora, dada una métrica podemos definir la función ”norma” de un vector
X ∈ Tp M, como

|·|g : Tp M −→ R
p (214)
X 7−→ |X|g := |g(X, X)|

A partir de esta definición podemos introducir el concepto de ángulo en-


tre vectores por la relación (si no se presenta inconsistencia no escribiremos el
subíndice g para referirse a la norma inducida por la métrica):

g(X, Y)
cos ] (X, Y) := 1/2
(215)
[|g(X, X)| |g(Y, Y)|]

la cual es válida ∀X, Y ∈Tp M, y |X| 6= 0 y |Y| 6= 0. Con esta definición


llamaremos vectores ortogonales aquellos que cumplan la condición g(X, Y) = 0.
xlvi VARIEDADES

Dadas las bases duales {Eα } y {Eβ }, el tensor métrico g en componentes


toma la forma

g = gαβ Eα ⊗ Eβ (216)
gαβ = g(Eα , Eβ ) (217)

Las magnitudes definidas por la métrica en el espacio tangente están rela-


cionadas con las magnitudes sobre la variedad por la siguiente definición:

Definition 72 La longitud del camino estre los puntos de la variedad p = λ(a)


y q = λ(b) situados sobre la curva λ(t), con vevtor tangente ∂/∂t, y tal que
g(∂/∂t, ∂/∂t) tiene el mismo signo sobre todos los puntos a lo largo de la curva
λ(t), está definida por la integral
Z b
1/2
Lab = |g(∂/∂t, ∂/∂t)| dt (218)
a

En una base coordenada la ecuación anterior toma la forma explícita


Z b · ¸
dxα dxβ
Lab = gαβ dt (219)
a dt dt

y por esta razón escribiremos, simbólicamente, la distancia a lo largo de una


curva entre dos puntos infinitesimalmente cercanos en la forma

ds2 = gαβ dxα dxβ (220)

Definition 73 Una métrica g se llama no degenerada en un punto p de la


variedad si no existe un vector no nulo X ∈Tp M tal que g(X, Y) = 0 para todo
vector Y ∈Tp M.

En términos de componentes coordenadas de g la métrica es no degenerada


si
det |gαβ | 6= 0 (221)

En estas condiciones podemos definir un tensor del tipo T02 tal que sus com-
ponentes g αβ , en la base coordenada dada, están determinadas por la relación

g αβ gβγ = δ α
γ (222)
¡ ¢
es decir, la matriz g αβ formada con las componentes del tensor es la inversa
de la matriz (gαβ ) formada con las componentes de g. A las componentes
g αβ se le llaman las componentes contravariantes del tensor métrico, y esta
denominación queda justificada, pues la definición 222 implica que podemos
establecer un isomorfismo entre las componentes covariantes y contravariantes
de tensores de la siguiente forma:
0.8. CÁLCULO EN VARIEDADES xlvii

Lemma 74 Sea g una métrica no degenerada en el punto p∈Tp M, entonces la


transformación
Tp M −→ Tp∗ M
1
X 7−→ C1 (g ⊗ X)
define un isomorfismo.
Si gαβ y X α son las componentes del tensor métrico g y del vector X,
entonces las componentes de la 1-forma C11 (g ⊗ X), que las denotaremos por
Xα están dadas por
Xα = gαβ X β (223)
y puesto que la métrica es no degenerada, utilizando la ecuación 222 tenemos que
podemos despejar las componentes del vector X en términos de las componentes
de C11 (g ⊗ X), pues
g µα Xα = g µα gαβ X β (224)
= δ µβ X β
= Xµ
A esta transformación y su inversa, se le conoce en la literatura como ”subir”
y ”bajar” índices. Así, dada una métrica no degenerada podemos hablar de las
componentes covariantes Xα y contravariantes X α de un ”vector” X las cuales
están relacionadas biunívocamente por las ecuaciones 223 y ??. Esta operación
se puede extender para subir o bajar cualquier índice tensorial (o índices por
aplicación sucesiva de la misma operación). Por ejemplo, consideremos un tensor
de rango 3 del tipo T12 , con componentes T αβγ , entonces aplicando las ecuaciones
223 y ?? podemos obtener los siguientes tensores:
T αβγ = g σγ T αβσ (225)
T αβγ = gβσ T ασγ (226)
Tαβγ = gασ gβε T σε γ (227)
T αβ γ = gβε g σγ T αε
σ (228)
Tα βγ = gασ T σβ
γ (229)
γ γη
Tαβ = gασ gβδ g T σβη (230)
Tα βγ = gασ g γη T σβη (231)
El isomorfismo inducido por el tensor métrico significa entonces, que podemos
considerar a todos los tensores de tercer rango cuyas componentes están rela-
cionadas por las ecuaciones anteriores, como diferentes representaciones del
mismo objeto abstracto T. En lo sucesivo se asumirá ésto para todos los ten-
sores. Es de anotar que en este caso se hace necesario respetar el orden de
los índices en las componentes de tensores tanto covariantes como contravari-
antes. Un caso particular de importancia lo constituye el tensor métrico g, en
donde las componentes covariantes gαβ , contravariantes g αβ , y mixtas δ αβ , rela-
cionadas por la ecuación 222 constituyen diferentes representaciones del mismo
objeto geométrico, el tensor T.
xlviii VARIEDADES

Definition 75 Definimos la signatura del tensor métrico g por:

sig.(g) = #de valores propios positivos menos


#de valores propios negativos

Si el campo tensorial g es no degenerado y continuo, entonces la signatura


del tensor métrico g es constante sobre toda la variedad. Siempre es posible
elegir una base adecuada {Eα } para el espacio tangente Tp M, de tal forma que
las componentes covariantes del tensor métrico tomen los valores ±1, i.e.

gαβ = g(Eα , Eβ ) = ηαβ (232)

en donde los elementos ηαβ están definidos por

η αβ = diag.(+1, +1, · · ·, +1, −1, −1, · · ·, −1)


| {z } | {z }
1 1
(n + s) (n + s)
2 2
en donde s = sig.(g), y n la dimensión de la variedad. Para el caso particular
de sig.(g) = n la métrica es definida positiva, y en este único caso el tensor
métrico define una métrica en sentido estricto. Otro caso de importancia en
física en la métrica con sig.(g) = 2 − n, es decir

gµν = diag.(+1, −1, −1, · · ·, −1) (233)

la cual se conoce con el nombre de métrica Lorentziana o Minkowskiana. Esta


métrica, para efectos de la física es equivalente a otra con signatura n − 2, pues
el único valor propio positivo, en el primer caso y negativo en el segundo, se
interpreta como la coordenada temporal.
En las presentes notas asumiremos la métrica con signatura 2 − n, y definire-
mos la estructura de conos de luz del espacio-tiempo de la siguiente forma:

Definition 76 Una métrica Lorentziana g sobre la variedad M divide a los


vectores no nulos de Tp M en tres clases disjuntas:
1- X ∈ Tp M se llama ”de tiempo” si g(X, X) > 0
2- X ∈ Tp M se llama ”de espacio” si g(X, X) < 0
3- X ∈ Tp M se llama ”de luz o nulo ” si g(X, X) = 0

Si la métrica es no degenerada y continua, los vectores nulos de Tp M forman


un doble cono (el cono de luz) el cual separa a los vectores de tiempo de los
vectores de espacio.

0.8.7 Relación entre conexión y métrica


Hasta en momento la conexión y la métrica son dos objetos definidos sobre
la variedad de manera independiente. Pero existe una relación entre ellos si
consideramos la conexión que deje invariante el producto punto entre vectores,
0.8. CÁLCULO EN VARIEDADES xlix

es decir, dada una métrica existe una única conexión libre de teorsión, definida
por la condición
∇g = 0 ⇐⇒ gαβ;γ = 0 (234)
y así, con esta condición el transporte paralelo de vectores preserva el producto
escalar definido por g. Para encontrar la forma explícita de la conexión consid-
eremos la forma explícita de la derivada covariante de un tensor, ecuación 179,
entonces
∂gαβ
0= − Γσγα g σβ − Γσγβ g ασ (235)
∂xγ
entonces, si definimos
Γσγα g σβ = Γβγα (236)
y rotamos siclícamente los índices βγα, y sumamos las dos primeras ecuaciones
y substraemos la tercera, y asumiendo que Γσγα = Γσαγ , obtenemos

∂gαβ ∂gαγ ∂gβγ


+ − = Γβγα + Γαγβ + Γγβα + Γαβγ − Γγαβ − Γβαγ
∂xγ ∂xβ ∂xα
= 2Γαβγ
= 2gασ Γσβγ (237)

y despejando los elementos de la conexión, llamados los símbolos de Christoffer


de segunda clase, obtenemos
½ ¾
1 ασ ∂gγσ ∂gβσ ∂gβγ
Γα
βγ = g + − (238)
2 ∂xβ ∂xγ ∂xα

Con esta conexión métrica el tensor de Riemann tiene las propiedades de


simetría adicionales

R(αβ)γδ = 0 ⇐⇒ Rαβγδ = −Rβαγδ (239)

Rαβγδ = Rγδαβ (240)


Estas relaciones implican que el tensor de Ricci es simétrico:

Rαβ = Rβα (241)

Problema: probar estas relaciones de simetría, y además mostrar que el


número de componentes independientes del tensor de Riemann es n2 (n2 −1)/12,
con n la dimensión de la variedad, y por tanto n(n + 1)/2 de estas componentes
pueden estar dadas en términos de las componentes independientes del tensor
de Ricci.
Para los siguientes casos particulares tenemos:
Si n = 1 entonces Rαβγδ = 0
Si n = 2 entonces Rαβγδ solo tiene una componente independiente, la cual
es proporcional al escalar curvatura R, definido por

R = g αβ Rαβ = Rβ β (242)
l VARIEDADES

Si n = 3 el tensor de Riemann tiene 6 componentes independientes y por lo


tanto las 6 componentes independientes del tensor de Ricci determina comple-
tamente al tensor de Riemann.
Si n = 4 el tensor de Riemann tiene 20 componentes independientes y el
tensor de Ricci tiene 10 componentes independientes.
Es de anotar que el tensor de Riemann contiene todas las propiedades ge-
ométricas de una variedad métrica.

0.8.8 Campos de Killing


Definition 77 Un difeomorfismo φ : M −→ M se llama una isometría si este
deja la métrica invariante, i.e., si la métrica transformada φ∗ g = g en todo
punto de M.

Esto implica, entonces, que la transformación

φ∗ : Tp M −→ Tφ(p) M

preserva el producto escalar:

g(X, Y) | p = φ∗ g(φ∗ X, φ∗ Y) |φ(p)


= g(φ∗ X, φ∗ Y) |φ(p) (243)

Ahora, si el grupo uniparamétrico de isomorfismos φt generado por un campo


vectorial K es un grupo de isometrias (es decir, si para cada t la transformación
φt es una isometría), entonces el campo vectorial K se denomina un campo
vectorial de Killing. Así, la derivada de Lie de la métrica con respecto al campo
vectorial K se anula,

1
LK g = lim (g − φt∗ g) = 0 (244)
t−→0 t
pues, g =φt∗ g por definición de isometría. Ahora, de la definición de derivada
de Lie
(LK g)αβ = 2K(α;β) (245)
Problema: demostrar esta relación. Por lo tanto, un campo vectorial de Killing
satisface la ecuación diferencial:

Kα;β + Kβ;α = 0 (246)

llamada ecuación diferencial de Killing.


Inversamente, si K es un campo vectorial que satisface la ecuación diferencial
de Killing, entonces
Z t
d
φt∗ g |p = g |p + (φ g) |p dt0
0 dt0 t∗
0.8. CÁLCULO EN VARIEDADES li

por el teorema fundamental del cálculo integral,


Z t
d
= g |p + (φ 0 ◦ φs∗ g)s=0 |p dt0
0 ds t ∗

puesto que φt es un grupo uniparámetrico de isomorfismos y así φt∗ ◦ φs∗ =


φs∗ ◦ φt∗ = φt+s∗ ,
Z tµ ¶
d
= g |p + φt0 ∗ ◦ φs∗ g |p dt0
0 ds s=0
Z t ³ ´
= g |p − φt0 ∗ LK g |φ−t |p dt0
0
= g |p

pues de la definición de derivada de Lie se obtiene que

d
(LX Y)α = − (φ Y)α (247)
dt t∗
por lo tanto

Theorem 78 K es un campo vectorial de Killing si y solo si satisface la ecuación


diferencial de Killing.

Una variedad en general, no tiene simetrias y así no admite campos vecto-


riales de Killing. Sin embargo, una variedad especial puede admitir r campos
vectoriales de Killing linealmente independientes Ki i = 1, 2, ..., r. Además se
puede mostrar que el conmutador de dos campos de Killing es de nuevo un
campo de Killing, i.e.,
[Ki , Kj ] = clij Kl (248)
Esto significa que el conjunto de campos vectoriales de Killing sobre una
variedad dada, forman un álgebra cerrada bajo el producto definido por el con-
mutador , la cual recibe el nombre del álgebra de Lie asociada a las simetrias
de la variedad. Las constantes clij se llaman constantes de estructura del corre-
spondiente grupo de Lie. Además, si n es la dimensión de la variedad, entonces
el número r de campos de Killing está acotado, i.e., 0 ≤ r ≤ 12 n(n + 1), así, el
grupo local de difeomorfismos generado por estos campos vectoriales de Killing
es un grupo de Lie de r parámetros, llamado el grupo de simetrias de la var-
iedad. Una variedad puede poseer otras simetrias, tales como la inversión en un
punto, o la reflexión en un plano, pero estas simetrias no están generadas por
un campo vectorial de Killing. La conexión de estas simetrias con la física está
en el teorema de Noether que establece que para cada simetría de la variedad,
generada por un campo vectorial de Killing existe una cantidad dinámica del
sistema que se conserva.
Una variedad que admite r = 12 n(n + 1) campos vectoriales de Killing, se
llama de simetría maximal.
lii VARIEDADES

Lemma 79 La variedad Lorentziana n-dimensional plana es de simetría maxi-


mal. Por variedad plana se quiere decir una variedad para la cual las conecciones
son nulas globalmente o equivalentemente el escalar de curvatura se anula en
toda la variedad R = 0.

Para demostrar este lema veamos en primer lugar que cada campo de Killing
dado K (si este existe) está determinado unívocamente por los valores de Kα |p
y Kα;β |p en cualquier punto p ∈ M. Para este fin, notemos que el conmutador
de las segundas derivadas covariantes del campo K están dadas por:
σ
Kα;β;γ − Kα;γ;β = −Rαβγ Kσ (249)
α
Ahora, de la relación R[βγδ] = 0 para el tensor de Riemann se tiene que,
como K satisface la ecuación de Killing, entonces
σ
Kα;β;γ = −Rαβγ Kσ (250)

Por lo tanto, dados Kα y Kα;β para algún punto p ∈ M, entonces por la


teoría de las ecuaciones diferenciales, conocemos K sobre la variedad. Entonces,
para el caso de una variedad plana esta ecuación se reduce a

∂ 2 Kα
=0 (251)
∂xβ ∂xγ
cuya solución general es de la forma

Kα (x) = aα + bαβ xβ (252)

con aα y bαβ son constantes de integración, con la condición bαβ = −bβα , lo


cual se sigue de la ecuación de Killing.
Así, tenemos 12 n(n − 1) constantes independientes bαβ más n constantes aα ,
lo cual conduce a un total de 12 n(n + 1) campos vectoriales de Killing indepen-
dientes, los cuales pueden ser escogidos de la siguiente manera: (µ índice de
componentes de vectores y j índice que numera los diferentes vectores)

Kµ(j) (x) = δ jµ ; µ, j = 1, 2, ..., n (253)

Kµ(ij) (x) = δ iµ xj − δ jµ xi ; µ, i, j = 1, 2, ..., n (254)


Los n vectores K(i) representan las translaciones y los 12 n(n − 1) vectores
(ij)
K representan rotaciones, lo cual dada la signatura Lorentziana de la métrica
contiene tanto transformaciones de Lorentz puras, como rotaciones espaciales
de los ejes.
Los postulados de la
relatividad general

En este caṕtulo daremos los postulados fundamentales sobre los cuales es-
tábasada la teoria general de la relatividad. En la primera parte mostraremos
como, el principio de equivalencia, conduce a una ”geometrización” de la fuerza
de gravedad, lo cual nos conducirá a la formulación de los postulados.

0.9 La ley de gravitación universal


La ley de gravitación universal establece que entre todo par de cuerpos en el
universo existe una interacción (fuerza atractiva), la cual solo depende de la
posición relativa de los cuerpos y de una propiedad intrínseca, llamada carga o
masa gravitacional, la cual satisface la tercera ley de Newton:

GmG G
1 m2
F1←2 = r̂ = −F2←1 (255)
r2
en donde mG G
1 y m2 son las masas gravitacionales, r1 y r2 los vectores posición
de los cuerpos, r = r2 − r1 , G una constante (la constante de gravitación uni-
versal G = 6.67259 × 10−11 m3 kg−1 s−2 ) y F1←2 es la fuerza que el cuerpo 2
ejerce sobre el 1. A partir de esta expresión, es claro que ésta no está en acuerdo
con los principios de la teoría especial de la relatividad, pues la ley de fuerza
es independiente del tiempo y por lo tanto describe una interacción instanta-
nea. Esta situación motivó a Einstein a buscar la forma relativista de la ley de
gravitación universal.
Esta ley de gravitación universal de Newton contiene dos postulados funda-
mentales, los cuales se constituirán en el punto de partida para la formulación
de la teoría general de la relatividad:
En primer lugar, esta interacción gravitacional es universal, es decir, todos
los objetos del universo tienen ”carga gravitacional” (compare la situación con
la carga eléctrica).
En segundo lugar, si consideramos la fuerza que un cuerpo dado, e.g. la
tierra con masa gravitacional MTG , sobre otros, con masa gravitacional mG , y
aplicamos la segunda ley de Newton para estudiar el movimiento de estas masas

liii
liv LOS POSTULADOS DE LA RELATIVIDAD GENERAL

en presencia de la primera, tenemos que

GMTG mG
r̂ = mI a (256)
r2
en donde mI denota la masa inercial del cuerpo con masa gravitacional mG ,
entonces la aceleración del cuerpo debido a MTG está dada por

GMTG mG mG
a= r̂ (257)
r2 mI
Si fijamos la masa de la tierra, la aceleración de cualquier otro cuerpo de-
pende solamente de la relación entre su masa gravitacional e inercial. Galileo
fue el primero en mostrar que la aceleración de un cuerpo cualquiera en un
punto dado sobre la superficie terrestre era independiente de su masa inercial,
este hecho, conocido como la ley de caida de los cuerpos de Galileo muestra,
por la ecuación anterior, que para todos los cuerpos la relación entre su masa
gravitacional y su masa inercial es independiente de la naturaleza (composición,
forma, etc) del cuerpo. Este principio adoptado por Newton, lo que explica
la introducción de la constante de gravitación universal, condujo a medir la
masa gravitacional en las mismas unidades que la inercial, aún cuando los dos
conceptos de masa son completamente independientes. Este principio, hoy cono-
cido como el ”Principio de Equivalencia Débil” (PED) implica entonces, que el
movimiento de cualquier cuerpo, independiente de su masa, es el mismo dadas
las mismas condiciones iniciales de posición y velocidad.
Otra forma de formular el PED es a través del famoso experimento imag-
inario (gedanken Experiment) del ascensor. Consideremos un ascensor y un
observador en su interior, y supongamos las siguientes dos situaciones: el ascen-
sor está en el espacio libre y es acelerado por alguna fuerza (motores) a 9.8m/s,
y el ascensor está en reposo sobre la superficie de la tierra. Entonces, debido a
la equivalencia entre masa inercial y gravitacional, dejando caer partículas en el
interior del ascensor no se puede determinar si éste se encuentra en reposo en
el campo gravitacional, o si está acelerado por una fuerza externa, asumiendo
que el escensor es lo suficientemente pequeño para que el campo gravitacional
en su interior sea uniforme.
Por otra parte, de acuerdo con la teoría especial de la relatividad, y en
particular, teniendo en cuenta la equivalencia entre masa y energía, Einstein
generalizó el PED y postuló que ningún experimento realizado dentro de la
caja podía determinar la diferencia entre un sistema uniformente acelerado y
un campo gravitacional uniforme. Este principio se conoce como el ”principio
de Equivalencia de Einstein” (PEE). Por ejemplo, consideremos un átomo de
hidrógeno, cuya masa es menor que la suma de las masas del electrón y el
protón que lo constituyen, pues este es un sistema ligado al cual hay que darle
energía para separar a las partículas que lo conforman y la relación entre su
masa inercial y gravitacional sigue siendo una constante. Así, de acuerdo con el
PEE el campo gravitacional se acopla de la misma manera con todas las formas
de energía y materia.
0.9. LA LEY DE GRAVITACIÓN UNIVERSAL lv

El PEE tiene consecuencias profundas sobre la estructura del espacio-tiempo.


En relatividad especial, al igual que en cualquier teoría física que no involucre
al campo gravitacional, se parte de la definición de sistema de referencia iner-
cial, considerando una partícula libre, la cual por definición, se encuentra no
acelerada. Entonces, con respecto a ella podemos definir el concepto de la clase
de sistemas de referencia inerciales, como aquellos para los cuales esta partícula
se encuentra en reposo o movimiento uniforme. La descripción matemática de
estos sistemas se hace a través de un sistema de reglas y relojes, calibrados ade-
cuadamente, los cuales se extiende a todo el espacio, y conducen a describir el
espacio-tiempo como una variedad 4-dimensional plana, es decir libre de con-
nección, y para la cual podemos elegir las coordenadas naturales, definidas por
(j)
las curvas integrales de los campos de Killing Kµ (x) = δ jµ ; µ, j = 1, 2, ..., n.
El punto de partida básico para la anterior construcción está en la suposición
de considerar la existencia de una partícula libre de fuerzas, con respecto a la
cual podemos definir el movimiento acelerado. Dado el caracter universal de
la gravedad, todas las formas de materia interactuan gravitacionalmente, no es
posible disponer de una part́cula ”gravitacionalmente neutra” con respecto a la
cual podamos definir la aceleración debida a la gravedad. Así, la ”aceleración
de la gravedad” no es un concepto que pueda ser definido independiente de la
materia y por lo tanto carece de significado experimental, y reemplazaremos el
concepto de movimiento libre (no acelerado) por el de sistema en ”caida libre”.
Así, siguiendo los pasos para construir un sistema de referencia inercial en
física no gravitacional, partimos de una partícula en caida libre, es decir, sobre
la cual no actuan fuerzas (electromagnéticas, débil, etc). Notemos en este punto
de la discusión, que estamos trabajando en el espíritu de Mach, en cuanto a que
ya no estamos haciendo referencia a una partícula libre de fuerzas (incluyendo
la gravitacional). Si asociamos a esta partícula en caida libre un sistema de
reglas rígidas y relojes calibrados de la manera usual, nos encontramos con
el problema, debido a la inhomogeneidad del campo gravitacional, que otra
partícula en caida libre no seguiría las líneas ”rectas” definidas por el sistema de
coordenadas canónicas asociadas al sistema de referencia de la primera partícula,
es decir partículas en caide libre en otras regiones del espacio aparecerian como
”aceleradas” con respecto a la primera.
El concepto de sistema de referencia inercial asociado a una partícula en
caida libre, solo tiene sentido para una región lo suficientemente pequeña en la
vecindad de la partícula. Notemos que este hecho corresponde, en el contexto
de las variedades, a la existencia en todo punto de la variedad, de un sistema
de coordenadas normales de Riemann, con respecto a las cuales se anulan las
componentes de la conexión en ese punto. Además ya no es posible comparar
velocidades, aceleraciones, etc. entre partículas localizadas en otras regiones,
pues los sistemas de referencia inerciales asociados a las diferentes partículas, son
independientes. Este hecho de no poder compara vectores en diferentes puntos
de la variedad, significa la dependencia del transporte paralelo de vectores, y
por lo tanto la dependencia de la curvatura de la variedad.
Aún cuando los argumentos anteriores, sobre el comportamiento de la fuerza
lvi LOS POSTULADOS DE LA RELATIVIDAD GENERAL

de la gravedad (PEE) y su relación intuitiva con las variedades, no es una


demostración de la necesidad de describir la gravitación a través de la geometría
del espacio-tiempo, estas consideraciones fueron suficientes para que Einstein
postulara la idea que la gravitación es una manifestación de la curvatura del
espacio-tiempo, y que esta curvatura sería determinada por todas las formas de
materia-energía.

0.10 Postulados de la TGR


Habiendo motivado la geometrización de la fuerza de la gravedad, pasaremos a
establecer los cuatro postulados fundamentales de la teoría general de la rela-
tividad.

Axiom 80 La variedad espacio-tiempo:


El espacio-tiempo lo constituyen todos los eventos físicos, el cual será de-
scrito por el par (M, g), donde M es una variedad suave (C ∞ ) 4-dimensional
conectada de Hausdorf y g es una métrica Lorentziana sobre M.

Sobre la variedad M están definidos todos los campos de materia que se


consideren, por ejemplo, el campo electromagnético, el campo de neutrinos,
etc., los cuales describen el contenido de materia en el espacio-tiempo.
Los campos de materia obedecen ecuaciones que se expresan como relaciones
entre tensores sobre M, en las cuales las derivadas con respecto a las coorde-
nadas son derivadas covariantes, con respecto a la conexión simétrica definida
por la métrica g.
Si denotamos los campos de materia incluidos en la teoría por Ψα...β (i) γ...δ (x),
donde el sibíndice i denota los diferentes campos de materia, entonces, los sigu-
ientes dos postulados sobre la naturaleza de los campos Ψα...β
(i) γ...δ son comunes a
la teoría especial y a la teoría general de la relatividad:

Axiom 81 Causalidad local:


Las ecuaciones que obedecen los campos de materia deben ser tales que, si
U ⊂ M es una vecindad convexa y p, q ∈ U, entonces, una señal puede ser
enviada en U entre p y q si y solamente si p y q pueden ser unidos por una
c1 − curva contenida en U, cuyo vector tangente en todas partes es diferente
de cero y es como de tiempo o como de luz (esta curva se llama no como de
espacio).

Otra forma equivalente de establecer espe postulado, y físicamente más sig-


nificativo, se puede dar en términos del problema de Cauchy para los campos
de materia: Sea p ∈ U tal que toda curva no como de espacio a través de p
intersepta la superficie como de espacio x0 = cte. dentro de U. Sea F el con-
junto de puntos en la hipersuperficie x0 = cte. los cuales pueden ser alcanzados
por curvas no como de espacio en U a través de p. Entonces, se exige que los
valores de los campos de materie en p deben estar unívocamente determinados
por los valores del campo y sus derivadas a un orden finito sobre F. Es decir, las
0.11. EL TENSOR MÉTRICO Y EL POSTULADO DE CAUSALIDAD lvii

ecuaciones de movimiento (ecuaciones diferenciales) que determinan los campos


(leyes de la física) involucran derivadas hasta un orden n finito (usualmente
hasta orden 2) tienen solución única, la cual está determina por las condiciones
de frontera, es decir, el valor de los campos y sus primeras n − 1 derivadas,
dadas sobre hipersuperficie interseptada por el cono de luz pasado del punto p.

Axiom 82 Conservación local de la energía:


Existe un tensor simétrico Tµν = Tµν (Ψi , ∇Ψi , ...) = Tνµ que es función de
los campos de materia y sus derivadas, hasta un orden finito, tal que:
i.- Tµν = 0 sobre U ⊂ M abierto, si y solo si Ψi = 0 para todo i sobre U.
ii.- T µν
;ν = 0

La primera condición expresa que todos los campos de materia contribuyen


a la energía. A partir de la segunda condición, si la variedad espacio-tiempo
admite un campo vectorial de Killing K entonces, obtenemos una ley de con-
servación, pues sea
pα = T αβ Kβ (258)
las componentes del vector P obtenido por contracción del tensor momentun-
energía con el campo de Killing, entonces

pα;α = T αβ
;α Kβ + T
αβ
Kβ;α = 0 (259)

pues T µν
;ν = 0 y K satisface la ecuación de Killing, i.e., K(α;β) = 0. Así, si D es
una región compacta y orientable, por el teorema de Gauss se tiene que
Z Z
pα dσ α pα;α dv = 0 (260)
∂D D

por lo tanto, este resultado se puede interpretar físicamente, pues el flujo de la


componente del tensor momentun-energía en la dirección del campo de Killing
sobre una superficie cerrada se anula, lo cual es la generalización del teorema
de Noether, el cual establece que a toda simetría le corresponde una ley de
conservación. En el caso particular de la variedad Lorentziana plana, asociado
a los diez vectores de Killing linealmente independientes están las diez leyes
de conservación usuales, para la energía, el momentun y el momentun angular
total.

0.11 El tensor métrico y el postulado de causal-


idad
Consideremos la ecuación de las geodésicas en alguna base coordenada

d2 xα β
α dx dx
γ
+ Γβγ =0 (261)
ds2 ds ds
en donde s es un parámetro afín. El paránetro afín de una curva geodésica está
determinado salvo un factor aditivo y uno multiplicativo constantes, es decir,
lviii LOS POSTULADOS DE LA RELATIVIDAD GENERAL

salvo una transformación de la forma s0 = as+b, con a, b constantes. La libertad


de escoger b corresponde a la libertad para elegir el punto inicial de la curva
λ(0), y el parámetro a corresponde a la libertad de normalizar el vector tangente
a la curva X por un factor de escala constante, X0 = a1 X.
Por otra parte, dada una cr −conexión, los teoremas de existencia y unici-
dad de las ecuaciones diferenciales ordinarias aplicados a la ecuación geodésica
muestran que para cualquier punto p ∈¡M¢y¯ Xp ∈ Tp M existe una geodésica
maximal λX (s) en M, con p = λ(0) y ∂s ∂ ¯ = Xp . Si r ≥ 1 la geodésica
λ s=0
es única y depende continuamente de los valores iniciales. Esta situación nos
permite definir la transformación exponencial
exp : Tp M −→ M
X 7−→ exp(X) := λX (1)

siendo λX (0) = p. Es decir, a cada vector X ∈Tp M se le asocia el punto


q ∈ M que está a una distancia paramétrica unidad del punto inicial a lo
largo de la única geodésica que se inicia en p y cuyo vector tangente es X.
Esta transformación exponencial no necesariamente está definida para todos los
vectores X ∈Tp M pues la geodésica no necesariamente está definida para todo
s. Entonces

Definition 83 Una geodésica λX (s) se llama completa si está definida para


todo s.

Definition 84 Una variedad se llama geodésicamente completa si todas las geo-


désicas sobre M son completas.

¡ ∂ ¢ ¯ exp está definida para todo X ∈Tp M. Séan


En este caso la transformación
X ∈Tp M y a ∈ R fijos con ∂s ¯ = X, entonces
λ s=0

λX [a, b] ⊆ R −→ M
s 7−→ λX (as)

tiene velocidad inicial


µ ¶ ¯ µ ¶ ¯
∂ ¯ d(as) ∂ ¯
¯ = ¯ = aX (262)
∂t ¯ ds ∂as ¯
λ t=0 λ s=0

así, λX (as) = λaX (s) y por lo tanto la transformación

exp(aX) = λaX (1) = λX (a) (263)

es decir, la transformación exp transforma rectas aX de Tp M en geodésicas


sobre M.
Si M es geodésicamente completo o no la transformación exp es de rango
n en p (n = dim M). Así, por el teorema de la función implícita existe una
vecindad abierta V0 del origen de Tp M y una vecindad abierta Vp del punto
p ∈ M tal que
exp : V0 ⊂ Tp M −→ Vp ⊂ M
0.11. EL TENSOR MÉTRICO Y EL POSTULADO DE CAUSALIDAD lix

es un C r −dif eomorf ismo de V0 sobre Vp . La vecindad Vp se llama una vecindad


normal de p. Además, podemos escoger Vp convexa, esto es, tal que todo punto
q ∈ Vp puede ser unido a cualquier otro punto r ∈ Vp por una única geodésica que
parte del punto q y que está totalmente contenida en Vp . En el interior de una
vecindad normal convexa V es posible escoger coordenadas (x1 , x2 , ..., xn ) con
origen en cualquier punto p ∈ V y tomando una base {Eα } de Tp M definimos
las coordenadas de un punto r ∈ V por la relación r = exp(xα Eα ), es decir,
se asigna al punto r las coordenadas del punto exp−1 r con respecto a la base
{Eα } de Tp M. Entonces, si Eα = ∂/∂xα |p de la ecuación de las geodésicas
¯
¯
se obtiene que Γα βγ ¯ = 0. Estas coordenadas se llaman coordenadas normales
p
centradas en el punto p. Este comportamiento de las geodésicas en una vecindad
normal no se da, en general, sobre toda la variedad, pues es posible que dados
dos puntos cualesquiera de M no se puedan unir por una geodésica, y por otra
parte, algunas de las geodésicas a través de un punto p ∈ M pueden converger
a un ”foco” en otro punto de M, por ejemplo las geodésicas sobre una 2-esfera
son círculos máximos los cuales convergen siempre al punto antípoda del cual
partieron.
Consideremos de nuevo el postulado de causalidad. Este postulado sitúa a
la métrica g a parte de los otros campos de materia sobre M, dado su carácter
geométrico especial. Si {xα } son coordenadas normales en una vecindad del
punto p ∈ U ⊂ M y con origen en p, entonces, los puntos en U que pueden
ser alcanzados a partir del punto p por curvas no como de espacio en U, son
aquellos cuyas coordenadas satisfacen
(x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 ≥ 0 (264)
El contorno de la región determinada por estos puntos está formado por la
imagen del cono de luz de p bajo la transformación exponencial, i.e., el conjunto
de geodésicas nulas a través de p. Así, observando cuales puntos de U ⊂ M
pueden comunicarse con p, se puede determinar el cono nulo Np en Tp M. Cono-
cido Np , la métrica en p se puede determinar salvo un factor conforme, en donde
Definition 85 Dos métricas g y g0 sobre M se llaman conformes, si
g0 = Ω2 (x)g (265)
en donde Ω2 (x) es una función suave y no nula, y por lo tanto
g(X, Y) g0 (X, Y)
= 0 (266)
g(Z, W) g (Z, W)

Para determinar la métrica a partir del cono nulo Np , sean X, Y ∈Tp M


vectores como de tiempo y como de espacio, respectivamente. Entonces, la
ecuación
g(X + λY, X + λY) = g(X, X) + 2λg(Y, Y) + λ2 g(X, Y) (267)
lx LOS POSTULADOS DE LA RELATIVIDAD GENERAL

tiene dos raices reales λ1 y λ2 , pues el discriminante es positivo,


2
(g(X, X)) − 4g(X, X)g(Y, Y) > 0 (268)

pues g(X, X) > 0 y g(Y, Y) < 0. Por lo tanto, si Np es conocido entonces λ1


y λ2 pueden ser determinados, y de estos valores podemos obtener la relación

g(X, X)
λ1 λ2 = (269)
g(Y, Y)

i.e., la razón de las magnitudes de un vector como de tiempo y uno como de


espacio pueden ser determinadas. Ahora si W, Z son dos vectores no nulos en
p, entonces
1
g(W, Z) = (g(W + Z, W + Z) − g(W, W)g(Z, Z)) (270)
2
y por lo tanto, cada una de las magnitudes del lado derecho de la ecuación ante-
rior pueden ser comparadas con las magnitudes de X o de Y y así podemos deter-
minar, por ejemplo, la razón g(W, Z)/g(X, X). Esto significa que la causalidad
local permite determinar la métrica, salvo un factor conforme. En la práctica
estas medidas se realizan usando el hecho que las señales electromagnéticas vi-
ajan sobre geodésicas nulas, un hecho que es consecuencia de las ecuaciones de
Maxwell y no de la teoría de la relatividad.
Para determinar el factor conforme se hace uso del segundo postulado, de-
jando así, todos los elementos de la teoría físicamente observables, pues podemos
comparar los factores conformes en diferentes puntos de la variedad espacio-
tiempo M. Esto se obtiene por el hecho que las ecuaciones de conservación

T αβ
;β = 0 (271)

pueden no cumplirse para una conexión derivada de otra métrica

g0 = Ω2 g (272)

Una forma práctica de determinar el factor conforme es observando pequeñas


partículas de prueba libres y determinando sus geodésicas como de tiempo.
Por ejemplo, consideremos un conjunto de sistemas idénticos (e.g. los estados
electrónicos internos de los átomos) cuyos cambios internos definen el conjunto
de eventos a lo largo de las líneas de universo de cada sistema. Si se aísla
cada sistema de los campos externos, entonces ellos siguen geodésicas como de
tiempo. Si γ(t) es una de las geodésicas con vector tangente (∂/∂t)γ entonces
podemos medir la longitud ³ de arco entre eventos
´ vecinos para cualquiera de estos
sistemas y determinar g (∂/∂t)γ , (∂/∂t)γ en cada punto del espacio-tiempo
y determinar así el factor conforme, salvo un factor multiplicatico constante el
cual lo define la escala.
Los postulados de causalidad y conservación no nos dicen como construir T αβ
para un conjunto de campos de materia dados. Sin embargo existe una manera
0.11. EL TENSOR MÉTRICO Y EL POSTULADO DE CAUSALIDAD lxi

única y bien definida de calcular el tensor momentun-energía, si las ecuaciones


de movimiento para los campos se derivan de una Lagrangiana, como es el caso
para los campos de materia usuales y de interés físico.
Sea L la densidad Lagrangiana, la cual es función de los campos de materia
Ψi , sus derivadas covariantes, hasta un orden finito y de la métrica. Entonces,
las ecuaciones de movimiento de los campos se obtienen a partir de la acción
Z
S = Ldv (273)

exigiendo que S sea estacionaria bajo variación de los campos en el interior de


una región compacta 4-dimensional D, i.e.,

δS = 0 (274)

Esta condición conduce a las ecuaciones de Euler-Lagrange


à !
∂L ∂L
− ¡ ¢ =0 (275)
∂Ψ(i) ∂ ∇Ψ(i)

El tensor momentun-energía se obtiene a partir de la densidad lagrangiana


L considerando las variaciones de la acción bajo cambios en la métrica:
2 δS
Tαβ = p (276)
|g(x)| δg αβ

Por ejemplo, un campo escalar φ(x), el cual representa partículas de escalares


de masa m, sin carga y espín cero, está descrito por la densidad Lagrangiana
1p © ª
L= |g(x)| g αβ φ;α φ;β − m2 φ2 (277)
2
en donde se han utilizado unidades de h/ = 1 y c = 1. Las ecuaciones de
Euler-Lagrange para este sistema, conducen a la ecuación de Klein-Gordon
¡ ¢
¤ + m2 φ = 0 (278)

en donde el D’alembertiano está dado por:

¤φ = g αβ φ;αβ (279)

y el tensor momentun-energía es:


1 ¡ ¢
Tαβ = φ;α φ;β − gαβ g γδ φ;γ φ;δ + m2 φ2 (280)
2
Otro ejemplo, de importancia en cosmología, es el de fluido perfecto. Un
fluido describe un sistema físico de muchas partículas (1023 que en este límite
se puede considerar como un sistema continuo) a través de las cantidades que
determinan el sistema, tales como la densidad, presión, temperatura, viscosidad,
lxii LOS POSTULADOS DE LA RELATIVIDAD GENERAL

etc. Aún cuando no hay una definición única de fluido perfecto, este se puede
definir como un sistema en el cual no hay conducción térmica ni viscosidad,
o como lo describe equivalentemente Wienberg, como un fluido tal que en sus
sistema en reposo es isotrópico. En estas condiciones un fluido perfecto es
descrito por la función densidad de energía y la densidad de presión.
Consideremos, en primer lugar, un gas de partículas en reposo relativo
(polvo), así este sistema es descrito como un gas ideal con presión cero. Para
un observador inercial todas las partículas se mueven con la misma velocidad,
y así con la misma cuadrivelocidad U α . Definamos, entonces, el cuadri-vector
flujo
N α = nU α (281)
en donde n es la densidad propia de partículas, i.e., la densidad de partículas
medida en el sistema en reposo. Ahora, si todas las partículas tienen la misma
masa en reposo m, la densidad de energía propia está dada por:

ρ = nmc2 (282)

La densidad de energía caracteriza completamente al fluido, pero la anterior


ecuación es solamente válida en el sistema en reposo del fluido, así para en-
contrar la expresión covariante de la densidad de energía (válida para cualquier
observador inercial), recordemos que mc2 es la componente temporal del cuadri-
vector momentun de una partícula en sus sistema en reposo, pα = (mc, 0, 0, 0) y
para este sistema N α = nU α = (nc, 0, 0, 0). Por lo tanto la densidad de energía
propia corresponde a la componente 00 del tensor p ⊗ N medida en su sistema
en reposo, así definimos el tensor momentun-energía para el gas de polvo como:
ρ α β
T αβ = pα N β = nmU α U β = U U (283)
c2
donde ρ es definida como la densidad de energía en el sistema en reposo. Para el
caso más general de un fluido perfecto con presión, asumiremos la definición de
Weinberg, como aquel que es isotrópico en su sistema en reposo. Esto significa
que T αβ es diagonal, es decir no hay flujo neto de momentun en la dirección
ortogonal. Además, sus componentes espaciales deben ser todas iguales, por
isotropía: T 11 = T 22 = T 33 . Si llamamos T 00 = ρ la densidad de energía, T ii =
p la densidad de presión, tenemos, que las componentes del tensor momentun-
energía, en el sistema en reposo están dadas por:
 
ρ 0 0 0
 0 p 0 0 
T αβ =   0 0 p 0 
 (284)
0 0 0 p

la cual, para un sistema de referencia inercial cualquiera, se puede escribir en la


forma (con c = 1):
T αβ = (p + ρ)U α U β + pη αβ (285)
en donde ηαβ es el tensor métrico de Minkowski.
0.12. ECUACIONES DE CAMPO DE EINSTEIN lxiii

La generalización para una variedad con métrica g es directa,

T αβ = (p + ρ)U α U β + pg αβ (286)

El tipo de materia específico que se considere, está determinado por la


ecuación de estado del sistema, es decir f (p, ρ) = 0, una función que relaciona
la densidad de energía y materia, por ejemplo, para un gas de polvo la ecuación
de estado es p = 0.
Este tensor momentun-energía se puede encontrar a partir de una densidad
Lagrangiana. Siguiendo la definición de Weinberg, sea U el campo de cuadriv-
elocidades y definamos la cuadri-corriente por J = µU, con µ la densidad de
α
partículas. La ecuación de continuidad exige que J;α = 0, y la densidad La-
grangiana está dada por:
L = −2µ(1 + ε) (287)
donde ε = ε(µ) es el potencial elástico. La acción S es estacionaria cuando
las líneas de flujo se varían, ajustando J para mantener la corriente conser-
vada. Entonces la ecuaciones de Euler-Lagrange conducen a las ecuaciones de
movimiento para el fluido:
ρ;α U α + (ρ + p)U;α
α
=0
(288)
(ρ + p)U̇ = −p;β (g + U β U α
α αβ

donde ρ = µ(1 + ε) es la densidad de energía, y p = µ2 dε/dµ la densidad


de presión, y U̇ α = U;β
α β
U . Así, la aceleración de las líneas de flujo U̇ α es
proporcional al gradiente de presión ortogonal a las líneas de flujo. A partir de
la densidad Lagrangiana obtenemos el tensor momentun-energía.

0.12 Ecuaciones de campo de Einstein


Hasta el presente la métrica g no ha sido especificada. En la teoría especial
de la relatividad, la cual no incluye los efectos gravitacionales, la métrica es
plana, i.e., g = η. En la discusión al comienzo del capítulo, vimos como la
fuerza de la gravedad, por su caracter universal, debe ser excluida como un
campo de fuerzas en un espacio plano, si queremos mantener la idea que una
partícula libre sigue ” líneas rectas” o que la velocidad de la luz en el vacío
es constante. Para mantener el principio de relatividad, es decir, la física es
la misma para todos los observadores, o equivalentemente, las leyes de la física
deben ser independientes del sistema de coordenadas, las ecuaciones de campo
para determinar la métrica deben ser relaciones tensoriales, que involucran a la
materia a través del tensor momentun-energía, si queremos mantener el principio
de equivalencia, es decir, si dos campos de materia contribuyen con la misma
densidad de energía a un sistema entonces las ecuaciones de campo para la
métrica deben conducir al mismo resultado. Por el lado de la geometría, como
Hilbert se lo sugirió a Einstein, el único obgeto geométrico, salvo identidades o
multiplos, el cual está determinado por el tensor métrico y primeras derivadas
de sus componentes, es el tensor de Riemann, o tensores derivados de ellos, y
lxiv LOS POSTULADOS DE LA RELATIVIDAD GENERAL

por lo tanto la única posibilidad, es una combinación lineal del tensor de Ricci,
el escalar curvatura y una constante, proporcional al tensor momentun-energía,
dadas las condiciones que sobre él se imponen, que sea simétrico y que satisfaga
el principio de conservación local, asi

Axiom 86 La métrica sobre la variedad espacio-tiempo (M, g) está determi-


nada por las ecuaciones de campo de Einstein

1 8πG
Rαβ − Rgαβ + Λgαβ = − 2 Tαβ (289)
2 c
G =constante de gravitación universal.
Λ = constante cosmológica

Este es un sistema de 10 ecuaciones diferenciales acopladas no lineales para


la métrica y sus primeras derivadas. Sin embargo, dado que la divergencia
covariante de cada lado de las ecuaciones se satisface independientemente
µ ¶
1 8πG
Rαβ − Rg αβ + Λg αβ = 0 = 2 T αβ ;α (290)
2 ;α c

entonces el número de ecuaciones independientes se reduce a seis. Este es el


número correcto de ecuaciones, pues de las diez componentes independientes
del tensor métrico, cuatro de ellas se pueden elegir arbitrariamente, pues cor-
responde al hecho que las componentes del tensor métrico son únicas, salvo
una transformación de coordenadas. Así, las ecuaciones de campo de Einstein
determinan el tensor métrico, salvo la clase de equivalencia de difeomorfismos

Θ : (M, g1 ) −→ (M, g2 )

en donde dos métricas definen el mismo espacio-tiempo si entre las variedades


(M, g1 ) y (M, g2 ) existe un difeomorfismo.
Para establecer la relación entre las ecuaciones de campo de Einstein y la
teoría de la gravitación universal de Newton, consideremos una partícula de
prueba que se mueve lentamente (comparado con la velocidad de la luz) en un
campo gravitacional débil. Si el campo es débil la métrica se puede escribir en
la forma (c = 1)
gαβ = η αβ + hαβ ; |hαβ | << 1 (291)
Si U α son las componentes de la cuadri-velocidad de la partícula, entonces

dx0 dxi
≈ 1; << 1 (292)
dτ dτ
y de la ecuación de las geodésicas tenemos

d2 xi d2 xi α
i dx dx
β
≈ = −Γαβ ≈ −Γi00 (293)
dt2 d2 τ dτ dτ
0.12. ECUACIONES DE CAMPO DE EINSTEIN lxv

Ahora, el coeficiente de la conexión estádado por


1
Γi00 = h00,i − h0i,0 (294)
2
en donde la coma significa la derivada usual. Si el campo gravitacional es
estacionario h0i,0 = 0, y con la notación x = (x1 , x2 , x3 ), se obtiene

d2 x 1
2
= − ∇h00 (295)
dt 2
que al compararla con la ecuación de Newton

d2 x
= −∇φ (296)
dt2
tenemos que
h00 = 2φ + cte. (297)
Puesto que el potencial gravitacional φ y h00 se anulan para grandes distancias,
y reintroduciendo la velocidad de la luz, obtenemos

g00 = 1 + (298)
c2
El término 2φ/c2 determina cuando una región del espacio-tiempo es fuerte-
mente curvada, por ejemplo

2φ/c2 Sobre la superf icie


10−9 tierra
10−6 sol
10−4 enana blanca
10−1 estrella neutrónica
10−39 protón
lxvi LOS POSTULADOS DE LA RELATIVIDAD GENERAL
La solución de
Schwarzschild

Karl Scharzschild, tan solo dos meses después de haberse publicado las ecua-
ciones de campo, encontró la primera solución analítica de las ecuaciones de
campo, para el exterior de una distribución de materia estática y esféricamente
simétrica. A partir de esta solución calculó el corrimiento del perihelio de mer-
curio y la desviación de un rayo de luz que pasa cerca al sol, confirmando los
resultados previos obtenidos por Einstein en la aproximación post-Newtoniana
(aproximación de campo débil).

0.13 Métrica para simetría esférica


Consideremos una distridución esférica de masa m y busquemos una solución
de las ecuaciones de campo de Einstein que describa la métrica en el exterior de
la distribución, es decir, estamos buscando las componentes del tensor métrico

g = gµν dxµ ⊗ dxν (299)

tal que g satisfaga las ecuaciones de Einstein en el vacío


1
Rαβ − Rgαβ = 0 (300)
2
en donde los índices griegos recorren de 0 a 3, esto es xµ = (x0 , x1 , x2 , x3 ), y
x0 = ct.
La solución a este problema debe satisfacer las siguientes condiciones:

1. Estática
2. Esféricamente simétrica
3. Asintóticamente (lejos de la distribución) se debe reducir a la métrica
Minkowskiana

Dada la simetría esférica del problema es útil trabajar en coordenadas es-


paciales esféricas (r, θ, ϕ), eligiendo el origen de las coordenadas en el centro de

lxvii
lxviii LA SOLUCIÓN DE SCHWARZSCHILD

la distribución de masa. La primera condición, métrica estática, significa que


si g es independiente del tiempo, entonces las componentes del tensor métrico
deben ser invariantes si hacemos la transformació x0 → −x0 , lo que implica
que las componentes del tensor métrico de la forma g0i con i = 1, 2, 3 no deben
aparecer. Así el tensor métrico que estamos buscando debe ser de la forma

g = g00 dx0 ⊗ dx0 + gij dxi ⊗ dxj i, j = 1, 2, 3 (301)

Introduciendo en forma explícita las coordenadas esféricas y la coordenada


temporal x0 = ct, y debido a la simetría esférica del problema, en el tensor
métrico no deben aparecer términos espaciales de la forma dr ⊗ dθ, dr ⊗ dϕ y
dθ ⊗ dϕ, y por lo tanto el tensor métrico toma la forma

g = g00 c2 dt ⊗ dt + grr dr ⊗ dr + gθθ r2 dθ ⊗ dθ + gϕϕ r2 sin2 θdϕ ⊗ dϕ (302)

en donde los coeficientes métricos g00 , grr , gθθ y gϕϕ son funciones solamente de
la coordenada radial r. Veamos que las componentes métricas gθθ y gϕϕ deben
ser iguales. Pues supongamos que hacemos un desplazamiento infinitesimal δθ
con = rδθ a partir del polo norte (θ = 0) con t, r y ϕ constantes, entonces

ds2 = gθθ 2
(303)

Si realizamos ahora el mismo desplazamiento pero en el plano ecuatorial


(θ = π/2) con idéntico r, = rdϕ entonces

ds2 = gϕϕ 2
(304)

y por lo tanto, dada la simetría esférica de la distribución de materia se debe


tener que gθθ = gϕϕ . Sea

dΩ2 = dθ ⊗ dθ + sin2 θdϕ ⊗ dϕ (305)

entonces el tensor métrico toma la forma

g = g00 c2 dt ⊗ dt + grr dr ⊗ dr + gθθ r2 dΩ2


= g00 c2 dt2 + grr dr2 + gθθ r2 dΩ2 (306)

lo cual significa que nos queda por determinar solamente tres funciones de r:
g00 (r), grr (r) y gθθ (r). Esta expresión se puede simplificar aún más y reducir el
problema solamente a dos funciones desconocidas, pues si realizamos el cambio
de variable p
r −→ r̃ = −gθθ (r)r (307)
entonces

−gθθ r2 = r̃2 =⇒
2 dgθθ
2r̃dr̃ = −r dr − 2gθθ rdr =⇒
dr
µ ¶−1
r̃ r dgθθ
dr = − 1+ dr̃ (308)
gθθ r 2gθθ dr
0.13. MÉTRICA PARA SIMETRÍA ESFÉRICA lxix

Así
µ ¶−2
2 grr r dgθθ
grr dr = − 1+ dr̃2
gθθ 2gθθ dr
= g̃rr (r̃) dr̃2 (309)

Remmplazando las ecuaciones de transformación anteriores en el tensor


métrico 306 tenemos

g = g00 c2 dt2 − g̃rr (r̃) dr̃2 − r̃2 dΩ2


= g00 c2 dt2 − grr dr2 − r2 dΩ2 (310)

en donde hemos redefinido r̃ −→ r y g̃rr → grr en la última igualdad, para


regresar a la notación usual de la variable radial. De esta forma el problema
se ha redusido a solo dos funciones, las cuales se determinan a partir de las
ecuaciones de campo de Einstein y las condiciones de frontera adecuadas. Dada
la signatura de la métrica, g00 > 0 y grr < 0, podemos reescribir el tensor
métrico en la siguiente forma

g = eh(r) c2 dt2 − eg(r) dr2 − r2 dΩ2 (311)

Las nuevas funciones a determinar, h(r) y g(r) deben satisfacer la condición


asintótica

lim h(r) = 0
r→∞
lim g(r) = 0 (312)
r→∞

para obtener el límite Minkowskiano de la condición 3. Las componentes del


tensor métrico deben satisfacer las ecuaciones de campo de Einstein en el vacío
300. Antes de reemplazar los coeficientes métricos en este sistema de ecuaciones,
veamos un teorema que nos permite simplicar los cálculos:

Theorem 87 Las ecuaciones de campo de Einstein en el vacío sin constante


cosmológica son equivalentes a la anulación de de las componentes del tensor de
Ricci, i.e.
1
Rαβ − Rgαβ = 0 ⇐⇒ Rαβ = 0 (313)
2
Proof. (⇐=) Si Rαβ = 0 entonces R = 0
(=⇒) Si Rαβ − 12 Rgαβ = 0 subiendo el primer índice covariante y con-
trayendo tenemos 0 = Rαα − 12 g αα R = R − 2R = 0 entonces R = 0 y por lo tanto
Rαβ = 0

A partir de las condiciones de simetría del problema pudimos determinar la


forma general y más simple del tensor métrico, antes de entrar en el problema
de resolver las ecuaciones de campo, lo cual constituye un método usual de
trabajo en física. Sin embargo, aun con esta métrica simplificada es necesario
lxx LA SOLUCIÓN DE SCHWARZSCHILD

calcular 40 símbolos de Christoffel que aparecen en las ecuaciones de campo. Un


método ágil que nos permite calcular las componentes no nulas de los símbolos de
Christoffel, lo constituye el método variacional (ecuaciones de Euler-Lagrange)
para la ecuación de las geodésicas:
d2 xα dxβ dxγ
2
+ Γαβγ =0 (314)
dt dt dt
las cuales contienen todos los símbolos de Christoffel y pueden ser obtenidas a
partir del principio variacional
Z
0 = δ F ds
Z
dxα dxβ
= δ gαβ ds (315)
ds ds
con las ecuaciones de Euler-Lagrange
µ ¶
d ∂F ∂F dxµ
µ
= ; ẋµ = (316)
ds ∂ ẋ ∂xµ ds
Así, para la métrica de Schwarzschild el elemento de distancia espacio-tiempo
está dado por
¡ ¢2 ¡ ¢2 ¡ ¢2 ¡ ¢2
F = eh(r) ẋ0 − eg(r) ẋ1 − r2 ẋ2 − r2 sin2 θ ẋ3 (317)
en donde x0 = ct, x1 = r, x2 = θ y x3 = ϕ.
Consideremos en primer lugar la ecuación de Euler-Lagrange para la coor-
denada temporal x0 , y denotemos las derivadas con respecto a la coordenada
radial por primas, así
d ³ h(r) 0 ´
2e ẋ = 0 =⇒
ds
0 1 0
ẍ + h´(r)ẋ ẋ = 0 (318)
La ecuación de las geodésicas correpondiente la obtenemos a partir de la
ecuación 314 para α = 0,
d2 x0 dxβ dxγ
0 = 2
+ Γ0βγ
dt dt dt
= ẍ0 + Γ000 ẋ0 ẋ0 + Γ001 ẋ0 ẋ1 + · · · + Γ033 ẋ3 ẋ3 (319)
Entonces, comparando las dos últimas ecuaciones, tenemos que los únicos
símbolos de Christoffel no nulos son:
1
Γ010 = Γ001 = h´(r) (320)
2
Para la coordenada r la ecuación de Euler-lagrange está dada por:
d ³ ´ ¡ ¢2
−2eg(r) ẋ1 = −2g´(r)eg(r) ẋ1 − 2eg(r) ẍ1
ds
¡ ¢2 ¡ ¢2 ¡ ¢2 ¡ 3 ¢2
= h´(r)eh(r) ẋ0 − g´(r)eg(r) ẋ1 − 2r ẋ2 − 2r sin2 θ (321)

0.13. MÉTRICA PARA SIMETRÍA ESFÉRICA lxxi

mientras que la ecuación geodésica, para α = 1 es

d2 x1 dxβ dxγ
0 = 2
+ Γ1βγ
dt dt dt
= ẍ1 + Γ100 ẋ0 ẋ0 + Γ101 ẋ0 ẋ1 + · · · + Γ133 ẋ3 ẋ3 (322)

y comparándolas, los símbolos de Christoffel no nulos están dados por:


1
Γ100 = h´(r)eh(r)−g(r)
2
1
Γ111 = − g´(r)
2
Γ122 = −re−g(r)
Γ133 = −re−g(r) sin2 θ (323)

Procediendo de forma similar para las coordenadas θ y ϕ los símbolos no


nulos que se obtienen son:
1
Γ212 = Γ221 =
r
Γ233 = − sin θ cos ϕ
1
Γ313 = Γ331 =
r
Γ323 = Γ332 = cot θ (324)

Reemplazando los simbolos de Chritoffel obtenidos en las ecuaciones de


campo en el vacío:
σ
0 = Rβδ = Rβσδ
∂Γσδβ ∂Γσσβ
= − + Γσσµ Γµδβ − Γσµδ Γµσβ (325)
∂xσ ∂xδ
obtenemos
Rβδ ≡ 0 si β 6= δ (326)
y de los términos diagonales Rββ = 0, se llega al siguiente sistema de ecuaciones
diferenciales acopladas:
1 1 2
h´+ h´2 − h´g´+ h´= 0 (327)
2 2 r
1 1 2
h´+ h´2 − h´g´− g´= 0 (328)
2 2 r
µ ¶
¡ −g ¢ −g −g h´+ g´ 2
re ´− 2e − 1 + re + =0 (329)
2 r
¡¡ ¢ ¢
sin2 θ re−g ´− 1 = 0 (330)
lxxii LA SOLUCIÓN DE SCHWARZSCHILD

Restando las ecuaciones 327 y 328 obtenemos

h´+ g´= 0 (331)

entonces
h + g = cte. (332)
y de la condición asintótica tenemos

h+g =0 (333)

Con esta condición la ecuación 328 toma la forma


2
g´− g´2 + g´= 0 (334)
r
Esta ecuación diferencial de segundo orden se puede escribir como:
¡ −g ¢
re ´= 0 (335)

la cual admite una primera integral


¡ −g ¢
re ´= K1 (336)

Antes de integrar esta ecuación, veamos que las otras dos ecuaciones diferen-
ciales 329 y 330 son consistentes con lo encontrado hasta ahora. De la ecuación
329 tenemos
µ ¶
¡ −g ¢ 0 2
re ´− 2e−g − 1 + re−g + = 0 =⇒
2 r
¡ −g ¢
re ´− 2e−g − 1 + 2e−g = 0 =⇒
¡ −g ¢
re ´ = 1 (337)

lo que implica que la constante de integración K1 = 1. La ecuación 330 no da


información adicional pues se satisface idénticamente debido a la última relación
encontrada, ecuación 337. Integrando la ecuación 337 obtenemos
K2
e−g(r) = eh(r) = 1 − (338)
r
en donde K2 es una constante de integración. Así la métrica de Schwarzschild
toma la forma
µ ¶ µ ¶−1
K2 ¡ 0 ¢2 K2
g = 1− dx − 1− dr2 − r2 dΩ2 (339)
r r

Notemos que hasta el presente, en la deducción de la métrica de Schwarz-


schild solo se ha utilizado la simetría de la distribución de materia y el caracter
asintótico, pero no la masa total de la distribución ni su radio. Es de esperar que
la constante de integración K2 involucre, de alguna manera, esta información
0.13. MÉTRICA PARA SIMETRÍA ESFÉRICA lxxiii

que caracteriza a la distribución de materia que produce el campo gravitacional


en su exterior. Para calcular esta constante podemos utilizar el siguiente razon-
amiento: La solución de Schwarzschild es válida para el exterior de cualquier
distribución esférica de materia, y por lo tanto debe describir el campo gravita-
cional de cualquier cuerpo celeste usual conocido, tal como el sol o la tierra, y se
espera que esta métrica represente los fenómenos que conocemos, y en particular
esperamos que en el límite de bajas velocidades y campos gravitacionales débiles
los resultados obtenidos se aproximen a los encontrados por la ley de gravitación
universal de Newton. Así podemos trabajar la aproximación postnewtoniana,
vista en el capítulo anterior, y utilizar la ecuación 298 que nos relaciona el po-
tencial gravitacional Newtoniano con la componente g00 del tensor métrico. Por
lo tanto, dado que el potencial gravitacional Newtoniano en el esterior de una
distribución esférica de masa m está dado por
Gm
φ(r) = − (340)
r
y la componente para la métrica de Schwarzschild, ecuación 339, es
K2
g00 = 1 − (341)
r
entonces

g00 = 1+ =⇒
c2
K2 2Gm
1− = 1− =⇒
r rc2
2Gm
K2 = (342)
c2
De esta manera la métrica de Schwarzschild está dada por
µ ¶ µ ¶−1
2Gm ¡ 0 ¢2 2Gm
g = 1− 2 dx − 1− 2 dr2 − r2 dΩ2 (343)
c r c r
El método que utilizamos para calcular la constante de integración K2 , aun
cuando conduce al resultado correcto, deja la pregunta abierta de la inter-
pretación física de la masa como fuente del campo, a través del tensor momentun-
energía. Para este fin es necesario desarrollar el concepto de las leyes de con-
servación para el campo gravitacional. Este campo de trabajo está abierto a
investigación y dejaremos para un capítulo posterior su formulación.

0.13.1 Teorema de Birkhoff


En este punto es importante enfatizar que el radio de la distribución no debe
aparecer en forma explícita en la solución, debido a la simetría esférica del prob-
lema. Es decir, la solución de Schwarzschild obtenida es válida solo para r > R,
donde R es el radio de la distribución, y de manera similar a la situación que se
lxxiv LA SOLUCIÓN DE SCHWARZSCHILD

presenta en electrostática, el campo eléctrico en el exterior de una distribución


esférica de carga, para puntos exteriores, se comporta como el campo de una
carga puntual, es decir como si toda la carga estuviera concentrada en el centro
y la solución no involucra, en forma explícita, el radio de la distribución. Esta
situación la podemos ver mejor en el siguiente resultado debido a Birkhoff, el cual
establece que la solución para el exterior de una distribución de masa esférica
es la de Schwarzschilod, independientemente que esta distribución esté variando
radialmente, es decir si la distribución esta colapsando o expandiéndose. Para
ver esto, consideremos una situación en la cual la distribución esférica de masa
total m está variando su radio en el tiempo, i.e., R = R(t), y busquemos una
solución de las ecuaciones de campo de Einstein para el exterior de esta dis-
tribución, es decir en en vacío. Dado que los elementos de simetría utilizados
para construir la forma general de la solución buscada, ecuación 311, no se ven
afectados por el comportamiento del radio de la distribución, podemos asumir
que la métrica buscada tiene la forma general
g = eh(r,t) c2 dt2 − eg(r,t) dr2 − r2 dΩ2 (344)
pero ahora las funciones h(r, t) y g(r, t), deben depender del tiempo. Si pro-
cedemos como antes, es decir, si introducimos esta métrica en las ecuaciones de
campo, obtenemos una relación similar a la ecuación 331
h´+ g´= 0 (345)
en donde la prima significa derivada respecto a la coordenada r, entonces inte-
grando
h + g = cte(t) = λ (t) . (346)
en donde ahora la constante de integración puede depender del tiempo. Así,
continuando con este procedimiento obtenemos finalmente
µ ¶ µ ¶−1
λ(t) 2Gm ¡ 0 ¢2 2Gm
g=e 1− 2 dx − 1− 2 dr2 − r2 dΩ2 (347)
c r c r
Si redefinimos la coordenada temporal como
Z
t̃ = eλ(t) dt (348)

entonces la métrica toma la forma de Schwarzschlid, es decir la métrica en el


exterior de la distribución solo depende de la masa total, y no del radio de la
distribución, así este radio sea o no una función del tiempo.
Este importante resultado significa que la solución de Schwarzschild obtenida,
es la única solución que representa la métrica en el vacío producida por cualquier
distribución de materia con simetría esférica.

0.13.2 Características de la solución de Schwarzschild


La métrica de Schwarzschild representa la solución a las ecuaciones de campo
de Einstein para el exterior de una distribución esférica de materia, y por esta
0.13. MÉTRICA PARA SIMETRÍA ESFÉRICA lxxv

razón es válida para r > R, en donde R es el radio de la distribución. Sin


embargo en la expresión para la métrica, ecuación 343, aparece una singularidad
¡ ¢2
coordenada, en el sentido que el coeficiente de dx0 se anula y el coeficiente
de dr2 diverge a +∞, cuando r −→ 2Gm/c2 por la derecha. A este valor de la
coordenada radial, denotado por rs , se le conoce como el radio de Schwarzschild
de la distribución
2Gm
rs = 2 (349)
c
el cual solo depende de la masa total y por lo tanto es un parámetro que car-
acteriza la distribución, independientemente del radio R. Si calculamos el valor
de este parámetro para un cuerpo como la tierra tenemos

2 × 6.67259 × 10−11 m3 kg−1 s−2 × 5.9742 × 1024 kg


rs = 2
(2.99792458 × 108 m s−1 )
= 8. 870 8 × 10−3 m (350)

es decir, del orden de 9 milímetros, que en comparación con el radio de la tierra


RT = 6.5 × 106 m es despreciable. Esto muestra por qué esta singularidad
no es relevante para los objetos celestes usuales. De hecho Schwarzschild notó
este problema que surgía en su solución y calculó de nuevo la métrica para
una distribución de masa con una densidad de energía constante y obtuvo que
el radio de la distribución debería ser mayor a 9rs /8, resultado que lo dejó
satisfecho pues aún en este caso la singularidad no jugaba papel alguno. En
1923 Birkhoff mostró que una solución esféricamente simétrica de las ecuaciones
de campo en el vacío era necesariamente estática para r > rs , y por lo tanto
la solución para cualquier distribución esférica de masa no estática era la de
Schwarzschild si r > rs , y por lo tanto el argumento que utilizó Schwarzschild
no es válido. Sin embargo dado que rs es muy pequeño no se esperaba encontrar
una distribución de materia en donde el radio de la distribución R fuera menor
que rs . Pues, por ejemplo esto implicaba que un cuerpo como la tierra tuviera
una densidad del orden de
3 × 5.9742 × 1024 kg
ρ = 3
4π (8. 870 8 × 10−3 m)
2. 0 × 1030
= kg (351)
m3
lo cual no se veía factible para la materia ordinaria que se conocía.
Un resultado conocido de la ley de gravitación universal de Newton, debido
al comportamiento de la fuerza gravitacional con el inverso del cuadrado de
la distancia, es el hecho de que la fuerza sobre una masa en el interior de un
cascarón esférico de materia se anula. Para ver que sucede en el caso de la
relatividad general, consideremos una distribución esférica de materia de radio
R, con un hueco interior concéntrico de radio a < R, entonces busquemos una
solución de las ecuaciones de campo en el interior de esta cavidad. Es claro que
por simetría, podemos seguir el mismo procedimiento que vimos para encontrar
lxxvi LA SOLUCIÓN DE SCHWARZSCHILD

la solución de Schwarzschild, y podemos proponer llevar los mismos argumentos


hasta plantear la forma general de la solución como

g = eh(r) c2 dt2 − eg(r) dr2 − r2 dΩ2 (352)

La primera diferencia que surge con respecto a la solución de Schwarzschild


es en la condición asintótica, la cual ya no es más aplicable en el presente caso
y por lo tanto en la ecuación 332,

h + g = k̃ = cte. (353)

la constante k̃ ya no es cero. Así, continuando con el procedimiento encontramos


(ecuación 338)
K2
e−g(r) = e−k̃ eh(r) = 1 − (354)
r
Para encontrar la solución en el interior del cascarón esférico podemos com-
parar la solución encontrada en la aproximación post-Newtoniana con el poten-
cial clásico, teniendo en cuenta que el potencial gravitacional Newtoniano en el
interior del cascarón es constante (i.e., la fuerza es cero sobre la partícula de
prueba), entonces


g00 = 1 + 2 = cte. =⇒
µc ¶
K2
g00 = ek̃ 1 − (355)
r

lo que implica que K2 = 0, y por lo tanto la métrica toma la forma

g = ek̃ c2 dt2 − dr2 − r2 dΩ2 (356)

la cual, salvo un factor de escala temporal que depende del potencial constante
en el interior del cascarón, se reduce a la métrica Minkowskiana. Este resultado
representa la versión relativista de la anulación de la fuerza gravitacional en el
interior de un cascarón esférico de materia. Esta situación se puede entender
como una consecuencia del comportamiento con el inverso al cuadrado de la
distancia de la fuerza de gravitación universal. Este resultado justifica ciertas
consideraciones Newtonianas que se hacen en cosmología.

0.14 Pruebas clásicas de la relatividad general


En esta sección analizaremos el movimiento de partículas materiales de prueba y
de rayos de luz (fotones) en el campo de una distribución esférica de masa, con-
centrándonos en dos efctos particulares: el corrimiento del perihelio del planeta
Mercurio y la desviación de un rayo de luz que pasa muy cerca de la superficie
solar. Estos resultados se han constituido como los paradigmas históricos de las
pruebas observacionales de la teoría general de la relatividad.
0.14. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL lxxvii

0.14.1 Corrimiento del perihelio de Mercurio


Consideremos en primer lugar el cálculo de las geodésicas como de tiempo para
la métrica de Schwarzschild, las cuales describen las trayectorias seguidas por
partículas materiales (i.e., de masa propia diferente de cero). Estas geodésicas
se pueden deducir a partir del elemento de línea por el principio variacional 315,
en donde
³ rs ´ ¡ 0 ¢2 ³ rs ´−1 ¡ 1 ¢2 ¡ ¢2 ¡ ¢2
F = 1− ẋ − 1− ẋ − r2 ẋ2 − r2 sin2 θ ẋ3 (357)
r r
¡ ¢
en donde x0 , x1 , x2 , x3 = (ct, r, θ, ϕ), y ẋµ = dxµ /ds. Entonces las ecuaciones
de Euler-Lagrange están dadas por (µ = 0, 1, 2, 3):
µ ¶
d ∂F ∂F
= (358)
ds ∂ ẋµ ∂xµ

Consideremos primero la ecuación para la coordenada x2 = θ, entonces


d ³ 2 ´
r θ̇ = r2 sin θ cos θϕ̇2 (359)
ds
y por lo tanto, si las condiciones iniciales del movimiento son tales que θ (0) =
π/2 y θ̇ (0) = 0 entonces θ (t) = π/2, es decir, si el cuerpo se está moviendo
inicialmente en el plano ecuatorial θ = π/2 con θ̇ (0) = 0 entoces el movimiento
continua siempre en este plano. Por esta razón siempre podemos elegir los ejes
coordenados espaciales con el eje z normal al plano del movimiento. De esta
forma asumiremos que θ = π/2 y por lo tanto la funcional F se reduce a
³ rs ´ 2 2 ³ rs ´−1 2
F = 1− c ṫ − 1 − ṙ − r2 ϕ̇2 (360)
r r
A partir de esta funcional, las ecuaciones de Euler-Lagrange para las coor-
denadas t y ϕ toman la forma
d ¡ 2 ¢
r ϕ̇ = 0 (361)
ds
d ³ 2³ rs ´ ´
c 1− ṫ = 0 (362)
ds r
Estas ecuaciones implican entonces que

r2 ϕ̇ = L = cte. (363)
³ rs ´
1− ṫ = E = cte. (364)
r
Para encontrar la ecuación para la coordenada radial, dividamos (formal-
mente) el elemento de arco (distancia espacio-tiempo) por ds, entonces
³ rs ´ 2 ³ rs ´−1 2
1= 1− ṫ − 1 − ṙ − r2 ϕ̇2 (365)
r r
lxxviii LA SOLUCIÓN DE SCHWARZSCHILD

y reemplacemos las ecuaciones 363 y 364 en la ecuación anterior obtenemos


³ rs ´−1 2 ³ rs ´−1 2 L2
1= 1− E − 1− ṙ − 2 (366)
r r r
o equivalentemente µ ¶
³ rs ´ L2
ṙ2 + 1 − 1 + 2 = E2 (367)
r r
Esta ecuación la podemos escribir en la forma

ṙ2 + V (r) = E 2 (368)

en donde el potencial efectivo V (r) está dado por


³ µ ¶
rs ´ L2
V (r) = 1 − 1+ 2 (369)
r r
Las ecuaciones 363 y 364 representan leyes de conservación pues para la
métrica de Schwarzschild ∂/∂t y ∂/∂ϕ son campos vectoriales de Killing. Este
resultado se puede ver del siguiente teorema:

Theorem 88 Sea γ (s) una geodésica con vector tangente u = (∂/∂s) |γ y ζ


un campo vectorial de Killing, entonces

g (u, ζ) = cte.

a lo largo de la geodésica γ (s).


Proof. Calculemos la derivada covariante del tensor métrico a lo largo de
la curva γ (s), entonces
µ ¶
D
g (u, ζ) | γ = ∇u g (u, ζ)
∂s
= (gµν uµ ζ ν );σ uσ
= gµν uµ;σ ζ ν uσ + gµν uµ ζ ν;σ uσ
g (∇u u, ζ) + g (u, ∇u ζ)

como la curva γ es una geodésica con vector tangente u, por definición ∇u u = 0,


y por lo tanto

∇u g (u, ζ) = gµν uµ ζ ν;σ uσ


= uµ uσ ζ ν;σ
1¡ µ σ ¢
= u u ζ µ;σ + uσ uµ ζ σ;µ
2
en donde la última igualdad se obtiene del hecho que los índices µ y σ son mudos.
Dado que ζ es un campo vectorial de Killing satisface la ecuación

ζ µ;σ + ζ σ;µ = 0
0.14. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL lxxix

y por lo tanto
1¡ µ σ ¢
∇u g (u, ζ) = u u ζ µ;σ + uµ uσ ζ σ;µ
2
1 µ σ¡ ¢
= u u ζ µ;σ + ζ σ;µ
2
= 0
lo cual demuestra el teorema.
Así, para el caso de la métrica de Schwarzschild tenemos que los vectores de
Killing ∂/∂t y ∂/∂ϕ tienen componentes (1, 0, 0, 0) y (0, 0, 0, 1) respectivamente
y por lo tanto
g (u, ∂/∂t) = g00 u0
³ rs ´ dx0
= 1−
³ r ds
rs ´
= 1− ṫ
r
= cte. (370)

g (u, ∂/∂ϕ) = g44 u4


dx4
= −r2
ds
= −r2 ϕ̇
= cte. (371)
Aquí estamos interesados en la órbita de la partícula de prueba r = r (ϕ),
entonces
dr ṙ
r´= = (372)
dϕ ϕ̇
y de las ecuaciones 363 y 368 tenemos
L2
r´= E 2 − V (r) (373)
r4
Para integrar esta ecuación realicemos el siguiente cambio de variable
1 u´
u= =⇒ r´= − (374)
r u2
entonces
E2 − 1 rs
u´2 + u2 = + 2 u + rs u3 (375)
L2 L
diferenciando con respecto a ϕ tenemos
rs
2u´u´+ 2uu´− 2 u´− 3rs u2 u´ = 0 =⇒
µ L ¶
rs 3 2
2u´ u´+ u − − rs u = 0 (376)
2L2 2
lxxx LA SOLUCIÓN DE SCHWARZSCHILD

Una solución de esta ecuación corresponde a movimiento circular, i.e., u´= 0


implica r = cte.o
rs 3
u´+ u − 2
− rs u2 = 0 (377)
2L 2
Si comparamos esta ecuación con la obtenida en mecánica Newtoniana
Gm
u´+ u − =0 (378)
L2
en donde

L = r2 (379)
dt
2
y notando que r ϕ̇ = L la relación entre las dos ecuaciones es
rs Gm
=
2L2 c2 L2
Gm
= 2
c2 (r2 ϕ̇)
Gm
= ³ ´2
c2 r2 dϕds
Gm
= ³ ´2

c2 r2 cdt
Gm
= ³ ´2
r2 dϕ
dt
Gm
= (380)
L2
en donde se ha utilizado la aproximación ds ' cdt válida para velocidades
pequeñas en comparación con la velocidad de la luz. Así, teniendo en cuenta la
definición del radio de Schwarzschild rs = 2Gm/c2 tenemos que cL = L. Vemos
entonces que la ecuación relativista contiene el término adicional 3/2rs u2 , el
cual, para el caso de la órbita de Mercurio es pequeño comparado con el témino
rs /2L2 , pues teniendo en cuenta que ds ' cdt, tenemos

3/2rs u2
= 3L2 u2
rs /2L2
1 ¡ 2 ¢2
= 3 r ϕ̇
r2
µ ¶2
3 dϕ
' r
c2 dt
2
v
' 3 ⊥
c2
∼ 7, 7 × 10−8 (381)
0.14. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL lxxxi

en donde v⊥ es la velocidad de Mercurio perpendicular al radio vector. Por esta


razón podemos resolver la ecuación de movimiento relativista para la órbita de
Mercurio, tratando al término 3/2rs u2 como una perturbación. La aproximación
de orden cero (Newtoniana) está dada por
rs
u(0) = (1 + e cos ϕ) (382)
2L2
en donde la excentricidad e está definida como
¡ ¢ 2L2
a 1 − e2 = (383)
rs

siendo a el semi-eje mayor de la órbita. Introduciendo esta solución de orden


cero en la ecuación diferencial para la órbita (ecuación 377) tenemos 32 rs u2

rs 3rs3
u´+ u = + (1 + e cos ϕ)2 (384)
2L2 8L4
Para encontrar la solución a esta ecuación diferencial no homogénea, notemos
que las siguientes tres ecuaciones diferenciales

 K
u´+ u = K cos ϕ (385)

K cos2 ϕ

poseen las siguientes soluciones particulares

K
1
2 Kϕ sin ϕ (386)
1
2K − 16 K cos (2ϕ)

Puesto que la solución perturbativa u que estamos buscando es de la forma


u = u(0) + u(1) , donde u(1) es la solución de la ecuación 384, entonces de las
tres soluciones particulares la primera K = cte no es de interés, pues sola-
mente cambia los parámetros de la órbita no perturbada y la tercera solución
1 1
2 K − 6 K cos (2ϕ) tampoco nos interesa pues en periódica y por lo tanto no
es observable. Así, la solución que presenta una perturbación interesante a la
órbita no perturbada es la segunda, pues lleva a un cambio secular de la órbita.
De esta forma la solución que estamos interesados corresponde a la ecuación
diferencial
rs 3rs3
u´+ u = + e cos ϕ (387)
2L2 4L4
la cual se obteniene a partir de la ecuación 384 manteniendo solamente el término
en cos ϕ. La solución a esta ecuación diferencial está dada por
µ ¶
rs 3rs2
u= 1 + e cos ϕ + eϕ sin ϕ (388)
2L2 4L2
lxxxii LA SOLUCIÓN DE SCHWARZSCHILD

Teniendo en cuenta que el término 3rs2 /4L2 es pequeño para órbitas plane-
tarias, pues e.g.
3rs2 3rs2
=
4L2 4 (r2 ϕ̇)2
3rs2
= 2
4 (r2 ϕ̇)
3rs2 c2
' ³ ´2
4r2 r dϕ dt

∼ 7 × 10−8 (389)

para Mercurio, entonces podemos reescribir la ecuación 388 en la forma


µ µ ¶¶
rs 3rs2
u= 1 + e cos ϕ − ϕ (390)
2L2 4L2
El término 3rs2 ϕ/4L2 introduce un aperiodicidad en la órbita del planeta,
la cual tiene como consecuencia un corrimiento en el perihelio de la órbita. El
perihelio de una órbita sucede cuando r es un mínimo, o equivalentemente u es
un máximo. Así u es máximo cuando
µ ¶
3r2
ϕ 1 − s2 = 2πn; n ∈ N (391)
4L
entonces µ ¶
3rs2
ϕ' 1+ 2πn (392)
4L2
y por lo tanto perihelios sucesivos ocurren a intervalos de
µ ¶
3r2
∆ϕ = 2π 1 + s2 (393)
4L
y así el corrimiento del perielio por revolución para la órbita de Mercurio es
3rs2
δϕ = 2π
4L2
= 42.89´/siglo (394)

El valor medido para Mercurio es de 42.6´± 1.0´/siglo.

0.14.2 Desviación de la luz por el sol


Para describir las geodésicas nulas el parámetro s no es apropiado puesto que
ds = 0. Sea q un parámetro cualquiera, entonces la ecuación de las geodésicas
se puede obtener a partir del principio variacional
Z
dxµ dxν
δ gµν dq = 0 (395)
dq dq
0.14. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL lxxxiii

Figure 6: Desviación del rayo de luz por el sol

De igual forma como procedimos en la sección anterior para obtener las


trayectorias de partículas, podemos restringir, sin pérdida de generalidad, el
movimiento de los rayos de luz al plano θ = π/2. Entonces las ecuaciones para
las coordenadas t y ϕ están dadas por

r2 ϕ̇ = cte. = h̃ (396)
³ rs ´
1− ṫ = cte. = L̃ (397)
r
La ecuación para la coordenada r la obtenemos a partir de la condición
ds = 0 válida para geodésicas nulas, así
³ rs ´−1 2 2 ³ rs ´−1 2 h̃2
1− c L̃ − 1 − ṙ − 2 = 0 (398)
r r r
Eliminando el parámetro q, y haciendo el cambio u (ϕ) = 1/r (ϕ), la ecuación
anterior se transforma en

c2 L̃2 − h̃2 u´2 − h̃2 u2 (1 − rs u) = 0 (399)

y diferenciando esta ecuación con respecto a ϕ, tenemos


µ ¶
3rs 2
u´ u´+ u − u =0 (400)
2

Descartando la solución u = cte. obtenemos finalmente


3rs 2
u´+ u = u (401)
2
lxxxiv LA SOLUCIÓN DE SCHWARZSCHILD

Puesto que estamos interesados en la trayectoria de rayos de luz en el campo


del sol, y en particular para rayos de luz que pasan cerca a la superficie solar,
el término 3rs u/2 es pequeño
3rs
u ' 10−6 (402)
2
y por lo tanto podemos considerar el término 3rs u2 /2 como una perturbación,
así la solución a la ecuación no perturbada
u´+ u = 0 (403)
está dada por
u(0) = A cos (ϕ + δ) (404)
con A y δ constantes de integración. Esta solución representa una línea recta
(no hay desviación) y si escogemos el origen de los ejes en el centro del sol, y
consideramos un rayo proveniente de y → −∞, y llamamos xmin = r0 el punto
de máximo acercamiento (que coincide con el parámetro de impacto) entonces
la solución no perturbada se puede escribir en la forma
1
u(0) =
cos ϕ ⇐⇒
r0
r cos ϕ = r0 (405)
Entonces la solución a primer orden en teoría de perturbaciones de la ecuación
401 la podemos ecribir como
3rs
u = u(0) + v (406)
2
en donde v satisface la ecuación
³ ´2
v´+ v = u(0) ⇐⇒
1
v´+ v = (1 + cos 2ϕ) (407)
2r0
cuya solución es
2 1
v= − cos2 ϕ (408)
3r02 3r02
y por lo tanto la solución hasta términos de orden rs toma la forma
1 rs rs
u= cos ϕ − 2 cos2 ϕ + 2 (409)
r0 2r0 r0
El efecto de la perturbación es producir una desviación global de la trayec-
toria. El punto de máximo acercamiento está dado para ϕ = 0, entonces
r0
rmin = rs
1 + 2r 0
rs
' r0 − (410)
2
0.14. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL lxxxv

Las asíntotas de la trayectoria corresponden a los valores de ϕ para los cuales


r → ∞ o u → 0, así
1 rs rs
cos ϕ∞ − 2 cos2 ϕ∞ + 2 = 0 =⇒
r0 2r0 r0
2r0
cos2 ϕ∞ − −2 = 0 (411)
rs
entonces " s #
r0 2rs2
cos ϕ∞ = 1± 1+ 2 (412)
rs r0
Para que el cos ϕ∞ ≤ 1 tomamos el signo negativo y expandimos el radical
hasta términos de primer orden, entonces
µ ¶
r0 r2
cos ϕ∞ ' 1 − 1 − s2
rs r0
rs
= − (413)
r0
Por lo tanto el ángulo de deflexión total está dado por
2rs 4Gm
α= = 2 (414)
r0 c r0
Para el caso de un rayo de luz que pasa muy cerca del sol, obtenemos para
la desviación total (tomando r0 el radio del sol)

α = 1, 75” (415)

La primera observación directa de este este efecto la realizó Eddington en


1919 aprovechando el eclipse total de sol.
Para las primeras observaciones de este efecto se utilizaban placas fotográfi-
cas de estrellas cercanas, comparando dos imágenes tomadas con seis meses de
diferencia. El error observacional debido a esta técnica era apreciable dando un
rango de valores entre 1, 5” y 3”. En la actualidad utilizando técnicas interfer-
ométricas (long-base-line) se alcanzan precisiones del orden de las milésimas de
segundo de arco.
Es importante anotar que la predicción de la desviación de la luz por un
cuerpo masivo como el sol ya se había planteado en el contexto de la gravedad
Newtoniana. En efecto, en el modelo Newtoniano corpuscular de la luz se es-
pera, que al igual que cualquier objeto masivo, sea afectado por un campo
gravitacional. Dada la equivalencia entre masa inercial y gravitacional, todos
los cuerpos independientemente de su masa, son desviados de la misma forma
por la gravedad. Mitchell en 1800 calculó que un rayo de luz que pase cerca a
la superficie solar desviaba su trayectoria un ángulo dado por
2Gm
α= (416)
c2 r0
lxxxvi LA SOLUCIÓN DE SCHWARZSCHILD

Einstein en 1911 repitió este cálculo con gravedad euclideana, teniendo en


cuenta ahora la equivalencia masa-energía para las ondas electromagnéticas,
obteniendo el mismo resultado que Mitchell. Notemos que la predicción clásica
(Newtoniana) es la mitad de la predicción en relativad general, lo cual es un
hecho muy significativo, pues determina un efecto que no es tan solo una pequeña
corrección a los cálculos clásicos (como es el caso que veremos para órbitas
planetarias) y manifiesta en forma explícita los efectos de curvatura del espacio.
Las primera observación realizada por Edington en 1919 debido al error ob-
servacional tan grande (rango entre 1, 5” y 3”) no se podría considerar una
prueba condundente de la relatividad general de Einstein, en el sentido de pro-
bar la predicción de 1, 75”. Sin embargo esta observación de 1919 es considerada
como una de las pruebas clásicas de la relatividad general. Esta situación se
puede entender en el sentido que la expedición de 1919 liderada por Eding-
ton tenía como objetivo primordial determinar si exitía o no el fenómeno de
desviación de la luz por un campo gravitacional, y teniendo en cuenta que las
predicción Newtoniana es la mitad que la propuesta por Einstein el experimento
si podía decidir sobre estas dos posibilidades.
La desviación de la luz por un cuerpo masivo, y en particular el resultado
obtenido por Einstein del ángulo de desviación de la luz por un cuerpo esférica-
mente simétrico
4Gm
αE = 2
c r0
llamado ángulo de Einstein, es el punto de partida para estudiar lentes grav-
itacionales, un campo de aplicación de la relatividad general que ha cobrado
recientemente una gran importancia para la astronomía observacional.
Colapso gravitacional

En el capítulo anterior en la sección sobre características de la solución de


Schwarzsclild vimos como la aparente singunlaridad que presenta la métrica
para r = rs no se consideraba significativa, pues esto implicaba densidades
de materia extremadamente altas que no se esperaba que se presentaran en el
universo, como lo estableció Schwarzschild. En este capítulo presentaremos al-
gunos resultados sobre el comportamiento de la métrica en el interior de una
distribución esférica de materia y se analizarán sus consecuencias. En particu-
lar veremos que en relatividad general se predice que bajo ciertas condiciones
(densidad crítica) el colapso es inevitable. Estudiaremos las propiedades más
significativas de los agujeros negros y presentaremos los resultados más impor-
tantes sobre el comportamiento de una partícula de prueba en el campo de un
agujero negro.

0.15 El tensor momentun-energía


Consideremos en primer lugar el modelo más simple de fluido (campo de ma-
teria) constituido por partículas no interactuantes y sobre las cuales no actúa
fuerza externa y trabajemos inicialmente en el contexto de la teoría especial
de la relatividad. Describir físicamente el fluido significa conocer la trayectoria
en función del tiempo de un elemento de masa de este fluido medida por al-
gún observador inercial. En estas condiciones, para una descripción covariante
del fluido, éste se puede describir por una función densidad propia ρ0 (x) y un
campo vectorial de cuadri-velocidad U µ (x). ρ0 (x) significa la densidad que mide
un observador inercial que se mueve con el fluido, es decir ρ0 (x) = dm0 /dV0 en
donde dm0 es la masa propia contenida en el lemento de volumen propio dV0
situado en el punto de coordenadas (x1 , x2 , x3 ) en el instante t, i.e.

x = (ct, x1 , x2 , x3 ) = (x0 , x1 , x2 , x3 ) (417)

y
dxµ dxµ
U µ (x) = =c (418)
dτ ds
es la cuadri-velocidad de este elemento de masa, en donde
¡ ¢2 ¡ ¢2 ¡ ¢2 ¡ ¢2
ds2 = dx0 − dx1 − dx2 − dx3 (419)

lxxxvii
lxxxviii COLAPSO GRAVITACIONAL

El tensor simétrico de momentun-energía que describe el fluido está dado


por
T µν = ρ0 (x)U µ (x)U ν (x) (420)

Para ver la interpretación física del tensor momentun-energía consideremos


en primer lugar la componente

dx0 dx0
T 00 = ρ0 U 0 U 0 = ρ0 c2 (421)
ds ds

Teniendo en cuenta la ecuación 419, entonces


µ ¶−1
dx0 dt ds
= c =c
ds ds dt
¡ 2 ¢
2 −1/2
= c c −u = γ(u) (422)

entonces
T 00 = ρ0 c2 γ 2 (u) (423)

en donde
1
γ(u) = q (424)
u2
1− c2

es el factor gamma de Lorentz de la velocidad del fluido u en el punto x. Esta


cantidad se interpreta entonces como la densidad de energía relativista del fluido
en el punto x, pues ρ0 c2 es la densidad de energía propia y un factor γ surge por
el aumento de la masa con la velocidad y el segundo factor γ por la contracción
del volumen.
Para interpretar físicamente las otras componentes consideremos primero los
términos

T 0i = ρ0 U 0 U i
dx0 dxi
= ρ0 c2
ds ds
2 dxi dt
= ρ0 c γ(u)
dt ds
ui
= ρ0 c2 γ 2 (u) (425)
c

en donde ui es la componente i − ésima de la velocidad del fluido. Similarmente


las otras componentes del tensor están dadas por

T ij = ρ0 U i U j
ui uj
= ρ0 c2 γ 2 2 (426)
c
0.15. EL TENSOR MOMENTUN-ENERGÍA lxxxix

Por lo tanto el tensor momentun-energía para el fluido no interactuante toma


la forma
 
1 ux /c uy /c uz /c
 ux /c u2x /c2 ux uy /c2 ux uz /c2 
T µν = ρ0 c2 γ 2 
 uy /c uy ux /c2
 (427)
u2y /c2 uy uyz /c2 
uz /c uz ux /c2 uz uy /c2 u2z /c2
La interpretación física del tensor momentun-energía esta basada sobre la
ecuación de conservación
∂T µν
≡ T µν,ν = 0 (428)
∂xν
Consideremos primero la componente 0 de esta ecuación (denotemos por
ρ = ρ0 c2 γ 2 ):
0 = T 0ν ,ν
∂T 00 ∂T 01 ∂T 02 ∂T 03
= 0
+ 1
+ 2
+
∂x
· ∂x ¸∂x ∂x3
1 ∂ρ
= + ∇ · (ρu) (429)
c ∂t
entonces esta ecuación representa la conservación de la energía y corresponde
a la ecuación de continuidad de la hidrodinámica clásica, pero representa la
conservación de la materia en el sentido de la equivalencia masa-energía.
Para ver el significado de las otras tres componentes de la ecuación 428
escribamos la componente i, i = 1, 2, 3 en forma explícita (con la notación
u1 = ux etc.):
∂T i0 ∂T i1 ∂T i2 ∂T i3
T iν ,ν = 0
+ 1
+ 2
+
∂x" ∂x ∂x ∂x3
¡ i¢ ¡ ¢ ¡ ¢ ¡ ¢#
1 ∂ ρu ∂ ρux ui ∂ ρuy ui ∂ ρuz ui
= + + +
c2 ∂t ∂x ∂y ∂z
" ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢#
ρ ∂ ui ∂ ui ∂ ui ∂ ui
= + ux + uy + uz +
c2 ∂t ∂x ∂y ∂z
· ¸
ui ∂ρ ∂ (ρux ) ∂ (ρuy ) ∂ (ρuz )
+ + + (430)
c2 ∂t ∂x ∂y ∂z
el segundo término de la última igualdad es cero debido a la ecuación de con-
tinuidad, así esta ecuación se puede escribir en la forma
" ¡ ¢ #
iν ρ ∂ ui i
T ,ν = 2 + u · ∇u (431)
c ∂t
Esta ecuación es también ususal en la hidrodinámica y representa el movimiento
de un campo de materia libre de fuerzas, y por lo tanto corresponde a la con-
servación del momentun. Al operador
D ∂
$ +u·∇ (432)
Dt ∂t
xc COLAPSO GRAVITACIONAL

se le llama la derivada de Euler. Así la ecuación T iν ,ν = 0 se puede escribir


como ¡ ¢
Dui ∂ ui
= + u · ∇ui = 0; i = 1, 2, 3 (433)
Dt ∂t
Esta ecuación (llamada ecuación de Euler) es una consecuencia del principio
de conservación del momentun. Por lo tanto la ecuación 428 representa las leyes
de conservación de energía y momentun.
Consideremos ahora la descripción de un fluido perfecto sobre el cual actúan
fuerzas internas descritas por la presión. Un fluido perfecto se define como
aquel para el cual un observador moviendose con la velocidad v del fluido en
un punto ve el fluido isotrópico. Esta definición supone que el camino libre
medio entre colisiones de las partículas que componen el fluido es pequeño en
comparación con la escala de longitud utilizada por el observador. Así un fluido
perfecto queda descrito por la función densidad propia ρ0 (x), el campo de cuadri-
velocidades U µ y el campo escalar de presión propia p0 (x).
Para encontrar la forma general del tensor momentun-energía, consideremos
un observador con respecto al cual un elemento de volumen del fluido situado
en un punto x del espacio-tiempo está en reposo. Entonces, por hipótesis de
fluido perfecto (isotrópico) en el sistema de referencia propio, el tensor toma la
forma  
ρ0 c2 0 0 0
 0 p0 0 0 
T0µν = 
 0
 (434)
0 p0 0 
0 0 0 p0
en donde el subíndice cero se refiere al sistema de referencia propio.
Transformando al sistema de referencia del laboratorio con respecto al cual
el fluido en el punto x se está moviendo con velocidad u, tenemos

T µν = Λµ α (u) Λν β (u) T0αβ (435)

en donde los coeficientes de la transformación de Lorentz están dados por


 
γ γβ x γβ y γβ z
 γβ u2x (γ−1) ux uy (γ−1) ux uz (γ−1) 
 x 1+ u2 u2 u2 
Λµ α =  ux uy (γ−1) u2 (γ−1) uy uz (γ−1)  (436)
 γβ y u2 1 + y u2 u2

ux uz (γ−1) uy uz (γ−1) u2 (γ−1)
γβ z u2 u2 1 + z u2

con γ = γ(u) y β i = ui /c. Entonces las componentes del tensor momentun-


energía son µ ¶
1
T µν = ρ0 U µ U ν + p0 2 U µ U ν − η µν (437)
c
en donde U µ es la cuadri-velocidad del fluido en el punto x, y satisface la
ecuación de conservación
T µν
=0 (438)
∂xν
0.16. MOVIMIENTO GEODÉSICO xci

La generalización del tensor momentun-energía al espacio-timpo curvo es


inmediata: µ ¶
µν µ ν 1 µ ν µν
T = ρ0 U U + p0 2 U U − g (439)
c
con la ecuación de conservación local

T µν;ν = 0 (440)

En el capítulo sobre cosmología trabajaremos el fluido perfecto como un


modelo para describir la materia del universo.

0.16 Movimiento geodésico


Como postulados básicos de la relatividad general están las ecuaciones de campo
de Einstein, las cuales determinan la métrica a partir del tensor momentun-
energía de la materia, y el postulado del movimiento geodésico de una partícula
de prueba libre de fuerzas, i.e., de una partícula en caida libre. Veremos en
esta sección como las ecuaciones de campo de Einstein contienen el movimiento
geodésico de las partículas de materia, las cuales determinan a su vez el tensor
métrico. Esta situación era de esperar teniendo en cuenta el caracter no lineal de
las ecuaciones de campo. Es decir, si consideramos una distribución de materia
y consideramos el movimiento de una partícula de prueba (que forma parte de
la distribución de materia), entonces la partícula de prueba debe seguir una
geodésica de la variedad, la cual está determinada por el tensor métrico (el
campo gravitacional), así se espera que las ecuaciones de campo determinen el
movimiento de las partículas que determinan a su vez el campo.
El caracter no lineal de las ecuaciones de campo significa que no es válido
el principio de superposición, el cual está en la base de la gravedad Newtoni-
ana. Esto significa que si a un sistema dado, i.e. una distribución de materia,
que produce un campo gravitacional le adicionamos una partícula, entonces el
nuevo campo gravitacional no es la superposición del campo garvitacional de
la distribución más el campo producido por la partícula. En este punto es im-
portante anotar que cuando resolvimos el problema del campo producido por
una distribución esférica de materia (métrica de Schwarzschild) y estudiamos el
movimiento de partículas de prueba, trayectorias de planetas y desviación de
un rayo de luz, se asumio la aproximación que estas partículas (el planeta o
el fotón) no afectaban apreciablemente el campo de la distribución esférica de
materia.
Para simplificar consideremos un gas de partículas no interactuantes (a parte
de su propia interacción gravitacional) descrito por el tensor momentun-energía
420
T µν = ρ0 (x)U µ (x)U ν (x) (441)
entonces las ecuaciones de campo de Einstein
8πG
Gαβ = Tαβ (442)
c2
xcii COLAPSO GRAVITACIONAL

garantizan que se cumpla la ecuación

T µν;ν = 0 (443)

Para ver las consecuencias de esta ecuación sobre el movimientos de las


partículas que conforman el fluido, escribamos en forma explícita la ecuación
443 para el tensor 441:

(ρ0 U ν );ν U µ + ρ0 U ν U µ ;ν =0 (444)

Teniendo en cuenta que la cuadri-velocidad satisface la relación

U α Uα = gαβ U α U β
dxα dxβ
= gαβ
dτ dτ
dxα dxβ
= c2 gαβ
ds ds
= c2 (445)

entonces tomando la derivada covariante de esta ecuación y contrayendo con el


cuadri-vector U , tenemos

0 = (U α Uα );ν U ν
¡ ¢
= gαβ U α U β ;ν U ν
¡ ¢
= gαβ U α U β ;ν + gαβ U α ;ν U
β

= 2U α ;ν U ν Uα (446)

multiplicando la ecuación 444 por Uµ tenemos

(ρ0 U ν );ν U µ Uµ + ρ0 U ν U µ ;ν Uµ =
(ρ0 U ν );ν U µ Uµ =
(ρ0 U ν );ν c2 = 0 (447)

es decir, la cantidad ρ0 U ν la cual se interpreta como la densidad de momentun


es conservada, lo cual implica que en la ecuación 444 el segundo término debe
ser nulo
U ν U µ ;ν = 0 (448)
Escribiendo esta ecuación en forma explícita tenemos que
¡ ¢
U ν U µ ,ν + Γµσν U σ = 0 (449)

Dado que el cuadri-vector U representa la cuadri-velocidad de una partícula


del gas, entonces
dxµ dxµ
Uµ = =c (450)
dτ ds
0.17. MÉTRICA PARA EL INTERIOR DE UNA MASA ESFÉRICA xciii

entonces la ecuación 449 se puede escribir en la forma


µ µ¶
dxν ∂ dx dxν µ dxσ
+ Γ =
ds ∂x ν ds ds σν ds
d2 xµ dxν dxσ
2
+ Γµσν = 0 (451)
ds ds ds
la cual corresponde a la ecuación geodésica para las partículas del fluido, como
se quería mostrar.

0.17 Métrica para el interior de una masa es-


férica
Consideremos ahora la solución de las ecuaciones de campo de Einstein para el
interior de una distribución esférica de materia, en donde supondremos que la
materia está descrita por el tensor
p
T µν = ρU µ U ν + (U µ U ν − g µν ) (452)
c2
con ρ = ρ(r) y p = p(r) y la ecuación de estado f (ρ, p) = 0. Dada la simetría
esférica del problema se puede mostrar (en forma similar al caso de la métrica
de Schwarzschil) que las componentes del tensor métrico para el interior de la
distribución deben tener la forma general
g = g00 c2 dt2 − grr dr2 − r2 dΩ2 (453)
en coordenadas espaciales esféricas y ahora las funciones g00 y grr se determinan
a partir de las ecuaciones de campo de Einstein.
Como estamos asumiendo que la materia está descrita por un tensor momentun-
energía para un fluido perfecto (ecuación 452) y la distribución es estática, en-
tonces en las coordenadas elegidas las partículas del fluido están en reposo y
por lo tanto las componentes del cuadri-vector velocidad son
U µ = (U 0 , 0, 0, 0) (454)
Así, sobre la línea de universo de cada partícula del fluido la relación entre
el tiempo propio y la coordenada temporal está dada por
¡ ¢2
ds2 = g00 dx0 = g00 c2 dt2 (455)
y como
¡ ¢2
c2 = U 2 = gµν U µ U ν = g00 U 0 (456)
entonces, las componentes covariantes de la cuadri-velocidad toman la forma
Uµ = gµν U ν =⇒

U0 = g0ν U ν = g00 U 0 = c g00
Ui = 0 i = 1, 2, 3 (457)
xciv COLAPSO GRAVITACIONAL

Con estas relaciones las componentes covariantes del tensor momentun-


energía están dadas por
p
Tµν = ρUµ Uν + (Uµ Uν − gµν )
 c2   
g00 0 0 0 0 0 0 0
 0 0 0   0 g11 0 
= ρ
0 − p  0  (458)
 0 0 0 0  c2  0 0 g22 0 
0 0 0 0 0 0 0 g33

Teniendo en cuenta la ecuación 453 para el tensor métrico, tenemos


 
ρg00 0 0 0
 0 p 
Tµν =  c2 grr 0 0  (459)
 0 0 p 2 
c2 r 0
p 2 2
0 0 0 c2 r sin θ

el cual describe un fluido perfecto en reposo. Para obtener las funciones de-
sconocidas g00 y grr utilizamos las ecuaciones de campo de Einstein

1 8πG
Rµν − g µν R = − 2 T µν (460)
2 c
las cuales se pueden escribir en forma equivalente como (problema)
µ ¶
8πG 1
Rµν = − 2 Tµν − gµν T (461)
c 2

en donde T = T σ σ es la traza del tensor momentun-energía, la cual se obtiene


fácilmente a partir de la ecuación 459 (problema):

T = g µν Tµν
3p
= ρ− 2 (462)
c
Entonces los términos no nulos del lado derecho de las ecuaciones de campo
461 son (κ = −8πG/c2 )
µ ¶ · µ ¶¸
1 1 3p
κ T00 − g00 T = κ ρg00 − g00 ρ − 2
2 2 c
µ ¶
1 3p
= κg00 ρ + 2 (463)
2 c

µ ¶ · µ ¶¸
1 p 1 3p
κ T11 − g11 T = κ 2 grr + grr ρ − 2
2 c 2 c
1 ³ p´
= κgrr ρ − 2 (464)
2 c
0.17. MÉTRICA PARA EL INTERIOR DE UNA MASA ESFÉRICA xcv
µ ¶ · µ ¶¸
1 p 1 3p
κ T22 − g22 T = κ 2 r2 + r2 ρ − 2
2 c 2 c
1 2³ p´
= κr ρ − 2 (465)
2 c

µ ¶ · µ ¶¸
1 p 1 3p
κ T33 − g33 T = κ 2 r2 sin2 θ + r2 sin2 θ ρ − 2
2 c 2 c
1 2 2 ³ p´
= κr sin θ ρ − 2 (466)
2 c
Las componentes del tensor de Riemann no nulas ya fueron obtenidas cuando
tratamos la métrica de Schwarzschild
µ ¶
eh−g 1 2 1 2
R00 = −h´− h´ + h´g´− h´ (467)
2 2 2 r

1 1 1 1
R11 = h´+ h´2 − h´g´− g´ (468)
2 4 4 r
µ ¶
rh´ rg´
R22 = e−g 1 + − −1 (469)
2 2
R33 = R22 sin2 θ (470)
en donde hemos utilizado las definiciones g00 = eh(r) y grr = eg(r) . Entonces
las ecuaciones de campo de Einstein toman la forma
µ ¶ µ ¶
−g h´ h´2 h´g´ h´ ρ 3p
e − − + − =κ + (471)
2 4 4 r 2 2c2
µ ¶ ³ρ
−g 1 1 2 1 g´ p ´
e h´+ h´ − h´g´− =κ − 2 (472)
2 4 4 r 2 2c
µ ¶ ³ρ
−g 1 h´ g´ 1 p ´
e + − − = κ − (473)
r2 2r 2r r2 2 2c2
en donde la última ecuación para las componente R33 no contribuye pues es
proporcional a la ecuación para R22 .
Para resolver este sistema de ecuaciones acopladas, sumemos en primer lugar
las ecuaciones 471 y 472 para obtener
µ ¶ ³
−g h´ g´ p´
e − − =κ ρ+ 2 (474)
r r c

y sumando y restando esta ecuación con la ecuación 473, para despejar ρ y p


respectivamente, tenemos
µ ¶
1 g´ 1
e−g − − 2 = κρ (475)
r2 r r
xcvi COLAPSO GRAVITACIONAL
µ ¶
1 1 h´ p
− e−g + =κ 2 (476)
r2 r 2 r c
La tercera ecuación diferencial la obtenemos restando las ecuaciones 472 y
473, µ ¶
1 1 1 g´+ h´ 1 1
e−g h´+ h´2 − h´g´− − 2 + 2 =0 (477)
2 4 4 2r r r
la cual es independiente de la densidad y la presión.
Este sistema de tres ecuaciones acopladas más la ecuación de estado, deter-
minan la métrica en términos de las propiedades de la materia que se quiera
modelar, a través de la función ρ(r) y constituyen de esta forma el punto de
partida para estudiar diferentes modelos de estructura estelar.
Teniendo en cuenta que la métrica para el exterior de una distribución es-
férica de materia está dada por la métrica de Schwarzschild, por continudad de
la métrica definamos la función m(r) por

2Gm(r)
e−g = 1 − (478)
c2 r
Para interpretar el significado de esta función calculemos su derivada:

c2 d £ ¡ ¢¤
m´(r) = r 1 − e−g
2G dr
c2 £¡ ¢ ¤
= 1 − e−g + rg´e−g
2G
c2 £ −g ¤
= −e (1 − rg´) + 1
2G · µ ¶ ¸
4πr2 −g 1 g´ 1
= e − − 2 (479)
κ r2 r r

en donde κ = −8πG/c2 . Comparando esta ecuación con 475 tenemos que

κm´(r)
= κρ (480)
4πr2
entonces, integrando esta ecuación, con la condición m(0) = 0 para quitar la
singularidad en r = 0, obtenemos
Z m Z r
m(r) = dm = 4πr2 ρ(r)dr (481)
0 0

Aun cuando esta expresión corresponde en gravedad Newtoniana a la masa


contenida en una esfera de radio r, esta cantidad, llamada masa geométrica, no
corresponde a la masa propia contenidad en el volumen esférico de radio r pues
el elemento de volumen propio está dado por
p
dV = |−3 g|d3 x
1/2 2
= grr r sin θdrdθdϕ (482)
0.17. MÉTRICA PARA EL INTERIOR DE UNA MASA ESFÉRICA xcvii
¯ ¯
en donde ¯−3 g¯ es el determinante del tensor métrico espacial, y por lo tanto la
masa propia contenida en en radio r está dada por
Z 2π Z π Z r
mp (r) = ρ(r)dV
0 0 0
Z r · ¸−1/2
2 2Gm(r)
= 4π ρ(r)r 1 − dr (483)
0 c2 r

Notemos que la masa propia siempre es mayor que la masa geométrica, y su


diferencia
EL = mp c2 − mc2 (484)
se puede interpretar como la energía de ligadura gravitacional.
Si integramos hasta la superficie de la distribución de materia de radio R
podemos identificar m(R) con la masa total de cuerpo y obtenemos entonces
la solución de Schwarzschild, pegando con continuidad la solución interna y la
externa.
Como vimos anteriormente para encontrar una solución explícita para la
métrica se requiere conocer la ecuación de estado de la materia, sin embargo
con la función de masa geométrica encontrada podemos obtener una ecuación
para la derivada de la presión, en términos de ρ, p, m y r la cual nos permitirá
llegar a resultados generales muy importantes en estructura estelar.
Despejando h´de la ecuación 476 y teniendo en cuenta 478 tenemos
µ ¶
g 1 p 1
h´ = re −κ 2 −
r2 c r
µ ¶−1 µ ¶
2Gm(r) 1 8πGpr 1
= 1− 2
+ 4

c r r c r
8πGpr 2Gm(r)
c4 +
c2 r2
= 2Gm(r)
1 − c2 r
3
2Gm(r)
2 + 8πGpr
c4 ´
= ³c (485)
r r − 2Gm(r)
c2

Para relacionar la derivada de la presión con h´ derivemos la ecuación 476


respecto a r:
µ ¶
p´ 2 −g g´ h´g´ 2 h´ h´
κ 2 =− 3 +e − + 3+ 2− (486)
c r r2 r r r r

utilizando la ecuación 477 para eliminar h´ tenemos


µ ¶
p´ 2 2 h´ h´
κ 2 = − 3 + e−g g´+ 3 + 2 − e−g
c r r r r
1 −g
= e h´(g´+ h´) (487)
2r
xcviii COLAPSO GRAVITACIONAL

Figure 7: Condición de equilibrio para una estrella

Comparando esta ecuación con 474 obtenemos


p´ 1 ³ p´
− = ρ + h´ (488)
c2 2 c2
Si despejamos p´de esta ecuación y remplazamos h´dado por la ecuación 485
obtenemos finalmente
³ ´¡ ¢
Gm(r) 4πGpr3
c 2 + c 4 ρ + cp2 c2
p´= − ³ ´ (489)
r r − 2Gm(r)
c2

la cual es la ecuación de equilibrio hidrostático de Tolman-Oppenheimer-Volkoff


(TOV).
Para ver el significado físico de la ecuación de TOV, veamos que ésta cor-
responde a la generalización relativista de la ecuación de equilibrio hidrostático
de Newton para una distribución uniforme de materia.
Consideremos una distribución uniforme de materia en equilibrio en el con-
texto de la gravedad Newtoniana. Sea dm la masa de un elemento de volumen
dV = dAdr (como se muestra en la figura) situado a una distancia r del centro.
Las fuezas que actúan sobre este elemento de masa son: su peso

Gm(r)dm
dF = − r̂ (490)
r2
en donde m(r) es la masa de la distribución contenida en un volumen de radio
r, y las fuerzas de presión −p(r + dr)dAr̂ sobre la cara superior de área dA y
+p(r)dAr̂ sobre la cara inferior. Entonces la condición de equilibrio significa

Gm(r)dm
− − p(r + dr)dAr̂ + p(r)dAr̂ = 0 (491)
r2
0.17. MÉTRICA PARA EL INTERIOR DE UNA MASA ESFÉRICA xcix

y teniendo en cuenta que dm = ρdV , obtenemos


Gm(r)ρ
p´(r) = − (492)
r2
que representa la ecuación Newtoniana de equilibrio hidrostático.
Si consideramos el límite no relativista de la ecuación de TOV, es decir para
v << c, entonces obtenemos la ecuación de equilibrio Newtoniana.
En resumen, para encontrar la métrica en el interior de una distribución
esféricamente simétrica de materia y su configuración de equilibrio, en donde el
valor para la densidad central ρc y presión central pc se fijan arbitrariamente,
se siguen los siguientes pasos:

1. Se debe conocer la ecuación de estado

p = p(ρ) (493)

2. A partir de esta función se integran las ecuaciones, para la masa geométrica


Z m Z r
m(r) = dm = 4πr2 ρ(r)dr (494)
0 0

y para el gradiente de presión


³ 3
´¡ ¢
Gm(r)
c2 + 4πGpr
c4 ρ+ p
c2 c2
p´= − ³ ´ (495)
r r − 2Gm(r)
c2

desde r = 0 hasta la superficie de la estrella en donde ρ(R) = p(R) = 0.


3. Finalmente se resuelve la ecuación para h(r):
2Gm(r) 8πGpr3
2 + c4 ´
h´= ³c (496)
2Gm(r)
r r− c2

sugeta a la condición de frontera que para r = R la métrica interna se


debe reducir a la métrica externa dada por Schwarzschild.

Aun cuando la configuración de equilibrio Newtoniana es un caso límite de la


relativista (ecuación de TOV), surge una diferencia fundamental, en el sentido
que la ecuación Newtoniana permite siempre una configuración de equilibrio
para cualquier valor de la densidad y del radio de la distribución, mientras que
la ecuación relativista impone un límite máximo, a partir del cual no es posible
una configuración de equilibrio, i.e. para un radio dado existe una masa dada a
partir de la cual el colapso es inevitable.
Para ver como surge esta situación, consideremos un ejemplo en donde la
densidad es uniforme: ½
ρ0 r ≤ R
ρ= (497)
0 r>R
c COLAPSO GRAVITACIONAL

y por lo tanto integrando 494 tenemos


4 3
m(r) = πr ρ0 (498)
3
un resultado válido tanto para el caso relativista como Newtoniano.
Con este resultado integremos primero la ecuación de equilibrio hidrostático
Newtoniana 492
Z p(r) Z r
Gm(r)ρ
dp(r) = − dr
0 R r2
µ 2 ¯r
4 r ¯¯
= − πGρ20
3 2 ¯R
2 ¡ ¢
= πGρ20 R2 − r2 (499)
3
por lo tanto la presión central en el caso Newtoniano para una estrella de den-
sidad uniforme está dada por
2
pc = p(0) = πGρ20 R2 (500)
3
Esta presión también la podemos expresar en términos de la masa total M
y la densidad, o la masa total y el radio de la estrella:
³ π ´1/3
4/3
pc = GM 2/3 ρ0 (501)
6
3 M2
pc = G (502)
8π R4
Notemos que la presión central siempre es finita para todos los valores de
densidad, masa y/o radio.
La ecuación relativista de equilibrio se puede integrar en forma exacta, obte-
niendo q q
1 − 8πGρ
3c2
0
R 2− 1 − 8πGρ 0 2
3c2 r
2
p = ρ0 c q q (503)
1 − 8πGρ 0 2 8πGρ0 2
3c2 r − 3 1 − 3c2 R

Remplazando la densidad en términos de la masa total y el radio de la


estrella, tenemos
q q
1 − 2GM
2
c R − 1 − 2GM
c2 R3 r
2
p = ρ0 c2 q q (504)
1 − 2GM
2
c R 3 r 2 − 3 1 − 2GM
2
c R

Por lo tanto la presión en el centro de la distribución, requerida para el


equilibrio está dada por
q
1 − 8πGρ 2
3c2 R − 1
0

pc = ρ0 c2 q (505)
1 − 3 1 − 8πGρ
3c2
0
R 2
0.17. MÉTRICA PARA EL INTERIOR DE UNA MASA ESFÉRICA ci

en términos de la densidad, y por


q
1 − 2GM
c2 R − 1
pc = ρ0 c2 q (506)
1 − 3 1 − 2GMc2 R

en términos de la masa total. Notemos que la ecuación [?] se reduce, para bajas
velocidades a
− 4πGρ
3c2 R
0 2
pc ' ρ0 c2 4πGρ0 2
−2 + c2 R
2πG 2 2
' ρ R
3 0
lo cual corresponde al límite Newtoniano. Sin embargo la presión central rela-
tivista, a diferencia de la Newtoniana, diverge para (ver ecuación 506)
r
2GM
3 1− 2 =1 (507)
c R
esto significa que si un objeto de masa dada colapsa hasta alcanzar un radio de
9GM
R= (508)
4c2
entonces se requeriría una presión infinita para mantener el equilibrio, es decir
el colapso sería inevitable, o equivalentemente un objeto de esta masa y radio
no puede existir. Este resultado relativista de la existencia de una cota superior
para la masa no es un resultado debido al modelo simplificado de un objeto con
densidad uniforme, que por cierto está lejos de ser un modelo realista de un
objeto celeste típico. De hecho para un objeto como una estrella, en cualquiera
de sus etapas de evolución, se espera que la densidad aumente hacia su interior.
En términos más generales: si consideramos una distribución esférica de masa
monotónicamente decreciente dρ/dr ≤ 0, entonces se debe tener que ρ ≥ 0, pues
al llegar a la superficie del cuerpo la solución debe coincidir con Schwarzschild
para la cual ρ = 0. Inversamente, si suponemos que tenemos un fluido con ρ ≥ 0
descrito por una ecuación de estado p = p(ρ) con p ≥ 0 y dp/dρ ≥ 0 entonces
la ecuación 495 implica dp/dr ≤ 0 y por lo tanto dρ/dr ≤ 0. Entonces se puede
mostrar que bajo la suposición general de una distribución esférica de masa
no negativa ρ ≥ 0 y por tanto monótona decreciente de r, existen dos tipos de
límites superiores para la masa de una estrella en relatividad general: El primero
para una estrella de radio R dado, la máxima masa posible es Mmax = 4R/9 y
el segundo, dada una ecuación de estado razonable para densidades por debajo
de alguna densidad dada ρ0 existe un límite superior de la masa cuando la
densidad alcanza valores superiores a ρ0 independiente de la ecuación de estado.
Es importante anotar en este punto que clásicamente, para cada ecuación de
estado hay un límite superior de la masa para la cual la presión central no
puede mantener el equilibrio y el colapso es inevitable, pero lo que establece la
cii COLAPSO GRAVITACIONAL

relatividad general es que aparece un límite superior de la masa independiente de


la ecuación de estado, lo cual indica un colapso inevitable independientemente
de las condiciones físicas de la materia, i.e. de la ecuación de estado asumida.
Para finalizar esta sección veamos algunos resultados cualitativos del colapso
estelar. Para esto consideremos primero una distribución de materia fria, esto es
los efectos de la presión de radiación serán despreciados. Es conocido el compor-
tamiento de la materia para densidades por debajo de la densidad de la materia
nuclear (∼ 1014 grcm−3 ). Para esta situación la contribución dominante a la
presión proviene de la presión de degeneración electrónica. Para una densidad
ne de electrones baja (ne ¿ m3e c3 /~3 ∼ 1031 cm−3 ) la presión de degeneración
está dada por
¡ ¢2/3
~2 3π2
p= n5/3
e (509)
5me
mientras que para densidades mayores a 1031 cm−3 la presión toma la forma
¡ ¢1/3
~c 3π2
p= n4/3
e (510)
4
Esta presión del gas de electrones es la que en últimas determina las config-
uraciones de equilibrio de las estrellas hasta un cierto límite de masa, calculado
por primera vez por Chandrasekhar en 1939, y dado por la relación
µ ¶2
2
Mc ' 1.4 Ms (511)
µN

en donde µN es el número de nucleones por electrón y Ms ∼ 2 × 1033 gr la


masa solar. En la figura se muestra un gráfico cualitativo del comportamiento
de las posibles configuraciones de una estrella, graficando la masa en unidades
de la masa solar en función del radio de la estrella. La parte de la curva entre
los puntos 1 y 2 representa las configuraciones de equilibrio soportadas por
la presión del gas de electrones y corresponden a las estrellas conocidas como
enanas blancas. A partir del punto 2, que representa el límite de Chandrasekhar
para enanas blancas, si la densidad sigue aumentando se entra en una situación
donde no se puede alcanzar una configuración de equilibrio, es decir la presión
del gas de electrones ya no es suficiente para mantener el equilibrio y comiensa
la masa a colapsar. En esta situación se inicia una reación de conversión de
electrones y protones en neutrones

p + e− −→ n + υe

donde υ e son neutrinos. Cuando la densidad de la materia se acerca a la densidad


nuclear, se alcanza el punto 3 de la curva, a partir del cual se entra en una
región de configuraciones de equilibrio, en donde ahora es la presión del gas
degenerado de neutrones que mantiene el equilibrio. Esta es la región de las
estrellas neutrónicas. El punto 4 de la curva representa la máxima masa a
partir de la cual el equilibrio se pierde y el colapso es inevitable. Este valor
0.17. MÉTRICA PARA EL INTERIOR DE UNA MASA ESFÉRICA ciii

Figure 8:

máximo tiene una mayor incertidumbre debido a que la ecuación de estado para
la materia no se conoce. Sin embargo se ha calculado un límite superior del
orden de 5Ms .
El análisis anterior se realizo para materia fria. En la realidad la componente
fundamental para la presión proviene de la radiación debido a las reaciones
nucleares que tienen lugar al interior de las estrellas y por tanto los límites
superiores de masas son mayores. Pero debido a que esta radiación escapa
de las estrellas, estas se van enfriando y los cálculos anteriores para materia
fria se aplican. Por ejemplo si la masa de la estrella es inferior al límite de
Chandrasekhar la estrella se enfriaría lentamente hasta apagarse, llegando a
una configuración final de enana blanca. Pero si la masa es superior a este
límite, comensaría un proceso muy lento de colapso, mientras la estrella radía,
y luego entraría en la etapa de una estrella neutrónica. En este proceso, debido
a la fusión nuclear del hidrógeno en helio y luego en núcleos más pesados, se
forma una corteza de níquel y hierro, la cual es mantenida en equilibrio por la
presión del gas de neutrones.
En esta fase del colapso, de la cortesa de níquel y hierro, es probable que
se produzca una onda de choque que se propaga desde el interior de la estrella,
expulsando la materia exterior a la corteza y dando lugar a un evento de super-
nova.
civ COLAPSO GRAVITACIONAL
Agujeros negros

Como vimos en el capítulo anterior, el colapso gravitacional de estrellas cuya


masa supera el límite de Chandrasekhar es inevitable, en el sentido que pasado
cierto límite e independiente de la ecuación de estado que rige para la materia,
no es posible alcanzar una configuración de equilibrio. En este punto surgen dos
preguntas fundamentales: Cual es el estado final de un objeto que colapsa? y
como se describe la métrica del campo gravitacional de este objeto?.
Teniendo en cuenta el teorema de Birkhoff (visto en un capítulo anterior),
sabemos que la única solución para el exterior de una distribución esférica de
materia está dada por la métrica de Schwarzschild. Esto significa que el campo
gravitacional en el exterior de un objeto bajo colapso esféricamente simétrico
está dado por la métrica de Schwarzschild, lo cual respondería a la segunda
pregunta. Por tanto dedicaremos la primera sección a complementar el estudio
de las propiedades de esta métrica.
Los resultados de esta sección nos darán, de paso, una respuesta a la primera
pregunta: el resultado final de una estrella bajo colapso es un estado de densi-
dad infita y radio cero, denominada una singularidad o agujero negro, dejando
como único parámetro observable la masa total. Evidentemente esta respuesta,
más que resolver la pregunta, plantea nuevos inerrogantes, los cuales han dado
lugar a nuevos campos de investigación, tanto en el ámbito matémático, es-
tructura matemática del espacio-tiempo y teoría de singularidades, como en la
construcción de una teoría cuántica de la gravedad y el papel fundamental de
los agujeros negros en la astronomía y astrofísica observacional.

0.18 Agujero negro de Schwarzschild


En el capítulo cuarto encontramos la solución de las ecuaciones de campo de
Einstein para el exterior de una distribución esférica de materia, dada por la
métrica se Schwarzschild:
µ ¶ µ ¶−1
2Gm ¡ 0 ¢2 2Gm
g = 1− 2 dx − 1− 2 dr2 − r2 dΩ2 (512)
c r c r
La métrica presenta dos comportamientos singulares: el primera para el
radio
2Gm
r ≡ rs = 2 (513)
c

cv
cvi AGUJEROS NEGROS

llamado el radio de Schwarzschild y el segunda para r = 0. Esto quiere decir


que los coeficientes del tensor métrico divergen o se anulan. Además, cuando
la coordenada radial r toma valores entre 0 y rs los signos de los coeficientes
métricos g00 y grr cambian y por lo tanto la coordenada radial r pasa ahora
a tomar el carácter de una coordenada temporal y la coordenada t toma el
carácter de una coordenada espacial. Este comportamiento de la métrica y su
significado debe ser cuidadosamente analizado, pues la interpretación física debe
ser independiente de las coordenadas.
Un primer resultado importante que podemos obtener es el cálculo de las
componentes del tensor de Riemann, evaluadas en el radio de Schwarzschild rs .
1 1
Por ejemplo, las componentes R212 = R313 están dadas por:
1 1
R212 = R313
µ ¶ Ã µ ¶−1 !
1 2Gm d 2Gm
= 1− 2 ln 1 − 2
r c r dr c r
1
∼ (514)
r3
las cuales son finitas para r → rs = 2Gm/c2 , pero divergen para r → 0.
Antes de continuar con el comportamiento de la métrica para coordenadas ra-
diales menores que el radio de Schwarzschild, consideremos la trayectoria de
una partícula que cae radialmente desde un punto con r0 > rs . Del intervalo
espacio-tiempo para la métrica de Schwarzschild, una partícula en movimiento
radial, dΩ2 = 0, y por lo tanto
µ ¶ µ ¶−1
2Gm ¡ 0 ¢2 2Gm
ds2 = c2 dτ 2 = 1 − 2 dx − 1− 2 dr2 (515)
c r c r
La ecuación para la geodésica radial está dada por la ecuación 367 con L2 =
0, entonces ³ rs ´
ṙ2 + 1 − = E2 (516)
r
Consideremos una partícula de prueba que se deja caer libremente desde un
punto r = R, entonces de la ecuación anterior tenemos que la constante E está
dada por ³ rs ´
1− = E2 (517)
R
y por lo tanto la ecuación de movimiento radial toma la forma
³r rs ´1/2
s
ṙ = − (518)
r R
Teniendo en cuenta que
dr dr
ṙ = = (519)
ds cdτ
podemos integrar la ecuación 518 en forma paramétrica
R
r= (1 + cos η) (520)
2
0.18. AGUJERO NEGRO DE SCHWARZSCHILD cvii

µ ¶1/2
1 R3
τ= (η + sin η) (521)
c 4rs
con la condición inicial r(η = 0) = R y τ (η = 0) = 0. Cuando la partícula
alcanza el origen r = 0, entonces η = π y el tiempo propio es finito
µ ¶1/2
π R3
τ= (522)
2c rs

es decir, para un reloj que viaja con la partícula, ésta cáe en un tiempo finito.
Calculemos ahora el tiempo coordenado, el cual corresponde al tiempo medido
por un observador situado en la región asintótica (i.e. lejos de la masa). Para
este fin consideremos la ecuación 364 para la coordenada radial:
³ rs ´
1− ṫ = E (523)
r
entonces
dr dt dr E
ṙ = = ¡ ¢ (524)
dt ds dt 1 − rrs

Para integrar esta ecuación es conveniente definir una nueva coordenada


radial ¯ ¯
¯r ¯
r = r + rs ln ¯ − 1¯¯
∗ ¯ (525)
rs
pues

dr∗ dr rs 1 dr
= + r
dt dt rs − 1 rs dt
1 dr
= (526)
1 − rrs dt

entonces la ecuación 524 toma la forma


dr∗
ṙ = E (527)
dt
Reemplazando esta ecuación en 516 tenemos
µ ¶2 ³
dr∗ rs ´
E + 1− = E2 (528)
dt r

Aun cuando esta ecuación no se puede integrar en forma cerrada, podemos


encontrar el comportamiento del radio en función de la coordenada temporal
cuando r → rs . En este límite la ecuación anterior se aproxima a

dr∗
' −1 (529)
dt
cviii AGUJEROS NEGROS

Figure 9: Comparación tiempo coordenado y propio

Se ha tomado el signo menos dado que la partícula está en caida. Integrando


esta ecuación, y reemplazando r∗ por su definición, tenemos
µ ¶
r
r∗ = r + rs ln − 1 = −Kt (530)
rs
en donde K es una constante de integración. Entonces en la aproximación que
estamos considerando obtenemos
r ' rs + K̃e−t/rs (531)
lo cual implica que la partícula requiere un tiempo infinito para llegar a r = rs
para un observador asintótico. En la figura 9 se muestra la comparación entre
el tiempo de caida medido por un observador asintótico (tiempo coordenado) y
el tiempo medido por un observador que cáe con la partícula (tiempo propio).

0.19 Coordenadas de Kruskal


Como vimos en la sección anterior, a pesar del comportamiento singular de la
métrica de Schwarzschild en el punto r = rs el tensor de Riemann es finito, lo
que implica que este comportamiento singular es debido a las coordenadas y no
es una característica intrínseca de la métrica. Además, si escribimos la ecuación
geodésica nula radial ds = 0, i.e., la ecuación que describe un rayo de luz que
incide o sale radialmente, en coordenadas de Schwarzschild, tenemos que
µ ¶
dr 2Gm
=± 1− 2 (532)
dt c r
lo cual implica que la velocidad coordenada radial del fotón, para el observador
asintótico tiende a cero, cuando r → rs . Adicionalmente, para 0 < r < rs la
0.19. COORDENADAS DE KRUSKAL cix

métrica es de nuevo regular, pero el signo de las coordenadas radial y temporal


cambia, es decir r se comporta ahora como una coordenada temporal y t como
una coordenada espacial, perdiendo así la métrica su caracter estático.
Para abolir este comportamiento anómalo de las coordenadas y para exten-
der la solución de las ecuaciones de campo de Einstein en el vacío con simetría
esférica más allá de r = rs Kruskal en 1960 buscó una transformación de coorde-
nadas de tal manera que la métrica exhibiera un comportamiento regular en el
radio de Schwarzschild. Para este fin se propone encontrar una transformación
de coordenadas (t, r) → (u, v), manteniendo las coordenadas angulares, de tal
manera que la métrica tome la forma

ds2 = f 2 (u, v)(dv 2 − du2 ) − r2 (dθ2 + sin2 θdϕ2 ) (533)

en donde la función f (u, v) no se anule para r = rs . Notemos que en estas


coordenadas la métrica es conforme a la métrica de Minkowski y la ecuación
geodésica para fotones radiales (conos de luz radiales) toma la forma
du
= ±1 (534)
dv
Para encontrar la función f y las ecuaciones de transformación de las coor-
denadas, escribamos en forma explícita la ecuación de transformación para las
componentes del tensor métrico:
∂ x̃γ ∂ x̃σ
gαβ = g̃γσ (535)
∂xα ∂xβ
en donde xα son las coordenadas de Schwarzschild, x̃γ las coordenadas de
Kruskal que estamos buscando, gαβ las componentes del tensor métrico en co-
ordenadas de Schwarzschild y g̃γσ en coordenadas de Kruskal. Remplazando
en la ecuación 535 las componentes del tensor métrico, obtenemos el siguiente
sistema de ecuaciones diferenciales
"µ ¶2 µ ¶2 #
rs 2 ∂v ∂u
1− =f − (536)
r ∂x0 ∂x0
"µ ¶ µ ¶2 #
³ rs ´−1 ∂v
2
∂u
2
− 1− =f − (537)
r ∂r ∂r
∂u ∂u ∂v ∂v
0= 0
− 0 (538)
∂x ∂r ∂x ∂r
Definiendo una nueva coordenada radial, como en 525,
¯ ¯
¯r ¯
r = r + rs ln ¯ − 1¯¯
∗ ¯ (539)
rs
y la función
1 − rrs
F (r∗ ) = (540)
f2
cx AGUJEROS NEGROS

en donde se ha asumido que la función f solo depende de r. Entonces las


ecuaciones 536, 537 y 538 toman la forma
µ ¶2 µ ¶2
∂v ∂u
F (r∗ ) = − (541)
∂x0 ∂x0
µ ¶2 µ ¶2
∗ ∂v ∂u
−F (r ) = − (542)
∂r∗ ∂r∗
∂u ∂u ∂v ∂v
= (543)
∂x0 ∂r∗ ∂x0 ∂r∗
Sumando las dos primeras ecuaciones y sumando y restando dos veces la
tercera obtenemos
µ ¶2 µ ¶2
∂v ∂v ∂u ∂u
+ = + (544)
∂x0 ∂r∗ ∂x0 ∂r∗
µ ¶2 µ ¶2
∂v ∂v ∂u ∂u
0
− ∗ = 0
− ∗ (545)
∂x ∂r ∂x ∂r
Tomando la raíz de la primera ecuación con signo relativo positivo y la raíz
de la segunda ecuación con signo negativo (si se toma el mismo signo relativo en
las raices de las dos ecuaciones el jacobiano de transformación podría anularse)
y sumando y restando las ecuaciones resultantes, tenemos que
∂v ∂u
= ∗ (546)
∂x0 ∂r
∂v ∂u
= (547)
∂r∗ ∂x0
y derivando llegamos al sistema de ecuaciones

∂2u ∂2u
− =0 (548)
∂x02 ∂r∗2
∂2v ∂2v
− =0 (549)
∂x02 ∂r∗2
cuya solución general (D ´Alembert) es de la forma

u = h(r∗ + x0 ) − g(r∗ − x0 ) (550)

v = h(r∗ + x0 ) + g(r∗ − x0 ) (551)


Remplazando estas soluciones en el sistema de ecuaciones 541, 542 y 543,
la tercera ecuación se satisface idénticamente, mientras que las dos primeras
ecuaciones conducen a la ecuación

−4h´(r∗ + x0 )g´(r∗ − x0 ) = F (r∗ ) (552)


0.19. COORDENADAS DE KRUSKAL cxi

Para resolver esta ecuación, diferenciemos con respecto a x0 y r∗ para obtener


las siguientes ecuaciones diferenciales

F´(r∗ ) h´(r∗ + x0 ) g´(r∗ − x0 )


= + (553)
F (r∗ ) h´(r∗ + x0 ) g´(r∗ − x0 )

h´(r∗ + x0 ) g´(r∗ − x0 )
0= − (554)
h´(r∗ + x0 ) g´(r∗ − x0 )
donde la prima representa derivada con respecto al argumento de la función.
Remplazando la ecuación [?] en [?] tenemos que
£ ¤
[ln F (r∗ )]´= 2 ln h´(r∗ + x0 ) ´ (555)

si tratamos r∗ y r∗ +x0 = y como variables independientes, entonces la ecuación


anterior implica que los dos lados de la ecuación son iguales a una constante:

[ln F (r∗ )]´ = 2η (556)


£ ¤
ln h´(r∗ + x0 ) ´ = η (557)

integrando estas ecuaciones tenemos y eligiendo la constante de integración ade-


cuada, la soluciones se pueden escribir en la forma

F (r∗ ) = η2 e2ηr (558)
1 η(r∗ +x0 )
h(r∗ + x0 ) = e (559)
2
y remplazando esta última ecuación en [?] tenemos que
1 ∗ 0
g(r∗ − x0 ) = − eη(r −x ) (560)
2
donde se ha tomado el signo de g y h diferente para mantener la función F > 0
(ver ecuación [?]). Con estos resultados las coordenadas u y v toman la forma

u = h(r∗ + x0 ) − g(r∗ − x0 )
1 η(r∗ +x0 ) 1 η(r∗ −x0 )
= e + e
2 2

= eηr cosh(ηx0 )
= eηr+rs ln| rs −1| cosh(ηx0 )
r

µ ¶rs η
ηr r
= e −1 cosh(ηx0 ) (561)
rs

similarmente

v = h(r∗ + x0 ) + g(r∗ − x0 )
µ ¶rs η
r
= eηr −1 sinh(ηx0 ) (562)
rs
cxii AGUJEROS NEGROS

y la función f está dada por

1 − rrs
F (r∗ ) = (563)
f2
entonces
1 − rrs
f2 =
η 2 e2ηr∗
µ ¶1−2rs η
rs −2ηr r
= e −1 (564)
η2r rs

Finalmente se escoge la constante de integración η de tal manera que la función


f 2 sea diferente de cero para r = rs , así se requiere que

1 − 2rs η = 0 (565)

Con esta escogencia tenemos que la transformación de coordenadas está dada


por r
r ct
u= − 1er/2rs cosh( ) (566)
rs 2rs
r
r ct
v= − 1er/2rs sinh( ) (567)
rs 2rs
y la función f
4rs3 −r/rs
f2 = e (568)
r
Por lo tanto la métrica de Schwarzschild en coordenadas de Kruskal (v, u),

ds2 = f 2 (u, v)(dv 2 − du2 ) − r2 (u, v)(dθ2 + sin2 θdϕ2 ) (569)

es finita para r → rs , en donde r es una función implícita de u y v. Para


entender el significado de estas nuevas coordenadas consideremos un gráfico
espacio-tiempo en el plano (v, u).
A partir de la ecuaciones 566 y 567 podemos despejar las coordenadas r y
x0 = ct: µ ¶
2 2 r
u −v = − 1 er/rs (570)
rs
µ ¶
v ct
= tanh (571)
u 2rs
En primer lugar, en las coordenadas de Schwarzschild se debe cumplir que
r > rs , lo cual equivale a la región I en la figura 10, es decir

u2 − v 2 > 0 ⇐⇒
u > |v| (572)
0.19. COORDENADAS DE KRUSKAL cxiii

Figure 10: Coordenadas de Kruskal

y los puntos r = const. corresponden a hipérbolas en esta región, mientras que


la coordenada t = cont. corresponde a rectas que pasan por el origen. Esto
significa que la región I la cual está limitada por las rectas u = ±v con u > 0,
corresponde a la región r > rs y −∞ < t < ∞ en coordenadas de Schwarzschild,
pues la recta u = −v representa t = −∞ y la recta u = v representa t = +∞.
Las hipérbolas en esta región tienen como asíntotas a las rectas u = |v| y
cuando r → rs entonces la hipérbola degenera en el punto u = v = 0. Sin
embargo la región (en coordenadas de Kruskal) para la cual la métrica 569 es
no singular corresponde a todos los valores las coordenadas tales que la función
f 2 sea finita y no nula, lo cual sucede para r 6= 0. Es decir la región para la
cual las coordenadas de Kruskal es regular está delimitada por la curva r = 0 o
equivalentemente (ver ecuación 570)
v 2 − u2 = 1 (573)
Notemos además que la coordenada r está univocamente definida como una
función de (u, v) si v 2 − u2 < 1, pues la función
µ ¶
r
− 1 er/rs (574)
rs
es monótona para r > 0.
En la derivación de las coordenadas de Kruskal se escogió (arbitrariamente) el
signo de h positivo y así g negativo. Si se escoge el signo al contrario obtenemos
la transformación (u, v) → (−u, −v). Es decir las regiones I y III en la figura
son isométricas.
Un cálculo directo muestra que la solución de Schwarzschild para 0 < r < rs
también es solución de las ecuaciones de Einstein en el vacío, pero ahora la
cxiv AGUJEROS NEGROS

coordenada r se comporta como una coordenada temporal mientras que t se


comporta como una coordenada espacial. Además, la solución para esta región
se puede transformar isométricamente en la región II de la figura 10. Para ver
esto consideremos de nuevo la deducción de la métrica de Kruskal. Dado que
0 < r < rs entonces F (r∗ ) < 0 y por lo tanto los signos de h y g deben ser
iguales. Si se escogen los signos positivos obtenemos
p t
u= 1 − r/rs er/2rs sinh( ) (575)
2rs
p t
v= 1 − r/rs er/2rs cosh( ) (576)
2rs
con esta transformación la métrica de Kruskal y la función f son las mismas.
Así bajo esta transformación la imagen de la región 0 < r < rs es la región II
en la figura. La transformación inversa está dada por
µ ¶
2 2 r
v −u = 1− er/rs (577)
rs
µ ¶
u ct
= tanh (578)
v 2rs
Si se escogen los signos de las funciones g y h negativos, entonces es equiva-
lente a la transformación (u, v) → (−u, −v), lo que implica que las regiones II y
IV son isométricas. Sobre la hipérbola v 2 − u2 = 1 la métrica es singular, pues
allí el tensor de Riemann diverge. Las cuatro regiones de la figura, I, II, III, y
IV constituyen la variedad de Schwarzschild-Kruskal.
Finalizaremos esta sección enunciando (sin demostración) el teorema de
Birkhoff generalizado

Theorem 89 Toda solución de clase C 2 de las ecuaciones de Einstein en el


vacío la cual es esféricamente simétrica en un subconjunto abierto U es local-
mente isométrica a una porción de la variedad de Schwarzschild-Kruskal
Cosmología

La hipótesis fundamental sobre la cual se basa el modelo estándar de la cos-


mología lo constituye el principio cosmológico, el cual establece que a gran escala
el universo es homogeneo e isotrópico. Esto significa que el universo observado
es el mismo para cualquier observador, sin importar el punto desde el cual se
esté observando o la dirección, es decir a gran escala la distribución de materia
en el universo (la densidad de galaxias y su movimiento) es independiente de
la dirección y el lugar desde el cual se observe. La hipótesis cosmológica es-
tábasada sobre la observación de la distribución de galaxias y radiación cósmica
de fondo.
Las ecuaciones de campo de Einstein permiten describir la geometría del
espacio-tiempo, determinada por la distribución de materia en el universo. La
forma más sencilla para describir la distribución de materia en el universo que
satisface el principio cosmológico, lo constituye el modelo del fluido perfecto, en
donde las galaxias son las partículas que conforman el fluido cósmico. Al igual
que en la dinámica de fluidos, en donde la materia está constituida por partícu-
las, se asume que las escalas de observación son lo suficientemente grandes para
que el elemento de volumen contenga un número suficiente de partículas y el
fluido, visto como una distribución continua de materia, sea una buena aproxi-
mación para describir la dinámica de este sistema.

0.20 Métrica de Robertson-Walker


Antes de entrar a resolver las ecuaciones de Einstein para este modelo de uni-
verso, los argumentos de simetría establecidos por el principio cosmológico nos
permiten avanzar en la forma general de la métrica, independientemente de
la forma explícita del tensor momentun-energía que describa la materia en el
universo.
Para encontrar la forma más general de la métrica que satisface el principio
cosmológico, estableceremos las siguientes hipótesis, como punto de partida:
H-1. Postulado de Weil: Las líneas de universo de las galaxias forman un
haz de geodésicas {Γ} que no se interceptan y ortogonales a una familia de
hipersuperficies {Σ} como de espacio.
H-2. A cada hipersuperficie Σ le corresponde una coordenada temporal x0 .
H-3. Cada hipersuperficie Σ es locamente isotrópica.

cxv
cxvi COSMOLOGÍA

Figure 11: Coordenadas cosmológicas

H-4. Todo par de puntos sobre cada hipersuperficie Σ son equivalentes.


Los postulados H-1 y H-2 corresponden a la escogencia de un sistemas de
coordenadas gaussiano: Sea Σ una hipersuperficie de la familia {Σ} de H-1y se
n un vector unitario normal a Σ, entonces se debe satisfacer que
g(n, n) = gµν nµ nν > 0 (579)
Sea x̃i = (x̃1 , x̃2 , x̃3 ) las coordenadas de un punto p̃ ∈ Σ y Γ la geodésica
que pasa por este punto p̃ ∈ Σ con vector tangente n. Sobre la geodésica Γ
definamos las coordenadas (x0 , x1 , x2 , x3 ) de un punto p ∈ Γ por:
x0 = longitud de arco p̃p sobre Γ (580)
i i
x = x̃ (581)
así, las coordenadas espaciales (x1 , x2 , x3 ) permanecen constante a lo largo de
cualquier geodésica Γ normal a Σ, y por lo tanto a lo largo de una de tales
geodésicas se debe cumplir que
¡ ¢2
ds2 = g00 dx0 (582)
Esto implica que siempre podemos reescalar la coordenada temporal x0 →

g00 x0 de tal manera que
¡ ¢2
ds2 = dx0 (583)
y por lo tanto la coordenada temporal x0 corresponde al tiempo propio medido
por un observador en reposo en una galaxia. Por esta razón todos observadores
sobre la misma hipersuperficie Σ registran el mismo tiempo tiempo x0 , lo cual
justifica el nombre de "tiempo cósmico".
La ortogonalidad de la geodésica Γ a la hipersuperficie Σ significa que en
esta coordenadas se debe tener que
g01 = g02 = g03 = 0 (584)
0.20. MÉTRICA DE ROBERTSON-WALKER cxvii

y por lo tanto el elemento de arco toma la forma


¡ ¢2
ds2 = dx0 + gij dxi dxj (585)
Esta es la razón por la cual las coordenadas elegidas se llaman "co-móviles",
pues a lo largo de cada una de las líneas de universo de las galaxias, geodésicas
Γ, las coordenadas espaciales xi de las galaxias no cambian, es decir las galaxias
permanecen en reposo respecto a estas coordenadas.
El postulado H-3 (isotropía local) implica que siempre es posible escoger
coordenadas de tal manera que reflejen la simetría esférica, es decir, el elemento
de línea espacial debe ser de la forma
dσ2 = dx2 + dy 2 + dz 2
= dr2 + r2 dΩ2 (586)
Por lo tanto la forma general del intervalo espacio-tiempo en estas coorde-
nadas debe ser de la forma
¡ ¢2 0
ds2 = dx0 − eG(x ,r) dσ2 (587)
en donde la función G no depende de las coordenadas angulares θ y ϕ por la
hipótesis de isotropía local y al escribir el elemento de arco de esta forma se
está garantizando que la signatura de la métrica se mantiene invariable en toda
la variedad.
El último postulado H-4 exige que dos observadores cualesquiera en puntos
diferentes sobre una hipersuperficie Σ "observen una física similar", es decir
lo único que puede diferir para los dos observadores es a lo más la escala de
medida. Esto significa que la razón de las distancias propias entre dos puntos
del espacio, con coordenadas (r1 , θ1 , ϕ1 ) y (r2 , θ2 , ϕ2 ) debe permanecer fija en
el tiempo, es decir debe ser independiente de x0 , así
0
eG(x ,r1 )
= F (r1 , r2 ); independiente de x0 (588)
eG(x0 ,r2 )
lo cual implica que la función G(x0 , r) debe ser de la forma
G(x0 , r) = g(x0 ) + h(r) (589)
con g y h funciones arbitrarias. Entonces la forma más general de la métrica
que satisface los postulados H-1 al H-4, es decir el principio cosmológico, está
dada por
¡ ¢2 0
ds2 = dx0 − eg(x ) eh(r) dσ 2 (590)
Consideremos ahora las ecuaciones de campo de Einstein. Para este fin
calculemos primero los símbolos de Chritoffel a partir de la ecuación de las
geodésicas y las ecuaciones de Euler-Lagrange (se deja como ejercicio). Deno-
tando por una prima las derivadas de una función respecto a su argumento, los
símbolos de Chritoffel no nulos son los siguientes:
1 g+h 1 2 g+h 1 2 g+h 2
Γ011 = g´e ; Γ022 = g´r e ; Γ033 = g´r e sin θ
2 2 2
cxviii COSMOLOGÍA

1 1
Γ101 = Γ202 = Γ303 = g´; Γ111 = h´
2 2
µ ¶ µ ¶
1 1 1 1
Γ122 = −r 2
h´+ 1
; Γ33 = −r 2
h´+ sin2 θ
2 r 2 r
1 1
Γ212 = Γ313 = h´+ ; Γ233 = − sin θ cos θ; Γ323 = − cot θ
2 r
A partir de estos símbolos, las componentes no nulas del tensor de Ricci
están dadas por (ejercicio):
3 3
g´+ g´2
R00 = (591)
2 4
µ ¶
1 1 3
R11 = h´+ h´− eg+h g´+ g´2 (592)
r 2 4
· µ ¶¸
1 1 31 1 3
R22 = r2 h´+ h´2 + h´− eg+h g´+ g´2 (593)
2 4 2r 2 4
R33 = sin2 θR22 (594)
además, las componentes contravariantes del tensor métrico son
µ ¶
µν g+h 1 g+h 1 g+h
g = diagonal 1, −e ,− 2e ,− 2 2 e (595)
r r sin θ
A partir de las ecuaciones anteriores el escalar curvatura toma la forma
µ ¶
¡ 2
¢ g+h 1 2 2
R = 3 g´+ g´ − 2e h´+ h´ + h´ (596)
4 r

Por lo tanto las ecuaciones de campo de Einstein, en componentes mixtas,


con constante cosmológica
1 8πG α
Rα β − Rg α β + Λg α β =− T β (597)
2 c2
conducen al siguiente sistema de ecuaciones acopladas
µ ¶
−g−h h´2 2h´ 3g´2 8πG
e h´+ + − + Λ = − 2 T0 0 (598)
4 r 4 c
µ ¶
−g−h h´2 h´ 3g´2 8πG
e + − g´− + Λ = − 2 T1 1 (599)
4 r 4 c

µ ¶
h´ h´ 3g´2 8πG
e−g−h + − g´− + Λ = − 2 T2 2
2 2r 4 c
8πG 3
= − 2 T 3 (600)
c
0.20. MÉTRICA DE ROBERTSON-WALKER cxix

8πG µ
0=− T ν ; µ 6= ν (601)
c2
La forma del tensor momentun-energía también debe manifestar la simetría
exigida por el principio cosmológico. Así, por isotropía local las componentes
espaciales del tensor momentun-energía T i j bajo una transformación ortogonal
de las coordenadas espaciales y por lo tanto todos sus valores propios deben ser
iguales. Esto significa que las componentes T i j deben ser un múltiplo de la
matriz unidad:
T i j = Aδ ij (602)
donde A es un escalar que solo depende de x0 y r. Puesto que δ ij = gji esta
ecuación es tensorial y por lo tanto es válida en todos los sistemas de coorde-
nadas, así se debe cumplir la condición

T1 1 = T2 2 = T3 3 (603)

entonces de las ecuaciones 599 y 600 la función h debe satisfacer la siguiente


condición:
h´2 h´ h´ h´
+ = + ⇔
4 r 2 2r
1 1
h´− h´2 − h´ = 0 (604)
2 r
Esta ecuación admite una primera integral

h´= areh/2 (605)

donde a es una constante de integración. Esta ecuación admite la solución


general
b2
eh = £ ¤ (606)
1 − ab r 2 2
4
con b otra constante de integración. Si definimos
1
|ab| = (607)
r02
entonces la ecuación 606 la podemos escribir en la forma
¡ ¢
h 1/ a2 r02
e =h i2 (608)
2
1 + k4 rr2
0

en donde k = 0, +1, −1 dependiendo si ab = 0, ab < 0 o ab > 0 respectivamente.


Además, dado que la constante b2 se puede absorber en la función eg entonces
la métrica se simplifica tomando la forma general
0
¡ ¢2 eg(x )
ds2 = dx0 − h i2 dσ
2
(609)
k r2
1 + 4 r2
0
cxx COSMOLOGÍA

La constante k determina, como veremos, un espacio plano (k = 0), esférico


(k > 0) o hiperbólico (k < 0).
Si utilizamos la expresión obtenida para la función h(r) para calcular la
expresión µ 2 ¶
−h h´ h´ a
e + = = const. (610)
4 r b
entonces teniendo en cuenta la ecuación [?] el sitema de ecuaciones 599 y 600
se reducen a
a −g 3g´2 8πG 8πG 2 8πG 3
e − g´− + Λ = − 2 T1 1 =− T 2 =− T 3 (611)
b 4 c c2 c2
Dado que el lado izquierdo de estas ecuaciones no depende explícitamente
de r, esto demuestra la homogeneidad del tri-espacio.
Antes de continuar con las ecuaciones de campo de Einstein, las cuales serán
el tema central del próximo capítulo, reescribamos el elemento de línea, ecuación
609,
dr2 + r2 dθ2 + r2 sin2 θdϕ2
ds2 = c2 dt2 − eg h i2 (612)
2
1 + k4 rr2
0

en una forma estándar. Para este fin la realizaremos las siguientes transforma-
ciones de coordenadasen: en primer lugar, con el fin de simplificar la expresiones
escribamos el elemento de línea en la forma
¡ ¢
ds2 = c2 dt2 − eg F (r)dr2 + r2 F (r)dΩ2 (613)

en donde · ¸−2
k r2 £ ¤−2
F (r) = 1 + 2 = 1 − αr2 (614)
4 r0
Definamos una nueva coordenada x por

x2 = r2 F (r) (615)

diferenciando esta expresión tenemos

2xdx = (r2 F´+ 2rF )dr (616)

despejando dr y remplazando en la expresión F (r)dr2 obtenemos

4x2 F
F (r)dr2 = dx2
(r2 F´+ 2rF )2
1 2
= ¡ ¢ dx (617)
rF´ 2
1 + 2F

De la definición 614 para la funció F tenemos que


4αr
F´= (618)
(1 − αr2 )3
0.20. MÉTRICA DE ROBERTSON-WALKER cxxi

entonces

= 4αrF 1/2 (619)
F
remplazando este resultado en la ecuación 617 se obtiene

1
F (r)dr2 = ¡ ¢2 dx
2
(620)
1 + 2αr2 F 1/2

para simplificar esta ecuación consideremos primero el denominador y remplace-


mos la función F , entonces:

2αr2
1 + 2αr2 F 1/2 = 1+
1 − αr2
1 + αr2
= (621)
1 − αr2
despejando la coordenada r de la ecuación 615

−1 + 1 + 4αx2
r= (622)
2αx
donde se ha tomado el signo positivo de la ecuaqción cuadrática dado que r ≥ 0.
Remplazando este resultado en la ecuación 621 tenemos

1 + αr2 1 + 4αx2 − 1 + 4αx2
= √ (623)
1 − αr2 −1 + 1 + 4αx2
y racionalizando esta expresión obtenemos

1 + αr2 p
= 1 + 4αx2 (624)
1 − αr2
remplazando esta expresión en la ecuación 620

1
F (r)dr2 = dx2 (625)
1 + 4αx2
de esta forma el elemento de línea 613 toma la forma
µ ¶
dx2
ds2 = c2 dt2 − eg + x 2
dΩ 2
1 + 4αx2
à !
2 2 g dx2 2 2
= c dt − e 2 + x dΩ (626)
1 − k xr2
0

definamos finalmente la transformación


x
x→r= (627)
r0
cxxii COSMOLOGÍA

en donde la nueva coordenada r es adimensional y no corresponde a la coor-


denada radial inicialmente utilizada. Con esta última definición obtenemos la
métrica de Robertson-Walker
µ ¶
dr2
ds2 = c2 dt2 − R2 (t) + r 2
dΩ2
(628)
1 − kr2

donde se ha remplazado la función eg y se ha absorbido una constante r0 , por


la función R2 (t) llamado el factor de escala, por las razones que se verán más
adelante.

0.20.1 Geometría espacial de la métrica de Robertson-


Walker
La parte espacial de la métrica de Robertson-Walker, ecuación 628 admite una
interpretación geométrica sencilla. Veamos inicialmente el caso k = 1, y con-
sideremos la longitud de la curva con r = cte. (círculo) en el plano ϕ = cte.
Entonces Z π
C=2 rRdθ = 2πrR (629)
0
y el área de la 2-esfera r = cte. está dada por
Z π Z 2π
A= dθ dϕr2 R2 sin θ = 4πr2 R2 (630)
0 0

sin embargo la distancia física radial (el radio físico del círculo y la dos esfera)
desde el origen de coordenadas a un punto de coordenada r es
Z Z r
dr
rf = ds = R(t) √
t,θ,ϕ=cte. 0 1 − r2
= R arcsin r 6= rR (631)

Este resultado ilustra la interpretación física de la función R como un factor


de escala. Para sustentar más claramente la interpretación geométrica de la
métrica de Robertson-Walker escribamos el elemento de arco ds en la forma
¡ ¢2
ds2 = dx0 − hij dxi dxj (632)

en donde hij son las componentes espaciales del tensor métrico. Las compo-
nentes del tensor de Riemann, de Rici y el escalar curvatura para la parte
espacial (3-variedad espacial), las cuales denotaremos por 3 Rijkl , 3 Rij y 3 R
respectivamente, están dadas por:

3 k
Rijkl = (hik hjl − hil hkj ) (633)
R2

3 2k
Rij = hij (634)
R2
0.20. MÉTRICA DE ROBERTSON-WALKER cxxiii

3 6k
R= (635)
R2
Notemos que para k = 0 se anulan y por lo tanto tenemos un 3-espacio
euclideano (tensor de Riemann globalmente nulo). Por completes, escribamos
las componentes del tensor de Rici y del escalar curvatura para la métrica de
Robertson-Walker (incluyendo los simbolos de Christoffel no nulos):
µ ¶
i 1 il ∂hlj ∂hlk ∂hjk
Γjk = h + − (636)
2 ∂xk ∂xj ∂xl

Ṙ Ṙ i
Γ0ij = hij Γi0j = δ (637)
R R j

R00 = −3 (638)
R
à !
R̈ Ṙ2 2k
Rij = − + 2 2 + 2 gij (639)
R R R
à !
R̈ Ṙ2 k
R = −6 + + (640)
R R 2 R2
notemos que en este caso si k = 0 el tensor de Rici y el escalar curvatura no
se anulan, pues en general el factor de escala es una función de la coordenada
tempotal R = R(t).
Consideremos ahora el caso simplificado de un espacio bi-dimensional homo-
geneo e isotrópico e ilustremos el caso de un espacio esférico S 2 (k = 1). Para
el espacio plano R2 (k = 0), y un espacio hiperbólico H 2 (k = −1) se puede
seguir un procedimiento similar.
Una 2-esfera de radio R se puede visualizar en R3 como una inmersión
de la superficie curva bidimensional en el espacio euclideano de coordenadas
(x1 , x2 , x3 ) por la ecuación:
¡ 1 ¢2 ¡ 2 ¢2 ¡ 3 ¢2
x + x + x = R2 (641)

con elemento de línea euclideano dado por


¡ ¢2 ¡ ¢2 ¡ ¢2
d 2 = dx1 + dx2 + dx3 (642)

Si eliminamos la coordenada x3 de la ecuación 641 el elemento de línea toma


la forma ¡ 1 1 ¢2
¡ ¢2 ¡ ¢2 x dx + x2 dx2
d 2 = dx1 + dx2 + (643)
R2 − (x1 )2 − (x2 )2
Definamos las nuevas coordenadas r̃ y θ̃ en términos de x1 y x2 por

x1 = r̃ cos θ̃ (644)

x2 = r̃ sin θ̃ (645)
cxxiv COSMOLOGÍA

Figure 12: 2-esfera en el espacio euclideano

Geométricamente r̃ y θ̃ corresponden a coordenadas polares en el plano x3 =


¡ ¢2
cte ( x3 = R2 − r̃2 ) como se muestra en la figura 12. En estas coordenadas el
elemento de línea se puede escribir en la forma:

2 2 r̃2 dr̃2 R2 dr̃2 2


d = dr̃2 + r̃2 dθ̃ + = + r̃2 dθ̃ (646)
R2 − r̃2 R2 − r̃2
Si definimos la coordenada adimensional

r= (647)
R
con 0 ≤ r ≤ 1, el elemento de línea toma la forma final
µ ¶
2 2 dr2 2 2
d =R + r dθ̃ (648)
1 − r2
cuya forma es similar a la métrica de Robertson-Walker para k = 1.
Otra forma de expresar el elemento de línea se obtiene si expresamos las
coordenadas de un punto sobre la 2-esfera en coordenadas esféricas θ y ϕ, para
las cuales tenemos las siguientes relaciones:

x1 = R sin θ cos ϕ (649)

x2 = R sin θ sin ϕ (650)


3
x = R cos θ (651)
entonces ¡ ¢
d 2
= R2 dθ2 + sin2 θdϕ2 (652)
0.20. MÉTRICA DE ROBERTSON-WALKER cxxv

la cual muestra de manera manifiesta que el 2-espacio es una esfera de radio R.


El volumen de esta 2-esfera (area de la esfera) se puede obtener a partir de la
integral
Z p Z 2π Z π
V = |h|d2 x = dϕ dθR2 sin θ = 4πR2 (653)
0 0

como era de esperarse, en donde h es el determinante del tensor métrico hij .


La esfera S 2 es homogenea e isotrópica y todos los puntos son equivalentes.
No hay fronteras y el espacio no es acotado, aún cuando su volumen es finito.
Si el radio R de la esfera varia, se expande o se contrae, los puntos sobre la
esfera no cambian sus coordenadas, lo cual justica en nombre de coordenadas
"co-móviles", además la distancia física entre dos puntos se escala con R y es
por esta razón que R se llama el factor de escala.
El espacio de curvatura clobal negativa (k = −1) no es posible representarlo
por una inmersión en R3 , pero su representación bidimensional se puede obtener
a partir de la anterior para la esfera haciendo el cambio de R → iR, y el elemento
de línea se puede escribir como
µ ¶
2 dr2 2
d = R2 + r2 dθ̃ (654)
1 + r2

o en la forma
¡ ¢
d 2
= R2 dθ2 + sinh2 θdϕ2 (655)

El espacio hiperbólico, es homogeneo e isotrópico, no acotado y de volumen


infinito. El caso del espacio con curvatura espacial nula (el plano k = 0) el
factor de escala no representa un radio, como en el caso de la 2-esfera, sino el
factor en el cual se escalan las distancias físicas entre puntos co-móviles.
Para finalizar esta sección la métrica de Robertson-Walker se puede expresar
en términos del tiempo conforme, definido como

dt
dη = (656)
R(t)

entonces µ ¶
dr2
ds2 = R2 (η) dη 2 − − r2 dθ2 − r2 sin2 θdϕ2 (657)
1 − kr2
lo cual muestra que la métrica de Robertson-Walker es conforme a la métrica
Minkowskiana.
Una condición necesaria y suficiente para que una métrica sea conforme a la
métrica de Minkowski es que el tensor curvatura de Weyl se anule. El tensor de
Weyl está definido, como la parte sin traza del tensor curvatura de Riemann,
por
[α β] 1 [α β]
C αβγδ = Rαβγδ − 2δ [γ R δ] + δ [γ δ δ] R (658)
3
cxxvi COSMOLOGÍA

0.21 Propiedades de la métrica de Robertson-


Walker
La métrica de Robertson-Walker se obtuvo a partir de consideraciones de simetría
(principio cosmológico) y está determinada salvo el factor de escala R y la con-
stante k que determina la geometría espacial. La forma precisa del factor de
escala y de la costante k se obtienen a partir de las ecuaciones de campo de
Einstein, sobre la base de un modelo para la distribución de materia, i.e., el
tensor energía-momentun, lo cual será el tema del siguiente capítulo. Sin em-
bargo, independientemente del modelo adoptado para la materia, es posible
obtener varias propiedades físicas a partir de la métrica de Robertson-Walker.
Esta sección está dedicada a estudiar algunas de consecuencias de la métrica de
Robertson-Walker.

0.21.1 Horizonte de eventos


Un primer resultado importante que presenta la métrica de Robertson-Walker lo
constituye la pregunta sobre el contacto causal. Es decir, sabemos que nuestro
universo está en espanción, lo cual se refleja en la métrica a través del factor de
escala y por lo tanto se plantea la pregunta ¿Para un observador como nosotros,
que parte del universo está en contacto causal con nosotros? o en otros términos:
Para un observador co-móvil situado en las coordenadas (t, r0 , θ0 , ϕ0 ) ¿para
cuales valores de (r, θ, ϕ) una señal de luz emitida en este punto en t = 0
alcanzaría al observador en o antes del instante t?
Para responder esta pregunta consideremos una señal de luz la cual sigue
una trayectoria que satisface la ecuación ds = 0. Dada la homogeneidad del
espacio, sin pérdida de generalidad y para simplicar los cálculos, tomemos r0 =
0, entonces las geodésicas de luz que pasan por r0 = 0 son curvas de θ y ϕ
constante, y por lo tanto dθ = dϕ = 0 y además la isotropía del espacio hace
que la escogencia de θ0 y ϕ0 sea irrelevante. Con estas consideraciones un rayo
de luz que parte del punto (rH , θ0 , ϕ0 ) en el instante t = 0 sigue una geodésica
tal que
dr2
ds2 = c2 dt2 − R2 (t) =0 (659)
1 − kr2
y alcanza el punto r0 = 0 en el instante t dado por

Z t Z rH  arcsin rH k=1
cdt´ dr
= √ = arcsinh rH k = −1 (660)
0 R(t´) 0 1 − kr2  rH k=0

La coordenada rH se llama el radio del horizonte. La distancia propia del


origen r0 = 0 al radio del horizonte en el instante t está dado por:
Z rH Z rH
√ dr
dH (t) = grr dr = R(t) √ (661)
0 0 1 − kr2
0.21. PROPIEDADES DE LA MÉTRICA DE ROBERTSON-WALKERcxxvii

la cual se puede escribir solamente en términos del factor de escala, utilizando


la ecuación 660, Z t
cdt´
dH (t) = R(t) (662)
0 R(t
´)
Si la distancia al horizonte dH es finita esto significa que nuestro cono de luz
pasado está limitado por un horizonte de partícula, una superficie bi-dimensional
como de espacio, la cual constituye la frontera entre el universo visible y la parte
del universo (sea finito o infinito) de la cual la lus no ha llegado a nosotros. Si la
distancia al horizonte dH es infinita significa que todo el universo es observable
y todos los puntos están en contacto causal. El comportamiento del factor de
escala R(t) en las vecindades de t = 0 determina si la distancia al horizonte es
finita o no. En el modelo estandar de la cosmología veremos que dH (t) ∼ t y
por lo tanto es finito.

0.21.2 Movimiento propio de una partícula en Robertson-


Walker
Consideremos ahora el comportamiento de una partícula en caída libre en la
métrica de Robertson-walker. Sea U µ las componentes de la cuadri-velocidad
de la partícula con respecto al sistema de coordenadas co-móviles. Entonces,
dado que la partícula está en caída libre sigue su línea de universo sigue la
ecuación geodésica
dU µ 1 dxβ
+ Γµαβ U α =0 (663)
ds c ds
en donde
dxα
Uα = (664)

Las componentes de la cuadri-velocidad están relacionadas con la velocidad de
la partícula v i = dxi /dt a través de la relación

U µ = (U 0 , U i ) = (cγ(v), γ(v)v i ) (665)

en donde
1
γ(|v|) = q (666)
2
1 − |v| /c2

|v|2 = hij v i v j (667)


Consideremos la componente µ = 0 de la ecuación de movimiento geodésico
para la partícula
dU 0 1
+ 2 Γ0αβ U α U β = 0 (668)
ds c
y utilizando la ecuación 637 para las conecciones, la ecuación anterior toma la
forma
dU 0 1 Ṙ
+ 2 hij U i U j = 0 (669)
ds c R
cxxviii COSMOLOGÍA

2
llamando |U| = hij U i U j la ecuación anterior se puede escribir como

dU 0 1 Ṙ
+ 2 |U|2 = 0 (670)
ds c R
Puesto que
¡ ¢2 ¡ ¢2
c2 = gαβ U α U β = U 0 − hij U i U j = U 0 − |U|2 (671)

implica que U 0 dU 0 = |U| d |U| y por lo tanto la componente 0 de la ecuación


de movimiento geodésico se transforma en la ecuación:

1 d |U| 1 Ṙ
+ 2 |U| = 0 (672)
U 0 ds c R
teniendo en cuenta que ds = cdτ entonces U 0 = dx0 /dτ = c2 dt/ds y esta
ecuación se puede escribir finalmente en la forma
1 d 1 d
|U| = − R (673)
|U| dt R dt

lo cual implica (integrando y llamando C la constante de integración) que

ln |U| + ln R = C =⇒ |U| ∝ R−1 (674)

Si expresamos esta ecuación en términos de la velocidad de la partícula


|U| = γ(v) |v| entonces
γ(v) |v| ∝ R−1 (675)
teniendo en cuenta que el cuadri-momentun físico de una partícula está dado
por pµ = m0 U µ la relación anterior implica que la magnitud del momentun de
la partícula disminuye (se corre hacia el rojo) si el factor de escala aumenta
(expansión del universo):
|p| ∝ R−1 (676)
Es decir en un universo en expansión, si una partícula se está moviendo respecto
a un observador co-móvil (tiene una velocidad peculiar) entonces ésta tiende al
reposo a medida que el universo se expande.

0.21.3 Corrimiento al rojo


Consideremos ahora la luz emitida por un objeto que se propaga en el espacio-
tiempo definido por la métrica de Robertson-Walker. Teniendo en cuenta la
relación entre momentun y frecuencia (o longitud de onda) para un fotón

p = }k (677)

con |k| = 2π/λ el número de onda, y notando que los resultados encontrados
en la sección anterior son independientes de la parametrización utilizada en la
ecuación geodésica, entonces teniendo en cuenta el análisis realizado en la sección
0.21. PROPIEDADES DE LA MÉTRICA DE ROBERTSON-WALKERcxxix

anterior para el movimiento de una partícula, ecuación 676, y consideramos una


partícula que en el instante t1 tiene momentun p1 y en un tiempo posterior t0
tendrá un momentun p0 relacionados por la ecuación:

|p1 | R(t1 ) = |p0 | R(t0 ) (678)

entonces de la ecuación 677 tenemos que se cumple la relación


λ1 R(t1 )
= (679)
λ0 R(t0 )
La interpretación física de esta ecuación es inmediata: si en el instante t1
se emite un rayo de luz de longitud de onda λ1 entonces un tiempo después t0
la longitud de onda del rayo ha cambiado de acuerdo con la relación 679, si el
universo se está expandiendo la longitud de onda aumenta proporcional al factor
de escala (corrimiento al rojo), si el universo se está contrayendo la longitud de
onda disminuye (corrimiento al azul).
Este mismo resultado se puede obtener, y es ilustrativo de la metodología
empleada, considerando la propagación de la luz como un fenómeno típicamente
ondulatorio. Supongamos que en el instante t1 se emite un frente de ondas desde
el punto de coordenadas r1 y de longitud de onda λ1 , es detectada en el origen
r0 = 0 en el instante t0 . Dado que el frente de ondas sigue una geodésica nula
ds2 , entonces la coordenada radial y la tamporal están relacionadas por
Z t0 Z r1
cdt´ dr
= √ = f (r1 ) (680)
t1 R(t´) 0 1 − kr2
Consideremos un segundo frente de ondas emitido en r1 en un instante pos-
terior t1 + δt1 y detectado en r = 0 en el instante t0 + δt0 , entonces este frente
también sigue una geodésica nula y por lo tante se debe cumplir que
Z t0 +δt0 Z r1
cdt´ dr
= √ = f (r1 ) (681)
t1 +δt1 R(t´) 0 1 − kr2
dado que el lado derecho de las ecuaciones 680 y 681 son iguales e independientes
del tiempo entonces tenemos que
Z t0 Z t0 +δt0
cdt´ cdt´
= (682)
t1 R(t
´) t1 +δt1 R(t
´)
aplicando las propiedades de la integral definida la expresión anterior toma la
forma Z t1 +δt1 Z t0 +δt0
cdt´ cdt´
= (683)
t1 R(t
´) t0 R(t
´)
Si el intervalo de tiempo δt es suficientemente pequeño entonces la ecuación
anterior se puede integrar para obtener
δt1 δt0
= (684)
R(t1 ) R(t0 )
cxxx COSMOLOGÍA

Si δt es el tiempo entre dos crestas sucesivas entonces cδt = λ es la longitud


de onda de la luz, así obtenemos de nuevo la relación 679.
En astronomía se define el factor de corrimiento z de un objeto en términos
de la razón de la diferencia de las longitudes de onda recibida y emitida con
respecto a la longitud de onda emitida
λ0 − λ1
z= (685)
λ1
o en forma equivalente, la cual es de uso más frecuente como
λ0 R(t0 )
1+z = = (686)
λ1 R(t1 )
Así, si el factor de escala está aumentando entonces z > 0 y se llama cor-
rimiento al rojo, en caso contrario z < 0 es el factor de corrimiento al azul.
Es importante aclarar que un objeto celeste, adicional al factor de corrim-
iento debido a la expansión del universo, puede tener también un cambio en
la frecuencia detectada debido a su velocidad peculiar respecto al observador,
conocido como el efecto Doppler.
La expansión del universo fue sugerida por primera vez en 1929 por Hubble,
quien encontró una relación entre el corrimiento al rojo que presentaban varias
galaxias y la distancia a nosotros. Esta relación conocida como la ley de Hubble
se puede obtener a partir de la métrica de Robertson-Walker, sin necesidad
de resolver las ecuaciones de campo de Einstein para algún modelo concreto.
Antes de entrar en la deducción de la ley de Hubble definiremos el concepto
fundamental de distancia el cual juega un papel fundamenta en cosmología y su
relación con la astronomía a gran escala.

0.21.4 El problema de la medida de distancias en cos-


mología
En la ecuación 661 definimos el concepto de distancia propia
Z r Z r
√ dr
dp (t) = grr dr = R(t) √ (687)
0 0 1 − kr2
entre el origen de coordenadas y un punto de coordenada radial r. Esta defini-
ción corresponde al concepto de distancia propia definido en relatividad especial.
Aún cuando esta definición de distancia corresponde a la idea que tenemos de
distancia, por ejemplo entre el sol y la tierra, para efectos de la astronomía a
gran escala esta definición no es muy relevante. Observacionalmente la distancia
entre objetos celestes se puede medir a partir de diferentes técnicas y por esto se
hace necesario definir diferentes conceptos de distancia dependiendo del método
utilizado. Claramente todas estas distancias no son independientes y existe una
relación entre todas ellas. Además para objetos cercanos con coordenada radial
r << 1 (o equivalentemente para objetos cuyas distancias propias estén por
debajo de 109 años − luz) todas prácticamente coinciden con la distancia propia
0.21. PROPIEDADES DE LA MÉTRICA DE ROBERTSON-WALKERcxxxi

definida en la ecuación 687. Observacionalmente dos definiciones de distancia


son relevantes en astronomía: La distancia de luminosidad dL y la distancia
diametral angular dA . La primera se basa en la relación entre la luminosidad
propia de un objeto y su luminosidad aparente, y la segunda en la relación entre
el diámetro propio de un objeto y el diámetro angular observado. En el caso de
un espacio euclideano estático, las tres distancias, dp , dL y dA , son equivalentes,
como veremos. Pero cuando el espacio no es euclideano y/o no es estático la
relación entre estas distancias depende, en general de la métrica del espacio.

Distancia de luminosidad
Consideremos en primer lugar la distancia de luminosidad dL . Para este fin
definamos en primer lugar la luminosidad aparente de una fuente medida por
un observador para el caso de un espacio euclideano estático. Para definir la
luminosidad aparente consideremos un telescopio de espejo circular de área A,
con el origen de coordenadas en el centro del espejo y la normal al espejo en
su centro n̂ en la dirección del objeto observado. Si la distancia euclideana de
la fuente al espejo la llamamos dL , entonces el flujo F que llega al espejo del
telescopio (energía incidente por unidad de área y por unidad de tiempo) es
igual a la energía por unidad de tiempo emitida por el objeto L (su luminosidad
propia o intrínseca) dividida entre el área total de la esfera de radio dL , es decir
L
F= (688)
4πd2L
Para el caso general, de un espacio no euclideano, definimos la distancia de
luminosidad como la relación entre la luminosidad propia del objeto L y el flujo
F medido por el observador, como
L
d2L = (689)
4πF
Notemos en primer lugar la diferencia entre las ecuaciones 688 y 689, aparente-
mente idénticas. En el caso euclideano, ecuación 688, dL corresponde a la distan-
cia euclideana entre la fuente y el observador, pero en el caso general, ecuación
689, dL no corresponde ni a la distancia a la cual se encontraba la fuente del
observador en el instante t1 de emisión de la radiación, ni a la distancia entre
fuente y observador en el instante t0 de observación. La razón para esto es la
siguiente: Consideremos una fuente co-móvil situada en la coordenada r1 que
emite un frente de radiación en el instante t1 , el cual es detectado por el obser-
vador situado en r = 0 en el instante t0 , entonces la conservación de la energía
implica que
L
F= (690)
4πR2 (t0 )r12 (1 + z)2
Para entender el origen de esta última ecuación notemos en primer lugar que
en el instante t0 de la llegada de la radiación al espejo del telescopio, el área de
la dos esfera que rodea la fuente (de radio coordenado r1 ) es
4πR2 (t0 )r12 (691)
cxxxii COSMOLOGÍA

ver ecuación 630, y por lo tanto la fracción del área cubierta por el espejo es
A
(692)
4πR2 (t0 )r12

Por otra parte debido a la expansión la energía por unidad de tiempo emitida
por la fuente se decrece en un factor (1 + z)2 cuando llega al espejo, pues de la
relación 679 la energía hc/λT de un fotón emitido en r1 en el instante t1 cuando
se detecta en el instante t0 decrece en un factor

λ0 R(t0 )
= =1+z (693)
λ1 R(t1 )

y el otro factor (1 + z) surge de la relación 684, pues si dos fotones son emi-
tidos con una diferencia de tiempo δt en la fuente, ellos llegan a la fuente con
una diferencia de tiempos de δt(1 + z). Así de la definición de distancia de
luminosidad, ecuación 689, la ecuación 690 implica que

dL = R(t0 )r1 (1 + z) (694)

la cual también se puede escribir en la forma


r1
dL = R2 (t0 ) (695)
R(t1 )

teniendo en cuenta la ecuación 686.

Diatancia diametral angular


La distancia diametral angular se basa sobre la relación entre el diámetro propio
del objeto emisor y el diámetro angular aparente. Sea D el diámetro propio de la
fuente situada en el punto de coordenada radial r1 y sea t1 el instante de emisión
de la señal. El observador situado en el origen de coordenadas detecta esta señal
en el instante t0 . Sin pérdida de generalidad podemos elegir las coordenadas
angulares para que el centro de la fuente esté en θ = 0. Como se muestra en la
figura 13, los rayos de luz que salen de los bordes opuestos de la lente y llegan
al punto de observación forman un ángulo δ.
De la métrica de Robertson-Walker, (r = cte, y ϕ = cte) el diámetro propio
de la fuente, con ∆θ = δ (aproximación válida para δ << 1) está dado por

D = R(t1 )r1 δ (696)

entonces el diámetro angular de la fuente es


D
δ= (697)
R(t1 )r1

En geometría euclideana el diámetro angular de una fuente de diámetro D


situado a una distancia d está dado por δ = D/d, por lo tanto definimos la
0.21. PROPIEDADES DE LA MÉTRICA DE ROBERTSON-WALKERcxxxiii

Figure 13: Distancia diametral angular

distancia diametral dA angular, en el caso general, de una fuente de diámetro


propio D, como
D
dA = (698)
δ
por lo tanto llegamos a la ecuación para la distancia diametral angular de un
objeto celeste
dA = R(t1 )r1 (699)
como una función de su coordenada radial y del factor de escala del universo
en el instante de emisión de la luz. Finalmente podemos obtener la relación
entre la distancia de luminosidad y diametral angular, teniendo en cuenta las
ecuaciones 686, 695 y 699:

dA R(t1 )r1 R2 (t1 )


= 2 r1 = 2 = (1 + z)−2 (700)
dL R (t0 ) R(t1 ) R (t0 )

Para objetos cercanos, es decir para r1 << 1 o equivalentemente z << 1, las


distancias propia, de luminosidad y diametral angular coinciden aproximada-
mente:
dp ≈ dL ≈ dA ≈ R(t0 )r1 (701)
Para finalizar esta sección daremos relación de la unidades de distancia
comúnmente utilizadas en astronomía:

1. La distancia promedio entre la tierra y el sol se define como la unidad


astronómica (a.u.)
1a.u. = 1.49589 × 108 km
cxxxiv COSMOLOGÍA

2. Un parsec (pc) se define como la distancia propia a la cual una estrella


presenta un paralaje trigonométrico de 1´; dado que en un radian hay
206.264, 8 segundos de arco, entonces

1pc = 3.0856 × 1013 km

3. Un año luz (a.l.) se define como la distancia recorrida por la luz en un


año, entonces
1a.l. = 9. 460 7 × 1012 km

4. Por lo tanto la relación entre estas unidades

1pc = 206264.8a.u.

1pc = 3.2615a.l.
1a.l. = 63242a.u

0.22 Ley de Hubble


En esta sección derivaremos la ley de Hubble como una consecuencia de la
métrica de Robertson-Walker. Hubble reportó en 1929 el resultado observa-
cional más importante de la astronomía en gran escala, pues con este resultado
se demostro que el universo no era estático, como se creia hasta entonces y dió
origen al modelo estandar de la cosmología actual. Las observaciones de los es-
pectros de varias galaxias distantes mostraban que éllas se estaban alejando de
nosotros, pues sus espectros presentaban un corrimiento al rojo, el cual dependia
de la distancia.
Para este fin expresemos la distancia de luminosidad dl en términos de z,
para lo cual debemos eliminar la dependencia explícita de r1 . Para este fin
deberiamos disponer de una expresión explícita del factor de escala R(t), lo cual
requiere resolver las ecuaciones de campos de Einstein. Sin embargo, aún sin
conocer R(t) podemos expresar los resultados en términos del valor del factor de
escala en la época actual, i.e. R(t0 ). En lo sucesivo, como es usual en cosmología,
t0 representa el tiempo presente. Para este fin expandiremos en serie de Taylor
las expresiones alrededor del tiempo presente, esto es en potencias de (t − t0 ).
Sea
R(t)
f (t) = (702)
R(t0 )
entonces
¯ ¯
df ¯¯ 1 d2 f ¯¯
f (t) = f (t0 ) + (t − t0 ) + (t − t0 )2 + · · · (703)
dt ¯t0 2! dt2 ¯t0

definiendo
Ṙ(t0 )
H0 = (704)
R(t0 )
0.22. LEY DE HUBBLE cxxxv

llamada la constante de Hubble, y

R̈(t0 ) R̈(t0 )
q0 = − R(t0 ) = − (705)
2
Ṙ (t0 ) R(t0 )H02

el parámetro de desaceleración, la ecuación 703 se puede escribir, hasta términos


de segundo orden, en la forma

R(t) 1
= 1 + H0 (t − t0 ) − q0 H02 (t − t0 )2 + · · · (706)
R(t0 ) 2

Teniendo en cuenta que


R(t0 )
=1+z (707)
R(t)

la ecuación anterior la podemos escribir como

1
1+z = 1 2
(708)
1 + H0 (t − t0 ) − 2 q0 H0 (t − t0 )2 + · · ·

Para valores pequeños de H0 (t − t0 ) esta ecuación se puede invertir (expan-


diendo el lado derecho) para obtener:
µ ¶
1
z = H0 (t0 − t) + 1 + q0 H02 (t0 − t)2 + · · · (709)
2

A partir de esta ecuación, resolviendo la ecuación cuadrática para (t0 − t) y


expandiendo el radical del discriminante de la ecuación obtenemos
· µ ¶ ¸
1
(t0 − t) = H0−1 z − 1 + q0 z 2 + · · · (710)
2

De la ecuación 680, que relaciona las coordenadas radial y temporal para un


frente de ondas emitido por la fuente ubicada en r en el instante t, integrando
la parte real y expandiendo el resultado
Z t0 Z r
cdt´ dr
= f (r) = √ =
t R(t´) 0 1 − kr2
 r 3
 arcsin r = r + 31 +··· k =1
= r =r k=0 (711)
 r3
arcsinh r = r − 31 + · · · k = −1

Para calcular la integral del lado izquierdo podemos utilizar la expansión


cxxxvi COSMOLOGÍA

706, y reteniendo términos hasta orden 2 en las expansiones obtenemos:


Z t0 Z t0
cdt´ c dt´
= 1 2 2
t R(t´) R(t 0 ) t 1 + H 0 (t
´− t0 ) − 2 q0 H0 (t´− t0 ) + · · ·
Z t0 · µ ¶ ¸
c 1 2 2
= 1 − H0 (t´− t0 ) + 1 + q0 H0 (t´− t0 ) + · · · dt´
R(t0 ) t 2
· ¸
c 1 ¡2 2
¢
= (t0 − t) + H0 t0 (t0 − t) − H0 t0 − t + · · ·
R(t0 ) 2
· ¸
c 1 2
= (t0 − t) + H0 (t0 − t) + · · · (712)
R(t0 ) 2
entonces de la ecuación 711, la coordenada r en primera aproximación está dada
por · ¸
c 1
r= (t0 − t) + H0 (t0 − t)2 + · · · (713)
R(t0 ) 2
Si remplazamos la ecuación 710 para (t0 − t) en la ecuación anterior, obten-
emos una relación para r en términos de z (reteniendo términos hasta z 2 ):
· µ ¶ ¸
c 1 1 2
r = H0−1 z − 1 + q0 z 2 + H0 H0−2 (z − · · ·) + · · ·
R(t0 ) 2 2
· ¸
c 1
= z − (1 + q0 ) z 2 + · · · (714)
R(t0 )H0 2
Finalmente la ecuación 694 para la distancia diametral angular la podemos
expresar en función del corrimiento al rojo z y de la constante de Hubble H0 y
del parámetro de desaceleración q0 actual:
dL = R(t0 )r1 (1 + z)
· ¸
c 1 2
= R(t0 )(1 + z) z − (1 + q0 ) z + · · ·
R(t0 )H0 2
· ¸
c 1 2
= z + (1 − q0 ) z + · · · (715)
H0 2
esta última ecuación la podemos escribir en la forma
c
H0 dL = cz + (1 − q0 ) z 2 + · · · (716)
2
la cual constituye la ley de Hubble. Notemos que para q0 6= 1 la ley de Hubble
no es lineal con z. La forma precisa de la ley de Hubble depende del modelo
específico que se asuma para la distribución de masa. En el siguiente capítulo
resolveremos las ecuaciones de campo de Einstein para diferentes modelos y
por ejemplo veremos que para un modelo de universo dominado por materia
encontraremos la forma exacta para la coordenada r como función de z, lo cual
nos conduce a la siguiente forma de la ley de Hubble:
c h ³p ´i
H0 dL = 2 zq0 + (q0 − 1) 2q0 z + 1 − 1 (717)
q0
0.22. LEY DE HUBBLE cxxxvii

Si expandimos esta expresión para valores pequeños de z tenemos


· µ ¶¸
c 1 2 2
H0 dL = zq0 + (q0 − 1) q0 z − q0 z + · · ·
q02 2
· ¸
c 2 1 3 2 1 2 2
= zq0 + q0 z − q0 z − q0 z + q0 z + · · ·
q02 2 2
c 2
= cz + (1 − q0 ) z + · · · (718)
2
la cual se reduce a la ecuación 716 como era de esperar. La ley de expansión
de Hubble es la relación entre los observables z y dL y por lo tanto élla nos
permitiría, en principio, determinar q0 , es decir el modelo cosmológico. La
dificultad observacional está en la medida de la distancia de luminosidad dL ,
pues esta distancia depende de la luminosidad propia o absoluta de objetos
distantes, como galaxias o supernovas, que puedan ser utilizados como fuentes
patrón, a diferencia de la medida del factor de corrimiento z cuya determinación
es muy precisa por técnicas espectroscópicas.
Otra relación importante entre cantidades observables y los parámetros cos-
mológicos es la relación entre la distancia diametral angular dA y z. Teniendo
en cuenta la ecuación 700 que relaciona la distancia diametral angular con la
distancia de luminosidad, podemos utilizar la relación 716 para encontrar una
expansión, válida para pequeños corrimientos z:

dA = (1 + z)−2 dL
· ¸
c 1
= (1 − 2z + · · ·) z + (1 − q0 ) z 2 + · · ·
H0 2
· ¸
c 1 2 2
= z + (1 − q0 ) z − 2z + · · ·
H0 2
· ¸
c 1 2
= z − (3 + q0 ) z + · · · (719)
H0 3

La expresión exacta para el modelo de universo dominado por materia está


dada por
c 1 h ³p ´i
dA = 2 zq0 + (q0 − 1) 2q 0 z + 1 − 1 (720)
H0 q0 (1 + z)2

la cual se reduce a 719 para z << 1.


Esta relación entre el corrimiento al rojo z y la distancia diametral angular
es de gran utilidad en el estudio de lentes gravitacionales, las cuales nos ofre-
cen otras técnicas observacionales para determinar los parámetros del modelo
cosmológico. En efecto, uno de los resultados más importantes derivado de la
observación de lentes gravitacionales fue la determinación de una cota inferior
para la constante cosmológica, utilizando estadística de lentes, es decir el conteo
del número de lentes gravitacionales por unidad de volumen y por unidad de
ángulo sólido para corrimientos entre z y z + dz. Finalizaremos este capítulo
cxxxviii COSMOLOGÍA

con la expresión para el conteo de galaxias como función del corrimiento al rojo
la cual se constituye como otra herramienta observacional para determinar el
modelo cosmológico. Para este fin sea

r2
dVc = √ drdΩ (721)
1 − kr2
el elemento de volumen comóvil en coordenadas de Robertson-Walker, entonces
si llamamos nc (t) la densidad de galaxias comóvil (número de galaxias por
unidad de volumen comóvil) el número de galaxias contenida en el elemento
de volumen está dado por

r2
dNgal = nc (t)dVc = nc (t) √ drdΩ (722)
1 − kr2
Utilizando la expansión para la coordenada r en términos de z, ecuación 714,
tenemos
c2
£ ¤2
R2 (t0 )H02
z − 12 (1 + q0 ) z 2 + · · ·
dNgal = nc (t) q £ ¤2 ×
2
1 − k R2 (tc0 )H 2 z − 12 (1 + q0 ) z 2 + · · ·
0
c
[dz − (1 + q0 ) zdz + · · ·]
R(t0 )H0
c3 £ 2 ¤
= nc (t) 3 3 z − (1 + q0 ) z 3 + · · · ×
R (t0 )H0
· ¸
1 c £ 2 ¤
1+ k z − (1 + q0 ) z 3 + · · · ×
2 R(t0 )H0
[dz − (1 + q0 ) zdz + · · ·]
nc (t)c3 £ 2 ¤
= z − 2 (1 + q0 ) z 3 + · · · dz (723)
R3 (t0 )H03

entonces, el número de galaxias por unidad de ángulo sólido y por unidad de


intervalo de corrimiento toma la forma
1 dNgal nc (z)
= 3 [1 − 2 (1 + q0 ) z + · · ·] (724)
2
z dzdΩ R (t0 )H03

A partir de esta relación es posible determinar el modelo cosmológico (i.e.


medir q0 ) contando el número de galaxias en un volumen dado con corrimientos
al rojo entre z y z + dz. Al igual que en los casos anteriores, para un modelo de
universo dominado por la materia la función conteo de galaxias está dada por
£ ¡√ ¢¤2
1 dNgal nc (z) zq0 + (q0 − 1) 2q0 z + 1 − 1
= 3 p (725)
z 2 dzdΩ R (t0 )H03 (1 + z)3 q04 1 − +2q0 (1 + z)

expresión, que de nuevo se reduce a la ecuación 724 para z pequeño.


Modelos cosmológicos

En el capítulo anterior encontramos la forma más general de la métrica la cual


satisface el principio cosmológico. La métrica encontrada (de Robertson-Walker)
quedó determinada salvo la función R(t), llamado el factor de escala, la cual debe
ser determinada a partir de las ecuaciones de campo de Einstein. Para este fin
se hace necesario adoptar un modelo que describa el contenido de materia del
universo, con la condición que este modelo satisfaga el principio cosmológico.
Como se dijo en la introducción al capítulo anterior, el modelo de materia más
sencillo que se puede considerar es el de un fluido perfecto caracterizado por una
densidad de materia ρ(t) y una densidad de presión p(t), en general funciones
del tiempo. En un capítulo anterior, ecuación 439 encontramos la expresión
general que describe un fluido perfecto:
µ ¶
1
T = ρU U + p 2 U µ U ν − g µν
µν µ ν
(726)
c
en donde se ha suprimido el subíndice 0 en ρ y p. En nuestro modelo las
partículas que constituyen el fluido son las galaxias las cuales se encuentran en
reposo respecto a las coordenadas de Robertson-Walker. Así, si escribimos el
tensor momentun-energía es componentes mixtas tenemos
µ ¶
µ µσ µ σ 1 µ σ µσ
T ν = gσν T = ρgσν U U + p 2 gσν U U − gσν g
c
µ ¶
1
= ρU µ Uν + p 2 U µ Uν − δ µν (727)
c
teniendo en cuenta que las galaxias están en reposo entonces U α = (c, 0, 0, 0) y
por lo tanto  
ρ 0 0 0
 0 −p 0 0 
Tµ ν =  0 0 −p 0 
 (728)
0 0 0 −p

0.23 Ecuaciones de Friedmann-Lemaître


El objetivo central de esta sección es encontrar, a partir de la métrica de
Robertson-Walker y dada la ecuación de estado f (ρ, p) = 0 para la materia,

cxxxix
cxl MODELOS COSMOLÓGICOS

las ecuaciones que determinan el factor de escala R(t). Para este fin considere-
mos las ecuaciones de campo de Einstein con constante cosmológica:
1 8πG α
Rα β − Rg α β + Λg α β =− T β (729)
2 c2
En el cápitulo anterior calculamos las componentes del tensor de Rici y del
escalar curvatura para la métrica de Robertson-Walker:


R00 = −3 (730)
R
à !
R̈ Ṙ2 2k
Rij = − + 2 2 + 2 gij (731)
R R R
à !
R̈ Ṙ2 k
R = −6 + + (732)
R R2 R 2

Entonces teniendo en cuenta que Rα β = g ασ Rσβ , T 1 1 = T 2 2 = T 3 3


las ecuaciones de campo 729 conducen al siguiente sistema de dos ecuaciones
acopladas:
4πG 3p 3R̈
(ρ + 2 ) = Λ − 2 2 (733)
c2 c c R
4πG p k Ṙ2 − RR̈
(ρ + ) = + (734)
c2 c2 R2 c2 R2
A partir de la ecuación para la conservación local de la energía-momentun

T αβ;β = 0 (735)

se obtiene la ecuación
d ¡ 2 3¢ d ¡ 3¢
c R +p R =0 (736)
dt dt
Sin embargo las tres ecuaciones ??, ?? y ?? no son independientes, pues cua-
lesquiera dos ellas implican la tercera, como se puede probar fácilmente. Por
ejemplo derivando la ecuación ?? con respecto a t, remplazando la ecuación ??
y reagrupando términos obtenemos ??. Este sistema de ecuaciones se puede es-
cribir en muchas otras formas equivalentes encontradas la literatura. Una forma
usalmente utilizada es la siguiente:

4πG 3p c2
R̈ = − (ρ + 2 )R + ΛR (737)
3 c 3
8πG 2 c2
Ṙ2 = ρR + ΛR2 − c2 k (738)
3 3
d ¡ 2 3¢ d ¡ 3¢
c R +p R =0 (739)
dt dt
0.23. ECUACIONES DE FRIEDMANN-LEMAÎTRE cxli

Este sistema de ecuaciones se llama de Friedmann-Lemaître y junto con la


ecuación de estado f (ρ, p) = 0 asumida para el modelo de materia determinan el
modelo cosmológico, i.e. R(t), ρ(t) y k. Como fue mencionado de las tres ecua-
ciones anteriores dos son independientes y usualmente se toman las ecuaciones
?? y ?? como independientes.
La ecuación ?? admite una interpretación física directa, pues si consideramos
4π R3 /3 = M como la masa, entonces la ecuación ?? se puede escribir en la
forma
dE + pdV = 0 (740)
donde E = M c2 es la energía total y pdV el trabajo hecho contra las fuerzas de
presión, así esta ecuación corresponde a la segunda ley de la termodinámica.

También podría gustarte