Está en la página 1de 231

1111111111111111111111 1111111111111 !

BIBLIOTECA CENTRAL !
------ ---,,-
11-

tercera edición inglesa de


Figueiras
Julian
Pedro Ramos

L B R o S
EDICIONES
Traslation from the English language edition:
Proofs /rom THE BOOK by Martin Aigner, Günter M. Ziegler
Copyright © Springer-Verlag Berlin Heidelberg 1998,2001,2004
Springer is a part of Springer Science+Business Media
All Rights Reserved

1a edición en castellano: junio de 2005

Imagen de cubierta: Detalle de paramento de La Alhambra (Archivo NIVOLA).

© Martín Aigner, Günter M. Ziegler, 2005


© NIVOLA libros y ediciones, S.L.
Apartado de Correos 113. 28760 Tres Cantos
Te\.: 918045817. Fax: 9180493 17
www.nivola.com
correo electrónico: contacto@nivola.com

ISBN: 84-95599-95-3
Depósito legal: M-25.892-2005
Impreso en España

Sin la autorización escrita de los titulares del copyright, queda rigurosamente


prohibida la reproducción parcial o total de esta obra por cualquier medio
o procedimiento, comprendidos la reprografía y el tratamiento informático.
De acuerdo con la acertada afirmación de G. H. Hardy que reza que no hay
lugar permanente para las matemáticas feas, a Paul Erd6s le gustaba hablar
de El Libro, en el que Dios recopila demostraciones perfectas de los teoremas
matemáticos. Erd6s también decía que, si eres matemático, no es necesario
que seas creyente, pero sí que creas en El Libro. Hace unos años le sugerimos
escribir una primera y modesta versión de El Libro. Estaba encantado con la
idea y empezó a trabajar inmediatamente con su entusiasmo habitual, llenando
páginas y páginas de sugerencias. Estaba previsto que este libro se publicara
en marzo de 1998, como regalo en el día que Erdos cumpliese ochenta y cinco
años. Su desafortunada muerte en el verano de 1996 ha hecho que dediquemos
este libro a su memoria, en lugar de que él mismo aparezca como autor.
Paul Erdos
No tenemos una definición que caracterice las demostraciones de El Libro:
todo lo que ofrecemos es una colección de ejemplos, que hemos seleccio-
nado con la esperanza de que nuestros lectores puedan compartir nuestro en-
tusiasmo cuando nos encontramos ante ideas brillantes, maneras geniales de
acercarse a un problema, o bonitas y precisas observaciones. También es-
peramos que los lectores puedan disfrutar a pesar de las imperfecciones que
pudiera tener nuestra exposición. La selección de los temas está muy influida
por Paul Erdos: una buena parte de ellos fueron sugeridos por él mismo, y
además de las demostraciones que llevan su firma, muchas otras fueron ini-
ciadas gracias a su suprema cualidad para formular la pregunta precisa o dar El Libro
con la conjetura adecuada. De modo que, en gran parte, este libro refleja el
punto de vista de Paul Erdos respecto a lo que debería ser una demostración
de El Libro.
Uno de los factores que nos han limitado en la selección de los contenidos
ha sido que todas las demostraciones que se incluyen en este libro deberían
resultar accesibles para cualquier lector con un dominio modesto de técni-
cas y conceptos matemáticos. Un poco de álgebra lineal, análisis y teoría de
números y un buen puñado de conceptos elementales de matemática discreta
deberían ser suficientes para comprender y disfrutar la lectura.
Hacemos público nuestro agradecimiento más profundo a muchas personas
que nos han ayudado y brindado su apoyo en este proyecto, y entre ellas a
los estudiantes de un seminario en el que discutimos una versión peliminar, a
Benno Artmann, Stephan Brandt, Stefan Felsner, Eli Goodman, Torsten Held-
mann, y Hans Mielke. Agradecemos también a Margrit Barrett, Christian
Bressler, Ewgenij Gawrilow, Michael Joswig, Elke Pose, y Jbrg Rambau por
su ayuda técnica en la composición del libro, a Tom Trotter que leyó el original
desde la primera a la última página, a Karl H. Hofmann por sus maravillosos
dibujos y, sobre todo, a Paul Erdos.
Berlín, marzo de 1998 Martin Aigner . Günter M. Ziegler
La primera edición de este libro tuvo una estupenda acogida y recibimos un
número inusual de cartas que contenían comentarios, correcciones, pasos más
abreviados en algunas ocasiones, demostráciones alternativas y nuevos temas
para considerar. (Aunque intentamos recoger demostraciones peifectas, nues-
tra exposición no lo es.)
Esta segunda edición nos brinda la oportunidad de presentar una nueva ver-
sión: hemos incluido tres capítulos adicionales, revisiones sustanciales y nue-
vas demostraciones, además de algunas mejoras y enmiendas menores, mu-
chas de ellas basadas en las sugerencias que hemos recibido. Hemos supri-
mido también uno de los capítulos antiguos, "sobre el problema de las trece
esferas," cuya demostración necesitaba introducir algunos arreglos que no po-
dían ser completados de forma que resultara una demostración breve y ele-
gante.
Gracias a todos los lectores que nos escribieron y nos ayudaron, entre ellos,
Stephan Brandt, Christian Elsholtz, Jürgen Elstrodt, Daniel Grieser, Roger
Heath-Brown, Lee L. Keener, Christian Lebceuf, Hanfried Lenz, Nicolas Puech,
John Scholes, Bernulf WeiBbach, y muchos otros. Gracias de nuevo por su
ayuda y apoyo a Ruth Allewelt y Karl-Friedrich Koch de la editorial Springer
en Heidelberg, a Christoph Eyrich y Torsten Heldmann en Berlín, y a Karl H.
Hofmann por los nuevos e igualmente estupendos dibujos.

Berlín, septiembre de 2000 Martin Aigner . Günter M. Ziegler

Nunca hubiéramos soñado con el éxito que ha alcanzado este libro mientras
preparábamos su primera edición en 1.998. Ha sido traducido a una gran can-
tidad de idiomas y contamos con las respuestas entusiasmadas de muchos lec-
tores que han aportado sugerencias interesantes para su mejora, adendas y
nuevos temas, que nos podrían mantener ocupados aún unos cuantos años.
En esta tercera edición aparecen dos nuevos capítulos, el primero acerca de las
identidades de Euler para particiones y el segundo sobre diferentes estrategias
de barajar un mazo de naipes. Hemos incluido a lo largo del libro algunas
mejoras, como el método de Calkin, Wilf y N ewman en la enumeración de los
racionales, y en un capítulo independiente tres demostraciones de las series de
Euler. Por ahora, eso es todo.
Expresamos nuestro agradecimiento a quienes han apoyado este proyecto en
los últimos cinco años y cuya implicación ha marcado la diferencia en esta
nueva edición. Gracias a David Bevan, Anders Bjorner, Dietrich Braess,
John Cosgrave, Hubert Kalf, Günter Pickert, Alistair Sinclair, y Herb Wilf.

Berlín, julio de 2003 Martin Aigner . Günter M. Ziegler


____________________________ 1

1. Seis demostraciones de la infinidad de números primos .............. 3


2. El postulado de Bertrand .......................................... 7
3. Los coeficientes binomiales casi nunca son potencias ............... 13
4. Representación de enteros como suma de dos cuadrados ............ 17
5. Cualquier anillo de división finito es un cuerpo ..................... 23
6. Algunos números irracionales .................................... 27
7. Tres veces 1f2/6 ................................................ 35

8. El tercer problema de Hilbert: descomposición de poliedros ......... 45


9. Rectas en el plano y descomposición de grafos ..................... 53
10. El problema de la pendiente ...................................... 59
11. Tres aplicaciones de la fórmula de Euler ........................... 65
12. El teorema de rigidez de Cauchy ................................. 71
13. Símplices en contacto ........................................... 75
14. Cualquier conjunto con muchos puntos tiene un ángulo obtuso ...... 79
15. La conjetura de Borsuk .......................................... 85

16. Conjuntos, funciones y la hipótesis del continuo ................... 93


17. Aquellas maravillosas desigualdades ............................. 109
18. Un teorema de Pólya sobre polinomios ........................... 117
19. Sobre un lema de Littlewood y Offord ........................... 123
20. La cotangente y el truco de Herglotz ............................. 127
21. La aguja de Buffon ............................................ 133
~ ___________________________ 1

22. El principio del palomar y el doble recuento ...................... 139

23. Tres teoremas famosos sobre conjuntos finitos .................... 151

24. Barajando el mazo ............................................. 157

25. Caminos, retículas y determinantes .............................. 167

26. La fórmula de Cayley para el número de árboles .................. 173

27. Completando cuadrados latinos ................................. 179

28. El problema de Dinitz .......................................... 185

29. Identidades y biyecciones ....................................... 191

_____________________________ 1

30. Cinco-coloración de grafos planos ............................... 199

31. Cómo vigilar un museo ......................................... 203

32. El teorema de Turán ............................................ 207

33. Comunicar sin errores .......................................... 213

34. Sobre amigos y políticos ....................................... 223

35. La probabilidad nos 10 pone fácil (a veces) ....................... 227

Sobre
índice temático ________________________
1
Seis demostraciones de la
infinidad de números primos 3
2
El postulado de Bertrand 7
3
Los coeficientes binomiales
casi nunca son potencias 13
4
Representación de enteros
como suma de dos cuadrados 17
5
Cualquier anillo de división finito
es un cuerpo 23
6
Algunos números irracionales 27
7
Tres veces Jr2/6 35

"La irracionalidad y Jr"


1

Es natural que comencemos estas páginas con la que probablemente es la más


antigua de las demostraciones de El Libro, que se atribuye a Euclides (Ele-
mentos 20). Demuestra que la sucesión de números primos es infinita .

• La demostración de Euclides. Para cualquier conjunto finito {PI, ... ,Pr }


de números primos, consideramos el número n = PIP2 ... Pr + l. Este n tiene
un divisor primo p. Pero P no es uno de los Pi; de otro modo, P sería un divisor
de n y del producto PIP2 ... Pr, Y en consecuencia también de la diferencia
n - PIP2 ... Pr = 1, lo cual es imposible. Por lo tanto, un conjunto finito
{PI, ... ,Pr } no puede recoger todos los números primos. D

Antes de continuar, acordaremos qué notación utilizaremos en adelante: para


el conjunto de los numero s naturales escribiremos N = {1, 2, 3, ... }, para el
de los números enteros Z = { ... , -2, -1, O, 1, 2, ... }, y lP' = {2, 3, 5, 7, ... }
denotará el conjunto de los números primos.
A continuación exponemos algunas otras demostraciones (de las muchas que
existen) y que esperamos que agraden a los lectores tanto como a nosotros.
Aunque utilizan diferentes puntos de vista, la siguiente idea es común a todas
ellas: los números naturales crecen más alla de todo límite, y todo número
natural n :::: 2 tiene un divisor primo. Estos dos hechos tomados conjunta-
mente obligan a que el conjunto lP' sea infinito. La siguiente demostración es
de Christian Goldbach (en una carta a Leonhard Euler en 1730); la tercera es
anónima y muy popular; la cuarta es del mismo Euler; la quinta fue propuesta
por Harry Fürstenberg y la última es de Paul Erdos .

• Segunda demostración. Fijémonos en primer lugar en los números de


2n
Fermat Fn = 2 + 1 para n = 0,1,2, .... Demostraremos que cualesquiera
Fo 3
dos números de Fermat son primos entre sí; de aquí se deduce que debe haber
FI 5
infinitos números primos. Para ello, comprobaremos que se verifica F2 17
n-I F3 257
F4 65537
(n:::: 1),
Fs 641 . 6700417
k=ü
Los primeros números de Fermat
a partir de lo cual nuestra afirmación se demuestra de manera inmediata. En
efecto, si m es un divisOf, digamos de Fk Y Fn (k < n), entonces m es divisor
de 2, y deducimos que m = 1 ó m = 2. Pero la opción m = 2 es imposible
ya que todos los números de Fermat son impares.
4 Seis demostraciones de la infinidad de números primos

Probamos la recursión por inducción sobre n. Para n = 1 tenemos Fo = 3 Y


Teorema de Fl - 2 = 3. Por inducción concluimos
Si G es un grupo multiplicativo
n n-l
finito y U un subgnlpo, entonces IUI
divide a IGI. Fk = ( Fk )Fn = (Fn - 2)Fn
k=O k=O
• Demostración. Consideramos la
relación binaria = (2 2n _1)(2 2n + 1) = 22n+l - 1 = Fn+1 - 2. O
a ~ b: {==} ba- 1 E U.
• Tercera demostración. Supongamos que lP' es finito y P es el mayor de to-
A partir de los axiomas de grupo se dos los números primos. Consideraremos los llamados números de Mersenne
sigue que ~ es una relación de equi- 2P - 1 Y demostraremos que cualquier factor primo q de 2P - 1 es mayor
valencia. La clase de equivalencia que p, lo cual nos conducirá a la conclusión deseada. Sea q un divisor primo
que contiene a un elemento a es pre~ de 2P - 1, por lo tanto tenemos 2P == 1 (mod q).
cisamente la clase Puesto que p es primo, el elemento 2 tiene orden p en el grupo multiplicativo
Ua={xa:xEU}. Zq \ {O} del cuerpo Zq. Este grupo tiene q - 1 elementos. Por el teorema de
Lagrange (ver el margen), sabemos que el orden de cualquier elemento.divide
Puesto que IU al IUI, encon- al cardinal del grupo, esto es, p I q - 1, Y de aquí que p < q. O
tramos que G se descompone en
La demostración que presentamos a continuación utiliza cálculo elemental.
clases de equivalencia, todas de
tamaño IUI, de donde deducimos • Cuarta demostración. Sea 7r(x) := #{p ~ x : p E lP'} el cardinal
que IUI divide a IGI. O del conjunto de números primos que son menores o iguales que el número
real x. Enumeramos los primos lP' = {Pl,P2,P3, ... } en orden creciente.
En el caso esencial en el que
U sea un subgrupo cíclico
Consideramos el logaritmo neperiano log x, definido como log x = tdt. J;
{a,a 2 , .•. ,a"'}, resulta que Comparando el área bajo la gráfica de f(t) = t
con una función escalera
m (el más pequeño de los enteros
superior (véase también el apéndice en la página 10 para más información
positivos tales qne a m = 1, llamado sobre este método), concluimos que para n ~ x < n + 1 se tiene que
el orden de a) divide al cardinallGI 1 1 1 1
del grupo. logx < 1+-+-+ ... + - - + -
2 3 n-l n

< ¿ ~,donde la suma se extiende sobre todos los m E N


m que sólo tienen divisores primos p ~ x.
Puesto que cualquiera de estos m puede escribirse de manera única como
1 producto de la forma n
pk p , deducimos que esta última suma es
p~X

rr (¿--\:).
pElP' k;:O:O P
p~X

1 2 n n+l La suma en el interior del paréntesis es una serie geométrica de razón ~, con
Escalera superior para f (t) = t lo cual sabemos que
1f(X)
Pk
logx <
Pk -1
k=l

Ahora es claro que Pk 2: k + 1, Y en consecuencia


Pk 1 1 k + 1
--=1+--<1+-= k
~-1 ~-1 - k
Seis demostraciones de la infinidad de números primos 5
----------------------------------------------------

por tanto
lr(X) k +1
logx < -k- = 1f(x) + l.
k=l

De todos es sabido que log x no está acotado, y por tanto concluimos que 1f(.T)
tampoco está acotado, así que existe un número infinito de primos. O

• demostración. Después del análisis ... ¡le toca el turno a la topo-


logía! Consideramos una curiosa topología en el conjunto Z de los números
enteros. Para a, b E Z, b > O, sea

Na,b = {a + nb : n E Z}.

Cada conjunto Na,b es una progresión aritmética infinita en los dos sentidos.
Un conjunto O <;;; Z es abierto si, o bien O es vacío, o si para todo a E O
existe algún b > O tal que Na,b <;;; O. Es evidente que la unión de abiertos
es un abierto. Si 0 1 , O 2 son abiertos, y a E 0 1 n O 2 con Na,b 1 <;;; 0 1 Y
N a,b2 <;;; O 2 , entonces a E N a,b 1 b2 <;;; 0 1 n O 2 . Por tanto, podemos concluir
que la intersección finita de abiertos es abierto. Así, esta familia de conjuntos
abiertos induce una topología en Z.
Nótese que se verifican las afirmaciones siguientes:

(A) Cualquier conjunto abierto no vacío es infinito.

(B) Cualquier conjunto Na,b también es cerrado.

Efectivamente, la primera afirmación se sigue inmediatamente de la defini-


ción. Para la segunda, observamos que
b-1
Na,b = .z \ UNa+i,b,
i=l

lo cual prueba que Na,b es el complementario de un conjunto abierto, y por


tanto es cerrado.
Hasta ahora, los números primos todavía no han entrado en escena -- pero
ya llegan. Puesto que cualquier número n distinto de 1 y -1 tiene un divisor
primo p, y por lo tanto está contenido en No,p, concluimos que

.z \ {1, -1} = U No,p' "Hacer la rana, hasta el infinito"


pElP'

Ahora, si lP' fuera finito, entonces UpElP' No,p sería unión finita de cerrados
(por (B)), y por lo tanto, cerrado. En consecuencia, {1, -1} debería ser un
conjunto abierto, lo que contradice (A). O

• Sexta demostración. Nuestra última demostración va considerablemente


más allá de la existencia de infinitos números primos, ya que además demues-
i
tra que la serie ¿PElP' diverge. La primera demostración de este importante
resultado fue dada por Euler (y es interesante en sí misma), pero la que pre-
sentamos aquí, elaborada por Erd6s, tiene un atractivo especial.
8 El postulado de Bertrand

A continuación probamos que

n p :::; 4x~1 para todo x 2: 2 real, (1)

donde nuestra notación - aquí y en lo que sigue - quiere decir que el pro-
ducto se toma sobre todos los primos p ~ x. Demostraremos este hecho por
inducción sobre el número de estos primos. No está tomada del trabajo origi-
nal de Erd6s, pero también se debe a él (véanse sus apuntes en el margen), y
es realmente una demostración tomada de El Libro. En primer lugar, nótese
que si q es el mayor número primo con q :::; x, entonces
p = p Y 4q - 1
:::; 4x - 1
.
p<:;x p<:;q

Por tanto, es suficiente comprobar (1) para el caso en el que x = q es primo.


Para q = 2 obtenemos "2 :::; 4," de modo que procedemos a considerar primos
impares q = 2m+ 1. (Aquí podemos suponer, por inducción, que (1) es válido
para todos los enteros x en el conjunto {2, 3, ... , 2m}.) Para q = 2m + 1
desarrollamos el producto y calculamos

p = p' P :::; 4m Cmm+1) : :; 4 m


2 2m = 4 2m.
p<2m+l p::;m+l m+l<p<:;2m+l

Es fácil verificar paso a paso esa cadena de desigualdades. De hecho,

se verifica por inducción. La inecuación

m+l<p<:;2m+l
rr P <

es cierta porque (2~+1) = ~~0~t:{;! es un entero, en el cual los primos que


estamos considerando son todos factores del numerador (2m + 1)!, pero no
del denominador m!(m + 1)! . Finalmente, se verifica
Teorema
El número n! contiene el factor
primo p exactamente
Cmm+ 1) : :; 2 2m

ya que

Cmm+ 1) yademás C::11)


veces. son dos sumandos (iguales) que aparecen en
Demostración. Exactamente
p
de los factores de
n! 1 . 2 . 3 ..... n son
divisibles entre p, de dond.e se
obtienen l ~ J p-factores. Además (3) Del teorema de Legendre (véase el margen) obtenemos que (2:) = ~~i
l ;Z J de los factores de n! son contiene el factor primo p exactamente
incluso divisibles entre p2, lo que
aumenta nuestro contador en [.I!:.-J
_p2
factores primos p de ni, etc. O
El postulado de Bertrand 9

veces. cada sumando es a lo sumo 1, ya que satisface

< 2n _
pk
2(~
. pk
- 1) = 2,
y es un entero. Aún más, los sumandos se anulan siempre que pk > 2n.
De e:) contiene p exactamente

veces. Por tanto, la mayor potencia de p que divide a (2:) no es mayor que 2n.
En particular, los primos p > V2ií aparecen en e:)
a lo sumo una vez.
Más aún, - y esto, según Erd6s, es la clave de la demostración - ¡los pri- Ejemplos tales como
mos p que satisfacen ~n < p :::; n no dividen a (2:)! De hecho, 3p > 2n G~) = 23 . 52 . 7 . 17 . 19 . 23
implica (para n ~ 3, Y por tanto p ~ 3) que p y 2p son los únicos múltiplos G:) = 23 . 33 . 52 . 17 . 19 . 23
de p que aparecen como factores en el numerador de ~~i, mientras que en el (~~) =24 . 3 2 . 5 . 17· 19 . 23 . 29
denominador hay exactamente dos factores p. ilustran que primos "muy pequeños"
Ahora ya podemos estimar e:). Para n ~ 3, utilizando una estimación de p < ffn pueden aparecer elevados a
las potencias más grandes en (2:), que
la página 12 para la cota inferior, obtenemos
factores primos "pequeños" que verifi-
n
can ffn < p ::; ~n aparecen a lo
-42n -< (2n)
n
<
-
2n p p
sumo una vez, mientras que factores en
p-:;.ffn
el hueco ~n < p ::; n no aparecen.

y por tanto, como no hay más de V2ií primos p :::; V2ií,


p rr
n<p-:;'2n
p para n ~ 3. (2)

(5) Asumimos ahora que no hay ningún primo p con n < p :::; 2n, de modo
que el segundo producto en (2) es 1. Substituyendo (1) en (2) obtenemos

4 n < (2n)Hffn 4~n


o
(3)
una desigualdad que no es cierta para n suficientemente grande. De hecho,
es tan falsa que (para n ~ 4000) lo podemos ver sin siquiera utilizar una
calculadora: Utilizando a + 1 < 2a (lo cual se verifica por inducción para
todo a ~ 2), obtenemos

y de aquí, para n ~ 50 (y por tanto 18 < 2V2ií) obtenemos de (3) y (4) que

Esto implica (2n)1/3 < 20, Y por tanto n < 4000. o


10 El postulado de Bertrand

Es posible sacar más de este de estimaciones: a de (2)


obtenerse con los mismos métodos que
1
P 2': 23ü n para n 2': 4000,

y por tanto existen al menos

1 n
30 10g2 n +1
primos entre n y 2n.
Esta estimación no es excesivamente mala: el "verdadero" número de primos
en ese rango es aproximadamente del orden de ni log n. Esto se sigue del
"teorema! de los números primos," que dice que el límite

. #{p ~ n : p es primo}
l1m
n--+oo ni log n
existe, y es igual a 1.
Este famoso resultado fue demostrado por primera vez por Hadamard y de la
Vallée-Poussin en 1896; Selberg y Erd6s dieron una demostración elemental
(sin utilizar herramientas de análisis complejo, aunque larga y complicada) en
1948.
En lo que se refiere al teorema de los números primos parece que aún no se ha
dicho la última palabra: por ejemplo, una demostración de la hipótesis de Rie-
mann (véase la página 41), uno de los problemas no resueltos más importante
en matemáticas, nos proporcionaría una mejora importante para el teorema de
los números primos. Pero también para el postulado de Bertrand podrían es-
perarse mejoras sustanciales. De hecho, el siguiente problema, de Opperman
(1882), está aún sin resolver:

¿Existe siempre algún número primo entre n 2 y (n + 1)2?


Pata más información, véase [3, p. 19] Y [4, pp. 248, 257].

Estimación mediante integrales

Existe un método muy sencillo pero efectivo para estimar sumas utilizando
integrales (tal y como ya se vio en la página 4). Para estimar los números
armónicos
n 1
Hn = I:: k
k=l

dibujamos la figura del margen, y deducimos de ella que

logn,
n
El postulado de Bertrand 1

comparando el área bajo la gráfica de f(t) = t


(1 ::; t ::; n) con el área de los
rectángulos sombreados en oscuro. Además obtenemos que

.
H - -
n
1
n
n-l 1
= ~ - >
~ k
in 1
-- dt
t
= log.n
'
k=l 1

esta vez con el área de los rectángulos grandes (incluyendo las


partes más claras). En conjunto, esto conduce a que
1
logn+ - < Hn < logn + l.
n
En particular lim· Hn ---+ 00, y el orden de crecimiento de Hn viene dado por
n---+oo
lim JHn =
n-+oo ogn
l. Pero se conocen estimaciones mucho mejores, tales como
Aquí O (~6) denota una función f (n)
1 1 1 (1) tal que f (n) ::; e ~6 se verifica para al-
Hn = log n + ry + 2n - 12n2 + 120n4 + O n 6 '
guna constante c.
donde ry ~ 0.5772 es la "constante de Euler" (véase [2]).

Estimación factorial - la fórmula de Stirling


El mismo método aplicado a
n
log(n!) = log2+log3+ ... +logn 2:log k
k=2
proporciona
log((n - 1)!) < ¡n logtdt < log(n!),

donde la integral puede calcularse fácilmente:

¡n logtdt = [tlogt _ t[ = nlogn - n + l.

. Así que obtenemos una cota inferior para n! de


n! > enJogn-n+l

y al mismo tiempo una cota superior


n! = n (n -1)! < nenJogn-n+l = en(~) n.
En este punto se necesita una análisis más cuidadoso para describir el com-
portamiento asintótico de ni, tal y como viene dado en lafórmula de Stirling Aquí f(n) rv g(n) signifca que
n! rv v27Tn (~r lim f(n) = 1.
g(n)
n-Hexo
y de nuevo existen versiones aún más precisas, tales como

n! = v27Tn (12)n (1 + _1 + _1_ _


2
139 + O (~))
4
.
e 12n 288n 5140n 3 n

Estimación mediante coeficientes binomiales


A partir de la definición del coeficiente binomial G) como el número de sub-
conjuntos de cardinal k de un conjunto de tamaño n, sabemos que la sucesión
(Z), G), ... , (~) de coeficientes binomiales
12 El postulado de Bertrand

n
iD tiene como suma :s (~) =
k=O
2n

1 @
. ,.
es slmetnca: (n)
k = (n)
n-k .
1 1
1 2 1
1 3 3 1 De la ecuación funcional (~) = n-~+l C;,::l) se deduce fácilmente que, para
1 4 6 4 1 todo n, los coeficientes binomiales (~) forman una sucesión que es simétrica y
1 5 10 10 5 1
1 6 15 20 15 6 1 unimodal: se incrementa hasta la mitad, de manera que los coeficientes bino-
1 7 21 35 35 21 7 1 miales centrales son los más grandes de la sucesión:
Triángulo de Pascal

Aquí, Lx J y IX l denotan, respectivamente, el número x redondeado inferior


y superiormente al entero más cercano.
A partir de las fórmulas asintóticas para los factoriales que se mencionaron
antes, pueden obtenerse fácilmente estimaciones muy precisas para el tamaño
de los coeficientes binomiales. Sin embargo, en este libro necesitaremos úni-
camente ~otas muy débiles, como la siguiente: G) :::
2n para todo k, mientras
que para n 2:: 2 tenemos

(Ln~2J) 2:: 2~)


dándose la igualdad sólo para n = 2. En particular, para n 2:: 1,
n
2n) 2:: 4 .
( n 2n

Esto se verifica porque (L n /2 J)' un coeficiente binomial central, es el mayor


en la sucesión G) + (~) (~) G) ... )(n::l)' cuya suma es 2n, y cuya media
es por tanto 2: .
Por otra parte, la siguiente cota superior para los coeficientes binomiales es
razonablemente buena para coeficientes "pequeños" en la cola de la sucesión,
cuando n es grande en comparación con k.

n(n-1) ... (n-k+1) nk nk


k! < k! < 2k - 1'

[1] P. ERD6s: Beweis eines Satzes von Tschebyschef, Acta Sci. Math. (Szeged) 5
(1930-32), 194-198.
[2] R. L. GRAHAM, D. E. KNUTH & O. PATASHNIK: Concrete Mathematics.
A Foundationfor Computer Science, Addison-Wesley, Reading MA 1989.
[3] G. H. HARDY & E. M. WRIGHT: An lntroduction to the Theory ofNumbers, fifth
edition, Oxford University Press 1979.
[4] P. RIBENBOIM: The New Book of Prime Number Records, Springer-Verlag, New
York 1989.
Existe un epílogo del postulado de Bertrand que conduce a un bonito resul-
tado sobre coeficientes binomiales. En 1892 Sylvester reforzó el postulado de
Bertrand de la siguiente manera:

Si n 2' 2k, entonces al menos uno de los números n, n - 1, ... , n-k + 1


tiene un divisor primo p mayor que k.

Nótese que para n = 2k obtenemos precisamente el postulado de Bertrand.


En 1934, Erd6s dio una breve y elemental demostración del resultado de Syl-
vester digna de estar en El Libro, análoga a su demostración del postulado de
Bertrand. Hay una manera equivalente de formular el teorema de Sylvester:
El coeficiente binomial

n) = n(n-1) .. ·(n-k+1)
(k (n 2' 2k)
k!
tiene siempre un factor primo p > k.

Sin perder de vista esta observación, volvamos a otra de las joyas de Erd6s:
¿cuando es (~) igual a una potencia mJl.? Es fácil ver que existen infinitas
soluciones para k = R = 2, es decir, para la ecuación (~) = m 2 . De hecho,
si G) es un cuadrado, entonces también lo es ((2n;1)2). Para ver esto, sea
n(n 1) =2m2. Se sigue que .
(2n - 1)2((2n - 1)2 - 1) = (2n - 1?4n(n - 1) = 2(2m(2n - 1))2,

y de aquí
C ~ 1)2)
2n
= (2m(2n _ 1))2.

Así pues, comenzando con (;) = 62 obtenemos infinitas soluciones - el


siguiente es (2~9) = 2042. Sin embargo, este procedimiento no proporciona
todas las soluciones. Por ejemplo, (52°) = 35 2 y 6282 ) = 11892 son el
C
comienzo de series diferentes. Para k = 3 se sabe que (~ ) = m 2 tiene la (53°) = 1402
solución única n = 50, m = 140, pero ahora ya hemos llegado al límite. Para es la única solución para k = 3, g = 2
k 2' 4 y cualquier R 2' 2 no existen soluciones, y esto es lo que probó Erdos
utilizando un ingenioso argumento.

Teorema. La ecuación (~) mE no tiene soluciones enteras con


R2'2 y 4::;k::;n-4.
14 Los coeficientes binomiales casi nunca son potencias

Nótese en primer lugar que podemos suponer sin pérdida


de generalidad que n 2: 2k, porque G)
= (n~k)' Supongamos que el teorema
es falso y que (~) = m C• La demostración, hasta llegar a una contradicción,
se desarrolla en cuatro pasos.
(1) Por el teorema de Sylvester, existe un factor primo p de (~) mayor que k,
ya que pC divide a n(n-1) ... (n-k+ 1). Claramente, sólo uno de los factores
n - i puede ser múltiplo de p (ya que p > k), y concluimos que pC In i, y
por lo tanto

(2) Consideremos cualquier factor n - j del numerador y escribámoslo de la


forma n-j = ajmj, donde aj no es divisible entre una potencia no trivial de fJ..
Nótese por (1) que aj sólo tiene divisores primos que son menores o iguales
que k. Queremos demostrar ahora que ai i- aj para i i- j. Suponemos, por
contra, que ai = aj para algún i < j. Entonces mi 2: mj + 1 y

k > (n - i) (n j) = aj(mf - m]) 2: aj((mj + l)c - mj)


> ajfJ.m~-l > fJ.(ajmj?/2 2: fJ.(n - k + 1)1/2
> fJ.(:g: + 1)1/2 > n 1/ 2 ,

lo cual contradice n > k 2 .


(3) A continuación probamos que los ai son los enteros 1,2, ... ,k ordenados
de alguna manera. (De acuerdo con Erdos, este es el quid de la demostración.)
Como ya sabemos que todos los ai son distintos, basta probar que
aOa1 ... ak-l divide a k!.

Substituyendo n - j = ajmj en la ecuación (~) = mC, se obtiene


c
aOa1'" ak-l(mOm1'" mk_d = k! mC.

Simplificando los factores comunes de mo ... mk-l Y m se obtiene


aOal ... ak-l u C = k! v C

con mcd( u, v) = 1.
Falta por demostrar que v = 1.
Si no es así, entonces v
contiene un dividor primo p. Puesto que mcd( u, v) = 1, p ha de ser un divisor
primo de aOal ... ak-l Y por tanto es menor o igual que k. Por el teorema
de Legendre (ver página 8) sabemos que k! contiene a p elevado a la potencia
¿i>ll
-
4p J. Ahora estimamos el exponente de p en n( n - 1) ... (n - k + 1).
Sea i un entero positivo, y sean b1 < b2 < ... < bs los múltiplos de pi que
1.
hay entre los factores n, n - 1, ... , n-k + Entonces bs = b1 + (3 - 1 )pi,
Y de aquí

(3 - l)pi k -1,

lo cual implica
s < lk;lJ+1 < l;J+1.
Los coeficientes binomiales casi nunca son potencias 15

Así que para cada i el número de de que entre n, ... , n- k+ 1,


Y por tanto entre los aj, está acotado por l-:!r J + l. Esto implica que el expo-
nente de p en aOal ... ak-l es a lo sumo

según el razonamiento que utilizamos para probar el teorema de Legendre en


el capítulo 2. la única diferencia es que esta vez la suma se detiene en i = .e-l,
ya que los aj no contienen potencias de.e.
Considerando ambos cálculos de manera conjunta, obtenemos que el expo-
nente de p en v R es a lo sumo

y ya hemos obtenido la contradicción buscada, ya que v R es una potencia de.e.


Esto ya es suficiente para concluir el caso .e = 2. De hecho, ya que k 2: 4, uno Vemos que nuestro análisis hasta este
de los ai tiene que ser igual a 4, pero los ai no contienen ningún cuadrado. punto concuerda con (53°) = 140 2, ya
Por tanto, suponemos a partir de ahora que .e 2: 3. que
50 = 2.5 2
(4) Como k 2: 4, debe ser ail = 1, ai2 = 2, ai3 = 4 para algunos i 1, i 2 , i3,
49 = 1· 72
esto es,
48=3.4 2
Y 5 . 7 . 4 = 140.

Afirmamos que (n-i 2)2 =} (n-i 1 )(n-i 3 ). En caso contrario, sea b = n-i 2
y n - i 1 = b - x, n - i3 = b + y, donde 0< Ixl, Iyl < k. De aquí

b2 =(b-x)(b+y) ó (y-x)b=xy,

donde x = y es obviamente imposible. Ahora, según la parte (1), tenemos:

Ixyl = bly - xl 2: b > n-k > (k - 1)2 2: Ixyl,


lo cual es absurdo.
Así, m~ =} mlm3, donde suponemos m~ > mlm3 (el otro caso es análogo),
y hemos llegado a nuestra última cadena de desigualdades. Obtenemos

2(k-l)n > n 2 -(n-k+l)2 > (n-i 2)2_(n-i 1 )(n-i 3 )


4[m~R - (mlm3)R] > 4[(mlm3 + l)R - (mlm3)R]

> 4.e mI<:-1 m R-l


3 .

Como.e 2: 3 y n > k R 2: k 3 > 6k, tenemos que


2(k - 1)nmlm3 > 4.emim~ = .e(n - i1)(n - i 3 )

> .e(n-k+l)2 > 3(n-~)2 > 2n2.


16 Los coeficientes binomiales casi nunca son potencias

Ahora, puesto que mi :S nI/e :S n I / 3 obtenemos finalmente

Ó k3 > n. Con esta contradicción se completa la demostración. D

[1] P. ERD6s: A theorem of Sylvester and Schur; J. London Math. Soco 9 (1934),
282-288.
[2] P. ERDÓS: On a diophantine equation, J. London Math. Soco 26 (1951),
176-178.
[3] J. J. SYLVESTER: On arithmetical series, Messenger of Math. 21 (1892), 1-19,
87-120; Collected Mathematical Papers Vol. 4,1912,687-731.
1 +0
2 2
1
1 +1
2 2
¿ Qué enteros se escribir como suma de dos cuadrados? 2
3 ??
2 +0
2 2
4
Esta pregunta es tan antigua como la teoría de números, y su solución es un
2 +1
2 2
5
clásico del área. La parte "difícil" de la respuesta es comprobar que todo
6 ??
número primo de la forma 4m + 1 es suma de dos cuadrados. G. H. Hardy
7
escribió que este teorema de los dos cuadrados de Fermat "es considerado,
8
con toda justicia, como uno de los más bellos de la aritmética." Sin embargo,
9
una de nuestras demostraciones de El Libro es bastante reciente.
10
Comencemos con algunos preliminares. En primer lugar, hemos de distinguir 11
el primo P = 2 de los primos de la forma P = 4m + 1 Y de los primos de
la forma P = 4m + 3. Todo número primo es de uno de estos tres tipos. En
este punto, se puede observar (siguiendo la idea de Euclides) que hay infinitos
primos de la forma 4m + 3. En efecto, si hubiera sólo un número finito,
podríamos tomar el mayor de ellos y llamarlo Pk. Haciendo

Nk := 22 . 3 . 5· .. Pk - 1

(donde PI = 2, P2 = 3, P3 = 5, " . denota la secuencia de todos los primos),


observamos que N k es congruente con 3 (mod4) y, por tanto, debe tener un
factor primo de la forma 4m + 3. Como dicho factor primo es mayor que Pb
Pierre de Fermat
hemos obtenido una contradicción. Al final de este capítulo demostraremos,
que también hay infinitos primos de la forma P = 4m + 1.
Nuestro primer lema es un caso particular de la famosa "ley de reciprocidad":
caracteriza los primos para los cuales -1 es un cuadrado en el cuerpo Zp (del
que se presenta un resumen en el recuadro de la página siguiente).

Lema 1. La ecuación 8 2 == -1 (mod p) tiel!e exactamente dos soluciones


8 E {1, 2, ... , p-1 } para los números primos P = 4m + 1, una solución para
P = 2 Y ninguna solución para los primos de la forma P = 4m + 3.

• Demostración. Para P = 2 tomamos 8 = 1. Si P es impar, consideramos el


conjunto {1, 2, ... ,p -1} Y construimos la relación de equivalencia generada
al identificar cada elemento con sus inversos aditivo y multiplicativo en Zp.
Por tanto, la clase de equivalencia "genérica" tiene cuatro elementos

{x, -x, x, -x},


ya que este conjunto contiene los inversos de todos sus elementos. No obs-
tante, hay clases de equivalencia con menos elementos si algunos de los miem-
bros son iguales:
18 Representación de enteros como suma de dos cuadrados

• x == -x es imposible si pes
• x == x es equivalente a X2 == 1. Esta ecuación tiene dos soluciones, x = 1
Y x = P - 1, lo que da lugar a la clase de equivalencia {1, p - 1}, con dos
elementos.
11 x == -x es equivalente a x2 == -1. Esta ecuación puede no tener solución
o tener dos soluciones distintas, xo, p - xo. En este último caso, la clase
de equivalencia es {xo,p - xo}.

Para p = 11 las clases de equivalencia El conjunto {1, 2, ... ,p - 1} tiene p - 1 elementos y lo hemos dividido en
son {1, lO}, {2, 9, 6, 5}, {3, 8, 4, 7}; 4-uplas (las clases de equivalencia de cardinal 4), más uno o dos pares (las
para p = 13 son clases de cardinal 2). Para p - 1 = 4m + 2 existe sólo el par {1, p - 1} Y
{1,12},{2,11,7,6},{3,10,9,4}, el resto son 4-uplas y, por tanto, 8 2 == -1 (mod p) no tiene solución. Para
{5, 8}: el par {5, 8} proporciona las p - 1 = 4m debe haber un segundo par que contiene las dos soluciones de la
dos soluciones de 3 2 == -1 mod 13. ecuación 8 2 == -1 que estamos buscando. .O

Si p es primo, el conjunto Zp = {O, 1, ... ,p 1} con la suma y mul-


tiplicación definidas "módulo p" es un cuerpo finito. Necesitaremos las
siguientes propiedades:

• Para x E Zp, x =1- 0, el inverso aditivo (que denotaremos -x) es


p - x E {1, 2, ... ,p 1}. Sip > 2, entonces x y -x son elementos
+ O 1 2 3 4 distintos de Zp.
O O 1 2 3 4
1 1 2 3 4 O <11 Cada x E Zp \ {O} tiene un único inverso multiplicativo x E Zp \ {O} .
2 2 3 4 O 1 tal que xx == 1 (modp).
3 3 4 O 1 2 De la definición de número primo se deduce que la aplicación Zp ---*
4 4 O 1 2 3 Zp, Z f--+ xz es inyectiva si x =1- O. Por tanto, en el conjunto finito
Zp \ {O} debe ser también sobreyectiva, y para cada x debe existir un
O 1 2 3 4 único x =1- Otal que xx == 1 (modp).
O O O O O O
1 O 1 2 3 4 <11 Los cuadrados 02 ,1 2 ,2 2 , ... ,h2 son elementos de distintos para
2 O 2 4 1 3 h = l~J.
3 O 3 1 4 2 Esto es así porque x2 == y2 (o (x + y) (x - y) == O) implica que x == y
4 O 4 3 2 1 o que x -y. Los 1 + l~J elementos 02 ,1 2 , ... , h 2 se denominan
Suma y multiplicación en :3 5 los cuadrados de Zp.

Mencionemos aquí que para todos los números primos existen soluciones de
X2 + y2 == -1 (modp). De hecho, hay l~J + 1 cuadrados distintos X2 en Zp,
en tanto que hay l~J + 1 elementos distintos de la forma -(1 + y2). Como
Zp tiene p elementos, estos dos conjuntos son demasiado grandes para ser
disjuntos, y deben existir x e y tales que x2 == -(1 + y2) (modp).
Lema 2. Ningún número n = 4m + 3 es suma de dos cuadrados.

111 Demostración. El cuadrado de un número par es (2k)2 = 4k 2 == O (mod 4)


y el de un número impar (2k + 1)2 = 4(k 2 + k) + 1 == 1 (mod4). Por tanto,
la suma de dos cuadrados es congruente con O, 1 ó 2 (mod4). O
Representación de enteros como suma de dos cuadrados 19

Ahora que sabemos que los de la fonna p = 4m -1- 3 son " nos
ocuparemos de las "buenas" propiedades de los primos de la fonna
p = 4m -1- 1. Presentamos el resultado clave previo al teorema principal.
Proposición. Todo número primo de la forma p = 4m -1- 1 es suma de dos
cuadrados, es decir, se puede escribir como p = x2 -1- y2 para ciertos números
naturales x, y E N.
Presentaremos dos demostraciones de este resultado, ambas elegantes y sor-
prendentes. En la primera se combinan hábilmente el "principio del palomar"
(que ya hemos empleado "de pasada" antes del Lema 2; en el capítulo 22 se
pueden encontrar más ejemplos), y los argumentos "modulo p". La idea se
debe al matemático noruego, especialista en teoría de números, Axel Thue .

• Demostración. Consideremos los pares (x', y') de enteros que verifica que
O :::;; x', y' :::;; yIP, es decir, x', y' E {O, 1, ... , l ylPJ}. El número total de pares
de este tipo es (l ylPJ -1- 1)2. Utilizando la estimación lx J -1- 1 > x para
x = yIP, vemos que hay más de p tales pares. Por tanto, para cualquier s E Z,
Para p = 13, lv'PJ = 3 considera-
es imposible que todos los valores x' - sy' generados por los pares (x', y') mos x', y' E {O, 1, 2, 3}. Para s = 5,
sean distintos módulo p, de donde se deduce que para cualquier s hay dos la suma x' - sy' (mod 13) toma los si-
pares distintos guientes valores:
y'
(X',y'), (X",y") E {O,1, ... ,lJPj}2 O 1 2 3
x'
O O 8 3 11
tales que
x' - sy' =:: x" - sy" (modp). 1 1 9 4 12
2 2 10 5 O
Restando se tiene que x' - x" =:: S(y' - y") (modp). Si definimos 3 3 11 6 1

x := Ix' - x"I, y:= Iy' - y"l,


se deduce que

(x,y) E {O,1,· .. ,lJPj}2 con x=::±sy(modp).

También sabemos que x e y no pueden ser ambos cero, ya que los pares (x', y')
Y (x", y") son distintos.
Sea s una solución de S2 =:: -1 (mod p), cuya existencia está asegurada por el
Lema 1. Como x2 =:: s2y2 =:: _y2 (mod p) hemos construido

(x,y)EZ 2 talque O<x 2 -1- y2<2p y x 2 -1-y2=::O(modp).

Como p es el único número entre Oy 2p que es divisible por p, se deduce que


x2 -1- y2 = p, y hemos tenninado. O

La segunda demostración de la proposición - también una demostración de


El Libro - fue encontrada por Roger Heath-Brown en 1971 y publicada tan
solo en 1984. (Don Zagier dio una versión "resumida en una frase".) Es tan
elemental que no necesitaremos utilizar el Lema 1.
El argumento de Heath-Brown utiliza tres involuciones lineales: una que es
bastante obvia, otra oculta y una última, trivial, que pone la guinda al pastel.
La segunda involución, sorprendente, corresponde a una estructura oculta en
el conjunto de soluciones enteras de la ecuación 4xy -1- Z2 = p.
20 Representación de enteros como suma de dos cuadrados

• Demostración. Estudiaremos el conjunto

S := {(X,y,Z) E Z3: 4xY+Z2 =p, x> O, y> O}.

Este conjunto es finito. De hecho, como x ~ 1 e y ~ 1 se deduce que y ~ ~


y x ~ ~. Por tanto, hay un número finito de posibles valores de x e y y, para
cada uno de ellos, hay como mucho dos valores de z.
1. La primera involución lineal viene dada por

f :S ----+ S, (x, y, z) 1--+ (y, x, -z),

es decir, "se permutan x e y, y se cambia el signo a z." Es evidente que esta


transformación envía S sobre sí mismo y que es una involución: aplicada dos
veces, resulta la identidad. Obsérvese que f no tiene puntos fijos, ya que z = O
implicaría que p = 4xy. Además, f envía los puntos de

T:= {(x,y,z)ES:Z>O}

a los puntos de S\T, que satisfacen z < O. Como f cambia los signos de
T x - y y de z, manda los puntos de

f U := {(X,y,Z)ES:(X-y)+z>O}

a los puntos de S\U. Obsérvese que no pueden existir puntos de S tales que
u (x-y)+z = Oyaque,enesecaso,setendríap = 4xY+Z2 = 4xy+(x-y)2 =
(x + y)2.
¿Qué se obtiene del estudio de f? La principal observación es que, como f
envía los conjuntos T y U a sus complementarios, también intercambia los
puntos de T\U con los de U\T. Por tanto, hay el mismo número de puntos
en U que no están en T que puntos en T que no están en U - por tanto, T
y U tienen el mismo cardinal.

2. La segunda transformación que estudiamos es una involución en U:

g: U ----+ U, (x, y, z) 1--+ (x - Y + z, y, 2y - z).

Veamos, en primer lugar, que 9 está bien definida: si (x, y, z) E U, entonces


x - y + z > O, y> O y 4(x - y + z)y + (2y - z)2 = 4xy + i 2, por lo que
g(x, y, z) E S. Como (x - y + z) - y + (2y - z) = x > O se deduce que
g(x, y, z) E U.
~. Además, 9 es una involución: 9 (x, y, z) = (x - y + z, y, 2y - z) se transforma
en ((x - y + z) - y + (2y - z), y, 2y - (2y - z)) = (x, y, z).
Finalmente, 9 tiene exactamente un punto fijo:

(x,y,z) = g(x,y,z) = (x-y+z,y,2y-z)

se verifica si y sólo si y = z y, en tal caso, p = 4xy + y2 = (4x + y)y, cuya


única solución es y = 1 = z Y x = p~l .
Pero si 9 es una involución en U que tiene exactamente un punto fijo, entonces
el cardinal de U es impar.
Representación de enteros como suma de dos cuadrados 21

3~ La tercera involución que estudiamos es trivial y consiste en intercambiar


x ey:
h: T ----t T, (x, y, z) 1----+ (y, x, z).
Es evidente que esta aplicación está bien definida y que es una involución.
Ahora combinamos los hechos deducidos de las otras dos involuciones: el
cardinal de T es igual al cardinal de U, que es impar. Pero si h es una involu-
ción en un conjunto finito de cardinal impar, entonces tiene algún punto fijo: En un conjunto finito de cardinal impar
existe un punto (x, y, z) E T tal que x = y, es decir, una solución de toda involución tiene al menos un punto
fijo.
o
Obsérvese que esta demostración dice más - el número de representaciones
de p de la formap = X2 + (2y)2 es impar para todos los números primos de
la forma p = 4m + 1. (De hecho, la representación es única, véase [3].) Ob-
sérvese también que ninguna de las demostraciones es constructiva: ¡intente
encontrar x e y para un número primo de diez dígitos! En [1] y [7] se estu-
dian formas eficientes de encontrar tales representaciones como suma de dos
cuadrados.
El siguiente teorema responde de forma definitiva a la pregunta con la que
comenzó este capítulo.
Teorema. Un número natural n se puede representar como suma de dos
cuadrados si y sólo si todos los factores primos de la forma p = 4m + 3
aparecen con exponente par en la factorización de n .

• Demostración. Diremos que un número n es representable si es la suma


de dos cuadrados, es decir, si n = x2 + y2 para ciertos x, y E No. El teorema
es una consecuencia de los cinco hechos siguientes.

(1) 1 = 12 + 02 Y 2 = 12 + 12 son representables. Todo número primo de la


forma p = 4m + 1 es representable.

(2) El producto de dos números representables nI = xi + YI y n2 = x~ + y~


es representable: nln2 = (XIX2 + YlY2)2 + (XIY2 - x2Yd 2.

(3) Si n es representable, n = x2 +y2, entonces nz 2 también es representable,


ya que nz 2 = (XZ)2 + (yz)2.

Los hechos (1), (2) Y (3) proporcionan la parte "si" del teorema.

(4) Si p = 4m + 3 es un primo divisor de un número representable


n = X2 + y2, entonces p es divisor de x y de y, por lo que p2 es divi-
sor de n. De hecho, si x =t O(mod p), existiría x tal que xx == 1 (mod p),
y multiplicando la ecuación X2 + y2 == O por x2 obtendríamos la relación
1 + y2J;2 = 1 + (xy)2 == O(modp), lo que es imposible según el Lema 1
ya que p = 4m + 3.

(5) Si n es representable y p = 4m + 3 es un divisor de n, entonces p2 es


divisor de n y n/p2 es representable. Esto se deduce de (4) y completa la
demostración. O
22 Representación de enteros como suma de dos cuadrados

Como veamos que existen infinitos números de la forma


P = 4m + 1.
Para ello, supongamos que hay un número finito y denotemos
por Pk al mayor de ellos. Consideremos

que es congruente con 1 (mod4). Todos sus factores primos son mayores
que Pk y, según el hecho (4) de la demostración precedente, no tiene factores
primos de la forma 4m + 3. Por tanto, M k tiene un factor primo de la forma
4m + 1 que es mayor que Pk.
Concluimos con dos observaciones:
11' Si a y b son dos números naturales que son primos entre sí, entonces hay
infinitos números primos de la forma am+b Cm E N) - este es un famoso
(y difícil) teorema de Dirichlet. De forma más precisa, se puede demostrar
que la cantidad de números primos P :S x de la forma P = am + b viene
dada de forma muy aproximada si x es grande por la función 'Pea) lo~ x,
donde cp(a) denota el número de primos relativos con a que son menores
que a. (Esto es una mejora sustancial del teorema de los números primos,
que tratamos en la página 10.)
11' Esto quiere decir que los números primos para a fijo y b variable aparecen
esencialmente en igual cantidad. Sin embargo, por ejemplo para a = 4, se
puede observar una sutil, pero perceptible y persistente tendencia a "más"
primos de la forma 4m + 3: si observamos un valor de x grande al azar, es
probable que haya más primos P :S x de la forma P = 4m + 3 que de la
forma P = 4m + l. Este efecto se conoce como "desviación de Chebyshev";
véase Riesel [4] y Rubinstein y Sarnak [5].

[1] F. W. CLARKE, W. N. EVERITT, L. L. LITTLEJOHN & S. J. R. VORSTER: H. J.


S. Smith and the Fennat Two Squares Theorem, Amer. Math. Month1y 106 (1999),
652-665.
[2] D. R. HEATH-BROWN: Fermat's two squares theorem, Invariant (1984),2-5.
[3] I. NrvEN & H. S. ZUCKERMAN: An Introduction to the Theory ofNumbers, Fifth
edition, Wiley, New York 1972.
[4] H. RIESEL: Prime Numbers and Computer Methods for Factorization, Second
edition, Progress in Mathematics 126, Birkhauser, Boston MA 1994.
[5] M. RUBINSTEIN & P. SARNAK: Chebyshev's bias, Experimental Mathematics 3
(1994), 173-197.
[6] A. THUE: Et par antydninger til en taltheoretisk metode, Kra, Vidensk. Selsk.
Forh. 7 (1902), 57-75.
[7] S. WAGON: Editor's comer: The Euclidean algorithm strikes again, Amer. Math.
Monthly 97 (1990), 125-129.
[8] D. ZAGIER: A one-sentence proofthat every prime p == 1 (mod4) is a sum oftwo
squares, Amer. Math. Monthly 97 (1990), 144.
Los anillos son estructuras importantes en el álgebra moderna. Si un anillo R
tiene elemento neutro para la multiplicación y cualquier elemento distinto de
cero tiene inverso para la multiplicación, entonces R es un anillo de división.
Así pues, todo lo que le falta a R para ser un cuerpo es la conmutatividad
de la multiplicacion. El ejemplo mejor conocido de un anillo de división no
conmutativo es el de los cuaterniones, descubierto por Hamilton. Pero, tal
y como dice el título del capítulo, cualquier anillo de este tipo ha de ser ne-
cesariamente infinito. Si R es finito, entonces los axiomas fuerzan a que la
multiplicación sea conmutativa.
Este resultado, ya un clásico, ha cautivado la imaginación de muchos mate-
máticos porque, como escribe Herstein, "es una inesperada interrelación entre
dos cosas aparentemente no relacionadas como son el número de elementos
en un sistema algebraico determinado y la multiplicación en ese sistema."

Teorema. Cualquier anillo de división R es conmutativo.


EmstWitt

Este bonito teorema, habitualmente atribuido a MacLagan Wedderburn, ha


sido probado de diferentes maneras, utilizando una gran variedad de ideas. El
mismo Wedderburn dio tres demostraciones en 1905, y Leonard E. Dickson
dio otra en el mismo año. Emil Artin, Hans Zassenhaus, Nicolas Bourbaki,
y muchos otros encontraron posteriormente nuevas demostraciones. Una de
ellas destaca por su simplicidad y elegancia. Fue hecha pública por Ernst Witt
en 1931 y combina dos ideas elementales que conducen a un glorioso final.
• Demostración..
Nuestro primer ingrediente está tomado de una combinación de álgebra lineal
y teoría de grupos básica. Para un elemento arbitrario s E R, sea C s el con-
junto {x E R : xs = sx} de elementos que conmutan con s; C s se llama el
centralizador de s. Claramente, C s contiene al O y all, y es un subanillo de
división de R.
El centro Z es el conjunto de elementos que conmutan con todos los elemen-
tos de R, esto es, Z = nsER Cs. En particular, todos los elementos de Z
commutan, O yI están en Z, y por tanto Z es un cuerpo finito. Sea IZI = q.
(Se puede demostrar que q debe ser una potencia de un número primo.)
Podemos considerar R y C s como espacios vectoriales sobre el cuerpo Z y de-
ducir que IRI = qn, donde n es la dimensión del espacio vectorial R sobre Z,
y de manera similar ICsl = qns para enteros apropiados ns :::: 1.
Ahora, suponemos que R no es un cuerpo. Esto significa que para algún s E R
el centralizador C s no es todo R, o lo que es lo mismo, ns < n.
24 Cualquier anillo de división finito es un cuerpo

En el conjunto R* := R\ {O} consideramos la relación

:~ r ' = x- 1rx para algún x E R*.

Es fácil comprobar que ~ es una relación de equivalencia. Sea

la clase de equivalencia que contiene a 8. Nótese que se cumple lAs = 1 1

precisamente cuando 8 está en el centro Z. Así, por nuestra suposición, existen


clases As con 1 2: 2. Consideramos ahora para 8 E R* la aplicación
1
f8 : x f---+ X- 8X de R* en As. Para x, y E R* tenemos

X- 18X = y-1 8y ~ (YX- 1)8 = s(yx- 1)


~ yx- 1 EO; ~ yEO;x,

donde hemos definido O; := Os \{O}, y O;x {zx: Z E O;} tiene car-


dinal 10; l. De aquí, cualquier elemento x- 1sx es la imagen de precisamente
10; 1 = qns - 1 elementos en R* bajo la aplicación f8, y deducimos que
1R* 1= 1As 110; l· En particular, nótese que
IR*I n 1
q = lAs es un entero para todo s.
10;1 qns - 1
1

Sabemos que las clases de equivalencia son una partición de R*. Ahora agru-
pamos los elementos del centro Z* y denotamos por Al, ... , At las clases de
equivalencia que contienen más de un elemento. Por nuestra suposición, sabe-
mos que t 2: 1. Como IR* 1= IZ* 1+ ¿;~=1 IAk 1, hemos probado la llamada
fórmula de clases

n
q -1 = q-l+
¿ t n
q -
1
(1)
nk -1'
k=l q

donde tenemos 1 < qªn. k


n
--1 1
E N para todo k.
Con (1) hemos dejado el álgebra abstracta y vuelto a los números naturales.
Ahora veremos que qn k -1 qn -1 implica que nk n. De hecho, si escribimos
1 1

n = ank + r con O :s; r < nk, entonces qn k - 11 qank+r - 1implica

y por tanto qn k - 11 q(a-1)n k +T - 1, ya que qn k y qn k - 1 son primos .entre


sí. Continuando de esta manera se tiene qn k - 11 qT - 1con O :s; r < nk, que
sólo es posible para r = O, esto es, nk n. En resumen, nótese que
1

nk n 1 para todo k. (2)

Ahora viene el segundo ingrediente: los números complejos C. Consideramos


el polinomio xn - 1. Sus raíces en C son las raíces n-ésimas de la unidad.
Como An = 1, todas estas raíces A tienen IAI = 1, Y por lo tanto son puntos
de la circunferencia unidad en el plano complejo. De hecho, son precisamente
los números Ak = e ';.,"i = cos(2k1r/n) + isen(2k7r/n), O < k < n
2
1
Cualquier anillo de división finito es un cuerpo 25

el recuadro en esta de las raíces A satisfacen Ad = 1


para d < n; por ejemplo, la raíz A = -1 satisface A2 = 1. Para una raíz A,
sea d el exponente positivo más pequeño con Ad = 1, esto es, d es el orden
de A en el grupo .de las raíces de la unidad. Entonces d In, por el teorema de
Lagrange ("el orden de cualquier elémento de un grupo divide al orden del
grupo" - véase el recuadro en el capítulo 1). Existen raíces de orden n, tales
como Al = e 2~i .

Cualquier número "nrnr\lp, z = x + iy puede escribirse en forma


como
z rép = r(cosso + i sen SO),
donde r = Iz I = .J
X2 + y2 es la distancia de z al origen y SO es el
ángulo medido en sentido positivo desde el eje de abscisas. Las raíces x = reos SO
n-ésimas de la unidad son de la forma
2
Ak = e k;;i = cos(2k1f/n) + isen(2k1r/n), o:::; k:::; n -1,

ya que para todo k

Ah = e2k'lCi = cos(2k1r) + isen(2k1f) = 1. -1

Obtenemos estas raíces geométricamente al inscribir un n-ágono regular


en la circunferencia unidad. Nótese que Ak (k para todo k, donde
( = e 2~i. Por tanto, las raíces n-ésimas de la unidad forman un grupo
cíclico {(, (2, ... ,(n-l, (n = 1} de orden n.
Raíces de la unidad para n =6

Ahora agrupamos todas las raíces de orden d y ponemos


TI (X-A).
A de orden d

Nótese que la definición de ePd (x) es independiente de n. Puesto que cualquier


raíz tiene algún orden d, concluimos que

(3)
dln
Aquí viene la observación crucial: los coeficientes de los polinomios ePn (x)
son enteros (esto es, ePn(X) E Z[x] para todo n) y además el término indepen-
diente es o bien 1 ó -1.
Verifiquemos con cuidado esta afirmación. Para n = 1 tenemos 1 como única
raíz, y por tanto ePI (x) = x -1. Ahora procedemos por inducción, suponiendo
que ePd(X) E Z[x] para todo d < n, y que el término independiente de ePd(X)
es 1 ó -1. Por (3),
(4)
e j n-e
dondep(x)= ¿PjX , ePn(x) = ¿akxk, conpo=1opo=-1.
j=O k=O
26 Cualquier anillo de división finito es un cuerpo

Puesto que -1 = poao, vemos que ao E {1, -1}. Supongamos que ya sabe-
mos que ao, al, ... , ak-1 E Z. Calculando el coeficiente de Xk a ambos lados
de (4) obtenemos
k k

2:.Pj a k-j 2:.Pjak-j + POak E Z.


j=o j=l
Por hipótesis, todos los ao, ... ,ak-1 (y todos los Pj) están en Z. Por tanto
POak es entero, y en consecuencia ak también, ya que Po es 1 ó -l.
Ahora ya estamos listos para el golpe de gracia. Sea nk n uno de los números
1

que aparecen en (1). Entonces

di n di n, dfnk, d#n
rr
Concluimos que en Z tenemos las relaciones de divisibilidad
qn -1
y cfJn (q) I qnk _ 1 . (5)

Ya que (5) se verifica para todo k, deducimos de la fórmula de clases (1) que

pero esto no puede ser. ¿Por qué? Sabemos que cfJn(x) = IJ(x - A) donde A
recorre todas las raíces de xn - 1 que tienen orden3. Sea A = a + ib una de
esas raíces. Como n > 1 (ya que R ::J Z) tenemos A ::J 1, lo cual implica que
la parte real a es menor que 1. Ahora 1>:1 2 = a 2 + b2 = 1, Y de aquí

Iq - a - ibl 2 = (q - a)2 + b2
q2 _ 2aq + a 2 + b2 = q2 - 2aq +1
> (porque a < 1)

Iq - ¡.ti > Iq - 11 y también Iq - >:1 > q - 1 se verifica para todas las raÍCes de orden n. Esto
implica

A
lo cual significa que cfJn(q) no puede ser un divisor de q - 1, que es una con-
tradicción y pone fin a la demostración. O

[1] L. E. DrCKSON: Onfinite algebras, Nachrichten der Alead. Wissenschaften Got-


tingen Math.-Phys. Klasse (1905), 1-36; Collected Mathematica1 Papers Vol. III,
Che1sea Publ. Comp, The Bronx, NY 1975, 539-574.
[2] J. H. M. WEDDERBURN: A theorem onfinite algebras, Trans. Amer. Math. Soco
6 (1905), 349-352.
[3] E. WITT: Über die Kommutativitiit endlicher Schiefkorper, Abh. Math. Sem. Univ.
Hamburg 8 (1931), 413.
"Jr es irracional"

Este resultado se remonta a Aristóteles, quien supuestamente afirmó que el


diámetro y la longitud de una circunferencia no son conmensurables. La pri-
mera demostración de este hecho fundamental fue dada por Johann Heinrich
Lambert en 1766. La demostración de El Libro que presentamos se debe a
Ivan Niven y data de 1947: es un argumento muy elegante de una sola página
que únicamente hace uso de cálculo elemental. Su idea es potente y puede
ser utilizada para obtener más resultados, como muestran los resultados de
Iwamoto y Koksma, respectivamente:

Jr2 es irracional y

El eT es irracio.nal si r i=- O es racio.nal.

El método. de Niven tiene alguno.s precedentes: se puede seguir su rastro hasta


Charles Hermite
el artículo. clásico. de Charles Herrnite de 1873, do.nde se demo.stró po.r primera
vez que e es trascendente, es decir, que e no. es raíz de ningún po.lino.mio. co.n
co.eficientes racio.nales.
Antes de estudiar Jr no.s o.cuparemos de e y sus po.tencias, y demo.straremo.s e .- 1 + t + ~ + i + :h + ...
que so.n irracio.nales. Esto. es mucho. más sencillo., y además nos permitirá 2.718281828 ...
respetar el orden histórico de o.btención de lo.s resultados.
Para co.menzar, es bastante sencillo. ver, al igual que hizo Fo.urier en 1815, que
tr
e = "2::\>0 es irracional. De hecho, si se tuviera e = T; para ciertos enteros
a y b > 0, ento.nces se o.btendría

n!be = n!a

para todo n 2: O. Pero esto. no puede ser cierto, ya que la parte derecha de la
igualdad es un entero, en tanto que la parte izquierda, con

se descompo.ne en una parte entera

I(
bn. 1 + I1
1.
+ I2.1 + ... + In.1)
y una segunda parte

1 1 1 )
b ( n+l + (n+l)(n+2) + (n+l)(n+2)(n+3) + .,.
28 Algunos números irracionales

que es aproximadamente ~ y, por tanto, para n grande no puede ser entero: es


Serie gec)m,etrlca mayor que n!
1 y menor que ~, según se puede comprobar comparando con
Para la serie geométrica infinita la serie geométrica:
Q=i+ +q\+'" 1 1 1 1
con q > 1 se tiene que - - < --+ +"(n+1)(n+2)(n+3) + ...
n+1 n+1 (n+1)(n+2)
qQ = 1 + i + q\ + ... = 1 + Q 1 1 1 1
y, por tanto, < n+1+(n+1)2+(n+1)3+'" =;;;,'
1
Q
q-l
En este punto el lector se habrá dado cuenta de que este simple truco de "mul-
tiplicar por n!" no es suficiente para demostrar que e 2 es irracional. Este úl-
timo resultado es más fuerte: V2 es un ejemplo de un número irracional cuyo
cuadrado es racional.
John Cosgrave observó que con dos bellas observaciones (nosotros las llama-
remos "trucos") se puede llegar dos pasos más allá: cada uno de los trucos
es suficiente para demostrar que e 2 es irracional, y la combinación de los dos
1,92. JOURNAL DE MATHÉMATIQUES permite demostrar que é también es irracional. El primer truco se puede en-
contrar en un artículo de una página de J. Liouville de 1840 - Y el segundo
SUR L'lRRATIONNALlTÉ DU NOMBRE en una adenda de dos páginas que Liouville publicó a continuación.

PAn J. LIOUVILLE. ¿Por qué es irracional e 2 ? ¿Qué se puede deducir de e2 = %? Según Liouville,
deberíamos escribir esta igualdad como
On prouve dans les éléments que le nombre e J base des logarithmes
népériens, n'a pas une valenr rationnelle, Gn de'Tait, ce me semble,
ajouter que la melle m~thode pro uve aussi que e ue peut pas etre ra-
cine d'une équation du second degré a coefficients rationne1s, en sarte
be = ae- 1 ,
que l'on ne peutpas avoir ae+ ~ = e, a étantun entier positifetb, e,
des entiers positifs négatifs. En effet, si l'on remplace dans eette
DU

équation e et :; DU e- 1 par le~rs développements deduits de celui dee",


sustituir las series
puia qu' on multiplie les deux membres par J. 2..3. , . n, 00 trouvera
aisément
e
"~, (,+"~,+ ... )± ".!-,(' ,-"~, +.)=!"
¡.t étant un entier. 00 peut toujours faire en 50rte que le facteur y
+~
-"+1
soit positif¡ i1 suffil'ade supposer npairsi b est <o etn impail' si b est
>0 ¡ en pl'enant de plus n tres grand) J'équation que nous venoos
d'écril'e conduira des lol's a une absurdité; cal' son pl'emier membre
étant essentiellement positif et tres petit, sera compris entre o et r,
.et ne pourra pas étre égal a un entiel' 0. Done, etc.
ya continuación multiplicar por ni, para algún número par n suficientemente
grande. Entonces se tiene que n!be es casi un entero:
Artículo de Liouville 1
n!b ( 1 + -
1
1)
+ -12 + -61 + ... + -,
n.
es un entero, y el resto

es aproximadamente ~, ya que es mayor que n!l


pero menor que ~, como
hemos visto anteriormente.
Al mismo tiempo, n!ae- 1 es también casi entero: de nuevo, obtenemos una
parte entera grande, y un resto

(-1 )n+l,n.a ((n+l)!-(n+2)!+(n+3)!:::¡:""


1 1 1 )
Algunos números irracionales 29

que es (_l)n+l~. De manera más para un número


par 71 el resto es mayor que - ~, pero menor que

_a(_l_ _
71+1
e

(71+1.)2
1 _(71+1)3
1 _ ) ___71+1
a_ (1-~)
71 oo' -
< O.

Esto es imposible, ya que para un número par 71 suficientemente grande se


tendría que n!ae- 1 es un poco menor que un entero, mientras que n!be es
un poco mayor que un entero y, en consecuencia, no se puede cumplir que
n!ae- 1 = n!be. O

Para demostrar que é es irracional, nos armamos de valor para suponer que
é = ~ es racional, y escribimos esta igualdad así:

be 2 = ae- 2 .

Podríamos intentar multiplicar por n! para algún 71 grande y agrupar los su-
mandos no enteros, pero esta idea no produce ningún resultado útil: la suma
2n 1 2n 1
de los restantes términos sería b : para el lado izquierdo y (_1)n+la :
para el lado derecho, y ambos serían grandes si 71 se hace grande.
Por tanto, es preciso estudiar la situación cuidadosamente y realizar dos pe-
queños retoques en la estrategia: en primer lugar, no tomaremos un 71 grande
arbitrario, sino una potencia de dos grande, 71 = 2m ; en segundo lugar, no
multiplicaremos por ni, sino por 2:~1' Necesitamos ahora un pequeño lema,
un caso especial del teorema de Legendre (véase la página 8): para cualquier
entero 71 2: 1, n! contiene el factor primo 2 como mucho 71 - 1 veces - la
igualdad se da si (y sólo si) 71 es potencia de dos, 71 = 2m .
Este lema no es nada difícil de demostrar: L~ J de los factores de ni son pares,
L:¡ J de ellos son divisibles por 4, y así sucesivamente. Por tanto, si 2k es la
mayor potencia de dos que satisface 2k :::: 71, entonces n! contiene el factor
primo 2 exactamente

l~J+l¡J+ ... +l;J < ~+¡+ ... +; = n(1-21k):::: 71-1

veces, donde las dos desigualdades se convierten en igualdades sólo cuando


71 = 2k .
Volvamos a be 2 = ae- 2 . Estamos estudiando
n! 2 n! -2
b-n- 1e a--e (1)
2 - 2n - 1
y sustituimos las series

1+-+-+-+ +,+ ...


2 r
248
126 r.
y

Para r :::: 71 obtenemos sumandos enteros en ambos lados, a saber


30 Algunos números irracionales

donde para r > O el denominador r! contiene el factor 2 como mucho


r - 1 veces, en tanto que n! lo contiene exactamente n - 1 veces. (Por tanto,
para r > Olos sumandos son pares.)
Como n es par (hemos tomado n 2 m ), las series que obtenemos para
r 2: n + 1 son
2 4 8 )
2b ( n+1 + (n+1)(n+2) + (n+1)(n+2)(n+3) + ...
y
2 4 8 )
2a ( - n+1 + (n+l)(n+2) - (n+1)(n+2)(n+3) ± ....

Si n es grande, estas series suman, aproximadamente, ~ y - ~ , respectiva-


mente, como se puede comprobar comparando con la serie geométrica. Para
n = 2m grande, esto quiere decir que el término de la izquierda de (1) es un
poco mayor que un entero, en tanto que el término de la derecha es un poco
menor - y esta es la contradicción buscada. D

Hemos demostrado que é es irracional. Para demostrar que é, é etc. tam-


bién son irracionales necesitamos herramientas más potentes (en concreto, un
poco más de cálculo infinitesimal) y una nueva idea - originalmente debida
a Charles Hermite, cuya esencia está contenida en este sencillo lema.
Lema. Sea n 2: 1 fijo y consideremos

2n
(i) Lafunción f(x) es un polinomio de laforma f(x) = ~ :~=>ixi,
n ..
donde los coeficientes Ci son enteros. 2=n

(ii) Para O< x < 1 se tiene que 0< f(x) < ~.


n.

(iii) Las derivadas f(k)(O) y f(k)(l) son enteros para todo k 2: O.

• Demostración. Las partes (i) y (ii) son evidentes.


Para demostrar (iii), obsérvese que, según (i), la k-ésima derivada f(k) se anula
en x = Oexcepto si n ::; k ::; 2n y, para estos valores de k, f(k) (O) = ~Ck es
un entero. Def(x) = f(l-x) se deduce que f(k)(x) = (-l)kf(k)(1-x)
para todo x y, por tanto, f(k) (1) = (-l)k f(k) (O), que es un entero. D

Teorema 1. eT es irracional para todo r E Q\ {O}.

• Demostración. Es suficiente demostrar que eS no puede ser racional para


ningún número natural s (si et fuera racional, entonces (et) t = eS también
La estimación n! > e ( :;;- ) n nos da, lo sería). Supongamos que eS = %para ciertos enteros a, b > O, Y sea n lo
de forma explícita, un n que es "sufi- suficientemente grande como para que n! > as 2n +1 . Sea
cientemente grande."

donde f (x) es la función del lema anterior.


Algunos números irracionales 31

F(x) se escribir también como una suma infinita


F(x) =. s2n f(x) - s2n-l j'(x) + s2n-2 f"(x):::¡= ... ,
ya que las derivadas f(k) (x) se anulan para k > 2n. De aquí se deduce que el
polinomio F (x) satisface la ecuación
F'(x) = -3 F(x) + s2n+l f(x).
Utilizando esta igualdad se obtiene que
d
- [e SX F(x)] = se sx F(x) + eSx F'(x)
dx
y por tanto,

N := b !al s2n+le sx f(x)dx = b [e SX F(x)]~ = aF(l) - bF(O).

Esta expresión es un entero, ya que la parte (iii) del lema asegura que F(O)
y F(l) son enteros. Sin embargo, la parte (ii) del lema proporciona cotas
superiores e inferiores para N,
1 as 2n + l
1
1
O< N = b s2 n+l esx f(x)dx < bs 2n +l e s _ = --- < 1,
o n! n!
lo que demuestra que N no puede ser un entero, y he aquí la contradic-
ción. D
Como hemos utilizado este truco con éxito, lo ponemos en práctica una vez
más.

Teorema 2. 7f2 es irracional .

• Demostración. Supongamos que 7f2 = %para ciertos enteros a, b > O.


Consideremos el polinomio

F(x) := bn (7f 2n f(x) - 7f2n-2 f(2) (x) + 7f2n-4 f(4) (x) :::¡= . " ),

que verifica la ecuación FI! (x) = _7f2 F(x) + bn 7f2n+2 f(x).


De la parte (iii) del lema se obtiene que F(O) y F(l) son enteros. Derivando 1['no es racional, pero tiene "buenas
obtenemos que aproximaciones" por números raciona-
les - algunas de ellas son conocidas
d
dx [F'(x) sen 7fX - 7fF(x) COS7fx] (FI! (x) + 7f2 F (x) ) sen 7fX desde la antigüedad:
~ 3.142857142857 .. .
bn7f2n+2 f(x) sen 7fX
i{~ 3.141592920353 .. .
7f 2a n f(x) sen 7fX, 104348
33215
3.141592653921.. .
y, por tanto, 1[' 3.141592653589 ...

N := 7f !al an f(x) sen 7fX dx [~F'(x) sen7fx - F(x) COS7fx]:

F(O) + F(l),
que es un entero. Además, N es positivo ya que está definido como la
32 Algunos números irracionales

integral de una función positiva (excepto en los extremos). Sin embargo, si


n
escogemos n suficientemente grande para que 7ra n.l
< 1, de la parte (ii) del
lema se deduce que

o< N = 7r 1 1
n
a f(x)sen7rxdx < < 1,

lo cual es una contradicción. D

Finalmente presentamos nuestro último resultado sobre números irracionales.

Teorema 3. Para todo entero impar n 2: 3, el número

A(n) := ~ arccos ()n)


es irracional.

Necesitaremos este resultado para el tercer problema de Hilbert (véase el ca-


pítulo 8) en los casos n = 3 Y n = 9. Para n = 2 Y n = 4 se tiene que
A(2) = ~ y A(4) = !,
lo que demuestra que la restricción a valores impares
de n es esencial. Es sencillo ver que la afirmación "~ arccos (Jn)
es irra-
cional" es equivalente, en la figura del margen, a que la poligonal construida
1 a partir de Jn
y tal que todos sus lados tienen la misma longitud, nunca se
cierra.
Proponemos como ejercicio para el lector demostrar que A( n) es racional
solamente para n E {1, 2, 4}. Como indicación, distínganse los casos en que
n = 2T del resto.

11 Demostración. Utilizamos la identidad trigonométrica

cos CIé + cos (3 = 2 cos a!i3 cos a;i3


que, para CIé = (k + l)ep Y (3 = (k - l)ep, nos proporciona la expresión
cos (k + l)ep = 2 cos ep cos kep - cos (k - l)ep. (2)

Para el ángulo epn = arce os (Jn),


definido por cos epn = Jn y O ::; epn ::; 7r,
obtenemos una representación de la forma

donde Ak es un entero no divisible por n, para todo k 2: O. De hecho, dicha


representación para k = 0,1 se tiene con Ao = Al = 1 y, por inducción sobre
k y utilizando (2), obtenemos que para k 2: 1

De esta expresión se deduce que A k+1 = 2Ak - nAk-1. Si n 2: 3 es impar y


Ak no es divisible por n, entonces Ak+1 tampoco puede ser divisible por n.
Algunos números irracionales 33

U¡'_H--'u¡o;aULVC> ahora que

k
A(n) =
g
es racional (donde k,.€ > O son enteros). Haciendo .€'Pn = br se obtiene que

R A
±1 = cos br = --r
,¡n
R
Por tanto,,¡n = ±AR es un entero, con.€ ~ 2, de donde se deduce que
n I ,¡nR. Como ,¡nR I A Rse deduce que n es un divisor de A R,Yhemos llegado
a una contradicción. O

[1) C. HERMITE: Sur lafonction exponentielle, Comptes rendus de l'Académie des


Sciences (Paris) 77 (1873), 18-24; CEuvres de Charles Hermite, Vol. rn, Gauthier-
Villars, Paris 1912, pp. 150-181.
[2) Y. IWAMOTO: A proof that -¡¡-2 is irrational, J. Osaka Institute of Science and
Technology 1 (1949),147-148.
[3) J. F. KOKSMA: On Niven's proof that -¡¡- is irrational, Nieuw Archief voor Wis-
kunde (2) 23 (1949), 39.
[4) J. LIOUVILLE: Sur l'irrationalité du nombre e = 2,718 ... , Joumal de Mathé-
matiques Pures et Appl. (1) 5 (1840), 192; Addition, 193-194.
[5) I. NIVEN: A simple proof that -¡¡- is irrational, Bulletin Amer. Math. Soco 53
(1947),509.
/

Sabemos que la serie infinita ¿n>l ~ no converge. Es más, en el capítulo 1


hemos visto que incluso la serie I:PElP' ~ diverge.
Sin embargo, la suma de los recíprocos de los números cuadrados converge
(muy despacio, como veremos) a un valor interesante.

La serie de Euler.

Esto es un resultado clásico, conocido e importante, que demostró Leonhard


Euler en 1734. Una de sus interpretaciones clave es que proporciona el primer
valor no trivial ((2) de la función zeta de Riemann (ver el apéndice en la
página 41). Como vimos en el capítulo 6, este valor es irracional.
Este resultado comparte su lugar tan destacado en la historia de la matemáti-
cas con algunas demostraciones muy elegantes que se dieron de él. En algunos
casos la alegría del hallazgo fue compartida por muchos matemáticos. Presen- 1.000000
taremos a continuación tres de estas demostraciones. 1.250000
1.361111
• Demostración. La primera demostración aparece como ejercicio en e11i- 1.423611
bro de teoría de números de William 1. LeVeque del año 1956. Pero él mismo 1.463611
afirma: "No tengo la menor idea del origen de este problema, pero estoy bas- 1.491388
tante convencido de que no lo encontré yo." 1.644934.
La prueba consiste en evaluar de dos maneras diferentes la integral doble

1 1

1 := JJ_1-dXd
1- xy Y.
o o

Para la primera, desarrollamos l!XY como serie geométrica, descomponemos


los sumandos como productos, e integramos:
1 1 1 1

1 J J2~)xytdXdY = L J J xnyndxdy
o o n~O n~Oo o
36 Tres veces ]f2 /6

Esta evaluación también demuestra que esta integral doble (de una función
positiva con un polo en x = y = 1) es finita. Asimismo, nótese que el
cómputo se puede efectuar al revés, de manera que la evaluación de ((2) lleva
a la integral doble J.
Le segunda manera de evaluar J parte de un cambio de coordenadas: En las
coordenadas nuevas u := yt x y v := y;x el dominio de integración es un
cuadrado de arista ~ y2, que se obtiene a partir del dominio antiguo primero
rotando 45° y después reduciendo según el factor de escala de y2. Sustitu-
yendo x = u - v e y = u + v nos da
1 1
1- xy 1- u 2 + v2 '
Para transformar la integral tenemos que reemplazar dx dy por 2 du dv, para
x
compensar el hecho de que nuestra transformación de coordenadas reduce el
1 área según el factor constante 2 (el jacobiano de la transformación; véase el
recuadro en la página siguiente). Tanto el nuevo dominio de integración como
v la función a integrar son simétricos respecto del eje u, por tanto sólo nos hace
falta calcular la integral sobre la mitad superior del nuevo dominio, y tener en
1 cuenta un factor adicional de 2. Descomponemos esta integral en dos partes
"2
de manera más natural:

u J dv )d
1- u2 + v2 u.
1

dx 1 x
Usando
J 2
a +x
2 = -
a
aretan -

1/2
a
+ e, obtenemos

J 4 J~
o
1- u 2
aretan (~)
1- u
du 2

+ 4J1 ~arctan(~)du.
u 1- u 1- 2 2
1/2

Podríamos evaluar estas integrales sustituyendo u = sen e y u = cos e,


respectivamente. Pero procederemos de manera más directa, usando que la
derivada de g(u) := aretan C/1~u2) es g'(u) = v'1~u2' y que la derivada de
h( u) := arctan (v'~-=-:2) = aretan (Vi+~) es h' (u) = - ~ v'1~u2' De la
relación J: f'(x)f(x)dx = [~f(x)2l~ = V(b)2 - V(a)2 resulta
2
J 4Jor 1
/ g'(u)g(u) du + 41,1 1/2
-2h'(u)h(u) du

2[9(u)2]:/2 - 4[h(u)2]:/2
2g(~)2 _ 2g(0)2 - 4h(1)2 + 4h(~)2

2(~)2_0_0+4(~)2 =
2
7[6 • O
Tres veces 1T 2 /6 37

En esta demostración hemos calculado el valor de la serie de Euler a de


una integral, usando un sencillo cambio de coordenadas. Una demostración La
ingeniosa de este tipo, pero con un cambio de coordenadas decididamente no Para evaluar una integral doble
trivial, fue descubierto más tarde por Beukers, Calabi y Kolk. Su punto de
partida es separar la suma ¿n>l
términos pares 212 + 12 + l2
;2
en sus términos pares e impares. Los
+--: .. =¿k2:1 (2k)2 claramente suman ~((2),
1 = J
s
f(x,y)dxdy.

' . .
Y por tanto 1os termmos Impares ]2 + 32 + 52 + ... - L..-,k2:0 (2k+l)2 suman
1 1 1 _"\, 1
podemos efectuar una sustitución de
las tres cuartas partes de la suma total ((2). Queda por demostrar pues que variables

x=x(u,v) y=y(u,v),
1
si la correspondencia de (u, v) E T
k2:0 (2k + 1)2 8 a (x, y) E S es biyectiva y derivable
con derivada continua. En este caso,
1 es
I
11 Demostración. Como antes, podemos expresarlo como una integral doble:
1 1
J
T
f(x( u, v), y(u, v» \de
d(X,y)
u, v) du dv,

J = JJ
o o
1_ ~2y2 dx dy = L
k2:0
(2k: 1)2' donde d(x,y)
d(u,v)
es eIJ'acobiano:

Para calcular esta integral J, Beukers, Calabi y Kolk propusieron pasar a las d(x, y) = det ( ~~ dx
dv
dy
) -
.
coordenadas nuevas d(u, v) ~; dv

~
-X2
u := arccos 1
-xy
2 2 v := arccos {§/;
1
_Y2
2 2'
-xy

Para efectar el cálculo, ignoramos la frontera del dominio y consideramos x, y


en los intervalos O < x < 1 Y O < Y < 1. Entonces u, v estarán en el
y
triángulo u > O, v > O, u + v < 1T /2. Se puede invertir esta transformación
de coordenadas de manera explícita, llegando a la substitución 1
sen u sen v
x = -- and Y -- --- .
S
cosv cosu
Es fácil comprobar que estas fórmulas definen una transformación biyectiva x
entre el interior del cuadrado unidad S = {(x, y) : O x, y :S 1} Y el interior :s: 1
del tnángulo T = {(u,v) : u,v:::: O, u + v:S: 1T/2}.
Ahora tenemos que calcular el jacobiano de esta transformación, y como por
arte de magia resulta ser v
7r
cosu sen u sen v ) "2
det cosv cos 2 V
( sen u sen v cosv
cos 2 u cosu

Pero esto significa que la integral que buscamos se transforma en


7r /2 7r /2-u T
J ¡ J I dudv, u
o o 7r
"2
que es justo el área ~ (~)2 = ~2 del triángulo T. D
38 Tres veces 1T 2 /6

Maravilloso - y más porque el mismo método se extiende al cálculo de (( 2k )


en términos de una integral 2k-dimensional, para todo k > 1.
Nos referimos al artículo original de Beuker, Calabi y Kolk [2], y al capí-
tulo 20, donde llegaremos a lo mismo por un camino diferente, usando el
truco de Herglotz y la idea original de Euler.
Después de ver estas dos demostraciones via transformadas de coordenadas,
no podemos resistir la tentación de presentar otra, completamente diferente y
elemental, del hecho que Ln>l ';'2 = ~2. Aparece en una secuencia de ejer-
cicios del libro de problemas de los hermanos gemelos Akiva y Isaak Yaglom,
cuyo edición original rusa data de 1954. Algunas versiones de la demostración
original fueron redescubiertas y presentadas por F. Holme (1970), I. Papadi-
mitriou (1973) y Ransford (1982), quien la atribuyó a 10hn Scholes .

• Demostración.. El primer paso consiste en establecer una relación entre


valores de la función "cotangente al cuadrado". Para todo m ~ 1, se tiene
Para m = 1,2,3, esto resulta en
2
cot :¡¡: =i (1)
cot ~2
+ cot 2
2; =2
Para establecer este resultado, empezamos con la relación
cot 2 2':7 + cot 2 271"
7
+ cot 2 3"
7
=5
cos nx + i sen nx = ( cos x + i sen x) n
y nos fijamos en su parte imaginaria

sennx = (~)senxcosn-lx- (~)sen3xcosn-3x±... (2)

Ahora ponemos n = 2m + 1, mientras que para x consideramos los m valores


diferentes x = 2~~1' para r = 1,2, ... ,m. Para cada uno de estos valores
tenemos nx = r1T, y por tanto sen nx = O, mientras que O < x < ~ implica
que para sen x tenemos m valores positivos diferentes.
En particular, podemos dividir (2) entre sen n x, y obtenemos

esto es,

para cada uno de los m valores distintos de x. Del polinomio de grado m

p(t)

conocemos m raíces distintas


2
ar cot (2~~1) for r = 1,2, ... , m.

Por tanto, el polinomio coincide con


Tres veces 1T
2
/6 39

comp1anmdlo los coeficientes de t rn - 1


en p( t) deducimos que la suma
de los raíces es Comparación de coeficientes:
Si p(t) = c(t - al) ... (t - a m ),
2rn(2rn-1) entonces el coeficiente de t m - l es
6
-c(al + ... + a=).
lo cu",l demuestra
También necesitamos una segunda identidad del mismo tipo,

2 ( 1[") 2 ( 21[" ) 2 ( rn1[" ) _ 2m(2m+2) (3)


ese 2rn+1 + ese 2m+1 + ... + ese 2m+1 - 6 '

para la función cosecante ese x = se~ x. Pero

2 1 eos 2 x+sen2x 2
ese x = - -2
= 2 = eot x + 1,
sen x sen x
y podemos deducir (3) de (1) sumando m a ambos miembros de la ecuación.
Ahora ya tenemos todas las herramientas a mano, y podemos encajar las piezas
de la demostración. Usaremos que para O < Y < "i se cumple

O < sen y < y < tgy, O<a<b<c


y por tanto implica
0<1.<1.<1.
e b a
O < eoty < 1.y < esey,
lo cual implica que

2
eot 2 y < 1
y2 < ese y.
Ahora aplicamos esta desigualdad doble a cada uno de los m distintos valores
de x, y sumamos los resultados. Empleando (1) para el término a la izquierda
y (3) para el término de la derecha, obtenemos
2m(2m-1) 2m(2m+2)
6 6

esto es,
1["2 2m 2rn-1 1 1 1
62rn+12rn+1 < 12 + 22 + ... + m 2

2
Tanto el término de la derecha como el de la izquierda convergen a ~ para
m --+ 00: final de la demostración. O

¿Cómo de rápido converge ¿ ~2 a 1T


2
/6? Para responder a esta pregunta
hemos de estimar la diferencia
rn 1 00
1
6 Ln
n=l
2
n=m+1
L n 2·
40 Tres veces 71
2
/6
Esto resulta muy fácil mediante la técnica de con una , que
ya hemos visto en el apéndice al capítulo 2 (página 10). Nos da

f(t) = :b 00
"""'
1
<
100 -dt
1
= -
1
~ n2 m t2 m
n=m+1

como cota superior y


1 1 1
1
00
(m+1)2 > ?dt =
m+1 t~ m+ 1
t
como cota inferior para los "sumandos restantes" - o incluso

00 -12 > 100 1 1


¿
n=m+l
n
m+"
1
-dt -
t2 -
--
m .1+2
si efectuamos la estimación con algo más de cuidado, utilizando el hecho de
que la función f (t) = :b
es convexa.
Esto quiere decir que nuestra serie no converge muy rápidamente. Si sumamos
los primeros mil sumandos, esperamos un error en el tercer dígito después de
la coma, y para la suma del primer millón de sumandos (m = 1000000) un
error en el sexto dígito, y efectivamente eso es lo que obtenemos. Pero ahora
viene una gran sorpresa: hasta los primeros 45 dígitos,

1.644934066848226436472415166646025189218949901,

1.644933066848726436305748499979391855885616544.

Efectivamente, el sexto dígito decimal es falso (es una unidad mayor), pero
¡los seis dígitos siguientes son correctos! Y después hay un dígito equivocado
(es cinco unidades más grande), y luego hay cinco correctos. Este descubri-
miento sorprendente es bastante reciente: lo hizo Roy D. North de Colorado
Springs en 1988. (En 1982, Martin R. Powell, un maestro de Amersham, Bu-
cks (Inglaterra), no llegó a notar todo este efecto por razón de los insuficientes
recursos de cálculo que tenía entonces.) Es demasiado extraño para ser una
coincidencia. .. Fijémonos en el error de la aproximación: hasta los primeros
45 dígitos es

= 0.000000999999500000166666666666633333333333357,

y claramente hay algún patrón. Se puede escribir este número como


+10- 6 - ~1O-12 + i lO- 18 - 310 10- 30 + 12 10- 42 + ...
donde los coeficientes (1, ~,i, O, -lo, o,
1
4 2) de 1O- 6i son el principio de la
sucesión de los números de Bernoulli que volveremos a ver en el capítulo 20.
El lector interesado puede consultar el artículo original de Borwein, Borwein
y Dilcher [3] para más "coincidencias" extrañas - y para demostraciones.
Tres veces ]f2 /6 41

Lafunción zeta de Riemann (( 8) se define para números reales 8 > 1 mediante

1
((8) :=
6~-.
ns
n2:1

Nuestras estimaciones para Hn (ver página 10) implican que la serie ((1)
diverge, pero ((8) sí converge para cualquier número real 8 > 1. La función
zeta tiene una continuación canónica al todo el plano complejo (con un polo
simple en 8 = 1), que se puede construir mediante expansiones en series de
potencias. La función compleja que resulta es de máxima importancia para la
teoría de los números primos. Mencionaremos tres conexiones:
(1) Euler halló la identidad notable

Codifica el hecho fundamental que cualquier número natural tiene una des-
composición única (!) en factores primos; usando este hecho, la identidad de
Euler es una consecuencia sencilla de la serie geométrica

1 1 1 1
1- p-s = 1+-+-
pS
-+-
P2 s
-+",
P3 s

(2) La ubicación de los ceros complejos de la función zeta de Riemann es


el tema de la "hipótesis de Riemann", una de las conjeturas más famosas e
importantes sin resolver de toda la Matemática. Afirma que todos los ceros no
triviales 8 E re de la función zeta satisfacen Re( 8) = ~. (La función zeta se
anula en todos los enteros negativos, que se llaman los "ceros triviales".)
Muy recientemente, Jeff Lagarias demostró que, de manera bastante sorpren-
dente, la hipótesis de Riemann es equivalente al siguiente enunciado elemen-
tal: Para todo n 2: 1,

L d < Hn + exp(Hn ) 10g(Hn ),


dln

con igualdad sólo para n = 1, donde Hn es como antes el n-ésimo número


harmónico.
(3) Se sabe desde hace mucho que (( 8) es un múltiplo racional de ]fs, y por
tanto irracional, si 8 es un entero par 8 2: 2; ver capítulo 20. En cambio, la
irracionalidad de ((3) fue probada por Roger Apéry sólo en 1979. A pesar de
notables esfuerzos nuestros conocimientos sobre (( 8) para los demás enteros
impares 8 = 2t + 1 2: 5 son bastante incompletos. Muy recientemente,
Keith Ball y Tanguy Rivoal demostraron que hay un número infinito de valores
irracionales de ((2t+ 1). Es más, aunque no se puede afirmar la irracionalidad
de (( 8) para ningún valor impar 8 2: 5 concreto, Wadim Zudilin ha conseguido
demostrar que por lo menos uno de los cuatro valores ((5), ((7), ((9) y ((11)
es irracional. Referimos el lector al bonito artículo de revisión de Fischler [4].
42 Tres veces 7f2 /6

[1] K. BALL & T. RIVOAL: ¡rrationalité d'une infinité de valeurs de lafonetion zeta
aux entiers impairs, Inventiones math. 146 (2001),193-207.
[2] F. BEUKERS, J. A. C. KOLK & E. CALABI: Sums ofgeneralized harmonie series
and volumes, Nieuw Archief voor Wiskunde (4) 11 (1993), 217-224.
[3] J. M. BORWEIN, P. B. BORWEIN & K. DILCHER: Pi, Eulernumbers, andasymp-
totie expansions, Amer. Math. Month1y 96 (1989),681-687.
[4] S. FISCHLER: ¡rrationalité de valeurs de zeta (d'apres Apéry, Rivoal, ... ),
Bourbaki Serninar, No. 910, November 2002; to appear in Astérisque; Preprint
arXiv: math. NT /0303066, March 2003, 45 pages.

[5] J. C. LAGARIAS: An elementary problem equivalent to the Riemann hypothesis,


Amer. Math. Monthly 109 (2002), 534-543.
[6] W. J. LEVEQUE: Topies in Number Theory, Vol. I, Addison-Wesley, Reading MA
1956.
[7] A. M. YAGLOM & l. M. YAGLOM: Challenging mathematieal problems with
elementary solutions, Vol. n, Holden-Day, Inc., San Francisco, CA 1967.
[8] W. ZUDILIN: Arithmetic of linear forms involving odd zeta values, Preprint~ Au-
gust 2001,42 pages; arXi v: math. NT /0206176.
a
El tercer problema de Hilbert:
descomposición de poliedros 45
9
Rectas en el plano
y descomposición de grafos 53
10
El problema de la pendiente 59
11
Tres aplicaciones
de la fórmula de.Euler 65
12
El teorema de rigidez
de Cauchy 71
13
Símplices en contacto 75
14
Cualquier conjunto con muchos
puntos tiene un ángulo obtuso 79
15
La conjetura de Borsuk 85

"Los sólidos platónicos,


¡un juego de niños!"
En su famosa conferencia en el Congreso Internacional de Matemáticos en
París en 1900, David Hilbert propuso, como tercero de sus 23 problemas,
encontrar

"dos tetraedros de igual base e igual altura que ser descom-


puestos en tetraedros congruentes, ni tampoco combinados con otros
tetraedros congruentes para formar dos poliedros que a su vez puedan
descomponerse en tetraedros congruentes."

El origen de este problema se remonta a dos cartas de Carl Friedrich Gauss


fechadas en 1844 (publicadas en 1900 en las obras completas de Gauss). Si
dos tetraedos del mismo volumen pudieran ser descompuestos en dos piezas
congruentes, estaríamos ante una demostración "elemental" del teorema XII 5
de Euclides, que afirma que dos pirámides de igual base e igual altura tienen
el mismo volumen. Por lo tanto, proporcionaría una definición elemental del
volumen de un poliedro (que no se basaría en el análisis, y por tanto tampoco
en argumentos de continuidad). Una afirmación similar es cierta en geometría David Hilbert
plana: El teorema de Bolyai-Gerwien [1, Sect 2.7] afirma que dos polígonos
planos cualesquiera son a la vez equidescomponibles (pueden ser descom-
puestos en triángulos congruentes) y equicompletables (pueden convertirse en
congruentes añadiéndoles triángulos congruentes) si y sólo si tienen la misma
área.

La cruz es equicompletable con un cua-


drado de la misma área.

De hecho, son incluso equidescomponibles.


46 El tercer problema de Hilbert: descomposición de poliedros

Como se ver a de su formulación del Hilbert


que no se verificase un teorema análogo en dimensión 3, y estaba en lo cierto.
El problema fue resuelto por su estudiante Max Dehn en dos trabajos. En el
primero, que se publicó en 1902, mostraba tetraedros equidescomponibles de
igual base y altura; sin embargo, los trabajos de Dehn no son de fácil compren-
sión, y es difícil saber si no cayó en la misma trampa que otros: Bricard (¡en
1896t), Meschowski (1960) y probablemente otros propusieron demostracio-
nes muy elegantes, pero desafortunadamente incorrectas. Afortunadamente,
la demostración de Dehn fue revisada y elaborada de nuevo, y después del
esfuerzo conjunto de V. F. Kagan (1903/1930), Hugo Hadwiger (1949/54) y
Vladimir G. Boltianskii, podemos exponer en este capítulo una demostración
de El Libro. (El apéndice proporciona algunos conceptos básicos sobre polie-
dros.)

(1) Unas nociones de álgebra lineal


Para cualquier conjunto finito de números reales M = {mI, . .. ,mk} <;;; lR,
definimos V(M) como el conjunto de todas las combinaciones lineales de
números en M con coeficientes racionales, esto es,
k
V(M) := { L qimi : qi E Q} <;;; lR.
i=1
La primera observación (trivial, pero importante) es que V(M) es un espa-
cio vectorial finito sobre el cuerpo Q de los números racionales. De hecho,
V(M) es cerrado bajo sumas y multiplicaciones por racionales, y los axio-
mas de cuerpo para lR hacen de V(l\!I) un espacio vectorial. La dimensión de
V(M) es el cardinal de cualquier conjunto minimal de generadores. Puesto
que por definición M genera a V (M), ha de contener un conjunto minimal de
generadores. De aquí,

dimQ V(M) ~ k = IMI.


En adelante, utilizaremos funciones lineales sobre Q

j : V(M) --+ Q,
es decir, aplicaciones lineales entre Q-espacios vectoriales. La propiedad
clave es que para cualquier relación de dependencia lineal 2:7=1 qimi = O
con qi E Q, se ha de verificar que 2:7=1 qd(mi) = j(O) = O.
Este sencillo lema será esencial para la resolución del problema de Hilbert:
Lema. Para dos subconjuntos M <;;; M' finitos de lR cualesquiera, el Q-
espacio vectorial V(M) es un subespacio de V(M'). Por tanto, cualquier
función Q-lineal j : V (M) --+ Q puede ser extendida a una función Q-lineal
j' : V(M') --+ Q tal que j'(m) = j(m) para todo m E M .

• Demostración. Cualquier función Q-lineal V(M) --+ Q queda determi-


nada al fijar las imágenes de una Q-base de V(M). El lema es una conse-
cuencia de que cualquier base de V (M) puede ser extendida a una base de
V(M ' ). D
El tercer problema de Hilbert: descomposición de poliedros 47

Invariantes Dehn
Para un poliedro tridimensional P, sea M p el conjunto de todos los ángulos
entre caras adyacentes (ángulos diedros), junto con el número 1T. Por ejem-
plo, para un cubo C tenemos Me = {~,1T},mientras que para un prisma
ortogonal Q sobre un triángulo equilátero obtenemos M Q = {~, ~, 1T}.
Dado cualquier conjunto finito M <;;; IR que contenga a M p , y cualquier fun-
ción Q-lineal
j : V(M) ---+ Q
que satisfaga j(1T) = O, definimos el invariante de Dehn de P (con respecto
a f) como el número real

Df(P) := I:: /!(e) . j(a(e)),


eEP

donde la suma se extiende sobre todas las aristas e del poliedro, /!( e) es la
longitud de e, y a( e) el ángulo diedro entre dos caras incidentes a e.
Calcularemos más adelante algunos invariantes de Dehn. Por ahora, fijémonos
simplemente en que j (~) = ~ j (1T) = O tiene que verificarse para cualquier
función Q-lineal j, y por tanto

Df(C) = O,

es decir, el invariante de Dehn de un cubo es cero respecto de cualquier j.

(3) Teorema de Dehn-Hadwiger


Como antes, llamaremos a dos poliedros P, Q equidescomponibles si pueden
descomponerse en un conjunto finito de poliedros PI, ... , P n Y Q1, ... , Qn
tales que Pi y Qi son congruentes para todo i (1 :S i :S n). Dos poliedros
son equicompletables si existen poliedros PI, ... ,Pm Y Q1, ... , Qm tales que
los interiores de los Pi son disjuntos dos a dos y disjuntos de P, y de manera
similar para los Qi y Q; además, Pi ha de ser congruente con Qi para todo i, y
P := PUP1UP2 U . " UPm y Q := QUQ1 UQ2 U '" UQm han de ser equi-
descomponibles. Un teorema demostrado por Gerling en 1844 implica que no
influye si se admiten o no reflexiones a la hora de considerar congruencias.
Es claro que poliedros equidescomponibles son equicompletables, pero el re-
cíproco no es evidente. El siguiente teorema de Hadwiger (en la versión de
Boltianskii) proporciona una herramienta para encontrar - tal y como pro-
puso Hilbert - tetraedros de igual volumen que no son equicompletables, y
por tanto tampoco equidescomponibles.
Teorema. Sean P y Q poliedros con ángulos diedros al, ... , a py 131, ... ,Pq
respectivamente, y sea M un conjunto finito de los números reales tal que

Si j : V (M) ---+ Q es cualquier función Q-lineal con j (1T) = OY tal que

Df(P) -¡. Df(Q),


entonces P y Q no son equicompletables.
48 El tercer problema de Hilbert: descomposición de poliedros

• Demostración. La demostración tiene dos


Si un poliedro P puede descomponerse en un número finito de poliedros
PI, . .. ,Pn , Y si todos los ángulos diedros de estos PI, . .. ,Pn están conteni-
dos en el conjunto NI, entonces para cada función CQl-lineal j : V(M) ---+ CQl,
los invariantes de Dehn se suman y resulta
f---/-----{/
Para verlo, asociamos a cada parte de cualquier arista de un poliedro una masa:
Si el <::.; e es una parte de una arista e de P, entonces su masa es

mj(e / ) :=e(e / ) j(a(e / )),

su longitud multiplicada por el valor que toma j en su ángulo diedro.


Si P se descompone en PI, ... , Pn, consideraremos todas las aristas de todas
las piezas. Comprobamos que la suma de los ángulos diedros de las piezas a
lo largo de el es el ángulo diedro de P en el, y por lo tanto lo mismo se cumple
para las masas.
Para cualquier otra arista el! de algún Pi, contenida en el interior de P o de
una de sus caras, la suma de los ángulos diedros es 1f Ó 21f. Así, la suma de
los valores de j en todos los ángulos de todas las piezas es o bien j(1f) = O,
o bien j(21f) = O. En consecuencia, para la suma de las masas obtenemos el
mismo valor que se había asignado a estas aristas en P, es decir, O.
(2) Suponiendo que P y Q son equicompletables, podemos extender M a
un conjunto mayor MI que también incluya todos los ángulos diedros que
aparecen en cualquiera de las piezas involucradas. MI es finito, ya que sólo
consideramos descomposiciones finitas. Por lo tanto, el lema que se expuso
anteriormente nos permite extender j a l' : V(M I ) ---+ CQl, y de la parte (1) se
desprende una ecuación del tipo

donde D J' (Pi) = D J' (Qi) ya que Pi y Qi son congruentes. Concluimos pues
que Dj(P) = Df(Q), lo cual es una contradicción. O

D Ejemplo 1. Para un tetraedro regular T o cuyas aristas miden f unidades de


longitud, calculamos el ángulo diedro apoyándonos en el dibujo. El punto
medio M de la base del triángulo divide a la altura AE de la base en dos
segmentos en razón 1:2. Puesto que IAEI = IDEI, se tiene cos a = !,
y por
tanto
_ 1
a - arccos 3'
e Haciendo M := {a, 1f} observamos que la razón
1 1
- arceos-
1f 3
B
es irracional, según el teorema 3 del capítulo 6 (tomando n = 9). Por tanto,
el CQl-espaeio vectorial V(M) tiene dimensión 2; una base es M, y existe una
función CQl-lineal j : V(M) ---+ CQl tal que

j(a) := 1, j(1f) := O.
El tercer problema de Hilbert: descomposición de poliedros 49

Para esta f tenemos

Df(To) = 61:f(a) = 61: i= O,


y por tanto un tetraedro regular no es ni equidescomponible ni equicomple-
table con un cubo, ya que el invariante de Dehn de un cubo se anula para
cualquier f.
~_.~ ... " •.~
2. Sea TI un tetraedro determinado por tres aristas ortogonales AB,
D
Ae, AD de longitud u. Este tetraedro tiene como ángulos diedros tres ángulos
rectos, y otros tres más de igual amplitud tp, que calculamos a partir del dibujo:

IAEI ~V2u 1
cbs tp
IDEI ~\1'3 V2u \1'3'
Se sigue que
1 e
tp= arccos \1'3'
B
Para M := Js, 1f}, el CQl-espacio vectorial V (M) tiene dimensión
{i, arccos
2: primero, V(M) = V( {arccos Js, 1f}), ya que y i son linealmente 1f

dependientes. Además, no hay ninguna relación con coeficientes racionales


entre arccos Js y esto es equivalente a que ~ arccos Js es irracional, tal y
1f;

como se probó en el capítulo 6 (con n = 3 en el teorema 3).


De este modo, podemos construir una aplicación CQl-lineal f haciendo
f(1f) := O y f( arccos Js) := 1,
de la cual obtenemos f (i) = O, y de aquí que

Df(TI ) = 3uf(i) +3(V2u)f(arccosJs) = 3V2u i= O.


D
Esto prueba que TI no es equidescomponible ni equicompletable con un cubo e
del mismo volumen, ya que se verifica D f (e) = Opara cualquier f.
Ejemplo 3. Finalmente, sea T 2 un tetraedro con tres aristas consecutivas AB, u
Be y e D que son ortogonales entre sí y de igual longitud u.
No calcularemos los ángulos de un tetraedro de este tipo (son ~ y :f), sino i,
que argumentaremos - utilizando los puntos medios de las aristas y caras, y
el centro - que un cubo cuya arista tiene longitud u puede ser descompuesto
e
en 6 de estos tetraedros (3 copias congruentes y sus respectivas imágenes es-
peculares) . A
Todos estos tetraedros tienen el mismo invariante de Dehn, y por lo tanto, para
cualquier función f apropiada, obtenemos
1
D f (T2 ) = 6Df(e) = O,

i así que todos los invariantes de Dehn se anulan en este tipo de tetraedros!
Esto resuelve el tercer problema de Hilbert, ya que hemos construido otro
tetraedro TI; ambos tienen bases congruentes e igual altura, y D f (Td i= O.
Por el teorema de Dehn-Hadwiger, TI y T 2 no son equidescomponibles, y ni
siquiera equicompletables.
50 El tercer problema de Hilbert: descomposición de poliedros

y
Un politopo convexo en ]Rd es el cierre convexo de cualquier conjunto finito
S = {SI, ... , Sn}, es decir, un conjunto de la forma
n n
P = conv(S) := {I>'iSi:Ai20, I:Ai=l}.
i=1 i=1

Los politopos resultan ser objetos familiares. Ejemplos paradigmáticos son


los polígonos convexos (politopos convexos en 2 dimensiones) y los poliedros
convexos (politopos convexos en dimensión 3).
Hay algunos tipos de poliedros que pueden generalizarse a dimensiones ma-
yores de manera natural. Por ejemplo, si S es un conjunto formado por d + 1
puntos afínmente independientes, entonces conv(S) es un símplice de dimen-
sión d (o d-símplice). Para el caso d = 2 se trata de un triángulo, y para d = 3
obtenemos un tetraedro. De forma similar, los cuadrados y los cubos son ca-
sos particulares de los cubos de dimensión d, como también lo es en general
el d-cubo unidad C d = [O, l]d ~ ]Rd.
Los politopos generales son uniones finitas de politopos convexos. En este
libro, los poliedros no convexos aparecerán relacionados con el teorema de
rigidez de Cauchy en el capítulo 12, y los polígonos no convexos en relación
con la fórmula de Pick, en el capítulo 11, y de nuevo cuando discutamos el
teorema de la galería del arte en el capítulo 31.
Los poli topos convexos pueden ser definidos, de manera equivalente, como
conjuntos acotados de soluciones de un sistema finito de inecuaciones lineales.
Por tanto, cada politopo convexo P ~ ]Rd admite una representación de la
forma
P = {x E ]Rd : Ax :s; b}

para alguna matriz A E ]Rmxd y un vector b E ]Rm. En otras palabras, P es el


conjunto de soluciones de un sistema de m inecuaciones lineales afx :s; bi ,
donde af es la i-ésima fila de A. Recíprocamente, todo conjunto acotado de
soluciones de un sistema de este tipo es un politopo convexo y en consecuencia
puede ser representado como el cierre convexo de un conjunto finito de puntos.
Algunos politopos comunes: tetraedro, Para polígonos y poliedros utilizamos conceptos familiares como vértices,
cubo y permutaedro aristas, y caras de dimensión 2. Podemos definir las caras de un politopo
convexo en dimensión mayor de la manera siguiente: Una cara de P es un
subconjunto F ~ P de la forma P n {x E ]Rd : a T x = b}, donde a T x :s; b
es una desigualdad lineal válida para todos los puntos x E P.
Todas las caras de un politopo son, a su vez, politopos. El conjunto V de vérti-
ces (cara de dimensión O) de un politopo convexo es también el conjunto más
pequeño tal que conv(V) = P. Suponiendo que P ~ ]Rd es un poUtopo con-
vexo de dimensión d, las facetas (caras de dimensión (d-l) determinan un
conjunto mínimo de hiperplanos, y por tanto, de semiespacios que contienen
a P, y cuya intersección es P. En particular, esto implica algo que necesitare-
mos más adelante: Sea F una faceta de P; HF el hiperplano que determina,
y Hj; Y H;; los dos semiespacios cerrados y acotados por H F . Entonces uno
de estos dos semiespacios contiene a P (y el otro no).
El tercer problema de Hilbert: descomposición de poliedros 51
.~---------------------------------------------

El del convexo P viene dado por el V de vérti-


ces del politopo y por un conjunto E de aristas, que son las caras de dimensión
1 de P. Si P tiene dimensión 3, este grafo es planar, y se verifica la conocida
"fórmula de Euler" (véase el capítulo 1
Dos politopos P, pI c::: lR d son congruentes si existe alguna aplicación afín
que conserva las distancias y que transforma P en PI. Tal aplicación puede
invertir la orientación del espacio, como hace por ejemplo la reflexión en un
hiperplano, que transforma P en su imagen especular. Se dice que los polito-
pos son combinatoriamente equivalentes si existe una biyección de las caras
de P en las caras de pI que conserva la dimensión y la relación de inclusión
entre las caras. Esta noción de equivalencia es mucho más débil que la de
congruencia; por ejemplo, la figura del margen muestra un cubo unidad y otro
deformado. Los dos politopos son combinatoriamente equivalentes (por tanto,
podríamos llamar "cubo" a cualquiera de ellas), pero evidentemente no son
congruentes.
Un politopo (o en general un subconjunto cualquiera de lR d ) tiene simetría
central si existe algún punto Xo E lR d tal que

Xo +x E P ~ Xo - x E P.

En esta situación, Xo se llama el centro de P. Dos politopos no congruentes, pero


combinatoriamente equivalentes

[1] V. G. BOLTIANSKII: Hilbert's Third Problem, V. H. Winston & Sons (Halsted


Press, John Wiley & Sons), Washington DC 1978.
[2] M. DEHN: Ueber raumgleiche Polyeder, Nachrichten von der Konigl. Gesells-
chaft der Wissenschaften, Mathematisch-physikalische Klasse (1900), 345-354.
[3] M. DEHN: Ueber den Rauminhalt, Mathematische Annalen 55 (1902),
465-478.
[4] C. F. GAUSS: "Congruenz und Symmetrie": Briefwechsel mit Gerling,
pp. 240-249 en: Werke, Band VIII, Konigl. Gesellschaft der Wissenschaften zu
Gottingen; B. G. Teubner, Leipzig 1900.
[5] D. HILBERT: Mathematical Problems, Lecture delivered at the Intemational Con-
gress of Mathematicians at Paris in 1900, Bulletin Amer. Math. Soco 8 (1902),
437-479.
[6] G. M. ZIEGLER: Lectures on Polytopes, Graduate Texts in Mathematics 152,
Springer-Verlag, New York 1995/1998.
El problema tal vez más conocido sobre configuraciones de rectas fue pro-
por Sylvester en 1893 en una columna sobre matemáticos
de la revista Educational Times.

No está claro si el propio Sylvester tenía una demostración - en cualquier


caso, la solución que se publicó en la Educational Times no tiene mucho sen-
tido. Unos 40 años más tarde, Tibor Gallai [Grünwald] dio una solución co-
rrecta. Por ello se atribuye el siguiente teorema comúnmente a ambos. Des-
pués de la demostración de Gallai aparecieron otras, pero la siguiente, de L.
M. Kelly, puede considerarse "simplemente la mejor."
Teorema 1. En cualquier configuración de n puntos no alineados en el plano,
existe una recta que contiene exactamente dos de los puntos.
Demostración. Sea P el conjunto de puntos dado y considérese el conjunto
L de todas las rectas que pasan por al menos dos puntos de P. Entre todos los
J. J. Sylvester
pares (P, R) tales que P no está sobre R, elegimos un par (Po, Ro) tal que Po
tenga distancia mínima a Ro. Llamaremos Q al punto más cercano a Po sobre
la recta Ro (esto es, en la perpendicular a Ro por Po). Po
¡tr,m{irCl!')n. ¡Esta recta Ro verifica el teorema! Ro
De otro modo, Ro contiene al menos tres puntos de p, y por tanto dos de
ellos, pongamos P 1 y P2 , están al mismo lado de Q. Suponemos que P 1 está
entre Q y P 2 , donde P 1 puede coincidir con Q (véase el margen). Se sigue
que la distancia de P 1 a la recta R1 que determinan Po Y P2 es menor que la Q
distancia de Po a Ro, Y esto contradice nuestra elección de Ro Y Po. O
En la demostración hemos utilizado axiomas métricos (la distancia más corta)
y axiomas de orden (P1 está entre Q y P 2 ) en el plano real. ¿Necesitamos
3
realmente estas propiedades, más allá de los axiomas habituales de incidencia
de puntos y rectas? Alguna condición adicional sí hace falta, como demuestra
el famoso plano de Fano dibujado en el margen. Aquí P = {l, 2, .. " 7}
Y L está formado por las 7 rectas por tres puntos que se indican en la figura,
incluyendo la "recta" {4, 5, 6}. Cualesquiera dos puntos determinan una única
recta, de modo que se satisfacen los axiomas de incidencia, pero no existe
ninguna recta que pase por dos puntos. Por tanto, el teorema de Sylvester-
Gallai muestra que la configuración de Fano no puede ser dibujada en el plano
real de manera que los 7 tripletes colineales estén sobre rectas reales: ha de
haber siempre una recta "quebrada". 1 6 2
54 Rectas en el plano y descomposición de grafos

Sin Coxeter demostró que los axiomas de orden son suficientes para
una demostración del teorema de Sylvester-Gallai. Por tanto, puede darse
una demostración que no utilice propiedades métricas - véase también la
demostración que darnos en el capítulo 11, utilizando la fórmula de EuJer.
El teorema de Sylvester-Gallai implica directamente otro famoso resultado
sobre puntos y rectas en el plano, debido a Paul Erdos y Nicolaas G. de Bruijn.
Pero este otro resultado se verifica de manera general para configuraciones
arbitrarias de puntos y rectas, tal y como observaron Erdos y de Bruijn. En
breve veremos este resultado más general.
Teorema 2. Sea P un conjunto de n 2" 3 puntos no alineados en el plano.
Entonces el conjunto 1: de rectas que pasan por al menos dos puntos contiene
al menos n rectas .

• Demostración. Para n = 3 no hay nada que demostrar. Ahora procedemos


por inducción sobre n. Sea IPI = n + 1. Por el teorema anterior, existe una
recta Ro E 1: que contiene exactamente dos puntos P y Q de P. Consideramos
el conjunto P' = P\ {Q} y el conjunto 1:' de rectas determinado por P'. Si
los puntos de P' no están alineados, entonces por inducción 11:' 12" n y de aquí
que 11:1 2" n + 1, por la recta adicional Ro en 1:. Por otra parte, si los puntos
de P' están todos alineados, entonces tenemos el "abanico" de la figura, el
cual nos da exactamente n + 1 rectas. D
Ahora, como prometimos, probaremos el resultado general, que se puede apli-
car a "geometrías de incidencia" mucho más generales.
Teorema 3. Sea X un conjunto de n 2" 3 elementos, y sean Al, ... , Am
subconjuntos propios de X, tales que cualquier par de elementos de X está
contenido precisamente en uno de los conjuntos Ai. Entonces m 2" n .
• Demostración.
La siguiente demostración, atribuida tanto a Motzkin como a Conway, es muy
corta y verdaderamente digna de mención. Para todo x E X sea 'r x el número
de conjuntos Ai que contienen a x. (Nótese que por hipótesis, 2 :S 'rx < m.)
Ahora, si x ti:. A i , entonces 'rx 2" IAi 1 porque los IAil conjuntos que contienen
a x y a un elemento de Ai han de ser distintos. Supongamos que m < n;
entonces mlAil < n'rx y por tanto m(n - 1) > n(m - 'r x ) para x ~ Ai'
Pero ahora nos encontramos con que

lo cual es absurdo. D
Hay otra demostración muy breve de este teorema que utiliza álgebra lineal.
Sea B la matriz de incidencia de (X; Al,' .. , A m ). Esto quiere decir que
etiquetamos las filas en B mediante los elementos de X, y las columnas según
Al, ... , Am; además, tenemos que
si x EA
si x ti:. A.
Consideramos el producto BB T . Para x el x' tenemos (BBT)xxf = 1, ya
que x y x' están contenidos precisamente en un conjunto A i , de modo que
Rectas en el plano y descomposición de grafos 55

o 1

o 1 ;1
donde T x se define como antes. Como la plimera matliz es definida positiva
(tiene únicamente autovalores positivos) y la segunda es semidefinida positiva
(tiene como autovalores n y O), deducimos que BBT es definida positiva; en
particular, es invertible, y el rango de BB T es n. Se sigue que el rango de la
matriz B, de dimensiones (n x m), es al menos n, y concluimos que, de hecho,
n :::; m, ya que el rango no puede ser mayor que el número de columnas.
Vayamos un poco más allá y volvamos a la teoría de grafos. (Hacemos una
revisión de los conceptos básicos de teoría de grafos al final de este capítulo.)
Un momento de reflexión basta para comprobar que la siguiente afirmación es
en realidad la misma que la que enuncia el teorema 3:
Si descomponemos un grafo completo Kn en m subgrafos comple-
tos diferentes de Kn. de tal modo que cada arista esté en un único
subgrafo completo, entonces m;::: n.
De hecho, si hacemos corresponder X con el conjunto de vértices de Kn y
los conjuntos Ai con los conjuntos de vértices de los sub grafos completos,
entonces las afirmaciones son idénticas.
Nuestra próxima tarea es descomponer Kn en grafos completos bipartitos de
tal modo que de nuevo cada arista esté exactamente en uno de esos grafos.
Para ello, numeramos los vértices {1, 2, ... , n}, y unimos 1 con el resto de
los vértices. Así obtenemos el grafo bipartito completo KI,n-1 (una estre-
lla). Luego unimos 2 con 3, ... ,n para obtener una estrella K I ,n-2; al seguir
de esta manera, Kn queda descompuesto en una selie de estrellas KI,n-l,
K I ,n-2, ... , KI,I, es decir, en n - 1 grafos bipartitos completos.
¿Será posible hacerlo mejor, utilizando menos grafos? El siguiente resultado,
de Ron Graham y Henry O. Pollak, asegura que no:
Teorema 4. Si se descompone Kn en grafos bipartitos completos H I, ... , H m ,
entonces m ;::: n - 1.
Lo interesante es que, en contraste con el teorema de Erd6s-de Bruijn, nadie
ha sabido dar una demostración combinatolia para este resultado. Todas las
que conocemos utilizan álgebra lineal de una u otra manera. De todas las ideas
más o menos equivalentes, veremos la demostración de Tverberg, que puede
que sea la más transparente.
Demostración. Sean {1, ... , n} el conjunto de vértices de K n y sean
L j , Rj los conjuntos de vértices que definen el grafo bipartito completo Hj, Descomposición de K5 en 4 subgrafos
para j = 1, ... , m. A cada vértice i asociamos una variable Xi. Como Kn bipartitos completos.
está descompuesto en H I , ... ,Hm, tenemos

(1)

Ahora supongamos que el teorema es falso y que, por tanto, m < n - 1.


56 Rectas en el plano y descomposición de grafos

Entonces el sistema de equaciones lineales

Xl + ... + x n O,
O (k=l, ... ,m)

tiene menos ecuaciones que variables, y por tanto existe una solución no trivial
cl, ... ,cn · Por (1) inferimos que

¿CíCj O.
i<j

Pero esto implica


n
¿C7 > O,
í=l í<j i=l

una contradicción, y la demostración está completa. o

Los grafos están entre las estructuras más básicas de las matemáticas. En con-
G: secuencia, pueden tener apariencia, representaciones y formas muy diversas.
De manera abstracta, un grafo es un par G = (V, E), donde Ves el conjunto
de vértices, E es el conjunto de aristas, y cada arista e E E "conecta" dos
vértices v, w E V. Consideramos únicamente grafos finitos, es decir, que V y
E son finitos.
Normalmente trabajamos con grafos simples, en los que no se admiten bucles,
es decir, aristas en las cuales los extremos coinciden, ni tampoco aristas múl-
Un grafo G con 7 vértices y 11 aristas. tiples, que tienen el mismo conjunto de extremos. Los vértices de un grafo se
Tiene un bucle, una arista doble y una llaman adyacentes o vecinos si están en los extremos de una arista. Un vértice
arista triple. y una arista se llaman incidentes si la arista tiene a ese vértice como extremo.
A continuación mostramos una pequeña galería de grafos simples importantes:

Los grafos completos Kn de n vértices


y G) aristas

K~ K~
@I @I

Kl,l

~
Los grafos bipartitos completos Km,n
con m + n vértices y mn aristas
K 2 ,2 K 2 ,3

K 3 ,3 ~
Rectas en el plano y descomposición de grafos 57

Los caminos P n con n vértices

Los ciclos en con n vértices

Dos grafos G = (V, E) Y G ' = (V', E') se consideran isomorfos si existen


biyecciones V -+V ' y E -+ E' que conservan la incidencia entre aristas y sus
extremos. (Si existe o no un método eficiente para decidir si dos grafos dados
son equivalentes es un problema aún sin resolver.) Esta noción de isomorfismo
nos permite hablar de el grafo completo K5 de S vértices, etc. es un sub grafo de
Un grafo G ' = (V', E') es un subgrafo de G = (V, E) si V' C;;; E' C;;; E,
Y cualquier arista e E E' tiene los mismos extremos en G' y en G. G' es un
subgrafo inducido si, además, todas las aristas de G que conectan vértices de
G' son también aristas de G' .
Muchas nociones sobre grafos son muy intuitivas. Por ejemplo, un grafo es
conexo si a cualesquiera dos vértices distintos les une un camino en G, o lo
que es equivalente, si G no puede descomponerse en dos sub grafos no vaCÍos
cuyos conjuntos de vértices sean disjuntos.
Finalizamos esta revisión de conceptos básicos de grafos con un poco de ter-
minología: Un conjunto independiente en G es un subgrafo inducido sin aris-
tas, esto es, un subconjunto del conjunto de vértices tal que no hay dos que
estén conectados por una arista de G. Un grafo es un bosque si no contiene
ciclos. Un árbol es un bosque conexo. Finalmente, G = (V, E) es un grafo
bipartito si es isomorfo a un sub grafo de un grafo completo bipartito, esto
es, si sus vértices pueden escribirse como una uníon V = VI U V2 de dos
conjuntos independientes.

[1] N. G. DE BRUIJN & P. ERDÓS: On a combinatorial problem, Proc. Kon. Ned.


Akad. Wetensch. 51 (1948), 1277-1279.
[2] H. S. M. COXETER: A problem of collinear points, Amer. Math. Month1y 55
(1948),26-28 (contains Kelly's proof).
[3] P. ERDÓS: Problem 4065 - Three point collinearity, Amer. Math. Month1y 51
(1944),169-171 (contains Gallai's proof).
[4] R. L. GRAHAM & H. O. POLLAK: On the addressing problemfor loop switching,
Bell System Tech. J. 50 (1971), 2495-2519.
[5] J. J. SYLVESTER: Mathematical Question 11851, The Educationa1 Times 46
(1893), 156.
[6] H. TVERBERG: On the decomposition of Kn into complete bipartite graphs, J.
Graph Theory 6 (1982), 493-494.
Intente usted mismo -antes de continuar leyendo- construir configuraciones
de puntos en el plano que determinen "relativamente pocas" pendientes. Para
ello suponemos, por supuesto, que los n 2: 3 puntos que se utilicen no están
alineados.
Recuérdese del capítulo 9 sobre "rectas en el plano" el teorema de Erd6s y
de Bruijn: los n puntos determinarán al menos n rectas diferentes; pero, por
supuesto, muchas de estas rectas pueden ser paralelas y tendrán la misma pen-
diente.

n=3 n=4 n=5 n=6 n=7


3 pendientes 4 pendientes 4 pendientes 6 pendientes 6 pendientes
ó

El análisis de algunos casos particulares


para n pequeño probablemente le con-
n=3 n=4 n=5 n=6 n=7 ducirá a una de las sucesiones que se
3 pendientes 4 pendientes 4 pendientes 6 pendientes 6 pendientes muestran aquí.

Después de unos cuantos intentos con algunas configuraciones, usted podría


conjeturar - tal y como hizo Scott en 1970 - el siguiente teorema.

Teorema. Si n 2: 3 puntos en el plano no están alineados, enton-


ces determinan al menos n - 1 pendientes diferentes, verificándose la
igualdad sólo si n es impar y n 2: 5.

Los ejemplos de arriba -los dibujos representan las primeras configuraciones


en dos sucesiones infinitas de ejemplos- nos muestran que el enunciado del
teorema, tal y como aparece aquí, es el mejor posible: para cualquier impar
n 2: 5 existe una configuración con n puntos que determina exactamente n - 1
pendientes diferentes, y para cualquier otro n 2: 3 tenemos una configuración
con exactamente n pendientes.
60 El problema de la pendiente

Sin embargo, las que hemos más arriba no son, ni


., ., ., ., ., mucho menos, las únicas. Por ejemplo, Jamison y Hill describieron cuatro
., ., ., ., familias infinitas de configuraciones con un número n impar de puntos que
., ., ., ., ., ., ., ., determinan sólo n - 1 pendientes ("configuraciones críticas de pendientes") .
., ., ., Aún más, dieron una lista de 102 ejemplos "esporádicos" -la mayoría de
., ., ., ., ., ellos encontrados mediante búsquedas exhaustivas con ordenadores- que no
., parecen ajustarse a ninguna familia infinita .
., ., ., ., El saber convencional diría que los problemas extremales suelen ser muy difí-
., ciles de resolver si configuraciones extremas son tan diversas e irregulares. De
., ., ., hecho, es mucho lo que puede decirse de la estructura de configuraciones crí-
ticas de pendientes (véase [2]), pero llegar a una clasificación parece ser algo
inalcanzable. Sin embargo, el teorema que hemos expuesto arriba admite una
Tres bonitos ejemplos esporádicos to-
demostración sencilla, con dos ingredientes principales: la reducción a un mo-
mados del catálogo de Jamison-Hill
delo combinatorio eficaz (debida a Eli Goodman y Ricky Pollack), y un bonito
argumento en este modelo con el cual Peter Ungar completó la demostración
en 1982 .
• Demostración. (1) En primer lugar, nótese que es suficiente probar que
cualquier conjunto de puntos en el plano de cardinal par determina al menos
n pendientes. Esto es así, ya que el caso n = 3 es trivial, y para cualquier
conjunto de n = 2m + 1 2: 5 puntos (no alineados) podemos encontrar un
subconjunto de n 1 = 2m puntos, no todos alineados, que ya determinan
2 n - 1 pendientes. Por tanto, en lo que sigue consideraremos configuraciones
de n = 2m puntos en el plano que determinan t 2: 2 pendientes diferentes.
Esta configuración de n = 6 puntos (2) El modelo combinatorio se obtiene construyendo una sucesión periódica
detennina t = 6 pendientes diferentes. de permutaciones. Para ello, comenzamos con alguna dirección en el plano
que no sea una de las pendientes de la configuración, y numeramos los puntos
• 1, ... , n según el orden en el que aparecen si los proyectamos en esta direc-
1 3 4 5 6 ción. Así, la permutación 7fa = 123 ... n representa el orden de los puntos
• • • respecto de nuestra dirección de partida .
A continuación, movemos la dirección en sentido contrario a las agujas del
.,
2
reloj y observamos cómo cambian la proyección y su permutación. El orden
de los puntos proyectados cambia exactamente cuando la dirección coincide
con una de las pendientes de la configuración.
Pero los cambios están lejos de ser aleatorios o arbitrarios: tomando una rota-
ción de 180 0 de la dirección, obtenemos una sucesión de permutaciones
1 2 3 456
1fa --+ 1fl --+ 1f2 --+ ... --+ 1ft-l --+ 1ft
Aquí, 7fo = 123456 representa una di-
que tiene las siguientes propiedades especiales:
rección vertical.
La sucesión comienza con 1fa = 123 ... n y termina con 1ft = n . .. 321.
iII La longitud t de la sucesión es el número de pendientes de la configura-
ción de puntos.
iII En el trancurso de la sucesión, cada par i < j se intercambia exactamente
una vez. Esto significa que en el camino que lleva de 1fa = 123 ... n a
1ft = n . .. 321, sólo se intercambian las subcadenas crecientes.

iII Cada movimiento consiste en la inversión de una o más subcadenas cre-


cientes (que corresponden a una o más rectas que tienen como pendiente
la dirección por la cual pasamos en ese punto).
El problema de la pendiente 61

7f6 = 654321

tt ttt 7f5 = 652341

/ IIIII
4 ~ 7f4 = 625314
~

~ 7f3 = 265314
1 6 ~
De este dibujo obtenemos la sucesión de
permutaciones de nuestro ejemplo
~
~
~ 7f2 = 213564

7f1 = 213546

7fo = 123456

Continuando con el movimiento circular alrededor de la configuración de pun-


tos, podemos interpretar la sucesión como parte de una sucesión infinita y
periódica de permutaciones:

... --+ 7f-1 --+ 7fo --+ ... --+ 7ft --+ 7ft+1 --+ ... --+ 7f2t --+ ...

Aquí 7fi+t es la inversa de 7fi para todo i, y de aquí 7fi+2t = 7fi para todo i E Z.
Demostraremos que toda sucesión con las propiedades anteriores (y t 2: 2) ha
de tener longitud t 2: n.
(3) La clave de la demostración es dividir cada permutación en una "mitad
izquierda" y una "mitad derecha" de la misma longitud m = ~, y contar las
letras que cruzan la barrera imaginaria entre la parte izquierda y la derecha.
Llamaremos a 7fi --+ 7fi+1 un movimiento de cruce si una de las subcadenas
265314
que invierten el sentido contiene letras de ambos lados de la barrera. En movi- 1 6 ~

miento de cruce tiene orden d si mueve 2d letras al otro lado de la barrera, es ~


decir, si la cadena que cruza tiene exactamente d letras en un lado y las otras 213564
d en el otro. Así, en nuestro ejemplo
Un movimiento de cruce

es un cruce de orden d = 2 (mueve 1,3,5,6 al otro lado de la barrera, lo que


señalamos con ":"); el movimiento
652:341 --+ 654:321

es un cruce de orden d = 1, mientras que


625:314 --+ 652:341

no es un movimiento de cruce.
62 El problema de la pendiente

En el transcurso de la sucesión 1To ---+ 1Tl ---+ ... ---+ 1Tt, cada una de las letras
1,2, ... ,n ha de cruzar la barrera al menos una vez. Esto implica que, si los
órdenes de los movimientos de cruce son dI, d2 , ... , de, entonces se verifica
e
L 2dí = #{letras que cruzan la barrera} ;::: n.
í=1

Esto implica también que tenemos al menos dos movimientos de cruce, ya


que un movimiento que cumpla 2dí = n se da únicamente si todos los puntos
están alineados, es decir, cuando t = 1. Geométricamente, un movimiento
de cruce corresponde a la dirección de una recta de la configuración que deja
menos de m puntos a cada lado.
652341 (4) Un movimiento de toque es un movimiento que invierte el sentido de alguna
4 cadena adyacente a la barrera central, pero no la cruza. Por ejemplo,
/ 625314
~
1
6 es un movimiento de toque. Visto de manera geométrica, un movimiento de
toque corresponde a la pendiente de una recta de la configuración que deja
exactamente m puntos a un lado, y por tanto, como mucho m - 2 puntos al
Un movimiento de toque otro.
Llamaremos ordinarios a los movimentos que no son ni toques ni cruces. Un
4 ejemplo es
1TI = 213:546 --+ 213:564 = 1T2.
1 6
Así, cualquier movimiento es un cruce, un toque, o un movimiento ordinario,
~
~
213564
°
y utilizaremos las letras O, T, para referimos a ellos. O(d) denotará un
cruce de orden d. Así, en nuestro pequeño ejemplo obtenemos
213546
T O 0(2) O T 0(1)
1To --+ 1TI --+ 1T2 --+ 1T3 --+ 1T4 --+ 1T5 --+ 1T6,
Un movimieto ordinario
o incluso en una forma más corta, podemos referimos a esta sucesión como
T, 0,0(2),0, T, 0(1).
(5) Para completar la demostración necesitamos los siguientes dos hechos:

Entre cualesquiera dos cruces existe al menos un toque.

Entre cualquier cruce de orden d y el siguiente toque, existen al me-


nos d - 1 movimientos ordinarios.

En efecto, después de un cruce de orden d, la barrera está contenida en una


subcadena simétrica decreciente de longitud 2d, con d letras en cada lado de
la barrera. Para el siguiente cruce la barrera central debe desplazarse dentro de
una subcadena creciente de longitud al menos 2. Pero sólo los movimientos
de toque tienen influencia en que la barrera esté o no en una cadena creciente.
Para el segundo hecho, nótese que con cada movimiento ordinario (que in-
vierte algunas subcadenas crecientes), la cadena decreciente de longitud 2d
puede acortarse únicamente por una letra en cada lado. Además, mientras la
cadena decreciente tenga al menos 4 letras, un toque es imposible. De aquí se
sigue el segundo hecho.
El problema de la pendiente 63

Si construimos la sucesión de de manera que comenzamos con


la misma proyección inicial, pero usamos una rotación en el sentido horario,
entonces obtenemos la sucesión de permutaciones inversa. Así, la sucesión
que habíamos apuntado debe satisfacer también el opuesto de nuestro segundo
hecho, es decir

E?1tre un toque y el siguiente cruce, de orden d, existen al menos d-1


movimientos ordinarios.

El patrón T -O-C de la sucesión infinita de permutaciones, tal y como


se deriva de (2), se obtiene repitiendo una y otra vez el patrón T-O-C de
longitud t de la sucesión 1fo -----+ ... -----+ 1ft. Así, con los hechos de (5) vemos
que en la sucesión infinita de movimientos, cada cruce de orden d forma parte
de un patrón T -O-C del tipo

T,O,O, ... , O,C(d),O,O, ... ,0,


~~
2: d-l 2: d-l

de longitud 1 + (d - 1) + 1 + (d - 1) = 2d.
En la sucesión infinita, consideramos un segmento finito de longitud t que co-
mienza con un toque. Este segmento está formado por subcadenas del tipo (*)
y posiblemente de otras del tipo T. Esto implica que su longitud t satisface
e

t ~ ¿2di > n,
i=l

lo cual completa la demostración. o

[1] J. E. GOODMAN & R. POLLACK: A combinatorial perspective on sorne


problems in geometry, Congressus Numerantium 32 (1981), 383-394.
[2] R. E. JAMISON & D. HILL: A catalogue of slope-critical configurations,
Congressus Numerantium 40 (1983),101-125.
[3] P. R. SCOTT: On the sets of directions determined by n points, Amer.
Math. Monthly 77 (1970), 502-505.
[4] P. UNGAR: 2N noncollinear points determine at least 2N directions, J.
Combinatorial Theory, Ser. A 33 (1982), 343-347.
Un grafo es planar si puede dibujarse en el plano ffi.2 sin aristas que se crucen
(o de manera equivalente, en la esfera 2-dimensional 8 2 ). Decimos que un
grafo es plano si ese dibujo viene ya dado y fijado. Cualquier dibujo de este
tipo descompone el plano o la esfera en un número finito de regiones conexas,
incluyendo la región exterior (no acotada), a las que nos referimos como caras.
La fórmula de Euler descubre una bella relación entre el número de vértices,
aristas y caras, que es válida para cualquier grafo plano. Euler mencionó
este resultado por primera vez en una carta a su amigo Goldbach en 1750,
pero en aquel entonces no tenía una demostración completa. Entre las muchas
demostraciones de la fórmula de Euler, presentamos una bonita y "auto-dual"
que no necesita inducción y se remonta a 1847, cuando aparece en el libro
"Geometrie der Lage" de Karl Georg Christian von Staudt.

Fórmula de Euler. Si G es un grafo conexo con n I/P¡e/u'p\,

e aristas y f caras, entonces


n- e+ f = 2 .

• Demostración. Sea T ~ E el conjunto de aristas de un árbol generador


Leonhard Euler
de G, esto es, un sub grafo minimal que conecta todos los vértices de G. Este
grafo no contiene ciclos por la suposición de minimalidad.
Ahora necesitamos el grafo dual G* de G: para construirlo, ponemos un vér-
tice en el interior de cada cara de G, y para cada arista de G que separa dos
caras conectamos los vértices correspondientes de G* mediante una arista. Si
dos caras de G comparten varias aristas en su frontera, conectaremos los vér-
tices correspondientes del grafo dual mediante más de una arista. (Así pues,
G* puede tener aristas múltiples incluso si el grafo original G es simple.)
Un grafo plano G: n = 6, e = 10, f = 6
Consideramos la colección T* ~ E* de aristas en el grafo dual que se corres-
ponden a las aristas en E\T. Las aristas en T* conectan todas las caras, ya
que T no tiene ciclos; pero T* tampoco contiene ciclos, pues de otra manera
separaría algunos de los vértices de G dentro del ciclo de los de fuera (y esto
no puede ser, ya que T es un sub grafo generador, y las aristas de T* no se
intersecan). Así pues, T* es un árbol generador para G*.
Para cada árbol, el número de vértices es uno más que el número de aristas.
Para verlo, elegimos un vértice como raíz y dirigimos todas las aristas "hacia
la raíz". Esto conduce a una biyección entre los vértices que no son raíz y las
aristas, haciendo corresponder cada arista con el vértice desde el cual sale.
Aplicado al árbol T esto conduce a que n = eT + 1, mientras que para el
árbol T* obtenemos f = eT* + 1. Sumando ambas ecuaciones obtenemos la Árboles generadores duales en G y
relación n + f = (eT + 1) + (eT* + 1) = e + 2. O enG*
66 Tres aplicaciones de lafórmula de Euler

La fórmula de Euler produce una conclusión numérica inesperada a partir de


una situación métrico-topológica: El número de vértices, aristas y caras de un
grafo finito G satisface n-e + f = 2 siempre que el grafo esté o pueda estar
dibujado-en el plano o sobre una esfera.
De la fórmula de Euler se derivan muchas consecuencias conocidas, algunas
de ellas clásicas. Entre ellas figuran la clasificación de los poliedros regula-
res convexos (los sólidos platónicos), el hecho de que los grafos K5 y K 3 ,3
no son planares (véase más adelante), y el teorema de los cinco colores, que
afirma que cada mapa planar puede ser coloreado usando como máximo cinco
colores, de manera que dos regiones adyacentes no tengan el mismo color. Sin
embargo, para este último resultado tenemos una demostración mucho mejor,
que no necesita la fórmula de Euler - véase el capítulo 30.
En este capítulo incluimos otras tres bellas demostraciones que dependen de
Los cinco sólidos platónicos manera esencial de la fórmula de Euler. Las dos primeras - una demostración
del teorema de Sylvester-Gallai, y un teorema sobre configuraciones de puntos
coloreados con dos colores - utilizan la fórmula de Euler en una inteligente
combinación con otras relaciones aritméticas entre los parámetros básicos de
un grafo. Veamos primero cuáles son estos parámetros.
El grado de un vértice es el número de aristas que terminan en él, contando
cada bucle dos veces. Sea ni el número de vértices de grado i en G. Contando
2 los vértices de acuerdo con sus grados, obtenemos
(1)

Por otro lado, toda arista tiene dos extremos, de manera que contribuye con 2
a la suma de todos los grados. Por tanto,
2 2 (2)
Aquí escribimos el grado alIado de cada
vértice. Contando los vértices de un Esta identidad puede interpretarse como si se contara de dos maneras los ex-
grado dado, se tiene n2 = 3, n3 = O, tremos de las aristas, esto es, las incidencias entre aristas y vértices. El grado
n4 = 1, n5 = 2.
medio d de los vértices es, en consecuencia,
- 2e
d = -.
n
Ahora contamos las caras de un grafo plano de acuerdo con su número de
lados: Una k-cara es una cara delimitada por k aristas (¡hay que contar dos
veces cada arista que delimita la misma cara por los dos lados!) Sea fk el
2 número de k-caras. Contando todas las caras obtenemos

f = JI + h + fs + f4 + ... (3)

Contando las aristas de acuerdo con las caras de las cuales son lados, obtene-
mos
Hemos escrito el número de lados den-
(4)
.tro de cada región. Contando las ca-
ras con un determinado número de la- Como antes, podemos interpretar esto como si contáramos las incidencias en-
dos obtenemos JI = 1, h = 3, J4 = 1, tre aristas y caras de dos maneras distintas. Nótese que el número medio de
fg = 1, Y Ji = O en los demás casos. lados de las caras viene dado por
2e
J"
Tres aplicaciones de lafórmula de Euler 67

A de esto, con la fórmula de se deduce que el


y el grafo completo bipartito K 3 ,3 no son planares. Para un dibujo plano
de K5 se tendría n = 5, e = (~) = 10, por tanto f = e + 2 - n = 7
Y 1 = 2; = 27° <3. Pero si el número medio de lados es menor que 3,
entonces el dibujo hipotético tendría una cara con dos lados como máximo, lo
cual es imposible.
De manera similar, para K 3 ,3 obtenemos n = 6, e = 9, Y f = e + 2 - n = 5,
Y por tanto 1 = 2; = 158 < 4. Esto es imposible, ya que K3,3 es simple Un dibujo de K5 con un cruce
y bipartito, y por lo tanto la longitud de cualquiera de sus ciclos es por lo
menos 4.
No es coincidencia, por tanto, que las ecuaciones (3) y (4) para los fi se pa-
rezcan tanto a las ecuaciones (1) y (2) para los ni. Se pueden transformar unas
en las otras pasando del grafo G al grafo dual G* .
De las fórmulas para contar incidencias obtenemos las siguientes importantes
consecuencias de la fórmula de Euler.
Un dibujo de K 3 ,3 con un cruce
pr,op'OSJCl()ll. Sea G cualquier grafo plano simple con n > 2 vértices. Enton-
ces
(A) G tiene un vértice de grado a lo sumo 5.

(B) G tiene a lo sumo 3n - 6 aristas.

(C) Si coloreamos las aristas de G con dos colores, hay un vértice de G de


manera que al leer las aristas incidentes a él en orden cíclico, vemos a
lo sumo dos cambios de color.

• Demostración. Para todos los enunciados podemos suponer G conexo.


(A) Cada cara tiene por lo menos 3 aristas (ya que G es simple), con lo cual
(3) y (4) nos dan

f h + f4 + f5 + .. .
2e 3h + 4f4 + 5f5 + .. .
y por tanto 2e 3f ~ O.
Si cada vértice tiene grado por lo menos 6, entonces (1) y (2) implican que

n n6 + n7 + ns + .. .
2e 6n6 + 7n7 + 8n8 + .. .
y por tanto 2e - 6n ~ O.
Juntando ambas desigualdades obtenemos

6(e-n-f) = (2e-6n)+2(2e-3f) > O

y por tanto e ~ n + f, contradiciendo la fórmula de Euler.


(B) Igual que en el primer paso del apartado (A), obtenemos 2e - 3f ~ O y,
aplicando la fórmula de Euler, que

3n - 6 = 3e - 3f > e.
68 Tres aplicaciones de la fórmula de Euler

(C) Sea c el número de donde un cambio de color.


que el enunciado es falso. Entonces hay c 2': 4n esquinas con cambios de
color, ya que en cada vértice hay un número par de cambios. Ahora, cada
cara con 2k ó 2k + 1 lados tiene como mucho 2k tales esquinas, de lo cual
concluimos que
4n < c < 2h + 414 + 415 + 616 + 617 + 818 + ...
Las flechas señalan esquinas con un
< 2h + 414 + 615 + 816 + 1017 + .. .
cambio de color.
2(3h + 414 + 515 + 616 + 717 + ... )
-4(h + 14 + 15 + 16 + 17 + ... )
4e - 41,
donde hemos vuelto a usar (3) y (4). Por tanto, tenemos e 2': n + 1, otra vez
en contradicción con la fónnula de Euler. O

1. vez
Parece ser que Nonnan Steenrod fue el primero en darse cuenta de que el
apartado (A) de la proposición nos da una demostración extraordinariamente
sencilla del teorema de Sylvester-Gallai (véase el capítulo 9).
El teorema de Sylvesíer-Gallai. Dado cualquier conjunto de n 2': 3
puntos en el plano, no todos alineados, siempre hay una recta que
contiene exactamente dos de los puntos .
• Demostración. (Sylvester-Gallai vía Euler)
Si situamos el plano JR2 dentro de JR3 y cercano a la esfera unidad S2 como
indica la figura, cada punto de JR2 se corresponde con una pareja de puntos
antipodales en S2, y las rectas en JR2 se corresponden con circunferencias
máximas en S2. Por tanto, el teorema de Sylvester-Gallai dice lo siguiente:
Dado cualquier conjunto de n 2': 3 parejas de puntos antipodales en
la esfera, no todos en una circunferencia máxima, siempre hay una
circunferencia máxima que contiene exactamente dos de las parejas.
Ahora pasamos a la versión dual, reemplazando cada pareja de puntos con la
correspondiente circunferencia máxima en la esfera. Dicho de otra manera, en
.. v .. vez de puntos ±v E S2 consideramos las circunferencias ortogonales dadas
por Cv := {x E S2 : (x, v) = O}. (Este Cv es el ecuador si consideramos v
" como polo norte de la esfera.)
El problema de Sylvester-Gallai nos pide demostrar:
Dada cualquier colección de n 2': 3 circunferencias máximas en S2,
no todos pasando por el mismo punto, siempre hay un punto conte-
nido en exactamente dos de los círculos.
Pero el arreglo de circunferencias máximas se puede interpretar como un grafo
plano simple en S2, cuyos vértices son los puntos de intersección de dos de
las circunferencias, y cuyas aristas los arcos de circunferencias entre los vér-
tices. El grado de todos los vértices es par, y además por lo menos 4 - por
construcción. Por tanto, el apartado (A) de la proposición nos da la existencia
de un vértice de grado 4. ¡Ya está! CJ
Tres aplicaciones de la fórmula de Euler 69

La siguiente demostración de una versión "coloreada" del teorema de Sylvester-


Gallai se debe a Don Chakerian.
Teorema. Dado cualquier configuración de puntos "negros" y "blancos" en
el plano, hay siempre por lo menos una recta "monocromática ", es decir, una
recta que contiene al menos dos puntos de un color y ninguno del otro .

• Demostración. Igual que en el problema de Sylvester-Gallai, llevamos el


problema a la esfera unidad y aplicamos dualidad. Tenemos que demostrar,
pues:

Dado cualquier colección de circunferencias máximas "blancos" y


"negros" en la esfera unidad, no todos pasando por el mismo punto,
siempre existe un punto de intersección que o bien sólo está en circun-
ferencias blancas, o bien sólo en circunferencias negras.

La solución queda clara a partir de la parte (C) de la proposición, ya que en


cada vértice que es intersección de circunferencias con diferentes colores, hay
por lo menos 4 esquinas con cambio de color. O

El teorema de Pick del año 1899 es un resultado bello y sorprendente por


sí mismo, pero también es una consecuencia clásica de la fórmula de Euler.
Diremos que un polígono convexo P ~ ffi.2 es elemental si sus vértices son
enteras (es decir, están contenidos en la retícula Z'?), pero no contiene más
puntos de la retícula.
Lema. Cada triángulo elemental 6. = conv{PO,PI,P2} ~ ffi.2 tiene área PI + P2 - Po

..
A(6.) = ~. ~
• • P2•
Demostración. Tanto el paralelogramo P que tiene como vértices Po, PI'
P2, PI + P2 - Po, como la retícula 'Z'} , son simétricos respecto de la aplicación
• l1li l1li

cr: X 1--+ PI + P2 - x, • • PI
• l1li

que es la reflexión con respecto al centro del segmento de PI a P2' Por tanto, Po
• • l1li

el paralelogramo P = 6. U cr(6.) también es elemental, y sus traslaciones con
vectores de coordenadas enteras teselan el plano. Por tanto, {PI -Po, P2 -Po}
es una base de la retícula Z2, la matriz correspondiente tiene determinante ±1,
P es un paralelogramo de área 1 y 6. tiene área ~. (Explicamos estos términos
en el recuadro de arriba.) O •
l1li
• • • • •
Teorema. El área de cualquier polígono Q ~ ffi.2, no necesariamente con- • • •
vexo, pero con vértices enteros, viene dada por
• • •
1
A(Q) = nint + 2nfr - 1, • • •
.10nde nint Y nfr son, respectivamente, el número de puntos con coordenadas • =•11 Y• = 8, •portanto
nin,
• A•= 14•
nlr
enteras en el interior yen lafrontera de Q.
70 Tres aplicaciones de la fórmula de Euler

Una base de 7!} es un par de vectores linealmente H""v~'vU~',U'v" el, e2


tal que
Z2 = {Alel + A2e2 : Al, A2 E Z}.
Sean el = my e2 = (~), entonces el área del que
determinan el Y e2 es A(el, e2) = Idet(el, e2)1 Idet (~~)I. Si
= (:) y (D es otra base, entonces existe una matriz invertible
con elementos enteros Q tal que (; ~) = (~~) Ya que
(¿ ~), y los determinantes son enteros, se sigue que I det QI = 1, y
por tanto Idet(f l' f 2) I Idet( el, e2) l· Concluimos que todos los
paralelogramos que se corresponden a una base tienen la misma área 1,
ya que A ( @, (~)) = 1.

111 Demostración. Cualquier polígono Q con las características del teorema


puede triangularse usando todos los nint puntos de la retícula en su interior, y
todos los nft· puntos de la retícula en su frontera. (Esto no es obvio del todo,
sobre todo si no pedimos que Q sea convexo, pero lo demuestra el argumento
del capítulo 31 sobre el problema de la galería de arte.)
Ahora interpretamos la triangulación como un grafo plano que subdivide el
plano en una cara no acotada, más f - 1 triángulos de área ~, de manera que

A(Q) = ~(f - 1).

Todo triángulo tiene tres lados, y cada uno de los eint lados interiores separa
dos triángulos, mientras que los ejr lados en la frontera sólo aparecen en un
único triángulo cada uno. Por tanto, 3(f - 1) = 2eint + ejr, y por tanto
f = 2 (e - f) - efr + 3. Además, el numero de aristas y vértices en la frontera
es el mismo, efr = njr. Estos dos hechos, junto con la fórmula de Euler, dan
f 2(e-f)-efr+ 3
2(n - 2) - nfr +3 = 2nint + nfr - 1,
y por tanto
A(Q) ~(f - 1) D

[1] G. D. CHAKERIAN: Sylvester's problem on collinear points and a relative, Amer.


Math. Monthly77 (1970),164-167.
[2] G. PIeK: Geometrisches zur Zahlenlehre, Sitzungsberichte Lotos (Prag), Natur-
medo Verein für Bóhmen 19 (1899), 311-319.
[3] K. G. C. VON STAUDT: Geometrie der Lage, Verlag der Fr. Korn'schen
Buchhandlung, Nürnberg 1847.
[4] N. E. STEENROD: Solution 4065/Editorial Note, Amer. Math. Monthly 51 (1944),
170-171.
1

Un famoso resultado que depende de la fórmula de Euler (en concreto, en la


parte (C) de la proposición del capítulo anterior) es el teorema de rigidez de
Cauchy para poliedros tridimensionales.
Para las nociones de congruencia y equivalencia combinatoria que utilizamos a
continuaci.ón, el lector se puede dirigir al apéndice sobre politopos y poliedros
del capítulo en el que tratamos el tercer problema de Hilbert, en la página 50.

Teorema. Si dos poliedros convexos tridimensionales P y p' son


combinatoriamente equivalentes y las caras correspondientes son con-
gruentes, entonces los ángulos entre los correspondientes pares de ca-
ras son iguales (y, por tanto, P y son congruentes).

La figura del margen muestra dos poliedros tridimensionales combinatoria-


mente equivalentes, y tales que las caras correspondientes son congruentes.
Sin embargo, no son congruentes, y sólo uno de ellos es convexo. Por tanto, Augustin Cauchy
¡la hipótesis de convexidad es esencial en el teorema de Cauchy!

• Demostración. Lo que presentamos a continuación es, esencialmente, la


demostración original de Cauchy. Supongamos que tenemos dos poliedros
convexos p y p' con caras congruentes. Coloreamos las aristas de P de la
siguiente forma: una arista es negra (o "positiva") si el ángulo interior entre
las caras adyacentes es mayor en p' que en P; es blanca (o "negativa") si el
ángulo es menor en p' que en P.
El conjunto de aristas blancas y negras de P forma un grafo plano 2-coloreado
en la superficie de P que, mediante una proyección central con origen en un
punto interior de P, podemos considerar en la superficie de la esfera unidad.
Si P Y p' tienen ángulos distintos entre caras correspondientes, el grafo es no
vacío. Utilizando la parte (C) de la proposición del capítulo anterior, deduci-
mos que existe un vértice p que es adyacente al menos a una arista blanca o
negra, y tal que hay como mucho dos cambios entre aristas blancas y negras
(considerando el orden cíclico).
Consideremos ahora la intersección del poliedro P con una esfera pequeña SE
(de radio E) centrada en el vértice p, y la intersección de p' con una esfera S~
del mismo radio E centrada en el vértice correspondiente p'. En SE y S~ se
obtienen polígonos esféricos Q y Q', convexos, tales que los arcos correspon-
dientes tienen la misma longitud, ya que las caras correspondientes de P y p'
son congruentes y hemos utilizado el mismo radio E.
Ahora marcamos con un + los ángulos de Q para los que el ángulo corres-
72 El teorema de rigidez de Cauchy

pondiente en es mayor, y con un - los ángulos para los que el ángulo


correspondiente en Q' es menor. Por tanto, cuando nos movemos de Q a Q',
Q: + los ángulos marcados con + se "abren" y los ángulos marcados con - se
"cierran", en tanto que las longitudes de las aristas y el resto de los ángulos
permanecen constantes.
De acuerdo con la elección de p, sabemos que existe algún signo + o -, y que
en el orden cíclico hay, como mucho, dos cambios +/ -. Si sólo hay signos de
un tipo, el lema que presentamos a continuación produce una contradicción,
Q': pues asegura que alguna arista debe cambiar de longitud. Si hay signos de los
dos tipos, entonces (como hay sólo dos cambios de signo) existe una "recta de
separación" que une los puntos medios de dos aristas y separa los signos + de
los signos -. De nuevo obtenemos una contradicción utilizando el lema que
presentarnos a continuación, ya que la recta de separación no puede ser a la
vez más larga y más corta en Q' que en Q. O

Lema de la poligon.al de Cauchy.


Si Q y Q' son n-ágonos convexos (planos o esféricos) etiquetados como en la
figura,

Q~...qn-l
q2 003 oon-l _____
002

ql qn

de tal manera que las longitudes de las aristas correspondientes verifican


qiqi+l = q~q~+l para 1 ~ i ~ n -1, y los ángulos correspondientes verifican
OOi ~ oo~ para 2 ~ i < n - 1, entonces la longitud de la arista "restante"
verifica
qlqn ~ q~ q~,
y la igualdad se da si y sólo si OOi = oo~ para todo i.

Aquí es interesante mencionar que la demostración original de Cauchy no era


correcta: un movimiento continuo que hace crecer los ángulos y mantiene
constantes las longitudes de los lados puede destruir la convexidad - ¡véase
la figura! Además, tanto el lema como la demostración presentada aquí, apa-
recidos en una carta de I. J. Schoenberg a S. K. Zaremba, son válidos tanto
para polígonos planos como esféricos.

111 Demostración.. Razonarnos por inducción sobre n. El caso n = 3 resulta


sencillo: si en un triángulo aumenta el ángulo I entre dos lados de longitudes
fijas a y b, entonces la longitud c del tercer lado también aumenta, según
demuestra el teorema del coseno

en el caso plano, y el resultado análogo

cos e = cos a cos b + sen a sen b cos I


El teorema de rigidez de Cauchy 73

en trigonometría esférica. Las a, b, e se miden en la de la


esfera de radio 1 y, por tanto, toman valores, en el intervalo [O, 7r].
Consideremos ahora n 2: 4. Si para algún i E {2, ... , n - 1} se verifica que
Oói = Oó~, el vértice correspondiente se puede eliminar insertando las diago-

na1es de qi-l a qi+l y de qi-l " 'f


a qi+l' ican qi-l qi+l= qi-l
que ven ' qi+l'
, Y
podemos utilizar la hipótesis de inducción. Por tanto, podemos suponer que
Oói < Oó~ para 2 :::; i :::; n - 1.

Construimos un nuevo polígono Q* a partir de Q cambiando Oón-l por el ma-


yor ángulo posible Oó~_l :::; Oó~-l de fonna que Q* siga siendo convexo. Para
ello, reemplazamos qn por q~, manteniendo el resto de vértices qi' longitudes
de aristas y ángulos de Q.
Si se puede escoger Oó~_l = Oó~_l de manera que Q* siga siendo convexo,
Q0
t ql qn
se obtiene ql qn < ql q::' :::; q~ q~, utilizando el caso n = 3 para la primera
desigualdad e inducción, como anterionnente, para la segunda. Q*:~ Oó n - 1

Si esto no es posible, después de un movimiento para el que se tiene --


(1) ql q~

quedamos "bloqueados" en una situación en que q2' ql Y q~ son colineales, de


fonnaque
q2ql + ql q::' = q2q::,· (2)
Comparando Q* y Q' obtenemos

q2 qn* < q2' qn' (3)

por inducción sobre n (ignorando los vértices ql y qD. Por tanto,

donde (*) es la desigualdad triangular y el resto de las desigualdades han sido


deducidas anterionnente. O

Hemos visto un ejemplo que demuestra que el teorema de Cauchy no es cierto


para poliedros no convexos. La característica especial del ejemplo es, eviden-
temente, un salto discontinuo que lleva un poliedro al otro, manteniendo las
caras congruentes mientras los ángulos diedros "saltan." Se puede preguntar
algo más:

¿Puede para algún poliedro no convexo, una deformación con-


tinua que mantenga las caras planas y congruentes?

Se había conjeturado que ninguna superficie triangulada, convexa o no, ad-


mitía tal movimiento. Por eso fue una gran sorpresa que en 1977 - más
de 160 años después del trabajo de Cauchy - Robert Connelly presentara
contraejemplos: esferas cerradas y trianguladas inmersas en ]Et3 (sin auto-
intersecciones) que son flexibles, con un movimiento continuo que mantiene
constantes las longitudes de las aristas y, por tanto, las caras triangulares con-
gruentes.
74 El teorema de rigidez de Cauchy

, /
/
/
/
-'- --
"""-,
Un precioso ejemplo de superficie flexi-
ble construido por Klaus Steffen: las lí- ,/'
Y-,
/\-
'

\,
-, -----.
neas discontinuas representan las aristas
no convexas en este desarrollo del po- \
liedro. Doble las líneas continuas como \,
"montañas" y las discontinuas como \
"valles". Las aristas del modelo tienen \
longitudes 5, 10, 11, 12 Y 17 unidades.

La teoría de rigidez de superficies tiene todavía más sorpresas: recientemente


Idjad Sabitov consiguió demostrar que cuando estas superficies flexibles se
mueven, el volumen que encierran debe permanecer constante. Su demostra-
ción hace un uso muy elegante de herramientas algebraicas (fuera del alcance
de este libro).

[1] A. CAUCHY: Sur les polygones et les polyedres, seconde mémoire, J. École Poly-
technique XVle Cahier, Tome IX (1813), 87-98; CEuvres Completes, He Série,
Vol. 1, Paris 1905,26-38.
[2] R. CONNELLY: A counterexample to the rigidity conjecture for polyhedra, Inst.
Haut. Etud. Sci., Publ. Math. 47 (1978), 333-338.
[3] R. CONNELLY: The rigidity of polyhedral surfaces, Mathematics Magazine 52
(1979),275-283.
[4] I. KH. SABITOV: The volume as a metric invariant ofpolyhedra, Discrete Com-
put. Geometry 20 (1998), 405-425.
[5] 1. SCHOENBERG & S.K. ZAREMBA: On Cauchy's lemma conceming convex
polygons, Canadian J. Math. 19 (1967), 1062-1071.
¿ Cuántos en ]Rd de ma-
nera que en contacto dos a es que todas las intersec-
ciones dos a dos tengan dimensión (d - 1)?

Esta es una cuestión antigua y muy natural. Sea f (d) la solución de este
problema, y anotamos f(l) = 2. Para d = 2 la configuración de los cuatro
triángulos en el margen muestra que f(2) ?::: 4. No existe una configuración
similar con cinco triángulos, ya que la construcción dual de ésta - que en
nuestro ejemplo de los cuatro triángulos conduce a un dibujo plano de K4 -
proporcionaría un dibujo plano de K 5 , algo imposible (véase la página 67).
Por tanto, tenemos f(2) 2: 4
f(2) = 4.

En tres dimensiones es fácil ver que f(3) ?::: 8. Para ello, utilizamos la confi-
guración de ocho triángulos que aparece a la derecha.
Los cuatro triángulos sombreados están unidos a un punto x por debajo del
'plano del dibujo", proporcionando cuatro tetraedros que tocan el plano desde
abajo. De manera similar, los cuatro triángulos blancos están unidos a un
punto y por encima del plano del dibujo. Por tanto, obtenemos una configura-
ción de ocho tetraedros en contacto en ]R3, esto es, f(3) ?::: 8.
En 1965, Baston escribió un libro en el que probaba que f(3) :::; 9, yen 1991 f(3) 2: 8
Zaks tuvo que escribir otro libro para establecer que

f(3) = 8.

Con f(l) = 2, f(2) = 4 Y f(3) = 8, no es necesaria mucha inspiración para


llegar a la siguiente conjetura, que formuló Bagemihl en 1956:
Conjetura. En una configuración de símplices de dimensión d en ]Rd, el
número máximo de pares en contacto es

La cota inferior, f (d) ?::: 2d , es fácil de verificar - si lo hacemos bien. Esto


nos conduce a usar reiteradamente transformaciones afines y un razonamiento
por inducción sobre la dimensión que establece el siguiente resultado, más
fuerte, que se debe a Joseph Zaks [4]:
Teorema 1. Para cada d ?::: 2, existe una familia de 2d símplices que están
en contacto dos a dos en ]Rd, junto con una recta transversal que interseca el
interior de cada uno de los símplices individuales. "Símplices en contacto"
76 Símplices en contacto

• Demostración. Para d = 2 la familia de cuatro triángulos que habíamos


considerado tiene, efectivamente, dicha recta transversal.
Ahora consideremos cualquier configuración d-dimensional de símplices en
contacto y que tiene una recta transversal f!. Cualquier otra paralela cercana f!1
es también una recta transversal. Si elegimos f!1 y f! paralelas y suficientemente
cercanas, entonces cada uno de los símpliées ha de contener un intervalo orto-
gonal (más corto) que conecta ambas rectas.
Sólo una parte acotada de las rectas f! y f!1 está contenida en los símplices de la
configuración, y podemos añadir dos segmentos que las conecten fuera de la
configuración, de tal manera que el rectángulo determinado por los segmentos
extremos, es decir, su cierre convexo, contenga todos los demás segmentos
que conectan las rectas. De este modo, hemos colocado una "escalera", de
manera que cada símplice de la configuración tiene uno de los peldaños en su
interior, mientras que sus cuatro extremos quedan fuera de la configuración.
Ahora, el paso principal es llevar a cabo una tranformación (afín) de jRd en
jRd, Y que lleve el rectángulo que forma la escalera al rectángulo (la mitad de
un cuadrado, como se muestra en la figura) dado por

R1 = {(X1,X2,0, ... ,of:-1:S;X1:S;0;-1:S;X2:S;1}.

Por tanto, la configuración de símplices en contacto ~1 en jRd que obtenemos


tiene el eje Xl corno recta transversal, y está colocada de tal manera que cada
uno de los símplices contiene un segmento

(-l,l)T
en su interior (para algún a con -1 < a < O), mientras que el origen O queda
fuera de todos los símplices.
Ahora obtenemos una segunda copia ~2 de esta configuración reflejando la
primera respecto del hiperplano dado por Xl = X2. Esta segunda configu-
---
ración tiene al eje X2 como recta transversal, y cada símplice contiene un
segmento
S2({3) = {(X1,{3,0, ... ,0)T:-1:S;X1:S;1}
en su interior, con -1 < {3 < O. Pero cada segmento SI ( a) interseca a cada
(-1, -l)T (O, _l)T segmento S2 ({3), y por tanto el interior de cada símplice de ~1 interseca a cada
símplice de ~2 en su interior. En consecuencia, si añadimos una coordenada
(d + l)-ésima, Xd+1, Y escogemos ~ como
{conv(Pi U {-ed+1}) : Pi E ~1} U {conv(Pj U {ed+d): Pj E ~2},
: ,
, obtenemos una configuración de (d + 1) símplices en contacto en jRd+ 1. Aún
más, la diagonal
A = {(x,-x,O, ... ,Of:XEjR} ~ jRd

interseca todos los segmentos SI ( a) y S2 ({3). Podernos "inclinarlo" un poco,


y obtener una recta
LE; = {(x, -x, 0, ... ,0, éX)T : X E jR} ~ jRd+l,
A',
°
que para todo é > suficientemente pequeño interseca a todos los símplices
de ~. Esto completa el paso de inducción. D
Símplices en contacto 77

En contraste con esta cota infelior es más difícil encontrar cotas


superiores ajustadas.
Un argumento ingenuo por inducción (que considera por separado todos los
hiperplanos que contienen a facetas en una configuración en contacto) conduce
únicamente a
f(d) :::; ~(d + 1)!,
Y esto queda bastante lejos de la cota inferior del teorema 1. Sin embargo, Mi-
cha Perles encontró una demostración "mágica" para una cota mucho mejor:

Teorema 2. Para todo d 2: 1, se tiene f(d) < 2d+ 1 .


Demostración. Dada una configuración de r símplices de dimensión d
PI, P 2 , ... ,Pr en contacto en ffi. d, enumeramos primero todos los diferentes
hiperplanos H I , H 2 , •.. , H s determinados por facetas de Pi. Para cada uno
de ellos escogemos de manera arbitraria un lado positivo H: ' y llamamos H i-
al otro lado.
Por ejemplo, la configuración 2-dimensional de r = 4 triángulos que aparece
a la derecha define s = 6 tales hiperplanos (que son rectas para d = 2).
A partir de estos datos, construimos la B -matriz, una matriz (r x s) con en-
tradas en { + 1, -1, O}, de la manera siguiente:

si Pi tiene una faceta en Hj , Y Pi ~ Ht,


si Pi tiene una faceta en H j , Y Pi ~ H j-,
si Pi no tiene una faceta en Hj.

Por ejemplo, la configuración 2-dimensional del margen da lugar a la matriz

O 1 O 1

B= -i -1 1 O O

( -1 1 O
O -1 -1
1
O
O
O

Son dignas de mención tres de las propiedades de la B-matriz: en primer lugar,


puesto que cualquier símplice de dimensión d tiene d + 1 facetas, encontramos
que cualquier fila de B tiene exactamente d + 1 entradas distintas de cero, y
por tanto tiene exactamente s - (d + 1) entradas nulas. En segundo lugar,
estamos tratando con una configuración de símplices que están en contacto
dos a dos, y de ahí que para cada par de filas existe una columna en la cual una
de las filas tiene un + 1, mientras que en la otra fila tiene un -1. Esto es, las
filas son diferentes incluso si dejamos de considerar sus entradas nulas. En
tercer lugar, las filas de B "representan" los símplices Pi mediante

n n
Ahora, obtenemos a partir de B una nueva matriz e en la cual cada fila de B
queda reemplazada por todos los vectores fila que pueden generarse a partir
de ella cambiando todos los ceros por +1 ó -1. Ya que cada fila de B tiene
s - d - 1 ceros, y B tiene r filas, la matriz e tiene 2 s - d - I r filas.
78 Símplices en contacto

Para nuestro ejemplo, esta matriz C es una matriz (32 x 6) que comienza
1 1 1 1 1 1
1 1 1 1 1 -1
1 1 1 -1 1 1
1 1 1 -1 1 -1
1 -1 1 1 1 1
1 -1 1 1 1 -1
C= 1 -1 -1 1 1
1
1 -1 1 -1 1 -1
-1 -1 1 1 1 1
-1 -1 1 1 1 -1

donde las primeras ocho filas de C se derivan de la primera fila de B, las


segundas ocho columnas provienen de la segunda fila de B, etc. Ahora, la
cuestión es que todas las filas de C son diferentes: Si dos filas se derivan de
la misma fila de B, entonces son diferentes ya que sus ceros han sido reem-
plazados de manera diferente; si derivan de filas diferentes de B, entonces son
diferentes, sin importar cómo hayan sido reemplazados los ceros.
Pero las filas de C son vectores de longitud s con entradas ±1, y existen
únicamente 2 8 vectores diferentes de este tipo. Por tanto, y ya que las filas
de C son distintas, la matriz C puede tener a lo sumo 2 8 filas, es decir,
28 - d - 1r ~ 28 .

La primera fila de la matriz e repre- Sin embargo, en C no aparecen todos los (±1)-vectores, lo cual conduce a una
senta el triángulo sombreado, mientras desigualdad estricta 28-d- 1 r < 28 , Y portanto r < 2 d + 1 . Para ver esto, nótese
que la segunda fila corresponde a una in- que cada fila de C representa una intersección de semi espacios - exactamente
tersección vacía de los semiespacios. El
punto x lleva al vector como para las filas de B en el caso anterior, mediante la fórmula (*).
Esta intersección es un subconjunto del símplice Pi, que vino dado mediante
(1 -1 1 1 -1 1) la correspondiente fila de B. Tomemos un punto x E lR. d que no esté en
ninguno de los hiperplanos H j , y tampoco en ninguno de los símplices Pi. A
que no aparece en la matriz e
partir de este x obtenemos un vector con entradas ±1 que indica para cada j si
x E Ht o x E H j-. Este (±1 )-vector no aparece en C, porque la intersec-
ción correspondiente de semiespacios contiene a x, de acuerdo con (*), y por
tanto no está contenido en ningún símplice Pi. O

[1] F. BAGEMIHL: A conjecture conceming neighboring tetrahedra, Amer. Math.


Monthly 63 (1956) 328-329.
[2] V. J. D. BASTON: Some Properties of Polyhedra in Euclidean Space, Pergamon
Press, Oxford 1965.
[3] M. A. PERLES: At most 2d +1 neighborly simplices in E d , Annals of Discrete
Math. 20 (1984), 253-254.
[4] J. ZAKS: Neighborly families of 2d d-simplices in E d , Geometriae Dedicata 11
(1981),279-296.
[5] J. ZAKS: No Nine Neighborly Tetrahedra Exist, Memoirs Amer. Math. Soco
No. 447, Vol. 91, 1991.
1

Alrededor de 1950 Paul Erd6s conjeturó que cualquier conjunto de más de 2d


puntos en R d determina al menos un ángulo obtuso, es decir, un ángulo mayor
que ~. En otras palabras, si un conjunto de puntos en R d tiene sólo ángulos
agudos y rectos, entonces tiene como mucho 2d puntos. Este problema fue
propuesto en un concurso por la Dutch Mathematical Society - pero sólo se
recibieron soluciones para d = 2 Y d = 3.
Para d = 2 el problema es sencillo: los cinco puntos pueden determinar un
pentágono convexo, que siempre tiene un ángulo obtuso (de hecho, al menos
un ángulo de al menos 108°). En otro caso, existe un punto contenido en
el triángulo que definen otros tres, y dicho punto "ve" a las tres aristas del
triángulo según tres ángulos que suman 360° , por lo que alguno de ellos es al
menos de 120°. (El segundo caso incluye las configuraciones con tres puntos
colineales y, por tanto, con un ángulo de 180°.)

De manera independiente, Victor Klee preguntó poco después - y Erd6s di-


fundió la pregunta - cuántos puntos puede tener un conjunto de R d mante- o- --
niendo la siguiente "propiedad antipodal": para cualquier par de puntos en el
conjunto existe una banda (acotada por dos hiperplanos paralelos) que con-
tiene al conjunto, y que tiene a los dos puntos en hiperplanos distintos.
En 1962, Ludwig Danzer y Branko Grünbaum consiguieron resolver los dos
problemas simultáneamente: encerraron los dos tamaños máximos en una ca-
dena de desigualdades, que comienza y termina en 2d . Por tanto, la respuesta
es 2d tanto para el problema de Erd6s como para el de Klee.

En lo que sigue consideramos conjuntos (finitos) de puntos contenidos en


Sr;;;; R d , sus envolventes convexas conv(S) y, en general, politopos convexos
Q r;;;; R d. (Véase el apéndice sobre politopos en la página 50 para un resumen
de los conceptos básicos). Suponemos que los conjuntos tienen dimensión d,
es decir, no están contenidos en un hiperplano. Dos conjuntos convexos se
tocan si tienen al menos un punto de la frontera en común, pero sus interiores
son disjuntos. Para un conjunto Q r;;;; R d y un vector s E R d denotamos por
Q + s la imagen de Q por la traslación que envía O a s. De manera similar,
Q - s es el conjunto que se obtiene al aplicar a Q la traslación que lleva s al
origen.
No se asuste: este capítulo es una excursión a la geometría d-dimensional,
sin embargo los argumentos que utilizaremos no necesitan ninguna "intuición
d-dimensional" ya que todos ellos pueden ser seguidos, visualizados (y, por
tanto, comprendidos) en dimensión tres, e incluso en el plano. Por tanto, los
dibujos ilustrarán la demostración para d = 2 (donde un "hiperplano" es sen-
cillamente una recta), y el lector podrá hacer sus propios dibujos para d = 3
(donde un "hiperplano" es un plano).
80 Cualquier conjunto con muchos puntos tiene un ángulo obtuso

Teorema 1. La siguiente cadena de desigualdades se verifica para cualquier


dimensión d:

8 <;;; ]Rd tales que para cualquier par de puntos}


(2) { {Si,Sj} <;;; S existe una banda S(i,j) que contiene
::; max #8 a 8 y que tiene a Si y Sj en hiperplanos distintos de
lafrontera de S( i, j).
8 <;;; ]Rd tales que los trasladados P - Si, Si E 8, de}
(3) max{ #8 la envolvente convexa P := conv(8) tienen un punto
en común, pero sólo se tocan.
(4) { 18
<;;; ]Rd tales que los trasladados Q + Si de algÚn}
< max #8 politopo convexo d-dimensional Q <;;; ]Rd se tocan dos
a dos.
8 <;;; ]Rd tales que los trasladados Q* + Si de algÚn}
(5)
= max { #8 politopo convexo d-dimensional y centralmente simé-
trico Q* <;;; lEtd se tocan dos a dos.
(6) d
::;2
• Demostración. Tenemos que comprobar un total de seis igualdades y des-
igualdades. Comencemos.
(1) Sea 8 := {O, l}d el conjunto de vértices del cubo unitario en ]Rd, y con-
sideremos Si, S j , S k E 8. Por simetría, podemos suponer que s j = O es el
vector nulo. Por tanto, el ángulo está determinado por
(Si, Sk)
cos<l ( Si,Sj,Sk ) = 1S~.11.Sk l'

que es claramente mayor o igual que cero. En consecuencia, 8 es un conjunto


de cardinal 2d que no tiene ángulos obtusos.
(2) Para Si, Sj E S consideramos el hiperplano Hij que pasa por el origen y
es ortogonal a la arista [Si, Sj], es decir, Hij = {x E]Rd : (x, Si-Sj) = O}
Y denotamos por Hij + S j el hiperplano paralelo que pasa por S j, es decir,
Hij + Sj = {x + Sj : x E H ij }. Por tanto, Hij + Si Y Hij + Sj son hiper-
planos paralelos que pasan por Si y Sj, respectivamente, y son ortogonales a
la arista [Si, Sj]. Obsérvese que la banda delimitada por Hij + Si Y Hij + Sj
contiene, además de los puntos Si y Sj, exactamente todos los puntos x E ]Rd
tales que los ángulos <l(Si,Sj,X) y <r(Sj,Si,X) no son obtusos. Podemos
concluir entonces que si 8 no contiene ángulos agudos, la banda limitada por
los hiperplanos Hij + Si Y Hij + Sj contiene todos los puntos de 8.
(3) P está contenido en el semiespacio definido por Hij + S j que contiene a
Si si y sólo si P - Sj está contenido en el semiespacio definido por Hij que
contiene a Si - S j: la propiedad "un objeto está contenido en un semiespacio"
no cambia si el objeto y el semiespacio sufren la misma traslación (en este
caso, de vector -Sj). De manera similar, P está contenido en el semiespacio
definido por Hij + Si que contiene a S j si y sólo si P Si está contenido en
el semiespacio definido por Hij que contiene a S j - Si.
Cualquier conjunto con muchos puntos tiene un ángulo obtuso 81

Combinando ambos vemos que un P está contenido en la


banda definida por Hij + Si Y Hij + Sj si y sólo si P - Si YP - Sj están en
lados diferentes del hiperplano Hij.
La figura del margen ilustra esta correspondencia.
Además, de Si E P = conv(S) se deduce que el origen está contenido en
todos los trasladados P - Si (Si E S). Por tanto, los conjuntos P - Si se
intersecan en el origen, pero sólo se tocan: los interiores son disjuntos dos a
dos, ya que están en lados distintos del correspondiente hiperplano Hij.
Esto es inmediato: "los trasladados se tocan dos a dos" es una afirmación
más débil que "se intersecan en un punto, pero sólo se tocan." De manera simi-
lar, podemos relajar la condición permitiendo que P sea un politopo convexo
arbitrario de JP;.d y reemplazar S por -S.
(5) Aquí "2" es trivial, pero no es el resultado que nos interesa. Debemos
comenzar con una configuración S ~ JP;.d Y cualquier politopo d-dimensional
Q ~ JP;.d tal que los trasladados Q + Si (Si E S) se tocan dos a dos. Veamos
que en esta situación podemos utilizar

Q* := g(x - y) E JP;.d : x, y E Q}
en lugar de Q. No es difícil: en primer lugar, Q* es d-dimensional, convexo
y centralmente simétrico. Se puede comprobar que Q* es un politopo (sus
vértices son de la forma ~ (qi - qj)' donde qi' qj son vértices de Q), pero esto
no es importante para nosotros.
A continuación demostraremos que Q + Si Y Q + Sj se tocan si y sólo si
Q* + Si Y Q* + Sj se tocan. Para ello, observamos, siguiendo los pasos de
Minkowski, que

(Q*+Si) n (Q* + Sj) #- 0

-{==?
I qi'
:3 qi' " qj'
I qj" E Q.. 2"1 (1
qi + Si
- qi") -_ 2"
1 (1
qj - qj") + Sj
-{==?
"Cl
qi)
::J
I qj" E Q.. 2"1 (1
I qi" ,qj) qi + qj") + Si -_ 2"1 (1
qj + qi") + Sj

-{==? :3qi) qj E Q : qi + Si = qj + Sj

donde en la tercera (y crucial) equivalencia "-{==?" hemos utilizado que todo


q E Q se puede escribir como q = ~ (q + q) para obtener "~", y que Q es
convexo y, por t ant o, 2"I ( qiI + q") 1 ( qjI + qi") E Q para obtener "
j ' 2" ".
=?-
Por tanto, el paso de Q a Q* (conocido como simetrización de Minkowski)
conserva la propiedad de que dos trasladados Q + Si Y Q + S j se intersecan.
Es decir, hemos demostrado que para cualquier convexo Q, dos trasladados
Q + Si Y Q + Sj se intersecan si y sólo si los trasladados Q* + Si Y Q* + Sj
se intersecan.
La siguiente caracterización demuestra que la simetrización de Minkowski
también conserva la propiedad de que dos trasladados se tocan:

Q + Si Y Q + Sj se tocan si y sólo si se intersecan; además, Q + Si


YQ + Sj + E(Sj - Si) no se intersecan para ningún E> O.
82 Cualquier conjunto con muchos puntos tiene un ángulo obtuso

Supongamos que Q* + Si Y + Sj se tocan. Para cualquier punto de la


intersección

se tiene que
x - Si E Q* y x - Sj E Q*,
por tanto, como Q* es centralm:ente simétrico,

y, como Q* es convexo,

Hemos demostrado que ~ (Si + Sj) está contenido en Q* + Sj para todo i. Por
tanto, para P := conv(S) obtenemos

Pj := ~(P + Sj) = conv g(Si + Sj) : Si E S} ~ Q* + Sj,


de donde se deduce que los conjuntos P j = ~ (P + S j) sólo se pueden tocar.
Finalmente, los conjuntos Pj están contenidos en P, ya que los puntos Si, Sj
y ~ (Si + S j) están en P por ser P convexo. Los conjuntos P j son copias
trasladadas y escaladas de P, contenidas en P. El factor de escala es ~, de
donde se deduce que 1
vol(Pj) = 2dvo1(P),
ya que se trata de conjuntos de dimensión d. Esto quiere decir que en P caben,
como mucho, 2 d conjuntos P j y, por tanto, ISI :::; 2d .
Factordeescala~, vol(Pj) = ivo1(p)
Con esto terminamos la demostración, ya que hemos cerrado la cadena de
desigualdades. O
... pero la historia no termina aquí. Danzer y Grünbaum hicieron la siguiente
pregunta natural:
¿ Qué ocurre si se pide que todos los ángulos sean en lugar
de no obtusos, es decir, si se prohíben también los ángulos rectos?

Danzer y Grünbaum construyeron configuraciones de 2d - 1 puntos en IFt d


que sólo tenían ángulos agudos, y conjeturaron que éste era el mayor tamaño
posible. Grünbaum demostró que esto es cierto para d :::; 3. Pero veintiún años
después, en 1983, Paul Erdos y Zoltan Füredi demostraron que la conjetura es
falsa - ¡por mucho, si la dimensión es alta! Su demostración es todo un
ejemplo magnífico de la potencia de los argumentos probabilísticos; véase el
capítulo 35 para una introducción al "método probabilístico." Nuestra versión
de la demostración utiliza pequeñas mejoras en la elección de los parámetros
debidas a nuestro lector David Bevan.

Teorema 2. Para todo d ::::: 2 existe un conjunto S ~ {O, l}d de 2l v;: (~) dJ
d
puntos en IFt (vertices del cubo unitario d-dimensional) que determinan sólo
ángulos agudos.
En particular, en dimensión d = 34 existe un conjunto de 72 > 2·34 - 1
puntos que sólo tiene ángulos agudos.
Cualquier conjunto con muchos puntos tiene un ángulo obtuso 83

• Demostración. Sea m := l V; (~ )d J y obtengamos 3m vectores


x(l), x(2), . .. , x(3m) E {O, l}d
seleccionando sus coordenadas del conjunto {O, 1}, de manera aleatoria e
independiente y con probabilidad ~ para cada alternativa. (Se puede tirar una
moneda 3md veces para ello; sin embargo, si d es grande esto puede resultar
un poco aburrido.).
Hemos visto anteriormente que todos los ángulos determinados por vecto-
res 0/1 no son obtusos. Por otra parte, tres vectores x(i), x(j), x(k) for-
man un ángulo recto con vértice en x(j) si y sólo si el producto escalar
(x(i) - x(j), x(k) - x(j)) se anula, es decir, si se tiene que

x(i)g - x(j)g = O o x(k)g - x(j)g = O para cada coordenada f!.

Llamamos a (i,j, k) una terna mala si esto ocurre. (Si x(i) = x(j) ó
x(j) = x(k), el ángulo no está definido pero la tema (i,j, k) es claramente
mala.)
La probabilidad de que una tema fija sea mala es exactamente (~) d: la tema
será buena si y sólo si para una de las d coordenadas f! se tiene

bien x(i)g = x(k)g = O, x(j)g = 1,


o bien x(i)g = x(k)g = 1, x(j)g = O.

Esto nos deja un total de seis posibilidades malas de un total de ocho igual-
mente probables, y una tema será mala si y sólo si ocurre una de las opciones
malas (con probabilidad ~) para cada una de las d coordenadas.
El número de temas que tenemos que considerar es 3 e;;n), ya que hay e;;n)
conjuntos de tres vectores y en cada uno de ellos tenemos tres posibles vérti-
ces. Por supuesto, las probabilidades de que distintas temas sean malas no son
independientes, pero la linealidad de la esperanza (que es lo que se obtiene
al hacer el promedio entre todas las posibles selecciones, véase el apéndice)
dice que la esperanza del número de temas malas es exactamente 3 (3;;n) (~) d.
Esto quiere decir - y es en este punto cuando el método probabilístico mues-
tra su potencia - que hay alguna elección de los 3m vectores para la que hay
como mucho 3 (3;;n) (~)d temas malas, donde

de acuerdo con nuestra elección de m.


Pero si no hay más de m temas malas, podemos eliminar m de los 3m vectores
x (i) de forma que los restantes 2m vectores no contengan ninguna tema mala,
es decir, determinen sólo ángulos agudos. O

La "construcción probabilística" de un conjunto grande de puntos con coor-


denadas 0/1 Y sin ángulos rectos se puede implementar fácilmente, utilizando
un generador de números aleatorios para "tirar la moneda." David Bevan ha
construido de esta forma un conjunto de 31 puntos en dimensión d = 15 que
sólo determina ángulos agudos.
84 Cualquier conjunto con muchos puntos tiene un ángulo obtuso

Presentamos aquí tres herramientas básicas de la teoría de la probabilidad dis-


creta que aparecerán en varias ocasiones: las variables aleatorias, la linealidad
de la esperanza y la desigualdad de Markov.
Sea (D, p) un espacio de probabilidad finito, es decir, D es un conjunto finito y
p = Prob es una aplicación de D en el intervalo [0,1] tal que ¿wESl p(w) = 1.
Una variable aleatoria X en D es una aplicación X : D -----+ R Un espacio de
probabilidad sobre el conjunto X(D) se construye definiendo
p(X = x) := ¿X(w)=xp(w). Un ejemplo sencillo es un dado equilibrado (es
decir, p(w) = i)con X = "el número obtenido cuando se tira el dado."
La esperanza EX de X es el promedio, es decir,

EX = L p(w)X(w).
wESl
Si X e Y son dos variables aleatorias en D, la suma X +Y es también una
variable aleatoria, y se tiene que

E(X + Y) LP(w)(X(w) + Y(w))


w

LP(w)X(w) + p(w)Y(w) = EX + EY.


w w

Esta propiedad se puede extender fácilmente a cualquier combinación lineal


finita de variables aleatorias - propiedad conocida como linealidad de la
esperanza. Obsérvese que no es preciso que las variables aleatorias sean "in-
dependientes" en ningún sentido.
La tercera herramienta es válida para variables aleatorias X que toman sólo
valores no negativos, lo que escribimos como X ;::: O. Sea

Prob(X;::: a) = L p(w)
w:X(w)2:a
la probabilidad de que X sea mayor o igual que cierto a > O. Entonces

EX L p(w)X(w) + L p(w)X(w) > a L p(w),


w:X(w)2: a w:X(w)<a w:X(w)2:a
y hemos demostrado la desigualdad de Markov
EX
Prob(X ;::: a) :::::
a

[1] L. DANZER & B. GRÜNBAUM: Über zwei Probleme bezüglich konvexer Korper
von P. Erdos und von V. L. Klee, Math. Zeitschrift 79 (1962), 95-99.
[2) P. ERDÓS & Z. FÜREDI: The greatest angle among n points in the
d-dimensional Euclidean space, Annals of Discrete Math. 17 (1983), 275-283.
[3) H. MINKOWSKI: Dichteste gitterformige Lagerung kongruenter Korper, Nachri-
chten Ges. Wiss. Géittingen, Math.-Phys. Klasse 1904, 311-355.
El artículo que Karol Borsuk publicó en 1933, con el título "Three theorems on
the n-dimensional euclidean sphere", tiene bastante fama porque contiene un
importante resultado (conjeturado por Stanislaw Ulam) que ahora se conoce
como el teorema de Borsuk-Ulam:

Cualquier aplicación continua f : Sd --+ ]R.d lleva dos puntos antipo-


dales de la esfera Sd al mismo punto en rn;d.

El mismo artículo también es famoso por un problema propuesto al final, que


se conoce como la conjetura de Borsuk:

Para S ~ ]R.d de diámetro acotado diam(S) > O,


¿puede encontrarse una partición en, a lo sumo, d + 1 partes
de menor diámetro?
Karol Borsuk
La cota d + 1 es la menor posible: si S es un símplice regular de dimensión d,
o sencillamente el conjunto de sus d + 1 vértices, entonces ningún conjunto
de una partición que reduzca el diámetro puede contener más de un vértice.
Siendo f(d) el menor número tal que cualquier conjunto acotado S c:: ]R.d
admite una particion en f (d) partes de menor diámetro, el símplice regular
demuestra que f (d) 2 d + 1.
La conjetura de Borsuk fue probada para el caso en que S es una esfera (por el
mismo Borsuk), para cuerpos lisos (usando el teorema de Borsuk-Ulam), para
d :S 3, ... pero el caso general permanecía abierto. La mejor cota superior
para f (d) fue dada por Oded Schramm, quien demostró que

f(d) :S (1.23)d
para d suficientemente grande. Esta cota parece débil en comparación con la
conjetura "f(d) = d + 1", pero en 1993 de pronto se convirtió en razonable
cuando Jeff Kahn y Gil Kalai refutaron la conjetura de Borsuk de manera muy
sorprendente. Sesenta años tras la publicación del artículo de Borsuk, Kahn y
Kalai probaron que f(d) 2 (1.2)Vd para d suficientemente grande.
Una versión de El Libro de la demostración de Kahn y Kalai fue dada por
A. Nilli. De manera breve, y sin hacer referencia a otros teoremas, proporciona
un contraejemplo explícito de la conjetura de Borsuk en dimensión d = 946.
Presentamos una modificación de esta demostración, dada conjuntamente por
Andrei M. Raigorodskii y Bernulf WeiBbach, que reduce la dimensión hasta Cualquier símplice de dimensión d
d = 561 (y se puede llegar incluso a d = 560). El "récord" actual es d = 298, puede descomponerse en d + 1 partes,
conseguido por Aicke Hinrichs y Christian Richter en el 2002. todas ellas de menor diámetro.
86 La conjetura de Borsuk

Teorema. Sea q = pm la de un n := - 2, Y d := G) =
(2q - 1)(4q 3). Entonces existe un conjunto S <:;;; {+1, -l}d de 2 n - 2
puntos en lR d tal que cualquier partición de S en partes de menor diámetro
que S tiene, al menos,

partes. Para q = 9 se sigue que la conjetura de Borsuk es falsa en dimensión


d = 561. Aún más, f(d) > (1.2)01 para d suficientemente grande.

11 Demostración. El conjunto S se construye en cuatro pasos.

A. Nilli Sean q la potencia de un primo, n = 4q - 2 y

Q := {x E {+l,-l}n: xl = 1, #{i: Xi = -l}espar},

un conjunto de 2n - 2 vectores enlR n . Veremos que (x, y) == 2 (mod4) se veri-


fica para todos los vectores x, y E Q. Diremos que x, y son casi-ortogonales
si I(x, 1= 2, Y probaremos que cualquier Q' <:;;; Q que no contiene vectores
casi-ortogonales es "pequeño": IQ'I S ¿;::;g
(n~l).
(2) A partir de Q, construimos el conjunto

R := {xxT:XEQ}

de 2n-2 matrices simétricas n x n de rango 1. Las interpretamos como


n2
vectores de n 2 componentes, R <:;;; lR . Probaremos que entre estos vecto-
res sólo hay ángulos agudos: tienen productos escalares positivos (cuyo valor
al menos es 4). Además, si R' <:;;; R no contiene dos vectores cuyo producto
escalar es 4, entonces IR'I es "pequeño": IR'I S ¿;::;g
(n~l).

y
En nuestra notación, los vectores x, y, ... son vectores columna y los
vectores transpuestos x T , yT, ... son vectores fila. El producto de ma-
trices xx T es una matriz de rango 1, con (XXT)ij = XiXj.
Si x, y son vectores columna, entonces su producto escalar es

T (x,y) = LXiYi =
X ( 1 -1 -1 1 -1)
1 -1 -1 1

xx T
=
(
-1
-1
1
1
1-1
1-1
1 -1 -1 1 -1
-i) También necesitaremos productos escalares para matrices X, Y E
lR nxn que se pueden interpretar como vectores de longitud n 2 . Por
tanto, su producto escalar es
-1 1 1-1 1
(X, Y) .- L XijYij'
i,j
La conjetura de Borsuk 87

A partir de R, obtenemos el conjunto de puntos en lR. G) cuyas coordenadas


son las "entradas subdiagonales" de las matrices correspondientes:

De nuevo, el conjunto S tiene 2n - 2 puntos. La distancia máxima entre estos


puntos se obtiene precisamente para los vectores casi-ortogonales x, y E Q.
Concluimos que un subconjunto S' c::; S de menor diámetro que S ha de ser
"pequeño": IS'I :S ¿i~g (n~l).
Del apartado (3) deducimos que cualquier partición de S que reduzca el
diámetro necesita al menos

g(q) .-

partes. En consecuencia,

f(d) 2 max{g(q) , d + 1} para d = (2q - 1)(4q - 3).

Por tanto, si 9 (q) > (2q - 1) (4q - 3) + 1, entonces existe un contraejemplo


para la conjetura de Borsuk en dimensión d = (2q - 1) (4q - 3). En particular,
g(9) > 56210 proporciona para d = 561. Además, veremos que

g(q) >
e
64q2
(27)q
16 '

lo cual lleva a la cota asintótica f( d) > (1.2) Vd para d suficientemente grande.

Detalles de (1): Empezamos con unas consideraciones sobre divisibilidad.


Lema. Lafunción P(z) := (~:::;) es un polinomio de grado q - 2 cuyo valor
numérico es entero para todo entero z. El entero P(z) es divisible entre p si y
sólo si z no es congruente con Oo con 1 módulo q.

• Demostración. Escribimos el coeficiente binomial P(z) de la forma

P(z) = z-
( q-2
2) = (z - 2)(z - 3) ..... (z - q + 1)
(q-2)(q-3)· ...... ·2·1

y comparamos el número de veces que aparece el factor p en el denominador


y en el numerador. En el denominador aparece el mismo número de veces que Afirmación. Si a == b -=¡É O (modq), en-
en (q - 2)!, o en (q -1)!, ya que q -1 no es divisible entre p. Es más, según la tonces el factor p aparece en a y b el
afirmación del margen, en cualquier producto de q -1 enteros, escogidos cada mismo número de veces.
uno de una clase diferente de residuos módulo q distinta de cero, el factor p 111 Demostración. Por congruencia, se
aparece el mismo número de veces. verifica que a = b + spm, donde b no
Si z es congruente con O ó 1 (modq), entonces también lo es el numerador: es divisible entre pm = q. Por lo tanto,
Todos los factores en el producto pertenecen a clases de residuos diferentes, y podemos afirmar que cualquier potencia
las únicas clases que no aparecen son la clase del O (los múltiplos de q) y la pk que divide a b verifica que k < m, y
clase, o bien del -1, o del +1, pero ni +1 ni -1 son divisibles entre p. Por en consecuencia también divide a a. Lo
tanto, el factor p aparece el mismo número de veces en el denominador y en mismo es cierto si intercambiamos los
el numerador, y de aquí que el cociente no sea divisible entre p. papeles de a y b. D
88 La conjetura de Borsuk

Por otra parte, si z t=- O, 1 (mod q), entonces en el numerador de (*) aparece
un factor que es divisible entre q = pm. Al mismo tiempo, en este producto
faltan factores de dos clases de residuos adyacentes no nulas: uno representa a
números que no contienen ningún factor p, y el otro tiene menos factores p que
q = pm. Por tanto, hay más factores p en el numerador que en el denominador,
y el cociente resulta ser divisible entre p. . D

Ahora consideremos cualquier subconjunto Q' ~ Q que no contenga vectores


casi-ortogonales. Queremos llegar a que Q' ha de ser "pequeño".
i
Tlrlrnacw'n 1. Si x, y son vectores distintos de Q, entonces ((x, y) + 2)
es un entero que satisface
-(q-2) :::; ~((x,y)+2) :::; q-1.
Tanto x como y tienen un número par de componentes -1, de modo que el
número de componentes en las cuales difieren también es par. Por tanto,
(x, y) = (4q - 2) - 2#{i : Xi -=1- Yi} == -2 (mod4)
para todo x, y E Q, es decir, ~((x, y) + 2) es un entero.
Puesto que x, y E {+1, _1}4 q -2, sabemos que -(4q-2) :::; (x, y) :::; 4q-2,
esto es, -(q-1):::; i((x,y) +2):::; q. Nunca se dala igualdad de la cota
inferior, ya que Xl = Yl = 1 implica que x -=1- -y. La igualdad en la cota
superior sólo se da si x = y.
Afirmación 2. Para cualquier y E Q', el polinomio de grado q - 2
en n variables Xl, ... , X n dado por
Fy(x) := p(~((x,y)+2)) = (~((X,Y)+2)-2)
q-2
cumple que Fy(x) es divisible entre p para cada x E Q'\{y}, pero
no para x = y.
Los valores del polinomio F y (x) son siempre enteros, ya que viene expresado
por un coeficiente binomial. Para x = y, obtenemos Fy(Y) = 1. Para x -=1- y,
dellema se deduce que F y (x) no es divisible entre p si y sólo si ~ ( (x, y) + 2)
es congruente con O ó 1 (modq). Por la afirmación 1, esto ocurre sólo si
~ ((x, y) + 2) es O ó 1, esto es, si (x, y) E {-2, +2}. Para ello, x e y han de
ser casi-ortogonales, lo cual contradice la definición de Q'.
Afirmación 3. Lo mismo es cierto para los polinomios F y (x) en
las n - 1 variables X2, ... ,X n obtenidos como sigue: Se expande
F y (x) en monomios, se elimina Xl. y se reducen todas las potencias
superiores de las demás variables substituyendo Xl = 1 Y x; = 1
para i > 1. El grado de F y (x) es, como máximo, q - 2.

x
Los vectores E Q ~ {+ 1, _l}n satisfacen Xl = 1 Y x;
= 1. Por tanto, las
substituciones no cambian los valores de F y (x) en el conjunto Q. Tampoco
aumentan el grado, con lo cual el grado de F y (x) es a lo sumo q - 2.

Afirmación 4. No existe ninguna relación lineal (con coeficientes


racionales) entre los polinomios F y(x) para y E Q', es decir, son
linealmente independientes sobre 1Ql. En particular, son distintos.
La conjetura de Borsuk 89

Supongamos que exista una relación de la forma ¿YEQ' ayF y (x) = O tal
que no todos los coeficientes ay son cero. Tras multiplicar por un escalar
apropiado, podemos suponer que los coeficientes son enteros, pero no todos
ellos divisibles entre p. En este caso, para todo y E Q' la evaluación en
x := y conduce a que ayF y(y) es divisible entre p, y de aquí que haya de
serlo ay, ya que F y(y) no lo es.
j"fl'w,'lu~i¡iln 5. IQ'I está acotado por el número de monomios libres
de cuadrados en n - 1 variables y de grado a lo sumo q - 2, es decir,
por ¿¡::g (n~l).

Por construcción, los polinomios F y son libres de cuadrados: ninguno de


sus monomios contiene una variable de grado mayor que 1. Por tanto, cada
F y (x) es una combinación lineal de monomios libres de cuadrados de grado
a lo sumo q - 2 en las n - 1 variables X2, . .. , X n . Puesto que los polinomios
F y (x) son linealmente independientes, su número (que es IQ'I) no puede ser
mayor que el número de monomios en cuestión.

Detalles de (2): La primera columna de xx T es x. Por tanto, para distintos


x E Q obtenemos matrices distintas M(x) := xx T . Interpretamos estas
matrices como vectores de longitud n 2 de componentes XiXj. El cálculo
n n
(M(x),M(y)) :L 'L,(XiXj) (YiYj)
i=l j=l

(x, y)2 > 4

muestra que el producto escalar de M (x) Y M (y) se minimiza si y sólo si


x, y E Q son casi-ortogonales.

Detalles de (3): Sea U (x) E {+ 1, -1 } d el vector cuyas componentes son


las entradas que aparecen por debajo de la diagonal en M (x). Puesto que la
matriz M (x) = xx T es simétrica y los valores de la diagonal son +1, vemos
que M(x) =1= M(y) implica U(x) =1= U(y). Aún más,

~
4 ~ (M(x), M(y)) = 2(U(x), U(y)) + n,
M(x)
esto es,

~1
n
(U(x), U(y)) ~ -"2 + 2,
y la igualdad se da si y sólo si x e y son casi-ortogonales. Puesto que todos
los vectores U(x) E S tienen la misma longitud V(U(x), U(x)) = Iff),
la distancia máxima entre puntos U (x), U (y) E S se alcanza exactamente
cuando x e y son casi-ortogonales.

Detalles de (4): Para q = 9 tenemos g(9) :=::ó 758.31, que es mayor que
4
d + 1 = e2 ) + 1 = 562.
Con el fin de obtener una cota general para d grande, usamos la monotonía y
unimodalidad de los coeficientes binomiales, y las estimaciones n! > e( -;)n
90 La conjetura de Borsuk

y n! < en(:;;-)n (véase apéndice del capítulo 2) para deducir que

(4q) ! e 4q (~) 4q
= q q!(3q)! < q e (;)q e en 3q = 4q2 (256) q.
e 27

De aquí concluimos que

f(d) 2 g(q)

A partir de esto y usando


d = (2q 1)(4q-3) = 5q2+(q-3)(3q-1) 25 q2 paraq23,

q= ~ + V~ + l4 > [j, y (i~)V1 > 1.2032,


obtenemos

f(d) > 1;d(1.2032)v'd > (1.2)v'd parad suficientemente grande. O

Un contraejemplo en dimensión 560 se obtiene observando que para q = 9


el cociente g(q) R:ó 758 es mucho más grande que la dimensión d(q) = 561.
Por tanto, se obtiene un contraejemplo para d = 560 tomando únicamente los
"tres cuartos" de los puntos en S que satisfacen X21 + X31 + X32 = -1.
Se sabe que la conjetura de Borsuk es cierta para d ::; 3, pero no ha sido
verificada en ninguna dimensión mayor. En contraste, la conjetura sí es cierta
hasta dimensión d = 8 si nos restringimos a subconjuntos S ~ {1, _l}d como
los construidos aquí (véase [8]). En cualquier caso, es muy posible que puedan
encontrarse contraejemplos en dimensiones razonablemente pequeñas.

Referencias
[1] K. BORSUK: Drei Satze über die n-dimensionale euklidische Sphiire, Fundamenta
Math. 20 (1933),177-190.
[2] A. HINRICHS & C. RICHTER: New sets with large Borsuk numbers, Preprint,
February 2002,10 pages; Discrete Math., to appear.
[3] J. KAHN & G. KALAI: A counterexample to Borsuk's conjecture, Bulletin Amer.
Math. Soc. 29 (1993), 60-62.
[4] A. NILLI: On Borsuk's problem, in: "Jerusalem Combinatorics '93" (H. Barcelo
and G. Kalai, eds.), Contemporary Mathematics 178, Amer. Math. Soc. 1994,
209-210.
[5] A. M. RAIGORODSKII: On the dimension in Borsuk's problem, Russian Math.
Surveys (6) 52 (1997), 1324-1325.
[6] O. SCHRAMM: Illuminating sets of constant width, Mathematika 35 (1988),180-
199.
[7] B. WEISSBACH: Sets with large Borsuk number, Beitrage zur Algebra und
Geometrie/Contributions to Algebra and Geometry 41 (2000), 417-423.
[8] G. M. ZIEGLER: Coloring Hamming graphs, optimal binary codes, and the 0/1-
Borsuk problem in low dimensions, Lecture Notes in Computer Science 2122,
Springer-Verlag 2001,164-175.
Ii I'"

16
Conjuntos, funciones
y la hipótesis del continuo 93
17
Aquellas maravillosas
desigualdades 1 09
18
Un teorema de Pólya
sobre polinomios 117
19
Sobre un lema
de Littlewood y Offord 123
20
La cotangente
y el truco de Herglotz 127
21
La aguja de Buffon 133

"El hotel de Hilbert junto al mar"


1

La teoría de conjuntos, fundada por Georg Cantor en la segunda mitad del


siglo ha transformado profundamente las matemáticas, de fonna que en
la actualidad no tendrían sentido sin el concepto de conjunto o, en palabras
de David Hilbert: "Nadie nos hará salir del paraíso (de la teoría de conjuntos)
que Cantor ha creado para nosotros."
Uno de los conceptos básicos definidos por Cantor fue el tamaño o cardinal
de un conjunto M, denotado por INII. Para conjuntos finitos la definición no
presenta dificultades: se cuentan los elementos y se dice que M tiene cardi-
nal n si contiene n elementos. Por tanto, dos conjuntos finitos M y N tienen
igual cardinal si tienen el mismo número de elementos.
Para definir el concepto de igual tamaño para conjuntos infinitos, hacemos
el siguiente experimento mental para conjuntos finitos. Supongamos que un
grupo de personas quieren subir a un autobús. ¿Cuándo diremos que el nú-
mero de personas es el mismo que el número de asientos libres? Sencillo:
dejamos que las personas se sienten; si todas encuentran un asiento, y ningún
asiento queda vacío, entonces (y sólo entonces) diremos que los conjuntos (de
personas y de asientos) tienen igual tamaño. En otras palabras, el tamaño es
el mismo si existe una biyección entre los dos conjuntos. Georg Cantor
Esta es por tanto nuestra definición: se dice que dos conjuntos cualesquiera
M y N (finitos o infinitos) tienen el mismo tamaño o cardinal si y sólo si
existe una biyección entre M y N. Es evidente que la noción de igual tamaño
es una relación de equivalencia y, por tanto, podemos asociar un número, lla-
mado cardinal, a cada clase de conjuntos del mismo tamaño. Por ejemplo,
para conjuntos finitos obtenemos los cardinales O, 1, 2, ... ,n, ... donde n de-
nota la clase de los conjuntos de n elementos y, en particular, O denota al
conjunto vacío 0. Obsérvese que, evidentemente, un subconjunto propio de
un conjunto finito M tiene siempre tamaño menor que M.
La teoría se vuelve mucho más interesante (y bastante contraria a la intui-
ción) cuando damos el salto a conjuntos infinitos. Consideremos el conjunto
N = {l, 2, 3, ... } de los números naturales. Diremos que un conjunto M
es numerable si se puede establecer una biyección entre M y N. En otras
palabras, M es numerable si se pueden escribir sus elementos en una lista
mI, m2, m3, . .. Nos encontramos ahora con un fenómeno extraño. Suponga-
mos que añadimos.a N un nuevo elemento x. Entonces, N U {x} sigue siendo
numerable y, por tanto, ¡del mismo tamaño que N!
El "hotel de Hilbert" es una ilustración muy atractiva de este hecho. Supon-
gamos que un hotel tiene una cantidad numerable de habitaciones, llamadas
1,2,3, ... , de forma que el cliente Ci ocupa la habitación i; por tanto, el hotel
está completo. Llega un nuevo cliente x en busca de habitación y el director
94 Conjuntos, funciones y la hipótesis del continuo

del hotel le dice: Lo siento, todas las habitaciones están ocupadas. No hay
problema, le contesta el recién llegado, cambie al cliente Cl a la habitación 2,
a C2 a la 3, a C3 a la 4, y así sucesivamente, y yo me quedaré con la 1. Ante la
sorpresa del director (que no es matemático) la idea funciona; sigue pudiendo
x alojar a todos los clientes, ¡más el recién llegado x!
Ahora está claro que también podemos alojar a un nuevo cliente y, y a otro z,
y así sucesivamente. Por tanto, al contrario que en el caso de conjuntos finitos,
puede ocurrir que un subconjunto propio de un conjunto infinito M tenga el
mismo tamaño que M. De hecho, como veremos, esta propiedad caracteriza
el tamaño infinito: un conjunto es infinito si y sólo si tiene el mismo tamaño
que alguno de sus subconjuntos propios.
Abandonemos el hotel de Hilbert y volvamos a nuestros familiares conjuntos
de números. El conjunto Z de los enteros también es numerable, ya que po-
demos ponerlo de la forma Z = {O, 1, -1,2, -2, 3, -3, ... }. Puede resultar
más sorprendente que el conjunto de los números racionales también se puede
enumerar de una forma similar.
Teorema 1. El conjunto Ql de los números racionales es numerable.

• Demostración. Enumerando el conjunto Ql+ de los racionales positivos


como sugiere la figura del margen, omitiendo los ya encontrados, vemos que
Ql+ es numerable y, por tanto, también lo es Ql si ponemos el O al principio y
- ~ inmediatamente después de ~. Con esta estrategia, obtenemos

Ql = {O, 1, -1, 2, -2,~, -~'!' -!, 3, -3,4, -4,~, -~, ... }. O

Otra forma de interpretar la figura es la siguiente afirmación:


La unión de una cantidad numerable de conjuntos numerables M n es
también numerable.
Si M n = {anl, a n 2, a n 3, ... } hacemos
00

U Mn = {an, a21, a12, a13, a22, a31, a41, a32, a23, a14,··· }
n=l
exactamente igual que antes.
Detengámonos un poco más en el proceso de enumeración de Cantor de los
racionales positivos. Directamente de la figura obtenemos la sucesión
121 1 2 3 432 1 1 2 345
l' l' 2' 3' 2' l' l' 2' 3' 4' 5' 4' 3' 2' l' .,.
y después tenemos que eliminar los números repetidos, como ~ = ó %= ~. t
Hay una enumeración que es todavía más elegante y sistemática, y que no
contiene repeticiones - encontrada recientemente por Neil Calkin y Herbert
Wilf. La lista comienza de la siguiente forma:
1 121 3 2 3 143 5 2 534
l' 2' l' 3' 2' 3' l' 4' 3' 5' 2' 5' 3' 4' l'
El denominador del n-ésimo número racional es igual al numerador del
(n+ l)-ésimo. En otras palabras, la fracción n-ésima es b(n)jb(n + 1), donde
(b( n) ) n2':0 es una sucesión que comienza con
(1, 1, 2, 1, 3, 2, 3, 1,4,3, 5, 2, 5, 3, 4, 1,5, ... ).
Conjuntos, funciones y la hipótesis del continuo 95

Esta sucesión fue estudiada por vez por el matemático alemán Moritz
1
Abraham Stem, en un artículo de 1858, y es conocida como la "serie diatómica
de Stem." ¿Cómo se obtiene esta sucesión y, por tanto, la enumeración de
Calkin-Wilf de los racionales positivos? Consideremos el árbol binario infinito
/I~
1 2
del margen. Es fácil encontrar su definición recursiva: "2 1

} es el primer nodo del árbol


1
1\ 3 2
1\ 3
I!I todo nodo :Y tiene dos hijos: el de la izquierda es i!j y el de la derecha es 3 "2 3 1
i+j
J
1
r1 r1 r1 r1
4 3 5 2 5 3 4
Las siguientes propiedades se pueden demostrar fácilmente: 4: 3 5" "2 5" 3 4: 1

(1) Todas las fracciones que aparecen en el árbol son irreducibles, es decir, si
1
r1r1r1r1r1r1r1r1
~ aparece en el árbol, entonces r y s son primos entre sí. 5"
t
Esto es cierto para el nodo y para el resto lo demostramos por inducción
hacia abajo. Si r y s son primos entre sí, tanto r y r + s como s y r + s lo son.

(2) Toda fracción irreducible ~ > O aparece en el árbol.


Procedemos por inducción sobre la suma r + s. El menor valor es r + s = 2, es
decir, ~ = t,
que aparece en el primer nodo. Si r > s, entonces aparece r-:;s
en el árbol por la hipótesis de inducción y, por tanto, ~ es su hijo derecho.
De manera similar, si r < s, entonces s:r
aparece en el árbol y ~ es su hijo
izquierdo.
(3) Todas las fracciones irreducibles aparecen exactamente una vez.

El argumento es similar. Si ~ aparece más de una vez, entonces r -=1= s, ya


que todos los nodos del árbol, excepto el primero, son de la forma i!j < 1ó
i+j > 1. Finalmente, si r > s ó r < s, seguimos el mismo argumento por
J
inducción que anteriormente.
Todos los números racionales positivos aparecen exactamente una vez en el
árbol y, por tanto, podemos enumerarlos escribiendo los números por niveles,
de izquierda a derecha. Esto nos proporciona el comienzo de la sucesión de
Calkin-Wilf mostrado anteriormente.
(4) El denominador de la n-ésima fracción de la lista es igual al numerador
de la (n + 1)-ésima.
Esto es claramente cierto para n = O y cuando la fracción n-ésima es un hijo
izquierdo. Supongamos que la fracción n-ésima ~ es un hijo derecho. Si ~
está en la frontera de la derecha, entonces s = 1 y el siguiente término de la r-s rl
sucesión está en la frontera izquierda y tiene numerador 1. Finalmente, si ~ s s'-r'
está en el interior y ~ es el siguiente término de la sucesión, entonces ~ es
el hijo derecho de r-:;s, ~ es el hijo izquierdo de s/~rl y, por inducción, el
\ T.. rl
1
s Sí
denQminador de r-:;s es el numerador de s/~rl y, por tanto, s = r'.
Bonito, pero todavía hay más. Nos podemos plantear dos preguntas naturales:

- ¿Tiene algún "significado" la sucesión (b( n) ) n:;::O ?


96 Conjuntos, funciones y la hipótesis del continuo

- Dado ~,¿es sencillo encontrar el término siguiente en la enumeración?

Para responder a la primera pregunta, observemos que el nodo b( n) jb( n + 1)


tiene como hijos a b(2n + 1)jb(2n + 2) Y b(2n + 2)jb(2n + 3). Reuniendo
los tres obtenemos las recursiones
b(2n + 1) = b(n) y b(2n + 2) = b(n) + b(n + 1). (1)

Haciendo b(O) = 1, la sucesión (b(n))n>O está determinada por (l).


¿Existe alguna sucesión "conocida" y "elegante" que satisfaga la misma recUf-
sión? Sí, la hay. Sabemos que cualquier número n se puede escribir de forma
única como suma de potencias de 2 distintas - obteniendo la representación
Por ejemplo, h(6) = 3, Y las represen-
binaria usual de n. Una representación hiperbinaria de n es una representa-
taciones hiperbinarias son
ción de n como suma de potencias de 2 donde cada potencia 2 k aparece a lo
6=4+2 sumo dos veces. Sea h(n) el número de tales representaciones de n. El lector
6=4+1+1 queda invitado a comprobar que la sucesión h( n) satisface la recursión (1) y,
6=2+2+1+1. por tanto, b( n) = h( n) para todo n.
Por cierto, hemos demostrado un hecho sorprendente: si ~ es una fracción
irreducible, existe exactamente un entero n tal que 'r = h(n) y s = h(n + 1).
Veamos ahora la segunda pregunta. En nuestro árbol se tiene
x
es decir, con x := ~,

x
l+x x+1

Utilizamos esto para generar un árbol binario infinito (sin raíz) de la siguiente
forma:
o
1

o
1

o
~I

1
"5
Conjuntos, funciones y la hipótesis del continuo 97

En este árbol todas las filas son y en ellas aparece la enumeración de


Calkin-Wilf de los racionales positivos (con un ~ adicional al principio).
Ahora bien, ¿cómo se construye el siguiente racional a uno dado? Para res-
ponder a esta pregunta, recordemos que dado un racional x, su hijo derecho es
x + 1, su "nieto" derecho es x + 2, y su k-descendiente derecho es x + k. De
manera similar, el hijo izquierdo de x es l~x' cuyo hijo izquierdo es 1;2x y
así sucesivamente: el k-descendiente izquierdo x es l;kx'
Para determinar cómo obtener el número racional f (x) que va "a continua-
ción" de ~ = x en la enumeración, tenemos que analizar la situación mos-
trada en el margen. De hecho, cualquier racional no negativo x en nuestro
árbol binario infinito es el k-descendiente derecho del hijo izquierdo de un
racional y ~ O (para algún k ~ O), en tanto que f (x) es el k-descendiente
izquierdo del hijo derecho del mismo y. Por tanto, de las fórmulas para los
k-descendientes izquierdo y derecho se deduce que
y
x = 1+Y + k,
como se afirma en la figura del margen. Aquí, k = Lx J es la parte entera de x,
mientras que l¡y
= {x} es la parte decimal. De esto se deduce que
l+k(y+1)

y+1 1 1 1
f(x) = 1 + k(y + 1) + 1- Y¡l
Y!l + k k LxJ+1-{x}'

Por tanto, hemos determinado una bonita expresión para el sucesor f (x) de x,
encontrada muy recientemente por Moshe Newman:

La función
1
x 1----+ f(x) = LxJ+1-{x}
genera la sucesión de Calkin-Wilf

lJ---+lJ---+~J---+lJ---+.:?J---+.:?J---+.:?J---+lJ---+i!J---+
1 2 1 3 2 3 1 4 3

que contiene todos los racionales positivos exactamente una vez.

La forma de Calkin-Wilf-Newman de enumerar los racionales positivos tiene


otras propiedades notables. Por ejemplo, nos podemos preguntar por una ma-
nera rápida de determinar la n-ésima fracción de la sucesión, por ejemplo para
1
n = 106 . Aquí está: "2
Para encontrar la fracción n-ésima de la sucesión de Calkin-Wilf, escriba
n en binario, n = (bkbk-l".blbo)2 y, a continuación, siga el camino
1\
en el árbol de CaIkin-Wilf determinado por sus dígitos, comenzando por
t = ~, de la siguiente forma: bi = 1 significa "escoja el hijo derecho," es
decir, "sume el denominador al numerador," mientras que bi = O significa
"escoja el hijo izquierdo," es decir, "sume el numerador al denominador."

La figura del margen muestra el camino resultante para n = 25 = (llOOlh:


por tanto, el término 25" de la sucesión de Calkin-Wilf es ~. El lector puede
98 Conjuntos, funciones y la hipótesis del continuo

encontrar fácilmente un método similar para calcular, dada una fracción % (y


su representación binaria), el lugar que ocupa en la sucesión de Calkin-Wilf.
Pasemos al conjunto de números reales R ¿Es también numerable? No, no
lo es, y el método de la demostración - el proceso de diagonalización de
Cantor - no es sólo de importancia fundamental en toda la teona de conjun-
tos, sino que entra en El Libro como un golpe de ingenio inusual.

Teorema 2. El conjunto lR. de los números reales no es numerable.

11 Demostración. Cualquier subconjunto N de un conjunto numerable


M = {mI, m2, m3, ... } es como mucho numerable (es decir, finito o nume-
rable). Sencillamente, se enumeran los elementos de N tal y como aparecen
en M. Por tanto, si podemos encontrar un subconjunto de lR. que no sea nume-
rable, entonces IR no puede ser numerable. El subconjunto M de lR. que vamos
a estudiar es el intervalo (0,1] de los números reales positivos T tales que
° < T S; 1. Supongamos que M es numerable, y sea M = {TI, T2, T3, ... }
una enumeración de M. Escribimos la única expresión decimal infinita de T n
sin una sucesión infinita de ceros al final:

donde ani E {O, 1, ... ,9} para todo n e i. Por ejemplo, 0.7 0.6999 ...
Consideremos ahora la lista doblemente infinita

TI 0.aUaI2aI3···

T2 0.a2Ia22a23···

Para todo n, elegimos bn E {1, ... , 8} distinto de ann ; es evidente que esto
es posible. Entonces b = 0.b I b2 b3 ... bn ... es un número real de M y, por tanto,
debe aparecer en la lista anterior. Pero es imposible que b = Tk, ya que bk es
distinto de akk. ¡Yeso es todo! O

Continuemos un poco más con los números reales. Obsérvese que los cua-
tro tipos de intervalos (0,1), (O, 1]' [O, 1) Y [0,1] tienen el mismo cardinal.
Como ejemplo, lo vamos a comprobar para (0,1] Y (0,1). La aplicación
f: (0,1] ----+ (0,1), x 1----+ y definida por

¡
2.
2
x para ~ < x S; 1,
2.- x para 4
I
<x<- I
2'
y:= ~ <
s-x para S
I
<X - I
4'

sirve para este propósito ya que es biyectiva: en la primera línea el rango de y


i
es ~ S; y < 1, en la segunda línea S; y < ~, en la tercera línea ~ S; y < i,
°
Una biyección f : (0,1] ---+ (0,1)
1 y así sucesivamente.
Conjuntos, funciones y la hipótesis del continuo 99

A continuación observar que cualesquiera dos intervalos (de lon-


gitud finita y no nula) tienen el mismo cardinal considerando la proyección
central de la figura. Todavía más: todo intervalo (de longitud no nula) tiene
el mismo cardinal que la recta real R Para ver esto, recurrimos al intervalo
abierto (O, 1) doblado de la figura y lo proyectamos en l8I. desde el punto S.
En conclusión, cualquier intervalo abierto, semiabierto o cerrado (finito o infi-
nito) de longitud no nula tiene el mismo cardinal, y dicho cardinal es denotado
por e, de continuo (un nombre utilizado a veces para el intervalo [0,1]). S

Que los intervalos finitos e infinitos tengan el mismo cardinal puede resultar
razonable tras algo de reflexión, pero he aquí otro hecho que seguramente
resulte más contrario a nuestra intuición.
Teorema 3. El conjunto l8I. 2 de todos los pares ordenados de números reales
(es decir, el plano real) tiene el mismo cardinal que R

• Demostración. Para ver esto, es suficiente demostrar que el conjunto de


los pares (x, y), O < x, y ~ 1, se puede poner en correspondencia biyectiva
con el intervalo (O, 1]. La demostración es otra vez de El Libro .. Consideremos
el par (x, y) y escribamos x e y en su única expresión decimal infinita, como
en el siguiente ejemplo:
x 0.3 01 2 007 08
Y 0.009 2 05 1 0008
Obsérvese que hemos separado los dígitos de x e y en grupos, de forma que
en cada grupo hay exactamente un dígito distinto de cero que aparece en la
posición de la derecha. Ahora asociamos a cada (x, y) el número z E (0,1]
que se obtiene al escribir el primer grupo de la x, a continuación el primer
grupo de la y, después el segundo grupo de la x, y así sucesivamente. En
nuestro ejemplo se obtiene
z = 0.3009 01 2 2 05 007 1 08 0008
Como ni la expresión de x ni la de y terminan con una cadena infinita de ceros,
la expresión de z tampoco lo hace. Recíprocamente, a partir de la expresión
de z podemos obtener de forma inmediata su imagen inversa (x, y), lo que
demuestra que la aplicación es biyectiva, y así termina la demostración. O
Como (x, y) f-----7 X + iy es una biyección entre l8I.2 y los números comple-
jos e, concluimos que ICI = Il8I.l = e. ¿Por qué nos resulta tan inesperado el
resultado Il8I.2 1= Il8I.l? Porque va contra nuestra intuición de dimensión. Este
resultado dice que el plano 2-dimensional l8I.2 (y, en general, por inducción, el
espacio n-dimensional l8I. n ) se puede poner en correspondencia biyectiva con
la recta l-dimensional R Por tanto, la dimensión no se conserva al aplicar
transformaciones biyectivas. Si, además, requerimos que la aplicación y su
inversa sean continuas, entonces la dimensión sí se conserva, como demostró
Luitzen Brouwer.

Avancemos un poco más. Hasta ahora hemos desarrollado la noción de igual


cardinal. ¿Cuándo diremos que M no es más grande que N? La respuesta
viene dada de nuevo por las aplicaciones. Diremos que el cardinal m es menor
o igual que n si para dos conjuntos M y N tales que IMI = m y INI = n,
100 Conjuntos,junciones y la hipótesis del continuo

existe una de NI en N. Es evidente que la relación m ::;


es independiente de los conjuntos NI y N elegidos. Si los conjuntos son finitos
esto se corresponde con la noción intuitiva: un conjunto con m elementos es
menor o igual que un conjunto de n elementos si y sólo si m ::; n.
Nos enfrentamos ahora a un problema fundamental. Nos gustaría que las pro-
piedades usuales de las desigualdades siguieran siendo válidas para los car-
dinales. Pero, ¿es esto cierto para los cardinales infinitos? Por ejemplo, ¿es
N cierto que m ::; TI Y TI ::; m implica que m = TI? Esto no es en absoluto
evidente: tenemos conjuntos infinitos NI y N Y aplicaciones j : NI ---+ N
Y 9 : N ---+ M que son inyectivas pero no necesmiamente sobreyectivas.
Esto sugiere construir una biyección enviando algunos elementos m E M a
j (m) EN, Y algunos elementos n E N a 9 (n) E M. Pero no está claro cómo
se pueden coordinar las distintas elecciones para que "encajen bien."
La respuesta es afirmativa y viene dada por el famoso teorema de Schri:ider-
Bernstein, que anunció Cantor en 1883. Las primeras demostraciones fueron
dadas por Friedrich SchrOder y Felix Bernstein algún tiempo después. La
demostración que presentamos apareció en un pequeño libro de uno de los gi-
gantes de la teoría de conjuntos del siglo XX, Paul Cohen, famoso por resolver
la hipótesis del continuo (sobre la que hablaremos posteriormente).

"Schroder y Bernstein pintando"

Teorema 4. Si existen aplicaciones inyectivas de M a N y de N a M, enton-


ces existe una biyección entre M y N, es decir, IMI = INI .
• Demostración. Podemos suponer que M y N son disjuntos - en caso
contrario, reemplazamos N por una nueva copia.
N
M Las aplicaciones inyectivas j y 9 mandan elementos de jlv! a elementos de
N, y viceversa. Una forma de clarificar esta situación potencialmente confusa
es alinear M U N en cadenas de elementos: tomamos un elemento arbitrario
mo E M, Y desde él formamos una cadena de elementos aplicando j, des-
pués g, a continuación de nuevo j, otra vez g, y así sucesivamente. La cadena
se puede cerrar (éste es el caso 1) si mo aparece de nuevo en el proceso, o
puede continuar indefinidamente con elementos distintos. (Por ser las apli-
caciones inyectivas, el primer elemento "repetido" de la cadena no puede ser
distinto de mo).
Si la cadena prosigue indefinidamente, tratamos de recorrerla en orden in-
verso: de mo a g-l(mo) si ffio está en la imagen de g, a continuación a
continuo

J-l (mo)) si (mo) está J, y así sucesivamente.


Pueden aparecer otros tres casos: el proceso de recorrer la cadena hacia atrás
continuar indefinidamente detenerse en un elemento de
NI que no está en la de 9 parar en un elemento de N
que no está en la de J
De esta forma, Iv! U N de cuyos ele-
mentos se

Caso l. Cadena finita de 2k + 2 elementos distintos (k 2: O)


f 9 J J
mo ~ no -----311-- mI ~ mk~nk

~ 9 ~
Caso 2. Cadena doblemente infinita de elementos distintos
J 9 J 9 f
... ~ mo -----311-- no ~ mI -----311-- nI ~ m2-----311--

Caso 3. Cadena infinita de elementos distintos que empieza en el elemento


mo E NI\g(N)
f 9 f 9 f
mo ~ no -----311-- mI ~ nI -----311-- m2 ~

Caso 4. Cadena infinita de elementos distintos que empieza en el elemento


no E N\f(NI)

9 f 9 f
no ~ mo -----311-- nI ~ mI -----311-- o

¿Qué ocurre con el resto de de las desigualdades? Como de cos-


tumbre, se dice que m < n si m < pero m 7=. n. Acabamos de ver
que para dos cardinales cualesquiera se verifica como mucho una de estas tres
posibilidades
m < n, m = n, tU > n
y, según la teoría de los cardinales, se sabe que siempre se cumple exactamente
una. (Véase la proposición 2 en el apéndice de este capítulo).
Además, el teorema de Schroder-Bernstein asegura que la relación < es tran-
sltlva, es m < n y <.J;! que m < .J;!. Por tanto, el conjunto
de los cardinales está totalmente ordenado, comenzando con los cardinales
finitos 0, 1,2,3, .... Recurriendo a los axiomas de Zermelo-Fraenkel (en par-
ticular, al axioma de elección) se deduce fácilmente que cualquier conjunto
infinito NI contiene un subconjunto numerable: 1\11 contiene un elemento mI;
el conjunto NI \ {mI} es no vacío que es y, por tanto, contiene un
elemento m2; considerando el conjunto NI\ {mI, m2} se asegura la existencia
de m3, Y así sucesivamente. Por tanto, el cardinal de un conjunto numerable
es el menor cardinal infinito, denotado usualmente por ~o (que se lee "aleph
sub-cero"). "El menor cardinal infinito"
102 Conjuntos, funciones y la hipótesis del continuo

Como un corolario de No ::; m para cardinal infinito m, IJV\JICUIVc>


demostrar el resultado del "hotel de Hilbert" para cualquier cardinal infinito
m, es decir, se tiene que 1M U {x} 1= 1M 1para cualquier conjunto infinito
También hemos demostrado un resul- M. En efecto, M contiene un subconjunto N = {mI, m2, m3, .. . }. Ahora
tado anunciado anteriormente: mandamos x a mI, mI a m2, Y así sucesivamente, dejando fijos los elementos
Todo conjunto infinito tiene el mismo ta- de M\N. Esto nos proporciona la biyección requerida.
maño que alguno de sus subconjuntos Otra consecuencia del teorema de Schroder-Bemstein que podemos demos-
propios. trar es que el conjunto P(N) de todos los subconjuntos de N tiene cardi-
nal c. Tal y como hemos observado anteriormente, es suficiente demostrar que
IP(N)\{0}1 = 1(0,1]1. Un ejemplo de aplicación inyectiva es
f:P(N)\{0} ---+ (0,1],

en tanto que
g: (0,1] ---+ P(N) \ {0},
define una aplicación inyectiva en la otra dirección.
Hasta ahora conocemos los números cardinales 0, 1, 2, ... , No, Y sabemos que
el cardinal c de lR es mayor que No. El paso de CQl con ICQlI = No a lR con
IlRl = c sugiere de manera inmediata la siguiente pregunta:
¿ Es c = IlRl el siguiente cardinal infinito tras No?
Por supuesto, nos encontramos con el problema de si siquiera existe el cardinal
siguiente o, en otras palabras, si NI tiene sentido. Lo tiene - daremos un
esquema de la demostración de este hecho en el apéndice de este capítulo.
La afirmación c = NI es conocida como la hipótesis del continuo. La pregunta
de si la hipótesis del continuo es cierta fue durante décadas uno de los mayores
retos de las matemáticas. La respuesta nos lleva a los límites de la lógica: Kurt
Godel y Paul Cohen demostraron que la afirmación c = NI es independiente
de los axiomas de Zermelo-Fraenkel, de la misma forma que el axioma de las
paralelas es independiente del resto de los axiomas de la geometría euclídea.
Existen modelos en los que se verifica c = NI Y existen otros modelos de la
teoría de conjuntos donde se verifica c i- NI.
A la vista de este hecho, es interesante preguntar si existen otras condiciones
(por ejemplo, del análisis) que sean equivalentes a la hipótesis del continuo.
Es natural preguntar por un ejemplo del análisis, ya que históricamente las
primeras aplicaciones importantes de la teoría de conjuntos de Cantor se die-
ron en este campo, más concretamente en la teoría de funciones complejas. A
continuación presentamos uno de estos ejemplos junto con la solución, extre-
madamente simple y elegante, encontrada por Paul Erd6s. En 1962, Wetzel
hizo la siguiente pregunta:

Sea { fa} un conjunto de funciones analíticas distintas dos a dos defini-


e e
das sobre tales que para cada z E el conjunto de valores {fa (z)}
es como mucho numerablé (es decir, es finito o numerable); llamemos
a esta propiedad (Po).
¿Es cierto que el conjunto es, a lo sumo, numerable?
Conjuntos, funciones y la hipótesis del continuo 103

poco después, Erdos demostró que, SOIlJfI~ncienternellte, la respuesta de-


pende de la hipótesis del continuo.

Teorema 5. Si e > N1 , entonces toda familia {joJ que satisface (Po) es


numerable. Si, por el contrario, e = N1 , existe alguna familia {foJ con la
propiedad (Po) que tiene tamaño c.

Para presentar la demostración necesitamos algunos hechos básicos sobre nú-


meros cardinales y ordinales. Los lectores poco familiarizados con estos con-
ceptos pueden encontrar un resumen de los resultados necesarios en el apén-
dice del final del capítulo.

111 Demostración del teorema 5. Supongamos que e> N1 . Demostraremos


que para cualquier familia {fa} de cardinal N1 de funciones analíticas existe
un número complejo Zo tal que todos los N1 valores fa (zo) son distintos. Por
tanto, si una familia de funciones satisface (Po), debe ser numerable.
Para ver esto, hacemos uso de nuestro conocimiento de los números ordina-
les. En primer lugar, ordenamos la familia {fa} de acuerdo con el ordinal
inicial W1 de N1 . Según la proposición 1 del apéndice, esto quiere decir que
el conjunto de índices recorre los números ordinales a menores que W1. A
continuación mostramos que el conjunto de pares (a, (3), a < (3 < W1, tiene
cardinal N1 . Como todo (3 < W1 es un ordinal numerable, el conjunto de pares
(a, (3), 00< (3, es numerable para cualquier (3 fijo. Tomando la unión sobre los
N1 elementos (3, deducimos de la proposición 6 del apéndice que el conjunto
de todos los pares (a, (3), a < (3, tiene cardinal N1.
Para cada par a < (3 consideramos el conjunto

8(00, (3) = {Z E ce : fa(z) = f(3(z)}.

Veamos que cada conjunto 8( a, (3) es numerable. En efecto, consideremos los


círculos C k de radio k = 1,2,3, ... centrados en el origen del plano complejo.
Si fa y f (3 son iguales en infinitos puntos de algún C ko entonces fa y f (3 son
idénticas según un conocido resultado sobre funciones analíticas. Por tanto,
fa y f (3 son iguales en un número finito de puntos de cada Ck y, por tanto,
en una cantidad como mucho numerable de puntos en todo el plano. Ahora
definimos 8 := Ua<(3 8(00, (3). De nuevo, según la proposición 6, se tiene que
8 tiene cardinal N1 , ya que cada conjunto 8(00, (3) es numerable. Llegamos
ahora al punto clave: como ce tiene cardinal e y, por hipótesis, e es mayor que
N1 , existe un número complejo Zo que no está en 8 y, para Zo los N1 valores
fa (zo) son distintos.

Supongamos ahora que e = N1. Consideremos el conjunto D S;;; ce de números


complejos p + iq con parte real e imaginaria racional. Como para cada p
el conjunto {p + iq : q E Q} es numerable, sabemos que D es numerable.
Además, D es un conjunto denso en ce: cualquier disco abierto del plano
complejo contiene puntos de D. Sea {za : O ::; a < W1} un buen orden de ce.
Construiremos una familia {f(3 : O ::; (3 < W1} de N1 funciones analíticas
distintas tales que

!(3(Za) E D siempre que a < (3. (1)


104 Conjuntos, funciones y la hipótesis del continuo

Una familia tal satisface la condición (Po). En cada Z E re tiene


un índice, digamos Z = Zú' Ahora bien, para todo (3 > a los valores {f¡3(zú)}
están en el conjunto numerable D. Como a es un ordinal numerable, las fun-
ciones f ¡3 tales que (3 :S a contribuirán a lo sumo con una cantidad numerable
de valores f¡3(zú) y, por tanto, el conjunto de todos los valores {j¡3(zú)} es
también como mucho numerable. Por tanto, si construimos una familia {f¡3}
que verifique (1), habremos concluido la demostración.
La construcción de {f¡3} utiliza inducción transfinita. Para fa podemos tomar
cualquier función analítica, por ejemplo fa = constante. Supongamos que
ya hemos construido f ¡3 para todo (3 < r' Como r es un ordinal numerable,
podemos reordenar {f¡3 : O :S (3 < r} en una sucesión gl, g2, g3, . . .. La
misma reordenación de {Za : O :S a < r} nos proporciona una sucesión
W1, W2, W3, .... A continuación construimos una función f-y que satisface para
todo n las condiciones
y (2)

La segunda condición nos asegura que todas las funciones f'Y (O :S r < W1)
son distintas, y la primera es exactamente (1), lo que implica (Po) como hemos
visto anteriormente. Obsérvese que la condición f'Y (w n ) -=1=- gn (w n ) es una vez
más un argumento de diagonalización.
Para construir f'Y escribimos
f'Y(z) ca + c1(Z -wd + c2(Z - wd(z - W2)
+ c3(Z - wd(z - W2)(Z - W3) + ....

Si r es un ordinal finito, entonces f'Y es un polinomio y, por tanto, analítica, y


podemos escoger números Ci para los que se satisfaga (2). Si r es un ordinal
numerable, entonces
00

f'Y (z) L cn(z - W1)'" (z - w n ). (3)


n=O

Obsérvese que los valores de Cm (m 2: n) no influyen en el valor f'Y(w n ) y,


por tanto, podemos elegir los Cn paso a paso. Si la sucesión (cn) tiende a O su-
ficientemente rápido, entonces (3) define una función analítica.
Finalmente, como D es un conjunto denso, podemos elegir la sucesión (cn)
de forma que f'Y verifique las condiciones de (2), lo que completa la demos-
tración. D

y
Comenzaremos preguntando si para cada número cardinal existe un siguiente.
Como primer paso veamos que, dado un cardinal m, siempre existe un cardi-
nal n mayor que m. Para ello utilizamos de nuevo una versión del proceso de
"Una leyenda sobre San Agustín cuenta diagonalización de Cantor.
que, mientras caminaba por una playa y Sea M un conjunto. Veamos que el conjunto P(M) de todos los subconjun-
contemplaba el infinito, vio un niño que tos de M tiene cardinal mayor que M. La aplicación que envía m E M a
intentaba vaciar el océano con una pe- {m} E P (M) demuestra que M se puede poner en correspondencia biyectiva
queña concha . .. " con un subconjunto de P(M), que es la definición de que ¡M¡ :S ¡P(M)¡.
Conjuntos, funciones y la hipótesis del continuo 105

Nos por demostrar que no existe entre P(IIIr) y un


subconjunto de M. Supongamos que esto es falso y sea cp : --+ P(M)
una biyección de N c;: M en P(M). Consideremos el subconjunto U c;: N
de todos los elementos de N que no están contenidos en su imagen por cp, es
decir, U == {m E N : m ti- cp(m)}. Como cp es una biyección, existe u E N
tal que cp(u) = U. Pero ahora ¡tanto u E U como u ti- U resultan imposibles!
En si u E U, entonces u ti- cp (u) = U según la definición de U, en
tanto que si u ti- U = cp (u), entonces u E U, Y llegamos a una contradicción.
Es probable que el lector haya visto este argumento anteriormente. Es el viejo
enigma del barbero: "Existe un barbero que afeita a todos los hombres que no
se afeitan a sí mismos. ¿Se afeita el barbero a sí mismo?"
Para continuar señalamos algunas otras importantes ideas debidas a Cantor:
los conceptos de conjuntos ordenados y números ordinales. Un conjunto M
está ordenado por < si la relación < es transitiva y, para cualesquiera dos
elementos a i=- b de M, se tiene que a < b o que b < a. Por ejemplo, podemos
ordenar N de la forma usual, N = {l, 2, 3, 4, ... }, pero, por supuesto, también
podemos ordenar N al revés, N = { ... , 4, 3, 2, l}, o enumerar primero los
números impares y después los pares, N = {l, 3, 5, ... , 2, 4, 6, ... }.
He aquí el concepto clave. Se dice que un conjunto ordenado M está bien
ordenado si todo subconjunto no vacío de M tiene un primer elemento. Por
tanto, los órdenes primero y tercero de N considerados anteriormente son bue-
nos órdenes, pero el segundo no lo es. El importante teorema del buen orden,
que es una consecuencia de los axiomas (incluido el axioma de elección), dice
que todo conjunto M admite un buen orden. En adelante, sólo consideraremos
conjuntos en los que se ha definido un buen orden.
Diremos que dos conjuntos bien ordenados M y N son similares (o del mismo Estos dos conjuntos bien orde-
tipo de orden) si existe una biyección cp de M en N que respeta la ordenación, nados, N {l, 2, 3, 4, .. .} y
es decir, tal que m <!VI n implica que cp(m) <N cp(n). Obsérvese que N {1,3,5, ... ,2,4,6, ... } no
cualquier conjunto ordenado que es similar a un conjunto bien ordenado está son similares: el primer orden tiene
también bien ordenado. un solo elemento que carece de uno
La similaridad es obviamente una relación de equivalencia y, por tanto, pode- inmediatamente anterior, en tanto que
mos hablar del número ordinal a definido por una clase de conjuntos similares. el segundo tiene dos.
Para conjuntos finitos, dos órdenes cualesquiera son buenos órdenes similares,
y utilizamos de nuevo el número ordinal n para la clase de los conjuntos con
n elementos. Obsérvese que, por definición, dos conjuntos similares tienen
igual cardinal. Por tanto, tiene sentido hablar del cardinallal de un número
ordinal a. Obsérvese también que cualquier subconjunto de un conjunto bien
ordenado está bien ordenado según el orden inducido.
Igual que hicimos con los números cardinales, ahora comparamos dos núme-
ros ordinales. Sea M un conjunto bien ordenado y m E M. Llamamos a
Mm = {X E M : X < m} el segmento (inicial) de M determinado por m; N
es un segmento de M si N = Nlm para algún m. En particular, Mm es el con-
junto vacío cuando m es el primer elemento de M. Consideremos ahora los
números ordinales f.1> y v de los conjuntos bien ordenados M y N. Se dice que El número ordinal de {l, 2, 3, ... }
f.1> es menor que v, f.1> < v, si M es similar a un segmento de N. Aquí también es menor que el número ordinal de
se tiene la propiedad transitiva y f.1> < v, v < 1f implica que f.1> < 1f, ya que una {l, 3, 5, ... ,2,4,6, ... }.
aplicación que respeta el orden transforma un segmento en un segmento.
106 Conjuntos, funciones y la hipótesis del continuo

Es evidente que, para conjuntos finitos, m < n conserva su sentido usual.


Sea W el número ordinal de N = {l, 2, 3, 4, ... } con la ordenación usual.
Considerando el segmento N n +1 se deduce que n < w para todo n finito.
Veamos que w :::; a para todo número ordinal infinito a. En efecto, si el
conjunto infinito bien ordenado M tiene número ordinal a, entonces M con-
tiene un primer elemento mI, el conjunto NI\ {mI} contiene un primer ele-
mento m2, M\ {mI, m2} contiene un primer elemento m3. De esta forma
se construye la sucesión mI < m2 < m3 < ... de elementos de NI. Si
M = {mI, m2, m3, ... }, entonces M es similar a N y, por tanto, a = w. Si,
por el contrario, M\ {mI, m2, ... } es no vacío, contiene un primer elemento
m, de donde se deduce que N es similar al segmento Mm, que es la definición
dew < a.
Presentamos ahora (sin incluir las demostraciones, que no son difíciles) tres
resultados básicos sobre números ordinales. El primero dice que cualquier
número ordinal p tiene un conjunto bien ordenado W,u como representante
"canónico" .

Proposición 1. Sea p un número ordinal y sea W,u el conjunto de números


ordinales menores que p. Entonces se verifica que:
(i) Los elementos de W,u son comparables dos a dos.
(ii) Si ordenamos W,u de acuerdo al tamaño, entonces W,u está bien ordenado
y tiene número ordinal p.

Proposición 2. Dos números ordinales cualesquiera p y v verifican una y


sólo una de las relaciones p < v, p = v Ó p > v.

Proposición 3. Todo conjunto de números ordinales (ordenado de acuerdo al


tamaño) está bien ordenado.

Tras esta excursión a los números ordinales volvemos a los números cardina-
les. Sea m un número cardinal y sea Om el conjunto de los números ordinales
p tales que Ipl = m. De acuerdo con la proposición 3, existe un menor nú-
mero ordinal Wm en Om, al que llamamos número ordinal inicial de m. Como
ejemplo, w es el número ordinal inicial de ~o. Tras estos preparativos, ya po-
demos demostrar un resultado básico para este capítulo.
Proposición 4. Para todo número cardinal m existe cierto número cardinal
siguiente mayor que m .

• Demostración. Ya sabemos que existe algún número cardinal mayor n.


Sea JC el conjunto de los números cardinales mayores que m y menores o
iguales que n. A cada,p E JC le asociamos su número ordinal inicial wp. De
entre estos números iniciales elegimos el menor (el cual sabemos que existe
por la proposición 3), y el correspondiente número cardinal es el menor de JC
y, por tanto, el número cardinal siguiente a m que buscábamos. D

Proposición 5. Sea M un conjunto infinito de cardinal m y bien ordenado con


respecto al número ordinal inicial wm . Entonces M no tiene último elemento.
Conjuntos, funciones y la hipótesis del continuo 107

• Demostración. En efecto, si M tuviera un último elemento m, entonces el


segmento Mm tendría un número ordinal IL < Wm tal que IILI = m, lo que
contradice la definición de W m . O

Para terminar, lo que necesitamos es una ampliación considerable del resul-


tado de que la unión de una cantidad numerable de conjuntos numerables es
tamLién numerable. En el siguiente resultado consideramos familias arbitra-
rias de conjuntos numerables.

Proposición 6. Supongamos que {A,,} es una familia de tamaño m de con-


juntos numerables Aa> donde m es un cardinal infinito. Entonces, la unión
U Aa tiene tamaño menor o igual que m.
a

• Demostración. Podemos suponer que los conjuntos Aa son disjuntos dos


a dos, ya que esto sólo puede aumentar el tamaño de la unión. Sea NI tal que
IMI = m el conjunto de índices y consideremos su buen orden de acuerdo
al número ordinal inicial W m . A continuación reemplazamos cada a E NI
por un conjunto numerable Ba~ {b a1 = a,b a2 ,ba3 , ... }, ordenado con
respecto a w, y denotamos por M al conjunto obtenido. Entonces, M es de
nuevo un conjunto bien ordenado si definimos bai < bf!L cuando a < (3 y
bai < baj cuando i < j. Sea ¡L el número ordinal de M. Como M es un
subconjunto de M, se tie~ que IL :::; ¡L según el argumento anterior. Si IL = ¡L,
entonces M e~imilar a NI, en tanto que si IL < ¡L, entonces M es similar a un
segmento de M. Ahora bien, como la ordenación Wm de NI no tiene último
elemento (proposición 5) vemos que, en ambos casos, M es similar a la unión
de conjuntos numerables B{3 y, por tanto, tiene el mismo cardinal.
El resto es sencillo. Sea r.p : UB{3 ---+ M una biyección y supongamos que
r.p(B{3) = {al,a2,a3,.··}. Reemplazamos cada ai por Aai y considera-
mos la unión U Aai' Como U Aai es la unión de una cantidad numerable de
conjuntos (y, por tanto, numerable), se tiene que B{3 tiene el mismo tamaño
que U Aai' En otras palabras, existe una biyección entre B {3 y U Aai para
todo (3 y, por tanto, una biyección 'Ij; entre U B{3 y U Aa. Finalmente, 'lj;r.p-l
es la biyección buscada entre M y U A", con lo que IU Aa I = m. O

[1] L. E. J. BROUWER: Beweis der Invarianz der Dimensionszahl, Math. Annalen 70


(1911), 161-165.
[2] N. CALKIN & H. WILF: Recounting the rationals, Amer. Math. Monthly 107
(2000),360-363.
[3] P. COHEN: Set Theory and the Continuum Hypothesis, W. A. Benjamin, New York
1966.
[4] P. ERDOS: An interpolation problem associated with the continuum hypo-
thesis, Michigan Math. J. 11 (1964), 9-10.
[5] E. KAMKE: Theory of Sets, Dover Books 1950.
[6] M. A. STERN: Ueber eine zahlentheoretische Funktion, Journal für die reine und
angewandte Mathematik 55 (1858), 193-220.
108 del continuo

"Una infinidad más de cardinales"


En el ámbito del análisis abundan las desigualdades, como bien se refleja en el
famoso libro de Littlewood y Pólya, que lleva precisamente por título
"Desigualdades". Veremos dos de las más básicas, con dos aplicaciones para
cada una, y conoceremos la opinión de George Pólya (colaborador de honor
en El Libro) sobre cuáles son las demostraciones más apropiadas.
Nuestra primera desigualdad se atribuye tanto a Cauchy como a Schwarz, e
incluso a Buniakowski:
TeoremaI ~ .... ,,.~;~..."'~'" de L~m(~!'n'-SchwlliJ'Z
Sea b) un producto interno en un espacio vectorial real V (con norma
[a[2 := a)). Entonces

se cumple para todos los vectores a, b E V. La igualdad se da si y sólo si a y


b son linealmente dependientes .

• Demostración. La siguiente demostración, de origen desconocido, es qui-


zás la más corta. Consideremos la función cuadrática

en la variable x. Podemos suponer que a i=- O. Si b = Aa, entonces es


claro que (a, b)2 = [a[2[b[2. Si en cambio los vectores a y b son linealmente
independientes, entonces se verifica que [xa+b[2 > Opara todo x, y por tanto
el discriminante (a, b)2 - [a[2[b[2 es menor que O. . O

Nuestro segundo ejemplo es la conocida desigualdad para las medias armó-


nica, geométrica y aritmética:
Teorema 11 \.LVJU"U"'" armónica, geométrica y aritmética)
Sean al, ... , an números reales positivos. Entonces
n
<

En ambos casos, se da la igualdad si y sólo si todos los ai son iguales .

• Demostración. La siguiente demostración, bella y singular, se atribuye a


Cauchy (véase [7]). Sea P(n) el enunciado de la segunda desigualdad, escrito
en la forma
al+ ... +an)n
al a2 ... an :S ( n .

!a
Para n = 2, tenemos al a2 :S (al 2 )2 ~ (al - a2)2 2: O, lo cual es cierto.
A continuación procedemos en dos pasos:
110 Aquellas maravillosas desigualdades

P(n) =? P(n - 1)

(E) P(n) y P(2) =? P(2n),

lo cual claramente implica el resultado.


n-l
Para demostrar (A), sea A:= I.: na~l' Entonces
k=l

P(n)
<

n-l
y por tanto TI ak < An - l

k=l
Para (E), vemos que

P(n)
<

La condición para la igualdad se concluye con la misma facilidad.


La desigualdad izquierda, entre la media armónica y geométrica, se sigue al
considerar l
al
, ... , ~.
an
O

111 Otra demostración. De las muchas demostraciones de la desigualdad en-


tre las medias aritmética y geométrica (la monografía [2] contiene más de 50),
resaltaremos una particularmente impactante, la de Alzer, de fecha reciente.
De hecho, esta demostración proporciona la desigualdad más fuerte

para cualquier al, ... , a n , PI, ... ,Pn positivos tales que I.:~=l Pi = 1. En
adelante, denotaremos por G la expresión de la izquierda, y por A la de la
derecha. Podemos suponer que al :s; .. , :s; ano Claramente al :s; G :s; an ,
por tanto debe existir algún k con ak :s; G :s; ak+!. Concluimos que

(1)

ya que todos los integrandos son 2: O. Al reescribir (1) obtenemos


Aquellas maravillosas desigualdades 11

donde el primer miembro es a

~ ai- G A
- -1
~P'-­
i=l 2 G G '
y el segundo miembro es igual a
n n

LPi(log ai -log G) = log afi -log G = O.


i=l i=l

Por tanto, é- 1 :::o: 0, es decir, A :::o: G. En el caso de igualdad, todas las


integrales en (1) deben anularse, lo cual implica al = ... = a n = G. D

Nuestra primera aplicación es un bonito resultado de Laguerre (véase [7])


acerca de la ubicación de raíces de polinomios.

Teorema 1. Supongamos que todas las raíces de xn + an_lX n - 1 + ... + ao


son reales. Entonces estas raíces están contenidas en el intervalo de extremos

• Demostración. Sea y una de las raíces e Yl, ... ,Yn-l las otras. Enton-
ces el polinomio es (x - y) (x - Yl) ... (x - Yn-l). Por tanto, comparando
coeficientes,

y + Yl + ... + Yn-l,
Y(Yl + ... + Yn-d + LYiYj,
i<j

y obtenemos
n-l
22 2
an-l - an -2 - Y = LY;'
i=l

Al aplicar la desigualdad de Cauchy a (Yl,' .. , Yn-d y (1, ... ,1) resulta

n-l
< (n - 1) LY; = (n - l)(a;_l - 2a n -2 - y2),
i=l
(0,2)
o
2 2an -l 2(n - 1) n- 2 2
Y + --
n
y+
n
a n -2 - --an-l :s; O.
n
En consecuencia, y (y por tanto todos los Yi) están entre las dos raíces de la
función cuadrática, y estas raíces son precisamente nuestras cotas. D

Nuestra segunda aplicación parte de una conocida propiedad elemental de las


parábolas. Consideramos la parábola descrita por f (x) = 1- X2 entre x = -1
Y x = 1. Asociamos a f (x) el triángulo tangencial y el rectángulo tangencial
de la figura. (-1, O) o (1,0)
112 Aquellas maravillosas desigualdades

Nos encontramos con que el área sombreada A = J~l (1 - x 2)dx es igual a


t,y las áreas T y R del triángulo y del rectángulo son ambas iguales a 2. Por
T 3 R 3
tanto A = "2 Y A = "2'
En un artÍCulo muy bonito, Paul Erd6s y Tibor Gallai .preguntaron qué pasa
cuando f (x) es un polinomio real arbitrario de grado n, con f (x) > O para
-1 < x < 1 Y f( -1) = f(l) = O. El área A es en este caso J~l f(x)dx.
Supongamos que en el intervalo (-1, 1) el polinomio f (x) alcanza su valor
máximo en b, de manera que R = 2f(b). Al calcular las tangentes en -1 y 1,
se verifica fácilmente (véase el recuadro) que
T = 21'(1)1'(-1)
(2)
1'(1) - 1'( -1)'
respectivamente T = O para f' (1) = l' (-1) = O.

LU"'UFiLUV tangencial es precisamente Yo, donde (xo, Yo)

es el punto de intersección entre las dos tangentes. Las ecuaciones de


dichas tangentes son Y = 1'( -l)(x + 1) e Y = 1'(l)(x - 1), por tanto

f'(l) + 1'(-1)
xo = f'(l) f'( -1)'

y en consecuencia

, (1'(1) + 1'( -1) ) 2 1'(1)1'(-1)


-1 ' v , 1 Yo = f (1) f'(l) f'(_l)-l f'(l) - f'(-l)"
2

En general, no hay cotas no triviales para 3i


y ~. Para darse cuenta de ello,
basta tomar f (x) = 1- x2n. Entonces T = 2n, A = 2~~ 1 ' Y en consecuencia
3i > n. De manera similar, R = 2 y ~ = 23~1, que se acerca tanto como
queramos a 1 cuando n tiende a infinito.
Sin embargo, tal y como demostraron Erd6s y Gallai, sí existen mejores cotas
para polinomios que sólo tienen raíces reales.
Teorema 2. Sea f (x) un polinomio real de grado n 2: 2 que sólo tiene raíces
reales, y tal que f(x) > O para -1 < x < 1 Y f( -1) = f(l) = O.
Entonces
2 2
-T < A < -R
3 - - 3 '
Y en ambos casos se cumple la igualdad solamente para n = 2.
Mathematical Reviews
Erd6s y Gallai establecieron este resultado mediante una compleja demostra-
ción por inducción. En una reseña del trabajo, que apareció en 1940 en la
Erd8s, P. and
roota. Ano, primera página de la primera edición de los Mathematical Reviews, George
Es seij(x)
f(-l)~f(I)~O, o<f(.);g¡;¡(P) für -1<x<l,
Pólya explicó cómo demostrar la primera desigualdad usando la desigualdad
wobei -1<~<1, so dilSS p. d¡e SteIle des Maximums von entre la media aritmética y la media geométrica - un ejemplo muy bello de
¡(x) im IntervaU (-1, 1) bedeutet. Dann ist
21'(1)1'(-1)
~---;g¡;
l' !(x)dx;g¡;!·2!(.),
una reseña hecha con mucho detalle, que al mismo tiempo proporciona una .
1'(1)-}'(-I) -, demostración de El Libro.
Aquellas maravillosas desigualdades 113

• Demostración de :::; A. Dado que f (x) sólo tiene raÍCes nin-


guna de ellas en el intervalo abierto ( -1, 1), se puede escribir de la forma

'--- x) + x) (3)
j

con Oí 2" 1, (3j 2" 1 - no teniendo en cuenta un factor constante positivo que
al final se cancelará. Por tanto,

- x) + x)dx.
j

Al sustituir x f-----+ -x, nos encontramos con que también

+ x) II ((3j - x)dx,
j

yen consecuencia, por la desigualdad entre la media aritmética y la geométrica


(nótese que todos los factores son 2" O)
1

A = J~[
-1
(1-x 2)II(aí- x )II((3j+x) +
' J

(1- X2) II(ai + x) II((3j - x) ]dx


i j

> J
-1
1

(1 - x2) (II (a; -



x2) II ((3; - x2)
J
r/ 2
dx

> J
-1
1

(1- X2) (II (a; - 1) II ((3; - 1)


' J
r/ 2
dx

= ~ (II(a; -1) II((3; -1)) 1/2.


i j

Calculemos f'(l) Y f'(-l). (Podemos suponer que f'(-1), 1'(1) -=J O, ya


que de otra manera T = Oy la desigualdad ~ T :S A se vuelve trivial.) Por (3)
vemos que
f'(1) = -2 -1) + 1), II((3j
j

y de manera similar que

-1) .
j

Por ende, podemos concluir que

A > ~(-f'(1)f'(-1))1/2
3 .
114 Aquellas maravillosas desigualdades

Al aplicar ahora la desigualdad entra la media aritmética y la media geométrica


a - l' (1) Y JI (1), llegamos por medio de (2) a la conclusión
2 2 4 1'(1)1'(-1) 2
A ~ - 1 1 -T
3 -f'(1) + f'(-I) 31'(1) - 1'(-1) 3 '

que es lo que queríamos demostrar. Analizando el caso de igualdad en todas


las desigualdades, el lector puede verificar fácilmente la última afirmación del
teorema. O
Queremos invitar al lector a que busque una demostración igualmente bonita
de la segunda desigualdad del teorema 2.
Era de esperar que en el análisis abundasen las desigualdades, pero he aquí un
ejemplo de la teoría de grafos donde su uso surge de manera muy inesperada.
Más adelante, en el capítulo 32, hablaremos del teorema de Turán, que en el
caso más sencillo afirma lo siguiente:
Teorema 3. Sea G un grafo con n vértices y sin triángulos. Entonces G tiene
2
como mucho ~ aristas, y se da la igualdad solamente si n es par y G es el
grafo bipartito completo K n / 2,n/2 .

• Primera demostración. Esta demostración, que saca buen partido de la


desigualdad de Cauchy, se debe a Mantel. Sea V = {1, ... , n} el conjunto de
vértices y E el conjunto de aristas de G. Denotamos por di el grado de i, de
donde ¿iEV di = 21EI (véase la página 143 del capítulo 22). Supongamos
que ij es una arista. Dado que G no tiene triángulos, nos encontramos con
que di + d j ~ n, ya que ningún vértice es vecino a la vez de i y j.
Se sigue que
L (di + dj ) ~ nlEI·
ijEE

Nótese que di aparece exactamente di veces en la suma, de manera que

ijEE iEV
Y al aplicar la desigualdad de Cauchy a los vectores (dI, ... , dn ) y (1, ... , 1),
se obtiene
nlEI ~ L d; ~ (¿ di )2 = 41E12,
n n
iEV
de donde se sigue el resultado. En el caso de la igualdad vemos que di = d j
para todo i,j, y además que di = ~ (ya que di + d j = n). Puesto que G no
tiene triángulos, de manera inmediata se sigue que G = Kn/2,n/2. O

• Segunda demostración. La siguiente demostración del teorema 3, que


usa la desigualdad entre la media aritmética y la geométrica, es realmente una
i demostración de El Libro, y a pesar de su popularidad no está claro a quién

o
atribuirla.
Sea a el cardinal de un conjunto independiente máximo A, y f3 = n-a.
Puesto que G no tiene triángulos, los vecinos de un vértice i forman un con-
junto independiente, de donde se deduce que di ~ a para todo i.
'----v,----'
di
Aquellas maravillosas desigualdades 115

El conjunto B = de cardinal f3 es incidente con cada arista de G. Al


contar las aristas de G según sus vértices extremos en B, obtenemos la relación
IEI :::; ¿iEB di. La desigualdad entre la media aritmética y la geométrica
ahora da

y de nuevo el caso de igualdad puede estudiarse fácilmente. o

[1] H. ALZER: A proof of the arithmetic mean-geometric mean inequality, Amer.


Math. Monthly 103 (1996), 585.
[2] P. S. BULLEN, D. S. MITRINOVICS & P. M. VASlé: Means and their Inequali-
ties, Reidel, Dordrecht 1988.
[3] P. ERDOS & T. GRÜNWALD: On polynomials with only real roots, Annals Math.
40 (1939), 537-548.
[4] G. H. HARDY, J. E. LITTLEWOOD & G. PÓLYA: Inequalities, Cambridge Uni-
versity Press, Cambridge 1952.
[5] W. MANTEL: Problem 28, Wiskundige Opgaven 10 (1906), 60-61.
[6] G. PÓLYA: Review of [3], Mathematical Reviews 1 (1940), 1.
[7] G. PÓLYA & G. SZEGO: Problems and Theorems in Analysis, Vol. 1, Springer-
Verlag, Berlin Heidelberg New York 1972/78; Reprint 1998.
Entre las muchas contribuciones de George Pólya al análisis, la siguiente ha
sido siempre la favorita de Erd6s, tanto por lo sorprendente del resultado como
por la belleza de la demostración. Supongamos que

es un polinomio complejo de grado n ::::: 1 con coeficiente director 1. Asocia-


mos a f(z) el conjunto

e := {z E re : If(z)1 :::; 2},


es decir, e es el conjunto de puntos cuya imagen por f está dentro del círculo
de radio 2 y centro en el origen del plano complejo. Por tanto, para n = 1 el
conjunto e es un círculo de diámetro 4.
Utilizando un argumento asombrosamente simple, Pólya demostró la siguiente
preciosa propiedad del conjunto e:

Tomemos cualquier recta L del plano complejo y consideremos la


proyección ortogonal eL del conjunto e en L. Entonces, la longitud George Pólya
total de dicha proyección es siempre menor o igual que 4.

¿ Qué quiere decir que la longitud total de la proyección eLes menor o igual
que 4? Veremos que eLes una unión finita de intervalos disjuntos h, ... , Jt
y, por tanto, la condición significa que C(h) + ... + C(Jt ) :::; 4, donde C(Jj ) es
la longitud usual de un intervalo.
Haciendo un giro del plano, vemos que es suficiente considerar el caso en que
L es el eje real del plano complejo. Teniendo en cuenta estos comentarios,
veamos el resultado de pólya.
L
Teorema 1. Sea f(z) un polinomio complejo de grado mayor o igual que 1 y
con coeficiente director 1. Sea e = {z E re : If(z)1 :::; 2} y sea R laproyec-
ción ortogonal de e sobre el eje real. Entonces, existen intervalos h, ... , Jt
de la recta real cuya unión recubre R y que satisfacen

C(h) + ... + C(It) :::; 4.

Es claro que la cota de 4 del teorema se alcanza para n = 1. Con el fin


de ganar intuición sobre el problema veamos qué ocurre con el polinomio
f(z) = z2 - 2, que también alcanza la cota de 4. Si z = x + iy es un número
complejo, entonces x es su proyección ortogonal sobre la recta real. Por tanto,

R = {x E IR : x + iY E e para algún y}.


18 Un teorema de Pólya sobre polinomios

El lector demostrar fácilmente que para el ~V'HR'UJLI"V f (z) = Z2 - 2 se


tiene x + iy E e si y sólo si

De aquí se deduce que x 4 ::; (X2 + y2)2 ::; 4X2 y, por tanto, x2 ::; 4, es decir,
Ixl ::; 2. Por otra parte, todo z = x E ~ tal que Ixl ::; 2 verifica IZ2 - 21 ::; 2,
de donde se deduce que n es el intervalo 2] de longitud 4.
Como primer paso escribimos f(z) = (z - el) ... (z - en) con ek = ak +
ib k , Y consideramos el polinomio real p(x) = (x - ad··· (x - an ). Para
z = x + iy E e, según el teorema de Pitágoras
y

y, por tanto, Ix - akl ::; Iz - ekl para todo k, es decir,

x Hemos visto que n está contenido en el conjunto P = {x E ~ : Ip( x) I ::; 2},


y si podemos demostrar que este conjunto está contenido en una familia de
intervalos de longitud total menor o igual que 4, habremos tenninado. Así,
nuestro resultado principal (teorema 1) será una consecuencia del siguiente
resultado.
Teorema 2. Sea p( x) un polinomio real de grado n ;::: 1 con coeficiente direc-
tor 1 y tal que todas sus raíces son reales. Entonces el conjunto
P = {x E ~ : Ip( x) I ::; 2} está contenido en un conjunto de intervalos
de longitud total menor o igual que 4.

Como Pólya demuestra en su artículo [2], el teorema 2 es, a su vez, una con-
secuencia del siguiente resultado, debido a Chebyshev. Para que este capítulo
sea autocontenido hemos incluido una demostración en el apéndice (siguiendo
una bonita exposición de Pólya y Szeg6).
Teorema de
Todo polinomio real p( x) de grado n ;::: 1 con coeficiente director 1 verifica
1
_~';~llp(x)1 ;::: 2n - l ·

Observemos la siguiente consecuencia inmediata.


Corolario. Sea p( x) un polinomio real de grado n ;::: 1 con coeficiente
director 1, y supongamos que Ip(x) I ::; 2 para todo x en el intervalo [a, b].
Entonces b - a ::; 4.

11 Demostración. Considérese el cambio de variable y = b~a (x a) -1. Si


x E [a, b], entonces y E 1,1]. El polinomio correspondiente
q(y) = p(b;a(y+1)+a)

tiene como coeficiente director (b;a)n y verifica

max Iq(y)1 = max Ip(x)l·


-l~y~l a~x~b
Pavnuty Chebyshev en un sello sovié-
tico de 1946
Un teorema de Pólya sobre polinomios 19

Del teorema de se deduce que

y, por tanto, b - a :S: 4, como queríamos demostrar. O

Este corolario nos deja muy cerca del resultado del teorema 2. Si el conjunto
p = {x : Ip( x) I :S: 2} es un intervalo, la longitud de P es menor o igual
que 4. Sin embargo, el conjunto P puede no ser un intervalo, como en el
ejemplo mostrado en la figura, en el que P está formado por dos intervalos.
¿Qué podemos decir sobre P? Como p(x) es una función continua, sabemos
inmediatamente que P es una unión de intervalos cerrados disjuntos 11 , h, ... ,
y que p( x) toma los valores 2 ó -2 en cada extremo de un intervalo 1j. De
aquí se deduce que hay un número finito de intervalos h, ... , ft, ya que p( x)
sólo puede tomar un valor dado un número finito de veces. Para el polinomio p( x) = x2 (x - 3) se
La maravillosa idea de Pólya fue construir otro polinomio f5( x) de grado n, tieneP = [1-V3, l]U[l+V3, ~ 3.2]
también con coeficiente director 1, Y tal que 15 = {x : 1f5( x ) I :S: 2} es un
intervalo de longitud al menos f(h) + ... + C(1t). Entonces, el corolario
demuestra que f(h) + ... + C(1t) :S: C(15) :S: 4, y hemos terminado .

• Demostración. del teorema 2. Consideremos p( x) = (x - al) ... (x - an )


con P = {x E lR : Ip(x)1 :S: 2} = hU ... U ft, donde hemos ordenado los
intervalos 1j de forma que h es el primero por la izquierda e 1t es el primero
por la derecha. La primera observación es que cualquier intervalo 1j contiene
alguna raíz de p( x ). En efecto, sabemos que p( x) toma los valores 2 ó -2 en
los extremos de 1j. Si un valor es 2 y el otro -2, debe haber una raíz en 1j.
Supongamos que p( x) = 2 en ambos extremos (el caso -2 es análogo). Sea
b E 1j un punto donde p( x) alcanza su mínimo en 1j. Entonces pi (b) = O
y p"(b) ;::: O. Si p"(b) = O, entonces b es una raíz múltiple de p'(X) y,
por tanto, una raíz de p( x) según la observación 1 del recuadro de la página
siguiente. Si, por el contrario, p" (b) > O, entonces se tiene que p(b) :S: O
según la observación 2 del mismo recuadro. Por tanto, o bien p(b) = O, Y
hemos encontrado la raíz, o bien p(b) < O, y tenemos una raíz en el intervalo
entre b y cualquiera de los dos extremos de 1j.
He aquí la idea final de la demostración. Sean 11 , ... ,1t los intervalos consi-
derados anteriormente, y supongamos que el primer intervalo por la derecha,
ft, contiene m raíces de p( x), contadas según su multiplicidad. Si m = n, en-
tonces 1t es el único intervalo (según lo que acabamos de demostrar), y hemos
terminado. Supongamos que m < n y sea d la distancia entre 1t - l e 1t (como
en la figura).
Sean bl , ... , bm las raíces de p( x) contenidas en 1t y el, ... en-m el resto de
las raíces. Escribimos p(x) = q(x )r(x), donde q(x) = (x - bl ) ... (x - bm ) h ... 1t-l 1t
y r(x) = (x - el)'" (x - en-m), y definimos Pl(X) = q(x + d)r(x). El
polinomio PI (x) es también de grado n y tiene un 1 como coeficiente director.
Para x E hU ... U 1t - l se tiene Ix + d - bil < Ix - bil para todo i y, por
tanto, Iq(x + d)1 < Iq(x)l. De aquí se sigue que

para xEhu ... U1t - l .


120 Un teorema de Pólya sobre polinomios

Si, por el contrario, x E entonces Ir(x - d)1 :::; Ir(x)1 y, por tanto,

Ipl(X d)1 = Iq(x)llr(x d)1 :::; Ip(x)1 :::; 2,

loquesignificaqueIt -d<;;;P1 ={x: Ipl(X)1 :::;2}.


En resumen, hemos visto que PI contiene a hU ... UIt -l u( It -d) y, por tanto,
su longitud es mayor o igual que la de P. Obsérvese que en el paso de p( x) a
Pl(X) los intervalos It-l e It - d se unen en un solo intervalo. Concluimos
que los intervalos h, ... , J s de PI (x) que forman PI tienen longitud al menos
f(h) + ... + f(It), y que el primer intervalo por la derecha, J s , contiene más
de m raíces de PI (x). Repitiendo este procedimiento como mucho t - 1 veces,
obtenemos un polinomio p(x) tal que 15 = {x : Ip(x)1 :::; 2} es un intervalo
de longitud f(15) 2: f(h) + ... f(It ), lo que completa la demostración. O

con

Sea p( x) un polinomio no constante que sólo tiene raíces reales.

Hecho 1. Si b es una raíz múltiple de pi (x), también es raíz de p(x).


11 Demostración. Sean b1 , ... , br las raíces de p( x) con multi-
plicidades respectivas SI, ... , S,.., donde 2::;=1 Sj = n. Como
p(x) = (x - bj )Sj h(x), se tiene que bj es una raíz de pi (x) si Sj 2: 2 y
que la multiplicidad de bj en pi (x) es Sj - 1. Además, existe una raíz
de pi (x) entre b1 y b2 , otra raíz entre b2 y b3 , ••. , y una entre br - 1 Y br ,
y todas ellas deben ser raíces simples, ya que 2::;=1 (Sj - 1) + ('1' - 1)
suma n - 1, el grado de p'(X). Por tanto, las raíces múltiples de p'(X)
son necesariamente raíces de p( x). O

Hecho 2. Se tiene p'(x? 2: p(X)p"(X) para todo x E lIt


11 Demostración. Si x = ai es una raíz de p( x), entonces no hay nada
que demostrar. Supongamos que x no es una raíz. La regla de derivación
.! del producto dice que
n n
p(x) pi (x) 1
p'(X)
x-ak
, es decir,
p(x) ¿~.
k=l k=l
Derivando de nuevo se obtiene
n
p"(x)p(x) - p'(X)2 1
p(x)2 < O. O
k=l (x - ak)2
Un teorema de Pólya sobre polinomios 121

1 ........... .
Teorema. Sea p(i) un polinomio real de grado n 2': 1 con coeficiente direc-
tor 1. Entonces .
1
_~';~llp(x)1 2': 2n - 1 '
Antes de comenzar, veamos algunos ejemplos donde se da la igualdad. En
el margen se muestran las gráficas de los polinomios de grado 1, 2 Y 3 que
alcanzan la igualdad. De hecho, veremos que hay exactamente un polinomio
en cada grado que alcanza la igualdad en el teorema de Chebyshev.

• Demostración. Sea p(x) = xn + an_1X n- 1 + ... + aa un polinomio


real y con coeficiente director 1 . Como estamos interesados en el intervalo
-1 :S x :S 1, hacemos x = cos {} y llamamos g( {}) := p( cos {}) al polinomio Los polinomios Pl (x) = X, P2 (x)
X2 - ~ y P3(X) = x 3 - ~x alcanzan la
resultante en cos {},
igualdad en el teorema de Chebyshev.
(1)

Los dos siguientes pasos de la demostración son a la vez resultados clásicos e


interesantes en sí mismos.

(A) Expresamos g( {}) como un polinomio en coseno, es decir, un polinomio


de la forma

g( {}) = bn cos n{} + bn - 1 cos( n - 1){} + ... + b1 COS {} + ba (2)

donde bk E IR., Y demostramos que el coeficiente director es bn = 2}-1'

(H) Dado cualquier polinomio en coseno h( {}) de grado n (es decir, tal que An
es el último coeficiente no nulo)

h({}) = Ancosn{}+An_lcos(n-1){}+ ... +Aa, (3)

demostramos que IAnl :S max Ih({})I, lo que, al aplicarlo a g({}), concluirá la


demostración del teorema.

Demostración de (A). Para conseguir (2) a partir de (1), tenemos que expresar
las potencias (cos {})k como polinomios en coseno. Por ejemplo, de la fórmula
para el coseno del ángulo doble

cos 2{} = cos 2 {} - sen 2 {} = 2 cos 2 {} - 1,

se deduce que cos 2 {} = ~ cos 2{} + ~. Para hacer esto con una potencia
arbitraria (cos {}) k introducimos los números complejos mediante la relación
eix = cos x + i sen x. Los números eix son los complejos de módulo 1 (véase
el recuadro sobre raíces complejas de la unidad de la página 25). En particular,
esto proporciona la igualdad

eim9 = cos n{} + i sen n{}. (4)


Por otra parte,

(5)
122 Un teorema de Pólya sobre polinomios

Igualando las partes reales de (4) y (5) se obtiene, utilizando que i 4H2 =
e
i 4f = 1 Y que sen 2 = 1 - cos 2 e,
cos mJ L: (:e) (cos 19t- 4f
(1 - cos 2 'l9)2f
f?:O
(6)
-L:( n )(cOS'l9)n-4e-2(I_Cos 2 'l9)2Hl.
e?:o 4,(i +2
Por tanto, cos n'l9 es un polinomio en cos 'l9,
cos n'l9 = cn ( cos 'l9)n + Cn-l (cos 'l9)n-l + ... + Co. (7)
A partir de (6) se obtiene que el coeficiente director es
1 se verifica para
Lk2:0 (2~)
L: (:e) + L: (4,(i:2)
n
= 2 -

todo n > O: todo subconjunto de Cn = 2n - 1


.
e?:o e?:o
{l, 2, ... , n - l} se puede asociar a un
Ahora le damos un giro total a nuestro argumento. Suponiendo por inducción
subconjunto de {l, 2, ... ,n} de tamaño
que, para k < n, (cos 'l9)k se puede expresar como un polinomio en coseno de
par si se añade el elemento n "cuando
grado k, deducimos de (7) que (cos 'l9) n se puede escribir como un polinomio
sea necesario."
en coseno de grado n con coeficiente director bn = 2nl_l'
Demostración de (B). Sea h( 'l9) un polinomio en coseno de grado n como
en (3) y supongamos, sin pérdida de generalidad, que An > O. Definiendo
m( 'l9) := An cos n'l9 se tiene que
m(~7r) = (-llAn parak=O,l, ... ,n.
Para llegar a una contradicción, supongamos que max Ih( 'l9) I < An. Entonces
m(~7r) - h(~7r) = (_l)k An - h(~7r)
es positivo si k es par y negativo si k es impar en el intervalo O S; k S; n. Se
concluye que m( 'l9) - h( 'l9) tiene al menos n raíces en el intervalo [O, 7r]. Pero
esto es imposible ya que m( 'l9) - h( 'l9) es un polinomio en coseno de grado
n - 1, que se puede escribir como en (1) y que tiene, por tanto, como mucho
n - 1 raíces.
Esto concluye la demostración de (B) y del teorema de Chebyshev. D
Ahora es fácil completar el análisis, demostrando que gn ('l9) := 2nl_l COS n'l9
es el único polinomio en coseno de grado n y con coeficiente director 1 que
alcanza la igualdad max Ig( 'l9) I = 2nl_l'
Los polinomios T n (x) = cos n 'l9, x = cos 'l9, se conocen como polinomios de
Chebyshev (de primera especie); por tanto, 2nl_l Tn(x) es el único polinomio
de grado n con coeficiente director 1 que alcanza la igualdad en el teorema de
Chebyshev.

[1] P. L. CEBYCEV: (Euvres, Vol. l, Acad. Imperiale des Sciences, St. Peters-
burg 1899, pp. 387-469.
[2] G. PÓLYA: Beitrag zur Verallgerneinerung des Verzerrungssatzes auf rnehifach
zusarnrnenhiingenden Gebieten, Sitzungsber. Preuss. Akad. Wiss. Berlin (1928),
228-232; Collected Papers Vol. l, MIT Press 1974,347-351.
[3] G. PÓLYA & G. SZEGO: Problerns and Theorerns in Analysis, Vol. 1I, Springer-
Verlag, Berlin Heidelberg New York 1976; Reprint 1998.
En 1943, Littlewood y Offord demostraron el siguiente resultado mientras tra-
bajaban en la distribución de raÍCes de ecuaciones algebraicas:

Sean al, a2, ... ,a n números complejos con Iai I 2: 1 para todo i,
y consideremos los 2n combinaciones lineales 2:7=1 Eiai tales que
Ei E {1, -1}. Entonces el número de sumas 2:7=1 Eiai contenidas
en el interior de cualquier circunferencia de radio 1 no es mayor que
2n
e fo log n para alguna constante e > O.

Unos años más tarde, Paul Erd6s mejoró esta cota eliminando el término log n,
pero lo que aún es más interesante, pudo demostrar que esta afirmación es una
sencilla consecuencia del teorema de Spemer (véase página 151).
Para hacerse una idea de este argumento, consideremos el caso en el que todos
los ai son reales. Podemos incluso suponer que todos ellos son positivos,
cambiando ai por -ai Y Ei por -Ei cuando ai < O. Suponemos ahora que un
conjunto de combinaciones 2: Eiai está contenido en el interior de un intervalo John E. Littlewood
de longitud 2. Sea N = {1, 2, ... ,n} el conjunto total de índices. Para cada
2: Eiai ponemos 1 := {i E N : Ei = 1}. Ahora, si 1 ~ I' para dos de estos
conjuntos, concluimos que

¿E~ai - ¿Eiai = 2 ¿ ai 2: 2,
iEI'\I
El teorema de "'I""AlI""'. El tamaño de
una cóntradicción. Por tanto, los conjuntos 1 forman una anticadena, y por el cualquier anticadena de subconjuntos
teorema de Spemer hay como mucho (Ln/2J) de aquellas combinaciones. De de un conjunto de n elementos es como
la fórmula de Stirling (véase página 11) se sigue que
mucho (Ln/2J)'
para algún e > O.

Si n es par y todos los ai = 1, obtenemos (n/2) combinaciones 2:7=1 Eiai


que suman O. Fijándonos en el intervalo ( -1, 1), concluimos que este número
binomial nos da la cota exacta.
En el mismo artículo, Erd6s conjeturó que (L n/2 J) era la cota correcta también
para números complejos (sólo consiguió demostrar e 2nn-1/2 para alguna
constante e), y además que la misma cota es válida para vectores al, ... , a n
con lail 2: 1 en un espacio de Hilbert real, si reemplazamos la circunferencia
de radio 1 por una bola abierta de radio l.
Erd6s estaba en lo cierto, pero tuvieron que pasar veinte años hasta que tanto
Gyula Katona como Daniel Kleitman dieran, de manera independiente, con
124 Sobre un lema de Littlewood y Offord

una demostración para los números complejos (o, lo que es lo mismo, para el
plano ]R2). Sus demostraciones usaron de manera explícita que el plano tiene
dimensión 2, y no quedaba claro en absoluto cómo extender su resultado para
el caso de espacios vectoriales reales de dimensión finita.
Entonces, en 1970 Kleitman demostró toda la conjetura en espacios de Hilbert
mediante un argumento de asombrosa sencillez. De hecho, demostró aún más.
Su argumento es un todo un ejemplo de lo que se puede conseguir con la
hipótesis de inducción adecuada.
Unas palabras de ánimo para los lectores que no están familiarizados con los
espacios de Hilbert: No los necesitamos realmente. Ya que sólo trataremos
con un número finito de vectores aí, basta considerar el espacio vectorial
real]Rd con el producto escalar usual. He aquí el resultado de Kleitman.

Teorema. Sean al, ... , a n vectores en ]Rd, cada uno de longitud por
lo menos 1, y consideremos k regiones abiertas R l , ... , Rk de ]Rd,
de manera que Ix yl < 2 para cualesquiera x, y contenidos en la
misma región Rí.
Entonces el número de combinaciones lineales I:7=l Siai, de modo
que Si E {1, -1}, que pueden estar dentro de la unión Ui Ri de las
regiones es como mucho la suma de los k mayores coeficientes bino-
miales (~).
En particular, para k = 1 obtenemos la cota (Ln/2J).

Antes de pasar a la demostración, notaremos que la cota es ajustada para la


elección de vectores

al = ... = an = a = (l,O, ... ,O)T.

En efecto, para n par obtenemos (n/2) sumas igual a O, (n/~-l) sumas igual
a (-2)a, (n/~+1) sumas igual a 2a, y así sucesivamente. Eligiendo bolas de
radio 1 alrededor de

(-2)a, 0, 2a, 2l k;l Ja,


obtenemos

sumas contenidas en estas k bolas. Esta es la expresión que buscamos, ya que


los coeficientes binomials mayores se hallan en el centro (véase página 12).
Podemos razonar de manera similar para n impar.

• Demostración.. Podemos suponer sin pérdida de generalidad que todas las


regiones Ri son disjuntas, y esto es lo que haremos a continuación. La clave de
la demostración es la recursión característica de los coeficientes binomiales, ya
que nos proporciona una relación entre los mayores coeficientes binomiales de
n y n - 1. Para verlo, ponemos r = l n-~+1 J y s = l n+~-l J, de manera que
Sobre un lema de Littlewood y Offord 125

(~), (r~l)' ... , G) son los k mayores coeficientes para n. Ahora la recursión
G) = (n~l) + G~;) implica que

t(n~l)+t(~~n
1,=7' 'l,=T

~ (n ~ 1) + .I (n -1)
1 (1)

itl (n ~ 1) +~ (n ~ 1),
y un cálculo fácil nos muestra que la primera expresión suma los k+ 1 mayores
coeficientes binomiales (n~ 1 ), y la segunda los k - 1 mayores.
La demostración de Kleitman sigue un razonamiento por inducción sobre n,
siendo el caso n = 1 trivial. Teniendo en cuenta (1), para el paso de inducción
sólo tenemos que demostrar que las combinaciones lineales de al, ... , a n
que están en k regiones disjuntas se corresponden de manera biyeetiva con
combinaciones de al, ... ,an-l que están en k + 1 ó k - 1 regiones.

nr.m{j!czórm. Por lo menos una de las regiones trasladadas Rj - a n


es disjunta de todas las regiones trasladadas Rl + an, ... ,Rk + an0

Para verlo, consideramos el hiperplano H = {x : (a n , x) = e} ortogonal


a an, que contiene a todas las regiones trasladadas Ri + a n en el lado dado
por (a n , x) ~ e, y que está en contacto con la adherencia de alguna región,
por ejemplo Rj + an0 Tal hiperplano existe porque las regiones son acotadas.
Ahora se cumple Ix - yl < 2 para cualquier x E Rj e yen la adherencia
de Rj, porque Rj es abierta. Queremos demostrar que Rj - a n está en el lado
contrario de H. Supongamos, por el c~ntrario, que (a n , x - an) ~ e para
algún x E Rj, esto es, (a n , x) ~ la n l2 + e. H
Sea y + a n un punto donde H está en contacto con Rj + a n . Entonces y está
en la adherencia de R j , y (a n , y + an) = e, esto es, (a n , -y) = la n l2 - C.
Por tanto
(a n , x - y) ~ 21an12,
y deducimos de la desigualdad de Cauchy-Schwarz que

Obtenemos pues (usando lanl ~ 1) que 2 :S 21a n l :S Ix - yl, lo cual es


una contradicción.
Lo demás es fácil. Clasificamos las combinaciones ¿ Eiai que están en la
unión Rl U ... U Rk de la manera siguiente. En la clase 1 agrupamos a to-
das las sumas ¿~=l Eiai con En = -1 Y todas las sumas ¿~=l Eiai con
En = 1 que están en Rj, Y en la clase 2 agrupamos las demás combinaciones
¿~=l Eiai con En = 1 que no están en Rj. Concluimos que las combinacio-
nes ¿~:ll Eiai de la clase 1 están contenidas en las k + 1 regiones disjuntas
Rl + a n , . .. , Rk + a n y Rj - an, y que las combinaciones ¿~:ll Eiai de
126 Sobre un lema de Littlewood y Offord

la clase 2 están en las k - 1 regiones disjuntas Rl - an, ... ,Rk - a n sin


Rj - an' Por inducción, la clase 1 contiene como mucho 2:::=r~l (n~l)
combinaciones, mientras que la clase 2 contiene como mucho 2::::::; (n~l)
combinaciones - y por (1) esto ya es toda la demostración, tal y como está
recogido en El Libro. D.

[1] P. ERDOS: On a lemma of Littlewood and Offord, Bulletin Amer. Math. Soco 51
(1945), 898-902.
[2] G. KATONA: On a conjecture of Erdffs and a stronger form of Sperner's
theorem, Studia Sci. Math. Hungar. 1 (1966), 59-63.
[3] D. KLEITMAN: On a lemma of Littlewood and Offord on the distribution of cer-
tain sums, Math. Zeitschrift 90 (1965), 251-259.
[4] D. KLEITMAN: On a lemma ofLittlewood and Offord on the distributions oflinear
combinations ofvectors, Advances Math. 5 (1970),155-157.
[5] J. E. LITTLEWOOD & A. C. OFFORD: On the number of real roots of a
random algebraic equation 1Il, Mat. USSR Sb. 12 (1943), 277-285.
¿Cuál es la fórmula más interesante que involucra funciones elementales? En
su bonito artículo [2], cuya exposición seguiremos bastante de cerca, Jürgen
Elstrodt nos propone como un primer candidato el desarrollo en fracciones
parciales de la función cotangente:

1 00 1 1
'ircot'irX = - + (-- + --) (x E ffi.\Z).
X n=l X + n x-n

Esta fórmula tan elegante fue probada por Euler en el § 178 de su Introductio
in Analysin Injinitorum del año 1748, y ciertamente es uno de sus hallazgos
más bellos. Se puede escribir de manera todavía más elegante como
N 1
'ir cot 'irX lim "" - - (1)
N-+oo L-,¡ X + n
n=-N

pero hay que tener en cuenta que la evaluación de la suma ¿nEZ x~n es un
tanto delicada, ya que tan solo es condicionalmente convergente. Por tanto, su
valor depende del orden en que se sume. Gustav Herglotz
Deduciremos (1) mediante un argumento asombrosamente sencillo, que se
atribuye a Gustav Herglotz - el "truco de Herglotz." Para empezar, ponemos !

N 1
f(x) := 'ir cot 'ir X , g(x) := lim "" - -
N -+00 L-,¡ X + n' f(x)
n=-N
e intentamos demostrar que estas funciones tienen tantas propiedades en común
que en realidad deben coincidir.
CA) Las funciones f y g están definidas para todos los valores no enteros, y
en ellos son continuas.
Para la función f (x) = 'ir cot 'irX = 'ir ~~~ ;~ , esto es claro (véase la figura).
x
Para g(x), primero usamos la identidad _+1 x n + _1_x-n = - n }x -x 2 para reescribir
la fórmula de Euler como
1 00 2x
'ir cot 'irX ; - n=l
L
n 2 x2· (2)

Por tanto, para CA) tenemos que demostrar que para todo x ~ Z, la serie La función f (x) = 'ir cot 7TX
00 1
L
n=l
n 2 -x2

converge de manera uniforme en un entorno de x.


128 La cotangente y .el truco de Herglotz

No hay ningún problema para el primer término n = 1, o para los términos


con 2n - 1 ::; x 2 , ya que sólo hay un número finito de ellos. Por otro lado,
para n 2: 2 Y 2n -1> x 2 , esto es n 2 - X2 > (n - 1)2 > O, los sumandos
están acotados por
1 1
O < < (n-1)2'
cota que no es válida sólo para x, sino también para valores en un entorno de x.
Finalmente, el hecho de que ¿ (n-=1)2 converge (a ~2, véase la página 35)
proporciona la convergencia uniforme que necesitarnos para demostrar (A).
(B) Tanto f como 9 son funciones periódicas de periodo 1, lo cual quiere
decir que f(x + 1) = f(x) Y g(x + 1) = g(x) para todo x E ffi.\Z.
Ya que la cotangente tiene periodo 7T, vemos que f tiene periodo 1 (véase otra
vez la figura de arriba). Para 9 argumentaremos como sigue. Sea
jli
N 1

11'1
L
n=-N
x+n'
ii entonces
I
1
N 1 N+1 1
II
¡I
L
n=-N
x+1+n L
n=-N+l
x+n
1'1
1 1
gN-l (x) + -x-+-N- + -x-+-N-+-1
Por tanto, g(x + 1) = lim gN (x
N-+oo
+ 1) = lim gN-l (x) = g(x).
N-+oo

(C) Tanto f como 9 son funciones impares, lo cual quiere decir que tenemos
1 I f(-x) = -f(x) y g(-x) = -g(x) para todo x E ffi.\Z.
i
l' La función f obviamente tiene esta propiedad, y para ver que 9 también la
tiene basta observar que 9N (-x) = -gN (x).

1
Las últimas dos afirmaciones constituyen el truco de Herglotz: Primero vemos
l' que f y 9 satisfacen la misma ecuación funcional, y en segundo lugar que
h := f - 9 se puede extender de manera continua a todo IR..
1I
'
li (D) Las dos funciones f y 9 satisfacen la misma ecuación funcional:
1 f(~)+f(X!1)=2f(x) y g(~)+g(xtl)=2g(x).
Fórmulas de adición:
1:
1 sen(x + y) = senx cosy + cosx seny Para f (x) esto se sigue de los teoremas de adición para el seno y coseno:
cos(x + y) = cosxcosy - senxseny
===} sen(x + ~) = cos x 7T [COS 1r2X _ sen 1f2X ]

cos(x+~) = -senx f(~) + f(xt 1 ) sen 1r X cos 1r X


2 2
sen x = 2 sen ~ cos ~ cos(1rX + 1rX)
cosx = cos 2 ~ - sen2 ~. 27r 2 2 2 f(x).
sen (1r2X + 1r X)
2

La ecuación funcional para 9 se sigue de


La cotangente y el truco de Herglotz 129

lo cual a su vez es consecuencia de

-_. 1
3'. + n
2
+ 1
--;-c;---
x+I
2
+n 2 (-x +-12n+ x + 2n1)
+1
.
Ahora examinaremos la función

1 ¿oo__ 2x )
h(x) = f(x) - g(x) = JrcotJrX - ( -x - . (3)
n 2 - x2
n=l

Llegados a este punto, ya sabemos que h es una función continua en ffi.\Z que
satisface las propiedades ¿Qué le pasa en los valores enteros? A
partir de los desarrollos del seno y del coseno, o aplicando dos veces la regla
de l'Hospital, hallamos que x3 x7
sen x =x- 3T + 5T -
::r;5
7! ± ...
x cosx - senx
lim (cotx
x->O
-~)
X
lim
x->O xsenx
o,
y por tanto también

1im ( Jr cot JrX


x->O
1)
;;
=
- O.

Pero puesto que la suma L~=I n}::x 2 en (3) converge a O si x -----+ O, tenemos
de hecho que lim h( x) = O, Y por tanto por la periodicidad que
x->O

lim h(x) = O para todo n E Z.


x->n

Resumiendo, hemos demostrado lo siguiente:

(E) Al definir h(x) := O para x E Z, la función h es continua en todo ffi. y


tiene las propiedades (B), (e) Y (D).

Ya estamos en posición de dar el golpe de gracia. Puesto que h es una función


periódica y continua, tiene un máximo m. Sea Xo un punto en [0,1] tal que
h(xo) = m. De (D) deducimos que
h( x20) + h( XOiI) = 2m,

y por tanto que h( X20) = m. Iterando, obtenemos h( ~~) = m para todo n, y


por tanto h(O) = m por continuidad. Pero h(O) = O, Y por tanto m = O, esto
es, h(x) .:::; O para todo x E R Ya que h(x) es una función impar, h(x) < O
es imposible, y por ende h(x) = O para todo x E ffi., Y hemos demostrado el
teorema de Euler. O
Entre los muchos corolarios que son consecuencia de (1), los más famosos son
los que tratan de los valores de la función zeta de Riemann en enteros pares
positivos (véase el apéndice al capítulo 6),
1
¿
00

((2k) = 2:k (k E N). (4)


n=l n

. Para acabar nuestra historia, veremos de qué manera trató Euler - unos años
más tarde, en 1755 -la serie (4). Empezamos con la fórmula (2). Al multi-
plicar (2) por x y poner y = JrX encontramos para Iyl < Jr que
130 La cotangente y el truco de Herglotz

ycoty

1- 2 000

n-l
y2
-7f2-n-2
1
-1-_-(-y-)--;'-2 .
7rn

El último factor es la suma de una serie geométrica, y por tanto


00 00 2k
ycoty 1-2~~ (:n) "
n=lk=l

1 - 2 L-,
~ ( 1
7f2k
~
L-, n 2k
1 )
y
2k
,
k=l n=l

y hemos demostrado el siguiente resultado notable:


Para todo k E N, el coeficiente de y2k en el desarrollo en serie de potencias
de y coty es
2k] 2 ~ 1
- 2 f L-, 2f =
2 (5)
[Y ycoty = -2f((2k).
7f n=l n 7f

Hay otra manera, mucho más "canónica", de obtener un desarrollo en serie de


y cot y. Sabemos del análisis que e iy = cos y + i sen y, y por tanto

e iy + e- iy éy e- iy
cosy sen y =
2 2i
lo cual conduce a
eiy + e- iy e2iy +1
y cot y iy ~y
eiY - e- iy e 2iy - 1
Ahora sustituimos z = 2iy, Y obtenemos
z eZ + 1 z z
ycoty = ---
2 e Z -1
-2 + e z -1
(6)

Por tanto, todo lo que nos hace falta es una expansión en serie de potencias de
la función e'=-l; nótese que esta función está definida y es continua en todo lPI.
(para z = O usamos la serie de la función exponencial, o de manera alternativa
la regla de l'Hospital, lo cual nos da el valor 1). Escribimos

(7)

Los coeficientes Bn son conocidos como los números de Bernoulli. El primer


miembro de (6) es una función par (esto es, f(z) = f( -z)), y por tanto vemos
que Bn = Opara n 2:: 3 impar, mientras que B 1 = - ~ corresponde al término
de ~ en (6). De

z
La cotangente y el truco de Herglotz 131

obtenemos al comparar coeficientes para zn que


n-1
'\:-:-' Bk = { 01 paran = 1,
(8)
6 k!(n - k)! para ni- 1.
ck=O
A partir de (8) podemos calcular los números de Bemoulli de manera recur- n012345678
siva. El valor n = 1 nos da Bo = 1, el siguiente valor n = 2 nos proporciona Bn 1 - ~ i O- 1
30 O 12 O-
1
30
la relación ~o + B 1 = O, de donde B 1 = -~, y así sucesivamente. Los primeros números de Bernoulli
Ahora casi hemos terminado: Al combinar (6) y (7) obtenemos
00 (2iy)2k 00 (_1)k2 2k B 2k 2k
ycoty = ¿B2k (2k)!
k=O
=
k=O
(2k)! ¿ y,

y de aquí se deduce, con (5), la fórmula de Euler para ((2k):


00 1 (_1)k-122k-1B2k 2k
~ n 2k = (2k)! 7'1 (k E N). (9)

De nuestra tabla de los números de Bemoulli obtenemos así otra vez la suma
;2
L = ~2 del capítulo 6, y además las relaciones darÍus perrpída~
commodiori modo

00 1 6917'112
¿
n=l
n 12 = 638512875'
5
El número de Bemoulli BlO = que proporciona el valor de ((10), parece
6 6'
bastante inofensivo, pero el siguiente valor B 12 = - 26i310' que necesitamos
para ((12), contiene el número primo bastante grande 691 en el numerador.
Euler había calculado unos cuantos valores (( 2k ), pero sin darse cuenta de
la conexión con los números de Bemoulli - sólo la aparición del extraño
primo 691 le puso sobre aviso.
Dicho sea de paso, puesto que ((2k) converge a 1 si k ---+ 00, la ecuación (9)
nos dice que los números IB 2k I crecen muy deprisa - algo que no es evidente
a la vista de los primeros valores.
iCios Potefiarum ipfius;r artificio
Por otra parte, sabemos muy poco sobre los valores de la función zeta de continuare licuit, quod adjurud,
R ".
Riemann en los enteros impares k 2: 3; véase la página 41.
La página 131 de la "Introductio in
Analysin Infinitorum" de Euler del año
[1] S. BOCHNER: Book review of "Gesammelte Schriften" by Gustav Herglotz, Bu- 1748
lletin Amer. Math. Soco 1 (1979), 1020-1022.
[2] J. ELSTRODT: Partialbruchzerlegung des Kotangens, Herglotz-Trick und die
Weierstraj3sche stetige, nirgends differenzierbare Funktion, Math. Semesterberi-
chte 45 (1998), 207-220.
[3] L. EULER: lntroductio in Analysin lnfinitorum, Tomus Primus, Lausanne 1748;
Opera Omnia, Ser. 1, Vol. 8. In English: lntroduction to Analysis of the lnfinite,
BookI (translated by J. D. Blanton), Springer-Verlag, New York 1988.
[4] L. EULER: lnstitutiones calculi differentialis cum ejus usu in analysifinitorum ac
doctrina serierum, Petersburg 1755; Opera Omnia, Ser. 1, Vol. 10.
Se dice que un noble francés, Georges Louis Leclerc, Conde de Buffon, pro-
puso el siguiente problema en 1777:

que se lanza una aguja corta en


¡JUJ'Jurll!u:rrtLIS

es la de que la
una de las lineas?

La probabilidad depende de la distancia d entre las líneas y también de la


longitud R, de la aguja. De manera más precisa, depende sólo de la razón ~.
Para nuestro objetivo, una aguja corta es una de longitud R, ::; d, es decir
que no puede cruzar dos líneas a la vez (y la probabilidad de que toque dos
líneas es cero). La solución al problema de la aguja de Buffon puede resultar
sorprendente, ya que involucra el número H.
Teorema ("Problema de la aguja de Buffon")
Si se lanza una aguja corta de longitud R, sobre un papel pautado con líneas
equidistantes a distancia d 2: R" entonces la probabilidad de que la aguja
caiga en una posición tal que cruce una de las líneas es

2R, El conde de Buffon


p = --o

Hd

Como consecuencia de este resultado, podemos obtener valores aproximados


de H mediante un experimento: Si lanzamos una aguja N veces, y resulta éxito
\
/ \
~
(una intersección) en P casos, entonces ~ debería ser aproximadamente ~ ~,

~~ / ,\ t
es decir, el número 2Jj'! debería ser una aproximación de H. Quizás el expe-
\ d
I ,
rimento más largo (y exhaustivo) fue llevado a cabo en 1901 por Lazzarini,
quien supuestamente llegó incluso a construir una máquina para lanzar una
I
aguja 3408 veces (con ~ = ~). Se encontró con que la aguja cruzaba una lí- "
""'-- . ----- ,/
,/

nea en 1808 ocasiones. Después de hacer las cuentas, llegó a la aproximación ,


H :=::; 2 . ~ f~g~ = 3.1415929 .... , que es correcta hasta el sexto dígito de H,
7 ~//
¡y demasiado bonita para ser verdad! (Los valores elegidos por Lazzarini con-
\
ducen a la conocida aproximación H :=::; ~i~, que apareció en la página 31.
Esto explica las más que sospechosas elecciones de 3408 y ~, cuyo producto
\
\ IR,
es un múltiplo de 355. Véase [5] para una discusión del engaño de Lazzarini.)
El problema de la aguja puede resolverse evaluando una integral. Lo haremos
más adelante, y así también resolveremos el problema para una aguja "larga".
Pero la demostración de El Libro, presentada por E. Barbier en 1860, no ne-
cesita integrales. Simplemente lanza una aguja diferente ...
134 La aguja de Buffon

Si se lanza cualquier aguja, corta o entonces el número de


cruces será
E = PI + 2P2 + 3P3 + ... ,
donde PI es la probabilidad de que la aguja cruce exactamente una línea, P2 es
la probabilidad de que cruce dos, P3 la de que cruce tres, etc. Por lo tanto, la
probabilidad de que obtengamos por lo menos un cruce, que es la que se pide
en el problema de Buffon, es

P = PI + P2 + P3 + ...
(Los sucesos en los cuales la aguja cae exactamente sobre una línea, o con
un extremo en una de ellas, tienen probabilidad cero; por tanto, pueden ser
ignorados a lo largo de la discusión del problema.)
Por otro lado, si la aguja es corta, entonces la probabilidad de obtener más
de un cruce es cero, P2 = P3 = ... = O, Y de aquí se obtiene E = p: la
probabilidad que buscamos es precisamente el número esperado de cruces.
Esta reformulación del problema es extremadamente útil, ya que ahora puede
utilizarse la linealidad de la esperanza (véase la página 84). Escribiremos E (e)
para el número esperado de cruces que se obtienen al lanzar una aguja recta
de longitud e. Si esta longitud es e = x + y, y consideramos por separado
su "parte de delante", de longitud x, y su "parte de detrás", de longitud y,
entonces obtenemos

E(x + y) = E(x) + E(y),


ya que cualquier cruce siempre se produce o bien por la parte de delante o bien
por la parte de detrás.
Por inducción sobre n, esta "ecuación funcional" implica que E(nx) = nE(x)
para todo n E N, y por tanto que mE(~x) = E(m~x) = E(nx) = nE(x).
Así, se verifica E (rx) = rE (x) para todo racional r E Q. Además, E (x) es
claramente monótona en x 2: O, de lo cual obtenemos que E(x) = ex para
todo x 2: O, donde e = E(l) es alguna constante.
Pero, ¿cuál es esta constante?
Para hallar la respuesta usaremos agujas de diferente forma. Lancemos pues
una aguja "poligonal" de longitud total eformada por segmentos de recta. El
número de cruces que se producen es (con probabilidad 1) la suma del número
de cruces que se producen en cada una de sus partes. De aquí se deduce que
el número esperado de cruces es, de nuevo,

E = ce,
por la linealidad de la esperanza. ¡Para este resultado ni siquiera importa si los
segmentos de recta están unidos de manera rígida o flexible!
La clave para la solución de Barbier al problema de la aguja de Buffon es

OOO(JO considerar una aguja que sea una circunferencia perfecta e de diámetro d,
cuya longitud es x = dlr. Si se lanza esta aguja sobre un papel pautado,
produce siempre dos intersecciones.
La circunferencia puede aproximarse mediante polígonos. hnagínese que
junto a la aguja circular e lanzamos un polígono inscrito Pn , y otro polígono
La aguja de Buffon 135

circunscrito pn. Cualquier línea que a Pn también intersecará a e,


e
y si una línea interseca a entonces también cortará a pn . Por lo tanto, los
números esperados de intersecciones satisfacen

Tanto Pn como pn son polígonos, de manera que el número esperado de


cruces es "e multiplicado por la longitud" en ambos casos, mientras que para
es 2. Por tanto,
cf!(Pn) :::; 2 :::; cf!(p n ). (1)
e
Q
o
Ahora, Pn y pn aproximan e para n ---+ oo. En particular,
lim f!.(Pn)
n-+oo
= d7r = lim f!.(p n ),
n-+oo
()
y por tanto para n ---+ 00

lo cual conduce a que e = ~ ~.


deducimos de (1) que

e d7r :::; 2 :::; e d7r,

o
o
Pero también podríamos haberlo hecho utilizando cálculo. La clave para ob-
tener una integral "sencilla" es considerar en primer lugar la pendiente de la
aguja. Supongamos que la aguja cae formando un ángulo a con la horizon-
tal, con a variando en el intervalo O :::; a :::; ~. (Ignoraremos el caso en el
que la aguja cae con pendiente negativa, ya que este caso es simétrico al de
la pendiente positiva y tiene la misma probabilidad.) Una aguja que cae con
ángulo a tiene altura f!. sen a, y la probabilidad de que cruce una de las líneas
horizontales separadas por una distancia d es Ji s':ina. De aquí obtenemos la
probabilidad calculando la media sobre los posibles valores de a: /
p ~ J
1r/2

f!.sena da = ~~ [- cosa] 1r/2 = ~~. \ /


7r
o
d 7rd o 7rd
\\
Para una aguja larga obtenemos la misma probabilidad Jis':in a
miel!tras que se
verifique f!. sen a :::; d, esto es, en el intervalo O :::; a :::; arcsen ~. Sin embargo,
para ángulos a más grandes la aguja tiene que cruzar una línea y por lo tanto
la probabilidad es 1. De aquí calcularnos, para f!. ;:::: d, que
I
2 (¡arCSen(d/Ji) f!. sen a J
1r /2
) I
p - --da + Ida
7r o d
arcsen( d/ Ji)

;:2(f!.[
d - ]arCSen(d/Ji)
cos a o + (7r2" - arcsen fd))

I+ ~ (~ (I- VI - ~:) - arcsen ~) .


La respuesta no ha resultado tan bonita para una aguja larga, pero en cam-
bio nos proporciona un problema interesante: Demuéstrese que la fórmula
da como resultado ~ en el caso f!. = d, que es estrictamente creciente como
función de f!., y que tiende a I para f!. ---+ oo.
136 La aguja de Buffon

[1] E. BARBIER: Note sur le problhne de l'aiguille et le jeu dujoint couvert, J. Mat-
hématiques Pures et Appliquées (2) 5 (1860), 273-286.
[2] L. BERGGREN, J. BORWEIN & P. BORWEIN, EDS.: Pi: A Source Book, Springer-
Verlag, New York 1997.
[3] G. L. LECLERC, COMTE DE BUFFON: Essai d'arithmétique morale, Appendix
to "HistoÍre naturelle générale et particuliere," Vol. 4, 1777.
[4] D. A. KLAIN & G.-C. ROTA: Introduction to Geometric Probability, "Lezioni
Lincee," Cambridge University Press 1997.
[5] T. H. O'BEIRNE: Puzzles and Paradoxes, Oxford University Press, London 1965.

111 :
,11,

"¿ Tiene algún problema?" I


. ..
I I

22
El principio del palomar
y el doble recuento 139
23
Tres teoremas famosos
sobre conjuntos finitos 151
24
Barajando el mazo 157
25
Caminos, retículas
y determinantes 167
26
La fórmula de Cayley
para el número de árboles 173
27
Completando cuadrados
latinos 179
28
El problema de Dinitz 185
29
Identidades y biyecciones 191

"Un cuadrado latino melancólico"


Algunos principios matemáticos, como los dos que ilustraremos en este capí-
tulo, son tan obvios que podría pensarse que sólo pueden producir resultados
igualmente obvios. Para convencerle de que esto no siempre es cierto los
ilustramos con algunos ejemplos cuya inclusión en el Libro fue sugerida por
Paul Erd6s. En capítulos posteriores encontraremos más aplicaciones de estos
principios.

Principio del pallJm~u:.


Si colocamos n objetos en r cajas y r < n, entonces al menos una de
las cajas contiene más de un objeto.

Esto es tan evidente que no hay nada que demostrar. En el lenguaje de las
aplicaciones el principio dice lo siguiente: sean N y R dos conjuntos finitos
tales que
INI = n > r = IRI,
y sea f : N ---+ R una aplicación. Entonces existe algún a E R tal que
If~l(a)1 2: 2. Es posible incluso escribir una desigualdad más fuerte: existe "El palomar a vista de pájaro"
algún a E R tal que
(1)

En efecto, en otro caso tendríamos If~l(a)1 < !f: para todo a y, por tanto,
n = L If~l(a)1 < r!f: = n, lo que es imposible.
aER

1.
Consideremos el conjunto 1,2,3, ... , 2n y tomemos
n + 1 cualesquiera.Entre ellos hay dos que son primos entre sí.

De nuevo, esto es evidente. Debe haber dos números consecutivos, y por tanto
primos entre sí.
Ahora démosle la vuelta a la afirmación.

Sea A <:;: {1, 2, ... , 2n} tal que IAI = n + 1. Existen


dos números de A tales que uno es divisor del otro.

Esto ya no es tan evidente. Según nos contó Erd6s, él propuso la cuestión al


joven Lajos Posa durante una cena, y para cuando acabaron de comer Lajos
tenía la respuesta. Se convirtió en una de las preguntas favoritas de Erd6s
140 El principio del palomar y el doble recuento

de "iniciación" a las matemáticas. El del la


respuesta (afirmativa) al problema. Escribamos cada número a E A de la
Ninguno de estos dos resultados si- forma a = 2 k m, donde m es un número impar entre 1 y 2n - 1. Como hay
gue siendo cierto al reemplazar n+ 1 n + 1 números en pero sólo n partes impares distintas, debe haber dos
por n: para ver esto, basta conside- números en A con la misma parte impar. Por tanto, uno de ellos debe ser
rar los dos conjuntos {2, 4, 6, ... , 2n} múltiplo del otro. O
y {n+l, n+2, ... , 2n}.

Este es otro de los problemas favoritos de Erdéís, que aparece en un artÍCulo


de Erdéís y Szekeres sobre problemas de Ramsey.

En cualquier sucesión al, a2," ., aTnn+l de mn +1


números reales distintos hay una subsucesión creciente
, "

,1

de longitud m + 1, o una subsucesión decreciente

de longitud n + 1, o ambas.
En esta ocasión la aplicación del principio del palomar no es inmediata. Aso-
ciemos a cada término ai el número ti, que es la longitud de la sub sucesión
creciente más larga que comienza en ai. Si ti 2': m + 1 para algún i, en-
tonces tenemos una subsucesión creciente de longitud m + 1. Supongamos,
por tanto, que ti S; m para todo i. La función f : ai f----+ ti, que transforma
{al, ... , amn+l} en {1, ... , m} nos dice, según (1), que existe algún valor
s E {1,. " ,m} tal que f(ai) = s para ":' + 1 = n + 1 términos ai. Sean
j' I
aj1' aj2' ... ,ajn+1 (JI < ... < jn+l) tales números. Analicemos dos térmi-
nos consecutivos aji' aji+1' Si aji < aji+1 obtenemos una subsucesión de
longitud s que comienza en aji+1 y, por tanto, una sub sucesión creciente de
El lector puede divertirse demostrando longitud s + 1 que comienza en aji' lo que es imposible, pues f (aji) = s. De
que para mn números la afirmación ya esta forma obtenemos una subsucesióndecreciente ajl > ajz > ... > ajn+l
no es cierta. de longitud n + 1. O

Este resultado de apariencia sencilla sobre subsucesiones monótonas tiene


consecuencias nada triviales en el concepto de dimensión de un grafo. No
necesitamos aquí la noción de dimensión para un grafo general, sino sólo
para el grafo completo Kn. Se puede enunciar de la siguiente forma. Sea
N = {1, ... , n}, n 2': 3, y consideremos m permutaciones 1l"1, . . . , 1l"m de N.
Se dice que las permutaciones 1l"i representan Kn si para cualesquiera tres nú-
meros distintos i, j, k existe una permutación 1l" en la que k aparece después
de i y j. La dimensión de Kn es el menor entero m para el que existe una
representación 1l"1, . . . ,1l"Tn'
Como ejemplo, dim(K3) = 3 ya que los tres números deben aparecer en úl-
timo lugar, como en 7fl = (1,2,3), 7f2 = (2,3,1), 7f3 = (3,1,2). ¿Qué ocurre
con K4? Obsérvese, en primer lugar, que dim(Kn ) S; dim(Kn+l): sólo hay
El principio del palomar y el doble recuento 141

que eliminar n + 1 en una o Por tanto, dim(K4) 2': 3


y, de dim(K4) = 3 tomando

7rl = 0(1, 2, 3, 4), 7r2 = (2,4,3,1), 7r3 = (1,4,3,2).

No es tan sencillo demostrar que dim(K 5 ) = 4; para valores mayores de n, 7rl: 1 2 3 5 6 7 8 91011 12 4
de forma sorprendente, la dimensión de Kn sigue siendo 4 hasta n = 12,
7r2: 2 3 4 8 7 6 5121110 9 1
en tanto que dim(K13) = 5. Parece que dim(Kn ) es una función bastante
7r3: 3 4 11112 910 6 5 8 7 2
extraña... pero no es así. Cuando n tiende a infinito, dim(Kn) es, de hecho,
una función bien conocida - y la clave para encontrar una cota inferior es el 7r4: 4 1 210 91211 7 8 5 6 3
principio del palomar. Veamos que Estas cuatro permutaciones represen-
tan K1 2
(2)

Como hemos visto que dim(Kn ) es una función monótona con respecto a n,
es suficiente demostrar (2) para n = 22P + 1, es decir, tenemos que demostrar
que

Supongamos, por el contrario, que dim(Kn ) :S p, y sean 7rl, ... ,7rP las per-
mutaciones que representan a N = {1, 2, ... ,2 2P + 1}. Ahora utilizamos
el resultado sobre sub sucesiones monótonas p veces. En 7rl existe alguna
sub sucesión monótona Al de longitud 22P - + 1, que puede ser creciente o
1

decreciente. Fijémonos en este conjunto Al en 7r2. Utilizando de nuevo el


resultado, encontramos en 7r2 alguna sub sucesión monótona A 2 e Al de lon-
2
gitud 22P - + 1, Y A 2 es, por supuesto, también monótona en 7rl. Continuando
de esta misma forma, encontramos una sub sucesión Ap de tamaño 22° + 1 = 3
que es monótona en todas las permutaciones 7ri. Si Ap = (a, b, e), entonces o
bien a < b < e, o bien a > b > e en toda 7ri. Pero esto es imposible, ya que
debe existir una permutación en la que b aparece después de a y c. O

El comportamiento asintótico correcto fue determinado por Joel Spencer (cota


superior) y por Erd6s, Szemerédi y Trotter (cota inferior):
1
dim(Kn ) = log2 log2 n + (2" + 0(1)) 10g2log210g2 n.
Sin embargo, la historia no termina aquí: muy recientemente, Morris y Ho§ten
dim(Kn) ::; 4 ~ n::; 12
encontraron un método que, en principio, puede determinar el valor exacto de
dim(Kn). Utilizando su resultado y un ordenador se pueden obtener los valo- dim(Kn ) ::; 5 ~ n ::; 81
res que mostramos al margen. ¡Esto es verdaderamente asombroso! Por ejem- dim(Kn) ::; 6 ~ n::; 2646
plo, piénsese en el número de permutaciones de 1422564 elementos. ¿Cómo dim(Kn ) ::; 7 ~ n::; 1422564
se determina si hacen falta 7 u 8 de ellas para representar K1422564?

Paul Erd6s atribuye a Andrew V ázsonyi y Marta Sved la siguiente atractiva


aplicación del principio del palomar:

Consideremos n enteros al, ... ,an , no necesariamente


distintos. Entonces, existe siempre un conjunto de elementos conse-
cutivos ak+l, ak+2,· .. ,ae cuya suma I:;=k+l ai es múltiplo de n.
142 El principio del palomar y el doble recuento

Para demostrar este hecho definimos los N = {O, 1, ... ,n} y


R = {O, 1, ... , n - 1} Y consideramos la aplicación f : N ---+ R, donde
f(m) es el resto de dividir la suma al + . " + a m entre n. Puesto que
INI = n + 1 > n = IRI, podemos asegurar la existencia de dos sumas
al + ... + ak Y al + ... + ac (k < .e) que proporcionan el mismo resto, donde
la primera suma puede ser la vacía, denotada por O. Por tanto,

i=l i=l

tiene resto O, lo que concluye la demostración. o

Pasemos ahora al segundo principio: contar de dos formas. De manera más


formal, podemos presentarlo aSÍ.

Doble recuento.
Supongamos que tenemos dos conjuntos finitos R y e y un subconjunto
S ~ R x e. Decimos que p y q son incidentes siempre que (p, q) E S.
Si r p denota el número de elementos incidentes a p E R, y cq denota el
número de elementos incidentes a q E e, entonces

I: c q• (3)
qEC

De nuevo, no hay nada que demostrar. La primera suma clasifica los pares
de S de acuerdo con su primera componente, en tanto que la segunda clasifica
los mismos pares de acuerdo con su segunda componente.
Podemos dibujar el conjunto S de una manera útil. Consideremos la matriz
A = (a pq ),la matriz de incidencia de S, cuyas filas y columnas se correspon-
den con los elementos de R y e, respectivamente, donde

apq={~
si (p, q) E S
e 1 2 3 4 5 6 7 8 si (p,q) tJ. S.
R
1 1 1 1 1 1 1 1 1
2 1 1 1 1 Con esta definición, r p es la suma de la fila p-ésima de A y c q es la suma de
3 1 1 la columna q-ésima. Por tanto, el primer término de (3) suma los elementos
4 1 1 de A (es decir, cuenta los elementos de S) por filas, en tanto que el segundo
5 1 término los suma por columnas.
6 1 El siguiente ejemplo terminará de aclarar esta correspondencia. Pongamos
7 1 R = e = {1, 2, ... , 8}, Y escogemos S = {(i,j) : i divide aj}. Se obtiene
8 1 la matriz del margen, en la cual sólo mostramos los unos.
El principio del palomar y el doble recuento 143

Obsérvese la tabla de la izquierda. La cantidad de unos en la columna j es


exactamente e1llúmero de divisores de j; denotemos este número por t(j).
Nos podemos preguntar cómo es t(j) en media cuando j toma los valores
entre 1 y n. Es decir, nos preguntamos por n 12345678
_ 1 n
t(n) = ; L t(j). t(n) I "23 :35 2 2 :37 '7
16 5
"2
j=l
Los primeros valores de t(n)'
¿Cómo de grande es t(n) para un n arbitrario? A primera vista, esta pregunta
puede parecer muy complicada. Para los números primos t(p) = 2, en tanto
que para 2k se tiene un término grande, t(2 k ) = k + 1. Por tanto, t(n) es una
función que oscila salvajemente, y podríamos conjeturar que algo parecido es
cierto para t(n). Pues no, nada más lejos de la realidad. El doble recuento
proporciona una respuesta sencilla y sorprendente.
Consideremos la matriz A (igual que antes) para los enteros de 1 a n. Con-
tando por columnas obtenemos ¿7=1 t(j). ¿Cuántos unos hay en la fila i?
Evidentemente, los unos corresponden a los múltiplos de i: li, 2i, ... , y el
mayor múltiplo menor o igual que n es lTJi. Por tanto,
_ In lnn lnn nI
t(n) = ""' tU) =
-nL..t -n L l---:-Jz ~ -nL..t
""' ---:z- = L-;-'z
j=l i=l i=l i=l

donde el error en cada sumando al pasar de lTJ a Tes menor que 1. Como
la última suma es el n-ésimo número armónico Hn, obtenemos la acotación
Hn -1 < t(n) < Hn que, junto con las estimaciones para Hn de la página 11
nos proporciona
logn-l < Hn-l-.!. < t(n) < Hn < 10gn+1.
n
Hemos demostrado un resultado notable: aunque t( n) es totalmente errática,
la media t( n) se comporta muy bien: difiere de log n en menos de l.

I 6
Sea G un grafo simple finito y sean V y E los conjuntos de sus vértices y
aristas, respectivamente. Ya definimos en el capítulo 11 el grado d( v) de
un vértice v como el número de aristas que tienen a v como extremo. En
el ejemplo de la figura, los vértices 1,2, ... ,7 tienen grados 3,2,4,3,3,2,3,
respectivamente.
2<Q :(] 3 7
Casi todos los libros de teoría de grafos comienzan con el siguiente resultado
(con el que ya nos encontramos en los capítulos 11 y 17):

L d(v) = 2\E\. (4)


vEV

Para demostrarlo, consideremos S ~ V x E, donde S es el conjunto de pares


(v, e) tales que v E V es un extremo de e E E. El doble recuento de S
proporciona, por una parte, ¿vEV d( v), ya que cada vértice contribuye con
d( v) al recuento y, por otra, 2\E\, ya que cada arista tiene dos extremos. O
144 El principio del palomar y el doble recuento

Este sencillo resultado tiene


les serán presentadas posteriormente. Queremos destacar en esta sección la
siguiente hermosa aplicación a un problema extremal en grafos. Aquí está:

Supongamos que G = (V, E) tiene n y no contiene ciclos de lon-


gitud 4 (que denotaremos por C4 ), es decir, ningún subgrafo
¿ Cuántas aristas puede tener G como máximo?

Como ejemplo, el grafo del margen tiene 5 vértices, no contiene ningún 4-ciclo
y tiene 6 aristas. Es sencillo demostrar que si el número de vértices es 5
entonces el número máximo de aristas es 6 y que, de hecho, éste es el único
grafo de 5 vértices con 6 aristas que no contiene ningún 4-ciclo.
Pasemos ahora al problema general. Sea G un grafo con n vértices y sin nin-
gún 4-ciclo. Como antes, denotamos por d( u) el grado de u. Ahora hacemos
doble recuento en el conjunto 8 de pares (u, {v, w } ), donde u es adyacente
a v y a w, de forma que v -1- w. En otras palabras, contamos las veces que
aparece

Sumando en u se tiene que 181 = I:uEV (d~u)). Por otra parte, todo par
{v, w} tiene como mucho un vecino común (debido a la ausencia de C4 ). Por
tanto, 181 :s; G), y se concluye que

o
2: d(u)2 :s; n(n - 1) + 2: d(u). (5)
uEV
A continuación, como es típico en esta clase de problemas extremales, aplica-
mos la desigualdad de Cauchy-Schwarz a los vectores (d(Ul)"'" d(u n )) y
(1,1, ... ,1), de donde obtenemos

(l:d(u)/ < nl:d(u)2,


uEV uEV

y, según (5),

(2: d(u) / < n 2(n - 1) + n 2: d(u).


uEV uEV

Utilizando (4) se deduce que

o
IEI2 - ~IEI-
2
n (n - 1) :s; O.
4
Resolviendo esta ecuación de segundo grado obtenemos el siguiente resultado,
debido a Istvan Reiman.
El principio del palomar y el doble recuento 145

Teorema. Si un graÍo G de n vértices no contiene entonces

(6)

Para n = 5 se obtiene IEI :::; 6, Y el grafo que apareció anteriormente muestra


que laigualdad es posible.
El doble recuento nos ha proporcionado, de forma sencilla, una cota superior
para el número de aristas. Pero, ¿cómo de ajustada es la cota (6) en general?
Este precioso ejemplo [2] [3] [6] muestra que es casi justa. Como ocurre fre-
cuentemente en este tipo de problemas, la geometría finita muestra el camino.

Al presentar el ejemplo suponemos que el lector está familiarizado con el


cuerpo finito ::Zp de los enteros módulo un número primo p (véase la pá-
gina 18). Consideremos el espacio vectorial tridimiensional X sobre ::Zp. A (0,0,1)
partir de X construimos el siguiente grafo Gp . Los vértices de Gp son los
subespacios de dimensión 1 [v] := {Av I A E ::Zp}, donde O i= v E X, Y dos
de estos subespacios [v], [w] están conectados por una arista si
(v, w) = V1Wl + V2W2 + V3W3 = O.
Obsérvese que no importa qué vector i= O escojamos del subespacio. En
lenguaje geométrico, los vértices son los puntos del plano proyectivo sobre ::Zp,
y [w] es adyacente a [v] si w está en la recta polar de v.
Como ejemplo, el grafo G 2 no contiene 4-ciclos y tiene 9 aristas, cerca de la
(1,0, O) (1,1,0) (0,1, O)
cota de 10 dada por (6). Veamos que esto es cierto para cualquier primo p.
En primer lugar demostraremos que Gp no tiene ningún C4 . Si [u] es un El grafo G 2 : sus vértices son las siete
vecino común de [v] y [w], entonces u es solución del sistema lineal temas (x, y, z) no nulas.

Vl x+ V2 Y + V3 Z = °
W1X + W2Y + W3Z = O.
Como v y w son linealmente independientes, sabemos que el subespacio de
soluciones tiene dimensión 1 y, por tanto, que el vecino común [u] es único.
Nos preguntamos ahora cuántos vértices tiene Gp , y hacemos otra vez doble
recuento. X contiene p3 - 1 vectores i= O. Como cualquier subespacio de
dimensión uno contiene p - 1 vectores i= O, deducimos que X tiene un total
de p:~; = p2 + p + 1 subespacios de dimensión uno, es decir, G tiene p
n = p2 + p + 1 vértices. De forma similar, cualquier subespacio de dimensión
dos contiene p2 - 1 vectores i= O y, por tanto, P:~ll = p + 1 subespacios de
dimensión uno.
Nos falta por determinar el número de aristas de Gp o, lo que es equivalente
gracias a (4), los grados de los vértices. Según la construcción de G p , los
vértices adyacentes a [u] son las soluciones de la ecuación
(7)

El conjunto de soluciones de (7) es un subespacio de dimensión dos y, por


tanto, hay p + 1 vértices adyacentes a [u]. Pero cuidado, es posible que el
mismo u sea solución de (7) y, en tal caso, hay sólo p vértices adyacentes
a [u].
146 El principio del palomar y el doble recuento

En resumen, hemos obtenido el siguiente resultado: si u está en la cónica


dada por x2 + y2 + Z2 = O, entonces d([u]) = p, y en el resto de los casos
d([u]) = p + 1. Por tanto, debemos detenmnar la cantidad de subespacios de
dimensión uno que hay en la cónica
X2 + y2 + Z2 = O.

Demostraremos el siguiente resultado dentro de un momento.


Afirmación. Hay exactamente p2 soluciones (x, y, z) de la ecuación
x2 +y2 + Z2 = Oy, por tanto, ignorando la solución (O, O, O), exacta-

mente ~~} = p + 1 vértices de grado p en G p .


Esto nos penmte completar el análisis de G p . Hay p + 1 vértices de grado p y,
por tanto, (p2 + p + 1) - (p + 1) = p2 vértices de grado p + 1. Utilizando (4)
obtenemos
(p + l)p p2(p + 1) (p + 1)2p
IEI 2 + 2 = 2
(p + l)p
(1 + (2p + 1)) = p2+ P (1 + 4p2 + 4p + 1).
4 4 .
V
Haciendo n = p2 + p + 1, la última ecuación queda
n-1
IEI = -4- (1 + v4n - 3),

que está muy cerca de la cota de (6).


Vamos ahora con la demostración de la afirmación. El siguiente argumento
es una hermosa aplicación del álgebra lineal que involucra a las matrices si-
métricas y sus autovalores. Nos encontraremos con el mismo método en el
capítulo 34, y no por casualidad: las dos demostraciones proceden del mismo
artículo de Erd6s, Rényi y Sós.
Igual que antes, representamos los subespacios de dimensión uno de X por
vectores VI, V2, ... , V p 2+p +I, de forma que dos cualesquiera de ellos son
linealmente independientes. De manera similar, podemos representar los sub-
espacios de dimensión dos con el mismo conjunto de vectores, de forma que
el subespacio correspondiente a u = (UI, U2, U3) es el conjunto de soluciones
de la ecuación UIX + U2Y + U3Z = O igual que en (7). (Por supuesto, esto
es simplemente el principio de dualidad en álgebra lineal.) Por tanto, según
(7), un subespacio de dimensión uno representado por Vi está contenido en el
sub espacio de dimensión dos representado por V j si y sólo si (Vi, V j) = O.
o 1 1 1 O O O
Consideremos la matriz A = (aij) de tamaño (p2 + p + 1) X (p2 + p + 1),
1 O 1 O 1 O O
definida de la siguiente forma: las filas y columnas de A corresponden a
1 1 O O O 1 O
VI, ... , V p 2+p+l, utilizando la misma numeración para filas y columnas, y
A= 1 O O 1 O O 1
O 1
O O
O O
1 O
1
O
O
1
1
1
a .. .
'J .
={1 si (Vi,Vj)
O en otro caso.
=0,
O O O 1 1 1 O
La matriz de G 2 Por tanto, A es una matriz real simétrica y aii = 1 si (Vi, Vi) = O, es decir,
precisamente cuando Vi está en la cónica x 2 + y2 + z2 = O. Ahora todo lo
que queda por demostrar es que
traza A p+l.
El principio del palomar y el doble recuento 147

Del álgebra lineal sabemos que la traza es a la suma de los autovalores.


y aquí viene el truco: aunque A parece complicada, la matriz A 2 es fácil de
analizar. Nos serán útiles las siguientes observaciones:

e Todas las filas de A tienen exactamente p + 1 unos. De aquí se deduce que


p + 1 es un autovalor de A, ya que Al = (p + 1)1, donde 1 es el vector
formado por unos.

@ Para dos filas cualesquiera Vi, Vj hay exactamente una columna con un 1
en ambas filas (la columna conespondiente al único subespacio generado
por Vi, Vj).

Utilizando estas observaciones obtenemos


1
p+1
pI + J,

donde I es la matriz identidad y J es la matriz formada enteramente por unos.


Ahora bien, J tiene los autovalores p2 + p + 1, de multiplicidad 1, y O, de
multiplicidad p2 + p. De aquí se deduce que los autovalores de la matriz A 2
son p2 + 2p + 1 = (p + 1)2 con multiplicidad 1 y p con multiplicidad p2 + p.
Como A es real y simétrica, es diagonalizable y, por tanto, A tiene el autovalor
p + 1 ó -(p + 1) Y p2 + p autovalores ±y'P. Según la observación 1 anterior,
el primer autovalor debe ser p + 1. Supongamos que y'P tiene multiplicidad
T y que -y'P tiene multiplicidad s, entonces

traza A = (p + 1) + Ty'P - sy'P.

y hemos terminado: como la traza es un entero, debe ocurrir que T = S y, por


tanto, traza A = p + 1. O

En 1911, Luitzen Brouwer publicó su famoso teorema del punto fijo:


Toda función continua f: En ------7 En de una bola n-dimensional en
sí misma tiene un punto fijo (algún x E En tal que f (x) = x).

Para dimensión 1, es decir, para un intervalo, este resultado es una conse-


cuencia sencilla del teorema de Bolzano, pero para dimensiones superiores la
demostración de Brouwer necesita henamientas más sofisticadas. La sorpresa
fue general cuando en 1928 el joven Emanuel Spemer (tenía entonces 23 años)
encontró un sencillo resultado combinatorio del que se pueden deducir tanto
el teorema del punto fijo de Brouwer como la invariancia de la dimensión bajo
aplicaciones biyectivas continuas. Más aún, el ingenioso lema de Spemer vino
acompañado de una demostración igualmente hermosa - simplemente doble
recuento.
Presentamos el lema de Spemer, y el teorema de Brouwer que se deduce de
él, para el primer caso interesante, es decir, para dimensión n = 2. El lector
148 El principio del palomar y el doble recuento

no debería tener dificultades para extender las demostraciones a dimensión


arbitraria (por inducción sobre la dimensión).
3
Lema de 'n."....'''..
Supongamos que un triángulo "grande" con vértices V 2 , V3 es triangu-
lado (es decir, descompuesto en un número finito de triángulos "pequeños"
pegados por sus aristas).
Supongamos que asociamos a cada vértice de la triangulación un "color" del
conjunto {1, 2, 3} de forma que Vi recibe el color i (para cada i), y que sólo
los colores i y j son utilizados para los vértices de la arista que va de a
Vi (para i i= j), mientras que los vértices interiores son coloreados de forma
arbitraria con 1, 2 o 3.
Los triángulos que tienen los vértices de Entonces en la triangulación debe encontrarse algún triángulo pequeño "tres-
tres colores distintos aparecen sombrea- coloreado ", es decir, que tiene los tres vértices de colores distintos.
dos
• Demostración. Probaremos un resultado aún más fuerte: el número de
triángulos tres-coloreados no sólo es distinto de cero, sino que es siempre im-
par. Para ello, consideremos el grafo dual de la triangulación, pero no toma-
mos todas sus aristas, sino sólo las que cruzan una arista que tiene extremos
con los colores (distintos) 1 y 2. De esta forma, obtenemos un "grafo dual
3 parcial" que tiene grado 1 en todos los vértices que corresponden a triángulos
tres-coloreados, grado 2 en los que corresponden a triángulos en los que sólo
aparecen los colores 1 y 2, Y grado O en los que corresponden a triángulos
en los que falta alguno de los colores 1 y 2. Por tanto, sólo los triángulos
tres-coloreados dan lugar a vértices de grado impar (de grado 1).
Sin embargo, el vértice del grafo dual que corresponde al exterior de la trian-
gulación tiene grado impar: en efecto, a lo largo de la arista completa que va
de V1 a V2 hay un número impar de cambios entre 1 y 2. Pero entonces hay un
2 número impar de aristas del grafo dual parcial que cruzan esta arista, mientras
que en las otras aristas del triángulo grande no pueden aparecer los colores 1
/
---0------- y 2 a la vez.
Como el número de vértices de grado impar en cualquier grafo finito es par
(según la ecuación (4», hemos demostrado que el número de triángulos pe-
queños que tienen tres colores distintos (y que corresponden a los vértices
interiores del grafo dual de grado impar) es impar. O
Utilizando este lema es sencillo demostrar el teorema de Brouwer.

• Demostración del teorema del punto fijo de Brouwe:r n = 2). Sea


6. el triángulo de ]R3 con vértices el = (1, O, O), e2 = (0,1, O) Y
e3 = (O, 0,1). Es suficiente demostrar que cualquier aplicación continua
f: 6. - + 6. tiene un punto fjo, ya que 6. es homeomorfo a la bola de dimen-
sión dos, B 2 .
Sea 6(T) la longitud de la arista más larga en una triangulación T. Es sencillo
construir una sucesión infinita de triangulaciones 'h, 72, ... de 6. tales que la
sucesión 15(~) tiene límite O. Una sucesión así se puede construir explícita-
mente o utilizando inducción, tomando por ejemplo ~+l como la subdivisión
baricéntrica de ~.
Para cada una de estas triangulaciones, definimos una 3-coloración de sus vér-
tices v haciendo A(V) := min{i : f(V)i < Vi}, es decir, A(V) es el menor
El principio del palomar y el doble recuento 149

índice i tal que la i-ésima coordenada de f (v) - v es Suponiendo


que f no tiene puntos fijos, esta coloración está bien definida. Para ver esto,
obsérvese que todo v E ,0,. está en el plano Xl + X2 + X3 = 1 y, por tanto,
¿i Vi = 1. Entonces, si f (v) =1= v, al menos una de las coordenadas de
f (v) - v debe ser negativa (y al menos una debe ser positiva).
Veamos que esta coloración verifica las condiciones del lema de Spemer. En
primer lugar, hay que asignar el color i al vértice ei, ya que la única compo-
nente de f (ei) - ei que puede ser negativa es la i-ésima. Además, si v está en
la arista opuesta a ei, entonces Vi = O y, por tanto, la i-ésima componente de
f (v) - v no puede ser negativa, de donde se deduce que a v no se le asigna el
color i.
El lema de Spemer dice ahora que en cada triangulación ~ hay un trián-
gulo 3-coloreado, es decir, existe un triángulo {V k :l , V k :2 , v k :3 } para el que
A( v k :i ) = i. La sucesión de puntos (v k :l h>l puede no ser convergente, pero
del hecho que el símplice ,0,. es compacto podemos deduir que existe alguna
subsucesión convergente. Tras reemplazar la sucesión de triangulaciones ~
por la subsucesión correspondiente (a la que, por simplicidad, también deno-
tamos por ~) sabemos que que (V k :l h converge a un punto v E ,0,.. Ahora
bien, la distancia de v k :2 y V k :3 a v k :l es menor o igual que el tamaño de la
triangulación o(~), que tiende a O. Por tanto, las sucesiones (V k :2 ) y (v k :3 )
convergen al mismo punto v.
¿Qué sabemos de f( v)? La primera coordenada f( v k :l ) es menor que la de
v k :l para todo k. Como f es continua, se deduce que la primera coordenada
de f (v) es menor o igual que la de v. El mismo razonamiento es válido para
la segunda y tercera coordenadas. Por tanto, ninguna de las coordenadas de
f (v) - v es positiva - y ya hemos visto que esto entra en contradicción con
la suposición de que f (v) =1= v. D

[1] L. E. J. BROUWER: Über Abbildungen von Mannigfaltigkeiten, Math. Annalen


71 (1912), 97-115.
[2] W. G. BROWN: On graphs that do not contain a Thomsen graph, Canadian Math.
Bull. 9 (1966), 281-285.
[3] P. ERDÓS, A. RÉNYI & V. SÓS: On a problem ofgraph theory, Studia Sci. Math.
Hungar. 1 (1966), 215-235.
[4] P. ERDÓS & G. SZEKERES: A combinatorial problem in geometry, Compositio
Math. (1935), 463-470.
[5] s. HO~TEN & W. D. MORRIS: The order dimension ofthe complete graph, Dis-
crete Math. 201 (1999), 133-139.
[6] 1. REIMAN: Über ein Problem von K. Zarankiewicz, Acta Math. Acad. Sci. Hun-
gar. 9 (1958), 269-273.
[7] J. SPENCER: Minimal scrambling sets of simple orders, Acta Math. Acad. Sci.
Hungar. 22 (1971), 349-353.
[8] E. SPERNER: Neuer Beweis für die lnvarianz der Dimensionszahl und des
Gebietes, Abh. Math. Sem. Hamburg 6 (1928), 265-272.
[9] W. T. TROTTER: Combinatorics and Partially Ordered Sets: Dimension
Theory, John Hopkins University Press, Baltimore and London 1992.
En este capítulo nos ocupamos de un tema básico de la combinatoria, en con-
creto de las propiedades y tamaños de familias especiales F de subconjuntos
de un conjunto finito N = {l, 2, ... , n}. Comencemos con dos clásicos del
área: los teoremas de Spemer y de Erdos-Ko-Rado. Estos resultados tienen en
común que fueron demostrados de nuevo muchas veces, y cada uno de ellos
dio origen a una nueva rama de la teoría de conjuntos combinatoria. Para am-
bos, la inducción parece ser el método natural, pero los argumentos que vamos
a presentar son bastante distintos, y verdaderamente geniales.
En al año 1928 Emanuel Spemer planteó y respondió la siguiente pregunta:
supongamos que tenemos un conjunto N = {l, 2, ... , n}. Se dice que una
familia F de subconjuntos de N es una anticadena si ningún conjunto de F
contiene a otro conjunto de la familia F. ¿Cuál es el tamaño de la anticadena
más grande? Claramente, la familia Fk de todos los conjuntos de cardinal k
es una anticadena, y IFk I = G). Considerando el máximo de los coeficien-
tes binomiales (véase la página 12) concluimos que existe una anticadena de
tamaño (Ln/2j) = maXk (~). El teorema de Spemer asegura que no existen
anticadenas más largas.
Teorema 1. El tamaño de la anticadena más grande de un conjunto de n Emanuel Spemer
elementos es (Ln/2j)'

• Demostración. Entre las muchas demostraciones existentes, la siguiente,


debida a David Lubell, es probablemente la más corta y elegante. Sea F una
anticadena arbitraria. Tenemos que demostrar que IFI :S (Ln/2j)' Para ello,
la idea clave es considerar cadenas de subconjuntos 0 = G o e G 1 e ... e
Gn = N, donde IGil = i para i = O, ... , n. ¿Cuántas cadenas hay? Es
claro que obtenemos una cadena añadiendo uno a uno los elementos de N y,
por tanto, existen tantas cadenas como permutaciones de N, es decir, nI. A
continuación, dado un conjunto A E F nos preguntamos en cuántas de estas
cadenas aparece. De nuevo, la respuesta es sencilla. Para ir desde 0 hasta A
hay que añadir de uno en uno los elementos de A, y para ir desde A hasta N
tenemos que añadir los elementos restantes. Por tanto, si A tiene k elemen-
tos, considerando todos estos pares de cadenas concatenadas vemos que hay
k! (n - k)! cadenas que contienen a A. Obsérvese que ninguna cadena puede
contener dos conjuntos distintos A y B de F, ya que F es una anticadena.
Para terminar la demostración, sea mk el número de subconjuntos de k ele-
mentos en F. Entonces, IFI = I:~=o mk. De la discusión precedente, se
deduce que el número de cadenas que contienen algún elemento de F es
n
L mkk!(n-k)!,
k=O
152 Tres teoremas famosos sobre conjuntos finitos

y esta expresión no puede superar a ni, la cantidad total de cadenas. Por tanto,
se concluye que
n
~ k!(n - k)! ~mk
.L.- mk < 1, o .L.- < 1.
n.I k=O G)
k=O

Invitamos al lector a comprobar que la Reemplazando los denominadores por el coeficiente binomial mayor se ob-
familia de todos los subconjuntos de tiene
~ elementos, cuando n es par, y las
dos familias de todos los subconjuntos
de n;-l elementos y de todos los sub-
es decir,
conjuntos de n~l elementos, cuando n
es impar, son las únicas anticadenas que y hemos terminado la demostración. o
alcanzan el tamaño máximo.
Nuestro segundo resultado es de naturaleza completamente distinta. De nuevo
consideramos el conjunto N = {1, ... , n}. Decimos que una familia F de
subconjuntos es unafamilia entrecruzada si dos conjuntos cualesquiera de F
tienen al menos un elemento en común. Es casi inmediato que el tamaño
de la mayor familia entrecruzada es 2n-l. Si A E F, el complementario
AC = N\A tiene intersección vacía con A y, por tanto, no puede estar en F.
De aquí se concluye que una familia entrecruzada contiene como mucho la
mitad de los 2n subconjuntos de N, es decir, IFI :S: 2n-l. Por otra parte, si
consideramos la familia de todos los conjuntos que contienen un elemento fijo,
por ejemplo la familia Fl de todos los conjuntos que contienen all, entonces
IFll = 2n- 1 , y el problema está resuelto.
Pero ahora nos hacemos la siguiente pregunta: ¿De qué tamaño puede ser una
familia entrecruzada F si todos los conjuntos de F tienen el mismo número de
elementos, digamos k? Llamaremos a tales familias familias k-entrecruzadas.
Para evitar situaciones triviales, suponemos que n ;::o: 2k, ya que en otro caso
dos conjuntos de tamaño k cualesquiera tienen intersección no vacía, y no hay
nada que demostrar. Recuperando la idea anterior, consideramos la familia Fl
de todos los subconjuntos de k elementos que contienen al 1. Es evidente
que los conjuntos de Fl se obtienen añadiendo al 1 todos los subconjuntos de
(k - 1) elementos del conjunto {2, 3, ... ,n} y, por tanto, IFll = (~=i). ¿Se
puede mejorar esto? No - y esta es la afirmación del teorema de Erdos-Ko-
Rado.

Teorema 2. El mayor tamaño de una familia k-entrecruzada en un conjunto


punto arista de n elementos es (~=i), cuando n ;::o: 2k.
\ I
Paul Erdos, Chao Ko y Richard Rado demostraron este resultado en 1938,
pero no fue publicado hasta 23 años después. Desde entonces se han encon-
trado muchas demostraciones y variantes pero el siguiente argumento, debido
a Gyula Katona, es especialmente elegante .

• Demostración. La idea clave de la demostración es el siguiente lema, que a


Una circunferencia e para n = 6. Los primera vista no parece en absoluto relacionado con nuestro problema. Consi-
segmentos en negrita forman un arco de e
deremos una circunferencia dividida por n puntos en n segmentos. Decimos
longitud 3. que un arco de longitud k está formado por k + 1 puntos consecutivos y los k
segmentos entre ellos.
Tres teoremas famosos sobre conjuntos finitos 153

Lema. Sea n :2:: 2k Y ", arcos distintos de k tales que dos


cualesquiera tienen un segmento en común Entonces t :s; k,
Para demostrar el lema, obsérvese en primer lugar que cualquier punto de O
es extremo de a 'lo más un arco, En efecto, si Ai y Aj tuvieran un extremo
común v, entonces tendrían que comenzar en direcciones distintas (ya que son
distintos). Pero entonces no podrían tener un segmento en común, ya que
n :2:: 2k, Consideremos el arco Al, Como cualquier (i:2:: 2) tiene un
segmento en común con Al, uno de los extremos de es un punto interior de
Al. Pero acabamos de ver que estos extremos deben ser distintos, y como Al
contiene k - 1 puntos interiores, se deduce que hay como mucho k - 1 arcos
adicionales y, por tanto, como mucho k arcos en totaL D

Vayamos ahora con la demostración del teorema de Erd6s-Ko-Rado, Sea F


una familia k-entrecruzada, Consideramos una circunferencia O con n pun-
tos y n segmentos en las condiciones del lema y una permutación cíclica
1f = (al, a2" .. , a n ), y escribimos los números ai en sentido horario alIado
de los segmentos de O, ¿Cuántos conjuntos A E F aparecen como k núme-
ros consecutivos en O? Como F es una familia entrecruzada, según el lema
puede haber a lo sumo k conjuntos, Ahora bien, esto es cierto para cualquier
permutación cíclica, y como hay (n -1)! permutaciones cíclicas, de esta forma
generamos como mucho
k(n - 1)!
conjuntos de F que aparecen de forma consecutiva en alguna permutación cí-
clica. ¿Cuántas veces contamos cada conjunto A E F? Muy sencillo: A apa-
rece en 1f si los k elementos de A aparecen de forma consecutiva en algún
orden, Como hay k! formas de ordenar los elementos de A, y (n k)! formas
de ordenar los restantes elementos, concluimos que un conjunto A aparece
exactamente en k!(n - k)! permutaciones cíclicas, de donde se deduce que

k (n - 1) 1 (n - 1)! (n - 1)
IFI :s; k! (n _ k)! = (k - 1)! (n - 1 - (k - 1))! = k _ l ' D

De nuevo, podemos preguntarnos si las familias que contienen un elemento


fijo son, las únicas familias k-entrecruzadas, Claramente, esto no es cierto
para n = 2k. Por ejemplo, para n = 4 Y k = 2la familia {1, 2}, {1, 3}, {2, 3}
también tiene tamaño (~) = 3, En general, para n = 2k obtenemos las
familias k-entrecruzadas maximales, de tamaño H~) = G=D, incluyendo,
para cada par de conjuntos formado por un conjunto A con k elementos y
su complementario N\A, uno cualquiera de los dos, Pero para n > 2k las
familias que contienen un elemento fijo son, de hecho, las únicas, Invitamos Una familia entrecruzada para n 4,
al lector a intentar demostrarlo, k=2

Finalmente nos ocupamos del tercer resultado, que puede ser presentado, con
bastante fundamento, como el teorema básico más importante de la teoría de
conjuntos finitos, el "teorema del matrimonio", demostrado por Philip Hall
en 1935, Con él comienza lo que hoy se conoce como teoría de empareja-
mientos, con amplias aplicaciones, algunas de las cuales se mostrarán a conti-
nuación.
154 Tres teoremas famosos sobre conjuntos finitos

Consideremos un finito X y una familia Al, . .. , de


tos de X (no necesariamente distintos). Diremos que una sucesión Xl, . .. ,X n
es un sistema de representantes distintos de {Al,." ,An} si los Xi son ele-
mentos distintos de X, y si Xi E Ai para todo i. Por supuesto, tal sistema,
que abreviaremos como SRD, puede no existir (por ejemplo, si uno de los
conjuntos Ai es vacío). El teorema de Hall presenta condiciones necesarias y
suficientes para que exista un SRD.
Antes de presentar el resultado veamos la interpretación por la que es cono-
cido como teorema del matrimonio: consideremos un conjunto {1, ... ,n} de
chicas y un conjunto X de chicos. Siempre que X E la chica i y el chico X
tienen tendencia a casarse y, por tanto, Ai es el conjunto de posibles parejas
de la chica i. Un SRD es una boda múltiple en la que cada chica se casa con
un chico que le gusta.
De vuelta a los conjuntos, éste es el resultado.
"Una boda múltiple" Teorema 3. Sea Al, ... , An una familia de subconjuntos de un conjunto fi-
nito X. Existe un sistema de representantes distintos si y sólo si la unión de
cualesquiera m conjuntos Ai contiene al menos m elementos, para
1 ~ m ~ n.

Es evidente que la condición es necesaria: si m conjuntos Ai tienen en total


menos de m elementos, entonces estos m conjuntos no pueden ser representa-
dos por elementos distintos. Lo sorprendente es que esta condición es también
suficiente (esta parte es la que origina multitud de aplicaciones). La demos-
tración original de Hall es bastante complicada, y posteriormente se han en-
contrado muchas pruebas distintas, de entre las cuales la siguiente (debida a
Easterfield y redescubierta por Halmos y Vaughan) parece la más natural.

• Demostración. Utilizamos inducción sobre n. Para n = 1 no hay nada


que demostrar. Sea n > 1, Y supongamos que {Al, ... , An} satisface la
condición del teorema, que abreviamos como (H). Diremos que una familia
de f! conjuntos Ai con 1 ~ f! < n es una familia crítica si su unión tiene f!
elementos. Hay que distinguir dos casos.
c Caso 1: No existe ninguna familia crítica.
Escogemos un elemento X E An. Eliminamos X de X y consideramos la
familia A~, ... ,A~_l' donde A~ = Ai \ {x}. Como no existe ninguna fami-
E lia crítica, la unión de cualesquiera m conjuntos de los A~ contiene al me-
nos m elementos. Por tanto, según la hipótesis de inducción existe un SRD
Xl, ... , Xn-l de {A~, ... , A~_l} que, junto con x n = x, proporciona un
{B, C, D} es una familia crítica SRD para la familia original.
Caso 2: Existe alguna familia crítica.
Después de reordenar los conjuntos podemos suponer que {Al, ... , Ac} es
una familia crítica. Entonces, U;=l Ai = X, con IXI = f!. Como f! < n,
aplicando indu~ción vemos que existe un SRD para Al, ... ,Ac, es decir, los
elementos de X se pueden etiquetar como Xl, ... , Xc, de forma que Xi E Ai
para todo i ~ f!.
Consideremos ahora los restantes conjuntos A C+I ," ., A n , y escojamos m
cualesquiera de ellos. Como la unión de Al, ... ,Ac y estos m conjuntos
Tres teoremas famosos sobre conjuntos finitos 155

contiene al menos e+ m elementos según la condición se deduce que los


m conjuntos tienen al menos m elementos que no pertenecen a X. En otras
palabras, la familia

satisface la condición (H).


La inducción nos proporcio~a ahora un SRD de AH l, ... ,An formado por
elementos que no están en X. Combinándolos con Xl, ... ,XC obtenemos un
SRD para todos los conjuntos Ai. Esto completa la demostración. O

Como hemos mencionado, el teorema de Hall fue el comienzo de la ahora


ampliamente desarrollada teoría de emparejamientos [6]. Una de las muchas
variantes nos permite enunciar un resultado particularmente atractivo, que el
lector queda invitado a demostrar:

Supongamos que los conjuntos Al, ... , An tienen todos tamaño


k 2 1 Y supongamos además que ningún elemento está contenido
en más de k conjuntos. Entonces existen k sistemas de representantes
distintos tales que, para cualquier i, los k representantes de Ai son
distintos y forman, por tanto, el conjunto Ai.

Un hermoso resultado que debería abrir nuevos horizontes a las posibilidades


de matrimonio.

[1] T. E. EASTERFIELD: A combinatorial algorithm, J. London Math. Soco 21 (1946),


219-226.
[2] P. ERDÓS, C. Ko & R. RADO: Intersection theoremsfor systems offinite sets,
Quart. J. Math. (Oxford), Ser. (2) 12 (1961), 313-320.
[3] P. HALL: On representatives of subsets, J. London Math. Soco 10 (1935),
26-30.
[4] P. R. HALMOS & H. E. VAUGHAN: The marriage problem, Amer. J. Math. 72
(1950),214-215.
[5] G. KATONA: A simple proof of the Erdffs-Ko-Rado theorem, J. Combinatorial
Theory, Ser. B 13 (1972), 183-184.
[6] L. LovÁsz & M. D. PLUMMER: Matching Theory, Akadémiai Kiadó, Budapest
1986.
[7] D. LUBELL: A short proof of Sperner's theorem, J. Combinatorial Theory 1
(1966), 299.
[8] E. SPERNER: Ein Satz über Untermengen einer endlichen Menge, Math. Zeitsch-
rift 27 (1928), 544-548.
¿ Cuántas veces ha de barajarse un mazo de para que el orden
de las cartas sea aleatorio?

Analizar procesos aleatorios es una tarea común, tanto en la vida cotidiana


("¿Cuánto se tarda en llegar al aeropuerto un viernes a las seis de la tarde?")
como en las matemáticas. Sin embargo, no se puede esperar obtener respuestas
sensatas sin antes formular una pregunta más precisa. En el caso de barajar un
mazo de naipes, es necesario especificar:

* el tamaño del mazo (por ejemplo, n = 52 cartas),


* cómo se baraja (empezaremos analizando mezclas en las que se coloca la
carta más alta en un sitio aleatorio, y después trataremos las más realistas
y efectivas mezclas por imbricación (riffle shuffles, en inglés), y
• qué se entiende por "aleatorio" o "casi aleatorio".
En este capítulo describiremos un análisis de la baraje por imbricación he-
cho por Edgar N. Gilbert y Claude Shannon (1955, sin publicar) y Jim Reeds
(1981, sin publicar). Seguiremos los pasos del estadístico David Aldous y el
antes mago y ahora matemático Persi Diaconis [1]. No llegaremos al resul-
tado final y preciso de que al cabo de 7 mezclas por imbricación una baraja
de n = 52 cartas es casi aleatoria, mientras que 6 no son suficientes - pero
sí obtendremos una cota superior de 12, y de paso veremos unas ideas muy
bellas: las "reglas de detención" y el "tiempo fuertemente uniforme", el lema
que enuncia que el tiempo fuertemente uniforme es una cota para la distancia
de variación, el lema de inversión de Reeds y, en consecuencia, la interpreta-
ción de un baraje como una "ordenación al revés". Al final, reduciremos todo
a dos problemas combinatorios muy clásicos, la paradoja de los cumpleaños y
el problema del coleccionista. ¡Empecemos pues con ellos!

La los cumpleaños
Escogemos n personas al azar, por ejemplo los asistentes de una clase o de La tarjeta de visita de Persi Diaconis
un seminario. ¿Cuál es la probabilidad de que todos cumplen años en días cuando era mago. En una entrevista pos-
diferentes? Con las simplificaciones usuales (el año tiene 365 días, no hay terior dijo: "Si dices que eres profesor
variación estacional, no hay gemelos), esta probabilidad es en Stanford, la gente te trata con respeto.
Si dices que te dedicas a inventar trucos
de magia, no te quieren presentar a su
hija."
158 Barajando el mazo

lo cual es menor que ~ para n = 23 (ésta es precisamente la "paradoja de los


cumpleaños"), menor que 9% para n = 42, Y exactamente O para n > 365
(según el principio del palomar; véase el capítulo 22). La formula es fácil
de demostrar - escogiendo a las personas en un orden fijo: Si las primeras
i personas cumplen años en días diferentes, la probabilidad de que la persona
(i + 1) -ésima también lo haga es 1 - 3~5' ya que hay todavía 365 - i días
disponibles.
De manera similar, al meter n bolas en K cajas de manera independiente y
aleatoria, la probabilidad de que ninguna caja reciba más de una bola es

rr (1- ~).
n-l .

p(n,K) =
i=l

El problema del coleccionista


Los niños coleccionan cromos de estrellas de música (o de fútbol), pero como
se venden en sobres cerrados no saben de antemano cuál les tocará. Si hay
n cromos diferentes, ¿cuál es el número esperado de sobres que tiene que
comprar un niño hasta tener al menos un ejemplar de cada cromo?
De manera equivalente, si se seleccionan bolas al azar de una urna que con-
tiene n bolas etiquetadas del 1 al n, y cada vez se vuelven a meter en la urna
y se mezclan bien, ¿cuántas bolas hay que tomar en promedio hasta que cada
bola haya sido escogida por lo menos una vez?
Si en un momento dado ya se han seleccionado k bolas diferentes, entonces la
probabilidad de no escoger a continuación una bola nueva es ~. Por tanto, la
I: x S
-
1
(1 - X)S = probabilidad de tener que seleccionar exactamente s bolas hasta dar con una
s~l nueva es (~)S-l(l - ~). En consecuencia, el número esperado de veces que
I: s 1
X - S - I: XSS hay que seleccionar una bola hasta dar con una nueva es
s~l s~l

L (-nk)S-l(1 - n-k) s = --k'


1--
1
s~O S~O s~l n
1
1- x'
(véase el margen). Por tanto, el número esperado de bolas que hay que selec-
cionar para dar con cada una de las n bolas por lo menos una vez es
donde en el último paso se suma una se-
1 n n n n
rie geométrica (ver página 28). L
n-l
--k
1--
= -
n
+- - + ... + -2 + -1
n-1
= nHn ~ nlogn,
k=O n

usando las cotas para los números armónicos obtenidas en la página 11. Por
tanto, la respuesta al problema del coleccionista es que en promedio se habrán
de seleccionar aproximadamente n log n bolas.
A continuación necesitaremos estimar la probabilidad de que haya que selec-
cionar un número de bolas significativamente mayor que n log n. Si Vn denota
el número de selecciones necesarias (Vn es la variable aleatoria cuyo valor es-
perado es E[Vnl ~ n log n) entonces, para n 2 1 Y e 2 O, la probabilidad de
tener que seleccionar más de m := In lag n + en1bolas es
Barajando el mazo 159

En si denota el suceso que en las nrimp.TCl m selecciones no se


escoge nunca la bola con el número i, entonces
Se puede demostrar que (1 - ~) n es
Prob[UAi ] una función creciente en n que converge
i
a l/e. Por tanto, (1 - ~r < ~ se
n(l- ~)m < <
_ e -e . cumple para todo n 2': 1.

Empecemos ahora con un mazo de n cartas. Las numeramos del 1 al n en el


orden en el que están en el mazo, de manera que la carta con el número 1 está
por encima de todas, y la "n" por debajo. Denotaremos además al conjunto
de todas las permutaciones de 1, ... , n por <5 n . Barajar el mazo equivale a
aplicar ciertas permutaciones aleatorias al orden de las cartas. En un caso
ideal, esto podría significar que aplicamos permutaciones arbitrarias 7f E <5 n
a nuestro orden inicial (1,2, ... , n), cada una con la misma probabilidad 10,. n.
Por tanto, después de hacerlo una sola vez ya tendríamos el mazo en el orden
7f = (7f(1), 7f(2), ... , 7f( n)), y este orden sería perfectamente aleatorio. Pero
eso no es lo que pasa en la realidad. Cuando barajamos un mazo solamente
aplicamos "ciertas" permutaciones, a lo mejor ni siquiera todas con la misma
probabilidad, y esto se repite un "cierto" número de veces. Después de esto,
tenemos la esperanza de que el mazo esté en un orden por lo menos "casi
aleatorio" .

Estrategia 1: primera carta a un sitio aleatorio


Hacemos lo siguiente: se escoge la carta más alta del mazo, y se inserta en
uno de los n posibles sitios, cada uno con probabilidad ;. Aplicamos pues
una de las permutaciones siguientes

i
J-
Ti = (2,3, ... ,i,1,i+1, ... ,n),
para 1 :::; i :::; n. Después de barajar una vez, el mazo aún no será aleatorio, y
de hecho habrá que barajar de esta forma muchas veces hasta que sí lo sea. La primera carta a un sitio aleatorio

1\1
Una sucesión típica de barajes según esta estrategia podría ser (para n = 5):

1
2
3
4
5
I~
I
I
I
I
I
I
I
I
2
3
4
1
5
I~
I
I
I
I
3
2
4
1
5
1\
I
I
I
I
I
I
I
I
2
4
1
5
3
I~I
I
I
I
I
I
I
I
I
2
4
1
5
3
I
I
I
I
I
I
I
I
4
1
5
3
2
II~
I
I
I
¿De qué manera podríamos expresar matemáticamente que el mazo es "casi
aleatorio"? Un medida bastante severa del grado de aleatoridad con la que
han dado los probabilistas ella "distancia de variación". Para definirla, em-
pezamos fijándonos en la distribución de probabilidad de las n! ordenaciones
diferentes del mazo, o de manera equivalente de las nl diferentes permuta-
ciones (J E <5 n que dan lugar a estas ordenaciones.
160 Barajando el mazo

Dos ejemplos son nuestra distribución de E, dada por

E(id) 1,
E( 1T) O en caso contrario,
y la distribución unifonne U dada por

U(1T) = rb para toda 1T E 6 n .

La distancia de variación entre dos distribuciones 01 y 02 se define como

1101 - 0211 := ~ L 101(1T) - 02(1T)1·


1l"E6 n

Definiendo S := {1T E 6 n : 01 (1T) > 02 (1T)} Y utilizando que ¿7r 01 (1T) =


¿7r 02(1T) = 1, esta expresión se puede escribir como

donde Oi(S) := ¿7rES Oi(1T). Es claro que O ::; 1101 - 0211 ::; 1. En lo
que sigue, interpretaremos "ser casi aleatorio" como "tener una distancia de
variación pequeña a la distribución unifonne." En nuestro caso, la distancia
de variación entre la distribución del inicio y la unifonne es casi 1:

IIE - UII = 1-~.


n.
Después de barajar una vez la aleatoridad del mazo no ha mejorado mucho:

IITop - UII = 1 - (n~l)!'


Para los jugadores de cartas, la pre- Llamaremos Top*k a la distribución de probabilidad en 6 n obtenida al in-
gunta esencial no es "¿cómo de aleato- sertar k veces la primera carta en un sitio aleatorio. ¿Cómo se comporta
rio será el mazo después de barajarlo IITop*k - U11 cuando aumenta k, eso es, si barajamos más veces? ¿Y si usamos
un millón de veces? ", sino "¿ bastará una estrategia diferente para barajar? La teoría general (en particular, cadenas
con 7?" de Markov en grupos finitos; véase por ejemplo Behrends [3]) implica que
(Aldous & Diaconis [1]) para k grande la distancia de variación d(k) := IITop*k - UII se aproxima
d(k) a O a velocidad exponencial, pero no es capaz de predecir el cambio brusco
observado en la práctica: Después de barajar un cierto número ka de veces,
1+---...... "de pronto" d(k) decrece muy deprisa (véase al margen).

Reglas de detención fuertemente uniformes


ka
Nuestro análisis se basa en la idea brillante de las reglas de detención fuerte-
mente unifonnes de Aldous y Diaconis. Imaginemos que el director de un ca-
sino vigila el proceso de barajar, analizando las pennutaciones que se aplican
al mazo, y después de un número de pasos que depende de las pennutaciones
que haya visto dice "¡Pare!". En esencia, tiene una regla de detención que
finaliza el proceso de barajar y que únicamente depende de las pennutaciones
(aleatorias) aplicadas hasta el momento. La regla de detención es fuertemente
uniforme si se cumple para todo k ::::: O que:

Si el baraje se detiene tras k pasos, entonces las permutaciones resultan-


tes del mazo se distribuyen (¡exactamente!) de manera uniforme.
Barajando el mazo 161

El número T de pasos que se dan hasta que el su


de detención, diga "¡Pare!" es una variable aleatoria. De manera similar, la
ordenación del mazo después de barajar k veces viene dada por una varia- La probabilidad condicionada
ble aleatoria X k (con valores en 6 n ). La regla de detención es fuertemente Prob[AIBl
uniforme si para todos los valores de k se cumple que
es la probabilidad del suceso A sa-
1
Prob [X k = 1T I T = k] = - para todo 1T E 6 n. biendo que el suceso B ocurre. Es la
n! probabilidad de que los dos sucesos
Hay tres razones por las cuales estas reglas son interesantes y útiles: ocurran, dividido entre la probabili-
dad de que ocurra el suceso B, esto
l. Efectivamente existen reglas de detención fuertemente uniformes. Es más, es,
en muchos ejemplos son bastante sencillas.
Prob[A /\ Bl
Prob[A I Bl
2. Se pueden analizar, y al intentar determinar Prob[T > k] a menudo surgen Prob[B]
interesantes problemas combinatorios.
3. Dan cotas superiores efectivas para las distancias de variación, como por
ejemplo d(k) = IITop*k - UII.
Por ejemplo, para la estrategia de insertar la primera carta en un sitio aleatorio,
una regla de detención fuertemente uniforme es:
"PARAR después de que la carta que al principio estuvo debajo del
todo (con la etiqueta n) se haya insertado en el mazo por primera vez."
En efecto, si seguimos a la carta n mientras barajamos, vemos que durante

1 3 2 4
2
3
4

T1
todo el proceso el orden de las cartas por debajo de ella es totalmente uni-
forme. Por tanto, después de que la carta n haya ascendido hasta arriba y se
haya vuelto a insertar, el mazo está distribuido uniformemente; la única pega
es que no sabemos exactamente cuándo pasa eso (pero el director del casino
sí).
Sea ahora Ti la variable aleatoria que cuenta el número de veces que se baraja
hasta que haya por primera vez i cartas por debajo de la carta n. Por tanto,
tenemos que determinar la distribución de
T = T 1 + (T2 - Td + ... + (Tn _ 1 - T n- 2 ) + (T - Tn-d.
Cada sumando corresponde a un problema del coleccionista: Ti - T i - 1 es el
tiempo hasta que la carta de arriba se inserta en un posible lugar por debajo de
la carta n. Por tanto, también es el tiempo que tarda el coleccionista desde que
adquiere el cromo (n - i)-ésimo hasta el (n - i + 1)-ésimo. Sea Vi el numero
de cromos comprados hasta que el coleccionista tenga i cromos diferentes.
Entonces
162 Barajando el mazo

Hemos visto que Prob[Ti - T i - 1 = j] = Prob[Vn -i+l - Vn - i = j] para todo


i y j. Por ende, el coleccionista y la persona que baraja el mazo según esta
estrategia llevan a cabo procesos aleatorios independientes, pero equivalentes;
eso sí, en orden inverso (para el coleccionista, finalizar es lo más difícil). Por
tanto, la probabilidad de que con esta regla de detención fuertemente uniforme
se tarde más de k = In lag n + en l pasos es pequeña:

y esto significa a su vez que, después de barajar insertando la primera carta


k = In lag n + en l veces, el mazo es "casi aleatorio" con

Esta última conclusión se sigue del siguiente lema, sencillo pero crucial.
Lema. Sea Q : <5 n --------+ lR cualquier distribución de probabilidad que define
un proceso de barajar Q*k con una regla de detenciónjuertemente uniforme
cuyo tiempo de detención es T. Entonces, para todo k 2 0,

• Demostración. Si X es una variable aleatoria con valores en <5 n Y Q su


distribución de probabilidad, podemos escribir Q(5) para la probabilidad de
que X tome un valor en 5 ~ <5 n . Así, Q(5) = Prob[X E 5], Y en el caso
Q = U obtenemos

U(5) = Prob[X E 5] = ~.
n.

Para cualquier subconjunto 5 ~ <5n> la probabilidad de que al cabo de k


pasos el mazo esté ordenado según una permutación en 5 es

Q*k(5) = Prob[Xk E 5]
I:: Prob[Xk E 5 /\ T = j] + Prob[Xk E 5 /\ T > k]
j9

I:: U(5) Prob[T = j] + Prob[Xk E 5 I T > k] . Prob[T > k]


j~k

U(5) (1- Prob[T > k]) + Prob[Xk E 5 I T > k]· Prob[T > k]
U(5) + (Prob[X k E 5 I T > k]- U(5)) . Prob[T > k].
Por tanto,
IQ*k(5) - U(5)1 :S Prob[T> k]
ya que
Prob[Xk E 5 I T > k] - U(5)
es una diferencia de probabilidades, y su valor absoluto es como mucho l. O

Esto completa nuestro análisis de la estrategia de insertar la carta de arriba


en un sitio aleatorio. Hemos demostrado la siguiente cota superior para el
número de mezclas necesarias hasta que el mazo sea "casi aleatorio".
Barajando el mazo 163

Teorema 1. Sea e 2 OY k := In log n + en l. de insertar


la primera carta k veces en un sitio aleatorio de un mazo con n cartas, la
distancia de variación desde la distribución uniforme cumple

Asimismo, se podría verificar que la distancia de variación d(k) sigue siendo


grande si barajamos un número significativamente menor de n log n veces con
esta estrategia. La razón es que un número más pequeño no bastará para alterar
el orden relativo en las cartas más bajas del mazo.
Por supuesto, esta estrategia de barajar es muy ineficaz - usando la cota de
nuestra teorema, tenemos que barajar aproximadamente n log n ~ 205 veces
hasta mezclar bien un mazo de n = 52 cartas. Por tanto, ahora nos fijaremos
en un modelo mucho más interesante y realista de barajar.

Mezclas por imbricación shuffles)


Esto es lo que el crupier hace en un casino: Toma la baraja, corta en dos partes,
y a continuación las entrelaza, por ejemplo dejando caer las partes inferiores
de los dos medios mazos de alguna manera irregular.
Como antes, esto produce cierta permutación en las cartas del mazo, que su-
ponemos inicialmente etiquetadas del 1 al n, siendo la 1 la de arriba. Las
mezclas por imbricación se corresponden exactamente con las permutaciones
7r E 6 n que verifican que la sucesión
(7r(1),7r(2), ... ,7r(n))
está formada por dos sucesiones crecientes entrelazadas (solamente en el caso
de la permutación identidad hay una sola permutación), y hay exactamente
2n - n mezclas por imbricación distintas en un mazo de n cartas.

01 1 1
O 1 1 01 1 Una mezcla por imbricación
01 2 1
O 2 I~ 11 3
1 3 I~ 11 4
1 4 1
11 3 IX 01 2
1 5 11 4
11 5
1
11 5
En efecto, si se parte el mazo cogiendo las t cartas superiores con la mano
derecha (O :::; t :::; n) y las n - t cartas restantes con la izquierda, entonces
hay (~) maneras de entrelazar las dos manos, y todas ellas generan permuta-
ciones distintas - excepto que para cada t hay una posibilidad de obtener la
permutación identidad.
No está claro qué distribución de probabilidad se debería asignar a las mezclas
por imbricación - no hay una respuesta única, ya que los aficionados y los
profesionales barajarán de manera diferente. Sin embargo, el modelo que ex-
pondremos a continuación, que fue desarrollado primero por Edgar N. Gilbert
y Claude Shannon en 1955 (entonces en el mítico departamento de "Matemá-
ticas de la Comunicación" de los laboratorios Bell), tiene algunas ventajas:
164 Barajando el mazo

es elegante, sencillo y parece


e modeliza con fidelidad la manera de barajar de un no profesional
y lo podemos analizar.
He aquí tres descripciones - todas ellas de la misma distribución de probabi-
lidad Bric en €'in:

1. Bric: €'in ----+ JR; se define mediante

n+l
2"" si n = id,
Bric(7I"):= ~~ si n consiste de dos sucesiones crecientes,
{
en caso contrario.

2. Se toman t cartas del mazo en la mano derecha, con probabilidad 2~ (~),


y el resto del mazo en la mano izquierda. Ahora, si se tienen r cartas en
la mano derecha y 12 en la mano izquierda, se deja caer la carta más baja
de la mano derecha con probabilidad r~R' y de la mano izquierda con
probabilidad r!R' A continuación se repite el proceso.
Las mezclas por imbricación inversas 3. En una mezcla inversa, se quitaría un conjunto de cartas del mazo, y se las
se corresponden con las permutaciones colocaría encima del resto - respetando el orden relativo en las dos partes
IJI
71" = (71"(1), ... ,7I"(n)) crecientes, con del mazo. Tal proceso viene determinado por el subconjunto de cartas que
excepción de a lo sumo un "descenso". se quitan, eligiéndose todos los subconjuntos con la misma probabilidad.
(Solamente la permutación identidad no De manera equivalente, se asigna una etiqueta "O" ó "1" a cada carta,
tiene ningún descenso.) aleatoria e independientemente con probabilidad ~, y se mueven las cartas
con la etiqueta "O" arriba.

Es fácil ver que estas reglas describen la misma distribución de probabilidad.


Para (1) ~ (3) obsérvese que obtenemos la permutación identidad justo en
el caso en que todas las cartas "O" están por encima de todas las cartas ''1''.
Ya hemos definido el modelo. Pero, ¿cómo analizarlo? ¿Cuántas mezclas por
imbricación hacen falta para tener un mazo casi aleatorio? No obtendremos la
respuesta más precisa posible, pero sí una bastante buena, siguiendo estos tres
pasos:
(1) Analizar mezclas por imbricación inversas,
(2) describir una regla de detención fuertemente uniforme para ellas,
(3) y demostrar que la clave para su análisis es ¡la paradoja del cumpleaños!

Teorema 2. Después de k mezclas por imbricación en un mazo de n cartas,


la distancia de variación desde una distribución uniforme cumple

IIBric*k - UII ~ 1- TI (1- 2ik ) '

• Demostración. (1) Analizaremos mezclas por imbricación inversas para


ver con qué rapidez nos llevan desde la distribución inicial hacia (o cerca de)
la distribución uniforme. Estas mezclas por imbricación inversas se corres-
ponden con la distribución de probabilidad dada por Bric(n) := Bric( n- 1 ).
Barajando el mazo 165

Del hecho que toda permutación una inversa y de que U(1T)


U(1T- 1 ), se obtenemos
-.-*k
IIBric*k - UII 11 Bric - UII·

(Esto es el lema de inversión de Reeds.)


En cada mezcla por imbricación inversa, a cada carta se le asocia un dí-
gitoOó1:

o1 1 1 O:=1==1====:1 1 1
01:=: : : 4====:1 ~ O1 4 1 :=1==2====:
112 I~ I 1~:=1==3====:
11 3 1 1 2 I~I 4
11 5 1 11 5
1 1
3
.
l. :=1=5====:
L-......."-----'

Si recordamos estos dígitos - por ejemplo, escribiéndolos en las cartas - en-


tonces, después de k mezclas por imbricación inversas, en cada carta aparece
una cadena ordenada de k dígitos. Nuestra regla de detención es:

"PARAR cuando todas las cartas tengan asignadas cadenas distintas."

Cuando esto suceda, las cartas del mazo habrán sido ordenadas según los
números binarios bk bk-l ... b2 bl. donde bí es el bit que la carta ha adquirido
en la i-ésima mezcla por imbricación inversa. Como estos bits son totalmente
aleatorios e independientes, esta regla de detención es fuertemente uniforme.
En el siguiente ejemplo para n = 5 cartas, necesitamos T = 3 mezclas inver-
sas hasta parar:

0001 4 001 4 01 1 1 1
0011 2 011 2 1 01 4 1 1 2
0101 1 -<f--- 011 5 I-<f---ll 2 I-<f---I 3
1011 5 101 1 1 11 3 1 1 4
1111 3 111 3 1 11 5 1 1 5
(3) El tiempo esperado T hasta parar usando esta regla de detención se distri-
buye como en la paradoja del cumpleaños, para K = 2k: ponemos dos cartas
en la misma caja si tienen la misma etiqueta bk bk- 1 ... b2 h E {O,1}k. Por
tanto, hay K = 2k cajas, y la probabilidad de que una caja contenga más de
una carta es

Prob[T> k] = 1- TI (1- 2ik ) ,

lo cual, como hemos visto, acota la distancia de variación 11 Bric*k - U 11


--*k
11 Bric - UII. O

¿Cuántas veces tenemos que barajar? Para n grande son aproximadamente


k = 2Iog 2 (n) veces: poniendo k := 210g 2 (cn) para algún e 2: 1 hallamos
(usando técnicas del análisis) que P[T > k] R::i 1 - e~ R::i 2~2.
166 Barajando el mazo

k d(k) Por ejemplo, para n = 52 cartas, las cotas superiores dadas por el teorema 2
1 1.000 son d(10) ~ 0.73, d(12) ~ 0.28, d(14) ~ 0.08 - con lo cual, k = 12
2 1.000 tendría que ser "suficientemente aleatorio" para fines prácticos. Pero en la
3 1.000 práctica no barajamos 12 veces - ni hace falta, como muestra un análisis más
4 1.000 detallado (véase al margen). El análisis de las mezclas por imbricación es parte
5 0.952 de un debate actual y muy vivo acerca del significado de "suficientemente .
6 0.614 aleatorio". Diaconis [4] puede servir de guía de los últimos acontecimientos.
7 0.334 ¿Es importante este análisis? En efecto, lo es: aún después de tres buenas
8 0.167 mezclas por imbricación de una baraja de 52 cartas, el mazo parece bastante
9 0.085 aleatorio ... pero no lo es. Martín Gardner [5, capítulo 7] describe algunos
10 0.043 impresionantes trucos de cartas basados en el orden escondido en tal mazo.
La distancia de variación después de k
mezclas por imbricación, según [2]

d(k) [1] D. ALDOUS & P. DIACONIS: Shuffling cards and stopping times, Amer. Math.
Monthly 93 (1986), 333-348.
[2] D. BAYER & P. DIACONIS: Trailing the dovetail shuffle to its lair, Annals Applied
Probability 2 (1992),294-313.
[3] E. BEHRENDS: Introduction to Markov Chains, Vieweg, Braunschweig/
1 7 10 Wiesbaden 2000.
[4] P. DIACONIS: Mathematical developments from the analysis oi riffle shuffling,
in: "Groups, Combinatorics and Geometry. Durham 2001" (A. A. Ivanov, M. W.
Liebeck and J. Saxl, eds.), World Scientific, Singapore 2003, pp. 73-97.
[5] M. GARDNER: Mathematical Magic Show, Knopf, New York/Allen & Unwin,
London 1977.
[6] E. N. GILBERT: Theory oi Shuffling, Technical Memorandum, Bell Laboratories,
Murray Hill NJ, 1955.

¿ Suficentemente aleatorio?
Lo esencial de las matemáticas es demostrar teoremas - y por tanto, a ello se
dedican los matemáticos: demuestran teoremas. Pero, a decir verdad, lo que
realmente quieren demostrar, por lo menos una vez en su vida, es un lema:
como el de Fatou en análisis, el lema de Gauss en la teoría de números o el
lema de Bumside-Frobenius en combinatoria.
Ahora, ¿qué convierte una afirmación matemática en un verdadero lema? En
primer lugar, debería ser aplicable a una gran variedad de circunstancias, in-
cluso a problemas sin conexión aparente. En segundo lugar, la afirmación
debería ser completamente obvia - una vez vista. Al lector hasta le podría
dar una leve envidia: ¿por qué yo no he observado esto antes? Y por último,
en un nivel estético, ¡tanto el lema como su demostración deberían ser bellos!
Aquí veremos un ejemplo de razonamiento matemático de estas característi-
cas, un lema de recuento que apareció por primera vez en 1972, en un artículo
de Bemt Lindstrbm. Aunque en ese entonces pasó desapercibido, en 1985 se
convirtió de golpe en un clásico, cuando Ira Gessel y Gerard Viennot lo re-
descubrieron y demostraron en un artículo maravilloso cómo puede aplicarse
a una gran diversidad de difíciles problemas de enumeración combinatoria.

Partimos de la representación del determinante de una matriz mediante permu-


taciones. Sea M = (mij) una matriz n x n con elementos reales. Entonces

det M = L sign (J" mlo-(l) m2o-(2) ... mnu(n) , (1)


o-

donde (J" recorre todas las permutaciones de {1, 2, ... , n}, y la signatura de (J"
es 1 ó -1, dependiendo de si (J" es el producto de un número par o impar de
transposiciones.
Ahora construimos un grafo, más exactamente un grafo bipartito dirigido con
pesos. Este grafo tendrá vértices Al, ... ,An representando las filas de M,
Y vértices El, ... ,En para las columnas. Para cada par (i, j) dibujamos una m1l
flecha de Ai a E j , Y le damos el peso mij (véase la figura).
En términos de este grafo, la fórmula (1) tiene la siguiente interpretación:
m nn

€II El primer miembro es el determinante de la matriz de caminos M, cuya


entrada (i, j) es el peso del (único) camino dirigido de Ai a Ej.

€II El segundo miembro es la suma ponderada (con signo) sobre todas las
familias de caminos disjuntos en vértices desde A = {Al, ... , An} hasta
B = {El, ... , En}. Tal familia Po- viene dada por los caminos
168 retículas y determinantes

y el peso de la familia de caminos Pu es el Prc)ducto de los pesos de los


caminos individuales:

Mediante esta interpretación, podemos escribir (1) como

detM = L signCTw(Pu )'

y ¿cuál es el resultado de Gessel y Viennot? Es la generalización natural


de (1) de grafos bipartitos a grafos arbitrarios. Es exactamente este paso el
que permite aplicar el lema en tantos contextos distintos - y su demostración
es sumamente sencilla y elegante.
Empecemos revisando los conceptos necesarios. El objeto básico es un grafo
finito dirigido acíclico G = (V, E), lo cual quiere decir que en G no hay
ciclos dirigidos. En particular, entre dos vértices cualesquiera A y B sólo
hay un número finito de caminos dirigidos, donde también consideramos los
caminos triviales A -+ A de longitud O. Cada arista e tiene el peso w(e).
Si P es un camino dirigido de A a B, que escribiremos P : A -+ B, se define
Un grafo dirigido acíclico el peso de P como
w(P) := w(e).
eEP

Si P es un camino de longitud O, se define que w(P) = 1.


Denotamos ahora por A = {Al, ... , An} YB = {Bl, ... , Bn} dos conjuntos
de n vértices, donde A y B no son necesariamente disjuntos. Asociamos a A
y B la matriz de caminos M = (mij) con

L w(P).
P:Ai--+Bj

Una familia de caminos P de A a B está formado por una permutación CT junto


con n caminos Pi : Ai -+ Bu(i), para i = 1, ... , n; además, escribiremos
sign P = sign CT . El peso de P es el producto de los pesos de los caminos,

w(P) = rrn

i=l
w(Pi ), (2)

es decir, el producto de los pesos de todas las aristas de la familia de caminos.


Finalmente, diremos que la familia de caminos P = (Pi, ... ,Pn ) es disjunta
en vértices si, para cada par de caminos en P, sus conjuntos de vértices son
disjuntos.
Lema. Sea G = (V, E) un grafo finito dirigido acíclico y ponderado, y sean
A = {Al, ... , An} y B = {B l , ... , Bn} dos conjuntos de n vértices y M la
matriz de caminos de A a B. Entonces

detM signP w(P). (3)


P familia de caminos
disjuntos en vértices
um",u'~, retículas y determinantes 169

_Demostración. Unsumando dedet(M) es sign(J mlo-(l)'" mno-(n),


lo cual se puede escribir como

Sumando sobre (J podemos deducir de (2) que

det M = L sign P w(P),


P
donde P recorre todos las familias de caminos de A a E, sean disjuntos en
vértices o no. Por tanto, para llegar a (3), sólo hace falta demostrar que

L signP w(P) = O, (4)


PEN
donde N es el conjunto de todos las familias de carninos no disjuntos en vér-
tices, y ello lo lograremos mediante un argumento de singular belleza. Dare-
mos una involución 1T : N ----; N (sin puntos fijos) tal que para P y 1TP
W(1TP) = w(P) y sign 1TP = -sign P .
Claramente, esto implicará (4), y por tanto la fórmula (3) del lema.
La involución 1T se define de manera muy natural. Sea P E N con caminos
Pi :Ai ----; Bo-(i)' Por definición, algunos pares de caminos se intersecarán.

@ Sea io el mínimo índice tal que Pio tiene un vértice en común con algún
otro camino.
@! Sea X el primero de tales vértices en el camino P io '

@! Sea jo el mínimo índice (jo> i o) tal que Pjo tiene el vértice X en común
con Pio'
Construimos la nueva familia 1TP = (Pi, . , . ,P~) de la manera siguiente:
@! Sea P~ = Pk para todo k =1- io, jo.
@ El nuevo camino Pio va de Aio a X pasando por P io ' Y a continuación
sigue a Bo-(jo) a lo largo de P jo . De manera similar, Pjo va desde Ajo
hasta X a lo largo de P jo y sigue hasta Bo-(io) a lo largo de Pio'
Claramente 1T(1TP) = P, ya que el índice i o, el vértice X, y el índice jo son
los mismos que antes. En otras palabras, al aplicar 1T dos veces volvemos a
los caminos Pi de antes. Ahora, ya que 1TP y P usan exactamente las mis-
mas aristas, tenemos ciertamente que W(1TP) = w(P). Y por último, puesto
que la nueva permutación (JI se obtiene componiendo (J con la transposición
(io, jo), deducimos que sign 1TP = -sign P , y hemos terminado la demos-
tración. D

Se puede usar el lema de Gessel-Viennot para deducir todas las propiedades


básicas de los determinantes, simplemente estudiando los grafos apropiados.
Consideremos a continuación un ejemplo especialmente llamativo, la fórmula
de Binet-Cauchy, que proporciona una generalización muy útil de la regla del
producto para determinantes.
170 nw"m,l<' retículas y determinantes

Teorema. Sean r ::; s, P una matriz r x s y Q una matriz s x T, entonces

det(PQ) = ~)detPz)(detQz),
z
Pil
Pik donde Pz es la submatriz (r x r) de P cuyas columnas están indexadas por el
conjunto Z, y Q z la submatriz (r x r) deQ cuyas filas están indexadas por Z.

• Demostración. Como antes, haremos corresponder a la matriz P el grafo


bipartito en A y B, Y de manera similar a Q el grafo bipartito en B y C. Con-
sideramos ahora el grafo concatenado de la figura de la izquierda. Podemos
observar que la entrada mij de la matriz M de caminos desde A hasta C es
precisamente mij = I: k Pik qkj ; por tanto, M = PQ.
Las familias de caminos disjuntos en vértices desde A hasta C en el grafo
concatenado se corresponden con pares de familias desde A hasta Z, y desde
Z hasta C. Por tanto, el resultado se sigue de manera inmediata del lema,
observando que sign (en) = (sign a") (sign T). O

El lema de Gessel-Viennot da lugar a muchos resultados que relacionan los


determinantes con propiedades enumerativas. La receta es siempre la misma:
hay que interpretar a la matriz M como una matriz de caminos, e intentar
calcular el segundo miembro de (3). Como ilustración, he aquí el problema
original estudiado por Gessel y Viennot, que les llevó a su lema:

Sean al < az < ... < a n y bt < b2 < ... < bn dos sucesiones
de números naturales. Se pide calcular el determinante de la matriz
M = (mij), donde mij es el coeficiente binomial (~i).
J

Dicho de otro modo, Gessel y Viennot consideraron los determinantes de todas


1 las submatrices cuadradas del triángulo de Pascal, por ejemplo de la matriz
1 1
1
1
1
1
2
3
4
5
1
3 1
6 4 1
10 10 5 1 det
(i) @ (~)
(i) (~) (!)
) 1
4 ~ ) ,
1 6 15 20 15 6 1 ( (~) (~) (~)
20 15
1 7 21 35 35 21 7 1
definida por las entradas en negrita del triángulo de Pascal del margen.
Como primer paso para resolver este problema recordaremos un resultado
conocido que relaciona los coeficientes binomiales con los caminos en una
retícula. Consideramos una retícula a x b como en el margen. Entonces, el
número de caminos desde la esquina inferior izquierda hasta la esquina su-
perior derecha, donde los únicos pasos permitidos son hacia arriba (norte) y
hacia la derecha (este), es (a!b).
La demostración de este hecho es fácil: cada camino está formado por una
sucesión arbitraria de b pasos hacia el "este" y a pasos hacia el "norte", y por
a=3 tanto se puede representar por una sucesión de la forma NENEEEN, que está
formado por a + b letras, de las cuales haya letras N y b letras E. El número
de tales cadenas es el número de maneras de elegir a posiciones de letras N de
b=4 un total de a + b posiciones, lo cual es (a!b) = (at b).
-'u,w.","' .... retículas y determinantes 171

Ahora consideramos la de la uv'.vvuu, en la cual está en el


(O, -ai) Y Ej en el punto (b j , -bj ).
El número de caminos de Ai hasta Bj en esta retícula que usan solamente
pasos al norte y 'al este es, como hemos visto, (bj+(~~-bj)) = (~i). Dicho de Al
J. J
otra manera, la matriz de coeficientes binomiales M es exactamente la matriz
de caminos de A a B en el grafo reticular dirigido en el cual todas las aristas
tienen peso 1, y están dirigidas al norte o al este. Por tanto, podemos aplicar el
lema de Gessel-Viennot para calcular det M. Una breve reflexión muestra que
toda familia de caminos disjunto en vértices P de A a B está necesariamente Ai ~

compuesta de caminos Pi : Ai ---+ Ei para todo i. En consecuencia, la única Bn


permutación posible es la identidad, que tiene signatura 1. Hemos obtenido el ~ ~ ~ ~ ~

bello resultado de que


~ lO lO

det ( (~;)) = # familias de caminos disjuntos en vértices de A a B.


An
En particular, de esto se sigue el hecho no trivial que det M es siempre no
negativo, ya que el segundo miembro de la igualdad cuenta algo. Además,
el lema de Gessel-Viennot implica que det M = O si Y sólo si ai < bi para
algún i.
En n~estro ejemplo de antes tenemos

~~
(D G) m familias de ~3
)
3

det ( (i) (i) (!) # caminos disjuntos 4 ~4


mmm en vértices en ~
6

,)

"Caminos en retículas"
172 Lu:rrunu,,'. retículas y detenninantes

[1] l. M. GESSEL & G. VIENNOT: Binomial determinants, paths, and hook length
formulae, Advances in Math. 58 (1985), 300-321.
[2] B. LINDSTRÓM: On the vector representation ofinduced matroids, Bulletin Lon-
don Math. Soco 5 (1973), 85-90.
Una de las fórmulas más bellas de toda la combinatoria enumerativa es la del
número de árboles etiquetados. Consideramos el conjunto N = {1, 2, ... ,n}.
¿Cuántos árboles diferentes podemos construir usando estos vértices? Sea T n
su número. La enumeración "a mano" nos da T 1 = 1, T 2 = 1, T 3 = 3 Y
T4 = 16, Y mostramos estos árboles a continuación:
1

3 3 3
1 2 1 212 1 2 1 2 1 2 1 2

343 4 3 4 3 4 3 4 3 4 3 434
1 2 1 2 1 212 1 2 1 2 1 2

3 4 343 4 3 4 3 4 3 4 3 434

Nótese que consideramos árboles etiquetados. Por tanto, aunque solamente Arthur Cayley
hay un árbol con tres vértices en el sentido de isomorfismo de grafos, al marcar
el vértice interior con 1, 2 ó 3 obtenemos tres árboles etiquetados distintos.
Para n = 5 hay tres árboles no isomorfos (sin etiquetar):

5
Para el primer árbol es claro que hay 5 etiquetados diferentes, y para el se-
gundo y tercero hay %l = 60 etiquetados - con lo cual n
= 125. Esto ya
tendría que ser suficiente para conjeturar que T n = nn-2, y este es precisa-
mente el resultado de Cayley.

Teorema. Hay nn-2 árboles etiquetados diferentes con n vértices.

Esta fórmula tan bella da lugar a demostraciones igualmente bellas, que usan
gran variedad de técnicas algebraicas y combinatorias. Esbozaremos tres de
ellas antes de presentar la demostración que hasta la fecha sigue siendo la más
bonita de todas .
• Primera demostración (Biyección). El método más clásico y directo es en-
contrar una biyección del conjunto de todos los árboles con n vértices con otro
174 La fórmula de Cayley para el número de árboles

conjunto del cual se sabe que tiene nn-2 elementos. De manera pode-
mos pensar en el conjunto de todas las sucesiones ordenadas (al, ... , a n -2)
con 1 ::; ai ::; n. Por tanto, queremos codificar unívocamente a cada árbol
T por una sucesión (al . .. ,an -2). Tal codificación fue hallada por Prüfer, y
aparece en la mayoría de los libros sobre teoría de grafos.
AquÍ queremos presentar otra demostracÍón por biyección, encontrada por Jo-
yal, que es menos conocida pero de igual elegancia y sencillez. Para ello, no
consideramos solamente árboles t con vértices en N = {l, ... , n}, sino tales
árboles junto con dos vértices distinguidos, el extremo izquierdo O y el ex-
tremo derecho O, que pueden coincidir. Sea In = {(t; O, O)} este nuevo
Los cuatro árboles de T2 conjunto. Entonces, claramente, IInI = n 2 T n .
Nuestra meta es por tanto probar que IIn I = n n. Ahora, hay un conjunto cuyo
tamaño sabemos que es nn, el conjunto NN de todas las aplicaciones de N
en N. Podemos pues probar nuestra fórmula si encontramos una biyección
entre NN y 4,.
Sea 1 : N ------+ N cualquier aplicación. Dibujando flechas de i a l(i), pode-
mos representar 1 como un grafo dirigido J. a
Por ejemplo, representamos la aplicación
7 4 9
1-------tl---~lO ~
1= ( ~
2
5
3
5
4
9
5
1
6
2
7
5
8
8
9
4
l~ )

por el grafo dirigido que aparece al margen.


Fijémonos en una componente conexa de OJ. Ya que hay exactamente una
e-___-----. 6
arista que sale de cada vértice, la componente contiene el mismo número de
2
vértices y aristas, y por tanto exactamente un ciclo. Sea NI ~ N la unión de
los conjuntos de vértices de dichos ciclos. Un momento de reflexión muestra
que M es el único subconjunto maximal de N tal que la restricción de 1 a M

es una biyección en M. Escribimos 11M = (l(a) ltb) l(z) ),


de manera que los números a, b, ... , z en la primera fila aperecen en su orden
natural. Esto proporciona una ordenación l(a), l(b), ... , l(z) del conjunto
M = {a, b, ... ,z} de acuerdo con la segunda fila, en la cual el extremo iz-
quierdo es 1(a) y el extremo derecho 1(z).
Podemos construir el árbol t correspondiente a la aplicacion 1 como sigue:
Dibujamos 1(a), ... , 1(z) en este orden como camino desde 1(a) hasta 1(z),
y rellenamos los demás vértices como indica OJ (suprimiendo las flechas).
En nuestro ejemplo anterior obtenemos M = {l, 4, 5, 7, 8, 9},
5 7 8
1 5 8

y por tanto el árbol t del margen.


Es inmediato cómo invertir esta correspondencia: Dado un árbol t, nos fijamos
6
en el único camino P del extremo izquierdo al extremo derecho. Esto nos da
el conjunto M y la aplicación 11M. Las demás correspondencias i -+ 1(i) se
determinan de acuerdo con los caminos únicos entre i y P. O
Lafórmula de Cayley para el número de árboles 175

Segunda demostración Podemos pensar en como el


número de árboles generadores del grafo completo Kn. Ahora nos fijamos
en un grafo arbitrario conexo y simple G en V = {1, 2, ... , n}, y denotamos
por t(G) el número de árboles generadores; de esta manera, T n = t(Kn ). El
resultado siguiente es el célebre teorema matricial de los árboles de Kirchhoff
(véase [1]). Consideramos la matriz de incidencia B = (b ie ) de G, cuyas filas
y columnas están etiquetadas, respectivamente, por V y E. Ponemos bie = 1
Ó Osegún i E e o i ti- e. Nótese que IEI 2: n -1, ya que G es conexo. En cada
columna reemplazamos de forma arbitraria alguno de los dos '1' por' -1' (en
otras palabras, orientamos G de forma arbitraria), y llamamos C a la nueva
matriz. Entonces M = C C T es una matriz simétrica (n x n) que contiene los
grados dI, ... , d n en su diagonal principal.
Proposición. Se cumple que t( G) = det M ii para todo i = 1, ... , n, donde
M ii se obtiene de M suprimiendo la fila i-ésima y la columna i-ésima .
• Demostración. La clave de la demostración es el teorema de Binet-Cauchy
que demostramos en el capítulo anterior: Si P es una matriz (r x 8) y Q una
matriz (8 x r), con r :::; 8, entonces det(PQ) es igual a la suma de los produc-
tos de los determinantes de todas las submatrices correspondientes de tamaño
(r x r), donde "correspondiente" quiere decir que escogemos los mismos ín-
dices para las r columnas de P y las r filas de Q.
Para M ii , esto quiere decir que
det M ii = L N det N . det N T = L N (det N)2 ,
donde N recorre todas las submatrices (n - 1) x (n - 1) de C\ {fila i}. Las
n - 1 columnas de N corresponden a un subgrafo de G con n - 1 aristas y n
vértices, y nos queda por demostrar que
det N = {±01 si estas aristas forman un árbol
en otro caso.
Supongamos que las n - 1 aristas no forman un árbol. Entonces existe una
componente que no contiene a i. Ya que las filas que le corresponden suman O,
sabemos que son linealmente dependientes, y por tanto det N = O.
Supongamos ahora que las columnas de N engendran un árbol. Entonces "Un método no estándar para contar
existe un vértice JI =1 i de grado 1; sea el la arista incidente. Al suprimir árboles: Coloque un gato en cada ár-
jI, el obtenemos un árbol con n - 2 aristas. Otra vez, hay un vértice 12 =1 i bol, pasee su perro, y cuente cuántas ve-
de grado 1 con arista incidente e2. Continuamos de esta manera hasta que ces ladra."
hayamos determinado jI, j2, ... ,jn-l Y el, e2, ... , en-l con ji E ei. Ahora
permutamos filas y columnas para llevar j k a la fila k-ésima, y ek a la columna
k-ésima. Puesto que por construcción jk ~ ee para k < R, vemos que la
nueva matriz N' es triangular inferior, y que todos los elementos de la diagonal
principal son ±l. Por tanto, det N = ±det N' = ±1, y hemos terminado.
Para el caso especial G = Kn es claro que

M
ii
= ( n ~/ n ~\ -1
.
)
,
-1 -1 n~1
y un cálculo fácil muestra que det M ii = n n- 2 . D
176 Lafónnula de Cayley para el número de árboles

• Tercera demostración Otro método clásico en combinatoria


enumerativa es establecer una relación de recurrencia, que después se resuelve
por inducción. La siguiente idea se debe esencialmente a Riordan y Rényi.
Para encontrar la recursión apropiada, consideramos un problema más general
(que ya aperece en el artículo de Cayley). Sea A un subconjunto arbitrario
de los vértices con k elementos. Denotamos por Tn,k el número de bosques
(etiquetados) con vértices {l, ... ,n} que están formados por k árboles, yen
los cuales los vértices de A aparecen en árboles diferentes. Es claro que sólo
importa el cardinal del conjunto A, no sus elementos. Nótese que T n ,l = T n .

1 2 1 2 1 2 1 2

KL:~II
34 3 4 3 4 3 4 3 4 3 4 3 4
Por ejemplo, T4,2 = 8 para A = {l, 2}
Consideremos un tal bosque B con A = {1, 2, ... ,k}, y supongamos que 1 es
adyacente con í vértices, tal y como se ilustra en el margen. Suprimiendo ell,
los í vecinos, junto con 2, ... , k, dan lugar a un vértice cada uno en las com-
ponentes de un bosque de k - 1 + í árboles. Ya que podemos (re)construir B
1 2 3 k fijando primero í, después eligiendo los í vecinos de 1, y a continuación el

~
bosque F\l, tenemos que·

Tn,k = L
n-k (
n ~ k ) T n - 1,k-1+i (1)
.=0
para todo n 2: k 2: 1, donde definimos To,o = 1 y Tn,o o para n > O.
Nótese que To,o = 1 es necesario para asegurar Tn,n = 1.
Proposición. Se verifica
T n,k = k n n-k-1 (2)
y por tanto, en particular,

• Demostración. Por (1), y usando inducción, encontramos que

Tn,k = 8
n-k (
n~
k) (k - 1 + í)(n - 1)n-1-k-i (í--;n-k-í)

nn-k _ (n _ k) ~ (n ~ ~ ~ k}n _ 1)i-1

nn-k _ (n _ k) n%r (n - ~- k) (n _ l)i

nn-k _ (n - k)nn-1-k = kn n- 1- k . o
La fórmula de Cayley para el número de árboles 177

• Cuada demostraci6n Obtenemos la fórmula de


y su generalización (2), a partir de una idea genial de Jim Pitman sin inducción
o biyección - sólo contando astutamente de dos maneras.
Un bosque con raíz con vértices en {1, ... ,n} es un bosque junto con una
elección de raíz en cada árbol. Sea :Fn,k el conjunto de todos los bosques con
raíz que están formados por k árboles con raíz. Por tanto, :Fn,l es el conjunto
de todos los árboles con raíz.
2
Nótese que l:Fn,ll = nTn , ya que en cada árbol hay n elecciones para la
raíz. Ahora pensamos en Fn,k E :Fn,k como un grafo dirigido con todas las
aristas "alejándose" de la raíz. Diremos que un bosque F contiene a otro
bosque F' si F contiene a F' como grafo dirigido. Claramente, si F contiene 9
a F' propiamente, entonces F tiene menos componentes que F'. La figura
muestra dos bosques de este tipo, con las raÍCes en la parte de arriba.
He aquí la idea crucial. Decimos que una sucesión F 1 , ... , F k de bosques una F2 contiene a F3
sucesión refinadora si Fi E :Fn,i y Fi contiene a Fi+l para todo i.
8 4 7
Sea ahora Fk un bosque fijo en :Fn,k, y denotamos

1:
G por N(Fk ) el número de árboles con raíz que contienen a Fk, y
9
2 1
G por N* (Fk ) el número de sucesiones refinadoras que acaban en Fk.
F3
Contamos N* (Fk ) de dos maneras distintas, primero empezando en un árbol, 10
yen segundo lugar empezando en Fk. Supongamos que Fl E :Fn,l contiene
a Fk. Ya que podemos borrar las k - 1 aristas de Fl \Fk en cualquier orden
posible para obtener una sucesión refinadora de Fl a Fk, vemos que

(3)

-]lo>-- _
Empecemos ahora por el otro lado. Para llegar a un Fk-l desde F k , tenemos ,/ 4
8 7
que añadir una arista dirigida desde cualquier vértice a hasta cualquiera de las
k - 1 raíces de los árboles que no contienen a a (véase la figura a la derecha,
/\l
donde pasamos de F3 a F 2 añadiendo la arista 3~... ~7). Por tanto, tenemos
n( k - 1) elecciones. De manera similar, para Fk-l podemos añadir una arista
dirigida desde cualquier vértice b a cualquiera de las k - 2 raíces de los árboles
que no contienen a b. Para ello tenemos n(k - 2) posibilidades de elección.
Continuando de esta manera, llegamos a
2

F3 ----t F2
3
1: 1

10
9

(4)
y con ello obtenemos, usando (3), la relación tan inesperadamente sencilla

para cualquier Fk E :Fn,k'

Para k = n, el bosque Fn está formado de n vértices aislados. Por tanto,


N(Fn ) cuenta el número de todos los árboles con raíz, y hemos obtenido el
resultado l:Fn,ll = nn-l, y por tanto la fórmula de Cayley. O

Pero podemos sacar aún más partido de esta demostración. Del caso k = n de
la fórmula (4) resulta que

# {sucesiones refinadoras (F1 , F 2 , ... , F n) } (5)


178 Lafónnula de Cayley para el número de árboles

Para Fk E J"n,b sea N** (Fk) el número de sucesiones refinadoras , ... , Fn


cuyo término k-ésimo es Fk. Claramente este número es N* (Fk) multiplicado
por el número de maneras de elegir (Fk + 1 , ... ,Fn ). Pero este último número
es (n - k)!, ya que podemos borrar las n-k aristas de Fk en cualquier orden.
Por tanto,

Puesto que este número no depende de la elección de F k , el resultado de la


división de (5) entre (6) proporciona el número de bosques con raíz con k
árboles:

Ya que podemos elegir las k raíces de (~) maneras distintas, hemos vuelto a
demostrar la fórmula Tn,k = knn-k-l sin necesidad de inducción.

Acabaremos con una nota histórica. Carl W. Borchardt publicó un artículo en


1860 anticipándose a Cayley, que publicaría su trabajo en 1889; este hecho
fue reconocido por el propio Cayley. Un resultado equivalente apareció aún
antes, en un trabajo de James J. Sylvester (1857), véase [2, capítulo 3]. La
novedad en el artículo de Cayley fue el uso de la terminología de la teoría de
grafos, y el teorema lleva su nombre desde entonces.

[1] M. AIGNER: Combinatorial Theory, Springer-Verlag, Berlin Heidelberg New


York 1979; Reprint 1997.
[2] N. L. BIGGs, E. K. LLOYD & R. J. WILSON: Graph Theory 1736-1936, Cla-
rendon Press, Oxford 1976.
[3] A. CAYLEY: A theorem on trees, Quart. J. Pure Appl. Math. 23 (1889), 376-378;
Collected Mathematical Papers Vol. 13, Cambridge University Press 1897, 26-28.
[4] A. J OYAL: Une théorie combinatoire des séries formelles, Advances in Math. 42
(1981),1-82.
[5] J. PITMAN: Coalescent random forests, J. Combinatorial Theory, Ser. A 85
(1999),165-193.
[6] H. PRÜFER: Neuer Beweis eines Satzes über Permutationen, Archiv der Math. u.
Physik (3) 27 (1918), 142-144.
[7] A. RÉNYI: Some remarks on the theory oftrees. MTA Mat. Kut. Inst. Kozl. (Publ.
math. Inst. Hungar. Acad. Sci.) 4 (1959), 73-85; Selected Papers Vol. 2, Akadé-
miai Kiadó, Budapest 1976, 363-374.
[8] J. RIORDAN: Forests of labeled trees, J. Combinatorial Theory 5 (1968),
90-103.
Entre los objetos combinatorios más antiguos se encuentran los Cuadrados
1 2 3 4
latinos, que aparentemente se estudian desde tiempos inmemoriales. Para ob-
tener un cuadrado latino, se han de rellenar las n 2 casillas de un cuadrado 2 1 4 3
(n x n) con los niimeros 1,2, ... ,n de manera que cada número aparezca
4 3 1 2
exactamente una vez en cada fila y cada columna. En otras palabras, cada una
de las filas y columnas representan permutaciones del conjunto {1, ... ,n}. 3 4 2 1
Nos referiremos a n como el orden del cuadrado latino.
Un cuadrado latino de orden 4
He aquí el problema que nos interesa discutir: Alguien comienza a rellenar
las celdas con los números {1, 2, ... ,n}. En algún momento se detiene y nos
pide continuar hasta obtener un cuadrado latino. ¿En qué condiciones será
posible hacerlo? Para que no sea imposible, supondremos que al comenzar
nuestra tarea cada elemento aparece a lo sumo una vez en cada fila y en cada
columna. Demos un nombre a esta situación: Hablaremos de un cuadrado
latino parcial de orden n si algunas celdas de un cuadrado (n x n) están
rellenas con números del conjunto {1, ... , n}, de tal manera que cada número
aparece como máximo una vez en cada fila y en cada columna. Hecho esto,
nuestro problema es el siguiente:

¿ En qué condiciones puede completarse un cuadrado latino parcial


para obtener un cuadrado latino del mismo orden? 1 4 2 5 3

Veamos unos cuantos ejemplos. Supongamos las n-1 primeras filas rellenas y 4 2 5 3 1
la última vacía. En esta situación podemos completar la última fila fácilmente: 2 5 3 1 4
Cada elemento aparece n 1 veces en el cuadrado latino parcial, y de aquí
que esté ausente exactamente de una columna. Basta por tanto escribir cada 5 3 1 4 2
elemento bajo dicha columna y habremos completado el cuadrado. 3 1 4 2 5
En cambio, si sólo está rellena la primera fila, es fácil completar el cuadrado
Un cuadrado latino cíclico
rotando los elementos cíclicamente en las filas siguientes.
De este modo, mientras que en el primero de los ejemplos existe una única
manera de completar el cuadrado, para el segundo existen muchas posibilida-
des. En general, cuantas menos celdas estén rellenas de partida, más libertad 1 2 ... n-1
deberíamos tener a la hora de completar el cuadrado. n
Sin embargo, en el margen se muestra un ejemplo de cuadrado parcial en el
que sólo aparecen rellenas n celdas y que no puede ser completado, puesto que
no hay manera de rellenar la esquina superior derecha sin violar la condición
impuesta a la fila o a la columna.

Si el número de filas que aparecen rellenas en una malla (n x n) es


menor que n, ¿puede siempre completarse para obtener un cuadrado
Un cuadrado latino parcial que no puede
latino?
ser completado
180 Completando cuadrados latinos

Esta pregunta fue por Trevor Evans in 1960, y la de que


es posible se difundió rápidamente como la "conjetura de Evans." Por su-
puesto, uno trataría de demostrarlo por inducción, y así es como finalmente
fue resuelto el problema por Bohdan Smetaniuk en 1981. Sin embargo, su
trabajo ilustra cuánta sutileza puede llegar a precisarse en una demostración
por inducción. Más aún, su prueba es constructiva, y permite completar explí-
citamente el cuadrado a partir de cualquier configuración parcial.
Antes de comenzar con la demostración, exploraremos los cuadrados latinos
en general con un poco de detalle. De manera alternativa, podemos referimos
1 3 2
a un cuadrado latino utilizando una disposición de tamaño (3 x n 2 ), que en
2 1 3 adelante llamaremos disposición en lineas del cuadrado latino. El margen
muestra un cuadrado latino de orden 3 y su disposición en líneas asociada,
3 2 1 donde F, e y E denotan, respectivamente, filas, columnas y elementos.
F: 1 1 1 2 2 2 3 3 3 La condición de cuadrado latino es equivalente a decir que en dos líneas cua-
c: 1 23 1 23 1 23 lesquiera de esta disposición aparecen todos los n 2 pares ordenados (y por
E: 1 3 2 2 1 3 3 2 1 tanto que cada par aparece exactamente una vez). Por tanto, podemos per-
mutar los símbolos de cada línea de manera arbitraria (lo cual corresponde
a permutar filas, columnas o elementos) y obtener de nuevo un cuadrado la-
tino. Pero la condición nos dice más: los elementos no juegan ningún papel
especial. Podemos permutar las líneas (como un todo), preservando las con-
Si permutamos cíclicamente las líneas diciones de la disposición en líneas, y por tanto del cuadrado latino.
del ejemplo anterior, Llamamos conjugados a los cuadrados latinos conectados por tales permuta-
F ---> C ---> E ---> F, entonces ciones. La siguiente observación será muy útil: A todo cuadrado latino parcial
obtenemos el cuadrado latino y la
le corresponde una disposición parcial en líneas (cada par aparece a lo sumo
disposición siguientes:
una vez en dos líneas cualesquiera), y todo conjugado de un cuadrado latino
1 2 3 parcial es, de nuevo, un cuadrado latino parcial. En particular, un cuadrado
latino parcial puede completarse si y sólo si puede serlo cualquier conjugado
3 1 2 (basta completar el conjugado e invertir la permutación de las tres líneas).
2 3 1 Necesitamos dos resultados, debidos a Herbert J. Ryser ya Charles C. Lindner,
y que eran conocidos con anterioridad al teorema de Smetaniuk. Si en un
F: 1 3 2 2 1 3 3 2 1 cuadrado latino las primeras r filas aparecen completas y el resto de las celdas
C: 1 1 1 2 2 2 3 3 3
están vacías, hablamos de un rectángulo latino de dimensión (r x n).
E: 1 23 1 2 3 1 2 3
Lema 1. Cualquier rectángulo latino de dimensiones (r x n), r < n, puede
extenderse a un rectángulo latino (( r + 1) x n), y por tanto puede completarse
para obtener un cuadrado latino .
• Demostración.. Aplicamos el teorema de Hall (véase capítulo 23). Sea
Aj el conjunto de números que no aparecen en la columna j. Para que una
fila sea admisible como (r + l)-ésima ha de corresponder a un sistema de
representantes distintos para la colección Al, ... , An. Para demostrar el lema,
por tanto, hemos de verificar la condición de Hall (H). Cualquier conjunto Aj
tiene tamaño n - r, y cada elemento está precisamente en n - r conjuntos Aj
(ya que aparece r veces en el rectángulo). Cualesquiera m de los conjuntos Aj
contienen en total m( n - r) elementos, y por tanto al menos m diferentes, lo
cual es precisamente la condición (H). O
Lema 2. Sea P un cuadrado latino parcial de orden n con, a lo sumo, n - 1
casillas rellenas y como máximo ~ elementos distintos. Entonces P puede
completarse para obtener un cuadrado latino de orden n.
Completando cuadrados latinos 181

• Demostración. En transfonnamos el en otro más


conveniente. Según el principio de congujación que discutimos anteriormente,
podemos reemplazar la condición "a lo sumo ~ elementos distintos" por la
condición de que las entradas aparezcan en, a lo sumo, ~ filas, y suponer in-
cluso que estas filas son las superiores. Por tanto, supongamos que las filas
que tienen sus celdas ocupadas son las celdas 1, 2, ... , r, con fi casillas re-
llenas en la fila i, siendo r ::::: ~ y L~=l fi ::::: n - 1. Pennutando las filas,
podemos asumir que h 2': 12 2': '" 2': fr. A continuación completamos las
filas 1, ... , r paso a paso hasta obtener un rectángulo de dimensiones (r x n),
el cual puede completarse hasta obtener un cuadrado latino por el lema l.
Supongamos ya rellenas las filas 1,2, ... ,f! - 1. En la fila f! hay fe casillas
rellenas que podemos suponer que son las inferiores. Esta situación se muestra
en la figura del margen, ella que se han sombreado las casillas rellenas.
Se consigue completar la fila f! mediante otra aplicación del teorema de Hall,
aunque esta vez la aplicación es más sutil. Sea X el conjunto de elementos que Una situación para n = 8, con f! = 3,
no aparecen en la fila f!, por tanto IXI = n-fe. Para j = 1, ... , n - h, sea fl = h = h = 2, f4 = 1. Las celdas
Aj el conjunto de aquellos elementos de X que no aparecen en la columna j más oscuras representan las que apare-
(ni por encima ni por debajo de la fila f!). De aquí, para completar la fila f! cían rellenas previamente; las más cla-
debemos verificar la condición (H) para la colección Al, ... , An- fg' ras muestran las que han sido rellenadas
En primer lugar afinnamos que en el proceso.

n-fe-f!+l > f!-1+fH1+···+fr· (1)

El caso f! = 1 es claro. En otro caso, de L~=l fi < n, h > > fr y


1 < f! ::::: r se deduce que
r
n > ¿fi 2': (f!-1)fe-1+fe+···+fr'
i=l

Ahora, o bien h-1 2': 2 (en cuyo caso se verifica (1)) o fe-1 = 1. En el último
caso, (1) se reduce a n > 2(f! - 1) + r - f! + 1 = r + f! - 1, lo cual es cierto
porque!! ::::: r ::::: ~.
Tomemos ahora m conjuntos Aj, 1::::: m ::::: n- fe, y sea B su unión. Debemos
demostrar que IBI 2': m. Consideremos el número e de casillas en las m
columnas que corresponden a los Aj que contienen elementos de X. Existen
a lo sumo (f! - l)m celdas de este tipo por encima de la fila f! y a lo sumo
fH1 + ... + fr por debajo. De ahí que
e ::::: (f!-1)m+fH1+"'+fr.

Por otro lado, cada elemento x E X\B aparece en cada una de las m colum-
nas, y de aquí que 2': m(IXI - IBI), y por tanto (con IXI = n - h),
IBI 2': IXI-~c 2': n-h-(f!-1)-~(fH1+.·.+fr)'

Se sigue que IBI 2': m si


n-h-(f!-1)-~(fH1+ ... +fr) > m-1,
esto es, si
m(n-fe-f!+2-m) > fH1+"'+fr. (2)
La desigualdad (2) es cierta para m = 1 Y para m = n - h - f! + 1 por (l).
182 Completando cuadrados latinos

e
Por tanto, la desigualdad es cierta para todo m entre 1 y n-iR - + 1, ya que
la mitad del primer miembro es una función cuadrática en m con coeficiente
principal -1. El caso que falta es m > n-iR - e + 1. Puesto que cualquier
elemento x de X está contenido en, a lo sumo, e - 1 + JC+l + ... + Jr filas,
también puede aparecer en, a lo sumo, el mismo número de columnas. De
nuevo por (1), deducimos que x está en algún conjunto Aj, de modo que en
este caso B = X, IBI = n-iR .:::: m, y la demostración queda completa. O
Por último, demostraremos el teorema de Smetaniuk.
Teorema. Cualquier cuadrado latino parcial de orden n con a lo sumo n - 1
casillas rellenas puede completarse a un cuadrado latino del mismo orden.
• Demostración. Utilizamos inducción sobre n, siendo trivial el caso de base
n ::; 2. Partimos pues de un cuadrado latino parcial de orden n .:::: 3 con a lo
2 7 sumo n - 1 casillas rellenas. Utilizando la notación anterior, estas celdas
5 4 están situadas en r ::; n - 1 filas diferentes que numeramos SI, . .. ,Sr> Y que
contienen ah, ... ,ir > O casillas rellenas, donde ¿~=1 Ji ::; n - 1.
Según el lema 2, podemos suponer que existen más de ~ elementos diferen-
5 tes. Por tanto, existe un elemento que aparece una sola vez; es más, después
de permutar las filas (si es necesario), podemos suponer que el elemento n
aparece una sola vez, y que esto ocurre en la fila SI.
4 En el paso siguiente queremos permutar las filas y columnas del cuadrado la-
tino parcial de tal manera que, después de llevar a cabo las permutaciones,
todas las casillas rellenas queden por debajo de la diagonal- excepto para la
casilla con n, que acabará en ella. (La diagonal está formada por las casillas
(k, k) con 1 ::; k ::; n.) Veamos cómo se puede conseguir esto. En primer
" lugar permutamos la fila SI hasta la posición h. Permutando las columnas
2 7 movemos todas las casillas rellenas hacia la izquierda, de manera que n apa-
rezca como el último elemento de su fila sobre la diagonal. A continuación
• movemos la fila S2 hasta la posición 1 + h + 12, y las casillas rellenas tantas
• posiciones a la izquierda como sea posible.
En general, movemos la fila Si hasta la posición 1 + h + 12 + ... + Ji, para
4 5 • 1 < i ::; r, y las casillas rellenas tantas posiciones a la izquierda como sea
5 • posible. El dibujo de la izquierda muestra un ejemplo, con n = 7: las filas
SI = 2, S2 = 3, S3 = 5 Y S4 = 7 con h = 12 = 2 Y h = J4 = 1 se mueven
4 • hasta las filas numeradas como 2, 5, 6 Y 7, Y las columnas se permutan "hacia
la izquierda" de manera que, al final, todas las entradas excepto la 7 están
situadas por debajo de la diagonal, que se ha señalado mediante "",".
Para poder aplicar inducción, quitamos la entrada n de la diagonal e ignoramos
la primera fila y la última columna (que no tienen ninguna casilla rellena). Por
2 3 4 1 6 5 tanto, estamos frente a un cuadrado latino parcial de orden n - 1 que tiene a
lo sumo n - 2 casillas rellenas, el cual puede completarse por inducción hasta
5 6 1 4 2 3 obtener un cuadrado latino de orden n -1. Una de las muchas posibilidades de
1 2 3 6 5 4 hacerlo en nuestro ejemplo se muestra en la figura del margen. Las entradas
originales se han marcado en negrita. Éstas son ya entradas finales, al igual
6 4 5 2 3 1 que los elementos en casillas sombreadas. Del resto de las entradas, algunas
3 1 6 5 4 2 cambiarán a continuación para poder completar el cuadrado latino de orden n.
En el paso siguiente queremos mover los elementos de la diagonal del cua-
4 5 2 3 1 6
drado hasta la última columna y reemplazarlos por entradas n. Sin embargo,
Completando cuadrados latinos 183

no hacerlo en ya que los elementos de la no tienen


porqué ser distintos. Por tanto, procedemos con más cuidado y efectuamos,
para k = 2,3, ... ,n - 1 (en este orden), la operación siguiente:
Colocamos el valor n en la casilla (k, n). Esto conduce a un cuadrado latino
parcial correcto. A continuación intercambiamos el valor Xk en la casilla
diagonal (k, k) con el valor n en la casilla (k, n) de la última columna.
Si el valor Xk no aparecía anteriormente en la última columna, entonces nues-
tro trabajo para el valor k ha concluido. Después de hacer esto, los elementos
que aparecen en la columna k-ésima no se cambiarán más.
En nuestro ejemplo, este método funciona sin problemas para k = 2, 3 Y 4, Y
los elementos correspondientes en la diagonal se mueven a la última columna.
Los siguientes diagramas muestran las operaciones correspondientes.

-- .------- ------- ---


r- 5""- C>-7
2 3" 4 1 6 7 5 2 7 4 1 6 5 3
--- -- JL -- ---o
2 4 1 3
7 7 4 1
5 6 1 4 2 3 5 6 1 4 2 3 5 6 .-2.. - 3
.......

1 2 3 6 5 4 1 2 3 6 5 4 1 2 3 6? 5 4 7
6 4 5 2 3 1 6 4 5 2 3 1 6 4 5 2 3 1
3 1 6 5 4 2 3 1 6 5 4 2 3 1 6 5 4 2
4 5 2 3 1 6 4 5 2 3 1 6 4 5 2 3 1 6

Ahora hemos de tratar el caso en que ya existe un elemento Xk en la última


columna. En este caso procederemos de la manera siguiente: k n
Si ya existe un elemento Xk en una casilla (j, n) con 2 :::; j < k, entonces
intercambiamos en la fila j el elemento Xk de la n-ésima columna con el
elemento x~ en la k-ésima columna. Si el elemento x~ también aparece en una x~ Xk J
casilla (jI, n), entonces: intercambiamos también en la fila j' los elementos de
la columna n-ésima y k-ésima, y así sucesivamente.
Si continuamos de esta manera no obtendremos nunca dos entradas iguales en x"k x~ j'
una fila. Nuestro proceso de intercambio asegura que nunca coincidirán dos Xk n k
elementos iguales en una columna. Por tanto, sólo tenemos que verificar que
el proceso de intercambio entre las columnas k-ésima y n-ésima no lleva a un
bucle infinito. Esto puede verse a partir del siguiente grafo bipartito G k : Sus
vértices corresponden a las casillas (i, k) y (j, n) con 2 :::; i, j :::; k, cuyos
elementos pueden intercambiarse. Existe una arista entre (i, k) y (j, n) si
estas dos casillas están en la misma fila (esto es, para i = j), o si las casillas
contienen el mismo elemento antes del intercambio (lo cual implica i i= j).
En nuestro esbozo, las aristas para i = j aparecen punteadas, las otras no.
Todos los vértices en G k tienen grado 1 ó 2. La casilla (k, n) corresponde a
un vértice de grado l. Este vértice es el comienzo de un camino que lleva a la
columna k sobre una arista horizontal, luego posiblemente de vuelta otra vez
a la columna n sobre una arista inclinada, luego de vuelta horizontalmente
hasta la columna k y así sucesivamente. El camino acaba en la columna k
en un valor que no aparece en la columna n. Así pues, las operaciones de
intercambio acabarán con un paso en el cual llevamos un elemento nuevo a la
184 Completando cuadrados latinos

última columna. Así tennina el con la colmlli1a k, y los elementos de


las celdas (i, k) para i 2: 2 no variarán en adelante.
En nuestro ejemplo, estos intercambios se dan para k = 5: El elemento X5 = 3
ya aparece en la última columna, de modo que esa entrada ha de ser devuelta a
la columna k = 5. Pero el elemento intercambiable x~ = 6 tampoco es nuevo,
así que se intercambia con x~ = 5, Y esté sí es nuevo .

. -------.

2 7 4 1 6 5 3 2 7 4 1 3 5 6

5 6 7 4 2 .-
3
-.
1 5 6 7 4 2 3 1

1 2 3 7 5 4
.-------.
6 1 2 3 7 6 4 5

6 4 5 2 3 1 7 6 4 5 2 7 1 3
3 1 6 5 4 2 3 1 6 5 4 2
4 5 2 3 1 6 4 5 2 3 1 6

Por último, el intercambio para k = 6 = n - 1 no es ningún problema, y


después de esto el cuadrado latino se completa de manera única:

7 3 1 6 4 2 4
2 7 4 1 3 5 6 2 7 4 1 3 5 6 2 7 4 1 3 5 6
5 6 7 4 2 3 1 5 6 7 4 2 3 1 5 6 7 4 2 3 1
1 2 3 7 6 4 5 1 2 3 7 6 4 5 1 2 3 7 6 4 5
6 4 5 2 7 1Íl".. ..j;3 6 4 5 2 7 1 3 6 4 5 2 7 1 3
3 1 6 5 4 2 7 3 1 6 5 4 7 2 3 1 6 5 4 7 2
4 5 2 3 1 6 4 5 2 3 1 6 4 5 2 3 1 6 7

... y lo mismo ocurre en general: Colocamos un elemento n en la celda (n, n),


y después de hacerlo la primera fila puede completarse con los elementos que
faltan de las respectivas columnas (ver lema 1), terminándose así la demostra-
ción. Para completar de manera explícita el cuadrado latino parcial original de
orden n, únicamente hemos de invertir las permutaciones de elementos, filas
y columnas en los primeros dos pasos de la demostración. O

[1] T. EVANS: Embedding incomplete Latin squares, Amer. Math. Monthly 67


(1960),958-961.
[2] C. C. LINDNER: On completing Latin rectangles, Canadian Math. Bulletin 13
(1970),65-68.
[3] H. J. RYSER: A combinatorial theorem with an application to Latin rectangles,
Proc. Amer. Math. Soco 2 (1951), 550-552.
[4] B. SMETANIUK: A new construction on Latín squares 1: A proof of the Evans
conjecture, Ars Combinatoria 11 (1981), 155-172.
El problema de los cuatro colores dio un impulso decisivo para que la teoría
de grafos se desarrollara tal y como la conocemos hoy en día. En general, los
problemas de coloreado están todavía entre los más interesantes para quienes
se dedican a la teoría de grafos. Uno de estos problemas, sencillo en aparencia,
fue planteado por Jeff Dinitz en 1978, y sin embargo se resistió a todos los
intentos de demostración hasta que quince años después Fred Galvin dio con J
una solución sorprendentemente sencilla. 1
C(i,j)
2
Se consideran n celdas ordenadas en un cuadrado (n x n), y se es-
cribe (í, j) para la celda en lafila i y columna j. Supóngase que cada ~
celda (í,j) tiene asignado un conjunto C(í,j) de n colores.
+--
siempre posible colorear la matriz completa eligiendo para cada
celda (i, j) un color del conjunto C( i, j), de manera que los colores
que aparecen en cada fila y columna sean distintos?

Para comenzar, consideremos el caso en el que todos los conjuntos de colores


C( i, j) son iguales, por ejemplo {l, 2, ... ,n}. Entonces el problema de Dinitz
se reduce a rellenar el cuadrado (n x n) con los números 1, 2, ... , n de manera
que en cada fila y columna no haya dos números iguales. En otras palabras,
cualquier coloración corresponde a un cuadrado latino, tal y como se discutió
en el capítulo anterior. Así pues, en este caso la respuesta al problema es "sí".
Este caso era sencillo, de manera que vayamos al caso general, en el cual el
conjunto C := Ui,j C(i, j) contiene más de n colores. La dificultad ahora de-
riva del hecho de que no todos los colores de C son válidos para cada celda.
Por ejemplo, mientras que en el caso del cuadrado latino podemos elegir ar-
bitrariamente una permutación de colores para la primera fila, esto ya no es
posible en el caso general. El caso de n = 2 ya ilustra esta dificultad.
Supongamos dados los conjuntos de colores que se indican en la figura. Si {l, 2} {2, 3}
elegimos los colores 1 y 2 para la primera fila, ya tenemos un problema, puesto
que tendríamos que elegir el color 3 para ambas celdas en la segunda fila. {l, 3} {2, 3}
Antes de abordar el problema de Dinitz, traduzcamos la situación al lenguaje
de la teoría de grafos. Como es habitual, consideramos grafos G = (V, E)
sin bucles ni aristas múltiples. Sea x( G) el número cromático del grafo, esto
es, el menor número de colores que pueden asignarse a sus vértices de manera
que vértices adyacentes reciban colores distintos.
En otras palabras, colorear el grafo requiere una partición de V en clases (colo-
readas con el mismo color) de manera que no haya aristas entre vértices de una
clase. Si llamamos independiente a un conjunto A <;;; V en una partición de
este tipo, vemos que el número cromático es el menor número de conjuntos
independientes que da lugar a una partición del conjunto de vértices V.
186 El problema de Dinitz

En 1976 Y tres años más tarde y estudiaron


la siguiente variante, que nos conduce directamente al problema de Dinitz:
Supóngase que en el grafo G = (V, E) tenemos asignado un conjunto C (v)
de colores para cada vértice v. Una coloración por listas es una coloración
e : V --+ UvEV C( v) donde c( v) E C( v) para cada v E V. La definición
del número cromático por listas Xi! (G) debería estar ahora clara: es el menor
número k de modo que para cualquier lista de conjuntos de colores C (v) con
IC(v)1 = k para todo v E existe siempre una coloración por listas. Por
supuesto, Xi! (G) :::: IVI (nunca se nos acaban los colores). Ya que cualquier
coloración ordinmia es el caso especial de una coloración por listas cuando
todos los conjuntos C (v) son iguales, obtenemos pm-a cualquier grafo G
X(G) :::: Xi!(G).
Volviendo al problema de Dinitz, considérese el grafo Sn, que tiene como
conjunto de vértices las n 2 celdas de nuestra matriz (n x n), y dos celdas son
adyacentes si y sólo si están en la misma fila o columna.
El grafo S3 Puesto que cualesquiera n celdas en una fila son adyacentes dos a dos, son
necesarios al menos n colores. Más aún, cualquier coloración con n colores
corresponde a un cuadrado latino en el que las celdas ocupadas por un mismo
número de colores dan lugar a una clase de color. Como los cuadrados lati-
nos, tal y como hemos visto, existen, podemos inferir que X(Sn) = n, y el
problema de Dinitz puede enunciarse de manera sucinta así:
¿Xi!(Sn) = n?

Uno podría pensar que tal vez se verifica X( G) = Xi! (G) para cualquier grafo,
pero nada más lejos de la verdad. Considérese el grafo G = K 2 ,4. Su número
{1,3} cromático es 2, ya que podemos usar un color para los dos vértices de la iz-
{1,2} quierda y un segundo color para los vértices de la derecha. Pero supongamos
{1,4} que nos dan los conjuntos de colores indicados en la figura.
Para colorear los vértices de la izquierda tenemos las cuatro posibilidades 113,
114, 213 Y 214, pero cualquiera de estos pares aparece como un conjunto de
{2,3} colores en la parte de la derecha, de modo que no es posible una coloración con
{3,4} lista. De aquí que Xc (G) ~ 3, Y el lector puede encontrar divertido comprobar
{2,4} que Xc (G) = 3 - ¡no hay necesidad de probar todas las combinaciones!
Generalizando este ejemplo, no es difícil encontrar grafos G en los cuales
X( G) = 2, pero Xc (G) es arbitrariamente grande. Así pues, el problema de la
coloración por listas no es tan fácil como parece a primera vista_
Volvamos al problema de Dinitz_ Un paso importante hacia la solución fue
dado por Jeanette Janssen en 1992, cuando demostró que Xc (Sn) :::: n + 1, Y
Fred Galvin dio el golpe de gracia combinando ingeniosamente dos resultados
que ya se conocían desde hacía mucho. Discutiremos a continuación ambos
resultados y veremos que implican la igualdad Xc (Sn) = n.
Nos hace falta un poco de notación. Si v es un vértice del grafo G, entonces
denotamos por d (v) el grado de v. En nuestro grafo cuadrado Sn cada vértice
tiene grado 2n - 2, ya que hay otros n - 1 vértices en la misma fila y en la
misma columna.
Para un subconjunto A c:;: V denotamos por G A el sub grafo que tiene a A
como conjunto de vértices y que contiene todas las aristas de G entre los vér-
El problema de Dinitz 187

tices de A. Llamamos a G A el inducido por y decimos que H es


un subgrafo inducido de G si H = G A para algún A.
e
Nuestro primer resultado trata de grafos dirigidos = (V, E), es decir, grafos
en los que cada arista e tiene una orientacion. La notación e = (u, v) signi-
fica que existe un arco e, denotado también u --+ v, cuyos vértices inicial y
final son, respectivamente, u y v. Tiene sentido por tanto hablar del grado
de salida d+ (v) y grado de entrada d~ (v ), donde d+ (v) cuenta el número
de aristas con v como vértice inicial, y análogamente para d~ (v); aún más,
d+(v) + d~(v) = d(v). Cuando escribimos G, nos referimos al grafo sin e
las orientationes.
El siguiente concepto surgió del análisis de juegos y tendrá un papel clave en
la discusión que nos ocupa.

Definición 1. Sea e
= (V, E) un grafo dirigido. Un núcleo K C;;; V es un
subconjunto de los vértices tal que
a
(i) K es independiente en G, y
(ii) para cada u ti- K existe un vértice v E K con una arista u --+ v.
f
Observemos el ejemplo de la figura. El conjunto {b, e, f} constituye un nú-
cleo, pero el sub grafo inducido por {a, e, e} no tiene ningún núcleo, ya que
las tres aristas constituyen un cíclo entre los vértices.
Ahora ya estamos listos para enunciar el primer resultado.

Lema 1. Sea e = (V, E) un grafo dirigido, y supongamos que para cada


e
vértice v E V tenemos un conjunto de colores (v) con más elementos que d
su grado de salida, le (v) I 2:: d+ (v) + 1. Si cada subgrafo inducido de e
tiene un núcleo, entonces existe una coloración por listas de G con un color
de e(v) para cada v.

11 Demostración. Procederemos por inducción sobre IVI. Si IVI = 1 no hay


nada que probar. Elegimos un color c E e = UvEV e(v) y un conjunto

A(c) := {v E V: e E e(v)}.

Por hipótesis, el sub grafo inducido G A( e) tiene un núcleo K (e). Ahora colo-
reamos todos los v E K (e) con el color e (esto es posible, ya que K (c) es
independiente), y eliminamos K(c) de G y e de e. Sea G I el de G subgrafo
inducido por V\K (e) con el (v) = e (v) \ e como la nueva lista de colores.
Nótese que para cada v E A(e)\K(e), el grado exterior d+(v) se reduce al
menos en 1 (por la condición (ii) de ser núcleo). Así que d+ (v) + 1 :::; Iel (v) I
se verifica aún en el.La misma condición también se verifica para los vértices
que no pertenecen a A (e), ya que en este caso el conjunto de colores v) noe(
varía. El nuevo grafo G I contiene menos vértices que G, y el resultado se
obtiene por inducción. O

El método para resolver el problema de Dinitz resulta ahora obvio: Hemos de


encontrar una orientación del grafo Sn con grados exteriores d+ (v) :::; n - 1
para todo v y que asegure la existencia de un núcleo para todos los sub grafos
inducidos. Esto se logra mediante nuestro segundo resultado.
188 El problema de

De nuevo necesitamos algunos Recuérdese 9) que


un grafo bipartito G = (X U Y, E) es un grafo con la siguiente propiedad:
El conjunto de vértices V se puede dividir en dos partes, X e Y, tales que
cada arista tiene un extremo en X y el otro en Y. En otras palabras, los grafos
bipartitos son precisamente los que pueden colorearse con dos colores (uno
para X y otro para Y).
Ahora veamos otro concepto importante, el de los "emparejamientos esta-
x y bles", que tiene una sencilla interpretación. Un emparejamiento M en un
grafo bipartito G = (X U Y, E) es un conjunto de aristas que no contiene dos
aristas con extremos comunes. En el grafo del dibujo las aristas en negrita
forman un emparejamiento.
Supongamos que X es un conjunto de hombres e Y un conjunto de mujeres, e
interpretemos uv E E como la posibilidad de que u y v se casen. Un empare-
Un grafo bipartito G = (X U Y, E) con jamiento sería entonces una boda multitudinaria en la que ninguna persona es
un emparejamiento. bígama. Para nuestro propósito, necesitamos una versión más refinada (¿y más
realista?) de los emparejamientos, que sugirieron David Gale y Lloyd S. Sha-
pley. Es evidente que en la vida real cada persona tiene sus preferencias, y
esto es lo que hemos de tener en cuenta. En G = (X U Y, E) suponemos que
para cada v E X U Y existe una valoración del conjunto N (v) de vértices ad-
yacentes a v, N ( v) = {Zl > Z2 > ... > Zd( v)}. Así, Zl es la mejor elección
para v, después Z2, Y así sucesivamente.
Definición 2. Un emparejamiento M de G = (X U Y, E) se llama estable si
se verifica la siguiente condición: Siempre que uv E E\M, u E X, v E Y
entonces, o bien, uy E M con y> ven N(u), o bien xv E M con x> u en
N (v), o se verifican ambas.

En nuestra interpretación, un conjunto de matrimonios es estable si nunca su-


cede que u y v no están casados pero u preferiría tener como pareja a v antes
que a la suya propia (si es que tiene) y v preferiría a u en lugar de la suya (si
es que tiene), lo cual crearía evidentemente una situción de inestabilidad.
Antes de probar nuestro segundo resultado, observemos el ejemplo siguiente:

Las aristas en negrita constituyen un {A >C} a A {e> d> a}


emparejamiento estable. En cada lista {C >D > B} b B {b}
de prioridades, la elección que conduce
a un emparejamiento estable está im- {A >D} e C {a> b}
presa en negrita. {A} d D {e> b}

En este ejemplo existe un único emparejamiento máximo M con cuatro aris-


tas, M = {aC, bB, eD, dA}, pero M no es estable (considérese eA).

Lema 2. Siempre existe un emparejamiento estable .

• Demostración. Consideremos el siguiente algoritmo. En el primer paso,


todos los hombres u E X se declaran a su primera elección. Si una mujer
recibe más de una proposición, elige a quien más le gusta y apunta su nombre,
y si recibe una única, apunta el nombre de aquél pretendiente. El resto de
los hombres son rechazados y pasan a formar parte de la reserva R. En el
El problema de Dinitz 189

paso, todos los hombres hacen su Las


comparan las proposiciones (junto con la que ya tienen apuntada, si es que
tienen alguna), eligen a su favorito y se lo apuntan. El resto son rechazados
y forman el nuevo conjunto R. Ahora, los hombres de R se declaran a su
siguiente elección, y así sucesivamente. Un hombre que se haya declarado a
su última elección y sea rechazado deja de ser tenido en cuenta (incluso deja
de fo.~mar parte de la reserva). Es evidente que en algún momento la reserva R
queda vacía, y en este momento se detiene el algoritmo.

¡mma!cum. Cuando el algoritmo se detiene, los hombres apuntados,


junto con las mujeres correspondientes, forman un emparejamiento
estable.

Nótese en primer lugar que el orden en el cual una mujer concreta apunta a
sus hombres está de acuerdo con sus preferencias, ya que en cada paso ella
compara al nuevo pretendiente con su pareja actual y elige a su favorito. Por
ello, si uv E E pero uv ti- M, entonces o bien u nunca se declara a v, (en
cuyo caso él encontró una pareja mejor antes de cortejar a v, lo cual implica
uy E M con y > ven N(u)), o u se declaró a v pero fue rechazado (lo cual
implica xv E M con x > u en N (v)). Pero esta es precisamente la condición
que caracteriza los emparejamientos estables. O

Poniendo en común los lemas 1 y 2, obtenemos ahora la solución de Galvin al


problema de Dinitz.

Teorema. Se tiene Xe(Sn) = n para todo n .

• Demostración. Como antes, se denotan los vértices de Sn por (i,j), con


1 :::; i,j :::; n. Así, (i,j) y (r,s) son adyacentes si y sólo si i = r ó j = s.
Tomamos cualquier cuadrado latino L con letras de{ 1, 2, ... , n} y denotamos
mediante L(i,j) la entrada en la casilla (i,j). A continuación convertimos
1 2 3
Sn en un grafo dirigido Sn dando a las las aristas horizontales la orientación
(i,j) ------+ (i,j') si L(i,j) < L(i,j'), Y a las verticales (i,j) ------+ (i',]') 3 1 2
si L(i,j) > L(i',j). De este modo, orientamos horizontalmente desde el
elemento más pequeño al mayor, y al revés en el caso vertical. (En el margen 2 3 1
aparece un ejemplo para n = 3.)
Nótese que obtenemos d+(i,j) = n - 1 para todo (í,j). De hecho, si
L(i,j) = k, entonces n-k casillas en la fila i contienen una entrada ma-
yor que k, y k - 1 casillas en la columna j tienen una entrada menor que
k.
Según el lema 1 falta probar que cualquier subgrafo inducido de Sn tiene un
núcleo. Considérese un subconjunto A ~ V, y sean X el conjunto de filas 1 234
de L, e Y el conjunto de sus columnas. Asociamos a A el grafo bipartito

~~~
G = (X U Y, A), donde cualquier (i, j) E A se representa mediante la arista
ij con í E X, j E Y. En el ejemplo del margen se han sombreado las casillas
J-----t---t----
de A. 3 3
La orientación de Sn induce de manera natural una valoración en el entorno 1--+-+---+--11
N(í) = {j E XUY : (í, j) E A} de cada vértice i del grafo G = (X U Y, A): 4 4
valoramos j' > j en N (í) si (í, j) ------+ (í, j') en Sn, respectivamente í' > í en
190 El problema de

N(j) si (i, j) ---+ (i', j). Por el lema 2, G = (X U A) tiene un empareja-


miento estable NI. Este NI, visto como un subconjunto de A, es el núcleo que
buscamos. Para ver el porqué, nótese en primer lugar que M es independiente
en A, ya que sus elementos, vistos como aristas del grafo G = (X U Y, A), no
comparten ningún extremo i o j. En segundo lugar, si (i, j) E A \M, entonces
por la definición de emparejamiento estable, o bien existen (i, j') E M con
j' > j, o bien (i', j) E M con i' > i. Este último hecho significa para Sn
que (i,j) ---+ (i,j') E M, o (i,j) ---+ (i',j) E M, Y la demostración está
terminada. O

Para finalizar, vayamos aún un poquito más lejos. El lector puede haberse dado
cuenta de que el grafo Sn surge de un grafo bipartito mediante una sencilla
construcción. Tómese el grafo bipartito completo denotado por Kn,n, con
IXI = IYI = n, y todas las aristas entre X e Y. Si consideramos las aristas de
Kn,n como vértices de un nuevo grafo y conectamos dos de esos vértices si y
sólo si tienen un extremo común como aristas de Kn,n, entonces obtenemos
el grafo cuadrado Sn. Decimos que Sn es el grafo de aristas de Kn,n. Esta
misma construcción puede llevarse a cabo en cualquier grafo G, llamando al
grafo obtenido el grafo de aristas L( G) de G.

l:b7 d
G: L(G): a
En general, H se llama un grafo de aristas si H = L( G) para algún grafo G.
Por supuesto, no cualquier grafo es un un grafo de aristas: por ejemplo el
grafo K 2 ,4 que habíamos considerado antes no lo es, y para este grafo hemos
visto que X(K2,4) < XR(K2,4). Pero, ¿qué pasa si H es un grafo de aristas?
Adaptando la demostración de nuestro teorema, puede demostrarse fácilmente
e e que se verifica X(H) = XR (H) siempre que H sea el grafo de aristas de
un grafo bipartito, y el método podría arrojar alguna luz sobre la que es la
Construcción de un grafo de aristas
conjetura más importante en este campo:

¿Se verifica que X(H) = XR(H) para todo grafo de aristas H?

Se sabe muy poco sobre esta conjetura y parece difícil, pero después de todo,
también lo parecía el problema de Dinitz hace veinte años.

[1] P. ERDOS, A. L. RUBIN & H. TAYLOR: Choosability in graphs, Proc. West Coast
Conference on Combinatorics, Graph Theory and Computing, Congressus Nume-
rantium 26 (1979), 125-157.
[2] D. GALE & L. S. SHAPLEY: College admissions and the stability ofmarriage,
Amer. Math. Monthly 69 (1962),9-15.
[3] F. GALVIN: The list chromatic index of a bipartite multigraph, J. Combinatorial
Theory, Ser. B 63 (1995), 153-158.
[4] J. C. M. JANSSEN: The Dinitz problem solved for rectangles, Bulletin Amer.
Math. Soco 29 (1993), 243-249.
[5] V. G. VIZING: Coloring the vertices ofa graph in prescribed colours (in Russian),
Metody Diskret. Analiz. 101 (1976), 3-10.
Consideremos el producto infinito (1 + x) (1 + x2) (1 + x 3) (1 + x 4 ) . .. y
expresémoslo de la forma usual en una serie Ln>o anx n , agrupando aquellos
productos que tienen la misma potencia x n. Para los primeros términos de la
serie podemos observar que

Por ejemplo, tenemos a6 = 4, a7 = 5, Y sospechamos (de manera acertada)


que a n tiende a infinito cuando n - - ¡ . oo.
Si observamos el producto (1 - x) (1 - x2) (1- x 3) (1- x 4 ) . .. encontraremos
que sucede algo inesperado. Al desarrollarlo obtenemos:

rr
k2:1
(1- xk) = 1- x - x2 + x5 + x7 - X12 - X15 + x22 + x 26 - .... (2)

Parece que todos los coeficientes son iguales a 1, -1 ó O, pero ¿es esto cierto?
y si es así, ¿cuál es el patrón?
Las sumas y productos infinitos y su convergencia han desempañado un papel
fundamental en el análisis desde la invención del cálculo diferencial, y algunos
de los más grandes matemáticos han hecho importantes contribuciones para su
estudio, desde Leonhard Euler a Srinivasa Ramanujan.
Al explicar identidades como (1) y (2), sin embargo, dejaremos de lado todas
las cuestiones de convergencia y simplemente manipularemos los coeficientes.
En la jerga matemática, se habla de series y productos de potencias "formales".
En este marco, mostraremos cómo se utilizan argumentos combinatorios para
demostrar de manera elegante identidades aparentemente difíciles.
La noción básica es la de una partición de un número natural. Llamamos
partición de n a una suma
5=5
5=4+1
5=3+2
Además, llamamos P(n) al conjunto de todas las particiones de n, y usamos 5=3+1+1
lanotaciónp(n):= IP(n)l,dondedefinimosp(O) = 1. 5=2+2+1
¿Qué tienen que ver las particiones con nuestro problema? Consideremos el 5=2+1+1+1
siguiente producto infinito de series: 5=1+1+1+1+1.
Las particiones contadas por p(5) =7

donde el k-ésimo factor es (1 + xk + x2k + x 3k + ... ). ¿Cuál es el coe-


ficiente de xn cuando desarrollamos este producto en una serie de la forma
192 Identidades y biyecciones

Ln>O anx n ? Tras una reflexión observar que es I-''''V'''U-

mente el número de maneras de escribir n como una suma

n nI . 1 + n2 . 2 + n3 . 3 + ...
1+ ... +1 + 2+ ... +2 + 3+ ... +3 +
'--v----"' ~ '--v----"'
nI n2 n3

De modo que el coeficiente no es otra cosa que el número p( n) de particiones


de n. Puesto que la suma de la serie geométrica 1 + xk + x2k + ... es l_lxk'
hemos probado la primera de nuestras identidades:

rr ~
k2::I
1-x
= '"""' p(n)
L.
n 2::0
xn . (4)

Aún más, podemos ver a partir de nuestro análisis que el factor I!x k cor-
responde a la contribución de k a una partición de n. Así pues, si dejamos
de tener en cuenta I!x k en el producto del primer miembro de (4), entonces
k no aparece en ninguna partición en el segundo miembro. Como ejemplo,
obtenemos inmediatamente
6=5+1
(5)
6=3+3
6=3+1+1+1
6 = 1+ 1+ 1+ 1+ 1+ 1 donde Pi (n) es el número de particiones de n cuyos sumandos son todos im-
Particiones de 6 en partes impares: pares, y un resultado análogo es cierto cuando todos los sumandos son pares.
Pi(6) = 4 Ahora ya debería quedar claro cuál será el coeficiente n-ésimo en el producto
infinito I1k> 1 (1 + xk). Puesto que tomamos o bien 1, o bien xk , de cualquiera
de los factores de (3), esto significa que consideramos únicamente aquellas
particiones en las que cualquier sumando k aparece a lo sumo una vez. En
otras palabras, el producto original (1) queda expresado como

(6)

7=7
7=5+1+1 donde Pd(n) es el número de particiones de n en sumandos distintos.
7=3+3+1 Ahora es cuando el método de series formales muestra su máxima potencia.
7=3+1+1+1+1 Puesto que 1 - X2 = (1 - x)(1 + x), podemos escribir
7=1+1+1+1+1+1+1
1
7=7 1- x2k-I '
7=6+1 k 2:: 1

7=5+2
ya que se simplifican todos los factores 1 - x2i con exponente par. De este
7=4+3
modo, los productos infinitos de (5) y (6) son iguales, y de aquí que también
7=4+2+1.
lo sean las series. Hemos obtenido el bonito resultado
Las particiones de 7 en partes impares y
en partes distintas: Pa(7) = Pd(7) = 5. para todo n 2': Q. (7)

Una igualdad tan impactante como ésta requiere una sencilla demostración
mediante biyección - al menos éste es el punto de vista de cualquiera que se .
dedique a la combinatoria.
Identidades y biyecciones 193

Problema. Sean Pi (n) y P d (n) las de n en sumandos y


sumandos distintos, respectivamente. Hállese una biyecGÍón de (n) a Pd(n).

Se conocen algunas de estas biyecciones, aunque probablemente la más bonita


sea una debida a J. W. L. Glaisher (1907). Sea A una partición de n en partés
impares. Agrupamos sumandos iguales y obtenemos

n Al + ... + Al + A2 + ... + A2 +
~~
n1 n2 Por ejemplo,
n1 . Al + n2 . A2 + ... + nt . At. cj; lleva
A : 25 = 5+5+5+3+3+1+1+1+1
Ahora escribimos n1 = 2m1 + 2m2 + ... + 2mr en binario y hacemos lo mismo
a
para el resto de los ni. La nueva partición A' de n es entonces
A': 25= (2+1)5 + (2)3 + (4)1
Al: n = 2m1 Al + 2m2 Al + ... + 2mr Al + 2k1 A2 + .... =10+ 5 +6+4
=10 + 6 + 5 +4.
Tenemos que comprobar que A' está en Pd(n), y que cjJ : A f-----+ A' es una
biyección. Ambas afirmaciones son fáciles de comprobar: Si 2a Ai = 2b Aj,
entonces 2a = 2 b ya que Ai y Aj son impares, y por tanto Ai = Aj. De aquí
Escribimos
que Al está en Pd(n). Recíprocamente, si n = /L1 + /L2 + ... + /Ls es una
A': 30 = 12 + 6 + 5 + 4 + 3
partición en sumandos distintos, entonces invertimos la biyección agrupando como 30=4(3+1) + 2(3) + 1(5+3)
todos los /Li que contienen la misma potencia más grande de 2, y anotamos las = (1)5 + (4+2+1)3 + (4)1
partes impares con la multiplicidad correspondiente. En el margen se muestra
Yobtenemos como cj;-l (A') la partición
un ejemplo.
A:30=5+3+3+3+3+3+3+
Así, la manipulación de productos formales nos ha conducido a la ecuación 3+1+1+1+1
en sumandos impares.
Po( n) = Pd( n) para particiones que hemos verificado mediante una biyección.
Ahora procedemos al revés: damos una demostración para las particiones uti-
lizando una biyección y deducimos una identidad. Esta vez nuestro objetivo
es identificar cuál es el patrón en el desarrollo (2).
Fijémonos en
1 - x - x2 + x 5 + x 7 _ x12 _ x 15 + x22 + X26 _ X35 _ x 40 + .... 3

Parece que los exponentes (sin tener en cuenta O) aparecen emparejados, y


si tomamos los exponentes de la primera potencia de cada par se obtiene la
sucesión J. = 1
1 5 12 22 35 51 70
que fue bien conocida para Euler. Se trata de los números pentagonales f(j),
cuyo calificativo viene sugerido por la figura del margen.
Calculamos de manera sencilla f(j) = 3j~-j Y J(j) = 3j~+j para el segundo
número de cada pareja. En resumen, conjeturamos, al igual que lo hizo Euler,
que debe verificarse la siguiente fórmula: Números pentagonales

Teorema.

1+ 2:) -1)j (x 3j~-j + (8)


j21
194 Identidades y biyecciones

Euler demostró este teorema utilizando series formales, pero aquí


daremos una demostración por biyecciones tomada de El Libro. En primer
lugar, nótese por (4) que el producto TIk>l (1- xk) es precisamente la inversa
de nuestra conocida serie de particiones-Ln>ü p( n )xn. De aquí, definiendo
la sucesión c(n) mediante TIk2:l (1 - xk) =: I=n2"ü c(n)x n , encontramos

Comparando coeficientes, vemos que c(n) es la única sucesión con c(O) = 1 Y


n
~ c(k)p(n - k) = O para todo n 2: 1. (9)
k=ü
00 . 3j2+j
Escribiendo el segundo miembro de (8) como L (-1)J x - 2 - , hemos de
demostrar que j=-oo

para k = 3j~+j ,cuando j E ;Z es par,


c(k) para k = 3j~+j ,cuando j E ;Z es impar,
en caso contrario

j2
proporciona esta única sucesión. Haciendo b(j) = 3 2+j para j E ;Z Y subs-
tituyendo estos valores en (9), nuestra conjetura se formula de manera simple
así:
~p(n - b(j)) = ~ p(n - b(j)) para todo n,
j par jimpar

donde por supuesto sólo consideramos j con b(j) :s: n. De modo que la
situación es la siguiente: Hemos de encontrar una biyección

rjJ: U P(n - b(j)) ----+ U P(n - b(j)).


j par j impar

De nuevo, se han sugerido algunas biyecciones, aunque la siguiente, pro-


puesta por David Bressoud y Doron Zeilberger, es sorprendentemente sen-
cilla. Simplemente damos la definición de rjJ (que de hecho es una involución)
e invitamos al lector a verificar los detalles más fáciles.
Para A : Al + ... + At E P( n - b(j)) sea
Como ejemplo, consideremos n = 15 Y
(t + 3j - 1) + (Al - 1) + ... + (At - 1)
j = 2, de modo que b(2) = 7.
rjJ(A) :=
La partición 3 + 2 + 2 + 1 del conjunto { (A2
P(15 - b(2)) = peS) se transforma en + 1) + ... + (At + 1) + ~
)'1 -t-3j-l
9+2+1+1, que está en P(15-b(1)) =
P(13). donde omitimos los ceros que surjan. Encontramos que en el primer caso rjJ(A)
está en P(n - b(j - 1)), Y en el segundo en P(n - b(j + 1)).

y si hasta aquí ha resultado bonito, aún podemos sacar más partido de ello.
Sabemos que
Identidades y biyecciones 195

Como de series ~V'.lH;'U\C;), nos damos cuenta de que la


introducción de la nueva variable y conduce a

k::O:l n::O:O

donde Pd,m(n) cuenta el número de particiones de n en precisamente m su-


mandos distintos. Con y = -1 esto lleva a
Como ejemplo para n = 10:
(lO) 10=9+1
10 = 8 + 2
10 = 7 + 3
donde Ed (n) es el liúmero de particiones de n en un número par de partes 10 = 6 +4
distintas, y Od(n) es el número de particiones en un número impar. Y aquí 10 = 4+ 3 + 2 + 1
está la gracia. Comparando (lO) con el desarrollo de Euler en (8) deducimos
Y
el bonito resultado: 10 = 10
para n = 3j~±j cuando j 2: O es par , 10 = 7+ 2+ 1
10 = 6+ 3+ 1
para n = 3j~±i cuando j 2: 1 es impar, 10 = 5 +4+ 1
10 == 5 + 3 + 2,
en otro caso. por tanto Ed(10) = Od(10) = 5.

Esto es, por supuesto, sólo el principio de una historia más larga que aún
no ha concluido. La teoría de productos infinitos está repleta de identidades
inesperadas con sus biyecciones correspondientes. Los ejemplos más famosos
son las llamadas identidades de Rogers-Ramanujan, denominadas así en honor
a Leonard Rogers y Srinivasa Ramanujan, en las cuales el número 5 juega un
papel misterioso:

Srinivasa Ramanujan

Invitamos al lector a traducirlas a la siguientes identidades de particiones, so-


bre las cuales llamó por primera vez la atención Percy MacMahon:

e Sea f (n) el número de particiones de n de manera que todos sus suman-


dos son de la forma 5k + 1 Ó 5k + 4, Y g(n) el número de particiones
cuyos sumandos se diferencian al menos en 2. Entonces f(n) = g(n).

@ Sea r(n) el número de particiones de n cuyos sumandos son todos de la


forma 5k + 2 Ó 5k + 3, Y s(n) el número de particiones cuyas partes se
diferencian al menos en 2 y que no contienen al l. Entonces r (n) = s (n).

Todas las demostraciones mediante series formales conocidas hasta hoy de las
identidades de Rogers-Ramanujan son bastante engorrosas, y por otra parte las
demostraciones por biyecciones de f(n) = g(n) y de r(n) = s(n) se mostra-
ron escurridizas durante mucho tiempo. Este tipo de demostraciones fueron
196 Identidades y biyecciones

finalmente dadas en 1981 por Adriano Garsia y Stephen Milne. Sus


ciones, sin embargo, son muy complicadas y no haya la vista, de momento,
demostraciones de El Libro.

[1] G. E. ANDREWS: The Theory ofPartitions, Encyclopedia ofMathematics and its


Applications, Vol. 2, Addison-Wesley, Reading MA 1976.
[2] D. BRESSOUD & D. ZEILBERGER: Bijecting Euler's partitions-recurrence,
Amer. Math. Monthly 92 (1985), 54-55.
[3] A. GARSIA & S. MILNE: A Rogers-Ramanujan bijection, J. Combinatorial
Theory, Ser. A 31 (1981), 289-339.
[4] S. RAMANUJAN: Proo! of certain identities in combinatory analysis, Proc. Cam-
bridge Phil. Soco 19 (1919), 214-216.
[5] L. J. ROGERS: Second memoiron the expansion ofcertain injinite products, Proc.
London Math. Soco 25 (1894),318-343.
30
Cinco-coloración
de grafos planos 199
31
Cómo vigilar un museo 203
32
El teorema de Turán 207
33
., Comunicar sin errores 213
34
Sobre amigos y políticos 223
35
La probabilidad
nos lo pone fácil Ca veces) 227

"El geógrafo de los cuatro colores"


Los grafos planos y sus coloraciones han sido objeto de intensa investiga-
ción desde los comienzos de la teoría de grafos, debido a su conexión con el
problema de los cuatro colores. Tal y como fue planteado originalmente, la
pregunta es si siempre es posible colorear las regiones de un mapa plano con
cuatro colores, de forma que a las regiones que tienen frontera común (y no
sólo un punto) se les asignen colores distintos. La figura de la derecha mues-
tra que colorear las regiones de un mapa es equivalente a colorear los vértices
de un grafo plano. Igual que en el capítulo 11 (página 65) ponemos un vér-
tice en el interior de cada región (incluyendo la región exterior) y conectamos
dos vértices correspondientes a regiones adyacentes por medio de una arista a
través de la frontera común.
El grafo resultante G, que es el grafo dual del mapa NI, resulta ser un grafo
plano, y colorear los vértices de G en el sentido usual es equivalente a colorear
las regiones de M. Debido a esto podemos concentramos en colorear los
vértices de grafos planos, tal y como haremos a partir de ahora. Podemos El grafo dual de un mapa
suponer que G no tiene bucles ni aristas múltiples, ya que estos tipos de aristas
son irrelevantes para la coloración.
En la larga y ardua historia de la búsqueda de una demostración para el teo-
rema de los cuatro colores, muchos intentos se quedaron cerca, pero lo que
finalmente tuvo éxito tanto en la demostración de Appel-Haken de 1976 y
también en la más reciente de Robertson, Sanders, Seymour y Thomas de
1997 fue una combinación de viejas ideas (que se remontan al siglo XIX) con
la potencia de cálculo de los ordenadores modernos. Veinticinco años después
de la demostración original, la situación sigue siendo esencialmente la misma,
y no haya la vista demostración de El Libro a la vista.
Seamos más modestos y preguntémonos si existe una demostración elegante
de que cualquier grafo plano es 5-coloreable. El teorema de los cinco colores
fue demostrado por Heawood a finales del siglo XIX. La herramienta básica
de su demostración (al igual que para el teorema de los cuatro colores) fue la
fórmula de Euler (véase capítulo 11). Evidentemente, cuando coloreamos un
grafo G podemos suponer que es conexo, ya que las diferentes componentes
conexas se podrían colorear independientemente. Un grafo plano divide al
plano en un conjunto R de regiones (entre las que se incluye la region exte-
rior). La fórmula de Euler dice que si G = (V, E) es un grafo plano conexo,
siempre se verifica que
IVI - IEI + IRI = 2.
Como entrenamiento, veamos cómo se puede utilizar la fórmula de Euler para
demostrar que cualquier grafo plano G es 6-coloreable. Razonamos por induc- Este grafo plano tiene 8 vértices,
ción sobre el número de vértices, n. Para valores pequeños de n (en concreto, 13 aristas y 7 regiones.
200 Cinco-coloración de grafos planos

si n :S 6) esto es evidente. Según la (A) de la proposición de la página 67


sabemos que G tiene un vértice v de grado menor o igual que 5. Eliminamos
v y todas las aristas incidentes a v. El grafo resultante G' = G\ v es un
grafo plano de n - 1 vértices. Según la hipótesis de inducción, lo podemos
6-colorear. Como v tiene como mucho 5 vecinos en G, para ellos se utilizan a
lo sumo 5 colores en la coloración de G'. Por tanto, podemos extender cual-
quier 6-coloración de G' a una 6-coloración de G asignando a v un color que
no haya sigo asignado en la coloración de G' a ninguno de sus vecinos. Por
tanto, G es 6-coloreable.

Estudiemos ahora el número cromático con listas, que presentamos en el ca-


pítulo anterior sobre el problema de Dinitz. Evidentemente, nuestro método
de 6-colorear también funciona para listas de colores (de nuevo tenemos sufi-
cientes colores) y, por tanto, Xc (G) :S 6 para cualquier grafo plano G. Erdos,
Rubin y Taylor conjeturaron en 1979 que cualquier grafo plano tiene número
cromático con listas menor o igual que 5, y que existen grafos planos G con
Xc (G) > 4. Estaban en lo cierto en ambos casos. Margit Voigt fue la primera
en construir un ejemplo de un grafo plano G con Xc (G) = 5 (su ejemplo tenía
238 vértices) y más o menos al mismo tiempo Carsten Thomassen dio una
demostración verdaderamente asombrosa de la conjetura de la 5-coloración
con listas. Su demostración es un magnífico ejemplo de lo que se puede llegar
a conseguir cuando se encuentra la hipótesis de inducción adecuada. i Y no
utiliza en absoluto la fórmula de Euler!

Teorema. Cualquier grafo plano G es coloreable con 5-listas:

• Demost.ración. En primer lugar, observemos que al añadir aristas el nú-


mero cromático sólo puede aumentar. En otras palabras, si H es un sub grafo
de G, entonces Xe(H) :S Xc (G). Por tanto, podemos suponer que G es conexo
y que en una inmersión dada las fronteras de las caras acotadas son triángulos.
Diremos que un grafo así está casi-triangulado. Si el teorema es cierto para
los grafos casi-triangulados, será cierto para cualquier grafo plano.
La idea de la demostración es verificar el siguiente resultado, más fuerte (y
que nos permite utilizar inducción):

Sea G = (V, E) un grafo casi-triangulado y sea B el ciclo que acota


la región exterior. Hacemos las siguientes suposiciones sobre los con-
juntos de colores G( v), v E V:

Un grafo plano casi-triangulado


(1) Dos vértices adyacentes x, y de B ya han sido coloreados
con colores a y f3 (distintos J.
(2) IG(v)1 2: 3 para el resto de los vértices v de B.
(3) IG (v) I 2: 5 para todos los vértices v en el interior.

Entonces, la coloración de x, y se puede extender a una coloración


propia de G eligiendo colores de las listas. En particular, Xc (G) :S 5.
Cinco-coloración de grafos planos 201

Para IVI = 3 esto es ya que para el único vértice v sin colorear se BI


tiene le (v) I : : : 3 y, por tanto, hay un color disponible. Ahora procedemos por x
inducción.
GI
Caso 1: Supongamos que B tiene una cuerda, es decir, una arista que no está
U
en B y que conecta dos vértices u, v E B. El sub grafo G I que está acotado por V

BI U {uv} y que contiene x, y, u y v está casi-triangulado y, por tanto, tiene


una coloración con S-listas, según la hipótesis de inducción. Supongamos que G2
en esta coloración los vértices u y v reciben los colores r y ¿j. Veamos qué
ocurre en la parte inferior de G 2 , acotada por B 2 y uv. Considerando u, v B2
como vértices precoloreados, vemos que G 2 también satisface la hipótesis de
inducción. Por tanto, G 2 puede ser coloreado con 5-listas con los colores
disponibles, y lo mismo es cierto para G. Vo
Caso 2: Supongamos que B no tiene cuerdas. Sea Vo el otro vértice adyacente
en B al vértice x que ha recibido el color a, y sean x, VI, ... , Vt, W los vecinos
de Vo. Como G está casi-triangulado, se tiene la situación de la figura.
Ahora construimos el grafo casi-triangulado G' = G\ Vo eliminando de G el
vértice Vo y todas las aristas adyacentes a Vo. El grafo G' tiene como frontera
exterior B' = (B\ vo) U {VI, ... , Vt}. Como le (vo) I : : : 3 según la suposición
(2), existen dos colores r, ¿j en e (vo) distintos de a. Ahora cambiamos los
conjuntos de colores e (Vi) por los e (Vi) \ {r, ¿j}, manteniendo los conjuntos B
de colores originales para el resto de los vértices de G'. Entonces, G' verifica
todas las suposiciones y es, por inducción, coloreable con 5-listas. Eligiendo
r o ¿j para vo, distinto del color de w, podemos extender la coloración con
listas de G' a todo G. O

Por tanto, hemos demostrado el teorema de los 5 colores con listas, pero la
historia no termina aquí. Una conjetura más fuerte afirma que el número cro-
mático con listas de un grafo plano G es, como mucho, uno más que el número
cromático usual:

¿ Es Xc (G) :S X( G) +1 para cualquier grafo plano G ?

Como X( G) :S 4 según el teorema de los cuatro colores, existen tres casos:


Caso 1: X(G) = 2 =? Xc(G) :S 3 {a,1,3,4} {a,2,3,4}

# ~
Caso II: X(G) = 3 =? Xc(G) :S 4
Caso III: X( G) = 4 =? Xc (G) :S 5.
{a,(3,1,2} a, (3,1, 2}
El resultado de Thomassen resuelve el caso III, y el caso 1 fue demostrado me-
diante un argumento ingenioso (y más sofisticado) por Alon y Tarsi. Además,
existen grafos planos G tales que X( G) = 2 Y Xc (G) = 3, por ejemplo el
grafo K 2 ,4 que consideramos en el capítulo sobre el problema de Dinitz.
¿Pero qué ocurre con el caso II? La conjetura no es cierta, como fue demos-
trado en primer lugar por Margit Voigt utilizando un grafo construido ante-
riormente por Shai Gutner. Su grafo, de 130 vértices, se puede obtener de la
siguiente forma. Primero consideramos el "doble octaedro" (véase la figura),
que es claramente 3-coloreable. Sean a E {5, 6, 7, 8} y (3 E {9, 10, 11, 12}
Y consideremos las listas dadas en la figura. Invitamos al lector a comprobar
que con estas listas no se puede colorear el grafo. Ahora tomamos 16 copias
202 Cinco-coloración de grafos planos

del doble octaedro e identificamos todos los vértices de arriba y todos los vér-
tices de abajo, lo que nos da un grafo con 16 . 8 + 2 = 130 vértices que
sigue siendo plano y 3-coloreable. Asignamos {5, 6, 7, 8} al vértice superior
y {9, 10, 11, 12} al vértice inferior, mientras que las listas de los vértices in-
teriores son los 16 pares (a, (3), a E {5, 6,7, 8}, (3 E {9, 10, 11, 12}. Para
cualquier elección de a y (3 obtenemos un sub grafo como el de la figura y, por
tanto, es imposible colorear con listas el grafo total.
Modificando otro de los ejemplos de Gutner, Voigt y Wirth construyeron un
grafo aún más pequeño, de 75 vértices, y tal que X = 3 Y XR- = 5, que además
utiliza sólo el número mínimo de 5 colores en las listas combinadas. El récord
actual es de 63 vértices.

[1] N. ALON & M. TARSI: Colorings and orientations of graphs, Combinatorica 12


(1992), 125-134.
[2] P. ERDOS, A. L. RUBIN & H. TAYLOR: Choosability in graphs, Prac. West Coast
Conference on Combinatorics, Graph Theory and Computing, Congressus Nume-
rantium 26 (1979),125-157.
[3] S. GUTNER: The complexity of planar graph choosability, Discrete Math. 159
(1996), 119-130.
[4] N. ROBERTSON, D. P. SANDERS, P. SEYMOUR & R. THOMAS: Thefour-colour
theorem, J. Combinatoria1 Theory, Ser. B 70 (1997), 2-44.
[5] C. THOMASSEN: Every planar graph is 5-choosable, J. Combinatorial Theory,
Ser. B 62 (1994),180-181.
[6] M. VOIGT: List colorings of planar graphs, Discrete Math. 120 (1993),
215-219.
[7] M. VOIGT & B. WIRTH: On 3-colorable non-4-choosable planar graphs,
J. Graph Theory 24 (1997), 233-235.
1

En el año 1973, Victor Klee propuso un bonito problema. Supongamos que


el director de un museo quiere asegurarse de que cada rincón de la galería
esté vigilado en todo momento por un guardia. Los guardias permanecen en
lugares fijos, pero pueden vigilar cualquier punto a su alrededor. ¿Cuántos
guardias son necesarios para garantizar la seguridad del museo?
Imaginemos que las paredes del edificio forman un polígono de n lados. Si
el polígono es convexo, está claro que basta con un solo guardia, que además
puede estar situado en cualquier punto del museo. Pero, en general, las paredes
pueden formar cualquier polígono cerrado. Una sala de exposiciones convexa
Consideremos un museo en forma de peine con n = 3m paredes, como puede
verse en el dibujo del margen. Es fácil ver que son necesarios por lo menos
m = ~ guardias: Nótese que hay n paredes, y que el punto 1 sólo puede ser
observado por un guardia situado en el triángulo sombreado que contiene a
este punto, y lo mismo para el resto de los puntos 2,3, ... ,m. Puesto que
todos estos triángulos son disjuntos, podemos concluir que se necesitan al
menos m guardias. Pero este número de vigilantes es también suficiente, ya
que pueden situarse en las aristas superiores de los triángulos. Eliminando
una o dos paredes del final, concluimos que para todo n hay un museo con 1 2 3 m
n paredes que necesita l ~ J guardias.

Una galería de arte "de verdad" ...


204 Cómo vigilar un museo

El resultado siguiente demuestra que este caso es el peor que puede darse.

Teorema. Cualquier museo con n se con a lo


sumo l JJguardias.

Este "teorema de la galería de arte" fue probado por primera vez por Vasek
Chvátal mediante un ingenioso argumento, pero la demostración realmente
bella que aquí presentaremos es de Steve Fisk.
Un museo con n = 12 paredes • Demostración. Empezarnos uniendo las esquinas de la galería mediante
n - 3 diagonales que no se intersecan entre sí, de modo que el interior quede
triangulado. Por ejemplo, podernos triangular el museo que se muestra en
el margen usando 9 diagonales. Para la demostración no importa cuál sea la
triangulación elegida.
Ahora imaginemos la figura triangulada corno un grafo plano, identificando
las esquinas con sus nodos, y las paredes con las aristas.

nr¡rna:curn. Este grafo se puede colorear con 3 colores.


Una triangulación del museo
Para n = 3 no hay nada que demostrar. Para n > 3, elegirnos cualquier
par de vértices u y v, conectados por una diagonal. Esta diagonal divide el
grafo en otros dos más pequeños, que contienen a la arista uv y están a su vez
triángulados. Por inducción, podernos colorear cada uno de estos dos grafos
con 3 colores, y además elegir en cada coloración el color 1 para u y el color 2
para v. Combinando estas dos coloraciones obtenemos una coloración de todo
el grafo mediante 3 colores.
El resto es fácil. Puesto que hay n vértices, existe por lo menos un color
J
- por ejemplo ell - que se utiliza como mucho para l J vértices. En estos
vértices colocaremos a los guardias. Como cada triángulo contiene un vértice
de color 1, sabemos que cada triángulo está vigilado, y por lo tanto lo está
todo el museo. D

e' Es posible que algún lector astuto haya encontrado una sutileza en nuestro
razonamiento. ¿Siempre existe una triangulación? Con toda probabilidad, la
reacción inmediata de cualquiera es: ¡por supuesto que sí! El caso es que
realmente existe, pero esto no es completamente obvio. De hecho, la generali-
zación natural a tres dimensiones (subdividir en tetraedros) no es cierta, como
se puede comprobar mediante el poliedro de Schonhardt, a la izquierda. Se
obtiene a partir de un prisma triangular girando el triángulo superior, de modo
que cada una de las caras cuadrangulares da lugar a dos triángulos con una
arista no convexa. Al intentar triangular este poliedro, uno se da cuenta de
que cualquier tetraedro que contenga el triangulo inferior también debe con-
tener uno de los tres vértices superiores. Sin embargo, el tetraedro resultante
se saldría del poliedro de Schonhardt. Concluimos entonces que cualquier
Poliedro de SchOnhardt: Los ángulos triangulación usa necesariamente algún vértice adicional.
diédros interiores en las aristas AB', Para probar que existe una triangulación de cualquier polígono en el plano,
BC' y CA' son mayores que 180 0
• convexo o no, procederemos por inducción sobre el número n de vértices.
Cómo vigilar un museo 205

Para n = 3, el polígono es un y no nada que demostrar. Así


pues, consideremos n 2:: 4. Para utilizar inducción, lo que tenemos que ha-
cer es considerar una diagonal que separe el polígono P en dos partes más
pequeñas, de manera que pueda construirse una triangulación del polígono
ensamblando triangulaciones de cada una de estas partes. Llamaremos a un
vértice A convexo si el ángulo interior en A es menor que 180 0 • Ya que la
suma de los ángulos interiores de P es (n - 2) 180 tiene que existir un vér-
0
,

tice convexo A. De hecho, tiene que haber por lo menos tres de estos vértices;
en esencia, se trata de una aplicación del principio del palomar. Otra manera
de verlo consiste en considerar el cierre convexo del polígono y observar que
todos sus vértices son también convexos para el polígono original.
Ahora nos fijaremos en los vértices adyacentes a A, a los cuales llamaremos
By C. Si todo del segmento BC está contenido en P, entonces BC será
nuestra diagonal. Si no es así, el triángulo ABC ha de contener a más vértices
de P. Deslizamos entonces el segmento BC hacia A hasta alcanzar el último A
vértice, Z, de ABC. De este modo, AZ estará contenido en P y habremos
encontrado nuestra diagonal.

Hay muchas variantes del teorema de la galería de arte. Por ejemplo, nos po-
dría interesar vigilar solamente las paredes (al fin y al cabo es allí donde se
cuelgan las pinturas), o podríamos colocar a todos los guardias en los vérti-
ces del polígono. Una variante especialmente bonita del problema (aún sin
resolver) es la siguiente:

Supongamos que cada guardia está situado en una única pared del
museo, de manera que caminando a lo largo de dicha pared puede
observar todo aquello que sea visible desde cualquier punto de esta
pared.
¿Cuántos "guardias de pared" hacen falta para vigilar el museo?

Godfried Toussaint construyó como ejemplo el museo que aparece dibujado a


la izquierda, el cual prueba que pueden ser necesarios L~ J guardias.
Este polígono tiene 28 lados (yen general, 4m), e invitamos al lector a com-
probar que se necesitan m guardias de pared. Hay una conjetura que afirma
que, excepto para algunos valores de n, este número es también suficiente,
pero todavía no se ha dado una demostración, y menos aún una demostración
merecedora de estar en El Libro.

[1] V. CHVÁTAL: A combinatorial theorem in plane geometry, J. Combinatorial


Theory, Ser. B 18 (1975), 39-41.
[2] S. FISK: A short proof of Chvátal's watchman theorem, J. Combinatorial
Theory, Ser. B 24 (1978), 374.
[3] J. O'ROURKE: Art Gallery Theorems and Algorithms, Oxford University
Press 1987.
[4] E. SCHÓNHARDT: Überdie Zerlegung vonDreieckspolyedern in Tetraeder, Math.
Annalen 98 (1928), 309-312.
206 Cómo vigilar un museo

"Los vigilantes del museo"


(Versión tridimensional del problema de
la galería de arte)
Uno de los resultados fundamentales de la teoría de grafos es el teorema de
Turán, de 1941, que dio origen a la teoría extremal de grafos. El teorema
de Turán ha sido redescubierto en muchas ocasiones y se han encontrado de-
mostraciones distintas. Presentaremos cinco de ellas y dejaremos al lector la
decisión sobre cuál de ellas pertenece a El Libro.
Empezamos introduciendo algo de notación. Sea G un grafo simple con vér-
tices V = {VI, ... , Vn } y aristas E. Si Vi Y Vj son adyacentes, escribimos
que ViVj E E. Un p-clan l de G es un sub grafo completo de G con p vértices,
denotado por Kp. Paul Turán hizo la siguiente pregunta:

Supongamos que G es un grafo simple que no contiene un p-clan.


¿ Cuál es el mayor número de aristas que puede tener G?

Paul Turán
Es sencillo obtener ejemplos de grafos sin un p-c1an dividiendo V en p - 1
subconjuntos disjuntos dos a dos V = VI U ... U Vp - I , con IViI = ni,
n = nI + ... + np-I, Y conectando dos vértices si y sólo si están en sub-
conjuntos distintos Vi, Vj. El grafo resultante, que denotamos Kn1, ... ,np_1'
tiene ¿i<j ninj aristas. Para un n fijo, el mayor número de aristas para tales
grafos se obtiene si los tamaños de los distintos subconjuntos son tan parecidos
entre sí como sea posible, es decir, si Ini - nj I ~ 1 para todo i, j. En efecto,
supongamos que nI 2: n2 + 2. Si cambiamos un vértice de VI a V2, obtenemos
Knl-l,n2+1, ... ,np_l que tiene (nI - 1)(n2 + 1) - nIn2 = nI - n2 - 1 2: 1
aristas más que K n1 ,n2, ... ,n p _l' Los grafos Kn1, ... ,np_l con Ini - njl ~ 1 se
conocen como grafos de Turán. En particular, si p - 1 divide a n, podemos
elegir ni = p":l para todo i, de donde se obtienen El grafo K 2 ,2,3

(
p -
2
1) (p-1
n ) 2
=
(
1- p
1) n
_1 2
2

aristas. El teorema de Turán afirma que este número es una cota superior del
número de aristas de cualquier grafo de n vértices que no contenga un p-c1an.
Teorema. Si un grafo G = (V, E) de n vértices no contiene un clan de n
vértices, p 2: 2, entonces

IEI ~ (1 -1)
- -n .
2
(1)
p-1 2
1NdT. No existe consenso sobre cómo traducir el término inglés cUque, que se utiliza para
referirse a un conjunto de vértices de un grafo G que inducen un sub grafo completo (o al propio
subgrafo). En este texto hemos optado por el término clan, que es uno de los utilizados por la
comunidad matemática de habla hispana y que recoge el significado del término original.
208 El teorema de Turán

Para p = 2 el resultado es tlivial. En el primer caso interesante, p = 3, el


teorema afirma que un grafo con n vértices que no contiene ningún triángulo
2
tiene como mucho ~ aristas. Se conocían demostraciones de este caso espe-
cial previas al resultado de Turán. Dos elegantes demostraciones que utilizan
desigualdades se han presentado en el capítulo 17.

Vayamos al caso general. Las dos primeras demostraciones utilizan inducción


y se deben a Turán y a Erd6s, respectivamente .
• Primera demostración. Hacemos inducción sobre n. Es sencillo verificar
que (1) es cierto si n < p. Sea G un grafo con vértices V = {VI, ... , V n } que
no contiene un p-clan, con n 2: p, y con el mayor número de aristas posible.
Es evidente que G contiene clanes de p - 1 vértices, pues en caso contrario
podríamos añadirle aristas. Sea A un (p - 1) -clan y consideremos B := V\ A.

El grafo A contiene (P; I) aristas. A continuación, acotamos e B, el número


de aristas de B, y eA,B, el número de aristas entre A y B. Por hipótesis de
inducción, eB :::; ~ (1- P~I )(n-p+ 1)2. Como G no tiene p-clanes, cualquier
vértice Vj E B es adyacente, como mucho, a p - 2 vértices de A, de donde se
sigue que eA,B :::; (p - 2)(n - p + 1). De aquí se deduce que

IEI :::; (
p -
2
1) + -1(
2
1)
1 - - - (n - p + 1)2
p-1
+ (p - 2)(n p+ 1),

que es exactamente (1- P~l r~2 . o

G • Segunda demostración. Esta demostración utiliza la estructura de los gra-


fos de Turán. Sea v m E V un vértice de grado máximo d m = maxI::;j::;n dj.
Denotemos por S el conjunto de vecinos de V m , ISI = dm , y consideremos
T := V\S. Como G no contiene ningún clan de p vértices y V m es adyacente
a todos los vértices de S, podemos asegurar que S no contiene ningún clan de
p - 1 vértices.
Ahora construimos el siguiente grafo H sobre V (véase la figura). H es igual
a G en S y contiene todas las aristas entre S y T, pero ninguna entre vérti-
ces de T. En otras palabras, T es un conjunto independiente de vértices en
H, de donde se deduce que tampoco H contiene p-clanes. Sea dj el grado
de Vj en H. Si Vj E S, es claro que dj 2: dj por construcción de H, en
tanto que para Vj E T se tiene que dj = ISI = dm 2: dj debido a la elec-
ción de V m. Por tanto, IE(H)I 2: IEI, de donde se deduce que, entre todos
los grafos con número de aristas máximo, debe haber uno con la estructura
de H. Por hipótesis de inducción, el grafo inducido por S tiene como mu-
cho tantas aristas como cierto grafo de la forma K n1 ,... ,np_2 definido en S.
Por tanto, IEI :::; IE(H)I :::; E(Kn1, ... ,np_J con np-I = ITI, de donde se
deduce (1). O
H
Las dos demostraciones siguientes son de naturaleza completamente distinta,
pues utilizan un argumento de optimización e ideas de la teoría de la probabi-
lidad. Son debidas a Motzkin y Straus y a Alon y Spencer, respectivamente.
El teorema de Turán 209

• Tercera demostración. Consideremos una distribución de


w = (WI, ... , w n ) definida en los vértices, es decir, una asignación de pesos
Wi ~ O a los vértices tal que L~=I Wi = 1. Nuestro objetivo es maximizar la
función
f(w) = L WiWj.
VivjEE

Supongamos que w es cualquier distribución, y sean Vi y Vj un par de vértices


no adyacentes con pesos positivos Wi Y Wj. Sea Si la suma de los pesos de
todos los vértices adyacentes a Vi y definamos Sj de forma análoga para Vj.
Sin pérdida de generalidad, podemos suponer que Si ~ S j. Ahora trasladamos
el peso de Vj a Vi, es decir, el nuevo peso de Vi es Wi + Wj, en tanto que el
peso de Vj se hace O. Para la nueva distribución w ' se tiene que

f(w /) = f(w) + WjSi - WjSj ~ f(w).


"Moviendo pesos"
Repetimos este proceso (reduciendo en cada etapa el número de vértices con
peso positivo en uno) hasta que no existan vértices no adyacentes con peso
positivo. Por tanto, concluimos que existe una distribución óptima tal que los
pesos positivos están concentrados en un clan, digamos un clan con k vértices.
Ahora bien, si, por ejemplo, WI > W2 > O, podemos escoger un valor de e tal
que O < e < WI - W2 Y cambiamos WI a WI - e Y W2 a W2 + c. La nueva
distribución w ' satisface f(w /) = f(w) + c(WI - W2) - c 2 > f(w), de
donde se deduce que el valor máximo de f (w) se alcanza para Wi = ~ en un
clan con k vértices y Wi = O para el resto de los vértices. Como un clan con k
/. . k(k~I). b
vertlces tIene - 2 - anstas, o tenemos

f(w) = k(k -1) ~ = ~ (1 _ ~).


2 k2 2 k

Como esta expresión es creciente en k, el óptimo se alcanza para k = p - 1


(ya que G no tiene p-clanes). Por tanto,

f(w) :S ~
2
(1 __1_)
p-1

para cualquier distribución w. En particular, esta desigualdad se cumple para


la distribución uniforme dada por Wi = ~ para todo i. De aquí se deduce que

que es exactamente (1) . o


• Cuarta demostraci6n. En esta ocasión utilizamos conceptos de la teona
de la probabilidad. Sea G un grafo arbitrario y sea V = {VI, ... , v n } el
conjunto de sus vértices. Denotamos por di el grado del vértice Vi y por w (G)
el número de vértices del mayor clan, que se conoce como número de clan
deG.
n 1
nnlW¡~Wjn. Se tiene que w(G) ~ L
n-d.'
i=1 "
210 El teorema de Turán

Elegimos una pelmutación aleatoria 1T = VI V2 ... V n del conjunto de vérti-


ces de forma que cada permutación aparezca con igual probabilidad, ,h,
y consideramos el siguiente conjunto C Tr • El vértice Vi está en C Tr si y sólo
si Vi es adyacente a todos los vértices Vj (j < i) que preceden a Vi. Por
definición, Gn es un clan de G. Sea X = IGnlla variable aleatoria corres-
pondiente. Obsérvese que X = ¿~=1 Xi, donde Xi es la variable aleatoria
indicatriz correspondiente al vértice Vi, es decir, Xi = 1 si Vi E Gn , en tanto
que Xi = O si Vi 7!- Gn . Ahora bien, Vi está en Gn cuando se elige la permuta-
ción VI V2 ... V n si y sólo si Vi aparece antes que los n - 1 - di vértices que no
son adyacentes a Vi, es decir, si Vi es el primero de entre Vi y los n -1- di vér-
tices no adyacentes. La probabilidad de que esto ocurra es n~di y, por tanto,
EXi = n~di' Como la esperanza es lineal (véase la página 84) se obtiene que

n n 1
E(IGnl) = EX = ¿ E Xi = ¿n-d'
i=1 i=1 "
Por tanto, debe haber un clan con, al menos, ese tamaño, como habíamos
afirmado. Para deducir el teorema de Turán a partir de la afirmación utilizamos
la desigualdad de Cauchy-Schwarz presentada en el capítulo 17,

Consideramos ai = yn - di, bi = vn~di y, por tanto, aibi = 1. Por tanto,

Utilizando ahora la hipótesis del teorema, que afirma que w( G) :::; p - 1,


Y la identidad ¿~=1 di = 21EI del capítulo dedicado al doble recuento, la
desigualdad (2) se transforma en
n2 :::; (p - 1)(n2 - 2I E I),

que es equivalente a la desigualdad de Turán. o


Ya estamos en condiciones de presentar la última demostración, que quizá sea
la más elegante de todas. Su origen no está claro; nos la contó Stephan Brandt,
quien la escuchó en Oberwolfach. Quizá se pueda considerarfolklore en teoría
de grafos. Demuestra, a la vez, que el grafo de Turán es el único ejemplo con
un número máximo de aristas. Se puede observar que este resultado es también
consecuencia de las demostraciones 1 y 2 .

• Quinta demostración. Sea G un grafo con n vértices y con el mayor


número de aristas de entre los que no contienen un p-clan.
Afirmación. G no contiene tres vértices u, V, w tales que vw E E,
pero uv 7!- E, uw 7!- E.
Supongamos que la afirmación es falsa y consideremos los siguientes casos.

Caso 1: d(u) < d(v) o d(u) < d(w).


Podemos suponer que d( u) < d( v). Duplicamos el vértice v, es decir, creamos
El teorema de Turán 21

un nuevo vértice v' que tiene exactamente los mismos vecinos que v (vv' no w
es una arista), eliminamos u y dejamos el resto del grafo sin cambios.
El nuevo grafo G' sigue sin tener un clan con p vértices y su número de aristas
es
IE(G')I = IE(G)I + d(v) - d(u) > IE(G)I,
lo que contradice el carácter maximal de G.
Caso 2: d(u) 2: d(v) y d(u) 2: d(w).
En este caso duplicamos u dos veces y eliminamos v y w (como se ve en la
figura). De nuevo, el grafo G' obtenido no tiene ningún p-clan y para su
número de aristas obtenemos la relación " w
IE(G')I = IE(G)I + 2d(u) - (d(v) + d(w) - 1) > IE(G)I,
donde el -1 corresponde a la arista vw. De nuevo hemos obtenido una con- U u' u"
tradicción.
Un momento de reflexión nos convence de que la afirmación demostrada es
equivalente a que la relación e
U rv V :~ uv tj. E( G)
sea una relación de equivalencia. Por tanto, G es un grafo multipartito com-
pleto, G = Kn1, ... ,np_l' Y hemos terminado la demostración. D

[1] M. AIGNER: Turán's graph theorem, Amer. Math. Month1y 102 (1995),
808-816.
[2] N. ALON & J. SPENCER: The Probabilistic Method, Wiley Interscience 1992.
[3] P. ERDOS: On the graph theorem ofTurán (in Hungarian), Math. Fiz. Lapok 21
(1970),249-251.
[4] T. S. MOTZKIN & E. G. STRAUS: Maxima for graphs and a new proof of a
theorem ofTurán, Canad. J. Math. 17 (1965), 533-540.
[5] P. TURÁN: On an extremal problem in graph theory, Math. Fiz. Lapok 48 (1941),
436-452.

"Moviendo pesos más grandes"


En 1956, Claude Shannon, el fundador de la teoría de la información, propuso
una interesante pregunta:

Supóngase que queremos transmitir a un rCF·Dnr"". a través


de un canal (que puede distorsionar algunas señales). ¿ Cuál es la
tasa máxima de transmisión para que el receptor recuperar el
mensaje sin errores?

Veamos a qué se refiere Shannon con "canal" y "tasa de transmisión." Dado un


conjunto V de símbolos, un mensaje es simplemente una cadena de símbolos
de V. Modelamos el canal como un grafo G = (V, E), donde V es el conjunto
de símbolos y E el conjunto de aristas entre pares de símbolos que pueden
confundirse durante la transmisión. Por ejemplo, al comunicarnos por teléfono
en lenguaje cotidiano, conectamos los símbolos By P mediante una arista, ya Claude Shannon
que el receptor puede no ser capaz de distinguirlos. Llamaremos a G el grafo
de confusión.
El ciclo C5 de longitud 5 jugará un papel importante en nuestra discusión.
En este ejemplo, puede que 1 y 2 se confundan, pero no 1 y 3, etc. De ma-
nera ideal, nos gustaría utilizar los cinco símbolos para la transmisión. Pero 1
dado que queremos comunicarnos sin errores podemos utilizar únicamente un
símbolo de cada uno de los pares que pueden confundirse (suponiendo que 5 2
se envíen símbolos de uno en uno independientemente). Así pues, para el
ciclo C 5 sólo podemos utilizar dos símbolos diferentes (cualesquiera que no
estén conectadas por una arista). En el lenguaje de la teoría de la información,
esto significa que para el ciclo de longitud 5 logramos una tasa de información
de 10g2 2 = 1 (en lugar de la máxima 10g2 5 :::::; 2.32). Es claro que según este
modelo, para un grafo arbitrario G = (\1, E), lo mejor que podemos hacer
es transmitir símbolos de un conjunto independiente máximo. De este modo,
la tasa de información, siempre que enviemos símbolos independientes, es
log2 a( G), donde a( G) es el número de independencia de G.
Veamos si podemos incrementar la tasa de información utilizando cadenas más
largas en lugar de símbolos independientes. Supongamos que queremos trans-
mitir cadenas de longitud 2. Las cadenas Ul U2 YVl V2 sólo pueden confundirse
si se da alguno de los tres casos siguientes:

Ul = Vl Y U2 puede confundirse con V2,


o U2 = V2 Y Ul puede confundirse con Vl, o
o Ul i=- Vl pueden confundirse y U2 i=- V2 pueden confundirse.
214 Comunicar sin errores

En ténninos de la teoría de grafos, esto lleva a considerar GI x G2


de dos grafos G I = (VI, El) Y G 2 = (112, E 2 ). El grafo G I x G 2 tiene
como conjunto de vértices VI x 112 = {( UI, U2) : UI E VI, U2 E V 2 }, donde
( UI, U2) =1= (VI, V2) están conectados mediante una arista si y sólo si Ui = Vi
Ó UiVi E Ei para i = 1,2. El grafo de confusión para las cadenas de longi-
tud 2 es por tanto G 2 = G x G, el producto del grafo de confusión G para
símbolos independientes consigo mismo. La tasa de información de cadenas
de longitud 2 por símbolo viene entonces dada por
2
10g20:(G ) _ 1 cpmG2)
2 - og2yO:,U-j.

Por supuesto, podemos utilizar cadenas de cualquier longitud n. El n-ésimo


grafo de confusión Gn = G x G x ... x G tiene como conjunto de vértices
vn = {(UI, ... ,Un ): ui E V}con(Ul, ... ,Un ) =1= (VI, ... V n ) conectados
mediante una arista si Ui = Vi Ó UiVi E E para todo i. La tasa de infonnación
por símbolo determinada por cadenas de longitud n es

¿Qué podemos decir sobre 0:( Gn)? En primer lugar observamos lo siguiente:
sea U ~ V uno de los conjuntos independientes máximos de G, de manera
que IUI = 0:. Los vértices o:n de Gn de la fonna (UI, ... , un), Ui E U para
todo i, fonnan claramente un conjunto independiente en Gn. De aquí

y por tanto

\/o:(Gn) 2': o:(G),

lo cual significa que la tasa de infonnación nunca decrece utilizando cadenas


largas en lugar de símbolos independientes. Esta, por cierto, es una idea básica
en la teoría de códigos: Codificando símbolos en cadenas más largas podemos
hacer que la comunicación sin errores sea más eficaz.
Si dejamos de tener en cuenta el logaritmo llegamos a la definición fundamen-
tal de Shannon: la capacidad de error cero de un grafo G viene dada por

8(G) := sup \/o:(Gn) ,


n?:l

y el problema de Shannon era calcular 8 (G), Y en particular 8 ( 0 5 ).


Echemos un vistazo a 0 5 . Hasta donde sabemos, 0:(05 ) = 2 ::; 8(05 ). Mi-
rando el 5-ciclo tal y como se dibujó antes, o al producto 0 5 x 0 5 como se
muestra al margen, vemos que el conjunto {(1, 1), (2,3), (3,5), (4,2), (5, 4)}
es independiente en 0 52 . Por tanto, tenemos 0:(052 ) 2': 5. Puesto que un con-
junto independiente puede contener sólo dos vértices de dos filas consecutivas,
vemos que 0:(052 ) = 5. En consecuencia, utilizando cadenas de longitud 2
hemos incrementado la cota inferior para la capacidad hasta 8 (05 ) 2': /5.

Hasta aquí no tenemos cotas superiores para la capacidad. Para obtener tales
cotas seguiremos de nuevo las ideas originales de Shannon. En primer lugar
Comunicar sin errores 215

necesitamos la definición dual de un Un


e <:: Ves un subgrafo completo o clan! si dos vértices cualesquiera de e están
unidos mediante una arista. Por ejemplo, los vértices son clanes triviales de
tamaño 1, las aristas son los subgrafos completos de tamaño 2, los triángulos
son de tamaño 3, y así sucesivamente. Sea C el conjunto de clanes en G.
Consideramos una distribución de probabilidad arbitraria x = (xv : v E
en el conjunto de esto es, Xv 2: O Y ¿vEV Xv = 1. Para cada
distribución x asociamos el "valor máximo de un clan"

:\(x) = max L X v ,
CEe
vEC

y finalmente hacemos

:\(G) = min:\(x) = minmax ~ Xv.


x x CEe L-,
vEC

Para ser precisos deberíamos utilizar ínfimo en lugar de mínimo, pero de hecho
el mínimo existe, porque :\(x) es continua en el conjunto compacto de todas
las distribuciones.
Consideramos ahora un conjunto independiente U <:: V de tamaño máximo
0;( G) = 0;. Asociada a U definimos la distribución Xu = (xv : v E V)
haciendo Xv = ~ si v E U Y Xv = O en otro caso. Puesto que cualquier
clan contiene a lo sumo un vértice de U, inferimos que :\(xu) = ~, yen
consecuencia, por la definición de :\ (G), que

1
:\(G) ::::; o;(G) ó

Lo que observó Shannon es que :\( G) -1 es, de hecho, una cota superior para
todo \lo; (Gn), y de aquí que también lo sea para 8 (G). Para demostrarlo es
suficiente demostrar que para cualquier par de grafos G, H se verifica

:\(G x H) = :\(G):\(H) , (1)

ya que esto implicará :\ (Gn) = :\ ( G) n y de aquí

:\(G n )-1 = :\(G)-n


:\(G)-I.

Para demostrar (1) usamos el teorema de dualidad de la programación lineal


(véase [1]) y obtenemos

:\(G) = minmax ~ Xv = maxmin ~ Yc, (2)


x CEe L-, y vEV L-,
vEC C3v

donde la parte de la derecha recorre todas las distribuciones de probabilidad


y = (Yc : e E C) en C. Consideremos G x H, y sean x y x' distribuciones
que alcanzan el mínimo, :\(x) = :\(G), :\(x ' ) = :\(H). En el conjunto
1NdT. Véase la nota al pie de la página 207.
216 Comunicar sin errores

de vértices de G x H asignamos el valor z(u,v) = xux~ al vértice (u, v).


Puesto que I:(u,v) Z(u,v) = I:u Xu I:v x~ = 1, obtenemos una distribución.
A continuación observamos que los clanes maximales en G x H son de la
forma e x D = {(u, v) : u E e, v E D}, donde e y D son clanes en G y H
respectivamente. De aquí obtenemos

A(G x H) ::; A(Z) max Z(u,v)


CxD
(u,v)ECxD

max ~ Xu ~ x~ = A(G)A(H) ,
CxD¿ ¿
uEC vED

por la definición de A(G x H). De la misma manera la desigualdad en sentido


contrario '\(G x H) 2: A(G)A(H) se demuestra utilizando la expresión dual
para A( G) en (2). Resumiendo, podemos concluir que para cualquier grafo G,

Apliquemos nuestros descubrimientos al S-ciclo y, de manera más general, al


e
m-ciclo m . Utilizando la distribución uniforme (~, ... , ~) en los vérti-
ces, obtenemos A(em ) ::; ~, ya que cualquier clan contiene a lo sumo dos
°
vértices. De manera similar, escogiendo ~ para las aristas y para los vér-
tices, tenemos ,\( em) 2: ~ por la expresión dual en (2). Concluimos que
A( Cm) = ~ y por tanto
m
8(Cm ) ::; 2
para todo m. Ahora, si m es par, entonces es claro que a(Cm ) = 'q-, y por
tanto también 8(Cm ) = 'q-. Para m impar, sin embargo, obtenemos que
a(Cm ) = m 2I. Para m = 3, el ciclo C3 es un grafo completo, y también lo
es cualquier producto 0"3' lo cual implica que a(C3 ) = 8(e3 ) = 1. Así, el
primer caso interesante es el S-ciclo, para el cual sabemos hasta ahora que

(3)

Utilizando este enfoque de la programación lineal (y algunas otras ideas)


Shannon fue capaz de calcular la capacidad de muchos grafos y, en parti-
cular, para todos los grafos con cinco o un número menor de vértices - con
la única excepción de C 5 , para el que no pudo ir más allá de las cotas que se
indicaron en (3). Llegado a este punto, se detuvieron las cosas durante más de
20 años, hasta que László Lovász consigió demostrar, utilizando un argumento
sorprendentemente sencillo, que 8 (C 5 ) = V5. Un problema combinatorio en
aparencia muy difícil fue resuelto con una solución elegante e inesperada.
La idea fundamental de Lovász fue representar a cada vértice v del grafo me-
diante un vector real de longitud 1, de manera que cualesquiera dos vectores
que pertenecen a vértices no adyacentes en G sean ortogonales. Llamemos a
este conjunto de vectores una representación ortonormal de G. Claramente,
tal representación siempre existe: basta considerar los m = IVI vectores uni-
tarios (1,0, ... , O)T, (0,1,0, ... ,O)T, ... , (0,0, ... , l)T de dimensión m.
o Para el grafo C 5 podemos obtener una representación ortonormal en lR?3 al
El paraguas de Lovász considerar un "paraguas de" con cinco varillas VI, .. . , V5 de longitud una
Comunicar sin errores 217

unidad. Ahora colocamos la del paraguas en el y lo abrimos


hasta el momento en que los ángulos entre varillas alternadas son de 90° .
A continuación Lovász demostró que la altura h del paraguas, esto es, la dis-
tancia entre O y S; proporciona la cota

(4)

Un cálculo sencillo conduce a h 2 = )g; véase el recuadro a continuación. De


aquí se sigue que 8(05 ) ~ vÍ5,yportanto 8(05 ) = vÍ5.

b
u,,'~"""vu,
se considera que un es estéticamente
si, después de cortar un cuadrado de lado a, el rectángulo que queda
tiene la misma forma que el Las a, b de los lados de
a
dicho deben verificar É.a = --a
b . Definiendo la razón T := 2.,
a a
obtenemos T = oT2 1 O. Al resolver la ecuación cuadrática
se obtiene el número áureo T =
Consideramos ahora un pentágono de lado a, y sea d la LVL'iSH"<lU

de sus diagonales. Desde Euclides XIll,8) se sabe que ~ T, Y b-a


que el punto de intersección de dos diagonales divide a las diagonales
según la razón áurea.
La demostración de Euclides es la Puesto que la suma total de
A
los ángulos del pentágono es 31f, el ángulo en cualquiera de los vértices
es 3;.De aquí se sigue que <J.ABE %, ya que ABE es un <LUUA6"LV

isósceles. Esto a su vez que <J.AM B = 3;,


Y podemos con- E
cluir que los triángulos ABO y AJvI B son semejantes. El cuadrilátero
OM E D es un rombo, ya que sus lados opuestos son paralelos (véanse
los ángulos), y por tanto IMe¡ ay = d - a. Por la semejanza
de ABO y AM B concluimos que

d IABI a IMOI e D
a IAMI =~= IMAI =T.

Aún hay más. Para la distancia 3 de un vértice al centro S del pentágono,


se invita al1ector demostrar la relación 8 2 (nótese que BS corta
a la diagonal AO en un ángulo recto y la por la mitad).
Para finalizar nuestra excursión por la geometría, consideramos ahora el
paraguas con el pentágono regular en la superior. Puesto que las
varillas alternadas (de 1) forman un ángulo recto, el teorema
de Pitágoras nos permite obtener d = ,,12, y de 32 = ,!2 =
v'5~5. Así, utilizando de nuevo Pitágoras, encontramos el resultado que
prometimos para la altura h ¡OSI:
h2 = 1_ 32 = 1+ vÍ5
vÍ5+5
218 Comunicar sin errores

Veamos cómo demostró Lovász la desigualdad (4). sus resultados


fueron mucho más generales), Consideramos el producto interno usual

= XlYl + .. , + XsYs
de dos vectores x = y = (Yl,"" Ys) en ]Rs. En esta situación,
(Xl, ... , X s ),
Ixl2 = (x, x) = xi + ... + x;es el cuadrado de la longitud Ixl de x, yel
ángulo I entre x e y viene dado por
(x, y)
COS I = Ixllyl'
Así (x, y) = O si y sólo si x y y son ortogonales.
Nuestro siguiente objetivo es obtener la cota superior 8(G) :::; O"yl para la
capacidad de Shannon de un grafo cualquiera G que tenga una representación
ortonormal especialmente "agradable". Para ello, sea T = {v(1), ... ,v(m)}
una representación ortonormal del grafo G en ]Rs, donde V(i) corresponde al
vértice Vi. Asumimos además que todos los vectores v(i) forman el mismo án-
gulo (distinto de 90°) con el vector u := ~(V(l) + ... + v(m»), o de manera
equivalente, que el producto interno

= O"T

tiene el mismo valor O" T -1 O para todo i. Llamemos a este valor O"T la cons-
tante de la representación T. Para el paraguas de Lovász gue representa al
ciclo 0 5 , la condición (v("), u) = O"T se verifica para u = OS.
Ahora continuamos con los tres pasos siguientes:
(A) Consideramos una distribución de probabilidad x = (Xl, ... ,X m ) en V,
y denotamos

Sea U el conjunto independiente más grande en G, con IUI = a, y definimos


Xu = (Xl,"" X m ) con Xi = ±
si Vi E U, Y Xi = O en otro caso. Puesto
que todos los vectores v(i) tienen longitud unitaria y (v(i) , v(j») = Opara dos
vértices cualesquiera no adyacentes en G, podemos inferir que
m 2
MT(G) :::; M(Xu) = II:XiV(i)1
i=l

Así, tenemos MT (G) :::; a -1, Y por tanto


1
a(G) :::; MT(G)"

CH) Ahora calcularemos MT (G) mediante la desigualdad de Cauchy-Schwarz

(a, b)2 :::; lal 2


para vectores a, b E ]Rs. Aplicada a a = Xl v(l) + ... + xmv(m) y b = u, la
desigualdad conduce a
(5)
Comunicar sin errores 219

Por la hipótesis (v (i) , U) = a T para todo i, tenemos

para cualquier distribucion x. En particular, esto ha de verificarse para la


distribución uniforme (~, ... , ~), lo cual implica lul 2 = aTo De aquí (5) se
reduce el
ó
Por otra parte, para x = (~, ... , ~) obtenemos

y por tanto hemos demostrado que

(6)

En resumen, hemos establecido la desigualdad


1
a(G) :::; - (7)
aT
para cualquier representación ortonormal T con constante a T.
(C) Para extender esta desigualdad a 8( G) procedemos como antes. Con-
sideramos de nuevo el producto de dos grafos G x H. Supongamos que
G y H tienen representaciones ortonormales R y S en llF y lIts respectiva-
mente, con constantes a R y a s . Sea v = (VI, ... , V r ) un vector en R y
W = (WI, ... , w s ) un vector en S. Al vértice en G x H correspondiente al
par (v, w) le asociamos el vector

Se comprueba inmediatamente que R x S := {vw T : v E R, W E S} es una


representación ortonormal de G x H con constante aRaS. De aquí, por (6),
obtenemos
¡'¿RXS(G x H) = ¡'¿R(G)¡'¿s(H).
Para Gn = G x ... x G y la representación T con constante aTesto significa

y por (7) obtenemos


< a- n
- T'

Tomando en consideración todos estos pasos hemos completado el argumento


de Lovász.

Teorema. Siempre que T = {v(1), ... , v(m)} sea una representación


ortonormal de G con constante a T' se tiene que

1
8(G) :::; (8)

"Paraguas con cinco varillas"


220 Comunicar sin errores

Mirando al paraguas de tenemos u = (O, O, h= k)T Y de que


(J" = (V(i), = h = )g, lo que conduce a 8(C5 ) :::: -j5. Así pues el
2

problema de Shannon queda resuelto.


Llevemos nuestra discusión un poco más allá. Vemos por (8) que cuanto ma-
yor sea la constante (J"T para una representación de G, mejor cota obtendremos
para 8 (G). El siguiente método nos proporciona una representación ortonor-
mal para cualquier grafo G. A G = (V, E) le asociamos la matriz de adyacen-
1 O O cia A = (aij), que se define así: sea V = {VI, ... , V m }, entonces hacemos
O 1 O
A=

o D 1
O
O
O
1
O
1
O
1

La matriz de incidencia para el ciclo


de longitud 5
e5
si ViVj E E
en otro caso.

A es una matriz real simétrica con ceros en la diagonal principal.


Ahora necesitamos dos resultados de álgebra lineal. En primer lugar, como
toda matriz simétrica, A tiene m autovalores reales Al 2 A2 2 ... 2 Am
(algunos de los cuales pueden ser iguales), y la suma de los autovalores es
igual a la suma de las entradas de la diagonal principal de A, es decir, O. De
aquí que el autovalor más pequeño tenga que ser negativo (excepto en el caso
trivial en el que G no tiene aristas.)
Sea p = IAm I = - Am el valor absoluto del menor autovalor y consideremos
la matriz
1
M := 1 + -A,
p

donde 1 denota la matriz identidad (m x m). Esta M tiene como valores


Propios 1 + Alp >- 1 + A2p >
- ... > - 1 + A=
p = O. El segundo resultado que
utilizaremos es el conocido teorema de la diagonalización del álgebra lineal:
Si M = (mij) es una matriz real simétrica con todos los autovalores 2 O,
entonces existen vectores v(l), ... ,v(m) E JR;.s, donde s = rango(M), tales
que
(1:::: i,j :::: m).
En particular, para M = 1 + ~ A obtenemos

(V(i), V(i)) = mii = 1 para todo i

y
para i i- j.
Puesto que aij = O siempre que ViVj tf. E, vemos que, de hecho, los vectores
v(l), ... , v(m) forman una representación ortonormal de G.
Finalmente, apliquemos esta construcción a los m-ciclos Cm para m 2 5
impar. Aquí podemos calcular facilmente p = IAmínl = 2 cos ~ (véase el
recuadro en la página opuesta). Cada fila de la matriz de adyacencia contiene
dos unos, lo cual implica que cada colunma de la matriz M suma 1 + ~. Para
la representación {v(l), ... ,v(m)} esto significa que
2 1
(v(i), V(l) + ... + v(m)) = 1+ - 1+--7r:-'
p cos -m
Comunicar sin errores 221

y de
1
(V(i) , = -
m
(1 + (cos -'m-'- ) -1) = a

para todo i. En consecuencia, podemos aplicar nuestro resultado principal (8)


y concluir que

(para m 2: 5 impar). (9)

Puesto que cos';;;:; < 1, la cota (9) es mejor que la cota 8( Cm) :S !J} que
encontramos antes. Nótese también que cos ~ = ~, donde T = ~+1 es la
razón áurea. De aquí, para m = 5 obtenemos de nuevo

= 5(vÍ5 + 1) = V5.
5 + vÍ5

Examinemos la matriz de adyacencia A del ciclo Cm' Para encontrar


los autovalores (y autovectores) utilizamos las raíces m-ésimas de la
unidad. Tales raíces vienen dadas por 1, (, (2, ... , (m-l para ( =
- véase el recuadro en la página 25.
Sea ,\ (h una de esas raíces. Entonces, afirmamos que
(1,'\,,\2, ... ,,\m-l)T es un autovector de A para el autovalor ,\ +,\-1.
De hecho, según la construcción de A encontramos

1 ,\ ,\m-l 1
+
,\ ,\2 1 ,\
+
,\2 ,\3 ,\2
A + ,\ =(,\+,\-1)

,\m-1 ,\m-2 ,\m-l


1 +
Puesto que los vectores (1, '\, ... , ,\ m-1) son independientes (forman lo
que se conoce como una matriz de Vandermonde), concluimos que para
m impar

(h + eh [(cos(2k1r /m) + i sen(2k1r /m)]


+ [cos(2k1r/m) - isen(2k1r/m)]
= 2cos(2k1r/m) (O:S k:S m 2 1)

son todos los autovalores de A. Además, puesto que el coseno es una


función decreciente,

7f
-2cos
m
es el menor de los autovalores de A.
222 Comunicar sin errores

La representación ortogonal que resulta de esta construcción es, por


exactamente el paraguas de Lovász.
Por ejemplo, para m = 7 todo lo que y ¿qué ocurre con G7 , Gg , Y el resto de los ciclos impares? Considerando
sabemos es a(G~), a(G;;J y otras potencias pequeñas, la cota inferior m;-l ::; 8(Gm )
4r<= 7 puede ser incrementada, pero para todos los números impares m 2: 7 las me-
v 108 :S 8( C 7 ) :S 1 + (cos'71r) - l '
jores cotas inferiores conocidas son distintas de la cota superior dada por (8).
que es 3.2237:S 8( C 7 ) :S 3.3177. Así, veinte años después de la fantástica demostración de Lovász de que
8( G5 ) = y5, estos problemas continúan abiertos y son considerados como
muy difíciles - pero, después de todo, así estabamos al principio.

[1] V. CHVÁTAL: Linear Programming, Freeman, New York 1983.


[2] W. HAEMERS: Eigenvalue methods, in: "Paeking and Covering in Combinato-
ries" (A. Sehrijver, ed.), Math. Centre Traets 106 (1979), 15-38.
[3] L. LovÁsz: On the Shannon capacity oJa graph, IEEE Trans. Information Theory
25 (1979), 1-7.
[4] C. E. SHANNON: The zera-error capacity of a noisy channel, IRE Trans.
Information Theory 3 (1956), 3-15.
No está claro quién dio al siguiente problema su toque humano, ni quién lo
propuso por primera vez:

Imagine que en un grupo de gente se da la situación de que r:u,'1w'uu~r


par de personas tiene precisamente un amigo en común. Entonces, hay
siempre una persona (el "político") que es amigo de todos los demás.

En la jerga matemática, este resultado se conoce como el teorema de la amis-


tad.
Antes de abordar la demostración, formulemos de nuevo el problema en la ter- "Sonrisa de político"
minología de la teoría de grafos. Interpretamos las personas como un conjunto
de vértices V, y unimos dos vértices mediante una arista si las dos personas
que representan son amigas. Asumimos de manera implícita que la amistad es
una relación simétrica, es decir, que si u es amigo de v, entonces v también
es amigo de u, y aún más, que nadie es amigo de uno mismo. Así pues, el
teorema puede enunciarse de la siguiente manera:

Teorema. Supóngase que G es un grafo finito en el cual cualquier pareja


de vértices tiene exactamente un vértice vecino común. Entonces existe un
vértice que es adyacente a todos los demás.

Nótese que existen grafos finitos con esta propiedad; véase la figura, en la
que u es el político. Sin embargo, estos "molinos de viento" resultan ser los
únicos grafos con la propiedad deseada. De hecho, no es difícil comprobar
que ante la presencia de un político, únicamente son posibles grafos del tipo
de los molinos de viento.
De manera sorprendente, el teorema de la amistad no se verifica para grafos
infinitos. De hecho, para la construcción inductiva de un contraejemplo se
puede comenzar, por ejemplo, con un 5-ciclo, y añadir reiteradamente veci-
nos comunes a todos los pares de vértices que no tienen aún ninguno. Esto
conduce a un grafo de la amistad infinito (numerable) sin político. Un molino de viento
Existen varias demostraciones del teorema de la amistad, pero la primera, dada
por Paul Erd6s, Alfred Rényi y Vera Sós, continúa siendo la más atractiva .

• Demostración.. Supóngase que la afirmación es falsa y que G constituye un


contraejemplo, es decir, ningún vértice de G es adyacente a todos los demás.
Para llegar a una contradicción procedemos en dos partes. La primera utiliza
combinatoria y la segunda álgebra lineal.
224 Sobre amigos y políticos

Afinnamos que G es un grafo es d( u) = d( v) para todo


u,v E V
Nótese en primer lugar que la condición del teorema implica que no existen

<) v
ciclos de longitud 4 en G. Nos referimos a ello como la condición-C4 .
Veamos en primer lugar que cualesquiera dos vértices u y v no adyacentes
tienen el mismo grado d( u) = d( v). Supongamos d( u) = k Y que Wl, ... ,Wk
son los vecinos de u. Exactamente uno de los Wi, por ejemplo W2, es adya-
cente a v, y W2 es adyacente a exactamente uno de los otros Wi, pongamos Wl,
de modo que tenemos la situación representada en la figura de la izquierda. El
vértice v tiene en común con Wl el vecino W2, Y con Wi (i 2: 2) un vecino
común Zi (i 2: 2). Por la condición C4 todos estos Zi han de ser diferentes.
Concluimos que d(v) 2: k = d(u) y, por simetría, que d(u) = d(v) = k.
Para finalizar la demostración de (1), obsérvese que cualquier vértice diferente
de W2 no es adyacente ni a u, ni a v, y por tanto tiene grado k, según lo que
acabamos de probar. Sin embargo, puesto que d( W2) < n - 1, existe algún
vértice que no es vecino de W2, Y por tanto W2 también tiene grado k, y G es
k-regular.

Sumando sobre los grados de los k vecinos de u obtenemos k 2 . Puesto que


cualquier vértice (excepto u) tiene exactamente un vecino común con u, he-
mos contado cada vértice una vez, excepto en el caso de u, que ha sido contado
k veces. Por tanto, el número total de vértices de G es

n = k2 - k + 1. (1)

(2) El resto de la demostración es una bonita aplicación de algunos resultados


básicos de álgebra lineal. Nótese en primer lugar que k ha de ser mayor que 2,
puesto que para k ~ 2, la condición (1) implica que sólo son posibles G = K 1
Y G = K 3 , Y ambos son grafos de molino de viento triviales. Consideremos la
matriz de adyacencia A = (aij), tal y como se definió en la página 220. Según
el apartado (1), cualquier fila tiene exactamente k unos, y por la condición del
teorema, para cualesquiera dos filas existe exactamente una columna en la cual
ambas tienen un 1. Aún más, nótese que la diagonal principal está compuesta
de ceros. De aquí, se tiene que

1
k

1 1) (k-1)I+J,

donde 1 es la matriz identidad y J la matriz compuesta únicamente por unos.


Se comprueba inmediatamente que los autovalores de J son n (con multipli-
cidad 1) y O (con multiplicidad n - 1). Se sigue que A2 tiene los autovalores
k - 1 + n = k 2 (con multiplicidad 1) y k - 1 (con multiplicidad n - 1).
Puesto que A es simétrica, y por tanto diagonalizable, concluimos que A tiene
como autovalores k (con multiplicidad 1) y ±-Jk=T Supongamos que 7" de
los autovalores son iguales a vIk-=1 y que s de ellos son iguales a -vIk-=1,
con 7" + S = n-l. Ahora casi hemos tenninado. Como la suma de los
Sobre amigos y políticos 225

auto valores de A es a la traza es encontramos que

k+r~-svk-l = 0,

y, en particular, r 7: s y

k
~=
s-r

Ahora, si la raíz cuadrada vm


de un número natural m es racional, entonces
es un entero. Una elegante demostración de este resultado fue presentada por
Dedekind en 1858: Sea no el menor natural con novm E N. Si vm
ti- N,
entonces existe f E N con <
vemos que nI E N Y nI
° vm -
vm vm -
= no(
f < 1. Haciendo nI := no(
f)vm = nom - f(novm) E N.
vm -f),

Ya que nI < no, estamos ante una contradicción para la elección de no.
Volviendo a nuestra ecuación, sea h ~ E N, entonces

Como h divide a h 2 + 1 Y a h 2 , tenemos que h debe ser igual a 1, y por tanto


k = 2, algo que ya habíamos excluido. En consecuencia, hemos llegado a una
contradicción, y la demostración está completa. O

Sin embargo, aquí no acaba la historia. Reformulemos nuestro teorema de


la siguiente manera: Supóngase que G es un grafo con la propiedad de que
entre cualesquiera dos vértices existe exactamente un camino de longitud 2.
Claramente, esta formulación es equivalente a la de la condición de amistad.
Nuestro teorema afirma entonces que los únicos grafos posibles son los moli-
nos de viento. Pero, ¿qué ocurre si consideramos caminos de longitud mayor
que 2? Una conjetura de Anton Kotzig afirma que la situación análoga es
imposible.

Conjetu.ra de Kotzig. Sea f > 2. Entonces no existen grafos finitos con


la propiedad de que entre cualesquiera dos vértices exista precisamente un
camino de longitud f.

El mismo Kotzig verificó su conjetura para f ::; 8. En [3] se ha probado hasta


f = 20, Y A. Kostochka nos ha comunicado recientemente que ahora se ha
verificado para todo f ::; 33. Una demostración general, sin embargo, parece
inalcanzable ....

[1] P. ERDÓS, A. RÉNYI & V. Sós: On a problem of graph theory, Studia Sci. Math.
1 (1966), 215-235.
[2] A. KOTZIG: Regularly k-path connected graphs, Congressus Numerantium 40
(1983), 137-141.
[3] A. KOSTOCHKA: The nonexistence of certain generalized friendship graphs, in:
"Combinatorics" (Eger, 1987), Colloq. Math. Soco János Bolyai 52, North-
Holland, Amsterdam 1988, 341-356.
Comenzábamos este libro con los primeros trabajos de Paul Erd6s en teoría
de números y lo concluimos con lo que posiblemente será considerado como
su contribución más importante: la introducción, junto con Alfred Rényi, del
método probabilístico. Enunciado de la manera más sencilla, dice así:

Si, en un conjunto dado de objetos, la probabilidad de que uno de ellos


no tenga una determinada propiedad es menor que 1, entonces ha de
existir un objeto con esta propiedad.

Por tanto, estamos ante un resultado de existencia. Puede ser muy difícil (y lo
es a menudo) encontrar este objeto, pero sabemos que existe. Presentamos tres
ejemplos de Erd6s (cada cuál más sofisticado) de este método probabilístico,
y acabamos con una reciente y particularmente elegante aplicación.
Para entrar en calor, consideremos una familia F de subconjuntos A i , todos
de tamaño d 2: 2, de un conjunto X finito. Decimos que F es 2-coloreable
si X puede colorearse con dos colores de modo que en cada Ai aparezcan
ambos. Es evidente que no cualquier familia de conjuntos es 2-coloreable:
consideremos por ejemplo todos los subconjuntos de tamaño d de un conjunto
X con 2d - 1 elementos. No importa cómo utilicemos dos colores para X,
habrá d elementos que reciban el mismo color. Otra observación evidente es
que cualquier subfamilia de una familia 2-coloreable tiene la misma propie-
dad. Nos interesa el mínimo m = m(d) para el cual existe una familia con
m conjuntos que no pueda colorearse con dos colores. Dicho de otra manera,
m( d) es el mayor número que garantiza que cualquier familia con menos de
m( d) conjuntos sí sea 2-coloreable.
Teorema 1. Cualquier familia que contiene como mucho 2d - 1 conjuntos de
d elementos es 2-coloreable, esto es, m(d) > 2d - 1 .
• Demostración. Sea F una familia que cumple la condición del enunciado.
Se colorea X de manera aleatoria y equiprobable con dos colores. Para cada
A E F sea EA el suceso "todos los elementos de A tienen el mismo color".
Puesto que existen precisamente dos de estas coloraciones, tenemos

Prob(EA) = (~)d-l.
Usando m = IFI ::; 2d - 1 (nótese que los sucesos EA no son disjuntos),

Concluimos que existe alguna coloración de X con dos colores que no tiene
ningún conjunto de F de un solo color. Por tanto, se verifica el teorema. O
228 La probabilidad nos lo pone fácil (aveces)

Erdos estableció también una cota superior para m( d),


3 a d 2 2d . Usó de nuevo el método probabilístico, esta vez tomando conjuntos
aleatorios y una coloración fija. Los únicos valores exactos conocidos son
m(2) = 3 Y m(3) = 7. El valor m(2) = 3 se alcanza para el grafo K 3 , y la
configuración de Fano, formada por los siete conjuntos de tres elementos de la
figura, conduce a m(3) .:s: 7. Es fácil ver que :F necesita tres colores. Probar
que todas las familias de seis conjuntos de tres elementos son 2-coloreables, y
por tanto que m(3) = 7, requiere un poco más de cuidado.
Nuestro siguiente ejemplo es un clásico del área: los números de Ramsey.
Consideremos el grafo completo KN de N vértices. Decimos que KN tiene la
1 6 2 propiedad (m, n) si, no importa de qué manera se coloreen las aristas de KN
de azul y rojo, siempre existe un subgrafo completo con m vértices cuyas
aristas son todas rojas, o uno con n vértices y todas las aristas azules. Es
claro que si KN tiene la propiedad (m, n), también la tiene cualquier Ks con
s ;::: N. Igual que en el primer ejemplo, nos interesa el menor número N (si
existe) con esta propiedad - el llamado número de Ramsey R( m, n).
Para comenzar, se tiene R(m, 2) = m, ya que o bien todas las aristas de Km
son rojas, o existe una arista azul, que es un K 2 azul. Por simetría, tenemos
R(2, n) = n. Ahora supongamos que existen R(m - 1, n) y R(m, n - 1).
Probaremos que existe R( m, n) y que

R(m, n) :s: R(m - 1, n) + R(m, n - 1). (1)

Sea N = R(m - 1, n) + R(m, n - 1), Y consideremos una coloración ar-


bitraria en rojo y azul de K N . Para un vértice v, llamamos A al conjunto de
vértices conectados con v mediante una arista roja, y B a los vértices conec-
A
aristas tados mediante una arista azul.
rojas Puesto que IAI + IBI = N 1, tenemos que o bien IAI ;::: R(m - 1, n), o
bien IBI;::: R(m,n-1). Supongamos que IAI;::: R(m-1,n) (el otro caso es
v análogo). Por la definición de R( m - 1, n), o bien existe en A un subconjunto
ARde tamaño m - 1 cuyas aristas son todas rojas (que proporciona, junto con
v, un Km rojo), o existe un subconjunto A B de tamaño n con todas las aristas
azules. Inferimos que KN satisface la propiedad (m, n), de donde se sigue la
afirmación (1).
B Combinando (1) con los valores iniciales R(m,2) = m y R(2, n) = n, y
utilizando la conocida recursión para coeficientes binomiales, obtenemos que

R(m,n) < ( m+n -


m-1
2),
y en particular, que

R(k,k) :s: 2k -
( k-1
2) 2k -
( k-1
3) + (2k -
k-2
3) < 22k~3.
-
(2)

Ahora lo que realmente nos interesa es encontrar una cota inferior para R( k, k).
Para ello hemos de probar que para un N < R(k, k) tan grande como sea po-
sible existe una coloración de las aristas de manera que no haya ningún Kk
azulo rojo. Aquí entra en juego el método probabilístico.
La probabilidad nos lo pone fácil (aveces) 229

Teorema Para todo k 2: 2, se tiene la 0'"'''',"',,''' cota mio,",nr para los


números Ramsey:
rojo
R(k, k) 2: 2~.

11 Demostración. Tenemos R(2, 2) = 2. Por (2) sabemos que R(3, 3) :S 6, '::,::" ... :/~~~i'\" ... ::::.'
~"~ .... ", ... ~, . . ,<
Y el grafo K5 coloreado como en la figura muestra que R(3, 3) = 6. :/ ............... , .............,
Sea ahora k 2: 4. Suponemos que N < 2~, Y consideramos todas las colora-
/~.......... """",,~\.
ciones de KN, donde cada arista se colorea independientemente de azulo rojo
con probabilidad ~. Por tanto, todas las coloraciones tienen la misma proba-
bilidad, Ten. Sea A un conjunto de vértices de tamaño k. La probabilidad
del suceso A R , todas las aristas de A están coloreadas de rojo, es entonces
Tm. De aquí se sigue que la probabilidad P R de que las aristas de algún
conjunto de tamaño k estén coloreadas de rojo está acotada por

PR = Prob( UA R) < L Prob(AR )


IAI=k IAI=k

Ya que N < 2~ Y k 2: 4, Y usando (~) < 21!~1 para k > 2 (véase la


página 12), tenemos

Por tanto P R < ~,y simétricamente P B < ~ para la probabilidad de que haya
k vértices con todas las aristas azules. Concluimos que PR + PB < 1 para
N < 2~, de manera que debe existir una coloración sin ningún Kk rojo ni
azul, lo que significa que K N no tiene la propiedad (k, k). O

Por supuesto, hay una importante diferencia entra las cotas inferior y superior
para R( k, k). A pesar de la sencillez de esta demostración sacada de El Libro,
en los 50 años posteriores al resultado de Erd6s no se ha hallado ninguna cota
inferior con un exponente mayor. Es más, nadie ha sabido demostrar ni una
cota inferior de la forma R(k, k) > 2( ~+E)k, ni una cota superior de la forma
R(k, k) < 2(2-E)k, para cualquier E> O fijo.

Nuestro tercer resultado es otra bonita ilustración del método probabilístico.


Se considera un grafo G de n vértices y número cromático x( G). Si x( G)
es grande, esto es, si necesitamos muchos colores para colorearlo, podríamos
sospechar que G contiene un sub grafo completo grande. Sin embargo, esto
está lejos de ser cierto. En los años cuarenta, Blanche Descartes (y otros; véase
el recuadro en la página siguiente) construyó grafos con número cromático
arbitrariamente grande y sin triángulos, es decir, en los que cada ciclo tiene
longitud como mínimo 4.
Sin embargo, en esos ejemplos hay muchos ciclos de longitud 4. ¿Podría-
mos eliminarlos? ¿Podríamos pedir que no haya ciclos cortos y aún así tener
el número cromático arbitrariamente grande? ¡Sí, podemos! Para precisar,
llamemos cintura ¡( G) a la mínima longitud de un ciclo en G. Entonces se
verifica el siguiente teorema, probado por primera vez por Paul Erd6s.
230 La probabilidad nos lo pone fácil (a veces)

He aquí una sucesión de grafos G 31 G 41 .•. sin triángulos con

n.

Empieza con G 3 = e 5 , el ciclo de 5; por tanto X( G 3 ) 3.


Supongamos que ya hemos construido el grafo con vértices V. El
G n +1 tiene como vértices V U VI U {z}, donde los vértices
Vi E corresponden de manera biyectiva a los v E y z es un UliCO
vértice adicional. 3 clases de aristas en G n +1: primero, todas las
aristas de G n ; en segundo lugar, se une cada vértice Vi exactamente a
los vecinos de ven G n ; finalmente, se conecta z con todos los Vi E VI.
Por tanto, a partir de G 3 e 5 obtenemos como el llamado grafo de
Mycielski.
Es claro que Gn+i no tiene triángulos. Para probar X( Gn+d = n + 1
hacemos inducción sobre n. Sea e una clase de color de cualquier
coloración de G n con n colores. Tiene que existir un vértice v E e
adyacente a por lo menos un vértice de todas las demás clases de color;
e
de otro modo podríamos colorear los vértices de con los n 1 colores
Construyendo el grafo de Mycielski restantes, y tendríamos X( G n ) ::; n - 1. Ahora es claro que en esta
coloración con n colores, el vértice Vi E VI tiene que recibir el mismo
color que el vértice v E V al que corresponde. Por tanto, los n colores
aparecen en VI, Y necesitamos un nuevo color para z.

Teorema 3. Para todo entero k 2 2 existe un grafo G con número cromático


X( G) > k y cintura ,( G) > k.
Nuestra estrategia es similar a la utilizada en las demostraciones anteriores:
Consideraremos cierto espacio de probabilidad en los grafos y demostraremos
que la probabilidad para X( G) :s; k es menor que ~, y de manera similar que
la probabilidad para, (G) :s; k es menor que ~. En consecuencia, tiene que
existir un grafo con las propiedades deseadas .
• Demostración. Sea V = {Vi, V2, ... 1 v n } el conjunto de vértices, y p
un número entre O y 1 que elegiremos con cuidado más adelante. Nuestro
espacio de probabilidad (} (n, p) está formado por todos los grafos con vértices
en y cuyas aristas aparecen con probabilidad p de manera independiente.
En otras palabras estamos ante un experimento de Bernoulli en el cual cada
arista aparece con probabilidad p. Por ejemplo, la probabilidad Prob(Kn) de
que aparezca el grafo completo es Prob(Kn) = p(?). En general, tenemos
Prob(H) = pm(1- p)(?)-m si el grafo H tiene exactamente m aristas.
Empecemos con el número cromático X(G). Sea a = a(G) el número de
independencia, que es el tamaño del mayor conjunto independiente en G.
Puesto que en una coloración con X = X( G) colores todas las clases de colores
son independientes (y por tanto de tamaño :s; a), se verifica que xa ?:: n. Por
tanto, si a es pequeño en comparación con n, entonces X tiene que ser grande,
que es lo queríamos.
La probabilidad nos lo pone fácil (a veces) 23

PV"hU.U"'" 2 :::; r :::; n. La de que un de tamaño r


en V sea independiente es (1 - p) (;) , y concluimos del mismo modo que en
el teorema 2 que

Prob(a ~ r) < (;>1- p)(;)

< n r (l - p)(;) (n(l - p) r;-l r < (ne- p (r-l)/2r,


ya que 1 - p :::; e- P para todo p.
k
Dado cualquier k > O fijo, escogemos ahora p := n - k+ 1 • Demostraremos a
continuación que para n lo suficientemente grande,

Prob ( a ~ ~) < ~. (3)


1 1
De hecho, ya que n k+l crece más deprisa que log n, tenemos n k+l ~ 6k log n
para n lo suficientemente grande, y por tanto p ~ 6k lo~ n. Para r := I l ;k
esto nos da pr ~ 3 log n, y por tanto

que converge a Ocuando n tiende a infinito. Por tanto, (3) se verifica para todo
n ~ nI, siendo nI cierto entero positivo.
Ahora tratamos el segundo parametro, "( (G). Para el valor dado de k queremos
demostrar que no hay demasiados ciclos de longitud:::; k. Sean i un número
entre 3 y k, y A s:
V un conjunto fijo de tamaño i. El número de ciclos
de longitud i posibles en A es la mitad del número de permutaciones cíclicas
de A (ya que podemos atravesar cada ciclo en dos direcciones), y por tanto
igual a (i-;I)!. El número total de posibles i-ciclos es por tanto (7) (i-;I)!, Y
cualquier i-ciclo e aparece con probabilidad p'. Sea X la variable aleatoria
que cuenta el número de ciclos de longitud:::; k. Para estimar X usaremos dos
herramientas sencillas, pero bellas: por un lado la linealidad de la esperanza,
y por otro la desigualdad de Markov para variables aleatorias no negativas:
EX
Prob(X ~ a) :::; - ,
a
donde EX es el valor esperado de X. En el apéndice del capítulo 14 presen-
tamos un rápido repaso de estas herramientas.
Sea Xc la variable aleatoria indicatriz de ciclo e, cuya longitud es, por ejem-
plo, i. Esto es, hacemos Xc = 1 ó O dependiendo de si e aparece o no en
el grafo; por tanto, EXc = pi. Puesto que X cuenta el número de todos los
ciclos de longitud:::; k, tenemos X = :z.::: Xc, y por linealidad

EX =
k
V
~
(n) (i -i
1) 1. 1v ..
k
1 k k
2 'p":::; 2~n'p2:::; 2(k-2)n p ,

1
donde la última desigualdad se verifica porque np = n k+l ~ 1. Aplicando
ahora la desigualdad de Markov con a = ~, obtenemos

Prob(X ~~) :::; ~~ < (k _ 2) (n~)k (k - 2)n- k+l.


1
232 La probabilidad nos lo pone fácil (a veces)

Puesto que el segundo miembro tiende a Ocuando n tiende a infinito, inferimos


que p( X ?: ~) < ~ para n ?: n2.
Casi hemos terminado. Nuestro análisis nos dice que para n ?: max(nl, n2)
existe un grafo H en n vértices con a(H) < 2nk y menos de ~ ciclos de
longitud::; k. Borramos un vértice de cada uno de estos ciclos y llamamos G
al grafo resultante. Sabemos que ")'( G) > k. Puesto que G contiene a más de
n
~ vértices y satisface a(G) ::; a(H) < 2 k' nos encontramos con

n/2 n n
X(G) ?: a(G) ?: 2a(H) > n/k = k,

y hemos acabado la demostración. o


Hay construcciones explícitas de grafos (muy grandes) con cintura y número
cromático grandes. (En contraste, no se sabe cómo construir las 2-colora-
ciones cuya existencia probamos en el teorema 2, que no contienen a grafos
completos monocromáticos grandes.) Un rasgo llamativo de la demostración
de Erdos es que nos proporciona la existencia de grafos relativamente peque-
ños con número cromático y cintura grandes.

Para finalizar nuestra excursión al mundo probabilístico mostraremos un im-


portante resultado en la teoría de grafos geométricos (que también se remonta
a Paul Erdos) cuya demostración de El Libro es bastante reciente.
Partimos de un grafo simple G = G (V, E) con n vértices y m aristas. Nuestro
objetivo es dibujar G en el plano de la misma manera en que lo hicimos para
grafos planares. Sabemos del capítulo 11 - como consecuencia de la fórmula
de Euler - que un grafo planar simple G tiene como mucho 3n - 6 aristas.
Por tanto, si m es mayor que 3n - 6, tiene que haber cruces entre algunas
aristas. El número de cruce cr( G) se define de manera natural como el menor
número de cruces entre todas las maneras de dibujar G, sin permitir que más
de dos aristas se crucen en un punto. Por tanto, cr( G) = O si y sólo si G es
planar.
En el dibujo con cr( G) mínimo buscado se prohíben las siguientes situaciones:
~ Ninguna arista se puede cruzar a sí misma.
<11 No se pueden cruzar aristas que tienen un vértice en común.
~ Ningún par de aristas se puede cruzar dos veces.
Nótese que en cualquiera de estos casos podemos construir un dibujo diferente
del mismo grafo con un número menor de cruces usando las operaciones de la
figura. Por tanto, a partir de ahora supondremos que cualquier dibujo se ajusta
a estas reglas.
Supongamos que se ha dibujado G en el plano con cr( G) cruces. Veremos a
continuación que hay una cota inferior inmediata para el número de cruces.
Consideramos el grafo H, cuyos vértices son todos los vértices de G más
todos los puntos de cruce, y cuyas aristas son todas las piezas de las aristas
originales según caminamos de un punto de cruce a otro.
El nuevo grafo H es plano y simple, por las tres condiciones de antes. El
número de vértices de H es n + cr( G), y el número de aristas es m + 2cr( G),
La probabilidad nos lo pone fácil (a veces) 233

ya que todos los vértices nuevos tienen 4. Utilizando la cota del número
de aristas de un grafo plano tenemos

m + 2cr(G) :$ 3(n + cr(G)) - 6,

esto es,
cr(G) 2: m 3n + 6. (4)
Por ejemplo, para el grafo completo K6 calculamos

cr(K6 ) 2: 15 - 18 + 6 = 3,

y, en efecto, hay un dibujo con solamente 3 cruces.


La cota (4) es bastante buena si m es lineal en n, pero la situación es diferente
cuando m es más grande comparado con n. Esta es la afirmación de nuestro
siguiente teorema.

Teorema 4. Sea G un grafo simple con n vértices y m aristas, donde m 2: 4n.


Entonces
1 m3
cr(G) > - -
- 64 n 2

La historia de este resultado, conocido como el lema de los cruces, es bastante


interesante. Fue conjeturado por Erd6s y Guy en 1973 (con alguna constante
e en lugar de l4). Las primeras demostraciones fueron dadas por Leighton
en 1982 (con la constante 160 en lugar de l4) y de manera independiente por
Ajtai, Chvátal, Newborn y Szemerédi. El lema de los cruces apenas fue cono-
cido (de hecho, mucha gente lo supuso una conjetura bastante tiempo después
de las demostraciones originales), hasta que László Székely mostró su utilidad
en un artículo muy bonito, en el que lo aplicó a varios problemas extremales
de geometría, hasta entonces considerados difíciles. La demostración que pre-
sentamos a continuación se debe a conversaciones por correo electrónico entre
Bernard Chazelle, Micha Sharir yErno WelzI, y sin duda se merece un sitio
en El Libro .

• Demostración. Consideramos un dibujo minimal de G, y sea p un número


entre O y 1, que escogeremos más adelante. Generanlos un sub grafo de G
seleccionando cada vértice de G con probabilidad p de manera independiente.
Llamaremos G p al sub grafo inducido obtenido de esta manera.
Sean np, mp, X p las variables aleatorias que cuentan el número de vértices,
aristas y cruces de Gp . Ya que la relación cr( G) - m + 3n 2: O se verifica
por (4) para cualquier grafo, con total seguridad tenemos

Ahora calcularemos los valores esperados E(n p), E(m p) y E(Xp ). De ma-
nera obvia, E(np) = pn y E(mp) = p2 m , ya que una arista aparece en G p si ~
Y sólo si lo hacen sus dos vértices extremos. Finalmente, E(Xp) = p4 cr(G),
porque un corte está presente en G p si y sólo si sus cuatro vértices (¡que son
distintos!) están presentes.
234 La probabilidad nos lo pone fácil (a veces)

Por linealidad de la esperanza se obtiene que

lo cual nos da
m 3n3· (5)
P
Y ahora, el golpe de gracia: elegimos p .- ;;:, que es como mucho 1, por
nuestra suposición. Entonces (5) es

1 [4m
cr(G) 2: 64 (n/m)2 - (n/m)3
3n]
y hemos terminado. D

A Paul Erd6s le habría encantado ver esta demostración.

[1] M. AJTAI, V. CHVÁTAL, M. NEWBORN & E. SZEMERÉDI: Crossing-free sub-


graphs, Annals ofDiscrete Math. 12 (1982), 9-12.
[2] N. ALON & J. SPENCER: The Probabilistic Method, Second edition, Wiley-
Interscience 2000.
[3] P. EROOS: Some remarks on the theory ofgraphs, Bulletin Amer. Math. Soco 53
(1947),292-294.
[4] P. EROOS: Graph theory and probability, Canadian J. Math. 11 (1959), 34-38.
[5] P. EROOS: On a combinatorial problem l, Nordisk Math. Tidskrift 11 (1963),
5-10.
[6] P. EROOS & R. K. GUY: Crossing number problems, Amer. Math. Monthly 80
(1973),52-58.
[7] P. EROOS & A. RÉNYI: On the evolution ofrandom graphs, Magyar Tud. Akad.
Mat. Kut. Int. Kozl. 5 (1960), 17-61.
[8] T. LEIGHTON: Complexity Issues in VLSI, MIT Press, Cambridge MA 1983.
[9] L. A. SZÉKELY: Crossing numbers and hard Erdtfs problems in discrete
geometry, Combinatorics, Probability, and Computing 6 (1997), 353-358.
El Libro de las demostraciones 235
Nos alegra tener la posibilidad, y el privilegio, de ilustrar este libro con los ma-
ravillosos dibujos originales de Karl Heinrich Hofmann (Darmstadt).
¡Gracias!
Los poliedros regulares de la página 66 y el desarrollo en el plano de una
esfera flexible de la página 74 son obra de WAF Ruppert (Viena).
Jürgen Richter-Gebert nos proporcionó dos ilustraciones de la página 68.
En la página 203 aparece el Weisman Art Museum de Mineápolis, diseñado
por Frank Gehry. La foto de su fachada occidental es de Chris Faust. El plano
pertenece a la Galería Dolly Fiterman Riverview, que se encuentra por detrás
de esta fachada.
Los retratos de Bertrand, Cantor, Erd6s, Euler, Fermat, Herglotz, Hermite,
Hilbert, Pólya, Littlewood y Sylvester pertenecen al archivo fotográfico del
Mathematisches Forschungsinstitut Oberwolfach, con autorización. (¡Muchas
gracias a Annette Disch!)
Los sellos con retratos de Buffon, Chebyshev, Euler y Ramanujan provienen
de la colección de sellos matemáticos de Jeff Miller, accesible en la dirección
http://jeff560.tripod.com, y han sido reproducidos con su generosa autoriza-
ción.
El retrato de Hermite procede del primer volumen de sus obras completas.
La foto de Claude Shannon fue proporcionada por el MIT Museum y aparece
reproducida en este libro con su permiso.
El retrato de Cayley está tomado del "Photoalbum für WeierstraB"
(editado por Reinhard B611ing, Vieweg 1994), con permiso de Kunstbibliothek,
Staatliche Museen zu Berlin, Preussischer Kulturbesitz.
El retrato de Cauchy está reproducido, con autorización, de Collections de
l'École Polytechnique, París.
El retrato de Fermat está tomado de Stefan Hildebrandt y Anthony Tromba:
The Parsimonious Universe. Shape and Form in the Natural World, Springer-
Verlag, New York 1996.
El retrato de Emst Witt pertenece al volumen 426 (1992) del Joumal für die
Reine und Angewandte Mathematik, con autorización de Walter de Gruyter
Publishers. Fue tomada alrededor de 1941.
La foto de Karol Borsuk fue tomada en 1967 por Isaac Namioka, y ha sido
reproducida aquí con su amable autorización.
Damos las gracias al DI. Peter Spemer (Braunschweig) por el retrato de su
padre, y a Vera Sós por la foto de Paul Turán.
¡Gracias a Noga Alon por el retrato de A. NiHi!
aguja de Buffon, 133 condición-C4 ,224
ángulo conexo, 57
diedro, 47 configuración de puntos, 59
obtuso, 79 congruentes, 51
anillo de división, 23 conjetura de Borsuk, 85
anticadena,151 conjunto
árbol, 57 finito, 151
de Calkin-Wilf, 95 independiente, 57, 185
etiquetado, 173 ordenado, 105
arista, 56 continuo, 99
de un poliedro, 50 convergencia, 39
aristas múltiples, 56 cuadrado latino, 179, 185
parcial, 179
barajar, 157 cuadrados, 18
estrategias, 159, 163 cubo unidad, 50
base de retícula, 70 cuerpo
bien ordenado, 105 finito, 23
biyección, 93, 191 primo, 18
bosque, 57
con raíz, 177 denso, 103
bucle, 56 desigualdad
de Cauchy-Schwarz, 109
cadena, 151 de Markov, 84
camino, 57 desigualdades, 109
caminos en retículas, 167 determinante, 167
canal, 213 de Jacobi, 37
capacidad de error cero, 214 dimensión, 99
cara, 50, 65 de un grafo, 140
cardinal, 93, 105 distribución de probabilidad, 209
centralizador, 23 doble recuento, 142
centro, 23
ciclo, 57 emparejamiento estable, 188
cintura, 229 espacio de probabilidad, 84
clan, 207, 215 esperanza, 84
coeficientes binomiales, 13 estrella, 55
coloración
con listas, 200 faceta, 50
de grafos, 199 familia
por listas, 186 de caminos disjuntos en vér-
combinatoriamente equivalente, 51 tices, 167
comparación de coeficientes, 39 crítica, 154
238 temático

familia entrecruzada, 152 incidente, 56


fórmula invariante de Dehn, 47
de Binet-Cauchy, 169, 175 involución, 20
de Cayley, 173
de clases, 24
de Euler para poliedros, 65
de Stirling, 11
fórmulas de adición, 128
función
de Newman, 97
impar, 128
matriz
lineal sobre Q, 46
de adyacencia, 220
par, 130
de caminos, 167
periódica, 128
de incidencia, 54, 142
zeta de Riemann, 41
de rango 1, 86
grado media
de entrada, 187 armónica, geométrica y arit-
de salida, 187 mética,109
de divisores, 143
de un vértice, 66, 143, 186
método probabilístico, 227
medio, 66
mezcla por imbricación, 163
grafo,56
mismo tamaño, 93
bipartito, 57, 188
molino de viento, 223
bipartito completo, 56
completo,56 núcleo, 187
de confusión, 213 numerable, 93
de aristas, 190 número
de Mycielski, 230 cromático por listas, 186
de un politopo, 51 de clan, 209
dirigido, 187 de cruce, 232
dirigido acíclico, 168 de independencia, 213, 230
dirigido con pesos, 167 de Ramsey, 228
dual,65 ordinal, 105
dual,199 ordinal inicial, 106
planar,65 primo, 3,7
plano, 65, 200 números
plano casi-triangulado, 200 armónicos, 10
simple, 56 de Bernoulli, 40, 130
sin C 4 , 144 de Fermat, 3
sin triángulos, 230 de Mersenne, 4
grafos irracionales, 27
de Turán, 207 pentagonales, 193
isomorfos, 57
orden de un elemento, 4
hipótesis del continuo, 102
paradoja de los cumpleaños, 157
identidades paraguas de Lovász, 216
de particiones, 191 partición, 191
de Rogers-Ramanujan, 195 plano proyectivo, 145
temático 239

poliedro, 45, 50 sub grafo, 57


de SchOnhardt, 204 completo, véase clan
poliedros inducido, 57, 187
equicompletables, 45 sub sucesiones monótonas, 140
equidescomponibles, 45 sucesión refinadora, 177
polígono, 50 suma de dos cuadrados, 17
elemental, 69
polinomio tamaño
complejo, 117 de un conjunto, 93
con raíces reales, 111, 120 tasa de transmisión, 213
en coseno, 121 teorema
polinomios de Chebyshev, 122 de Sylvester-Gallai, 68
politopo, 79 de Chebyshev's theorem, 118
convexo, 50 de Dehn-Hadwiger, 47
postulado de Bertrand, 7 de Erd6s-Ko-Rado, 152
principio del palomar, 139 de la amistad, 223
problema de la galería de arte, 204
de Dinitz, 185 de Lagrange, 4
de la pendiente, 59 de Legendre, 8
de Littlewood-Offord, 123 de los cuatro colores, 199
del coleccionista, 158 de los dos cuadrados, 17
tercero de Hilbert, 45 de los números primos, 10
producto de Lovász, 219
de grafos, 214 de Pick, 69
escalar, 86 de rigidez de Cauchy, 71
infinito, 191 de SchrOder-Bemstein, 100
proporción áurea, 217 de Spemer, 151
de Sylvester, 13
raíces de la unidad, 25 de Sylvester-Gallai, 53
rectángulo de Turán, 207
latino, 180 del buen orden, 105
tangencial, 111 del matrimonio, 154
regla de detención, 160 del punto fijo de Brouwer, 147
representación matricial de los árboles, 175
hiperbinaria, 96 tercer problema de Hilbert, 45
ortonormal,216 triángulo tangencial, 111
retícula, 69 truco de Herglotz, 127

serie unimodal, 12
de Euler, 35
variable aleatoria, 84
diatómica de Stem, 95
vecino, 56
series de potencias formales, 191
vectores casi-ortogonales, 86
simetría central, 51
vértice, 50, 56
simetrización de Minkowski, 81
convexo, 205
símplice, 50
vértices adyacentes, 56
símplices en contacto, 75
vigilantes del museo, 203
sistema
volumen, 74
de conjuntos 2-coloreable, 227
de representantes distintos, 154

También podría gustarte