Está en la página 1de 41

ELEMENTOS DE

MATEMÁTICA
Publicación didáctico-cientı́fica editada
por la UNIVERSIDAD CAECE

VOLUMEN XXIV - NÚMERO 83


Marzo de 2018
ELEMENTOS DE MATEMÁTICA ELEMENTOS DE
MATEMÁTICA
Propietario: Fundación CAECE PUBLICACIÓN DIDÁCTICO-CIENTÍFICA
Publicación didáctico-cientı́fica DE LA UNIVERSIDAD CAECE
editada por la Universidad CAECE
en forma semestral.

Redacción y administración
Av. de Mayo 866 - CP: 1084
CABA, Argentina
Tel: (011) 5252-2800
e-mail: ediciones@caece.edu.ar

Comité Editorial: VOLUMEN XXIV - NÚMERO 83


Dr. Daniel Prelat Marzo de 2018
Dr. César Massri
Dr. Federico Quallbrunn
SUMARIO
Comité Cientı́fico:
Editorial . . . . . . . . . . . . . . . . . . 3
Dr. Efim Zelmánov
Dr. Arturo Pianzola Noticias matemáticas . . . . . . . . . . . 4
Dr. Philippe Gille Crupiers y matemática
Dr. Fernando Cukierman Dr. Nicolás Frevenza . . . . . . . . . . . . 5

Diagramación: Problemas para pensar


26a Olimpiadas de Matemáticas Ñandú . . . . 11
Dr. César Massri
Ejemplos de análisis global para métricas
Secretaria: euclı́deas
Lic. Mayra Valije Dr. Osvaldo P. Santillán . . . . . . . . . . . 13
La distribución de probabilidad Chi-Cuadrado
Lic. Susana Pasciullo . . . . . . . . . . . . 22
Sistemas hamiltonianos
Lic. Francisco Kordon . . . . . . . . . . . . 30

ISSN: 2591-3131
Editorial

El número 83 de la Revista está en marcha. No es para ufanarse en exceso


por la continuidad de la publicación (dado que hubo una interrupción de varios
años), pero la sucesión de los números naturales comienza por el 1 y para
alcanzar el número 100 es necesario publicar el segundo, luego el tercero, por
lo cual, vamos por buen camino. Esta es una Revista hecha por y dirigida a
personas que se dedican a la Matemática, con mayor o menor éxito, pero todos
con la misma fascinación frente a esta ciencia (¿arte?). Esta fascinación que
suele ser un misterio para la inmensa mayorı́a de la gente. Un filósofo escribió,
en sus indagaciones juveniles, que se encontró con “algunos filósofos infiltrados
en el género humano”. Podrı́amos expresar lo mismo de los matemáticos. Tal
vez exista un virus, digamos el mathematicaviridae, que causa una enfermedad
incurable: la pasión por la Matemática. El efecto es un camino de ida, de
un punto de no retorno. Cabe aclarar, enfáticamente, que no se trata de un
“juego divertido”. ¿Alguien dirı́a que una sinfonı́a de Mozart es “divertida”?
Creo que, en este sentido, hay más afinidad entre la Matemática y la Música o
la Literatura, que, por ejemplo, con la Ingenierı́a. Es conocida la fascinación
de Borges por la Matemática, por citar un ejemplo ilustre. Lo demuestran
no solamente sus reflexiones sobre el infinito o las paradojas eleáticas, sino
también sus maravillosas ficciones, a las que volvemos siempre, una y otra
vez, como El libro de arena o El disco (de Odı́n). Pero hay otro aspecto,
quizás, más misterioso: “La irrazonable eficacia de la Matemática en las
Ciencias Naturales” (E. Wigner 1960). Para terminar con estas disquisiciones,
acompaño con una cita clásica que incorpora, curiosamente, el “honor del
espı́ritu” a esta cuestión. En una carta, Jacobi le escribe a Legendre: “Fourier
sostenı́a que la finalidad principal de la Matemática era la utilidad pública y la
explicación de los fenómenos naturales, pero un filósofo como él deberı́a saber
que el objetivo único de la ciencia es el honor del espı́ritu humano y que, en ese
sentido, un problema de teorı́a de números es tan valioso como un problema
sobre la estructura del universo”.

Dr. Daniel Prelat


Director del Departamento de Matemática
4 Noticias matemáticas

Noticias matemáticas

En esta sección recopilamos noticias de interés a todo el espectro de la comunidad matemática que
hayan ocurrido en los últimos meses

• La red de publicaciones cientı́ficas “Frontiers in science” lanzó una nueva revista on-line
“Frontiers for Young Minds” que publica artı́culos expositivos de investigaciones recientes
orientados hacia un público infantil. En la sección “Understanding mathematics” aparecen
artı́culos explicando problemas actuales de la matemática en términos muy sencillos
Link: https://kids.frontiersin.org/section/understanding-mathematics/articles.

• Este año se realizará el ICM, International Congress of Mathematics, la reunión de matemática


más importante a nivel mundial. Esta vez es la primera que se realiza en lationamérica, en
la ciudad de Rio de Janéiro entre el 31 de julio y el 8 de agosto. Es en este encuentro donde
se darán a conocer los nombres de los nuevos galardonados con la medalla Fields, el premio
más famoso en matemática.
Link: http://www.icm2018.org/portal/en/.
• Entre el 22 y el 26 de Enero del 2018, se realizó en Valdivia, Chile, el II Encuentro de Mujeres
Matemáticas de América Latina. La primera versión de este encuentro se realizó en Oaxaca.
El objetivo del encuentro es hacer visible el trabajo de mujeres matemáticas de la región,
crear redes, y también mostrar parte de la investigación que se está haciendo en torno a la
relación de niñas y mujeres con esta disciplina. Contó con charlas de matemáticas dictadas
por investigadoras de diferentes paı́ses de América Latina, ası́ como también con charlas y
talleres relativos a género y ciencias.
• El Premio Wolf de 2018 para Matemáticas ha sido otorgado a Alexander Beilinson y Vladimir
Drinfeld, ambos de la Universidad de Chicago, “por su trabajo pionero en geometrı́a algebraica,
teorı́a de la representación y fı́sica matemática”. El premio, que conlleva un premio en efectivo
de US $ 100.000, fue anunciado en un evento especial organizado por el Presidente de Israel,
el Sr. Reuven Rivlin. Los Premios Wolf se otorgan anualmente desde 1978 a reconocidos
cientı́ficos y artistas por sus logros para la humanidad y por las relaciones amistosas entre los
pueblos, independientemente de su nacionalidad, raza, color, religión, género o perspectiva
polı́tica, en campos como agricultura, quı́mica, matemática, medicina, fı́sica y las artes.

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 5

Crupiers y matemática
Dr. Nicolás Frevenza

... la suerte juega con cartas sin marcar


no se puede cambiar ...
https://www.youtube.com/watch?v=yMvWAuLhjB4
Cartas sin marcar - Andrés Calamaro.

En casi cualquier juego de cartas es importante saber si las cartas están bien mezcladas. A
todos alguna vez, para bien o para mal, nos sucedió que las cartas no se mezclaran bien, haciendo
que algunos juegos de la mano anterior se repitan casi idénticamente. Saber mezclar es toda una
habilidad aunque más habilidad requiere barajar para aparentar que las cartas se mezclaron pero
sin que lo hayan hecho demasiado. En definitiva, si no se mezcló bien se podrı́an reconocer patrones
para saber qué cartas están en el juego y cuáles no. En esta nota se comentarán algunos modelos
matemáticos que representan el proceso de barajar cartas y se verá en qué medida se puede decir
si lo hicimos bien o no.
Supongamos que tenemos n cartas en el mazo. La primer pregunta es de cuántas formas
diferentes podemos ordenarlas, es decir, cuántos mazos diferentes existen. El mazo es en definitiva
un conjunto ordenando de cartas, por lo que lo pensaremos como una secuencia de n posiciones,
donde cada posición se corresponde con un lugar en el mazo. Cada carta debe tener una posición,
por lo que para la primer carta que se toma hay n posibles opciones para ubicarla en el mazo.
Para la segunda carta se tienen n − 1 opciones porque ya se usó una posición para la primer carta;
la tercera cuenta con n − 2 posibilidades, y ası́ sucesivamente hasta que en el n-ésimo paso nos
queda solo una carta para colocar en el mazo. Es decir que tenemos n! mazos posibles (se dice n
factorial), donde n! se define como

n! = n × (n − 1) × (n − 2) × · · · × 2 × 1.

Notar que de la definición del factorial se deduce que (k + 1)k! = (k + 1)! para cualquiera k.
Comencemos precisando qué quiere decir que las cartas estén bien mezcladas.

Definición 1. Diremos que las cartas están bien mezcladas cuando todos los mazos tienen la
misma probabilidad de obtenerse, es decir, la probabilidad de tener las cartas ordenadas de alguna
forma prefijada, es 1/n!.
No es difı́cil deducir que un mazo de n cartas es en realidad una permutación del conjunto
{1, . . . , n}; y que decir que las cartas estén bien mezcladas es elegir una permutación al azar entre
las n! permutaciones disponibles y todas con la misma probabilidad.
Comencemos con un método muy sencillo aunque no muy práctico para mezclar cartas. Ya
habrá tiempo para mejorar. En el primer turno tenemos n cartas en el mazo y tomamos la que
está más arriba y la colocamos en un lugar aleatorio del mazo (hay n posibles lugares). En el
segundo turno tomamos la carta que quedó más arriba y volvemos a elegir una posición al azar
dentro del mazo para colocarla, y ası́ sucesivamente en siguientes turnos. Como queremos jugar
a las cartas sin pasarnos la vida mezclando con un algoritmo bastante aburrido, cabe preguntar:
¿cuántas veces tenemos que aplicarlo para poder decir que el mazo está bien mezclado? Si usted
esperaba un número concreto como respuesta está equivocado, pero podemos dar una regla exacta
que nos indica cuándo dejar de mezclar.

Universidad CAECE
6 Dr. Nicolás Frevenza

Mazo inicial:
1 2 3 4 5 6 7 8 9 10
Tomamos la carta que está más arriba (derecha
en nuestro caso) y redistribuimos:
1 2 3 10 4 5 6 7 8 9
De nuevo
1 2 3 10 4 5 6 9 7 8
La carta de arriba (8) se coloca en una
posición aleatoria (6 en este caso):
1 2 3 10 4 8 5 6 9 7
Otro cambio:
7 1 2 3 10 4 8 5 6 9
Siguiente turno:
7 9 1 2 3 10 4 8 5 6
Esquema del algoritmo para 10 cartas aplicado 5 veces;
termina cuando la carta 1 esté en la posición de más
arriba (derecha).

Para ello vamos a mirar la posición en el mazo de la carta que originalmente estaba debajo. Esta
carta será una carta distinguida, vamos a tener que poder diferenciarla del resto. Llamaremos τ al
turno en el que esa carta quedó arriba del mazo durante el procedimiento de mezcla. Resaltemos
la definición de τ .
Definición 2. τ es el primer turno en el que la carta que estaba originalmente debajo del mazo
está arriba del todo.
En el turno posterior, τ + 1, se tomará esa carta y se la ubicará de forma aleatoria en alguna
posición del mazo. En ese turno, τ + 1, el mazo se encontrará perfectamente mezclado.
Antes de probar la afirmación anterior vamos a hacer algunas observaciones. Para que en un
turno la carta que estaba originalmente debajo esté arriba y la podamos tomar para redistribuirla,
se debió haber tomado previamente cada una de las n − 1 cartas que originalmente estaban sobre
ella, porque en cada paso se toma sólo una carta y luego se coloca al azar. Se tiene entonces que
τ ≥ n. Notar que en cada turno del algoritmo no tomamos necesariamente una carta nueva, se
puede agarrar una carta que ya se habı́a tomado en un turno anterior. Por ejemplo, a la primera
carta, cuando se eligió dónde colocarla, se la puede volver a poner arriba del mazo, en el lugar que
tenı́a originalmente; de hecho esto sucede con probabilidad 1/n. En caso de que ello suceda, en el
segundo turno se tomarı́a nuevamente la misma carta. Esta situación puede ocurrir en cualquier
momento, no necesariamente con la primer carta, por lo que está bien que tengamos que esperar al
menos n turnos para que la carta que estaba originalmente debajo quede arriba del mazo. Ahora
sı́, la prueba de nuestra afirmación y su enunciado como teorema.
Teorema 3. Tenemos un mazo de n cartas que vamos a barajar de la siguiente forma:
• Tomamos la carta que está arriba y la colocamos al azar en alguna posición del mazo.
• Repetimos el ı́tem anterior hasta la primera vez que tomamos la carta que estaba originalmente
debajo del mazo (es decir, hasta τ ), y colocamos a ésta última en una posición al azar en el
mazo.
En ese momento, τ + 1, el mazo estárá bien mezclado, esto es, la probabilidad de obtener un
mazo con las cartas ordenadas de alguna forma prefijada, cualquiera sea esta, es 1/n!.
La demostración consiste en probar que si en un turno t del algoritmo de mezcla tenemos k
cartas debajo de nuestra carta distinguida (la carta que originalmente estaba abajo del todo en el
mazo), entonces esas k cartas están ordenadas de forma aleatoria. Si probamos eso, en el turno
τ todas las cartas debajo de la carta que está arriba (que es la que originalmente estaba abajo)
están distribuidas aleatoriamente, por lo que cuando insertemos a esta última en una posición al
azar, el mazo, como conjunto ordenando de cartas, tendrá un orden perfectamente aleatorio.
Para la prueba usaremos el método de inducción y lo haremos sobre la cantidad de turnos
t. Si t = 0, es decir antes de comenzar con el algoritmo, no hay cartas debajo de la carta que
estaba (¡está!) última originalmente, por lo que la afirmación es trivialmente verdadera. Ahora
supongamos que la afirmación es cierta para un turno t e intentemos probarlo para el siguiente

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 7

turno. En el paso t + 1 hay dos posibilidades para la carta que tomamos y vamos a redistribuir: o
bien la colocamos debajo de la carta que estaba originalmente abajo del mazo o bien lo hacemos
arriba de esta. En el segundo caso, las cartas que estaban debajo de la última carta en el mazo
original son las mismas que en el turno anterior, por lo que siguen ordenadas aleatoriamente. En
el primer caso, se tienen k + 1 posiciones para colocar la carta y todas igualmente probables, por lo
que hay (k + 1)k! = (k + 1)! arreglos posibles para esas cartas y todos equiprobables. Por lo tanto,
en cualquier caso, las cartas debajo de la carta que originalmente era la última, están distribuidas
aleatoriamente. Fin de la demostración y podemos jugar en paz una mano de Tute Cabrero.
Ahora bien, si concretamente se quiere jugar a un juego con 50 cartas, debido al componente
aleatorio del modelo, no se puede decir a priori cuántos turnos nos llevará este algoritmo para
tener un mazo bien mezclado. Sin embargo, podemos tener una idea de cuál es el tiempo promedio
que nos llevarı́a hacerlo. Esto es, si M personas se pone a mezclar mazos de n cartas usando el
algoritmo anterior y se observa el tiempo promedio en el que terminaron de mezclar, cuando M (la
cantidad de personas) es suficientemente grande, el tiempo promedio deberı́a encontrarse cercano
al valor n ln(n), lo que para un mazo de 50 cartas resulta en aproximadamente unos 196 turnos!
¿De dónde viene este valor de n ln(n)? Para decir algo sobre esto precisamos repasar algunos
conceptos de probabilidad.
• Distribución geométrica: se realiza un experimento que tiene dos resultados posibles,
éxito o fracaso. Pensemos que se está tirando una moneda cargada donde la probabilidad de
obtener cara (un éxito) es p y la de obtener seca (fracaso) es (1 − p). Se va a tirar la moneda
hasta la primera vez que se obtenga un éxito, es decir, salga cara, pero cada tirada se hace
de forma independiente a las anteriores. El resultado será un número Y ∈ {1, 2, 3, . . . } que
cuenta la cantidad de fracasos que tuvimos que esperar hasta obtener el primer éxito. A
esta Y , que es variable porque no siempre se obtiene el mismo resultado, se le llama variable
aleatoria geométrica con parámetro de éxito p. Nos interesa saber cuál es la distribución que
tiene el número Y que se obtiene. Por ejemplo, esto es decir cuál es la probabilidad de que
tengamos que esperar 4 tiradas. Si escribimos P a esta probabilidad no es difı́cil de calcular
y se obtiene que:
P(Y = k) = p(1 − p)k−1 .

• Ley de los grandes números: en general, en cada realización del experimento anterior
vamos a obtener un valor diferente de Y . Si el experimento se repite muchas veces de forma
independiente, entonces se puede demostrar que el promedio de estos valores converge a un
número que tiene que ver con la distribución geométrica. Más precisamente, si Y1 , Y2 , . . . , YM
son realizaciones independientes del experimento, se tiene que:
Y1 + Y2 + · · · + YM
−→ E(Y ),
M M −→∞

donde E(Y ) es un número real que se lo conoce como valor esperado (o esperanza) de la
variable aleatoria Y . En el caso de que Y tenga distribución geométrica con parámetro de
éxito p, E(Y ) = p1 (es decir, mientras más chica es la probabilidad de éxito, más tiempo se
debe esperar en promedio hasta observar el primer éxito). A este tipo de resultados donde
el promedio de cantidades independientes pero con la misma distribución (geométrica en el
caso de las Y ’s) converge a su valor esperado se lo conoce como Ley de los grandes números.
Conviene destacar que es un resultado muy general dentro de la Probabilidad, y que es cierto
para una gran variedad de variables aleatorias (no necesariamente geométricas).
Luego de esta disgresión, volvamos a pregunta que querı́amos responder: si se pone a M
personas a mezclar mazos de n cartas con el método anterior y se calcula el número de turnos
promedio en el que terminaron de mezclar, ¿cuánto vale esa cantidad? Para dar una respuesta
vamos a suponer que M es grande y que las personas mezclan de forma independiente entre sı́
(nadie mira el mazo de otra persona para mezclar). En ese caso, por la Ley de los grandes números
que recién se describı́a, el número de turnos promedio se puede aproximar por el valor esperado de
la mezcla de un sólo mazo. Por lo tanto, la respuesta a cuál es el tiempo promedio, enunciada en
forma de teorema, es la siguiente:
Teorema 4. Se considera un mazo de n cartas y el procedimiento de mezclado donde se toma la
carta de arriba del mazo y se la redistribuye aleatoriamente en este. Si se denomina τ el primer

Universidad CAECE
8 Dr. Nicolás Frevenza

tiempo para el cual la carta que estaba última en el mazo original se encuentra arriba del mismo,
se tiene entonces que:
Xn
1
E(τ ) = n ≈ n ln(n) .
k
k=1

Además ya sabı́amos que en el instante τ + 1, es decir cuando se redistribuye esta última carta, el
mazo se encuentra perfectamente mezclado.
Pn
1
El aproximado del teorema se basa en que la suma k crece como ln(n) (este último es un
k=1
resultado clásico de series, ver serie armónica en Wikipedia).
Demostremos este segundo teorema.
Sea Xt la posición en el mazo en el turno t de la carta que originalmente era la última. Vamos
a pensar que las posiciones comienzan en la última carta (la que está más abajo) y que terminan
en la carta que está más arriba (en la posición n). Por tanto en el turno t = 0 se tiene que X0 = 1.
Notar que el número de cartas que están debajo de la carta que era originalmente la última, es
siempre Xt − 1 y que si se quiere insertar una carta debajo de la carta en Xt se tienen Xt sitios
para hacerlo.
Cuando en nuestro algoritmo se toma una carta en el turno t + 1 hay dos posibilidades: o bien
se coloca arriba de la carta que estaba originalmente última o debajo de ella. En el primer caso
nuestra carta permanece en la misma posición, es decir, Xt+1 = Xt y en el segundo caso la posición
se incrementa en 1, esto es, Xt+1 = Xt + 1. Estas son las únicas transiciones posibles, por lo tanto
Xt es no decreciente (es decir, crece o queda igual). Calculemos las probabilidades de que estas
transiciones ocurran bajo el supuesto que Xt = k. La carta que tomamos de arriba del mazo se va
a colocar en una posición del mazo elegida al azar, por lo tanto las probabilidades de insertar esta
carta debajo o arriba de la que era originalmente última (que ahora está en la posición Xt ) son nk
y n−k
n respectivamente.
Sea el turno τk definido como τk = min{t ≥ 0 : Xt = k}, es decir, el primer instante en el que
la carta que originalmente era la última está exactamente en la posición k del mazo. Con esta
notación τ = τn y τ1 = 0. Observar que se puede escribir a τ de la siguiente forma:

τ = τ1 + (τ2 − τ1 ) + · · · + (τn − τn−1 ) ,

donde cada diferencia (τk − τk−1 ) cuenta la cantidad de turnos que se usaron para que la carta pase
de la posición k − 1 a la k. Ahora bien, se puede pensar que cada vez que Xt crece se está ante un
éxito y que el caso contrario (cuando permanece igual) es un fracaso. El procedimiento se repite
hasta obtener el primer éxito, es decir, hasta que la posición de la carta que era originalmente
la última suba en una unidad, o equivalentemente, haya una carta más debajo de ella. Con este
esquema nos podemos dar cuenta que la variable aleatoria (τk −τk−1 ) tiene distribución geométrica
con parámetro de éxito nk puesto que hay k lugares para insertar la carta que se tomó debajo de
nuestra carta distinguida. Entonces la esperanza o tiempo medio de τ se calcula como:
n n n n
X  X X n X 1
E [τ ] = E τi − τi−1 = E [τi − τi−1 ] = =n .
k k
k=1 k=1 k=1 k=1

Ahora vamos a comentar otro modelo para mezclar cartas, denominado mezcla americana o
riffle shuffle, mucho más real pero en el que resulta más difı́cil probar resultados.
Se corta el mazo aproximadamente por la mitad y se mezclan los dos mazos que quedaron
intercalando las cartas de ambos. Obviamente, si no se intercala de forma perfecta pueden quedar
más cartas entre medio. Lo que sı́ sucede es que si dos cartas pertenecen al mismo sub-mazo
y tienen un orden relativo entre sı́ (es decir, una está arriba de la otra), ese orden relativo se
mantiene luego de la mezcla. En el siguiente cuadro mostramos un ejemplo de mezcla americana
pero también se pueden buscar vı́deos en YouTube para ver cómo funciona este tipo de mezcla e
incluso tutoriales para aprender a mezclar de esta forma (https://youtu.be/AW91UR1bdT8acá hay
uno). Para el ejemplo, se vuelve a enumerar las cartas pero ahora al revés que en la parte anterior:
denominamos 1 a la carta que está más arriba del mazo, 2 a la siguiente y ası́ sucesivamente.
Mazo inicial:
1 2 3 4 5 6 7 8 9 10 11 12 13

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 9

Luego de cortar:
1 2 3 4 5 6 7 8 9 10 11 12 13
Ahora mezclamos
1 6 2 7 8 3 9 4 10 11 12 5 13
Volvemos a cortar:
1 6 2 7 8 3 9 4 10 11 12 5 13
Se mezcla de nuevo y se obtiene
4 1 10 6 11 2 7 12 5 8 13 3 9
Esquema del algoritmo de mezcla americana
para un mazo de 13 cartas aplicado 2 veces.

Para describir el modelo matemático detrás de esta forma de mezclar cartas precisamos otro
paréntesis para recordar a la distribución Binomial. Si ya conoce a esta distribución, puede saltearse
la disgresión.

• Distribución Binomial: vamos realizar n veces de forma independiente un experimento


que tiene dos resultados posibles: éxito o fracaso, y donde la probabilidad de éxito es p.
Estos dos parámetros, n, cantidad de veces que se repite el experimento, y p, la probabilidad
individual de obtener un éxito, están fijos y los conocemos de antemano. Llamamos M a
la cantidad de éxitos que obtenemos en esas n realizaciones del experimento. M será un
número natural entre 0 y n. Se puede calcular exactamente cuál es la probabilidad de que
M = i, es decir, de obtener exactamente i éxitos y n − i fracasos, es
 
n i
P(M = i) = p (1 − p)n−i ,
i

donde ni = (n−i)!i!
n!
. Si bien esta fórmula puede parecer engorrosa, es sencillo de creer que
la cantidad media de éxitos que se espera obtener es

np = cantidad de experimentos × probabilidad de éxito de un experimento.

Ahora sı́, describamos el modelo de mezcla americana. Se elige un número M con distribución
Binomial(n, 1/2) y se divide el mazo en las primeras M cartas y las restantes n − M . Al tomar M
como una variable aleatoria Binomial estamos considerando la posibilidad de que el mazo se puede
partir de forma no necesariamente perfecta, y al mismo tiempo le asignamos mayor probabilidad
a los cortes que dividen el mazo en tamaños similares (y en media, estamos dividiendo el mazo
a la mitad). Al momento de intercalar tenemos que elegir al azar dónde insertar las cartas pero
respetando el orden relativo de cada mazo. ¿Cuántas formas hay de hacer esto? Notar que lo
único que hace falta, dado que el orden relativo se va a respetar, es elegir los lugares donde se
colocarán las cartas del primer mazo. Elegidos esos M lugares, se coloca la primer carta del mazo
1 en el primer lugar, la segunda en el segundo, etc. Se tienen entonces tantas formas de hacerlo
como subconjuntos de M elementos dentro de un conjunto de n elementos donde el orden de los
M lugares no nos importa porque vamos a respetar el orden del primer mazo. Hay en definitiva
n
M posibles formas de colocar las M cartas del primer mazo respetando el orden entre ellas. En
resumen, para la mezcla americana o riffle shuffle hacemos lo siguiente:
• se elige M con distribución Binomial(n, 1/2) y se divide el mazo en dos.
n

• los dos mazos se intercalan usando de forma equiprobable alguna de las M formas que
existen de hacerlo.
No entraremos en detalles pero es fácil de creer que de esta forma las cartas se mezclan más
rápido que con el primer algoritmo. Concretamente se puede probar que si la cantidad de cartas,
es decir n, es grande, en este caso se requieren alrededor de 2 ln(n) para decir que la mezcla es
buena, cuando con el primer método eran necesarias del orden de n ln(n) iteraciones. Por ejemplo,
en un mazo de 50 cartas serı́an unas 8 contra 196 veces.
Llamemos µt a la distribución que tiene el mazo de cartas luego de repetir t veces alguno de los
procedimientos de mezcla que se comentaron y µ a la distribución uniforme sobre estos mazos. Los
teoremas y afirmaciones anteriores nos dicen que si t crece, usando cualquiera de los dos métodos
de mezcla, µt se acerca a µ y se acerca en un sentido que puede precisarse bien pero sobre el que

Universidad CAECE
10 Dr. Nicolás Frevenza

no daremos detalles. Solo mencionaremos que es posible definir una distancia entre µt y µ (la
distancia en variación total), y que la diferencia de los métodos radica en su eficiencia para que
µt se acerque a µ: la mezcla americana lo hace mucho más rápido que el primer método. En el
siguiente cuadro se muestra cómo se modifica esa distancia entre µt y la distribución uniforme µ
con las sucesivas mezclas en el caso de la mezcla americana para un mazo de 52 cartas (baraja
francesa ♥♣♦♠):

1 2 3 4 5 6
1.0000 1.0000 1.0000 1.0000 0.9237 0.6135
7 8 9 10 11 12
0.3341 0.1672 0.0854 0.0429 0.0215 0.0108
Cuadro de distancia entre la distribución del mazo luego de t mezclas
y una distribución uniforme.

Notar que el cambio en la distancia es muy drástico luego de las 7 primeras mezclas y que aún
haciendo la mezcla americana 5 veces, las cartas están lejos de ser distribuidas de forma aleatoria
(aunque engañen a nuestros ojos y ası́ lo parezcan). Este fenómeno, donde la distancia varı́a de
forma muy abrupta se conoce como cut-off y es de gran interés matemático.
Mirando el cuadro anterior quizás nos podemos convencer de que 7 u 8 mezclas son suficientes
para aleatorizar un mazo de 52 cartas. Sin embargo, en los 90’, Peter G. Doyle describió un juego
de cartas (New-Age Solitaire, un solitario) en el que si el mazo está distribuido de forma uniforme,
la probabilidad de ganar es exactamente 1/2, pero si se toma un mazo nuevo y se aplica 7 veces
el algoritmo de mezcla americana, entonces la probabilidad de ganar asciende a aproximadamente
0.8. Por lo tanto, en este juego inventado por Doyle, mezclar 7 u 8 está lejos de ser satisfactorio
para que el juego sea justo. Nos encontramos entonces con que dar una respuesta a priori de
cuántas veces es necesario barajar con la mezcla americana para decir que el mazo es aleatorio, no
es posible y depende del juego y una tolerancia que estemos dispuestos a aceptar. En cada caso, si
se fija un nivel de tolerancia, el cuadro anterior nos permite decir cuántas veces mezclar para caer
dentro de ese rango de tolerancia.

Referencias

Para esta nota se siguieron algunas partes del libro de Levin, Peres y Wilmer [3], allı́ la mezcla
de cartas aparece como un ejemplo relevante de cadenas de Markov. En el artı́culo [1] de Aldous y
Diaconis también se encuentra una descripción detallada de estos modelos. El libro de Grinstead y
Snell [2] dedica una sección del tercer capı́tulo a estos modelos y utiliza esencialmente herramientas
combinatorias. En particular, explica con detalle el solitario que propuso Doyle donde aplicar la
mezcla americana es totalmente insuficiente para tener un juego “justo”. Para esto último y para
algunas generalizaciones de este modelo (por ejemplo, mezcla americana pero cortando el mazo en
3,4, 5, ... mazos en vez de 2) se puede consultar el apunte de Mann [4].

Referencias

[1] Aldous, David; Diaconis, Persi. Shuffling cards and stopping times. Amer. Math. Monthly 93
(1986), no. 5, 333–348.
[2] Grinstead, Charles M.; Snell, J. Laurie. Grinstead and Snell’s Introduction to Probability.
University Press of Florida, 2009, x+510 pp, ISBN: 978-0-8218-4739-8.
[3] Levin, David A.; Peres, Yuval; Wilmer, Elizabeth L. Markov chains and mixing times. With a
chapter by James G. Propp and David B. Wilson. American Mathematical Society, Providence,
RI, 2009. xviii+371 pp. ISBN: 978-0-8218-4739-8. Disponible en http://yuvalperes.com/
markovmixing.pdf.
[4] Mann, Bran. How many times should you suffle a deck of cards?. Disponible en https://www.
dartmouth.edu/~chance/teaching_aids/Mann.pdf.

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 11

Problemas para pensar


26a Olimpiadas de Matemáticas Ñandú

Resúmen. Los siguientes problemas fueron propuestos en el segundo nivel de las 26a
Olimpiadas de Matemáticas Ñandú, 2017.

Problemas

1
1. En la función de teatro la entrada cuesta $200. El último domingo de las entradas quedaron
3
1
sin vender, de las entradas se vendieron a mitad de precio y el resto de las entradas se
5
vendieron al precio original; se recaudaron $37400 por la venta de entradas.

(a) ¿Cuántas entradas habı́a en total?


(b) ¿Cuánto se habrı́a recaudado ese dı́a si todas las entradas vendidas se hubiesen pagado
al precio original?

2. En la figura:

D R C

P Q

A B

ABCD es un cuadrado de 2304cm2 de área, BC = 3BQ, DR = 3RC y P QRD es un


paralelogramo.

(a) ¿Cuál es el área de QCR?


(b) ¿Cuál es el área de P QRD?
(c) ¿Cuál es el área de P BCD?
(d) ¿Cuál es el área de P BR?

3. Están escritos los números 1, 2, 3, 4, 5, 6, 7, 8, 9. Beto tacha alguno de estos números. Andrés
suma los números que quedaron sin tachar. La suma de Andrés es igual al doble de la suma
de los números que tachó Beto.
¿Qué números puede haber tachado Beto? Da todas las posibilidades.

Universidad CAECE
12 26a Olimpiadas de Matemáticas Ñandú

Soluciones

En lo que sigue daremos una solución de los problemas planteados en el segundo nivel de las 26a
Olimpiadas de Matemáticas Ñandú, 2017.

1. Respuestas al primero problema


(a) Habı́a 330 entradas
(b) Se habrı́an recaudado $44000
Idea de resolución:
Sea T el total de entradas. Dado que 1/3 + 1/5 es 8/15, resulta que se vendieron (7/15)T
entradas al precio original. Luego,
 
1 7
100 + 200 T = 37400 =⇒ T = 330
5 15

Se vendieron (2/3)T = 220 entradas y se habrı́a recaudado (2/3)T × $200 = $44000.


Notemos que se vendieron 66 entradas a $100 y 154 entradas a $200.
2. Respuestas al segundo problema

(a) Área de QCR es 192cm2


(b) Área de P QRD es 1152cm2
(c) Área de P BCD es 1632cm2
(d) Área de P BR es 768cm2
Idea de resolución:
Área ABCD = (AB)2 = 2304cm2 , luego AB = 48cm. Dado que BC = 3BQ, resulta
BQ = BC/3 = AB/3 = 16cm y entonces QC = 32cm.
Dado que DR = 3RC, el segmento total DC = 4RC. Luego RC = DC/4 = AB/4 = 12cm.
Entonces, DR = 36cm y por ser P QRD un paralelogramo, resulta P Q = 36cm.
Con estos datos podemos calcular

QCR = (RC × QC)/2 = 192cm2 ,

P QRD = P Q × QC = 1152cm2 ,
P BCD = P BQ + QCR + P QRD = (288 + 192 + 1152)cm2 = 1632cm2 ,
P BR = P BCD − BCR − P RD = (1632 − 288 − 576)cm2 = 768cm2 .
donde P RD se calcula como la mitad de P QRD.
3. Respuestas al tercer problema
(a) Hay 17 maneras de elegir los números

Idea de resolución:
La suma de los 9 dı́gitos es 45; la suma de los dı́gitos que tachó Beto es 45/3 = 15. Luego
los dı́gitos que suman 15 son,

(1, 2, 3, 4, 5) (2, 3, 4, 6) (3, 4, 8) (4, 5, 6) (6, 9) (7, 8)

(1, 2, 3, 9) (2, 4, 9) (3, 5, 7) (1, 2, 4, 8) (2, 5, 8) (1, 2, 5, 7) (2, 6, 7)


(1, 3, 4, 7) (1, 3, 5, 6) (1, 5, 9) (1, 6, 8).

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 13

Ejemplos de análisis global para métricas


euclı́deas
Dr. Osvaldo P. Santillán

Resúmen. En el repaso siguiente se ejemplificará con tres casos como se efectúa un


análisis global de una métrica dada. Se asume que la forma local del elemento de
distancia g = gij dxi dxj es conocido, y se desea determinar el rango global de sus
coordenadas xi . Los ejemplos utilizados son los instantones gravitatorios de Taub-Nut
[1] y Eguchi-Hanson [2], asi como los espacios Einstein-Sasaki Y (p, q) [3]. Sin embargo,
no se asume que el lector tenga algún conocimiento previo sobre estas geometrı́as ni
conceptos avanzados de topologı́a algebraica. La descripción a continuación utiliza un
lenguaje intencionalmente elemental para no expertos en el tema.

1. Introducción

En este corto repaso, se darán ejemplos de análisis global de una métrica o elemento de distancia
dado, en dimensión arbitraria.
La idea de este repaso es la siguiente. En varias ramas de la matemática pura, en particular la
topologı́a [4] y la geometrı́a algebraica [5], se estudian propiedades de variedades, fibrados, haces,
y diversas estructuras que pueden ser definida sobre ellas. Estas estructuras permiten distinguir
entre variedades inequivalentes. Ejemplos no exhaustivos son los grupos de homotopı́a, los grupos
de homologı́a y cohomologı́a, invariantes topológicos varios como los invariantes de Donaldson en
cuatro dimensiones y las clases de Chern de un fibrado dado. En estas aplicaciones, la variedad a
ser estudiada es un objeto conocido.
En fı́sica en cambio, el problema que surge a veces es opuesto. En muchos casos, los modelos
como la Relatividad General o las Teorı́as de Cuerdas, contienen ecuaciones diferenciales que
describen localmente una geometrı́a dada. Por ejemplo, en el caso de la Relatividad General con
constante cosmológica, se busca hallar una métrica o elemento de distancia

g = gij dxi dxj ,

tal que su tensor de Ricci satisfaga Rij = Λgij , siendo Λ una constante, denominada constante
cosmológica. No se pretende en este repaso entender en profundidad esta condición. Lo que se
desea resaltar es que, a priori, se ignora en que variedad suave y regular esta métrica se halla
definida. Incluso, son muchas las situaciones en las cuales ignora si esta métrica se halla siquiera
definida en una variedad suave. Es decir que se conocen aspectos locales de la geometrı́a, pero no
se conocen las propiedades globales, al menos sin un análisis adicional.
Los ejemplos que se dan a continuación son simples, pero cuidadosamente seleccionados, y
recogen en gran parte la técnica para hacer un análisis global de una métrica dada. El lenguaje
se mantiene intencionalmente elemental, para dar luego pie a un lenguaje más sofisticado. En
mi opinión, el entendendimiento de la intuición detrás de este lenguaje es una herramienta muy
potente para aprender la teorı́a general posteriormente.

Universidad CAECE
14 Dr. Osvaldo P. Santillán

2. Singularidades cónicas, fibrados y esferas

Es simple pero fundamental para el objetivo de este repaso entender el significado de una singularidad
cónica. Consideremos una métrica bidimensional plana euclı́dea (pitagórica)

g2 = dx2 + dy 2 .

En coordenadas cilı́ndricas o polares, x = ρ cos θ, y = ρ sin θ se tiene que

dx = cos θdρ − ρ sin θdθ, dy = sin θdρ + ρ cos θdθ.

Utilizando estas expresiones y teniendo en cuenta la identidad pitagórica sin2 θ + cos2 θ = 1 la


métrica plana queda expresada como sigue

g2 = dρ2 + ρ2 dθ2 , (2.1)

La coordenada angular θ, como es sabido, tiene perı́odo 2π.


Sin definir siquiera lo que es la curvatura, sabemos intuitivamente que la métrica plana (2.1)
tiene curvatura nula.
Consideremos ahora la figura de un cono bidimensional embebido en un espacio en tres dimensiones
R3 con su métrica plana. La ecuación que define este cono es extremadamente simple. Si se asume
que el eje del cono coincide con el eje ẑ, la ecuación definitoria es

z = aρ,

siendo z, ρ y θ las coordenadas cilı́ndricas usuales en R3 . Esta relación indica que las laderas del
cono son rectas. La métrica inducida sobre la superficie del cono se deduce partiendo de la métrica
plana en R3 donde el cono se halla embebido

g3 = dρ2 + ρ2 dθ2 + dz 2 ,

e incluyendo la relación z = aρ en la misma. El resultado es

gc = (1 + a2 )dρ2 + ρ2 dθ2 .
√ √
Definiendo la nueva coordenada angular θe = θ/ 1 + a2 y la nueva coordenada radial ρe = 1 + a2 ρ
la métrica resulta
gc = deρ2 + ρe2 dθe2 . (2.2)
Esto es localmente equivalente a (2.1), la métrica plana euclı́dea en dos dimensiones. La métrica
plana euclı́dea es claramente no singular, de hecho es la métrica más sencilla que pueda imaginarse.
Pero por otro lado, intuitivamente sabemos que un cono tiene una singularidad de curvatura en
su punta. Esto no implica√ninguna paradoja. El problema se halla en que el nuevo ángulo θe no
tiene perı́odo 2π, sino 2π/ 1 + a2 por lo tanto la equivalencia es local y no global. Es decir que
la métrica (2.2) tiene una singularidad de curvatura en la punta del cono ρ = 0 excepto cuando
el perı́odo θ es 2π, para el cual simplemente es la métrica plana. Esta singularidad se llama
singularidad cónica, por razones que se explican por si solas.
En general, dada una métrica de la forma

gn = dr2 + r2 Ωn−1 (2.3)

siendo Ωn−1 una métrica arbitaria compacta, esta métrica tiene una singularidad cónica en r = 0
excepto si Ωn−1 es la métrica estándar de la esfera S n−1 . No daremos una demostración de este
hecho, pero la intuición detrás es idéntica al caso bidimensional discutido más arriba.
Es importante notar que ante un escaleo de la forma r → λr la métrica cónica (2.3) escalea
como gn → λ2 gn . Este escaleo es un buen indicador que hay una singularidad cónica. Para dar un
ejemplo, consideremos una superficie en C3 descripta por la ecuación de la forma

z1 z2 = z32 . (2.4)

Esta ecuación es invariante ante un cambio zi → λzi , y esto implica que la métrica inducida
resultante es de la forma (2.3), dado que un escaleo transforma la métrica en gn → λ2 gn . Es decir

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 15

que se sabe de antemano, sin hacer ninguna cuenta, que la métrica inducida por la ecuación (2.4)
tiene una singularidad cónica.
Es un buen ejercicio deducir la métrica estándar de una esfera S 2 . Esta puede hallarse teniendo
en cuenta la relación
x2 + y 2 + z 2 = 1,
la cual describe a la esfera como una superficie en R3 . Por simplicidad, asumimos que el radio de
la esfera es R = 1. Se tienen dos formas de parametrizar la esfera. La primera es postular
p
z = ± 1 − x2 − y 2 .

Vemos que necesitamos dos cartas para definir una esfera, debido al signo ± presente en la última
expresión. Otra forma es parametrizar las coordenadas de la forma

x = cos θ cos φ, y = cos θ sin φ, z = sin θ. (2.5)

Aquı́, 0 ≤ θ ≤ π y 0 ≤ φ < 2π. Sin embargo, no hay que concluı́r que este sistema de coordenadas
cubre a la esfera con una carta. Este sistema de coordenadas tiene una singularidad en el polo sur
θ = π y polo norte θ = 0, dado que la coordenada φ no se halla definida en esos puntos. Ahora
bien, hallando dx, dy y dz teniendo en cuenta (2.5) e introduciendo las expresiones resultantes en
la métrica plana g3 = dx2 + dy 2 + dz 2 se obtiene que

.gS 2 = dθ2 + sin2 θdφ2 . (2.6)

Esta expresión será utilizada frecuentemente en lo que sigue. Otra expresión que necesitaremos es
la de la métrica de una tres esfera S 3 . Existe una elección de ángulos para los cuales la métrica
toma la forma

gS 3 = (dψ + cos θdφ)2 + dθ2 + sin2 θdφ2 = (dψ + cos θdφ)2 + gS 2 . (2.7)

Aquı́, el nuevo ángulo ψ tiene perı́odo 4π.


En este punto, es conveniente hacer una aclaración de vocabulario. Vemos que la métrica
estándar de la esfera S 3 tiene un factor gS 2 más un elemento (dτ + cos θdϕ)2 . Se dice que S 3 tiene
a S 2 como espacio base con una fibra U (1) ∼ S 1 parametrizada por ψ. Veamos esto en forma más
explı́cita. Consideremos por un momento la siguiente métrica en tres dimensiones

g3 = dθ2 + sin2 θdϕ2 + dψ 2 ,

siendo ψ periódica. Llamamos a esta métrica un fibrado U (1) trivial. La denominación U (1) ∼ S 1
indica que la coordenada ψ es perı́odica y parametriza un cı́rculo. La palabra trivial indica que
esta métrica es una suma directa de la métrica de S 2 y la métrica plana de un cı́rculo U (1). En
cambio, la métrica de una esfera S 3 (2.7) es un fibrado U (1) sobre una esfera S 2 . Pero este fibrado
no es trivial, dado que ”la fibra” (dτ + cos θdϕ)2 varı́a al moverse sobre las coordenadas de la base
S 2 por su dependencia con la coordenada θ.
Para finalizar, hay que indicar que no toda métrica puede ser descripta como un fibrado U (1).
Por ejemplo, existe un teorema debido a Adams que afirma que la esfera S 4 no puede describirse
como un fibrado U (1) sobre S 3 .

3. La geometrı́a Taub-Nut

Armados con el entendimiento básico de singularidades cónicas, procedemos a continuación con


nuestros ejemplos. La primera métrica a analizar es la siguiente
  2  r + a 
r az 
g= dτ + d arctan(y/x) + dx2 + dy 2 + dz 2 . (3.8)
r+a r r

Esta
p métrica se halla definida en cuatro dimensiones, con coordenadas x, y, z y τ . Aquı́ r =
x2 + y 2 + z 2 y a es un simple parámetro numérico, hasta el momento arbitrario. Esta métrica se
llama instanton de Taub-Nut [1] y es conocida en fı́sica porque tiene tensor de Ricci nulo Rij = 0.
Sin embargo, no nos interesan sus aplicaciones. En cambio, se plantea la siguiente pregunta. Para

Universidad CAECE
16 Dr. Osvaldo P. Santillán

qué valores de coordenadas τ , x, y y z se halla definida esta métrica? Se halla esta métrica
definida en una variedad? O este elemento de distancia es tan solo local y no puede ser extendido
globalmente?
Para analizar este problema, en primer lugar, es tentador asumir que x, y y z son coordenadas
planas cuyo rango va desde −∞ hasta ∞. Esto por el momento es válido. Sin embargo, la función
z/r es discontinua cuando se cruza el origen desde z > 0 a z < 0 a lo largo del eje z, para el cual
z = r en la parte superior y z = −r en la parte inferior. Es decir que la métrica parece estar definida
en la zona z > 0 o z ≤ 0 por separado, pero hay que analizar si puede pegarse para conseguir una
métrica suave en todos lados. Se necesitan entonces dos cartas para definir la geometrı́a. Ahora
bien, estas dos cartas pueden describirse declarando que para z > 0 la primera coordenada se
denomina τ mientras que para z ≤ 0 la coordenada se denomina τe = τ + 2a arctan(y/x). Como se
verá a continuación, esto implica que τ tiene que ser periódica. Para visualizarlo, es conveniente
introducir las coordenadas cilı́ndricas estándar

x = ρ cos ϕ, y = ρ sin ϕ, z = η, d arctan(y/x) = dϕ.

En estos términos, se ve que la forma


az
A= d arctan(y/x) = cos θdϕ,
r
que aparece en la métrica (3.8) tiene la siguiente discontinuidad al moverse a lo largo del eje z

lim A− lim A = 2adϕ.


z=r→+0 z=−r→−0

Es decir que esta forma, la cual aparece en la métrica, tiene un salto al pasar por el origen z = 0 por
la recta z = r equivalente a 2adϕ. Este salto puede compensarse si la coordenada τe en el ecuador
θ = π/2 se identifica como τe = τ + 2aϕ. Dado que el ángulo ϕ tiene perı́odo 2π es claro que τ tiene
perı́odo 4aπ, en caso contrario la identificación no serı́a posible. Con este simple razonamiento, se
ha determinado el rango de todas las coordenadas de la métrica.
Existe otra forma de explicar esto, que quizás sea más familiar para un matemático. La métrica
(3.8) puede escribirse de la siguiente forma
   
r 2 r+a 
g= (dτ + a cos θdϕ) + dr2 + r2 dθ2 + r2 sin2 θdϕ2 . (3.9)
r+a r

En el polo norte θ = 0 la coordenada ϕ no se halla definida. La forma dτ + a cos θdϕ en ese punto
se convierte en dτ + adϕ. La singularidad en dicho punto puede evitarse definiendo la coordenada
τ1 = τ + aϕ, la cual necesariamente tiene perı́odo 2aϕ. En el polo sur la coordenada es en cambio
τ2 = τ − aϕ, con el mismo perı́odo. En el ecuador, ambas coordenadas se hallan relacionadas por
τ1 = τ2 + 2aϕ. Con estas condiciones pueden obtenerse las mismas conclusiones que en el párrafo
anterior. La ventaja de este razonamiento es que puede generalizarse a geometrı́as compactas,
como una esfera por ejemplo, en las cuales no es posible atravesar el origen moviéndose a lo largo
del eje z.

3.1 La métrica de Eguchi-Hanson


La segunda métrica a analizar es la de Eguchi y Hanson [2]

r2  −1 2 r2
g= 1 − (a/r)4 ( dτ + cos θdϕ )2 + 1 − (a/r)4 dr + ( dθ2 + sin2 θdϕ2 ) (3.10)
4 4
Este ejemplo es quizás más interesante que el anterior. Se quiere hallar un rango de coordenadas
para que la métrica no tenga ningún tipo de singularidades.
En primer lugar, r ≥ a, en caso contrario se tendrı́a una distancia negativa, lo cual es inaceptable
en el caso euclı́deo. Ahora bien, para la región asintótica r >> a la métrica puede aproximarse
por
r2 r2
g ≃ ( dτ + cos θdϕ )2 + dr2 + ( dθ2 + sin2 θdϕ2 ) (3.11)
4 4

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 17

Esta métrica se parece entonces a una métrica plana, dado que es localmente de la forma g ∼
dr2 + r2 g3 con g3 la métrica estándar de la esfera S 3 descripta en (2.7). Pero cómo se define el
rango de sus coordenadas? En principio la parte de la métrica

g2 = dθ2 + sin2 θdϕ2 ,

tiene una singularidad cónica cerca de θ = 0 a menos que ϕ tenga perı́odo 2π, dado que en ese
entorno vale la aproximación
g2 ≃ dθ2 + θ2 dϕ2 ,
la cual tiene una singularidad cónica si ϕ no tiene perı́odo 2π. Es decir que se ha determinado que
ϕ = ϕ + 2π, lo cual era de esperarse. Además, la coordenada θ en principio puede ser identificada
con perı́odo π. Por otro lado, si se analiza la forma

dτ + cos θdϕ = dτ + A,

presente en la métrica, se tiene nuevamente un salto en δA = 2dϕ al pasar de cos θ = 1 a cos θ = −1.
Este salto, como en el ejemplo anterior, puede cancelarse si τ = τ +4π, debido a que ϕ tiene perı́odo
2π. Hasta aquı́ esto es lo esperado. Sin embargo, hay una singularidad cónica extra no tan evidente.
Esta singularidad puede visualizarse haciendo el cambio de coordenadas

u2 = r2 1 − (a/r)4 ,

con el cual la métrica (3.10) queda expresada de la siguiente forma


u2 −2 r2
g= ( dτ + cos θdϕ )2 + 1 + (a/r)4 du2 + ( dθ2 + sin2 θdϕ2 ). (3.12)
4 4
La singularidad aparente en r = a se corresponde con u = 0 en estas nuevas coordenadas. Cerca
de esa singularidad la métrica toma la siguiente forma
u2 1 a2
g≃ ( dτ + cos ϕdϕ )2 + du2 + ( dϕ2 + sin2 ϕdϕ2 ).
4 4 4
Si se dejan a θ y ϕ fijas, esta última expresión se reduce a
1 2 u2 2
g≃ du + dθ .
4 4
Nuevamente se ha obtenido una singularidad cónica, en la cual u/2 juega el rol de coordenada
radial y τ de coordenada angular. Esta singularidad puede ser evitada tan solo si el rango de τ
varı́a entre 0 a 2π.
Es importante notar que anteriormente se habı́a concluı́do que 0 ≤ τ < 4π mientras con este
razonamiento se tiene que 0 ≤ τ < 2π. Ambas condiciones son consistentes eligiendo el menor
perı́odo, es decir 0 ≤ τ < 2π. Qué significa esto? Significa que esta métrica es asintóticamente
localmente euclı́dea (ALE), pero uno de sus ángulos no tiene el rango esperado 4π, sino una mitad
2π. Es decir al alejarse a la región asintótica r >> a, si se efectúa media vuelta alrededor del centro
r = 0, se vuelve al punto de partida. Por eso se enfatiza la palabra localmente. La métrica de
Eguchi-Hanson entonces se halla definida en C2 /Z2 , que es el cociente del espacio vectorial complejo
C2 por la acción del grupo de dos elementos Z2 = {−1, 1} por multiplicación por escalares. En
coordenadas radiales, el factor Z2 describe la media vuelta recién mencionada e identifica τ = τ +2π
en vez de τ = τ + 4π.
Es conveniente remarcar que existe una interpretación sencilla del comportamiento de esta
métrica. Para ello, es conveniente parametrizar C2 con coordenadas complejas a y b. Estas
coordenadas, por definición, son doble valuadas en C2 /Z2 debido a que un punto dado (a, b) ∈ C2
se identifica con (−a, −b) en el cociente C2 /Z2 . Pero las funciones

z1 = a 2 , z2 = b2 , z3 = ab,

son univaluadas en C2 /Z2 . Dos de ellas pueden ser utilizadas como coordenadas en C2 /Z2 , por
ejemplo z1 y z2 . La función z3 queda definida en términos de estas coordenadas por la relación
evidente
z1 z2 = z32 ,

Universidad CAECE
18 Dr. Osvaldo P. Santillán

la cual es la ecuación algebraica de C2 /Z2 vista como una superficie en C3 . Esta última variedad
se halla parametrizada por z1 , z2 y z3 . Cabe mencionar que esta ecuación es idéntica a (2.4), la
cual fue discutida intencionalmente en secciones anteriores. La superficie inducida resultante por
esta ecuación es singular, más precisamente, tiene una singularidad cónica. En la literatura suelen
ser llamadas orbifolds.
A pesar que la ecuación algebraica descripta en el párrafo anterior define una superficie singular,
la ecuación deformada
z1 z2 − ǫ2 = z32 ,
define una geometrı́a regular, si ǫ es un parámetro positivo. El efecto de este parámetro es suavizar
la punta del cono, donde se halla concentrada la singularidad de la curvatura. Puede hacerse un
cambio de coordenadas para poner esta última ecuación en la forma

z12 + z22 + z32 = ǫ2 . (3.13)

Si se considera la métrica inducida por esta ecuación, es decir que se considera la métrica plana en
C3
g = dz1 dz 1 + dz2 dz 2 + dz3 dz 3 ,
y se introduce la relación (3.13) en la misma, se obtiene luego de algunos cambios de coordenadas
la métrica de Eguchi-Hanson (3.10) con la identificación de parámetros

ǫ = a.

Es decir que la métrica de Eguchi-Hanson se corresponde con la resolución de la singularidad cónica


en C2 /Z2 . Esta resolución suele llamarse blowup (explotado), pero no es el tema central de este
repaso. Sin embargo, cabe aclarar que los blowups a veces no son fáciles de hacer, especialmente
si se desea mantener ciertas propiedades de la geometrı́a en forma intacta. Por ejemplo, podrı́a
ser no trivial hallar un blowup tal que la métrica resultante tenga tensor de Ricci nulo. Lo que es
notable de esta discusión es que el análisis de la métrica hecho anteriormente permitió conocer la
variedad sobre la cual se halla definida a partir de su forma local, ignorando inicialmente que esta
variedad se halla descripta por (3.13).
Existe otro aspecto importante a ser discutido, que es el siguiente. Si se introduce un parámetro
irracional q en la métrica (3.10), tal que la nueva métrica resulta ser

r2  −1 2 r2
gp = 1 − (a/r)4 ( dτ + q cos θdϕ )2 + 1 − (a/r)4 dr + ( dθ2 + sin2 θdϕ2 ) (3.14)
4 4
se hubiera llegado a la conclusión que τ = τ +4qπ y τ = τ +2π. Si q es irracional, es imposible hacer
esta identificación. La métrica resultante es singular necesariamente. Es decir que los valores de los
parámetros de una métrica pueden jugar un rol fundamental en sus aspectos globales. Hablando
sin demasiado rigor, el conjunto de parámetros de una geometrı́a dada suele llamarse en algunos
contextos el moduli.

4. La métrica Y (p, q)

Como último ejemplo, consideremos ahora la siguiente métrica [3]

1−y 1 q(y)
g5 = (dθ2 + sin2 θdφ2 ) + dy 2 + [dψ − cos θdφ]2 +
6 w(y)q(y) 9
 2
a − 2y + y 2
+w(y) dα + [dψ − cos θdφ] (4.15)
6(a − y 2 )

siendo
2(a − y 2 ) a − 3y 2 + 2y 3
w(y) = q(y) = . (4.16)
1−y a − y2
Esta métrica ese halla definida en 5 dimensiones y viene descripta por coordenadas θ, φ, y, ψ y
α. Se desea entender, como en los ejemplos anteriores, el rango en el cual estas coordenadas se
hallan definidas. De nuestra discusión sobre fibrados, vemos que esta métrica se halla representada

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 19

como una fibración, probablmente U (1), cuya fibra se halla parametrizada por la coordenada α. La
métrica base viene descripta por θ, φ, y, ψ. Desde un punto de vista fı́sico se requiere que tanto la
base como la métrica total sean regulares. Esto se debe a que esta geometrı́a se utiliza en teorı́as de
Kaluza-Klein, las cuales tienen este requerimiento. Desde un punto de vista matemático en cambio,
esto no es obligatorio y pueden considerarse casos en que la métrica base sea irregular, siempre
y cuando la métrica total sea regular. En el siguiente análisis nos centramos en la condición
fı́sica, aunque algunos matemáticos fueron capaces de hallar soluciones regulares extras que no
consideraremos a continuación [6].
Ahora bien, cómo proceder para determinar el rango de las coordenadas? En principio, podrı́a
postularse que la parte bidimensional de la métrica dada por dθ2 + sin2 θdφ2 se corresponde con
la métrica de la esfera S 2 y por lo tanto θ tiene un rango de 0 a π y φ varı́a entre 0 y 2π. La
forma dψ − cos θdφ se halla bien definida al pasar de cos θ = −1 a cos θ = 1 si vale la identificación
ψ = ψ + 4π, de la misma forma que en los ejemplos anteriores. Otra condición necesaria es que
w(y) > 0 y q(y) > 0, en caso contrario se obtendrı́a una distancia euclı́dea negativa, lo cual es
inaceptable. Esta última condición implica que

y < 1, y 2 < a.

En particular, y tiene que variar entre dos ceros adjacentes yi de q(y). Es decir que yi son ceros
adjacentes de la ecuación cúbica
a − 3y 2 + 2y 3 = 0.
Ahora bien, cerca de alguno de estos ceros yi , vale el desarrollo de Taylor a primer orden q(y) ∼
q ′ (yi )(y − yi ). La métrica base entonces toma, para θ y φ fijos, la forma siguiente
1 q ′ (yi )(y − yi ) 2
dy 2 + dψ . (4.17)
w(yi )q ′ (y i )(y − yi ) 9

Si se hace el cambio de coordenadas R = [4(y−yi )/w(yi )q ′ (yi )]1/2 esta última expresión se convierte
en
q ′ (yi )2 w(yi )R2 2
dR2 + dψ . (4.18)
36
′ 2 ′ 2
Dado que q (yi ) = −3/yi y w(yi ) = 4yi , se tiene que q (yi ) w(yi )/36 = 1 para ambos ceros y = y1
and y = y2 . Por lo tanto no habrá una singularidad cónica en y = yi si el perı́odo de ψ es 2π.
Anteriormente se habı́a concluı́do que ψ = ψ+4π, y ambas conclusiones son consistentes asumiendo
el mı́nimo perı́odo, que es 2π. Por otro lado, puede introducirse la coordenada angular
 1/2
a − 3y 2 + 2y 3 2y
cos ζ = q(y)1/2 = 2
sin ζ = − (4.19)
a−y w(y)1/2
con ζ variando entre π/2 y −π/2 cuando se varı́a entre y1 e y2 . Pero es algo difı́cil trabajar con
estas coordenadas, por lo que seguimos trabajando con y. Claramente, ζ y ψ parametrizan una
esfera S 2 . Lo mismo pasa con las coordenadas φ y θ. Es decir que el espacio base es S 2 × S 2 .
Para finalizar el análisis, es necesario que determinar el rango de valores de la coordenada α.
Esto requiere analizar la forma siguiente
a − 2y + y 2
dα + [dψ − cos θdφ],
6(a − y 2 )
la cual aparece en la expresión de la métrica. De la discusión anterior se concluye que ψ e y son
dos coordenadas angulares que parametrizan una esfera S 2 . Las coordenadas (4.19) muestran que
el polo sur se corresponde con y = y1 y el polo norte con y = y2 . Si se deja φ y θ fijos, existe
una posible potencial singularidad en y = y1 e y = y2 , dado que la coordenada ψ no se halla
definida en los polos. Esto es idéntico a los ejemplos anteriores. En los polos pueden introducirse
la coordenadas
a − 2y1 + y12 a − 2y2 + y22
α1 = α + 2 ψ, α2 = α + ψ.
6(a − y1 ) 6(a − y22 )
Es decir que α1 tiene perı́odo
a − 2y1 + y12
α1 = α1 + 2π,
6(a − y12 )

Universidad CAECE
20 Dr. Osvaldo P. Santillán

y α2 tiene perı́odo
a − 2y2 + y22
α2 = α2 + 2π.
6(a − y22 )
Pero estas coordenadas tienen que pegarse en el ecuador, y eso tan solo es posible si el cociente
entre sus perı́odos
P1 a − 2y1 + y12 6(a − y22 )
= ,
P2 6(a − y12 ) a − 2y2 + y22
es racional. En caso contrario, no es posible definir una coordenada α globalmente. Esta condición
depende de la forma de las raı́ces yi , las cuales son funciones del parámetro a por la famosa fórmula
de Cardamo. Se ha demostrado que existen una cantidad infinita contable de valores de a para
los cuales el cociente es un número racional p/q, siendo p y q enteros. Más aún, cualquier cociente
racional se halla permitido. Por este motivo estas métricas se suelen denotar con el sı́mbolo Y (p, q).
Este análisis es puramente numérico y no es intrincado, pero preferimos remitirnos a la literatura
original para más detalles [3].

5. Discusión

Para concluir este repaso, es necesario remarcar dos aspectos importantes. En primer lugar, existen
otro tipos de singularidades que este repaso no tiene en cuenta. En principio, dada una métrica
arbitraria g = gij dxi dxj , pueden existir puntos en los cuales alguna componente de la métrica
diverge o se anula. Las singularidades cónicas pertenecen a este segundo caso. Esto no implica en
absoluto la presencia de una singularidad. Por ejemplo, la métrica

1 2 1
g= dt + 2 dθ2 ,
t4 t
parece divergente en t = 0. Sin embargo, el cambio de coordenadas ρ = 1/t la convierte en

g = dρ2 + ρ2 dθ2 .

Esta es la métrica plana en dos dimensiones, y es perfectamente regular. La divergencia aparente en


esta métrica se debe a una mala elección de coordenadas. Además, el punto t → 0 se corresponde
con ρ → ∞, es decir la región asintótica. Claramente, este punto se halla a distancia infinita de
cualquier otro punto en la variedad. Este ejemplo muestra que es necesario adoptar un criterio más
preciso de singularidad. Dada una métrica, pueden construirse los tensores de curvatura Rijkl , el
tensor de Ricci Rij y la curvatura R. A partir de estos tensores pueden construirse invariantes
como
Rijkl Rijkl , Rij Rij ,
entre otros. Denominamos a estas cantidades invariantes, porque su valor en un punto dado de
la variedad es independiente del sistema de coordenadas elegido. Si alguno de estos invariantes es
divergente en algún punto x0 , entonces se tiene una singularidad verdadera en dicho punto. La
única excepción se da cuando x0 es un punto que se halla a distancia infinita de cualquier otro
punto, como en el caso t = 0 del ejemplo anterior. Una singularidad en un punto que se halla a
infinita distancia de cualquier otro punto no se considera una singularidad real. En una geometrı́a
compacta en cambio, necesariamente se tiene una singularidad cuando alguno de estos invariantes
diverge.
En segundo lugar, parte del análisis hecho en las secciones anteriores requiere el estudio de
formas de tipo dτ + A. En varios ejemplos, se encontró que A = cos θdϕ, lo cual permitió deducir el
perı́odo de la coordenada τ estudiando el salto de la forma A al cruzar el origen desde la recta θ = 0
a θ = π. En forma equivalente, se pudo determinar este perı́odo estudiando el comportamiento
de dichas formas en los polos de la esfera S 2 . Este análisis es posible debido a que la forma A
tiene una expresión sencilla. Sin embargo, pueden existir situaciones en la cual la expresión de A
es más confusa, debido a la elección de coordenadas. Por ese motivo, los matemáticos prefieren
un procedimiento más intrı́nseco para determinar el perı́odo de la coordenada en cuestión. Este
procedimiento fué hallado por Chern. La justifiación de este procedimiento no es nada trivial, y
los conceptos involucrados son profundos. Sin intentar describirlo en detalle, nos limitaremos a

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 21

inidicar que la forma dA es cerrada pero no exacta, debido a la presencia de singularidades en los
polos de la esfera. En particular, esta forma tiene un perı́odo no nulo
Z
1
P = dA.
2π S 2

Es justamente esta cantidad la que determina el perı́odo de τ . Esta cantidad se denomina clase de
Chern de la esfera. Además, las métricas Y (p, q) pueden considerarse como un fibrado U (1) sobre
un espacio base S12 × S22 , como indicamos en secciones anteriores. Estos fibrados son conocidos en
la literatura matemática. Los perı́odos
Z
1
Pi = dA,
2π Si2

determinan la periodicidad de la coordenada α. Sin embargo, es posible definir dicha periodicidad


si el cociente P1 /P2 es racional. En caso contrario se llega a una contradicción insalvable. Esta
condición es equivalente a la obtenida anteriormente, e implica que estas métricas vienen descriptas
por dos números enteros p y q. No podemos hacer más comentarios sobre este formalismo, y
referimos al lector a literatura más profunda sobre el tema [7].

Referencias

[1] G. Gibbons and S. Hawking Physics Letters B. 78 (1978) 430.


[2] T. Eguchi and A. Hanson, Physics Letters B. 74 (1978) 249.
[3] J. Gauntlett, D. Martelli, J. Sparks and D. Waldram Theor. Math. Phys. 8 (2004) 711.

[4] A. Hatcher ”Algebraic Topology” Cambridge University Press 2002, ISBN 0-521-79540-0.
[5] P. Griffiths and J. Harris ”Principles of Algebraic Geometry” John Wiley and Sons 1978, ISBN
9780471050599.
[6] W. Chen, H. Lu, C. Pope and J. Vazquez-Poritz Class. Quant. Grav. 22 (2005) 3421.

[7] J. Milnor and A. Stasheff ”Characteristic classes” Annals of Mathematical Studies Princeton
University Press 1974, ISBN-13 978-0691081229.

Agradecimientos

O.P.S es financiado por el CONICET.

Universidad CAECE
22 Lic. Susana Pasciullo

La distribución de probabilidad Chi-Cuadrado


Lic. Susana Pasciullo

La distribución de probabilidad Chi-Cuadrado es una de las principales distribuciones usadas en


Inferencia Estadı́stica. La función de densidad es:
1 n x
f (x) = n/2 x 2 −1 e− 2 x > 0 n ≥ 1 entero.
2 Γ(n/2)
y se la representa con el sı́mbolo χ2n . Depende de un único parámetro n, llamado grados de libertad.
Se trata de una distribución asimétrica a la derecha y su asimetrı́a disminuye si n crece, como se
observa en las Figuras 1 y 2. Para n grande la distribución converge a la distribución Normal con
esperanza n y variancia 2n.

Figura 1 Figura 2
x
Probamos la condición de cierre haciendo = z de donde dx = 2dz
2
Z ∞ Z ∞ Z ∞
1 n x 1 n 1 n
x 2 −1 e− 2 dx = e −z
(2z) 2 −1 2dz = e−z z 2 −1 dz = 1
2 n/2 Γ(n/2) 2 n/2 Γ(n/2) Γ(n/2)
0 0 0

ya que la última integral es Γ(n/2).


La distribución fue trabajada por el alemán Friedrich Robert Helmert (1843-1917) por lo que a
veces se la nombra como la distribución de Helmert. Independientemente el británico Karl Pearson
(1857-1936) la regenera en sus aplicaciones de pruebas de bondad de ajuste, por lo que también
es conocida como distribución de Pearson. Es difı́cil conocer el momento preciso en el que surge
un modelo cientı́fico. El nombre de “grados de libertad” al único parámetro de la distribución fue
dado por el británico Sir Ronald Aylmer Fisher (1890-1962), un grande de la Estadı́stica del siglo
20.
El nombre original de Pearson era Carl, pero cuando viaja a Alemania a estudiar ciencias
polı́ticas, siendo un joven entusiasta, es capturado por las ideas de Karl Marx y su admiración lo
lleva a cambiar Carl por Karl. También se dijo que el cambio se originó por un error en algún
documento de la universidad a la que asistı́a.
Volviendo a nuestro Chi-Cuadrado, citemos la definición dada por el profesor argentino Carlos
Eugenio Dieulefait (1901-1982), creador de la carrera de Estadı́stica en Argentina (1948), en su
“Matemática Superior I” pag.201: “Se llama Chi-Cuadrado de una muestra proveniente de un
universo normal, a la suma de los cuadrados de los desvı́os de cada valor de la variable con respecto
a la media parámetro, partida por la variancia de la población”.
La expresión de f (x) expuesta al comienzo corresponde a la suma de cuadrados de n variables
aleatorias N (0; 1) independientes. Para X ∼ χ2n tenemos las siguientes caracterı́sticas:

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 23

Caracterı́stica Expresión
Esperanza Matemática E(χ2n ) = n
Momento Ordinario r-ésimo mr = 2r Γ(r + n/2)/Γ(n/2)
Variancia V ar(χ2n ) = 2n
Mediana M na = m − 2/3
Modo M do = pn − 2 si n ≥ 2
Coeficiente de Asimetrı́a As = 8/n
Coeficiente de Curtosis K = 12/n
Función Generatriz de Momentos ϕx (t) = (1 − 2t)−n/2 si 2t < 1
La distribución Chi-Cuadrado se relaciona con otras distribuciones de probabilidad además
de la distribución Normal. Mencionemos como ejemplos la distribución Gamma, la distribución
Uniforme y la distribución F de Snedecor, por el estadounidense George Snedecor (1881-1974),
conocida también como F de Fisher.
1
a) La función de densidad Gamma f (x) = β α Γ(α) xα−1 e−x/β con x > 0 α > 0 β > 0 la que para
α = n/2 y β = 2 con n entero positivo, se transforma en la distribución χ2n .
b) Si X se distribuye Uniforme (0;1) tenemos que −2 ln X ∼ χ22 . Además si P = X1 X2 . . . Xn
con Xi independientes, −2 ln P ∼ χ2n .
χ2n χ2m
c) El cociente de dos variables independientes n y m es una Fn;m . Si n → ∞ y m → ∞,
F → Normal.
Retomando la definición original del Chi-Cuadrado, en el caso en que Z ∼ N (0; 1) se tiene
que Z 2 ∼ χ21 y si X ∼ N (µ, σ 2 ) con X como estimador de µ , en una muestra de n valores
independientes, se tiene lo siguiente:
n 
X 2 n
Xi − X 1 X S 2 (n − 1)
= (Xi − X)2 = = χ20 ∼ χ2n−1
i=1
σ σ 2 i=1 σ2
1
Pn
siendo S 2 = n−1 2 2
i=1 (Xi − X) el estimador insesgado de la variancia σ . Los grados de libertad
son
Pn n-1 dado que en la expresión se ha estimado µ con X y las n variables cumplen la restricción
i=1 (X i − X) = 0.
La simulación de variables aleatorias es una muy útil herramienta análoga a un experimento
de muestreo recreado en el computador, que nos permite comprobar las propiedades de modelos
probabilı́sticos. Por esta vı́a obtendremos valores de χ20 , construiremos la distribución correspondiente
y comprobaremos sus propiedades . En una planilla de Excel generamos 1000 muestras de extensión
n=12 observaciones independientes provenientes de una población Normal con E(X) = 100 y
σ = 10 como se muestra en las columnas B a M de la Figura 3:

Figura 3

Universidad CAECE
24 Lic. Susana Pasciullo

En la columna N calculamos la variancia de cada una de las muestras y en la columna O la


2
cantidad S (n−1)
σ2 .
Al final de la planilla para los datos de la columna O calculamos el mı́nimo obtenido, el máximo,
la media, la variancia y la mediana. Dado que n=12 tendremos un χ211 y el resultado de la media
en la simulación es 10,94 siendo 11 el valor teórico dado que E(χ211 ) = 11.
La variancia teórica es 22 y en la simulación resultó 21,51 mientras que la mediana teórica
es 11,33 y la experimental fue 10,29. Se ve como la convergencia de la media muestral hacia la
poblacional es más rápida que la convergencia de cualquier otro estimador como por ejemplo la
variancia, para un número fijo de iteraciones.
S 2 (n−1)
Vemos en las Figuras 4 y 5 la distribución de frecuencias de los valores de σ2 y el
histograma.

Figura 4 Figura 5

La distribución Chi-Cuadrado pertenece al repertorio de curvas de Karl Pearson que cumplen


con la ecuación diferencial:

f ′ (x) x−a
= con a = n − 2 b0 = 0 b1 = −2 b2 = 0
f (x) b 0 + b 1 x + b2 x 2

como se puede fácilmente comprobar calculando la derivada primera de la función de densidad y


haciendo el cociente indicado.
Karl Pearson nacido en Londres, discı́pulo, admirador y continuador de Francis Galton (1822-1911)
fue el creador de la Biometrı́a. Dedicó su vida al desarrollo y vı́nculo entre la Estadı́stica Teórica
y la Estadı́stica Aplicada. Fundó junto a Galton y a Walter Weldon (1860-1906) la importante
publicación cientı́fica Biometrika, que editó desde Octubre de 1901 hasta su muerte. Esta publicación
tuvo como principal objetivo durante toda su existencia darle vida a la bioestadı́stica y su nombre
escrito con k y no con c obedece al griego antiguo. Las siguientes palabras escritas por Galton en
el primer número muestran el espı́ritu que mantuvo siempre la publicación:
“It is intended that Biometrika shall serve as a means not only of collecting or publishing under
one title biological data of a kind not systematically collected or published elsewhere in any other
periodical, but also of spreading a knowledge of such statistical theory as may be requisite for their
scientific treatment”.
Las Figuras 6 y 7 corresponden a esta prestigiosa y singular publicación cientı́fica en la que
aparecen las primeras aplicaciones de la distribución Chi-Cuadrado.

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 25

Figura 7
Figura 6

Los trabajos de Karl Pearson y Francis Galton y de otros cientı́ficos estadı́sticos de la época
fueron publicados en Biometrika. Algunos de ellos: George. U. Yule (1871-1951) distinguido por
sus reconocidos aportes en la teorı́a de correlación y regresión, William S. Gosset (1876-1937), más
conocido por su seudónimo Student, y muy popular por su tan difundida t de Student, William F.
Sheppard (1863-1936) al que muchos recordamos por su corrección para los errores de agrupamiento
en grandes cantidades de datos.
Los dibujos de Francis Galton y Karl Pearson se muestran en las Figuras 8 y 9 respectivamente.
El primero fue publicado en el N◦ 4 de Biometrika en Noviembre de 1903.

Figura 8 Figura 9

Las aplicaciones del χ2n son muchas, algunas pertenecen a modelos avanzados de la teorı́a
Estadı́stica, como el Chi-Cuadrado y la Normal multidimensional, o formas cuadráticas más
complejas de la que hemos presentado, y otras en cambio, tratan cuestiones más simples pertenecientes
a la Inferencia, en su mayorı́a presentadas casi siempre en los cursos elementales de Estadı́stica
básica, como por ejemplo:
1. Pruebas de hipótesis e intervalos de confianza para la variancia σ 2 .
2. Pruebas de bondad de ajuste.
3. Pruebas de independencia y homogeneidad en datos categóricos.
4. Coeficientes de contingencia.
5. Pruebas de homogeneidad de variancias.
6. Pruebas ANOVA no paramétricas.
7. Pruebas de normalidad.
8. Pruebas de multicolinealidad.

Universidad CAECE
26 Lic. Susana Pasciullo

Una propiedad importante de la distribución Chi-Cuadrado es la de ser “reproductiva”.


La misma establece que si sumamos k variables aleatorias independientes distribuidas con un
Chi-Cuadrado, obtenemos otro Chi-Cuadrado cuyos grados de libertad resultan ser la suma de
los grados de libertad de cada una de las variables. Veamos esta propiedad usando la función
generatriz de momentos. Sea Sk = X1 + X2 + . . . + Xk donde cada variable del segundo miembro
tiene una distribución χ2ni con i = 1, 2, . . . , k entonces como la función generatriz de la suma de
variables independientes es el producto de las funciones generatrices de cada una de las variable,
tendremos:

1
ϕSk (t) = ϕX1 (t) . . . ϕXk (t) = (1 − 2t)−n1 /2 . . . (1 − 2t)−nk /2 = (1 − 2t)− 2 (n1 +...+nk )

expresión que corresponde a la función generatriz de momento de χ2n1 +n2 +...+nk por lo que en
virtud del teorema de unicidad, concluimos que Sk tiene una distribución Chi-Cuadrado con n1 +
n2 + . . . + nk grados de libertad.
Probemos el resultado expuesto simulando variables aleatorias con distribución Chi-Cuadrado
en Excel para lo que usaremos las funciones inversas de la planilla de cálculo y el generador de
valores aleatorios con distribución uniforme en el intervalo 0;1: ALEATORIO() . Una presentación
detallada de estas funciones se podrá ver en: “Generación de variables aleatorias usando las
Funciones Inversas de Excel”, Lic. Susana Pasciullo, Elementos de Matemática Universidad
CAECE, marzo 2005. En una planilla de Excel generamos en las columnas B, C y D, 1000 muestras
de 3 valores independientes X, Y y Z cada uno de ellos con distribución Chi-Cuadrado con 1, 4 y
2 grados de libertad respectivamente para lo que usamos las funciones inversas mostradas en las
llamadas. El argumento de estas funciones son los grados de libertad y la probabilidad de superar el
valor de la variable, que se genera con la función ALEATORIO() . En la columna E sumamos estos
valores en cada muestra. Posteriormente, para los datos de la columna E calculamos el mı́nimo,
el máximo, el promedio, la variancia y la mediana. De acuerdo con lo expuesto W ∼ χ27 entonces
los resultados teóricos son: E(χ27 ) = 7, V ar(χ27 ) = 14, M na(χ27 ) = 6, 33. Los valores obtenidos en
la simulación para estos parámetros son respectivamente 7,34 15,55 y 6,66. Todos estos resultados
aparecen en la Figura 10.
La Figura 11 y la Figura 12 muestran la distribución de frecuencias obtenida y el correspondiente
histograma donde seppuede observar la asimetrı́a positiva de la distribución. El coeficiente de
asimetrı́a teórico es 8/7 = 1.069

Figura 10

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 27

Figura 11 Figura 12

Para ejemplificar una de las contribuciones de Pearson a la Estadı́stica, realizaremos una


prueba de bondad de ajuste a la distribución de la Figura 11. Si bien hemos construido la
distribución simulando variables Chi-Cuadrado, esta prueba podrá tomarse como una verificación
de los generadores aleatorios de Excel. En una prueba de bondad de ajuste se comparan las
frecuencias observadas Oi de un conjunto de valores de una variable con las frecuencias esperadas
Ei bajo el supuesto de una determinada distribución teórica. Una vez postuladas las hipótesis,
debemos recurrir a una estadı́stica de pruebas cuya evaluación determinará si la hipótesis formulada
se rechaza o no se rechaza, usando aquı́ un nivel de significación α = 1%. Planteamos entonces
para la distribución de la variable W: H0 ) La distribución es χ27 H1 ) La distribución no es χ27 .
Pk 2
La estadı́stica de pruebas es χ20 = i=1 (Oi −E
Ei
i)
∼ χ2k−p−1 donde k es la cantidad de intervalos
de la distribución que verifican la condición requerida Ei > 5 y p es la cantidad de parámetros
estimados en el proceso de la prueba que en este caso es cero. Construyamos la siguiente tabla:

Figura 14

Figura 13

Las probabilidades, columna O, fueron calculadas con la integral de la función χ27 en cada uno
de los intervalos de la distribución de frecuencias; a modo de ejemplo mostramos el primer cálculo:
Z 2
e−w/2 w2,5
dq == 0, 040164 con 3, 323 = Γ(7/2)
0 23,5 3, 323

Esta columna forzosamente debe cumplir con la condición de cierre para no perder observaciones
al calcular las Ei . A veces por problemas de truncamiento falta una pequeña cantidad que la
agregamos.
Las frecuencias esperadas se calcularon en la columna P multiplicando la probabilidad por el
total de datos N=1000 y en la columna Q se calcularon los valores como indica el cabezal y la
llamada, que al sumarlos obtenemos el valor de la estadı́stica de pruebas, en nuestro caso 20,501.
Notar que toda vez que Ei no superó 5 debimos fundir las clases, quedándonos con 11 de ellas.
Como no hemos estimado ningún parámetro, resulta k − p − 1 = 11 − 0 − 1 = 10 grados de
libertad. Entonces resumimos los resultados en el gráfico de la Figura 14 con χ210 = 23, 21 valor
del Chi-Cuadrado con 10 grados de libertad que deja a la derecha una probabilidad 0,01. Entonces
no rechazamos H0 , la distribución de W es χ27 .

Universidad CAECE
28 Lic. Susana Pasciullo

Otra relación entre las √


distribuciones
√ Chi-Cuadrado y Normal, debida a Fisher es la siguiente:
si X ∼ χ2n entonces Y = 2X ∼ N ( 2n − 1; 1). Recreamos esta propiedad en Excel con 2000
valores independientes de X con n=5:

Figura 15
También podemos obtener valores χ2n usando la función INV.GAMMA de Excel haciendo α =
1/2 y r = n/2.
Otra atrayente propiedad debida a Wilson y Hilferty es: siX ∼ χ2n entonces Y = (X/n)1/3 ∼
2 2
N (1 − 9n ; 9n ). Dejamos la verificación de esta propiedad en una planilla de cálculo para lectores
interesados.
Miembros de la comunidad cientı́fica argentina y española coincidieron en que el profesor
Carlos Eugenio Dieulefait es el continuador de Karl Pearson por sus valiosos aportes en la teorı́a
de Correlación y Regresión y en la Estadı́stica en general. En la Figura 16 se muestra una
correspondencia de Pearson a Dieulefait del año 1934:

Figura 17

Figura 16
Como resultado de esa correspondencia, Biometrika publicó “Contribution a l’Etude de la
Théorie de la Corrélation” par M. le Professeur Carlos E. Dieulefait, 01 december 1934 volume 26

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 29

Issue 4, pages 378-403. Hubo también posteriores publicaciones del autor en Biometrika. La Figura
17 muestra la foto exhibida en la página 373 del libro Algoritmo- Matemáticas II, de J.R. Vizmanos
y M. Anzola, Ediciones Madrid. Finalmente recordemos que cuando Pearson construyó la prueba
de bondad de ajuste usó la letra griega χ porque la estadı́stica de pruebas tenı́a una distribución
como las de su grupo de distribuciones asimétricas que oportunamente habı́a denominado “familia
chi”, pero elevadas al cuadrado. Esta relación explica el nombre tan particular de la distribución.

Universidad CAECE
30 Lic. Francisco Kordon

Sistemas hamiltonianos
Lic. Francisco Kordon

Resúmen. Los sistemas hamiltonianos definidos en variedades son sistemas dinámicos


que nacen para formalizar la descripción de problemas de la mecánica clásica. Integrar
un sistema hamiltoniano es, moralmente, conseguir ecuaciones no diferenciales para
sus trayectorias. En este artı́culo hacemos una introducción a estos temas y en la
última sección damos condiciones suficientes para integrar sistemas hamiltonianos y
dar descripciones geométricas cualitativas de su dinámica.

Agradecimientos

Este trabajo está basado en mi tesis de licenciatura, realizada durante el segundo semestre de
2013 bajo la dirección de Sergio Grillo y con la colaboración de Javier Fernandez, ambos del
Instituto Balseiro - Centro Atómico Bariloche. Les agradezco entonces a ellos por su excelente
trabajo y aprovecho para agradecer también a César Massri y a Federico Quallbrunn por darme
la oportunidad de publicar aquı́.

1. Motivaciones desde la mecánica

Intentaremos motivar, de manera resumida y omitiendo algunos detalles, el uso de sistemas hamiltonianos
en la mecánica clásica. Esto se hará sólo como motivación; para una explicación más apropiada
del tema se recomienda recurrir, por ejemplo, a [4], [2] o [1], o incluso a [3] como referencia clásica
en la fı́sica.
Consideremos un sistema de N partı́culas. La posición de cada partı́cula puede pensarse
como un elemento de R3 , ası́ que la posición del sistema se asocia a un punto de R3N . Las
trayectorias de este sistema satisfarán las ecuaciones de Newton, esto es, la aceleración de cada
partı́cula multiplicada por su masa coincidirá con la suma de las fuerzas que actúan sobre ella. Las
fuerzas en cuestión pueden ser de todo tipo; pueden depender de las posiciones, de las velocidades.
Supondremos aquı́ que no son sino conservativas o de vı́nculo. Por fuerza conservativa entenderemos
aquélla que es derivada de un potencial que sólo depende de la posición, esto es, que se escribe

F = −∇V.

Aquı́, como estamos en R3N , no nos preocupamos por la definición de gradiente o si conviene o no
pensar las fuerzas como vectores o covectores.
Diremos que el sistema está sujeto a un vı́nculo —trataremos aquı́ sólo a los holónomos— si
las trayectorias de las partı́culas deben vivir en la preimagen de 0 por una aplicación diferenciable
v : R3N −→ R. En caso de tener varios vı́nculos v1 , . . . , vk , (que suponemos independientes;
sus
Tn diferenciales en cada punto son linealmente independientes), el sistema se moverá en Q =
−1
i=1 vi (0). Decimos que Q es el espacio de configuraciones del sistema; bajo ciertas hipótesis de
regularidad, es una subvariedad de R3N . En este caso, 3N − k es el número de grados de libertad
del sistema.
A los sistemas de partı́culas con vı́nculos se les puede asociar una aplicación de T Q a valo res
reales llamada lagrangiano. La energı́a cinética del sistema T : T Q −→ R se puede escribir como

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 31

T (v) = 12 g(v, v), donde g es una métrica riemanniana en T Q. Si V : Q −→ R es el potencial


mecánico del sistema, el lagrangiano se define por, para v ∈ Tq Q,
L(v) = T (v) − V ◦ p(v) = 12 g(v, v) − V (q). (1.1)
Aún en presencia de vı́nculos, utilizando el principio de D’Alembert, puede deducirse que las
trayectorias del sistema son aquellas que cumplen las ecuaciones de Euler-Lagrange: en cada carta
(q 1 , . . . , q n , q̇ 1 , . . . , q̇ n ) inducida en T Q por una carta (q 1 , . . . , q n ) en Q se satisfará que
d ∂L  ∂L
− i = 0, (1.2)
dt ∂ q̇ i ∂q
para cada 1 ≤ i ≤ n, donde L : T Q −→ R es el definido en (1.1).
Definición 1. Llamaremos sistema langrangiano a un par (Q, L) donde Q es una variedad y
L : T Q −→ R una aplicación diferenciable. Las trayectorias del sistema son las curvas t 7→ γ(t) ∈ Q
tales que en cada carta (U, (q 1 , . . . , q n )) se satisfacen las ecuaciones (1.2), las de Euler–Lagrange.
No vamos a estudiar la formulación lagrangiana de la mecánica sino la hamiltoniana y, para
esto, hay que pasar por la transformada de Legendre. Si (Q, L) es un sistema lagrangiano, la
transformada de Legendre consiste en una aplicación FL : T Q −→ T ∗ Q definida por
d
hFL(v), wi = L(v + tw),
dt t=0
donde v, w ∈ Tq Q. A esta aplicación también se la denomina derivada a lo largo de la fibra de L.
La expresión local es
d ∂L
hFL(q, q˙1 ), (q, q˙2 )i = (q, L(q, q˙1 + tq˙2 )) = (q, (q, q˙1 ) · q˙2 ).
dt t=0 ∂ q̇
Definición 2. El lagrangiano L se dice hiperregular si FL es un difeomorfismo.
Si L es hiperregular, podemos definir la función hamiltoniana. Primero, definimos la energia
E : T Q −→ R por, para v ∈ T Q,
E(v) := hFL(v), vi − L(v);
ahora, el hamiltoniano correspondiente al lagrangiano L se define por
H := E ◦ (FL)−1
y en coordenadas locales, si (q, p) = FL(q, q̇), es
H(q, p) = p · q̇(q, p) − L(q, q̇(q, p))
En el caso en que L es un lagrangiano mecánico —es decir, uno como el de la ecuación (1.1)—,
la transformada de Legendre se ve como
FL(v) = g(v, −).

La aplicación g : T Q ∋ v 7→ g(v, −) ∈ T ∗ Q es inversible por la no degeneración de la métrica;
notemos su inversa por g ♯ . Ası́, (FL)−1 = g ♯ y el hamiltoniano es, para σ ∈ Tq∗ Q,

H(σ) = 21 g g ♯ (σ), g ♯ (σ) + V (q).
La siguiente proposición, que no demostraremos, dice cómo se ven las ecuaciones de movimiento
sobre T ∗ Q.
Proposición 3. Sean L un lagrangiano hiperregular y H la función hamiltoniana que recién
definimos. Entonces t 7→ γ(t) es una trayectoria en Q del sistema lagrangiano si y sólo si se
satisfacen localmente en T ∗ Q las ecuaciones
dq i ∂H dpi ∂H
(t) = (q(t), p(t)), (t) = − i (q(t), p(t)). (1.3)
dt ∂pi dt ∂q
para 1 ≤ i ≤ n.

Universidad CAECE
32 Lic. Francisco Kordon

Las (1.3) se conocen como las ecuaciones canónicas de Hamilton, y a H se la llama función
hamiltoniana del sistema. Observemos que las trayectorias del sistema en T ∗ Q son soluciones de
ecuaciones de primer orden, ası́ que pueden entenderse como curvas integrales de un cierto campo
vectorial.
La moraleja que se quiere dejar es, precisamente, que el problema de encontrar las trayectorias
de un sistema mecánico de partı́culas se puede traducir a otro, que consiste en encontrar las curvas
integrales de un campo definido en el fibrado cotangente al espacio de configuraciones.

Ejemplo 4. Consideremos una partı́cula de masa m moviéndose en R3 sujeta a una fuerza


conservativa con potencial V , definida en algún abierto de R3 ; para fijar ideas, digamos que ese
abierto es todo R3 . Según la segunda ley de Newton, si q = (q 1 , q 2 , q 3 ) denota un punto genérico
de R3 y t 7→ q(t) la trayectoria de la partı́cula, ésta cumplirá las ecuaciones diferenciales, para cada
i,
d2 q i ∂V
m 2 (t) = − i (q(t)). (1.4)
dt ∂q
Este es un sistema de ecuaciones diferenciales de segundo orden, es decir, aparece una derivada
segunda. Para hacer de él un sistema de primer orden podemos considerar una nueva ¡¡variable¿¿:
ponemos, para cada i, pi = mq̇ i ; se suele llamar momentos a estas nuevas variables. Las ecuaciones
de Newton se dejan reescribir entonces como

dq i ∂H dpi ∂H
(t) = (q(t), p(t)), (t) = − i (q(t), p(t)), (1.5)
dt ∂pi dt ∂q
con
p2
H(q, p) = + V (q). (1.6)
2m
Dado que las ecuaciones que tenemos que resolver son de primer orden, podemos entenderlas como
las ecuaciones para las curvas integrales de cierto campo vectorial. Efectivamente, si notamos

XH : R6 −→ R6
 ∂H ∂H ∂H ∂H ∂H ∂H 
(q 1 , q 2 , q 3 , p1 , p2 , p3 ) 7→ , , , − 1 , − 2 , − 3 (q, p)
∂p1 ∂p2 ∂p3 ∂q ∂q ∂q
p p p ∂V ∂V ∂V 
1 2 3
= , , ,− , − 2 , − 3 (q, p),
m m m ∂q 1 ∂q ∂q

tendremos que t 7→ (q(t), p(t)) es una curva integral de XH si y sólo si se cumplen las ecuaciones
(1.3). Esto equivale también a que las q(t) satisfagan las ecuaciones (1.4), que son las que tenı́amos
originalmente. El campo vectorial XH es un campo hamiltoniano.

2. Variedades simplécticas

Hablamos en la sección anterior de que podemos pensar al espacio de configuraciones de un


sistema mecánico como una variedad; su fibrado cotangente es el lugar natural para desarrollar
la mecánica hamiltoniana. Vamos a ver que este fibrado tiene una estructura, también natural,
de variedad simpléctica y con esto en mente nos será razonable considerar sistemas hamiltonianos
definidos directamente en variedades simplécticas. Repasamos primero un resultado sobre álgebras
simplécticas cuya prueba puede verse en [1, II.3.1].

Proposición 5. Si V es un R–espacio vectorial y a : V ×V −→ R es un forma bilineal antisimétrica


de rango r, entonces r es par. Además, poniendo r = 2n se tiene que existe una base ordenada
(vi ) de V en la que la matriz de a es
 
0 −I 0
I 0 0 .
0 0 0
Pn
En otras palabras, si (ψi ) es la base dual a la anterior, es a = i=1 ψi+n ∧ ψi .

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 33

También, si a : V × V −→ R es un forma bilineal, tenemos definido su núcleo ker a = {v ∈


V | a(v, w) = 0 ∀w ∈ V }. Decimos que a es no degenerada si ker a = 0, es decir, si cada vez que
a(v, w) = 0 para todo w ∈ V debe ser v = 0.
Sean M una variedad y ω una sección diferenciable de
a
Bil(Tx M, R) −→ M,
x∈M

donde, si V es un R–espacio vectorial, Bil(V, R) denota las formas bilineales de V en R. Diremos


que ω es no degenerada si para cada x ∈ M , ωx , que es una forma bilineal definida en Tx M , es
no degenerada. En tal caso, podemos construir un difeomorfismo entre las secciones diferenciables
del fibrado tangente y las del cotangente de M como sigue.

Definición 6. Si M y ω son los de recién, definimos ω ♭ : X(M ) −→ Ω1 (M ) por

X 7→ X ♭ = −ιX ω = ω(−, X).

Cuando ω es no degenerada, la aplicación que acabamos de definir es inversible y notamos su


inversa por ω ♯ : α 7→ α♯ .

Si M admite una 2–forma no degenerada ω, por la proposición 5 obtenemos que dim M es par,
digamos dim M = 2n. A partir de ω podemos construir una 2n–forma, poniendo ν = ω n . Ésta
resulta una forma de volumen en M : si x ∈ M , por la misma proposición podemos considerar (ψi )
Pn n
una base dual a Tx M tal que ωx = i=1 ψi+n ∧ ψi y en consecuencia ν = n!(−1) 2 ψ1 ∧ . . . ∧ ψ2n .
Hemos probado, pues, lo siguiente.

Proposición 7. Si una variedad M admite una 2–forma no degenerada, es de dimensión par. En


tal caso, M es orientable y si ω es una tal forma y dim M = 2n, ω n es una forma de volumen.

El siguiente teorema, que data de 1882, establece que si M admite una 2–forma no degenerada
que además es cerrada, se le puede conocer una expresión local. La prueba es la que aparece en
[1], y es atribuida a Moser y Weinstein.

Teorema 8 (Darboux). Sea ω una 2–forma no degenerada en M , una variedad de dimensión


2n. Entonces dω = 0 si y sólo si para cada x ∈ M existe una carta (U, ϕ) tal que ϕ(x) = 0 y si
ϕ(x) = (x1 (x), . . . , xn (x), y1 (x), . . . , yn (x)), es
n
X

ω U = dyi ∧ dxi . (2.7)
i=1

Demostración. Si ω se escribe localmente como en (2.7), es evidentemente cerrada. Recı́procamente,


supongamos que es cerrada y busquemos una carta en la que tiene esa expresión. Para esto,
podemos suponer que M = R2n ; fijemos x = 0. Sea ω1 una forma constantemente igual a ω(0)
y pongamos ω̃ = ω1 − ω y, para cada 0 ≤ t ≤ 1, ωt = ω + tω̃. Para cada t, ωt (0) = ω(0) es no
degenerada, y entonces existe un entorno de 0 —digamos una bola— en que ωt es no degenerada
para todo t. Por el lema de Poincaré, ω = dα allı́; podemos suponer que α(0) = 0. Sea Xt = ω ♯ (α).
Tenemos localmente definido el flujo de Xt , llamémoslo gt , con g0 = Id. Entonces

d ∗ d
(g ωt ) = gt∗ (LXt ωt ) + gt∗ ωt = gt∗ dιXt ω − gt∗ ω̃ =
dt t dt
= gt∗ (−dα − ω̃) = 0.

Por lo tanto g1∗ ω1 = g0∗ ω0 = ω, ası́ que g1 da el cambio de coordenadas que trasforma ω en la forma
constante ω1 .

Las cartas del teorema de Darboux serán llamadas cartas simplécticas, las funciones xi , yi
coordenadas canónicas. Estamos en condiciones de hablar de variedades simplécticas.

Definición 9. Una forma simpléctica en una variedad M es una 2–forma cerrada no degenerada
ω. Una variedad simpléctica (M, ω) es una variedad M junto con una forma simpléctica ω.

Universidad CAECE
34 Lic. Francisco Kordon

Ejemplo 10. En R2n = {(q 1 , . . . , q n , p1 , . . . , pn )} puede ponerse una estructura simpléctica ω. La


definimos dando su matriz en la base ¡¡canónica¿¿ [ω]:
 
0 −In
[ω] = ,
In 0
1 n
donde In denota la matriz identidadPnde tamaño n × n. Si (dq , . . . , dq , dp1 , . . . , dpn ) es la base
dual a la canónica, se escribe ω = i=1 dpi ∧ dq i .
n/2
Sea (M, ω) una variedad simpléctica. Si ponemos νω = (−1) n! ω n , razonando como antes de la
Proposición 7, ésta resulta una forma de volumen y, en virtud del teorema de Darboux, se tiene
que en cartas simplécticas es

νω = dx1 ∧ . . . ∧ xn ∧ dy1 ∧ . . . ∧ dyn . (2.8)

Definición 11. Sean (M, ω) y (N, ρ) variedades simplécticas. Una aplicación diferenciable f :
M −→ N es simpléctica o transformación canónica si f ∗ ρ = ω.
Observemos que si f : (M 2n , ω) −→ (N 2n , ρ) es simpléctica, como los elementos de volumen νω
y νρ se obtienen a partir de las formas simplécticas, se tendrá que f conserva la forma de volumen.
También, para cada x en M se pueden tomar coordenadas simplécticas y lo propio puede hacerse
en f (x). En estas coordenadas, f es la identidad, y en particular f es un difeomorfismo local.
En mecánica, tı́picamente el planteo del problema sucede en el fibrado cotangente del espacio
de configuraciones Q. Allı́ puede ponerse una 2–forma diferencial no degenerada y exacta, y de
esta manera hacer de T ∗ Q una variedad simpléctica. Para una demostración del siguiente teorema,
se sugiere recurrir a [1].
Teorema 12. Sea Q una variedad, escribamos M = T ∗ Q y llamemos π : M −→ Q a la proyección.
Si α ∈ M , definimos

θα : Tα M −→ R
w 7→ hα, dπα (w)i.

Entonces θ : α 7→ θα es una 1–forma en M y su diferencial es una forma simpléctica en M , con


lo que (M, dθ) resulta una variedad simpléctica.
Puede recuperarse del Teorema 12 que los fibrados cotangentes son orientables. Como ω es no
degenerada, la aplicación definida en la Definición 6 induce un difeomorfismo entre T Q y T ∗ Q, y
de esta manera también recuperamos que los fibrados tangentes son orientables.
Llamemos ω = dθ. Si notamos (q 1 , . . . , q n ) a las coordenadas en Q y (q 1 , . . . , q n , p1 , . . . , pn ) las
de M , obtenemos las siguientes expresiones locales:
n
X
θ= pi dq i , (2.9)
i=1
Xn
ω= dpi ∧ dq i . (2.10)
i=1

La 1–forma canónica tiene una propiedad que la caracteriza: para todas las 1-formas β de Q
vale que β ∗ θ = β. En efecto, si β ∈ Ω1 (Q) y v ∈ Tq Q,

hβ ∗ θ(q), vi = hθ(β(q)), dβq (v)i = hβ(q), dπβ(q) dβq (v)i


= hβ(q), d(π ◦ β)q (v)i = hβ(q), vi,

en virtud de la regla de la cadena y de que π ◦ β = 1Q .

3. Sistemas hamiltonianos

Una familia bastante amplia de sistemas dinámicos es la de los que se describen mediante una
variedad y un campo vectorial en ella; las trayectorias del sistema son las curvas integrales de este

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 35

campo. En muchos casos, este campo es un campo gradiente: si f es una función a valores reales
definida en la variedad y g es una métrica riemanniana, el campo vectorial que define el sistema
dinámico es el único X tal que g(X, −) = df .
Algo muy similar puede hacerse cuando, en vez de considerar una variedad riemanniana, se
considera una variedad simpléctica. El campo hamiltoniano asociado a una función f será aquél
que al contraer a la forma simpléctica coincide con (menos) la diferencial de f . La antisimetrı́a
de la forma simpléctica llevará a propiedades conservativas de los campos hamiltonianos: esto no
sucede tı́picamente con los campos gradientes, donde la simetrı́a de la métrica induce más bien
propiedades disipativas.

Definición 13. Sean (M, ω) una variedad simpléctica y H : M −→ R una función diferenciable.
Definimos el campo vectorial hamiltoniano asociado a H, XH , como el único campo vectorial que
cumple
ω(Y, XH ) = hdH, Y i (3.11)
para todo Y ∈ X(M ), o, equivalentemente, −ιXH ω = dH. La existencia de este campo está
garantizada por la no degeneración de ω.
Llamamos a la terna (M, ω, H) sistema hamiltoniano; las trayectorias del sistema son las curvas
integrales de XH .

Observemos que XH = ω ♯ (dH); esta concisa escritura de el campo hamiltoniano nos será útil
en varios cálculos en lo sucesivo.

Ejemplo 14. Sea (M, ω, H) un sistema hamiltoniano. Sean (q 1 , . . . , q n , p1 , . . . , pn ) coordenadas


canónicas para ω. Encontremos una expresión local de XH en estas coordenadas. Pongamos,
omitiendo el sı́mbolo de sumatoria, XH = ai ∂q∂ i + bi ∂p ∂
i
. Como ω = dpi ∧ dq i , es −ιXH ω =
i i ∂H i ∂H i ∂H
a dpi − bi dq . Ahora, como queremos que esto sea igual a dH = ∂q i dq + ∂p dpi , debe ser a = ∂p
i i
∂H
y también bi = − ∂qi . Por lo tanto, en estas coordenadas, se escribe

Xn
∂H ∂ ∂H ∂
XH = i
− i . (3.12)
i=1
∂pi ∂q ∂q ∂pi

En particular, (q 1 (t), . . . , q n (t), p1 (t), . . . , pn (t)) es una trayectoria del sistema si y solo si, para
todo 1 ≤ i ≤ n, es

dq i ∂H dpi ∂H
(t) = (q(t), p(t)), (t) = − i (q(t), p(t)).
dt ∂pi dt ∂q

Las ecuaciones de recién son las llamadas ecuaciones de Hamilton o ecuaciones canónicas: son
las mismas que (1.3). Si pensamos que H es el hamiltoniano (sin dependencia explı́cita en el
tiempo) de un sistema mecánico en el sentido clásico, recuperamos la formulación hamiltoniana
maś conocida de los problemas de mecánica, como aparecen por ejemplo en el libro de Goldstein
[3] o en el de Landau, o en el apunte [7].

Proposición 15. Si (M, ω, H) es un sistema hamiltoniano, y t 7→ c(t) es una curva integral de


XH , entonces H es constante a lo largo de c.

Demostración. Para ver que H(c(t)) es constante en t, veremos que su derivada se anula:

d
H(c(t)) = dHc(t) ċ(t) = hdHc(t) , XH (c(t))i
dt t=0
= −ω(XH (c(t)), XH (c(t))) = 0,

en virtud de la antisimetrı́a de ω.

Observemos, continuando el paralelismo entre campos hamiltonianos y gradientes introducido


al principio de esta sección, que la reciente proposición no es cierta en caso de tener campos
gradientes: de hecho, las curvas integrales del gradiente son, en cada punto, las direcciones de
máximo crecimiento de la función.

Universidad CAECE
36 Lic. Francisco Kordon

Ejemplo 16. La proposición anterior también puede probarse usando las expresiones locales
encontradas en el Ejemplo 14:
d ∂H ∂h ∂H ∂H 
H(c(t)) = hdHc(t) , ċ(t)i = + − i = 0,
dt t=0 ∂q i ∂pi ∂pi ∂q

con (q 1 , . . . , q n , p1 , . . . , pn ) coordenadas canónicas.


Otro hecho para destacar es que los flujos de los campos hamiltonianos son transformaciones
canónicas, y en particular preservan el volumen. En el caso en que nuestra variedad simpléctica
viene de la mecánica clásica, recuperamos el llamado Teorema de Liouville que aparece en textos
clásicos como [7] o [3].
Proposición 17. Sean (M, ω, H) un sistema hamiltoniano y φt el flujo del campo. Entonces, para
cada t, φ∗t ω = ω.
Demostración. Veremos que φ∗t ω es constante en t. En efecto, usando la conocida relación entre
flujos y derivadas de Lie, obtenemos que
d
φ∗ ω = φ∗t LXH ω = φ∗t (ιXH dω + dιXH ω)
dt t=0 t
= φ∗t (0 − ddH) = 0,

puesto que ω es cerrada. Ahora, como φ0 = 1M , resulta que φ∗t ω = φ∗0 ω = ω cualquiera sea t.
En general, no todos los campos vectoriales son campos hamiltonianos; es decir, no es cierto
que para todo X ∈ X(M ) exista una función f ∈ C ∞ (M ) tal que X = Xf . Ciertamente, se
requiere es que ω(−, X) sea exacta para todo X ∈ X(M ) y esto no es para nada cierto en general,
ni siquiera localmente. En virtud de la igualdad LX ω = dιX M (ω es cerrada) y del Lema de
Poincaré, que un campo X sea localmente hamiltoniano es equivalente a que la derivada de Lie de
la forma simpléctica respecto de X se anule.
Por supuesto, un campo hamiltoniano es localmente hamiltoniano, ası́ que una condición
necesaria para que un campo X sea hamiltoniano es que LX ω = 0. Ahora, para que efectivamente
lo sea se necesita que además ιX ω sea exacta. En particular, si el primer grupo de cohomologı́a de
De Rham de M es nulo, los campos hamiltonianos son exactamente los localmente hamiltonianos.
Ejemplo 18. Si en el toro T 2 identificamos las coordenadas angulares x, y; ω = dy ∧ dx es una
forma simpléctica. Si a, b ∈ R, consideramos el campo vectorial definido por X(x, y) = (a, b). Es
ιX ω = ady − bdx, que es evidentemente cerrada, y por lo tanto X es localmente hamiltoniano. Sin
embargo, X no es hamiltoniano globalmente: si X = XH , de la compacidad de T 2 se sigue que H
tiene, por ejemplo, un máximo local y allı́ se anula su diferencial, mientras que ιX ω nunca es cero.
Si (M, ω) es una variedad simpléctica, puede definirse en ella lo que llamaremos corchetes de
Poisson. Éstos ya aparecı́an en los textos clásicos de mecánica y resultaban de gran utilidad; el
concepto se ha generalizado bastante desde entonces.
Definición 19. Sea (M, ω) una variedad simpléctica. Si f, g ∈ C ∞ (M ), el corchete de Poisson
entre f y g es, por definición, el elemento de C ∞ (M ) dado por

{f, g} = ω(Xf , Xg ). (3.13)

Notemos que esto es igual a −ιXf ιXg ω y también a Xf (g).


Observemos que de la antisimetrı́a de ω sigue que {f, g} = −{g, f } cualesquiera sean f, g ∈
C ∞ (M ). La siguiente propiedad ilustra la utilidad de los corchetes de Poisson en la consideración
de constantes de movimiento, esto es, en las funciones a valores reales que son constantes en las
trayectorias del sistema.
Proposición 20. Sea (M, ω) una variedad simpléctica y f, g ∈ C ∞ (M ).
(i) Es {f, g} = LXf g = −LXg f .
(ii) Si h ∈ C ∞ (M ), la aplicación g 7→ {h, g} es una derivación en C ∞ (M ).

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 37

(iii) Como consecuencia de lo anterior, f es constante en las curvas integrales de Xg si y sólo si


{f, g} = 0.
Demostración. Para el primer inciso, observemos que LXf g = ιXf dg = −ιXf ιXg ω, esto último es
el corchete entre f y g. El segundo es consecuencia directa del primero.
Para el último, sea φt el flujo del campo Xf . Se tiene
d
(g ◦ φt ) = φ∗t LXf g = φ∗t {f, g}.
dt t=0
El lado derecho se anula sólo cuando {f, g}, y el lado izquierdo se anula si y solo si g ◦ φt es
constante en t, i.e., si g es constante en las trayectorias de Xf .
Debido a la antisimetrı́a del corchete de Poisson, se tiene que f es constante en las curvas
integrales de Xg si y sólo si g lo es en las de Xf . Se deduce, también de la antisimetrı́a, que en un
sistema hamiltoniano el hamiltoniano es constante en las trayectorias del sistema.
Ejemplo 21. Si f, g ∈ C ∞ (M ), escribamos la expresión de su corchete de Poisson en coordenadas
canónicas (q 1 , . . . , q n , p1 , . . . , pn ). Era {f, g} = Xf (g) y usando la expresión (3.12) obtenemos

Xn
∂f ∂g ∂f ∂g
{f, g} = i
− i ,
i=1
∂pi ∂q ∂q ∂pi

lo que coincide con la expresión usual del corchete de Poisson que aparece en los textos clásicos de
mecánica —a menos, depende de las convenciones, de un signo—.
El corchete de Poisson puede utilizarse también para escribir las ecuaciones de movimiento
sin mencionar explı́citamente a la forma simpléctica. En algún punto, esto es una motivacion
para considerar sistemas dinámicos cuyas ecuaciones de movimiento estén dadas por expresiones
como las que siguen, pero que el corchete de Poisson no provenga de una forma simpléctica.
Más aún, existe la noción de álgebra de Poisson, que consiste de un álgebra asociativa sobre un
anillo conmutativo equipada con una estructura de Lie que es una derivación en cada coordenada:
C ∞ (M ) es un álgebra de Poisson sobre R.
Proposición 22. Sean (M, ω, H) un sistema hamiltoniano, y φt el flujo del campo XH . Entonces,
si f ∈ C ∞ (M ), es
d
(f ◦ φt ) = {H, f ◦ φt }. (3.14)
dt
Demostración. Es, en virtud de la relación entre el flujo de un campo y la derivada de Lie respecto
de él,
d d
(f ◦ φt ) = φ∗t f = φ∗t LXH f =
dt dt
= LXH (f ◦ φt ) = {H, f ◦ φt },

como querı́amos probar.


Para terminar la sección, observemos que el corchete que definimos satisface la llamada identidad
de Jacobi : es, si f, g, h ∈ C ∞ (M ),

{{f, g}, h} + {{h, f }, g} + {{g, h}, f } = 0.

Puede encontrarse en [5], [2] o [1] una prueba de esta afirmación. Como consecuencia, se tiene que
C ∞ (M ) junto con el corchete es un álgebra de Poisson.

4. Integrabilidad Liouville

Daremos en lo siguiente una definición de integrabilidad de sistemas hamiltonianos. Es cierto que


cuanto más constantes de movimiento moralmente independientes tenga un sistema hamiltoniano,
más condicionada estará su dinámica y ciertamente será más accesible encontrar sus trayectorias.
El teorema clave de esta sección, el de Liouville-Arnold, da condiciones suficientes para encontrar

Universidad CAECE
38 Lic. Francisco Kordon

las trayectorias del sistema a menos de cuadraturas; un sistema hamiltoniano que esté en las
hipótesis del teorema se dirá integrable Liouville. Según comenta Arnold, ¡¡el teorema cubre todos
los problemas de dinámica que han sido integrados hasta el presente dı́a¿¿ [2, pág 273]. Por supuesto
no daremos una demostración de esta altisonante afirmación; sı́ algunos ejemplos donde se aplica
el teorema, ni bien lo hayamos formulado.
Sean (M, ω) una 2n–variedad simpléctica, H : M −→ R suave y XH su campo hamiltoniano
asociado; notemos al sistema hamiltoniano ası́ determinado (M 2n , ω, H).

Definición 23 (Integrabilidad Liouville). El sistema hamiltoniano es integrable Liouville si existen


funciones f1 , ..., fn ∈ C ∞ (M ) tales que

1. f1 , ..., fn son integrales de XH , es decir, son constantes a lo largo de sus curvas integrales;

2. f1 , ..., fn son independientes:{dfi (x)}ni=1 es linealmente independiente para todo x en M ;

3. {fi , fj } = 0 para cualesquiera i, j; y, por último,

4. Los campos Xi := ω ♯ (dfi ) ∈ X(M ) son completos: sus curvas integrales tienen dominio R.

La descomposición de M 2n en componentes conexas de las superficies de nivel de f = (f1 , ..., fn )


se llama la foliación de Liouville correspondiente al sistema integrable XH , y a la postre resulta
no depender de f . En efecto, esto sigue de que cada una de estas componentes conexas puede
obtenerse como la clausura de la unión de las imágenes de las trayectorias que allı́ empiezan. El
teorema de Liouville describe la estructura de la foliación de Liouville cerca de hojas regulares, que
son la preimagen de valores regulares. Vale aclarar o recordar que c ∈ Rn es un valor regular de f
si {dfi (x)}ni=1 es linealmente independiente para cada x ∈ Mc = f −1 (c).

Teorema 24 (Liouville-Arnold). Fijemos (M 2n , ω, H) un sistema hamiltoniano integrable Liouville


y sea Mc una hoja de f = (f1 , ..., fn ). Entonces

1. Mc es una variedad de dimensión n, Lagrangiana (ω = 0 allı́) e invariante respecto a Xi


para todo i;

2. y si Mc es conexo y compacto, entonces es difeomorfo a T n , el llamado toro de Liouville.

3. La foliación de Liouville es trivial en un entorno del toro de Liouville: existe un entorno U


de Mc que es difeomorfo a T n × Dn por un difeomorfismo que preserva las hojas, y más aún:

4. en U = T n ×Dn hay un sistema de coordenadas, las variables ángulo-acción s1 , ..., sn , ϕ1 , ..., ϕn ,


donde las primeras son coordenadas en el disco y las últimas en el toro, tales que

P
(a) ω = dϕi ∧ dsi ,

(b) las variables de acción dependen exlusivamente de f , y

(c) el flujo de XH en las coordenadas ángulo-acción se endereza: las derivadas de si y de


ϕi son nulas y constantes, respectivamente.

Ejemplo 25. Consideremos el caso de una partı́cula que se puede mover en una sola dirección
sujeta a la acción de un potencial V = V (x), que depende sólo de la distancia a un punto fijo. El
espacio de configuraciones es de dimensión 1, el fibrado cotangente de dimensión 2, y se tiene una
constante de movimiento, la energı́a. Supongamos que V tiene la pinta de la Figura 1. A energı́a
constante, el movimiento será oscilatorio: las hojas Mc son difemorfas al toro de dimensión 1.

Universidad CAECE
ELEMENTOS DE MATEMÁTICA - Vol. XXIV Nro. 83, Marzo de 2018 39

Figura 1: Primer potencial

Consideremos ahora el caso de la Figura 2. Aquı́, si la energı́a tiene valores no negativos, ME1
será difeomorfo a R y si no, ME2 lo será al toro de dimensión 1.

Figura 2: Segundo potencial

Figura 3: Tercer potencial

Por último, miremos el potencial de la Figura 3. Las hojas aquı́ no son todas conexas, y,
dependiendo de cuál es el valor de la energı́a, algunas componentes conexas son difeomorfas al toro
y otras a R.

Ejemplo 26. Si en un sistema hamiltoniano (M 2n , ω, h) con n = 2 —que en el caso mecánico


corresponde a un sistema con espacio de configuraciones de dimensión 2, i.e., de dos grados
de libertad— se tiene una constante de movimiento independiente del hamiltoniano, entonces

Universidad CAECE
40 Lic. Francisco Kordon

el sistema es integrable por cuadraturas. Por ejemplo, los problemas de fuerzas centrales, que
consisten en dos partı́culas interactuando entre sı́ con fuerzas en la dirección que las une, la posición
del sistema se describe dando la posición del centro de masa y el vector que une a las dos partı́culas;
se conservan el momento angular y la energı́a: son entonces integrables. Famosos son los casos en
que la fuerza es de gravedad o elástica. La coordenada angular se moverá en un toro de dimensión
1 y, de hecho, puede verse que pasando al potencial efectivo, la coordenada radial puede estudiarse
mirando gráficos de potencial como en el ejemplo anterior.
Ejemplo 27. El conocido trompo de Lagrange es un trompo simétrico fijado en O, y sujeto a la
acción de la fuerza de gravedad mg, como muestra la Figura 4.

Figura 4: El trompo de Lagrange

Se tienen tres constantes de movimiento: primero, el hamiltoniano, que es la energı́a; segundo y


tercero, las proyecciones del momento angular en los ejes z y e3 , que llamaremos Mz y M3 —esto se
debe a la simetrı́a de rotación del trompo alrededor de cada eje, como puede verse con el Teorema de
Noether, pero también puede verificarse haciendo la cuenta a mano—. Puede verificarse que estas
constantes de movimiento están en involución. Más aún, las superficies de nivel del hamiltoniano
H son compactas. Se tiene entonces, por el Teorema 24, que para todas las condiciones iniciales
que no degeneran (h, Mz , M3 ) —que son, según Arnold, ¡¡la mayorı́a¿¿— el movimiento del trompo
es periódico en las tres coordenadas angulares: las trayectorias en el espacio de fases suceden en
el toro tridimensional dado por (H, Mz , M3 ) = cte; las correspondientes tres frecuencias se llaman
frecuencias de revolución, precesión y nutación.

Referencias

[1] ] R. Abraham y J .Marsden, Foundations of Mechanics, Addison–Wesley, 1978.

[2] V. I. Arnold, Mathematical methods of classical mechanics, Springer, 1989.


[3] H. Goldstein, Classical mechanics, Addison–Wesley, 1980.

[4] S. Grillo, Introducción a la Mecánica Lagrangiana y Hamiltoniana, III Encuentro de


Geometrı́a Diferencial, La Falda, Agosto 06–11, 2007.

[5] P. Libermann y C.M. Marle, Symplectic geometry and analytical mechanics, Springer, 1987.
[6] J. E. Marsden and A. Weinstein, Reduction of symplectic manifolds with symmetry,
Reports on Mathematical Physics 5 (1974), 121–130.
[7] F. O. Minotti, Apuntes de Mecánica Clásica, disponible en
http://www.lfp.uba.ar/minotti/mecanica/cursomec.pdf.

Universidad CAECE
.

www.ucaece.edu.ar
matematica@caece.edu.ar