Está en la página 1de 46

Los Números p-ádicos y el Teorema de

Hasse-Minkowski
Ramiro Lafuente

Estructuras Algebraicas
Facultad de Ciencias Exactas
Universidad Nacional de La Plata
Mayo de 2008

1
Índice
1. Introducción 3

2. Los Números p-ádicos 4


2.1. La valuación, la norma p-ádica y la métrica p-ádica: Primera definición . . 4
2.2. Segunda definición: Zp y Qp . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3. Polinomios y ecuaciones p-ádicas . . . . . . . . . . . . . . . . . . . . . . . 7
2.4. Unidades y cuadrados en Qp . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3. El sı́mbolo de Hilbert 14
3.1. Definición, propiedades básicas y cálculo del sı́mbolo . . . . . . . . . . . . 14
3.2. Propiedades globales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

4. Formas cuadráticas 22
4.1. Módulos cuadráticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.2. Propiedades generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.3. Formas cuadráticas sobre Fq . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.4. Formas cuadráticas sobre Qp . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.5. Formas cuadráticas sobre R . . . . . . . . . . . . . . . . . . . . . . . . . . 36

5. Teorema de Hasse-Minkowski 38
5.1. Demostración del Teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.2. Algunos comentarios interesantes . . . . . . . . . . . . . . . . . . . . . . . 41

6. Apéndices 42
6.1. Algunos resultados en Teorı́a de Números . . . . . . . . . . . . . . . . . . . 42
6.1.1. Ecuaciones sobre cuerpos finitos . . . . . . . . . . . . . . . . . . . . 42
6.1.2. Ley de reciprocidad cuadrática . . . . . . . . . . . . . . . . . . . . 43
6.2. Sistemas y Lı́mites proyectivos . . . . . . . . . . . . . . . . . . . . . . . . . 44

2
Los Números p-ádicos y el Teorema de Hasse-Minkowski 3

1. Introducción
Se podrı́a haber incluido en el tı́tulo de este trabajo el nombre de ”formas cuadráticas”,
puesto que nos ocupamos del estudio de estos objetos en gran medida. Sin embargo, esto
ha quedado implı́cito al mencionar el Teorema de Hasse-Minkowski, el cual es conocido
por dar una muy buena clasificación de las formas cuadráticas sobre Q. Para llegar a este
resultado, uno de nuestros objetivos, se deberá recorrer un largo camino, a través del cual
serán presentados el cuerpo de los números p-ádicos, el sı́mbolo de Hilbert, y numerosos re-
sultados algebráicos (muchos de ellos relacionados directamente con la Teorı́a de Números),
entre otras cosas.
Además de apuntar al ya mencionado Teorema de Hasse-Minkowski y a clasificar las for-
mas cuadráticas sobre los distintos cuerpos en cuestión, nos interesaremos bastante en los
números p-ádicos y en algunas de sus propiedades y aplicaciones para resolver problemas.
Es curiosa la gran diversidad de maneras que existen para presentar al cuerpo Qp de los
números p-ádicos. Algunas de ellas son mas bien desde el punto de vista .analı́tico”(como
la completación de Q respecto de cierta norma, o ciertas series formales de potencias de
p), otras son puramente algebráicas (”el cuerpo de cocientes del lı́mite proyectivo de los
enteros módulo pn ”). Presentaremos dos de ellas en la primer sección, pero a lo largo del
trabajo serán de mayor utilidad las ideas del tipo algebráico (incluso en algunos resultados
en los que aparecen derivadas!).
En la tercer sección se estudiará el Sı́mbolo de Hilbert, que será una herramienta funda-
mental para construir invariantes para las formas cuadráticas tanto en Qp como en Q.
La sección de formas cuadráticas se ocupará de presentar estos objetos matemáticos, y
finalmente llegar a una minuciosa clasificación de ellas (no sobre las racionales), la cual uti-
lizaremos en la sección siguiente para probar la relación global-local que vincula los cuerpos
Qp y R con Q.
Por último, cabe mencionar que gran parte de este trabajo ha sido basado en los primeros
capı́tulos de [2]. Es por eso que en general todas las deficiones y resultados que se prueben
tendrán, tarde o temprano, su rol importante en el trabajo. Sin embargo, en contraposi-
ción con la bibliografı́a mencionada, intentaremos hacer más hincapié en los detalles de las
pruebas, para llegar a cada resultado de una manera más accesible.
Los Números p-ádicos y el Teorema de Hasse-Minkowski 4

2. Los Números p-ádicos


En esta sección se hará una introducción a la teorı́a de los números p-ádicos. Hay varias
formas equivalentes de definir este conjunto de números; a continuación mostraremos dos de
ellas. La primera es más útil para comprender realmente qué estamos haciendo al construir
los números p-ádicos, mientras que la segunda es una presentación más algebráica que, si
bien un tanto más complicada de entender, nos permite manejarlos con mayor simplicidad
y más formalmente.

2.1. La valuación, la norma p-ádica y la métrica p-ádica: Primera


definición
Sea p un número primo fijo. Sabemos, por el TFA, que para cada a ∈ Z existe un único
n ∈ Z≥0 tal que a = pn r, con (r, p) = 1. Esto nos permite, siguiendo las ideas en [1], hacer
la siguiente definición:

Definición 2.1. Se define la valuación p-ádica de un número racional como:

vp (x) = máx{n ∈ Z : pn | x} ≥ 0, si x ∈ Z \ {0}

vp (q) = vp (a) − vp (b), si q = a/b ∈ Q.

Por convención se toma vp (0) = ∞.


Notemos que vp : Q → Z, y además está bien definida, pues si a/b = a0 /b0 entonces ab0 = a0 b,
y claramente vp (a) + vp (b0 ) = vp (a0 ) + vp (b) de donde vp (a/b) = vp (a0 /b0 ).

Proposición 2.2. Sean x, y ∈ Q. Entonces valen:


(a) vp (x) = ∞ ⇐⇒ x = 0
(b) vp (xy) = vp (x) + vp (y)
(c) vp (x + y) ≥ mı́n{vp (x), vp (y)}, y si vp (x) =
6 vp (y) se da la igualdad.

Demostración: Probaremos únicamente el item (c) que es el no trivial. Para eso, supong-
amos que x, y son no nulos (si alguno de ellos lo fuera, se da la igualdad trivialmente).
Entonces podemos escribir
a c
x = pr , y = ps
b d
con r, s ∈ Z, y a, b, c, d ∈ Z no divisibles por p. Es claro que vp (x) = r, vp (y) = s.
Supongamos sin pérdida de generalidad que s ≥ r, y sea t = s − r ≥ 0. Entonces,
t
   
r a tc r ad + p bc
x+y =p +p =p
b d bd

de donde se deduce inmediatamente la desigualdad a probar. Si suponemos vp (x) 6= vp (y),


es equivalente a tomar t ≥ 1 con lo cual se ve claramente que p no divide ni al numerador
ni al denominador de la fracción que acompaña a pr (pues por hipótesis p no dividı́a a
ninguno de los enteros a, b, c, d. 

Esta valuación p-ádica nos permite definir la norma p-ádica, de la siguiente manera:
Los Números p-ádicos y el Teorema de Hasse-Minkowski 5

Definición 2.3. Si p es un número primo fijo, se define en Q la norma p-ádica como


kxkp = p−vp (x) .

Obviamente, definimos k0kp = 0. Es fácil verificar que es efectivamente una norma en


Q. En particular, se ve que k · kp : Q → R≥0 . Valen las siguientes propiedades, análogas a
las que valı́an para la valuación:

Proposición 2.4. Si x ∈ Q, entonces se verifican:


(a) kxkp = 0 ⇐⇒ x = 0
(b) kxykp = kxkp kykp
1
(c) kx + ykp ≤ máx{kxkp , kykp }, y si kxkp 6= kykp se da la igualdad.

La demostración se deduce inmediatamente de 2.2.


Como bien es sabido, toda norma N en un espacio induce una distancia, mediante la
definición d(x, y) = N (x − y). Ası́, suena lógico presentar la siguiente definición:

Definición 2.5. Se define en Q la métrica p-ádica, como dp (x, y) = vp (x − y).

Es usual interpretar a los números reales R como la completación de Q de acuerdo a la


métrica estandard d(x, y) = |x − y|. Inspirados en esta interpretación, se define lo siguiente:

Definición 2.6. El cuerpo de números p-ádicos Qp es la completación de Q con respecto


a la métrica p-ádica.

En Qp se considera la topologı́a inducida por la métrica p-ádica, según la cual resulta un


espacio de Hausdorf localmente compacto. Obviamente, considerado como espacio métrico,
Qp resultará completo.

2.2. Segunda definición: Zp y Qp


Como se ha mencionado mas arriba, trabajaremos con una nueva definición de los
números p-ádicos, viéndolos ahora desde el punto de vista algebráico (como son presen-
tados en [2]).
Para cada n ≥ 1, denotemos por An al anillo de enteros módulo pn , es decir, An := Z/pn Z.
Claramente a cada elemento a ∈ An se le puede asociar uno en An−1 tomando resto en la
división por pn−1 . De esta forma queda siempre definido un epimorfismo φn : An → An−1 ,
cuyo núcleo es pn−1 An .
Con estos epimorfismos, resulta evidente que la sucesión

. . . → An → An−1 → . . . → A2 → A1

conforma un sistema proyectivo. De esta observación surge la idea para la segunda definición
de los números p-ádicos.

Definición 2.7. Se define el anillo de enteros p-ádicos Zp como el lı́mite proyectivo del
sistema (An , φn ) definido previamente. Es decir,

Zp := lim(An , φn )
←−
1
Una norma que satisface esta propiedad se dice ”no-arquimediana”
Los Números p-ádicos y el Teorema de Hasse-Minkowski 6

Por definición de lı́mite proyectivo, un elemento de Zp es una sucesión x = (. . . , xn , . . . , x1 )


con xn ∈ An , y xn ≡ xn−1 mod pn−1 . La suma y el producto en este anillo se definen co-
ordenada
Q a coordenada, es decir, se interpreta a Zp como un subanillo del anillo producto
n≥1 An .
Antes de llegar a la definición de Qp , veamos algunas propiedades de los enteros p-ádicos.
Proposición 2.8. Sea εn : Zp → An la proyección de la n-ésima coordenada xn de cada
entero p-ádico x. Entonces, la sucesión de grupos abelianos
pn n ε
0 → Zp −→ Zp −→ An → 0

es exacta.
Demostración: Es claro que εn es un epimorfismo. Veamos entonces que la multiplicación
por pn es inyectiva en Zp . Para eso, basta con ver que multiplicar por p lo es (luego com-
ponemos esta función n veces). Sea x = (xn ) ∈ Zp tal que px = 0. Mirando coordenada
a coordenada, se tiene que pxn+1 = 0 (en An+1 ) para todo n. Luego, xn+1 = pn yn+1 , para
cierto yn+1 ∈ An+1 . Pero por definición de Zp , xn = φn+1 (xn+1 ), luego xn también es di-
visible por pn , y por estar en An , xn = 0. Esto vale para todo n, luego x = 0 y entonces
multiplicar por p es una aplicación inyectiva.
Para completar la demostración, resta ver que pn Zp es igual al núcleo de εn . Es claro que
dicho núcleo contiene a pn Zp (ya que todo múltiplo de pn tiene en su n-ésima coordenada
un 0). Ahora tomemos un elemento x = (xm ) ∈ ker(εn ). Entonces, xn = 0, y luego por
definición de Zp tenemos que pn | xm para todo m ≥ n. Escribamos xm = pn ym−n , con
ym−n ∈ Am−n (se puede suponer esto puesto que pn Am ∼ = Am−n ). Entonces estos elementos
yi definen en Zp = lim Ai un elemento y (esto se deduce de que x satisface las condiciones
←−
para estar en Zp ), el cual verifica claramente (coordenada a coordenada) x = pn y. Luego
x ∈ pn Zp , y en conclusión, la sucesión es exacta. 

Notemos que esto nos permite pensar a Zp /pn Zp como An , que a su vez es igual a Z/pn Z.
Proposición 2.9. Un elemento de An o de Zp es una unidad si y sólo si no es divisible por
p. Además, todo elemento no nulo de Zp se escribe de forma única como pn u, con u ∈ U(Zp )
y n ≥ 0.
Demostración: Probemos la tésis primero para An . Es claro que si x ∈ An es una unidad
entonces no es divisible por p, pues si ası́ fuera, entonces p | xx−1 = 1 + mpn ⇒ p | 1,
absurdo. Recı́procamente, supongamos que x ∈ An \ pAn no es múltiplo de p. Entonces la
imagen de x en A1 = Z/pZ es no nula, luego es invertible. Tomemos entonces y tal que
xy = 1 − pz, y podemos pensar que y, z ∈ An . Ası́,

xy(1 + pz + . . . + pn−1 z n−1 ) = (1 − pz)(1 + pz + . . . + pn−1 z n−1 ) = 1 − pn z n

por lo tanto x es invertible en An .


Para ver el resultado en Zp , basta con observar que si x ∈ Zp no es múltiplo de p entonces
su imagen xn en cada An tampoco lo es, con lo cual es invertible. Y como la multiplicación
en Zp se define coordenada a coordenada, esto implica que el mismo x es invertible en Zp
y listo.
Por otro lado, si tenemos un elemento x = (xn ) ∈ Zp no nulo, sea n el mayor ı́ndice para
el cual xn = 0. Entonces pn | x, pero pn+1 - x en Zp , lo cual implica que existe u tal que
Los Números p-ádicos y el Teorema de Hasse-Minkowski 7

x = pn u y además p - u. Por el resultado anterior, u ∈ U(Zp ), con lo cual queda probada la


existencia de la descomposición.
La unicidad se deduce del hecho de que el n fue elegido de manera única, y la multiplicación
por pn es inyectiva (proposición anterior), o sea que no pueden existir dos u distintos. 

De la última parte de la proposición se puede definir, como en 2.1, la valuación p-ádica,


pero esta vez directamente para Zp .
Teniendo en cuenta que Zp resulta un anillo (es incluso un dominio de integridad), sabemos
que podemos construir un cuerpo que lo contenga de forma “razonable”. Es decir, el cuerpo
de cocientes del anillo. Y al igual que de Z obtenemos el cuerpo Q, podemos hacer lo mismo
con Zp para obtener ası́ el conjunto de números en cuestión:

Definición 2.10. El conjunto de los números p-ádicos Qp se define como el cuerpo de


cocientes del anillo Zp .

Podemos pensar que Qp = Zp [p−1 ]. Y al igual que en Zp , todo elemento de Q∗p puede
escribirse de forma única como pn u, con u ∈ U = U(Zp ) y n ∈ Z. Esto da lugar a la
generalización de la valuación p-ádica para todo Qp , y obviamente se verifica que vp (x) ≥ 0
si y sólo si x ∈ Zp .
Al igual que en la primer definición de los números p-ádicos, se puede definir la distancia (o
métrica) p-ádica, basándose en la valuación p-ádica ya definida. 2 Esta distancia define la
topologı́a en Zp y Qp , según la cual el anillo Zp resulta ser un espacio métrico completo, que
contiene como subconjunto denso en él a Z. Además, como ya se ha mencionado, el cuerpo
Qp resulta ser localmente compacto con la topologı́a mencionada, y el anillo Zp resulta ser
un subanillo abierto. Obviamente, Q es denso en Qp .

A pesar de que ya hemos definido a los números p-ádicos desde dos puntos de vista
diferentes, aún hay una forma más de pensar en ellos. K. Hensel, quien fue el primero en
introducir la idea de número p-ádico, trabajó mucho con ellos para resolver problemas de
la teorı́a de números, y utilizaba en sus trabajos un desarrollo en serie de los números
p-ádicos, conocido como desarrollo de Hensel. En [3] se menciona dicho desarrollo, y se
prueba la siguiente proposición:

Proposición 2.11. Todo x ∈ Qp admite un único desarrollo de Hensel, es decir, se puede


escribir de forma única como x = n≥no an pn , con 0 ≤ an < p, an0 6= 0 y n0 ∈ Z.
P

Claramente, n0 es lo que nosotros hemos llamado vp (x). En esta forma de ver a los
números p-ádicos se ve mucho mejor la idea de completación (pues en realidad los elemen-
tos de Q son precisamente aquellos cuyo desarrollo de Hensel se hace periódico a partir de
un punto; por ejemplo, que se haga cero a partir de n1 ).

2.3. Polinomios y ecuaciones p-ádicas


En esta sección veremos algunos resultados importantes sobre las raı́ces de polinomios
con coeficientes p-ádicos. A pesar de que la mayoria de ellos sólo serán usados para el caso de
Vale la pena mencionar que algunos autores utilizan la definición dp (x, y) := e−vp (x−y) , sin embargo
2

ambas definiciones dan lugar a normas totalmente equivalentes


Los Números p-ádicos y el Teorema de Hasse-Minkowski 8

grado 2 (formas cuadráticas), vale la pena mencionarlos en general ya que la demostración


es casi idéntica en ambos casos.

Antes que nada, algo de notación: Si f ∈ Zp [X1 , . . . , Xm ] es un polinomio con coefi-


cientes en Zp , llamaremos fn al polinomio obtenido de f tomando módulo pn (n ∈ N). Y si
x = (x1 , . . . , xm ) ∈ (Zp )m (resp. en (An )m ) , diremos que x es primitivo si alguno de los
xi es inverible en Zp (resp. en An ). O sea, si alguna de sus coordenadas no es múltiplo de
p.

Proposición 2.12. Sean f (i) ∈ Zp [X1 , . . . , Xm ] polinomios con coeficientes enteros p-ádi-
cos. Son equivalentes:
(i) Todos los f (i) tienen una raı́z en común en (Zp )m .
(i)
(ii) Para cada n > 1, los polinomios fn tienen una raı́z en común en (An )m .

Demostración: Esto es una consecuencia inmediata del Lema 6.9. En efecto, si se toma
(i)
como Dn al conjunto de raı́ces en común de los fn , se ve que los Dn son finitos y además
forman un sistema proyectivo (puesto que ser raiz módulo pn+1 implica serlo módulo pn ).
Pero aparte, D := lim Dn es el conjunto de raı́ces del polinomio en Zp , ya que ser raiz
←−
módulo pn para todo n implica que es raiz en Zp . O sea que se puede aplicar el Lema,
que nos dice que si los Dn son no vacı́os entonces D lo es, y esto es precisamente lo que
querı́amos probar (el hecho de que D no vacı́o implica que los Dn lo son sale por reducir la
ecuación módulo pn ). 

Proposición 2.13. Sean f (i) ∈ Zp [X1 , . . . , Xm ] polinomios homogéneos con coeficientes


enteros p-ádicos. Son equivalentes:
(a) Los f (i) tienen una raı́z no trivial en común en (Qp )m .
(b) Los f (i) tienen una raı́z primitiva en común (Zp )m .
(i)
(c) Para cada n > 1, los polinomios fn tienen una raı́z primitiva en (An )m .

Demostración: Es claro que (b) → (a). Para ver la vuelta, sea x = (x1 , . . . , xm ) ∈ (Qp )m
es una raiz no trivial de los f (i) , y llamemos h := inf(vp (x1 ), . . . , vp (xm )), y = p−h x.
Ası́ definido, resulta que vp (yj ) = vp (xj ) − h ≥ 0 ∀j, y además en un ı́ndice j se da la
igualdad, con lo cual y ∈ Zp y es primitivo. Como los polinomios son homogeneos, al eval-
(i)
uarlos en y = p−h x el factor p−h deg(f ) sale en común, y lo restante queda 0 por ser x raiz.
Entonces y es raiz primitiva en común de los f (i) en Zp .
Para finalizar, vemos que podemos imitar la prueba de la proposición anterior (utilizando
el mismo Lema) para probar que (b) ↔ (c), poniendo Dn como el conjunto de raı́ces prim-
itivas en común de los f (i) en An y observando que forman un sistema proyectivo, cuyo
lı́mite es el conjunto D de raı́ces en común de los polinomios en Zp . 

A continuación veremos como están relacionadas las soluciones a ecuaciones polinomi-


ales módulo pn con soluciones en Zp (es evidente como obtener las primeras sabiendo las
segundas, el problema es conseguir soluciones en Zp a partir de soluciones en cada An ).

Lema 2.14. (Método de Newton aplicado a números p-ádicos) Sea f ∈ Zp [X], y sea f 0 su
polonomio derivado. Dados x ∈ Zp , n, k ∈ Z, tales que 0 ≤ 2k < n, f (x) ≡ 0 mod pn y
Los Números p-ádicos y el Teorema de Hasse-Minkowski 9

vp (f 0 (x)) = k, entonces existe y ∈ Zp tal que

f (y) ≡ 0 mod pn+1 , vp (f 0 (y)) = k, y ≡ x mod pn−k

Demostración: Propongamos un y de la forma y = x + pn−k z como solución, z ∈ Zp .


Tomando el polinomio de Taylor de grado 2 para f centrado en x, y evaluandolo en y,
obtenemos que

f (y) = f (x) + (y − x)f 0 (x) + (y − x)2 a = f (x) + pn−k zf 0 (x) + p2n−2k za

con a ∈ Zp . Pero por hipótesis, f (x) = pn b, f 0 (x) = pk c con b ∈ Zp y c ∈ U. Sea c−1 el


inverso de c módulo p (pensando que c−1 ∈ Zp ), y consideremos entonces z = −bc−1 . Se ve
que b + zc es múltiplo de p, entonces pn (b + zc) es múltiplo de pn+1 . Por lo tanto, tenemos
que
f (y) = pn b + pn−k zpk c + p2n−2k za = pn (b + zc) + p2n−2k a ≡ 0 mod pn+1
pues 2n − 2k > n por hipótesis.
Finalmente, como el y elegido satisface y ≡ x (modpn−k ), aplicamos f 0 a ambos lados y
obtenemos f 0 (y) ≡ pk c (modpn−k ), con c no divisible por p. Pero n − k > k, luego la mayor
potencia de p que puede dividir a f 0 (y) es pk (pues sino p dividirı́a a c), y esto es decir que
vp (f 0 (y)) = k. 

Teorema 2.15. Sean f ∈ Zp [X1 , . . . , Xm ], x = (x1 , . . . , xm ) ∈ (Zp )m , n, k, j ∈ Z tales que


0 ≤ j ≤ m y 0 ≤ 2k < n. Supongamos que
 
n ∂f
f (x) ≡ 0 mod(p ), vp (x) = k
∂Xj

Entonces, existe una raı́z y ∈ (Zp )m de f tal que y ≡ x mod(pn−k ) (coordenada a coorde-
nada).

Demostración: Probemos el Teorema primero para el caso m = 1. Según el Lema del


método de Newton podemos encontrar un x(1) ∈ Zp tal que x(1) ≡ x mod(pn−k ) y tal
que f (x(1) ) ≡ 0 mod(pn+1 ) y vp (f 0 (x(1) )) = k. De la misma forma, y en general, pode-
mos reemplazar n por n + 1 y volver a aplicar el Lema, consiguiendo ası́ una sucesión
x, x(1) , . . . , x(q) , . . . tal que para todo q x(q+1) ≡ x(q) mod(pn+q−k ) y f (x(q) ) ≡ 0 mod(pn+q ).
Como n + q − k tiende a infinito, la norma p-ádica de x(q+r) − x(q) tiende a 0, con lo cual
la sucesión construida es de Cauchy. Sea y su lı́mite (recordar que Zp es completo). Por
continuidad, la norma de f (y) es 0 entonces f (y) = 0. Y al tener que todos los términos de
la sucesión son congruentes con x módulo pn−k , lo mismo ocurre con y.
Para probar el caso m > 1 simplemente fijamos en el polinomio todas las variables que
no tengan ı́ndice j, y les damos el valor xi correspondiente. Ası́ obtenemos un polinomio
f˜ ∈ Zp [Xj ] que está en las condiciones anteriores, y podemos entonces hallar yj congruente
a xj módulo pn−k tal que f˜(yj ) = 0. Poniendo yi = xi para i 6= j, obtenemos el elemento
y = (yi ) buscado. 

Este importante teorema trae como consecuencia numerosos resultados. Los que más
nos interesan son los siguientes:
Los Números p-ádicos y el Teorema de Hasse-Minkowski 10

Corolario 2.16. (Lema de Hensel) Sea f ∈ Zp [X1 , . . . , Xm ] un polinomio con coeficientes


en Zp , y a = (a1 , . . . , am ) ∈ (Zp )m una raı́z simple de

f (x) ≡ 0 mod(p)
∂f
(i.e., ∂X i
(a) 6= 0 mod (p) para algún i, 1 ≤ i ≤ m). Entonces existe y ∈ Zp tal que y ≡ a0
mod p y f (y) = 0.
∂f
(Esto es exactamente el teorema para n = 1, k = 0. En efecto, el hecho de que ∂X i
(a) 6= 0
∂f

mod (p) implica que vp ∂Xi (a) 6= 0).
P
Corolario 2.17. Sean a ∈ Zp , y f (X) = i,j aij Xi Xj , con aij = aji , una forma cuadrática
con coeficientes en Zp tal que det(aij ) es invertible. Entonces,
(i) Si p 6= 2, toda solución primitiva de f (X) ≡ a mod(p) da lugar a una solución en Zp .
(ii) Si p = 2, toda solución de f (X) ≡ a mod(8) da lugar a una solución en Z2
Demostración: Sea x una solución primitiva de f (X) ≡ a mod(p). Para probar (i) basta
con demostrar que hay alguna derivada parcial P que no se anula en x, módulo p (por Lema de
∂f
Hensel). Sea A = (aij ). Vemos que ∂X i
= 2 j aij Xj = 2(AX)i (donde X = (X1 , . . . , Xn )).
Si todas las derivadas parciales fueran cero, entonces el vector AX serı́a cero módulo p. Y
esto es absurdo puesto que X no es cero módulo p (pues es primitivo), y A es invertible
mod (p). Por lo tanto hay alguna no nula, y se puede aplicar el Lema.
Con el mismo razonamiento que recien, pero teniendo en cuenta el 2 que acompaña a (AX)i
en la fórmula de la derivada parcial, se ve que en el caso p = 2 el hecho de que A sea in-
vertible implica que las derivadas parciales no son todas nulas mod(4). Pero entonces el
resultado a probar no es otra cosa que aplicar el Teorema con n = 3, k = 1. 

2.4. Unidades y cuadrados en Qp


El objetivo de esta sección es caracterizar de cierta forma los grupos multiplicativos y,
con esta información, los diferentes tipos de restos cuadráticos en cada uno de los cuerpos
Qp .

Llamaremos U = Z∗p al grupo multiplicativo (o de unidades) de los enteros p-ádicos. Para


cada n ≥ 1, notamos Un = 1 + pn Zp , es decir, el núcleo de la aplicación εn : U → (Z/pn Z)∗
definida en la Proposición 2.8. En particular, como U1 = ker(ε1 ) y (Z/pZ)∗ = Im(ε1 ), U/U1
se puede pensar como (Z/pZ)∗ ∼ = Fp∗ (grupo multiplicativo del cuerpo de p elementos),
y luego es cı́clico y de orden p − 1. Además, es claro que los Un forman una sucesión
”decreciente”(según inclusión) de subgrupos abiertos de U (pues U/Un ∼ = (Z/pn Z)∗ ), y se
tiene que U = lim U/Un .
←−
Consideremos ahora para cada n ≥ 1 el morfismo de grupos abelianos φ : Un → Z/pZ, dado
por (1 + pn x) 7→ x mod p. Entonces Un /ker(φ) ∼ = Im(φ). Pero ker(φ) = Un+1 , Im(φ) =
Z/pZ, luego Un /Un+1 ∼ = Z/pZ. Ası́, se puede ver por inducción que U1 /Un tiene orden pn−1 .
Veamos ahora el siguiente Lema de terorı́a de grupos:
Lema 2.18. Sea 0 → A → E → B → 0 una sucesión exacta de grupos abelianos, a, b
los ordenes (finitos) de A, B resp., y tales que mcd(a, b) = 1. Si B 0 := {x ∈ E : bx = 0},
entonces E ∼= A ⊕ B 0 , y además B 0 es el único subgrupo de E isomorfo a B.
Los Números p-ádicos y el Teorema de Hasse-Minkowski 11

Demostración: Como a y b son coprimos, existen r, s ∈ Z tales que ar + bs = 1. Veamos


primero que A ∩ B 0 = 0. Sea x ∈ A ∩ B 0 . Entonces por ser a el orden de A, ax = 0. Y bx = 0
por definición de B 0 , luego x = (ar + bs)x = r(ax) + s(bx) = 0 y entonces A ∩ B 0 = 0.
Ahora bien, tomemos x ∈ E y escribamoslo como x = arx + bsx. Sean f el monomorfismo
de A a E y g el epimorfismo de E a B. Entonces g(bsx) = bg(sx) = 0 ya que g(sx) ∈ B
y b es el orden de ese grupo. Luego, bsx ∈ ker g = Imf ∼ = A pues f es mono. Entonces,
bsx ∈ A (abuso de notación; en realidad está en un subgrupo de E isomorfo a A). Resta
ver que arx ∈ B 0 , pero para esto hacemos b(arx) = a(brx), se ve de forma análoga a la
anterior que brx ∈ A, y luego abrx = 0 con lo cual arx ∈ B 0 . Por lo tanto, E ∼ = A ⊕ B0.
0
El epimorfismo g : E 7→ B define un isomorfismo entre B y B , puesto que en los elementos
de A da 0. Si tuvieramos un B 00 ⊆ E isomorfo a B entonces por una cuestión de orden (de
este subgrupo), bB 00 = 0 luego B 00 ⊆ B 0 por definición de B 0 . Y al tener el mismo orden,
resulta que B 0 = B 00 . 

Proposición 2.19. Si V := {x ∈ U : xp−1 = 1}, entonces este es el único subgrupo de U


isomorfo a Fp∗ , y U = V × U1
Demostración: Consideremos la sucesión de grupos abelianos
1 → U1 /Un → U/Un → Fp∗ → 1
n ∼
Es exacta, ya que UU/U
1 /Un
= U/U1 por el segundo Teorema del isomorfismo, y hemos visto
que este último grupo es isomorfo a Fp∗ . Pero además, el orden de U1 /Un es pn−1 y el de
Fp∗ es p − 1: son coprimos. Por lo tanto se aplica el Lema anterior, y podemos concluir que
U/Un contiene un único subgrupo Vn isomorfo a Fp∗ . Por el mismo Lema, podemos decir
que Vn es exactamente {x ∈ U/Un |xp−1 = 1}. Pensando el epimorfismo φn : An 7→ An−1
como φn : U/Un 7→ U/Un−1 (se puede porque estos conjuntos son isomorfos) tenemos un
sistema proyectivo cuyo lı́mite es U . Y como cada morfismo lleva Vn a Vn−1 de manera
isomorfa, obtenemos pasando al lı́mite un único subgrupo V de U isomorfo a Fp∗ . El hecho
de que V sea de la forma explicitada en la Proposición se deduce de cómo son los Vn , y por
otra parte como U/U1 ∼ = Fp∗ , se deduce inmediatamente que U = V × U1 .  3

Veamos ahora qué ocurre con el grupo U1 :


Lema 2.20. Si x ∈ Un \ Un+1 , con n ≥ 1 (y n ≥ 2 si p = 2), entonces xp ∈ Un+1 \ Un+2 .
Demostración: Por hipótesis, podemos escribir x = 1 + kpn , con k no múltiplo de p.
Desarrollando por binomio de Newton, tenemos que
xp = 1 + kpn+1 + . . . + k p pnp
y en todos los términos que faltan el exponente de p es al menos 2n + 1 ≥ n + 2. Más aun,
np ≥ n + 2 (para esto se pide la hipótesis de que si p = 2 entonces n ≥ 2). Luego
xp ≡ 1 + kpn+1 mod pn+2
y entonces x ∈ Un+1 \ Un+2 . 

3
Notar que en el Lema se utilizó la notación aditiva, mientras que al aplicarlo a la Proposición se
utilizó la notacion multiplicativa.
Los Números p-ádicos y el Teorema de Hasse-Minkowski 12

Proposición 2.21. El grupo U1 es isomorfo a...


(i) Zp , si p 6= 2.
(ii) {±1} × U2 ∼ = {±1} × Z2 , si p = 2.
Demostración: (i) Sea α ∈ U1 \ U2 , por ejemplo α = 1 + p. Por el Lema anterior,
i
αp ∈ Ui+1 \ Ui+2 . Sea αn la imagen de α en U1 /Un . De lo mencionado anteriormente
n−2 n−1
(tomando i = n − 2 y i = n − 1) se deduce que αp ∈ Un−1 \ Un y αp ∈ Un , luego
n−2 n−1
(αn )p 6= 1 y (αn )p = 1 (recordar que los grupos se notan multiplicativamente). Al ser
U1 /Un un grupo de orden pn−1 , resulta que el orden de αn es exactamente pn−1 , con lo cual
es un generador. Esto implica que se puede definir un isomorfismo θn,α entre Z/pn−1 Z y
U1 /Un . Es claro, por la definición de dichos isomorfimos, que el diagrama
Z/pn Z −→ U1 /Un+1
↓ ↓
Z/pn−1 Z −→ U1 /Un
conmuta. Pasando al lı́mite, queda entonces definido un isomorfismo θ entre Zp =
lim Z/pn−1 Z y U1 = lim U1 /Un , con lo cual queda probado el caso p 6= 2.
←− ←−
(ii) Tomando α ∈ U2 \ U3 obtenemos de la misma forma que antes los isomorfimos θn,α :
Z/2n−2 Z → U2 /Un , y por lo tanto se tiene un isomorfismo θ : Z2 → U2 . Por otro lado,
como U1 /U2 ∼= Z/2Z ∼= {±1} se ve inmediatamente que U1 ∼ = {±1} × U2 . 

Con estos resultados, ya estamos en condiciones de caracterizar el grupo multiplicativo


de Qp de la siguiente manera:

Teorema 2.22. El grupo Q∗p es isomorfo a Z × Zp × Z/rZ, donde r = p − 1 si p 6= 2, y


r = 2 si p = 2.
Demostración: Sabemos que todo elemento x ∈ Qp ∗ se escribe de forma única como
x = pn u, con n ∈ Z y u ∈ U . Luego, Qp ∗ ∼= Z × U . Pero además, U ∼= V × U1 por la

Proposición 2.19, y V = Z/(p − 1)Z si p 6= 2 (V es trivial si p = 2), luego usando la
estructura para U1 probada en la Proposición anterior se deduce inmediatamente lo que
queremos probar. 

Con esta caracterización, y utilizando el sı́mbolo de Legendre (ver Apéndice 6.1.2) pode-
mos conocer mas profundamente los cuadrados perfectos en Qp , mediante los siguientes
resultados, que eran el objetivo principal de esta sección.

Teorema 2.23. Si p 6= 2, entonces para que un elemento x = pn u ∈ Q∗p , con n ∈ Z y


u ∈ U 4 , sea un cuadrado perfecto, es necesario y suficiente que n sea par, y que la imagen
de u en Fp∗ = U/U1 sea un cuadrado perfecto (resto cuadrático).5
Demostración: Escribamos u = vu1 , con v ∈ V y u1 ∈ U1 . Como Qp ∗ ∼ = Z × V × U1 ,
entonces x es cuadrado perfecto si y sólo si n es par, y v y u1 son cuadrados en sus respec-
tivas ubicaciones. Pero U1 es isomorfo a Zp (este último con notación aditiva), y como 2 es
4
Ver comentario posterior a la Definición 2.10
5
Al decir ”la imagen de u en Fp∗ nos referimos a su primera componente en la descomposición U = V ×U1
de la Proposición 2.19, ya que V ∼
= Fp∗ .)
Los Números p-ádicos y el Teorema de Hasse-Minkowski 13

invertible en Zp , todos los elementos son cuadrados, luego u1 siempre es cuadrado perfecto.
Al ser V isomorfo a Fp∗ , queda probado el teorema.  6

Corolario 2.24. Si p 6= 2, el grupo Q∗p /Q∗p 2 es isomorfo a Z2 × Z2 , y se puede representar


mediante {1, p, u, up}, siendo u ∈ U un elemento tal que su imagen ũ en Fp∗ verifica ũp =


−1 (es decir, no es un resto cuadrático mod p).

Demostración: Esto es obvio, ya que si cocientamos con el cuerpo de cuadrados Q∗p 2 en-
tonces de los elementos de Q∗p , que pueden pensarse como pn u, sólo nos interesa la paridad
de n y el sı́mbolo de Legendre ũp (el cual toma valores en {±1}). Luego tomando 1 = p0 ,


p = p1 , u y pu tenemos representantes de dicho cociente. 

Teorema 2.25. Para que un elemento x = pn u ∈ Q∗2 sea un cuadrado perfecto, es necesario
y suficiente que n sea par y que u ≡ 1 mod 8.

Demostración: La descomposición del Teorema 2.22 nos dice que x = pn u es cuadrado


perfecto si y sólo si n es par, y u es un cuadrado en U . Pero U = {±1} × U2 , luego esto
último pasará si y sólo si u ∈ U2 y además u es un cuadrado allı́. Considerando el isomor-
fismo θ definido en la Proposición 2.21, vemos que este envı́a al conjunto 2n Z2 en Un+2 . En
particular, para n = 1, el conjunto 2Z2 es isomorfo a U3 . Pero 2Z2 son los cuadrados en Z2 ,
y Z2 es isomorfo a U2 , luego u será un cuadrado en U2 sii u ∈ U3 . Es decir, si y sólo si u es
congruente con 1 módulo 8. 

Corolario 2.26. El grupo Q∗2 /Q∗2 2 es isomorfo a Z2 × Z2 × Z2 , y se puede representar


mediante {±1, ±5, ±2, ±10}.

Demostración: Este Corolario se deduce inmediatamente del hecho de que U/U3 se puede
caracterizar mediante el conjunto {±1, ±5}. 

Nota: Los Teoremas 2.23 y 2.25 dicen que Q∗p 2 es un subgrupo abierto de Q∗p , para todo
p primo.

6
Cabe mencionar que en las estructuras notadas aditivamente también consideramos los cuadrados
perfectos: son aquellos elementos x para los cuales existe un y tal que y + y = x.
Los Números p-ádicos y el Teorema de Hasse-Minkowski 14

3. El sı́mbolo de Hilbert
Para trabajar con formas cuadráticas, y mas precisamente si estamos estudiando cuándo
una ecuación cuadrática tiene solución, es sumamente útil introducir la noción del sı́mbolo
de Hilbert. Además éste nos permitirá, en la próxima sección, hacer la clasificación de
formas cuadráticas.
En [4] se presenta al sı́mbolo de Hilbert definido sobre cualquier cuerpo local 7 , lo cual
servirı́a para demostrar la versión general del Teorema de Hasse-Minkowski. Sin embargo,
para entender y probar los resultados se requiere un buen manejo de la Teorı́a de Cuerpos,
razón por la cual nos limitamos a hacer las cosas en R y Qp .
En general en esta sección cuando se hable de cuerpo nos estaremos refiriendo a Qp o a R.

3.1. Definición, propiedades básicas y cálculo del sı́mbolo


Definición 3.1. Sea k un cuerpo. Si a, b ∈ k ∗ , se define el sı́mbolo de Hilbert entre a y
b con respecto a k como el número (a, b) dado por:

1, si la ecuación z 2 − ax2 − by 2 = 0 tiene solución no trivial en k 3 ;
(a, b) =
−1, en caso contrario.

Al ser invariante bajo multiplicaciones de a y b por cuadrados (i.e., (a, bc2 ) = (a, b)), el
sı́mbolo de Hilbert define una aplicación entre k ∗ /k ∗ 2 × k ∗ /k ∗ 2 y {±1}.

Proposición 3.2. Sean a, b ∈ k ∗ , y kb := k( b). Si N kb∗ es el conjunto de normas de
elementos en kb∗ , entonces (a, b) = 1 sii a ∈ N kb∗ .

Demostración: Si b = c2 para cierto c ∈ k ∗ , entonces kb = k y la terna (c, 0, 1) es solución


de z 2 − ax2 − by 2 = 0. Luego (a, b) = 1, pero además a ∈ N kb∗ pues N kb∗ = N k ∗ = k ∗ , y
entonces vale la Proposición.
Si no ocurriera eso, sea β una raiz cuadrada de b. Todo elemento ξ ∈ kb se puede escribir
de la forma ξ = z + βy, con y, z ∈ k. Se tiene que N (ξ) = z 2 − by 2 . Entonces, si a ∈ N kb∗ ,
podremos escribirlo como a = z 2 −by 2 con lo cual (z, 1, y) es raiz de la ecuación y (a, b) = 1.
Recı́procamente, si (a, b) = 1, tomemos una raiz (z, x, y) de la ecuación. Debe ocurrir que
x 6= 0 pues si lo fuera entonces b serı́a un cuadrado y supusimos que no lo era. Entonces,
z/x, 1, y/x) es también solución de la ecuación, y deducimos que

z2 y2
a= − b ∈ N kb∗ .
x2 x2

Proposición 3.3. El sı́mbolo de Hilbert satisface las siguientes propiedades ∀a, b, c ∈ k:


(i) (a, b) = (b, a) y (a, 1) = 1 (luego (a, c2 ) = 1);
(ii) (a, −a) = (a, 1 − a) = 1;
(iii) Si (a, b) = 1 entonces (ac, b) = (c, b) (más aún, (ac, b) = (a, b)(c, b));
(iv) (a, b) = (a, −ab) = (a, (1 − a)b).
7
Los cuerpos locales son aquellos cuerpos que poseen una función valor absoluto no trivial, y son
localmente compactos respecto a dicho valor absoluto. Por ejemplo, todas las extensiones Qp o R
Los Números p-ádicos y el Teorema de Hasse-Minkowski 15

Demostración: (i) (a, b) = (b, a) es trivial; para ver que (a, 1) = 1 basta notar que (c, 0, c)
es solución de la ecuación para cualquier c ∈ k ∗ .
(ii) Si b = −a, (0, 1, 1) es solución. Y si b = 1 − a, (1, 1, 1) lo es.
(iii) Si (a, b) = 1 entonces a ∈ N kb∗ por la Proposición anterior. Como N kb∗ es un subgrupo
de k ∗ (multiplicativo), resulta que c ∈ N kb∗ sii ac ∈ N kb∗ , lo cual traducido en términos del
sı́mbolo de Hilbert es justamente lo que querı́amos probar.
(iv) Como (a, −a) = 1, usando (iii) obtenemos que (a, b) = (a, −ab). Y usando que
(a, 1 − a) = 1 y (iii) se llega a que (a, b) = (a, (1 − a)b). 

A continuación presentamos un resultado muy importante a los efectos de calcular el


sı́mbolo (a, b). Pero antes, necesitaremos el siguiente Lema:

Lema 3.4. Sea v ∈ U . Si la ecuación z 2 − px2 − vy 2 = 0 tiene solución no trivial en Qp ,


entonces tiene una solución (z, x, y) que verifica z, y ∈ U , x ∈ Zp .

Demostración: Por la Proposición 2.13 sabemos que existe una solución primitiva de la
ecuación (z, x, y), en (Zp )3 . Si no cumpliera las condiciones que queremos, entonces y o z es
divisible por p. Pero por ser solución, sabemos que z 2 − vy 2 es múltiplo de p, y v no, luego
deberı́a ocurrir que ambos (z e y) sean múltiplos de p. Entonces, p2 | (z 2 − vy 2 ) = px2 luego
p | x, absurdo pues la solución era primitiva. Por lo tanto, (z, x, y) verifica las condiciones
buscadas. 

Teorema 3.5. Si k = R, se tiene que



1, si a > 0 ó b > 0;
(a, b) =
−1, si a, b < 0.

Si k = Qp y escribimos a a y b en la forma pα u, pβ v, con u, v ∈ U , entonces se tiene que


 u β v α
(−1)αβε(p)( p ) ( p ) , si p 6= 2;
(a, b) = ε(u)ε(v)+αω(v)+βω(u)
(−1) , si p = 2.
u

donde p
denota el sı́mbolo de Legendre de u respecto de p, y las expresiones ve(x), ω(x),
x−1 x2 −1 8
representan el resto módulo dos de las expresiones 2
, 8 , respectivamente.

Demostración: El caso k = R es trivial, se deduce del hecho de que un número es un


cuadrado en R si y sólo si es positivo.
Supongamos ahora k = Qp , p 6= 2. Es claro que sólo nos interesa el resto de α, β módulo
2. Pero además, como el sı́mbolo de Hilbert es simétrico, basta con considerar sólo 3 casos:
1) α = 0, β = 0:
Resulta evidente, por la paridad de los exponentes, que (a, b) = (pα u, pβ v) = (u, v). Y el
8
De hecho, una versión más general de este Teorema vale también: Si k es cualquier cuerpo local, tal
que su cuerpo de residuos tiene caracterı́stica impar, sean a, b ∈ k ∗ . Escribimos a = π m u, b = π n v con
m, n ∈ Z y u, v ∈ O∗ . Entonces se tiene que

(a, b) = (−1)mn(q−1)/2 χ(ũ)χ(ṽ)

donde q es el tamaño del cuerpo de residuos y χ su caracterı́stica cuadrática.


Los Números p-ádicos y el Teorema de Hasse-Minkowski 16

lado derecho de la igualdad a probar es claramente 1; veamos entonces que (u, v) = 1. Como
Corolario del Teorema de Chevalley-Warning en 6.1, se obtiene que toda forma cuadrática
sobre 3 o más variables tiene una solución no trivial módulo p. Al ser el discriminante de
esta forma una unidad, por el Corolario 2.17 obtenemos a partir de dicha solución una en
Qp . Luego (u, v) = 1.
2) α = 1, β = 0:
Reemplazando con estos valores en la fórmula a probar, basta ver que (pu, v) = vp . Pero


ya hemos visto que (u, v) = 1, entonces (pu, v) = (p, v) por la propiedad (iii) del sı́mbolo
de Hilbert. Debemos probar entonces que
v
(p, v) =
p
Recordemos, por el Teorema 2.23, que v es un cuadrado sii vp = 1. Si v fuera cuadrado


perfecto, entonces (p, v) = 1 por la propiedad (i) del sı́mbolo, y vp = 1 por lo recien


mencionado; se da la igualdad. En caso contrario, tenemos que vp = −1. Mirando la




ecuación z 2 − px2 − vy 2 = 0 vemos que si tuviera solución no trivial, entonces por el Lema
z 2

anterior tendrı́a una con z, y ∈ U . Esto implicarı́a que v ≡ y mod p, absurdo pues v
no era cuadrado. Por lo tanto la ecuación no tiene solución, y luego (p, v) = −1 = vp .


3) α = 1, β = 1:
Este caso se reduce a probar la fórmula (pu, pv) = (−1)(p−1)/2 up vp . Por la propiedad (iv)
 

del sı́mbolo, tenemos que (pu, pv) = (pu, −pupv) = (pu, −p2 uv)  = (pu, −uv), y −uv ∈ U .
Usando el caso 2) llegamos a que (pu, pv) = (pu, −uv) = −uv p
. Finalmente,
        
−uv −1 u v (p−1)/2 u v
= = (−1)
p p p p p p
como querı́amos ver.
Ahora sea p = 2. Como en el caso anterior, sólo consideraremos tres posibilidades:
1) α = 0, β = 0:
u−1 v−1
Traduciendo la fórmula a probar, hay que ver que (u, v) = (−1) 2 2 . Es decir, que
(u, v) = 1 si u o v es congruente a 1 mod 4, y -1 en caso contrario. Supongamos que
u ≡ 1 mod 4, entonces u ≡ 1 o 5 mod 8. En el primer caso, por el Teorema 2.25 ten-
emos que u es un cuadrado, luego (u, v) = 1. Si u ≡ 5 mod 8, como v es coprimo con 2
resulta que 4v ≡ 4 mod 8. Entonces u + 4v ≡ 1 mod 8, luego u + 4v es un cuadrado.
Supongamos que w2 = u + 4v, w ∈ U ; se ve en este caso que (w, 1, 2) es solución de la
ecuación z 2 − ux2 − vy 2 = 0, con lo cual (u, v) = 1. Finalmente, si u ≡ v ≡ −1 mod 4,
supongamos que (u, v) = 1. Entonces existe una solución primitiva (z, x, y) de la ecuación
z 2 − ux2 − vy 2 = 0. Reduciendo módulo 4, x2 + y 2 + z 2 ≡ 0 mod 4, y como los únicos
cuadrados módulo 4 son 0 y 1, esto implica que x2 , y 2 y z 2 son 0 mod 4. Pero entonces
los 3 elementos de la terna (z, x, y) son múltiplos de 2, contradiciendo el hecho de que era
primitiva. Absurdo; por lo tanto (u, v) = −1.
2) α = 1, β = 0:
2
u−1 v−1
+ v 8−1
Dados los valores de α y β, hay que probar que (2u, v) = (−1) 2 2 . Primero probe-
v 2 −1
mos que (2, v) = (−1) 8 , es decir, que (2, v) = 1 sii v ≡ ±1 mod 8:
Si (2, v) = 1 entonces por el Lema anterior existen x, y, z ∈ Z2 tales que z 2 − 2x2 − vy 2 = 0
y y, z no múltiplos de 2. Esto implica que y 2 ≡ z 2 ≡ 1 mod 8, y entonces 1 − 2x2 − v ≡ 0
Los Números p-ádicos y el Teorema de Hasse-Minkowski 17

mod 8. Pero los únicos cuadrados módulo 8 son 0, 1 y 4; deducimos de esto que v ≡ ±1
mod 8. Recı́procamente, si v ≡ 1 mod 8, es un cuadrado y luego (2, v) = 1; y si v ≡ −1
mod 8, la ecuación z 2 − 2x2 − vy 2 = 0 tiene a (1, 1, 1) como solución módulo 8. Por el
Corolario 2.17 tenemos que esta solución da lugar a una en Z2 , entonces (2, v) = 1.
Probemos ahora que (2u, v) = (2, v)(u, v), suficiente para lo que necesitamos puesto que
u−1 v−1
por el caso 1), (u, v) = (−1) 2 2 . Si (2, v) = 1 o (u, v) = 1, esto vale por la Propiedad
(iii) del sı́mbolo. En caso contrario, supongamos que (2, v) = (u, v) = −1. De los resultados
anteriores, y del caso 1), esto equivale a decir que v ≡ 3 mod 8 y u ≡ 3 o − 1 mod 8.
Luego la ecuación z 2 − 2ux2 − vy 2 = 0 se lee módulo 8 como

z 2 + 2x2 − 3y 2 ≡ 0 ó z 2 − 6x2 + 5y 2 ≡ 0

Ambas tienen como solución a (1, 1, 1); como antes, esta da lugar a una solución en Z2 , por
lo tanto (2u, v) = 1 = (−1)(−1) como querı́amos ver.
3) α = 1, β = 1:
Debemos ver que
2 2
u−1 v−1
+ v 8−1 + u 8−1
(2u, 2v) = (−1) 2 2

Por la Propiedad (iv) del sı́mbolo de Hilbert, sabemos que (2u, 2v) = (2u, −4uv) =
(2u, −uv). Pero además, por el caso anterior sabemos que como −uv ∈ U ,
u−1 −uv−1 (−uv)2 −1
+
(2u, 2v) = (2u, −uv) = (−1) 2 2 8

Resta observar que, si hacemos las cuentas,


(u − 1) (v − 1) v 2 − 1 u2 − 1 (u − 1) (−uv − 1) (−uv)2 − 1
     2 
u −1
+ + − + = (1+2v−v 2 )
2 2 8 8 2 2 8 8
lo cual resulta evidentemente ≡ 0 mod 2 (ya que como v ≡ 1 mod 2, entonces (1 + 2v −
v 2 ) ≡ 0 mod 2 ). Y esto implica la fórmula que se debı́a probar, pues la resta en la ecuación
de arriba es entre los dos exponentes en cuestión (el que querı́amos probar, y el que tenı́amos
como válido). 

Observar que la generalización de la propiedad (iii) en la Proposición 3.3 implica que el


sı́mbolo de Hilbert es bilineal. Pero de hecho vale lo siguiente:
Teorema 3.6. El sı́mbolo de Hilbert es una forma bilineal simétrica no degenerada sobre
el F2 -espacio vectorial k ∗ /k ∗ 2
Nota: Fq representa un cuerpo de q elementos.
Demostración: El hecho de que sea bilineal se deduce inmediatamente de la expresión
probada en el Teorema anterior, y del hecho de que las aplicaciones ε, ω : U → Z/2Z dadas
2
por ε(u) = u−1
2
, ω(u) = u 8−1 (que son las que aparecen en los exponentes) son morfismos.
La no degeneración se prueba tomando un sistema de representantes para el grupo Q∗p /Q∗p 2
según los Corolarios 2.24 y 2.26, y encontrando para cada uno de los elementos no neutros
a algún otro elemento b tal que (a, b) = −1. Esto se puede hacer fácilmente dado que los
grupos en cuestión tienen 4 u 8 elementos (dependiendo de si p 6= 2 o p = 2), es por eso
que consideramos innecesario presentar los detalles aquı́. .

Este teorema tiene como consecuencia inmediata lo siguiente:


Los Números p-ádicos y el Teorema de Hasse-Minkowski 18

/ k ∗ 2 entonces N kb∗ es un subgrupo de ı́ndice 2 de k ∗ .


Corolario 3.7. Si b ∈

Demostración: Simplemente definimos el morfismo φb : k ∗ → {±1} mediante φb (a) =


(a, b), y resulta evidente que N kb∗ = ker φb . El hecho de que el sı́mbolo sea no degenerado im-
plica que φb sea suryectiva. Luego por el Primer Teorema del Isomorfismo, k ∗ /N kb∗ ∼ = {±1},
y esto implica lo que querı́amos probar. 

Si escribimos (a, b) = (−1)[a,b] , entonces [a, b] es una forma bilineal simétrica sobre k ∗ /k ∗ 2 ,
con valores en Z/2Z, y podemos conocer (mediante el Teorema 3.5) su matriz en cierta base
para k ∗ /k ∗ 2 :

Si k = R, la matriz es (1).

Si k = Qp , p 6= 2, y consideramos la base {p, u} (tal que u no sea resto cuadrático


mod p) entonces la matriz es
  
0 1
, si p ≡ 1 (mod 4);


 1 0 

1 1
, si p ≡ 3 (mod 4).


1 0

Si k = Q2 , fijando la base {2, −1, 5} la matriz resulta ser


 
0 0 1
 0 1 0 
1 0 0

3.2. Propiedades globales


Como hemos notado anteriormente, el cuerpo de los números racionales Q se puede con-
siderar como un subcuerpo de todos los Qp y de R. Entonces, dados a, b ∈ Q∗ , denotaremos
(a, b)p al sı́mbolo de Hilbert respecto de Qp de sus imágenes allı́ (y análogamente con (a, b)∞
para R). Por comodidad de notación, definimos también V como el conjunto de números
primos junto con el sı́mbolo ∞, llamando naturalmente Q∞ = R; ası́ notamos a todas las
extensiones de Q aquı́ consideradas como Qv , para algún v ∈ V .

El que sigue es un resultado fundamental del sı́mbolo de Hilbert que, junto con otro
teorema a continuación conforman lo que hemos llamado Propiedades Globales del sı́mbolo
de Hilbert (la palabra globales surge de considerar todos los sı́mbolos de Hilbert de los
distintos cuerpos en cuestión y relacionarlos).

Teorema 3.8 (Hilbert). Si a, b ∈ Q∗ , entonces (a, b)v = 1 ∀v ∈ V salvo finitos, y además


Y
(a, b)v = 1
v∈V
Los Números p-ádicos y el Teorema de Hasse-Minkowski 19

Nota: Esta es la llamada fórmula del producto para el sı́mbolo de Hilbert.


Demostración: 9 Por la bilinealidad del sı́mbolo de Hilbert (bilinealidad ”multiplicativa”),
basta con probar el Teorema para el caso en el que a, b son -1 o un número primo. Entonces,
por simetrı́a, basta con considerar sólo 3 casos, y en cada uno de ellos podremos calcular
los sı́mbolos de Hilbert mediante el Teorema 3.5 (serı́a util tener presentes las fórmulas que
dicho Teorema da para el cálculo del sı́mbolo de Hilbert):
1)a = −1, b = −1: Es claro que (−1, −1)∞ = −1. Para los demás v, vemos que la
escritura de a, b en la forma v α u, respectivamente, está dada por α = 0, u = −1. Luego
(−1, −1)v = 1 si v 6= 2. Y como ε(−1) = 1, resulta que (−1, −1)2 = −1; se verifica
inmediatamente el enunciado del Teorema.
2) a = −1, b = l, con l primo: Si l = 2, es claro que (−1, 2)v = 1 cuando v 6= 2 (pues
la descomposición de l en la forma v α u se da con α = 0). Y si v = 2, α = 1 y u = 1, pero
como ω(−1) = 0 y ε(u) = 0 resulta también que (−1, 22 = 1.
Para l 6= 2, si tuviéramos que v 6= 2, l entonces α = 0 y u = l, luego (−1, l)v = 1. O sea que
son todos 1, salvo tal vez para v = 2 ó v = l. Pero en esos casos uno ve que α = 0, u = l si
v = 2, en cuyo caso (−1, l)2 = (−1)ε(l) ; o bien α = 1, u = 1 cuando v = l, se tiene entonces
que (−1, l)l = (−1)ε(l) . Se verifica luego que (−1, l)2 = (−1, l)l , por lo tanto el producto
sobre todos los v da efectivamente 1.
3) a = l, b = l0 , con l, l0 primos: Si l = l0 entonces por la Propiedad (iv) del sı́mbolo de
Hilbert se ve que (l, l)v = (l, −l2 ) = (l, −1), y queda reducido al caso anterior. Supongamos
entonces que l 6= l0 . En general escribiremos l = v α u, l = v β u0 para v 6= ∞ (es claro
que (l, l0 )∞ = 1), la descomposición usual. Si alguno de ellos fuera 2, por ejemplo l0 = 2,
entonces puede pasar que:
(i) v 6= 2, l: En este caso α = β = 0 y luego (l, 2)v = 1 para todos esos v;
(ii) v = 2: Esto implica α = 0, β = 1, u0 = 1, y tenemos ε(u0 ) = 0 con lo cual (l, 2)2 =
(−1)ω(l)
(iii) v = l: Aquı́ se tiene α = 1, β = 0, u0 = 2, entonces (l, 2)l = 2l = (−1)ω(l) (para


justificar la última igualdad, ver Apéndice sobre Teorı́a de números, más especificamente
las propiedades del sı́mbolo de Legendre)
Se ve entonces que (l, 2)2 = (l, 2)l , y el producto da 1.
Finalmente, cuando l 6= l0 y ninguno de ellos es 2, se tiene para v 6= 2, l, l0 que α = β = 0,
0
luego (l, l0 )v = 1. Para v = 2, también vale que α = β = 0, luego (l, l0 )2 = (−1)ε(l)ε(l ) . Y
0
en los otroscasos, resulta evidente que α = 0, β = 1 o viceversa, de donde (l, l0 )l = ll ,
(l, l0 )l0 = ll0 . Utilizando la ley de reciprocidad cuadrática de Gauss, tenemos que

l0  l  0
(l, l0 )l (l, l0 )l0 = 0
= (−1)ε(l)ε(l )
l l
Por lo tanto al multiplicar con (l, l0 )2 da 1. 

A continuación plantearemos una especie de ecuación, cuyos únicos datos son ciertos
sı́mbolos de Hilbert, y hallaremos (bajo ciertas hipótesis que son obligadas) condiciones
necesarias y suficientes para su solución. (Notar que el resultado siguiente esta muy rela-
9
El único caso realmente interesante de la demostración es cuando a y b son primos impares distintos,
demostrado al final. Es por esto que escencialmente este Teorema es equivalente a la ley de reciprocidad
cuadrática. Y es importante mencionar además que es posible generalizar el Teorema para el conjunto de
cuerpos de números algebráicos, de ahı́ su importancia.
Los Números p-ádicos y el Teorema de Hasse-Minkowski 20

cionado con hallar una solución en Q para cierta forma cuadrática, dado que existen solu-
ciones en cada Qv ):

Teorema 3.9. Sea (ai )i∈I una familia finita de elementos en Q∗ , y sea (εi,v )i∈I,v∈V una
familia de números en {±1}. Entonces existirá un x ∈ Q∗ tal que (ai , x)v = εi,v ∀i ∈ I, v ∈
V si y sólo si se satisfacen las siguientes tres condiciones:
(i) Los εi,v son todos iguales a 1,Q salvo finitos.
(ii) Para todo i ∈ I se tiene que v∈V εi,v = 1
(iii) Para todo v ∈ V existe un xv ∈ Q∗v tal que (ai , xv )v = εi,v para todo i ∈ I.

Para la demostración necesitaremos dos lemas, a saber:

Lema 3.10. (Teorema


Q de aproximación) Sea S un subconjunto finito de V . Entonces la
imagen de Q en v∈S Qv es densa en dicho producto.

Lema 3.11 (Dirichlet). Si a, m ∈ N son coprimos, entonces existen infinitos primos p


tales que p ≡ a (mod m).

Demostración: (del Teorema) Es claro que las condiciones son necesarias: las primeras
dos por la fórmula del producto del sı́mbolo de Hilbert, la tercera tomando por ejemplo
xv = x. Probemos entonces la vuelta: sean (εi,v ) que satisfacen las hipótesis del Teorema,
y supongamos que los ai son todos enteros (se puede, pues podemos multiplicarlos por su
denominador al cuadrado, lo cual deja invariante los sı́mbolos de Hilbert). Definamos S
como el conjunto de los factores primos de los ai junto con 2 y ∞, y T := {v ∈ V : ∃i ∈
I con εi,v = −1}.
Caso 1) S ∩ T = ∅
Sean Y
a= l
l∈T \{∞}
Y
m=8 l
l∈S\{2,∞}

Al ser S y T finitos, estos enteros están bien definidos. Como S ∩ T = ∅ se tiene que a y m
son coprimos. Luego por Dirichlet, existe p primo tal que p ≡ a mod m, tal que p ∈ / S ∪T.
Veamos que x = ap verifica las condiciones requeridas (o sea, que (ai , x)v = εi,v para todos
i ∈ I, v ∈ V ):
Si v ∈ S ⇒ v ∈ / T ⇒ εi,v = 1; debemos ver que (ai , x) = 1. Para v = ∞, esto es verdad
pues x > 0; si v = l es un número primo, x ≡ ap ≡ a2 mod m, luego por definición de m
tenemos que: cuando l = 2 x ≡ a2 mod 8; y cuando l 6= 2 x ≡ a2 mod l. Notar que x y
a son unidades l-ádicas (ver definición de x, a y m). Pero además, si escribimos x = ln u
resulta n = 0 y la imagen de u = x en Fl∗ es justamente a2 mod l, un resto cuadrático,
luego por el Teorema 2.23 x es un cuadrado en Q∗l . Por lo tanto, (ai , x)v = 1 = εi,v en este
caso.
Cuando v ∈ / S (llamemos v = l), se tiene que ai es una unidad l-ádica para cada i ∈ I.
Luego aplicando el Teorema 3.5 se obtiene que
ai vl (b)
(ai , b)l =
l
Los Números p-ádicos y el Teorema de Hasse-Minkowski 21

para cualquier b ∈ Q∗l .


Si l ∈ / T y l 6= p entonces también resulta que x es una unidad l-ádica, luego vl (x) = 0 y
entonces utilizando la fórmula anterior llegamos a que (ai , x)l = 1, que es igual a εi,v ya
que l ∈ / T.
Si l ∈ T entonces l | a luego vl (x) = vl (a) + vl (p) = 1 + 0 = 1. Utilizando la hipótesis
(iii) tenemos que ∃xl ∈ Q∗l tal que (ai , xl )l = εi,l ∀i ∈ I. Al ser que l ∈ T , existirá algún
εi,l = −1, con lo cual vl (xl ) ≡ 1 mod 2 (debido a la fórmula presentada para el cálculo de
(ai , b)l ). Pero entonces,
 
ai
(ai , x)l = = (ai , xl )l = εi,l para todo i ∈ I
l

como querı́amos.
Para l = p, utilizando la fórmula del producto (y la hipótesis (ii)) para despejar los términos
con v = p, obtenemos que:
Y Y
(ai , x)p = (ai , x)v = εi,v = εi,p
v6=p v6=p

Luego queda probado el Teorema en el caso S ∩ T = ∅.


Caso 2) S ∩ T 6= ∅
∗2 ∗ ∗2
Q
Sabemos que Q v es un subgrupo abierto de Qv . Luego por ser S finito, v∈S Qv es
abierto en v∈S Q∗v . Ahora bien, tenemos xv ∈ Q∗v que verifican la hipótesis (iii), luego
Q
por el Teorema de Q Aproximación presentado antes de la demostración, como la imagen de
Q∗ es densa en v∈S Q∗v , existirá un x0 ∈ Q∗ tal que x0 /xv ∈ Q∗v 2 ∀v ∈ S. En particular
tenemos que (ai , x0 )v = (ai , xv )v = εi,v para tovo v ∈ S. Sean ηi,v = εi,v (ai , x0 )v . Entonces la
familia de números (ηi,v ) verifica claramente las tres hipótesis (i), (ii), (iii). Pero más aun,
si v ∈ S entonces ηi,v = εi,v (ai , x0 )v = εi,b 2 = 1. Esto nos dice que si definimos S y T para
esta nueva familia, entonces S queda igual ya que son los mismos ai , y T resulta disjunto
con S (pues para estar en T debı́a ocurrir que para algún i, ηi,v = −1). Luego por el caso
anterior, existirá y ∈ Q∗ tal que (ai , y)v = ηi,v para todo i ∈ I y v ∈ V . Definimos entonces
x = yx0 , y luego
(ai , x)v = (ai , y)v (ai , x0 )v = ηi,v (ai , x0 )v = εi,v
por lo tanto x verifica las condiciones requeridas. 
Los Números p-ádicos y el Teorema de Hasse-Minkowski 22

4. Formas cuadráticas
El objetivo de esta sección es estudiar y caracterizar las formas cuadráticas sobre los
cuerpos Qv y Q. Para eso, estudiaremos las propiedades de los módulos cuadráticos en gen-
eral, y luego las traduciremos al lenguaje corriente de formas cuadráticas. Al terminar con
las propiedades básicas y los importantes teoremas de representación de un número a través
de una forma cuadrática, nos dedicaremos a estudiar más especı́ficamente las propiedades
de estas sobre Qp y sobre R.

4.1. Módulos cuadráticos


Definición 4.1. Sea V un A-módulo, con A un anillo conmutativo. Una función Q : V →
A es una forma cuadrática sobre V si se satisfacen las siguientes condiciones:
(i) Q(ax) = a2 Q(x) ∀a ∈ A, x ∈ V ;
(ii) La función B(x, y) = Q(x + y) − Q(x) − Q(y) es una forma bilineal.
Un par (V, Q) con dichas propiedades se llama módulo cuadrático.

En esta sección nos limitaremos al caso de que A sea un cuerpo k de caracterı́stica


distinta de 2. Entonces el A-módulo V resulta ser un k-espacio vectorial, que supondremos
que será de dimensión finita.
Vale la pena observar que la definición surge de la relación entre la norma y el producto
interno en un espacio vectorial: están mutuamente determinados, justamente por la fórmula
(ii) de la definición (en realidad multiplicando por 1/2 el lado derecho). Y aprovechando
esto, definiremos el producto escalar asociado a Q mediante

x.y := (Q(x + y) − Q(x) − Q(y))/2

(tiene sentido dividir por 2 pues excluimos a los cuerpos de caracterı́stica 2). Observar
que con esta definición resulta ser efectivamente un producto escalar, ya que al ser + con-
mutativa, la forma bilineal de la definición es simétrica. Y además, se tiene que Q(x) = x.x.

Definición 4.2. Si (V, Q) y (V 0 , Q0 ) son dos módulos cuadráticos, una función f : V →


V 0 es un morfismo de módulos cuadráticos (o morfismo métrico, para simplificar) si
Q0 ◦ f = Q.

Observar que esta condición implica que f (x).f (y) = x.y ∀x, y ∈ V .

Si fijamos una base (ei )1≤i≤n para V , llamamos matriz de Q respecto de esta base a
) ∈ k nxn dada por aij = ei .ej . Es claro que A es simétrica, y además si
la matriz A = (aijP
escribimos a x = ni=1 xi ei en la base fijada, entonces se tiene que
X
Q(x) = aij xi xj
i,j

y ahora vemos que la definición dada al principio coincide con la idea intuitiva de forma
cuadrática que uno tenı́a.
Los Números p-ádicos y el Teorema de Hasse-Minkowski 23

En este contexto surge el primer invariante de las formas cuadráticas, al cual llamaremos
discriminante de Q y estará dado por

^ ∈ k ∗ /k ∗ 2
d(Q) := det(A)

donde la tilde denota la imagen de det(A) en el conjunto de clases de restos cuadráticos


(para la definición estamos suponiendo que det(A) 6= 0; si esto ocurriera, decimos que
disc(Q) = 0) . La buena definición surge de lo siguiente: si cambiáramos la base mediante
la matriz cambio de base (invertible) X ∈ Glk (n), entonces la matriz de Q en esta nueva
base no serı́a otra cosa que A0 = XAX t . Pero entonces det(A0 ) = det(A) det(X)2 , y justa-
mente det(X)2 ∈ k ∗ 2 (es no nulo por ser X es invertible).

Diremos que dos elementos x, y ∈ V son ortogonales (respecto a Q) si x.y = 0. Si


H ⊆ V , definimos su complemento ortogonal H 0 := {y ∈ V : h.y = 0 ∀h ∈ H},
que claramente es un subespacio vectorial de V . Diremos que dos subespacios V1 , V2 son
ortogonales si V1 ⊆ V20 (i.e., si dados v1 ∈ V1 , v2 ∈ V2 ⇒ v1 .v2 = 0). El complemento
ortogonal de todo el espacio V , V 0 , es llamado radical de V , y se denota rad(V ). Definimos
entonces el rango de Q como

rank(Q) := dim V − dim(rad(V ))

Diremos que Q es no-degenerada si V 0 = 0, lo cual equivale a decir que d(Q) 6= 0 (esto se


verá después).

Definición 4.3. Sean U1 , . . . , Um subespacios de V . Diremos que V es la suma directa


ortogonal de ellos si son todos ortogonales entre sı́, y además V es suma directa de ellos.
Se nota como:
V = U1 ⊕ˆ . . . ⊕U
ˆ m
P
En primer lugar, si escribimos x = xi , donde xi son sus componentes en Ui , entonces
se tiene que
Q(x) = Q1 (x1 ) + . . . + Qm (xm )
donde Qi denotan las restricciones de Q a cada Ui . Pero recı́procamente, si tenemos una
familia de módulos cuadráticos (Ui , Qi ), podemos construir la forma cuadrática que resulta
suma directa de las Qi mediante la fórmula de arriba, obteniendo ası́ el módulo cuadrático
( ˆ Ui , Q).
L
Por otro lado, es claro que si U ⊆ V es sumplementario de rad(V ), entonces V =
ˆ
U ⊕rad(V ).

Proposición 4.4. Sea (V, Q) un módulo cuadrático no degenerado. Entonces,


(i) Todos los morfismos métricos que partan de V son inyectivos.
(ii) Para todo subespacio U de V se tiene que

U 00 = U, dim U + dim U 0 = dim V, rad(U ) = rad(U 0 ) = U ∩ U 0 .

Además, el módulo cuadrático U es no-degenerado si y sólo si U 0 lo es, y si esto pasa se


ˆ 0.
tiene que V = U ⊕U
(iii) Si V es suma directa ortogonal de dos subespacios, entonces son no-degenerados.
Los Números p-ádicos y el Teorema de Hasse-Minkowski 24

Demostración:
(i) Sea f : V → V 0 un morfismo métrico, con (V 0 , Q0 ) un módulo cuadrático. Para ver
que f es inyectiva, supongamos que f (x) = 0. Entonces dado y ∈ V , x.y = f (x).f (y) = 0
por ser f morfismo. Esto es decir que x ∈ rad(V ) (es ortogonal a todos), pero como V era
no degenerado, x = 0. Luego f es inyectiva.
(ii) Sea U un subespacio de V . Definamos el morfismo qU : V → U ∗ (donde U ∗ es el dual
de U ) que aplica y ∈ U al funcional lineal en U g(x) = x.y. Es claro que el núcleo de qU es
U 0 . En particular, al ser V no degenerado, qV : V → V ∗ es un isomorfismo (su núcleo seria
rad(V ) = 0).
Vemos que podemos obtener qU componiendo qV con la proyección canónica de V ∗ a U ∗ .
Luego qU : V → U ∗ resulta ser suryectiva. Entonces, considerando la inclusión de U 0 en V
obtenemos la siguiente sucesión exacta

0 → U0 → V → U∗ → 0

de donde dim V = dim U 0 + dim U ∗ = dim U 0 + dim U . Aplicando este proceso para el
subespacio U 0 , se llegarı́a a la fórmula dim V = dim U 00 + dim U 0 , la cual junto con la
anterior implica que dim U = dim U 00 . Pero por definición de U 0 , tenemos que U ⊆ U 00
(los elementos de U son ortogonales a los de U 0 , luego están en U 00 ), por lo tanto U = U 00 .
Veamos ahora que rad(U ) = U ∩ U 0 (lo cual, junto con el hecho anterior, nos dirá también
que rad(U 0 ) = U ∩U 0 ): x ∈ rad(U ) si y sólo si x ∈ U y x es ortogonal a todos los elementos
de U . Es decir, si y sólo si x ∈ U y x ∈ U 0 , y listo.
Un módulo cuadrático es no degenerado si y sólo si su rad es nulo. Puesto que rad(U ) =
rad(U 0 ), la no degeneración de U implica la de U 0 y viceversa. En el caso en que lo sean,
tenemos que dim U + dim U 0 = dim V , y U ∩ U 0 = rad(U ) = 0 luego V = U ⊕ U 0 . Por
definición de U 0 , la suma directa es también ortogonal.
(iii) Si V = U1 ⊕U ˆ 2 entonces U2 ⊆ U10 por ser la suma ortogonal. Pero dim U2 =
dim V − dim U1 = dim U10 luego U2 = U10 . Ahora bien, vemos que si x ∈ rad(U1 ) entonces
es ortogonal a todos los de U1 . Pero por estar en U1 , es ortogonal a todos los de U10 . Luego
es ortogonal a todo elemento de U1 ⊕U10 = V , entonces x = 0 ya que V era no degenerado. 

Definición 4.5. Dado un módulo cuadrático (V, Q), diremos que un elemento x es isotrópi-
co si Q(x) = 0. Un subespacio U es isotrópico si todos sus elementos lo son. Finalmente,
diremos que el módulo cuadrático es isotrópico si existe algún elemento isotrópico no nulo
x∈V.

Es claro que U es isotrópico si y sólo si U ⊆ U 0 , lo cual equivale a decir que la restricción


de Q a U es la forma cuadrática nula.

Definición 4.6. Un módulo cuadrático que tiene una base formada por dos elementos
isotrópicos x, y no ortogonales es llamado un plano hiperbólico.

Se puede suponer sin pérdida de generalidad que x.y = 1, en cuyo caso la matriz del
plano hiperbólico en la base x, y resulta ser
 
0 1
1 0
Los Números p-ádicos y el Teorema de Hasse-Minkowski 25

con d(Q) = −1. Observar que es el ejemplo más pequeño posible (no trivial) de un
módulo cuadrático isotrópico. El siguiente inesperado resultado muestra que todo módulo
cuadrático isotrópico debe contener un plano hiperbólico como subespacio:

Proposición 4.7. Sea x ∈ V un elemento isotrópico no nulo, donde (Q, V ) es no-degenerado.


Entonces existe un subespacio U de V que contiene a x y es un plano hiperbólico.

Demostración: Al ser V no degenerado, existe z ∈ V tal que x.z 6= 0. Podemos suponer,


mediante el producto por un escalar, que x.z = 1. Sea y = 2z − (z.z)x. Entonces, y es
isotrópico, pues

y.y = 4(z.z) + (z.z)2 (x.x) − 4(z.z)(z.x) = 4(z.z) + 0 − 4(z.z) = 0

y además, haciendo las cuentas, x.y = 2. Luego el subespacio kx + ky es un plano hiperbóli-


co. 

Corolario 4.8. Si (V, Q) es isotrópico, entonces Q(V ) = k.

Demostración: Por la Proposición anterior, basta con demostrarlo para V un plano


hiperbólico. Supongamos que una base para V es x, y, con x, y isotrópicos y x.y = 1. En-
tonces dado a ∈ k, resulta que a = Q(x + a2 y); por lo tanto Q(V ) = k. 

Teorema 4.9. Todo módulo cuadrático (V, Q) admite una base de elementos ortogonales
dos a dos (i.e., base ortogonal).

Demostración: Probemos el resultado por inducción en n = dim V . El caso n = 1


es trivial. Ahora supongamos que dim V = n. Si V fuera isotrópico (i.e., todos sus ele-
mentos isotrópicos), entonces cualquier base serı́a ortogonal ya que Q serı́a idénticamente
cero. Entonces supongamos que V no es isotrópico, luego existirá un e1 ∈ V tal que
e1 .e1 6= 0. El complemento ortogonal H de {e1 } tendrá entonces dimensión n − 1, puesto
que e1 ∈ / H por hipótesis. Al ser el subespacio ke1 no degenerado, resulta (Proposición
anterior) que V = ke1 ⊕H. ˆ Luego aplicando la hipótesis inductiva, tomamos una base or-
togonal (e2 , . . . , en ) para H, y la base (e1 , e2 , . . . , en ) de V resulta ser ortogonal. 

Este teorema ayuda mucho a comprender qué es lo que realmente pasa con las formas
cuadráticas, puesto que la matriz de Q en una base ortogonal no es otra cosa que una
matriz diagonal:  
a1 0 . . . 0
 0 a2 . . . 0 
 
 .. .. . . 
 . . . 0 
0 0 . . . an
xi ei , entonces Q(x) = a1 x21 + . . . + an x2n . Podemos reinterpretar la
P
Si escribimos x =
definición de módulo cuadrático no-degenerado: lo que se está diciendo realmente es que
ai 6= 0 ∀i = 1, . . . , n (es decir, que la forma cuadrática sea efectivamente en n variables).
Q Y
ahora resulta evidente que (V, Q) es no degenerada sii d(Q) 6= 0, pues d(Q) = ai .
Los Números p-ádicos y el Teorema de Hasse-Minkowski 26

Definición 4.10. Dos bases ortogonales de un mismo módulo cuadrático (V, Q) se di-
cen contiguas si tienen algún elemento en común (i.e., si las bases son (e1 , . . . , en ) y
(e01 , . . . , e0n ), deben existir i, j tal que ei = e0j ).

Teorema 4.11. Sea (V, Q) un módulo cuadrático no degenerado de dimensión n ≥ 3, y


sean e = (e1 , . . . , en ) y e’ = (e01 , . . . , e0n ) dos bases ortogonales de V . Entonces existe una
sucesión finita de bases ortogonales e(0) , e(1) , . . . , e(m) tales que e(0) = e, e(m) = e’ y e(j) es
contigua a e(j+1) para todo j = 0, . . . , m − 1.

Demostración: Dividiremos la prueba en tres casos:


1) (e1 .e1 )(e01 , e01 ) − (e1 .e01 )2 6= 0
Claramente, si llamamos P al plano ke1 + ke01 , la condición supuesta nos dice que e1 y e01
no pertenecen a rad(P ). Pero además, también nos dice que e1 no es un múltiplo de e01 y
viceversa. O sea que {e1 , e01 } es base para P , y como ningun de ellos está en rad(P ), debe
ser que rad(P ) = 0. Por lo tanto P es no degenerado. Luego, deben existir complementos
ortogonales para e1 y e01 de dimensión 1, es decir, ε2 , ε02 tales que

ˆ 2 = ke01 ⊕kε
P = ke1 ⊕kε ˆ 02 .

Llamemos H al complemento ortogonal de P . Como P es no degenerado, V = H ⊕P ˆ por


00 00
la Proposición 4.4. Sea (e3 , . . . , en ) una base ortogonal para H. Entonces, podemos hacer
contiguas a e y e’ mediante la cadena

e → (e1 , ε2 , e003 , . . . , e00n ) → (e01 , ε02 , e003 , . . . , e00n ) → e’

y vale el Teorema.
2) (e1 .e1 )(e02 , e02 ) − (e1 .e02 )2 6= 0
La prueba de este caso es exactamente la misma que en el 1), cambiando e01 por e02 .
3) (e1 .e1 )(e0i , e0i ) − (e1 .e0i )2 = 0 para i = 1, 2
Probemos primero que la condición supuesta implica que existe un x ∈ k tal que el elemento
ex := e01 + xe02 es no isotrópico, y genera junto con e1 un plano no degenerado:
La condición de no isotrópico se cumplirá si y sólo si ex .ex = e01 .e01 + x2 (e02 .e02 ) 6= 0, i.e.,
sii x2 6= −(e01 .e01 )/(e02 .e02 ). Y para que el plano que genera con e1 sea no degenerado debe
pasar, como antes, que (e1 .e1 )(ex , ex ) − (e1 .ex )2 6= 0. Desarrollando con la fórmula para
ex , y utilizando la condición supuesta, llegamos a el plano generado será no degenerado sii
−2x(e1 .e01 )(e1 .e02 ). Pero la hipótesis supuesta implica que (e1 .e0i ) 6= 0 para i = 1, 2. O sea
que basta con que x 6= 0.
Ası́, sólo tenemos que lograr que x 6= 0 y x2 6= −(e01 .e01 )/(e02 .e02 ). Esto excluye a lo sumo 3
valores de k para elegir, luego si k tiene más de 4 elementos, ya está. En el caso de k = F3 ,
como (e1 .e0i ) 6= 0 no queda otra que (e1 .e0i )2 = 1. Entonces la hipótesis 3) se reescribe como
(e1 .e1 )(e0i , e0i ) = 1, i = 1, 2. Pero entonces la expresión −(e01 .e01 )/(e02 .e02 ) es -1, y por lo tanto
basta tomar x = 1 para verificar las propiedades requeridas para ex .
Ahora podemos entonces tomar ex = e01 + xe02 no isotrópico, y tal que ke1 + kex es no
degenerado. Como ex es no isotrópico, existirá un e002 tal que (ex , e002 ) es una base ortogonal
para ke01 ⊕keˆ 02 . Sea
e” = (ex , e002 , e03 , . . . , e0n )
base ortogonal de V . Al ser ke1 + kex un plano no degenerado, podemos deducir de los
casos 1) y 2) que e y e” se relacionan mediante una cadena de bases contiguas. Como e”
Los Números p-ádicos y el Teorema de Hasse-Minkowski 27

es contigua a e’, el Teorema está probado. 

Sean (V, Q), (V 0 , Q0 ) dos módulos cuadráticos no degenerados, y sea U un subespacio


de V . Supongamos que s : U → V 0 es un morfismo métrico inyectivo. En el trabajo por
clasificar las formas cuadráticas surge la pregunta natural ¿cuándo será posible extender
s a una isometrı́a (isomorfismo métrico) entre V y V 0 ? La respuesta la da precisamente el
Teorema de Witt que se presenta a continuación:

Teorema 4.12. Si (V, Q) y (V 0 , Q0 ) son isomorfos (como módulos cuadráticos) y no de-


generados, entonces todo morfismo métrico inyectivo s : U → V , de cualquier subespacio
U de V , puede ser extendido a una isometrı́a de V en V 0 .

Demostración: Supondremos en gral que V = V 0 (ya que son isomorfos). Veamos los dos
casos:
Caso (i): U degenerado
Sea x 6= 0 un elemento de rad(U ), y tomemos l ∈ U ∗ tal que l(x) = 1. Al ser V no
degenerado, existe y ∈ V tal que l(u) = u.y (pues qV : V → V ∗ es isomorfismo). Podemos
suponer que y.y = 0, haciendo un corrimiento de y a y−λx con λ = 12 y.y; sigue valiendo que
l(u) = u.y debido a que x ∈ rad(U ). Entonces tenemos un nuevo subespacio U1 = U ⊕ ky
(notar que y ∈ / U pues si y ∈ U entonces l(x) = x.y = 0 ya que x ∈ rad(U ), pero l(x) era
1).
Al ser s morfismo métrico inyectivo, resulta que s(U ) es también degenerado. Luego apli-
camos la misma construcción para U 0 = s(U ), x0 = s(x) y l0 = l ◦ s−1 , y obtenemos y 0
y U10 = U 0 ⊕ ky 0 . Extendamos entonces s mediante la asignación s0 (y) = y 0 , y queda asi
determinado un morfismo métrico inyectivo s0 : U1 → V que coincide con s en U . Pero lo
bueno es que dim U1 = dim U + 1.
Si U1 fuera degenerado, repetimos este proceso. Si fuera no degenerado, pasamos al caso
(ii).
Caso (ii): U no degenerado
Probemos el Teorema por inducción en dim U . Si dim U = 1, U = kx con x ∈ V no
isotrópico (para que U sea no degenerado). Llamemos y = s(x); por ser s morfismo métrico
se tiene que y.y = x.x. Vemos que alguno de los elementos x+y, x−y debe ser no isotrópico,
pues si ambos lo fueran entonces

0 = Q(x + y) + Q(x − y) = 2(x.x) + 2(y.y) = 4(x.x)

luego x serı́a isotrópico. Supongamos sin pérdida de generalidad entonces que z = x + y


es no isotrópico. Llamemos H al complemento ortogonal de z; se tiene que V = kz ⊕H. ˆ
Además observar que (x + y).(x − y) = 0, luego x − y ∈ H. Definamos el automorfismo σ
como la simetrı́a respecto de H, es decir, la identidad en H y multiplicar por -1 en la coor-
denada de kz. Como x − y ∈ H, x + y ∈ kz, entonces σ(x − y) = x − y y σ(x + y) = −x − y.
Luego σ(x) = −y, y por lo tanto el automorfismo −σ extiende a s a todo V .
Si dim U > 1, descomponemos a U en U1 ⊕U ˆ 2 , con Ui 6= 0. Por hipótesis inductiva, la re-
stricción s1 de s a U1 se puede extender a un automorfismo σ1 de V . Si reemplazamos σ por
σ1−1 ◦ s vemos que se puede suponer que s es la identidad en U1 . Ahora usamos la hipótesis
para la restricción s2 de s a U2 : claramente, al ser s la identidad en U1 , s2 : U2 → V1 ,
donde V1 es el complemento ortogonal de U1 . Luego existirá un automorfismo σ2 de V1 que
extiende a s2 . Definimos entonces σ como la identidad en U1 , y σ2 en V1 . Es claro que σ
Los Números p-ádicos y el Teorema de Hasse-Minkowski 28

extiende a s a todo V y mantiene la condición de ser morfismo métrico. 

Corolario 4.13. Dos subespacios isomorfos de un módulo cuadrático no degenerado tienen


complementos ortogonales isomorfos.
Demostración: Simplemente extendemos el isomorfismo métrico entre dichos subespacios
a un automorfismo del espacio completo, y lo restringimos a los complementos ortogonales.


4.2. Propiedades generales


En esta sección interpretaremos los resultados presentados para módulos cuadráticos,
desde el punto de vista de formas cuadráticas (según la noción estandard, i.e. polinomio
homogéneo dePgrado 2 en n variables).
Sea f (X) = ni=1 aii Xi2 + 2 i<j aij Xi Xj una forma cuadrática en n variables sobre k.
P
Suponemos que aij = aji , de esta forma, la matriz de f A = (aij ) resulta simétrica. En-
tonces, según los términos de la sección anterior, (k n , f ) resulta un módulo cuadrático;
será llamado de hecho el módulo cuadrático asociado a f (o a su matriz A).

Definición 4.14. Diremos que dos formas cuadráticas f y f 0 son equivalentes si los
correspondientes módulos cuadráticos son isomorfos. Lo notaremos como

f ∼ f0

Si f (X1 , . . . , Xn ) y g(X1 , . . . , Xm ) son dos formas cuadráticas, definimos la suma (tam-


bién conocida como suma ortogonal) de f y g mediante la forma cuadrática

f u g := (X1 , . . . , Xn ) + g(X1 , . . . , Xm )

en n + m variables (ver la definición 4.3 para entender de donde surge la idea: en reali-
dad se realiza la suma directa de los módulos cuadráticos, definiendo la forma cuadrática
allı́ canónicamente). De manera natural, definiremos

f −̇g := f u (−g)

En general, se omitirá el puntito por comodidad de notación (siempre y cuando no haya


problemas).
Definición 4.15. Diremos que una forma cuadrática f representa a un determinado
elemento a ∈ k si existe x ∈ (k n )∗ tal que f (x) = a.
Observar que f representa a 0 si y sólo si su módulo cuadrático correspondiente es
isotrópico.
Reescribimos ahora la Definición 4.6:
Definición 4.16. Una forma cuadrática f (X1 , X2 ) se dice hiperbólica si se tiene

f ∼ X12 − X22
Los Números p-ádicos y el Teorema de Hasse-Minkowski 29

En ese caso, también se tendrı́a que f ∼ X1 X2 .

Y si interpretamos en este contexto la Proposición 4.7 y su Corolario obtenemos los


siguientes resultados, que traducen todos los problemas realtivos a números representables
por cierta forma cuadrática, a entender cúales son las formas cuadráticas isotrópicas (i.e.,
que representan a 0):

Proposición 4.17. Si f es no-degenerada y representa a 0, entonces se tiene que f ∼ f2 +g,


con f2 hiperbólica. Y además, f representa a todos los elementos de k.

Demostración: Es simplemente pasar a este lenguaje la Proposición 4.7, junto con su


Corolario 4.8. 

Corolario 4.18. Si g es una forma cuadrática en n − 1 variables, y a ∈ k ∗ , entonces son


equivalentes:
(i) g representa a a;
(ii) g ∼ h + aZ 2 , donde h es una forma cuadrática en n − 2 variables;
(iii) La forma cuadrática f = g − aZ 2 representa a 0.

Demostración:
(i) ⇔ (ii): La vuelta es trivial, pues g(0, . . . , 0, 1) = a. Para ver su recı́proca, si suponemos
que g representa a a entonces el módulo cuadrático V correspondiente a g tendrá un elemen-
to x tal que x.x = a (ya que x.x = g(x) en dicho módulo cuadrático). Sea H el complemento
ortogonal de x; tenemos que V = H ⊕kx. ˆ O lo que es equivalente, g ∼ h + aZ 2 , donde h es
la g restringida a H (es claro, dado que x.x = a, que g restringida a kx es aZ 2 ).
(ii) ⇒ (iii): Por la hipótesis (ii) tenemos que f ∼ h+aY 2 −aZ 2 , luego f (0, . . . , 0, 1, 1) = 0
entonces f representa a 0.
(iii) ⇒ (i): Supongamos que f ∼ g −aZ 2 y f (x1 , . . . , xn−1 , z) = 0, con (x1 , . . . , xn−1 , z) 6=
0. Entonces: o bien z = 0, en cuyo caso g(x1 , . . . , xn−1 ) = 0 con (x1 , . . . , xn−1 ) 6= 0, o sea
que g representa a 0 y luego a a (por la Proposición 4.17); o bien z 6= 0, que implica
g(x1 /z, . . . , xn−1 /z) = a por lo tanto g representa a a (observar que no es necesario pedir
que algún xj sea no nulo, pues si todos fueran 0 entonces a = 0, absurdo). 

Corolario 4.19. Sean g, h dos formas no-degeneradas de rango n ≥ 1, y sea f = g −̇h.


Entonces son equivalentes:
(i) f representa a 0;
(ii) Existe a ∈ k ∗ que es representado por g y por h;
(iii) Existe a ∈ k ∗ tal que g − aZ 2 y h − aZ 2 representan 0.

Demostración: Es claro que (ii) ⇔ (iii), por el Corolario anterior. Además, se ve que (ii)
implica (i) pues si g(x) = h(y) = a con x, y no nulos (en sus correspondientes espacios, por
ej x ∈ k r , y ∈ k s ), entonces f (x, y) = 0 y (x, y) 6= 0. Para terminar, probemos la recı́proca:
supongamos que f representa a 0. Entonces existe (x, y) 6= 0 tal que f (x, y) = 0, o sea
que g(x) = h(y) = a. Si a 6= 0, queda probado (ii). Si a = 0, el hecho de que (x, y) 6= 0
implica que x 6= 0 ó y 6= 0: supongamos sin pérdida de generalidad que x 6= 0. Esto nos
dice que g representa a 0. Pero entonces por la Proposición 4.17, g representa a todos
los elementos de k ∗ . En particular, representará a todos los elementos de k ∗ representados
Los Números p-ádicos y el Teorema de Hasse-Minkowski 30

por h (existe alguno de tales elementos pues h es no degenerada), con lo cual se tiene (ii). 

Ahora vemos que el Teorema 4.9 de diagonalización de la matriz de f nos lleva a la


forma mas caracterı́stica de presentar una forma cuadrática:

Teorema 4.20. Si f es una forma cuadrática en n variables, entonces existen ai ∈ k tales


que
f ∼ a1 X12 + . . . + an Xn

Demostración: Recordemos, en la definición de módulo cuadrático, que si definı́amos


una
P base de V para la cual la matriz de la forma resultaba A = (aij ), entonces f (x) =
i,j aij xi xj donde los xi son las coordenadas de x en la base en cuestión.
n
Ası́, si tomamos f forma cuadrática en n variables, esto equivalePan que V = k , y fijando la
base dada por el Teorema 4.9 obtenemos la expresión f (x) = i=1 aii xi , como querı́amos
probar. 
Ası́ presentada, sabemos que el rango de f es exactamente la cantidad de coeficientes ai
no nulos.
Para concluir con la traducción de los resultados del capı́tulo anterior, presentamos los
equivalentes del Teorema de Witt y su Corolario:

Teorema 4.21. Sean f = g + h y f 0 = g 0 + h0 dos formas cuadráticas no-degeneradas.


Entonces si f ∼ f 0 y g ∼ g 0 , se tiene que h ∼ h0 .

Demostración: Lo único que debemos notar es que si V = U ⊕H ˆ es isomorfo a V 0 =


U 0 ⊕H
ˆ 0 y U isomorfo a U 0 , entonces H resulta isomorfo a H 0 , y esto vale por el Corolario
4.13. En nuestro contexto, como por hipótesis f restringida a H es h (y lo análogo para f 0 ,
H 0 , h0 ), entonces h ∼ h0 . 

Corolario 4.22. Si f es una forma cuadrática se tiene que

f ∼ g0 + g1 + . . . + gm + h

donde g0 ∼ 0, las gi son formas hiperbólicas para 1 ≤ i ≤ m, y h es no isotrópica. Además,


esta descomposición es única (salvo equivalencias).

Demostración: Por el Teorema 4.20, separando los ai nulos de los no nulos, obtenemos
inmediatamente una descomposición en la forma f ∼ g0 + g, con g0 ∼ 0 (la parte con los
ai = 0), y g no degenerada. Ahora descomponemos g según la Proposición 4.17, que nos
permite extraer de manera iterativa nuevas formas hiperbólicas: en cada paso, mientras
sea posible (es decir, mientras la parte restante siga representando a 0), obtenemos g ∼
g1 + . . . + gr + hr con gi hiperbólicas. Ası́ hasta llegar al punto en que hr no representa a
0, en cuyo caso se obtiene la forma explcicitada en el enunciado del Corolario.
Para ver la unicidad, basta notar primero que la descomposición f ∼ g0 + g es única
salvo equivalencias, pues está determinada por la forma diagonal de la matriz de f y por
su rango. Y segundo, ver que la parte de g1 + . . . + gm + h es única también, presentamos
dos posibles expresiones y cancelamos todos las partes hiperbólicas mediante el Teorema
4.21. 
Los Números p-ádicos y el Teorema de Hasse-Minkowski 31

4.3. Formas cuadráticas sobre Fq


Aquı́ clasificaremos las formas cuadráticas sobre un cuerpo finito, y estudiaremos cuáles
elementos son representadas por ellas. A continuación, p denotará un número primo impar,
y q una potencia de p. Como ya mencionamos antes, Fq es un cuerpo con q elementos.

Proposición 4.23. Si f es una forma cuadrática sobre Fq de rango n, entonces:


-Si n ≥ 2, f representa a todos los elementos de Fq∗ .
-Si n ≥ 3, f también representa a 0.

Demostración: Debido a la implicación (iii) → (i) del Corolario 4.18, es suficiente probar
la segunda afirmación para n = 3 (tomando como válido esto, si el rango de g es 2 entonces
el de f = g − aZ 2 es 3, luego representará a 0, y esto implicarı́a que g representa a a ∈ Fq∗ ).
Probar que toda forma en 3 variables representa a 0 es equivalente a ver que para todos
a, b, c ∈ Fq la ecuación
ax2 + by 2 = c
tiene solución (esto se ve porque se toma el vector no trivial que anula a f , y se divide por
una coordenada no nula, despejando su coeficiente correspondiente). Para ver que dicha
ecuación tiene solución, supongamos que a, b, c ∈ Fq∗ (si alguno es 0 la ecuación es trivial).
Sean A, B ⊆ Fq los conjuntons de números de la forma rx = ax2 , sy = c − by 2 respectiva-
mente, con x, y ∈ Fq . Claramente si rx = rx0 entonces x2 = (x0 )2 luego o bien x = 0, o bien
x = ±x0 . Esto nos dice que rx consiste del 0, y q−1 2
elementos más: es decir, un total de
q+1 q+1
2
. Análogamente, se ve que B consiste también de 2 elementos. Pero en Fq hay sólo q,
luego A ∩ B 6= ∅. Esto implica simplemente que la ecuación en cuestión tiene solución. 

Sabemos que el grupo Fq∗ /Fq∗ 2 tiene exactamente dos elementos. Sea entonces a ∈ Fq ,
que no sea un cuadrado. Se tiene el siguiente resultado:

Proposición 4.24. Toda forma cuadrática no-degenerada de rango n sobre Fq es equiva-


lente a
X12 + . . . + Xn−1
2
+ Xn2
oa
X12 + . . . + Xn−1
2
+ aXn2
dependiendo de que clase le corresponde a su discriminante en Fq∗ /Fq∗ 2 .

Demostración: Usemos inducción en n. El resultado es claro si n = 1, por el hecho de


que Fq∗ /Fq∗ 2 tiene exactamente dos elementos. Ahora tomemos n ≥ 2. Por la Proposición
anterior, f representa a 1. Luego se podrá escribir, por 4.18, como f = X12 + g, con g en
n − 1 variables. Se aplica entonces la hipótesis inductiva a g, y listo. 

Corolario 4.25. Dos formas cuadráticas no degeneradas sobre Fq son equivalentes si y


sólo si tienen el mismo rango y el mismo discriminante.

Demostración: La ida es trivial; para la vuelta, si dos formas cuadráticas tuvieran el


mismo rango y discriminante, entonces la Proposición anterior dice que son equivalente a
una misma forma, luego por transitividad serán equivalentes entre sı́. 
Los Números p-ádicos y el Teorema de Hasse-Minkowski 32

4.4. Formas cuadráticas sobre Qp


En esta sección estudiaremos especificamente las formas cuadráticas definidas sobre el
cuerpo Qp de los números p-ádicos, obteniendo una muy buena clasificación de ellas según 3
invariantes (los dos utilizados para clasificar las formas cuadráticas sobre Fq , y uno nuevo).
En este capı́tulo p denotará un número primo, k el cuerpo Qp , todos los módulos cuadráticos
serán considerados sobre el cuerpo k, de rango n, y supondremos que son no degenerados.
Las mismas suposiciones se tendrán en cuenta para las formas cuadráticas en cuestión.

Recordemos que habı́amos definido el discriminante d(Q) de un módulo cuadrático


(V, Q). Si fijamos una base ortogonal e = {e1 , . . . , en } para V y llamamos Ai = ei .ei ,
entonces resulta que
d(Q) = a1 . . . an
considerado como un elemento del cociente k ∗ /k ∗ 2 (las formas son no degeneradas, entonces
la expresión utilizada es no nula). Ya hemos visto que d(Q) es un invariante del módulo
cuadrático (V, Q) (i.e., no depende de la base e utilizada para definirlo).

En el mismo contexto, definamos la función ε por:


Y
ε(e) = (ai , aj )
i<j

donde (a, b) denota el sı́mbolo de Hilbert. Ası́ definida, resulta evidente que ε(e) ∈ {1, −1}.
Más aún, ε es otro invariante de (V, Q), como lo muestra el siguiente Teorema:

Teorema 4.26. El número ε(e) no depende de la base ortogonal e elegida para su defini-
ción.

Demostración: Para n = 1, es claro que ε(e) = 1 siempre. Si n = 2, tenemos que


ε(e) = (a1 , a2 ). O sea que ε(e) = 1 si y sólo si Z 2 − a1 X 2 − a2 Y 2 representa a 0. Por
el Corolario 4.18, esto equivale a que a1 X 2 + a2 Y 2 represente a 1, es decir, que exista un
v ∈ V tal que Q(v) = 1. Y claramente esto es independiente de e. Ahora usemos inducción
para n ≥ 3. Por el Teorema 4.11, basta con probar que ε(e) = ε(e’) si e y e’ son contiguas.
Supongamos, por simetrı́a del sı́mbolo, que e1 = e01 . Entonces a01 = a1 (donde a0i = e0i .e0i ).
Luego, como el sı́mbolo es ”lineal”en cada coordenada, podemos escribir
Y Y Y
ε(e) = (a1 , a2 . . . an ) (ai , aj ) = (a1 , a21 a2 . . . an ) (ai , aj ) = (a1 , d(Q)a1 ) (ai , aj )
2≤i<j 2≤i<j 2≤i<j

Análogamente, Y
ε(e’) = (a1 , d(Q)a1 ) (a0i , a0j )
2≤i<j

Y aplicando la hipótesis inductiva a la forma restringida al complemento ortogonal de e1 ,


tenemos que Y Y
(ai , aj ) = (a0i , a0j )
2≤i<j 2≤i<j

de donde se tiene la igualdad buscada, y listo. 


Los Números p-ádicos y el Teorema de Hasse-Minkowski 33

En el lenguaje de formas cuadráticas, lo que hemos dicho se traduce directamente a que


si f ∼ a1 X12 + . . . + an Xn2 es una forma cuadrática en n variables, entonces

d(f ) = a1 . . . an ∈ k ∗ /k ∗ 2
Y
ε(f ) = (ai , aj ) ∈ {1, −1}
i<j

son invariantes de la clase de equivalencia (via isomorfismos métricos) de f .

A continuación veremos dos resultados que dan condiciones para caracterizar comple-
tamente el hecho de que una forma cuadrática f represente un elemento determinado de
k ∗ /k ∗ 2 .
Para probarlo necesitaremos el siguiente Lema, que habla sobre las soluciones de algunas
ecuaciones con el sı́mbolo de Hilbert.
Recordar antes que hemos hallado, en la Sección 2.4, la cantidad de elementos de los
cuerpos k ∗ /k ∗ 2 (donde k = Qp ). Estos son un total de 2r , con r = 3 si p = 2 y r = 2 si p
es impar.

Lema 4.27. (a) Si a ∈ k ∗ /k ∗ 2 y ε = ±1, definamos Haε como el conjunto de elementos


x ∈ k ∗ /k ∗ 2 tales que (x, a) = ε. Si a = 1, Ha1 tiene 2r elementos (y luego Ha−1 = ∅). Si
a 6= 1, Haε tiene 2r−1 elementos.
0
(b) Sean a, a0 en k ∗ /k ∗ 2 , y ε, ε0 = ±1. Supongamos que Haε y Haε0 son no vacı́os. Entonces,
son disjuntos si y sólo si a = a0 y ε = −ε0 .

Demostración: (a) Cuando a = 1, es claro que (x, a) = 1 para todo x ∈ k ∗ /k ∗ 2 , se sigue


lo que querı́amos probar. Si a 6= 1, como el sı́mbolo de Hilbert es una forma bilineal no
degenerada entonces tenemos un funcional lineal φa : k ∗ /k ∗ 2 → {±1}, dado por b 7→ (a, b).
Su núcleo es un hiperplano de k ∗ /k ∗ 2 , o sea que tiene 2r−1 elementos. Pero dicho núclo es
justamente Ha1 . Y finalmente, Ha−1 es el complemento de el mencionado subespacio, con lo
cual tendrá 2r − 2r−1 = 2r−1 elementos.
0
(b) En el caso en que Haε y Haε0 sean no vacı́os y disjuntos, tenemos dos casos:
El primero, a = 1. Por el ı́tem anterior, el hecho de que sean no vacı́os implica que ε = 1.
Pero entonces Haε tiene 2r elementos, y luego el otro es vacı́o. Entonces queda descartada
esta opción.
El segundo caso es a 6= 1. Por el mismo motivo que antes, supongamos también a‘ 6= 1
(sino se llega a un absurdo como antes, razonando análogamente). Entonces nuevamente
utilizando el ı́tem anterior, sabemos que los dos conjuntos tienen 2r−1 elementos. El hecho de
que sean disjuntos implica entonces que son complementarios. Como ya sabemos que Ha1 y
Ha−1 son complementarios, deducimos entonces que Ha1 y Ha10 son iguales o complementarios.
Pero complementarios no son, pues ambos contienen al 1. Por lo tanto, Ha1 = Ha10 , y luego
lo mismo pasa con −1. Ası́, por definición de estos conjuntos,

(x, a) = (x, a0 )∀x ∈ k ∗ /k ∗ 2 .

Al ser el sı́mbolo de Hilbert no degenerado, esto implica que a = a0 . Es claro ahora que para
que los conjuntos inicialmente considerados sean complementarios, debe ser que ε = −ε0 .
La recı́proca se deduce inmediatamente de (a). 
Los Números p-ádicos y el Teorema de Hasse-Minkowski 34

Teorema 4.28. Una forma cuadrática f en Qp de rango n y discriminante d representa a


0 si y sólo si:
i) n = 2, d = −1
ii) n = 3, ε = (−1, −d)
iii) n = 4, y d 6= 1, ó d = 1 y ε = (−1, −1)
iv) n ≥ 5

Haciendo un cambio en la forma cuadrática podemos generalizar este resultado para


cualquier a ∈ k ∗ /k ∗ 2 . Llamando fa = f − aZ 2 (resta entre formas cuadráticas), sabemos
por 4.17 que fa representa a 0 sii f representa a a. Pero además, se pueden obtener los
invariantes de fa en función de los de f , mediante las fórmulas

d(fa ) = −ad, ε(fa ) = (−a, d)ε(f )

Luego, se tiene el siguiente corolario:

Corolario 4.29. Dado a ∈ k ∗ /k ∗ 2 , se tiene que f representa a a si y sólo si:


i) n = 1, a = d
ii) n = 2, ε = (a, −d)
iii) n = 3, y a 6= −d, ó a = −d y ε = (−1, −d)
iv) n ≥ 4

Demostración: (del Teorema) Escribimos f ∼ a1 X12 + . . . + an Xn2 .


(i) Tenemos que a1 X12 + a2 X22 = 0 ⇔ Y 2 = (X1 /X2 )2 = −a1 /a2 , si y sólo si −a1 /a2 (que
es igual a −a1 a2 en k ∗ /k ∗ 2 ) es un cuadrado. Esto es, d = −1 (ya que en este caso k ∗ /k ∗ 2
tiene sólo dos elementos).
(ii) f representa a 0 sii −a3 f ∼ −a3 a1 X12 − a3 a2 X22 − X32 representa a 0. Esto es equiv-
alente, por definición del sı́mbolo de Hilbert, que (−a3 a1 , −a3 a2 ) = 1. Desarrollando del
lado izquierdo (por ”linealidad”), obtenemos

(−1, −1)(−1, a1 )(−1, a2 )(a3 , a3 )(a1 , a2 )(a1 , a3 )(a2 , a3 ) = 1

lo cual, utilizando la propiedad (a3 , a3 = (−1, a3 ) se puede escribir como

(−1, −a1 a2 a3 )(a1 , a2 )(a1 , a3 )(a2 , a3 ) = 1

es decir, (−1, −d)ε = 1. O sea, (−1, −d) = ε.


(iii) Por el Corolario 4.19, como f ∼ (a1 X12 +a2 X22 )−(−a3 X32 −a4 X42 ), f representa a 0 sii
existe un x ∈ k ∗ /k ∗ 2 representado por las formas g = a1 X12 + a2 X22 y h = −a3 X32 − a4 X42 .
Pero por el ı́tem (ii) del Corolario al Teorema (notar que ya hemos probado en el caso
anterior la parte correspondiente para poder usarlo), esto equivale a decir que

(x, −a1 a2 ) = (a1 , a2 ) y (x, −a3 a4 ) = (−a3 , −a4 )

Sean A, B los conjuntos de solución de cada una de las ecuaciones de arriba. Tenemos que
f representa a 0 sii A ∩ B 6= ∅. Es claro que ambos son no vacı́os (pues por ejemplo a1 ∈ A,
−a3 ∈ B por fórmulas conocidas del sı́mbolo). Luego aplicando el Lema previo, tenemos
Los Números p-ádicos y el Teorema de Hasse-Minkowski 35

que A∩B = ∅ si y sólo si se cumplen las siguientes dos condiciones: a1 a2 = a3 a4 (cancelamos


los −), y (a1 , a2 ) = −(−a3 , −a4 ). Lo primero implica claramente que el discriminante es un
cuadrado, i.e., d = 1. Entonces,

ε = (a1 , a2 )(a1 , a3 )(a1 , a4 )(a2 , a3 )(a2 , a4 )(a3 , a4 )

= (a1 , a2 )(a1 , a3 a4 )(a2 , a3 a4 )(a3 , a4 )


= (a1 , a2 )(a1 a2 , a3 a4 )(a3 , a4 )
= (a1 , a2 )(a3 a4 , a3 a4 )(a3 , a4 )
Sabemos, por una propiedad del sı́mbolo, que (x, x) = (−1, x); entonces reemplazando, y
utilizando la segunda condición,

ε = (a1 , a2 )(a3 , a4 )(−1, a3 a4 )

= −(−a3 , −a4 )(a3 , a4 )(−1, a3 )(−1, a4 )


= −(−1, −a4 )(a3 , −a4 )(a3 , a4 )(a3 , −1)(−1, a4 )
= −(−1, −a24 )(a3 , −a4 )2 = −(−1, −1)
En conclusión, tenemos que f no representa a 0 sii A ∩ B = ∅, sii d = 1 y ε = −(−1, −1).
Negando todo, obtenemos lo que se querı́a probar.
(iv) Supongamos que n = 5. Por el Lema, y utilizando la parte (ii) del Corolario (toman-
do el a del Lema como −d), vemos que existen 2r−1 a ∈ k ∗ /k ∗ 2 tales que (a, −d) = ε (para
formas de rango ≥ 2; en nuestro caso el rango es 5). Esto implica, por el Corolario, que
hay por lo menos 2r−1 elementos de k ∗ /k ∗ 2 que son representados por f . Tomemos un
a ∈ k ∗ /k ∗ 2 que sea representado por f , y que sea distinto de d. Por resultados ya men-
cionados, f ∼ aX 2 +g, donde g es una forma cuadrática en 4 variables. Pero el discriminante
de g es justamente d/a 6= 1 en k ∗ /k ∗ 2 , luego por el caso anterior, g representa a 0. Poniendo
X = 0, vemos que f representa a 0, y listo. 

Ahora llegamos a la hora de clasificar completamente (salvo isomorfismos) las formas


cuadráticas sobre Qp , mediante los invariantes previamente definidos.

Teorema 4.30. Dos formas cuadráticas sobre k son equivalentes si y sólo si tienen el
mismo rango, el mismo discriminante y el mismo ε.

Demostración: Es claro que si dos formas son equivalentes, tienen los mismos invariantes
(por la propia definición de los mismos, que no dependı́an de ninguna base prefijada). Para
probar la vuelta (que es lo interesante) usaremos inducción en n, el rango de f (y de g). Los
primeros casos son triviales. Por el Corolario 4.29, vemos que f y g representarán los mismos
elementos de k ∗ /k ∗ 2 . La suposición de que son no degeneradas, permite entonces tomar
a ∈ k ∗ /k ∗ 2 que sea representado por ambas formas. Entonces, tenemos que f ∼ aZ 2 + f 0 ,
g ∼ aZ 2 + g 0 . Pero justamente

d(f 0 ) = ad(f ) = ad(g) = d(g 0 )

ε(f 0 ) = ε(f )(a, d(f 0 )) = ε(g)(a, d(g 0 )) = ε(g 0 )


Los Números p-ádicos y el Teorema de Hasse-Minkowski 36

Y f 0 , g 0 son de rango n − 1, con lo cual por hipótesis inductiva, f 0 ∼ g 0 . Luego, f ∼ g como


querı́amos. 

Observar que, tomando en cuenta este Teorema y el Teorema anterior, 4.28, se ve que
la única forma cuadrática en 4 variables que no representa a 0 es aquella que cumple
d(f ) = 1, ε(f ) = −(−1, −1) (es única por lo que acabamos de probar). Tomando a, b tales
que (a, b) = −1, esta forma se puede expresar como f ∼ Z 2 − aX 2 − bY 2 + abT 2 .
Para hallar exactamente el número total de clases de formas cuadráticas (para cada
rango n) debemos mencionar el siguiente resultado:

Proposición 4.31. Dado n ≥ 1, d ∈ k ∗ /k ∗ 2 y ε ∈ {±1}, existirá una forma cuadrática


f de rango n tal que d(f ) = d y ε(f ) = ε si y sólo si n = 1, ε = 1; ó n = 2, d 6= −1;
ó n = 2, ε = 1; ó n ≥ 3.

Demostración: El caso n = 1 es trivial. Para n = 2, escribamos f ∼ aX 2 + bY 2 . Si


d(f ) = −1, entonces tenemos que ε(f ) = (a, b) = (a, −ab) = (a, 1) = 1, luego cuando
d = −1 no queda otra que tener ε = 1. Para este caso, tomamos f = X 2 − Y 2 , que verifica
lo requerido.
Cuando d 6= −1, para cualquier ε podremos encontrar a ∈ k ∗ /k ∗ 2 tal que (a, −d) = ε (ver
Lemma previo al Teorema 4.28). Entonces, la forma f = aX 2 + adY 2 tiene las propiedades
requeridas.
Cuando n = 3, se toma un a ∈ k ∗ /k ∗ 2 tal que a 6= −d en dicho contexto. Entonces
ad 6= −1, luego por el caso anterior existe una forma g en 2 variables tal que d(g) = ad,
ε(g) = (a, −d)ε. Tomamos luego f = aZ 2 + g, y tiene las propiedades requeridas.
Si n ≥ 4, tomamos la forma g de rango 3 que verifique los invariantes requeridos, y defini-
mos f = g(X1 , X2 , X3 ) + X4 + . . . + Xn , que funciona. 

Como consecuencia inmediata, encontramos la cantidad de formas cuadráticas (clases)


sobre Qp de rango n, que irán de acuerdo con el siguiente cuadro:

n=1 n=2 n≥3


p=2 8 15 16
p 6= 2 4 7 8

(podemos hacer ese cuadro pues ya sabemos cuántos valores puede tomar d(f ) y ε(f ))

4.5. Formas cuadráticas sobre R


En general el trabajo que hemos hecho para las formas cuadráticas sobre Qp se aplica
en gran parte a R si n ≤ 3 (n es el rango de la forma cuadrática en cuestión).

Es claro que si k = R entonces k ∗ /k ∗ 2 no es otra cosa que {±1}. Luego toda forma
cuadrática no degenerada sobre R se puede pensar como

f ∼ X12 + . . . + Xr2 − Y12 − . . . − Ys2


Los Números p-ádicos y el Teorema de Hasse-Minkowski 37

donde r + s = n. Los números (r, s) determinan totalmente la forma cuadrática, y los


llamaremos signatura de f .
Para este caso se pueden conocer, en función de s, las invariantes d y ε, puesto que
(−1, −1) = −1. En efecto,

s(s−1)/2 1, si s ≡ 0, 1 mod 4
ε(f ) = (−1) =
−1, si s ≡ 2, 3 mod 4

s 1, si s ≡ 0 mod 2
d(f ) = (−1) =
−1, si s ≡ 1 mod 2
Los Números p-ádicos y el Teorema de Hasse-Minkowski 38

5. Teorema de Hasse-Minkowski
5.1. Demostración del Teorema
Basándonos en los resultados previos estudiaremos ahora las formas cuadráticas sobre
Q, para llegar ası́ al resultado principal de nuestro trabajo.
Como antes, V denotará el conjunto de números primos junto con el sı́mbolo ∞, y
denotaremos Q∞ = R. Sea f ∼ a1 X12 + . . . + an Xn2 una forma cuadrática en Q de rango n.
Consideramos los siguiente invariantes, llamados invariantes locales de f :
a) El discriminante de f , d(f ) = a1 . . . an ∈ Q∗ /Q∗ 2
b) Para cada v ∈ V , consideramos a f como una forma cuadrática fv en Qv , lo cual nos
permite definir el invariante εv (f ) para cada v ∈ V de la siguiente manera:
Y
εv (f ) = (ai , aj )v
i<j

Según la fórmula vista en 3.8, se tiene que


Y
εv (f ) = 1
v∈V

c) La signatura (r, s) de la forma cuadrática pensada en R.


Estamos en condición de presentar el Teorema que nos dice que es equivalente la exis-
tencia de soluciones en Q a la existencia de soluciones en cada Qv :

Teorema 5.1 (Hasse-Minkowski). Sea f una forma cuadrática sobre Q. Entonces f


representa a 0 si y sólo si para todo v ∈ V la forma cuadrática fv representa a 0.

Demostración: Es obvio que si f representa a 0, su imagen en Qv también, para todo v.


Para probar la vuelta, escribamos a f en la forma usual:

f ∼ a1 X12 + . . . + an Xn2 , ai ∈ Q∗

Y supongamos sin pérdida de generalidad que a1 = 1 (reemplazando f por a1 f ). Dividermos


la prueba en casos: n = 2, 3, 4 y ≥ 5:
i) n = 2
Tenemos f = X12 −aX22 . El hecho de que f∞ represente a 0 nos dice que a > 0. Escribamos
Y
a= pvp (a)
p

y como fp representa a 0 para todo p, se tiene que si (x1 , x2 ) es una solución no trivial de
fp = 0 entonces a = (x1 /x2 )2 , y entonces es un cuadrado en cada Qp . Esto implica que
vp (a) es par, para todo p. Pero entonces a es un cuadrado en Q, con lo cual f representa a
0.
ii) n = 3 (Legendre)
Se tiene f = X12 −aX22 −bX32 , y podemos suponer que a y b son enteros libres de cuadrados
(si no fueran enteros, multiplicamos por los denominadores al cuadrado, obteniendo una
forma equivalente; luego para que sean libres de cuadrados, hacemos que las variables
Los Números p-ádicos y el Teorema de Hasse-Minkowski 39

”absorban”todos los factores cuadrados de a y de b). Esto se traduce en que vp (a), vp (b) ∈
{0, 1} para todo p primo. Supongamos sin pérdida de generalidad que |a| ≤ |b|. Probemos
el resultado por inducción en m := |a| + |b|:
Para m = 2, f = X12 ± X22 ± X32 . Pero no pueden ser todos signos positivos por el hecho de
que f∞ representa a 0. Entonces, es claro que f representa a 0.
Supongamos ahora que m > 2. Esto implica que |b| ≥ 2 (pues es el más grande de los dos).
Escribamos a b como
b = ±p1 . . . pk
donde los pi son primos distintos (por la suposición hecha de que b es libre de cuadrados).
Sea p cualquiera de los pi , veamos que a es un cuadrado módulo p (i.e., resto cuadrático
mod p): si a es múltiplo de p, esto es trivial. En caso contrario, a es una unidad en Qp .
Por hipótesis, sabemos que existe (x, y, z) ∈ (Qp )3 tal que z 2 − ax2 − by 2 = 0. Podemos
suponer, por la Proposición 2.13, que (x, y, z) es primitiva (i.e., que x, y, z ∈ Zp y hay
alguno no múltiplo de p). Se tiene que z 2 − ax2 ≡ 0 mod p ya que p | b. Si p dividiera a x,
entonces también a z. Pero como vp (b) = 1, p dividirı́a tambien a y, absurdo. Luego x no
es múltiplo de p, entonces multiplicando por su inverso mod p en la ecuación de antes, se
ve que a ≡ (zx−1 )2 mod p entonces es cuadrado módulo p. Q
Esto vale para cualquier pi que divide a b, luego como Z/bZ = Z/pi Z, tenemos que a es
un cuadrado módul b. Es decir, existen t, b0 tales que

t2 = a + bb0

Se puede suponer √ que |t| ≤ |b|/2. Observar que bb0 = t2 − a luego bb0 es la norma de
un elemento de k( a). Entonces por la Proposición 3.2, (a, bb0 ) = 1. Luego (a, b) = 1 sii
(a, b0 ) = 1, por linealidad. Ası́, recordando la definición del sı́mbolo de Hilbert, tenemos
que nuestra forma f representa a 0 en k (= Q o a Qp ) sii lo hace la forma

f 0 := X12 − aX22 − b‘X32

Por hipótesis, f representa a 0 en cada Qp , entonces f 0 también. Pero observar que


2
t − a t2 |a| |t|2

0 |b|
|b | = ≤ + ≤ + 1 ≤ + 1 < |b|
b b |b| |b| 4
pues |b| ≥ 2. Si escribimos b0 = ub00 , con b00 libre de cuadrados, entonces es claro que
|b00 | < |b|. Por hipótesis inductiva, la forma cuadrática f 00 = X12 − aX22 − b00 X32 representa
a 0. Luego f 0 también, y en consecuencia nuestra f .
iii) n = 4
Por comodidad, escribamos f = aX12 + bX22 − (cX32 + dX42 ). Sea v ∈ V . Como fv
representa a 0, por el Corolario 4.19 se tiene que existe un xv ∈ Q∗v representado por las
formas aX12 + bX22 y cX32 + dX42 . Esto equivale, utilizando ahora la parte (ii) del Corolario
4.29 (que sigue valiendo, trivialmente, para Q∞ = R), a decir que

(xv , −ab)v = (a, b)v , y (xv , −cd)v = (c, d)v


Q Q
Y esto vale para todo v ∈ V . Como v∈V (a, b)v = v∈V (c, d)v = 1, podemos aplicar el
Teorema 3.9 y obtenemos ası́ un x ∈ Q∗ que verifica

(x, −ab)v = (a, b)v , y (x, −cd)v = (c, d)v


Los Números p-ádicos y el Teorema de Hasse-Minkowski 40

para todo v ∈ V . Esto implica que la forma cuadrática aX12 + bX22 − xZ 2 representa a
0 en cada Qv , y entonces representa a 0 en Q por el caso anterior. O sea que x ∈ Q∗ es
representado por aX12 + bX22 . Analogamente, x es representado por cX32 + dX42 . Aplicando
ahora otra implicación del Corolario 4.19, deducimos que f representa a 0 en Q.
iv) n ≥ 5
Probaremos el resultado por inducción en n. Pensemos a f como f = h − g, donde
h = a1 X12 + a2 X22 y g = −(a3 X32 + . . . + an Xn2 ). Sea S el subconjunto de V dado por
los elementos ∞, 2, y los primos p tales que vp (ai ) 6= 0 para algún i ≥ 3 (i.e., primos
que dividen a alguno de los coeficientes de g). Claramente, S es finito. Sea v ∈ S. Como
fv representa a 0, existirá un av ∈ Q∗v representado (en Qv ) por h y g). Esto es, existen
xvi ∈ Qv , i = 1, . . . , n tales que

h(xv1 , xv2 ) = g(xv3 , . . . , xvn ) = av

Como los cuadrados de Q∗v forman un abierto, si utilizamos el Teorema de Aproximación


presentado antes de la prueba de 3.9 para el conjunto S definido previamente, deducimos
que existen x1 , x2 ∈ Q tales que si a = h(x1 , x2 ), entonces a/av ∈ Q∗v 2 para todo v ∈ S.
Consideremos ahora la forma f1 = aZ 2 − g, de rango n − 1. Dado v ∈ S, sabemos que g
representa a av en Qv , luego también a a (ya que para k ∗ /k ∗ 2 son lo mismo). Esto implica
que f1 representa a 0 en cada Qv , v ∈ S. Si v ∈ / S, resulta que los coeficientes de g son
todos unidades v-ádicas (por definición de S). Entonces también dv (g) será una unidad.
Pero además, observemos que la forma cuadrática g es en 3 o más variables, entonces por
el Corolario 6.3 al Teorema de Chevalley-Warning, la ecuación g ≡ a mod v tiene solución
no trivial. Pero entonces, al ser el discriminante de g una unidad v-ádica, podemos aplicar
el Corolario 2.17 y obtener ası́ la existencia de una solución en Qv de g = a. Es decir, g
representa a a en Qv . Luego, f1 representa a 0 en Qv , ahora para los v ∈ / S.
En cualquiera de los dos casos, vemos que la forma f1 representa a 0 en Qv , para todo
v. Luego por hipótesis inductiva, como f1 es de rango n − 1, también representa a 0 en
Q. Esto implica que g representa a a en Q. Pero como h también representaba a a en Q
(por construcción de a), tenemos que f representa a 0 en Q, y queda probado el Teorema. 

Fácilmente se extiende el teorema a cualquier a ∈ Q∗ :

Corolario 5.2. Sea a ∈ Q∗ . f representa a a en Q si y sólo si lo hace en cada Qv .

Demostración: Se deduce inmediatamente del Teorema, aplicado a la forma cuadrática


aZ 2 − f 

Y además, recordando que todas las formas cuadráticas de rango n ≥ 5 representa a 0


en cada Qp , obtenemos el siguiente resultado:

Corolario 5.3. Una forma cuadrática f en Q de rango n ≥ 5 representa a 0 si y sólo si


representa a 0 en R

Demostración: Sabemos que, por el Teorema 4.28, una forma de rango ≥ 5 siempre
representa a 0 en Qp ; el Corolario resulta de reescribir el enunciado del Teorema de Hasse-
Minkowski con esta información. 
Los Números p-ádicos y el Teorema de Hasse-Minkowski 41

Es decir, que si f es una forma cuadrática no degenerada en más de 4 variables, entonces


la ecuación f = 0 tiene solución no trivial en Q si y sólo si la tiene en R.

5.2. Algunos comentarios interesantes


Vale la pena mencionar que la versión del Teorema presentada en este trabajo no es lo
más general que se ha podido probar hasta el momento.
La prueba del Teorema que hemos mostrado a lo largo de estas páginas fue desarrollada
por Hermann Minkowski a finales del siglo XIX. Posteriormente, Helmut Hasse probó la
versión más general del mismo, cuya formulación se hace en un cuerpo global F (en el
lugar de Q), y los cuerpos de números p-ádicos son reemplazados por las completaciones
de F respecto a valuaciones no triviales (de la misma manera que la primera definición de
Qp mostrada aquı́). Dichas valuaciones son clasificadas módulo la relación de equivalencia
”generar la misma topologı́a sobre F ”(ya que toda valuación da lugar a una métrica, la cual
genera una topologı́a en el cuerpo en cuestión). Se denomina a las clases de equivalencia
los primos de K (en analogı́a con el caso de F = Q). Uno de tales primos se dice infinito
si las valuaciones correspondientes a esa clase de equivalencia son arquimedianas (i.e., si
no cumple la propiedad (c) de la Proposición 2.4 ). En el caso en que las valuaciones
correspondientes a un primo sean no-arquimedianas, se dice que es un primo finito.
Esta noción de valuaciones primas (las finitas, según la definición previa) generaliza en
cierta manera la noción de ideal primo. Esto es por la siguiente razón: supongamos que F
es un cuerpo númerico (o de números algebraicos, es decir, una extensión finita de Q). Si
℘ es un ideal primo del anillo de enteros de F , junto con la definición de norma N (℘) de
un ideal, se puede definir una valuación en F asociada a ℘, de la siguiente manera. Para
cada x ∈ F no nulo, sea r el único número entero tal que x ∈ ℘r pero x ∈ / ℘r+1 . Entonces
definimos 
1/N (℘)r , si x 6= 0;
|x|℘ :=
0, si x = 0.
Ası́, | · |℘ es una valuación no-arquimediana en F . Y más aún, se puede ver que toda val-
uación no-arquimediana en F es equivalente a | · |℘ para algún ideal primo ℘ del anillo de
enteros de F . He aquı́ una biyección entre primos finitos de F y sus ideales primos.
De manera análoga en el caso de las valuaciones arquimedianas, se puede ver que son todas
equivalentes a las surgidas de hacer un ”embedding”de F en R o C (en el caso de que F
sea un cuerpo de números algebráicos). Es por eso que se denomina a los primos infinitos
de K reales o complejos, dependiendo de a dónde llegue el embedding.

Llegado un momento las analogı́as son cada vez menos visibles, es por eso que se requiere
de fuertes resultados en Teorı́a de Cuerpos Globales para demostrar la versión general de
Hasse del Teorema. Sin embargo, el espı́ritu y las ideas principales de la demostración no
se alejan demasiado de los puntos seguidos para probar el Teorema en Q.
Los Números p-ádicos y el Teorema de Hasse-Minkowski 42

6. Apéndices
6.1. Algunos resultados en Teorı́a de Números
En esta sección adicional veremos algunos resultados básicos de la Teorı́a de Números,
que han sido utilizados en partes fundamentales del desarrollo previo.

6.1.1. Ecuaciones sobre cuerpos finitos


Teorema 6.1 (Chevalley - Warning). Sea p un primo, y K = Z/pZ el cuerpo de los
enteros módulos p. Sean fα ∈ K[X1 , . . . , Xn ] polinomios tales que la suma de sus grados
es menor que n. Si V ⊆ (K)n es el conjunto de raı́ces en común de dichos polinomios,
entonces la cantidad de elementos de V es múltiplo de p.
Para probar el Teorema utilizaremos el siguiente Lema que facilita las cosas:
Lema 6.2. En el contexto del Teorema, sea u un entero positivo. Entonces S(X u ) :=
u
P
x∈K x es igual a -1 si u es no nulo y divisible por q − 1, y es igual a 0 en cualquier otro
caso.
Demostración: Para u = 0, S(X u ) = 1 + . . . + 1 = q,1 = 0 pues K es de caracterı́stica
p, y p divide a q.
Si u 6= 0 y es divisible por q − 1, tenemos que xu = 1 para x 6= 0 (por Fermat), y xu = 0
si x = 0. Luego, S(X u ) = (q − 1),1 = −1.
Finalmente, para u 6= 0 no divisible por q − 1, como K ∗ = K \ {0} es cı́clico y de orden
q − 1 (ejercicio 6 de la cursada de Estructuras Algebraicas 2007), tenemos que existe un
y ∈ K ∗ generador de dicho grupo. Luego, valen dos cosas: K ∗ = {yx, x ∈ K ∗ }; y además
y u 6= 1 por la hipótesis sobre u. Con lo cual,
X X
S(X u ) = xu = y u xu = y u S(X u )
x∈K ∗ x∈K ∗

luego (1 − y u )S(X u ) = 0 y como y u 6= 1, S(X u ) = 0. 

Demostración: (del Teorema) Sea P = α (1 − fαq−1 , y tomemos x ∈ K n . Si x ∈ V , es


Q
claro que P (x) = 1. Por otro lado, si x ∈ / V entonces existe α tal que fα (x) 6= 0, y luego para
q−1
dicho α se tiene que fα (x) = 1. Entonces, P (x) = 0. En conclusión, P = χVP , la función
caracterı́stica de V . Si generalizamos la función S del Lema mediante S(f ) = x∈K n f (x)
para cualquier polinomio f , entonces es claro que la cantidad de elementos de V es igual a
S(P ) mod p. Bastarı́a entonces con probar que S(P ) = 0.
Como la suma de los grados de los fα es menor que n, entonces el grado de P es menor
que n(q − 1). Con lo cual, P el polinomio P es combinación lineal de monomios de la forma
u u1 un
X = X1 . . . Xn , con ui < n(q − 1). Al ser S lineal, hemos reducido todo a probar que
S(X u ) = 0 para cada uno de dichos monomios. Pero al tener que
P
ui < n(q − 1), existe i
tal que ui < q − 1, es decir, hay algún ui para el cual S(X ui ) = 0. Supongamos sin pérdida
de generalidad que i = n. Entonces,
X X X un−1 un 
X  X u1 un−1 
S(X u ) = xu1 1 . . . xunn = y1u1 . . . yn−1 xn = xunn y1 . . . yn−1 =0
x∈K n xn ∈K y∈K n−1 xn ∈K y∈K n−1

Y listo. 
Los Números p-ádicos y el Teorema de Hasse-Minkowski 43

Corolario 6.3. Toda forma cuadrática en 3 o más variables sobre K tiene una raiz no
trivial.
Demostración: Una forma cuadrática es un polinomio de grado 2 ¡3, luego la cantidad
de raı́ces es múltiplo de p. Pero al tener una raı́z trivial (el vector nulo), entonces tiene al
menos otras p − 1 raı́ces (y p − 1 > 0). 

6.1.2. Ley de reciprocidad cuadrática


Introducimos primero el Sı́mbolo de Legendre:
Definición 6.4. Sea p un primo impar, y x ∈ Fp∗ (pensar en (Z/pZ)∗ ). El sı́mbolo de
Legendre de x respecto de p se define como
 
x
:= x(p−1)/2
p
Claramente, el sı́mbolo de Legendre toma valores en {±1} (pues al elevarlo al cuadrado
da 1, y estamos en un cuerpo). Pero lo más importante es que da 1 si y sólo si x es un resto
cuadrático módulo p (i.e., existe y ∈ Fp∗ tal que y 2 = x en Fp∗ ). Además, sabemos que es
multiplicativo. Es decir,     
x y xy
=
p p p

Es sabido cómo calcular rápidamente el sı́mbolo de Legendre para cualquier primo impar
p en el caso de x = 1, −1, 2. Para esto, se introducen las siguientes funciones (utilizadas en
la Sección 3): si n ∈ Z es impar, se definen ε(n), ω(n) mediante

n−1 0, sin ≡ 1 mod 4
ε(n) := mod 2 =
2 1, sin ≡ −1 mod 4
n2 − 1

0, sin ≡ ±1 mod 8
ω(n) := mod 2 =
8 1, sin ≡ ±5 mod 8
Se tiene entonces el siguiente resultado:
Teorema  6.5. Para todo primo impar p valen las siguientes fórmulas:
1
(i) p = 1
(ii) −1

p
= (−1)ε(p)
(iii) p2 = (−1)ω(p)
Pero más aún, si x es un número primo se tiene el siguiente resultado, fundamental a la
hora de calcular cualquier sı́mbolo de Legendre 10 :
Teorema 6.6 (Gauss). Si l, p son dos primos impares distintos, entonces
   
l p
= (−1)ε(l)ε(p)
p l
10
En realidad, para que ayude a calcular cualquier sı́mbolo deberı́amos introducir el sı́mbolo de Jacobi,
el cual es una generalizacion del de Legendre para cuando la base no es un número primo
Los Números p-ádicos y el Teorema de Hasse-Minkowski 44

Este es uno de los resultados más famosos y ”populares”de Teorı́a de Números. Fue
conjeturado originalmente por Euler y Legendre, pero probado por primera vez por Gauss
a la edad de 19 años. Su fascinación por este Teorema hizo que, a lo largo de toda su vida,
Gauss diera ocho demostraciones diferentes del mismo. Actualmente, existen más de 200
demostraciones diferenes publicadas. 11

6.2. Sistemas y Lı́mites proyectivos


Los sistemas y lı́mites proyectivos permiten juntar la información de muchos grupos, y
morfismos entre ellos, mediante un nuevo objeto que definiremos a continuación. Esta es
la herramienta algebráica utilizada en una de las definiciones presentadas de los enteros
p-ádicos.

Definición 6.7. Dado (I, ≤) un conjunto ordenado y dirigido 12 , sea A = (Ai )i∈I una
familia de grupos, y supongamos que tenemos definidos una familia de morfismos F dados
por fij : Aj → Ai para todo i ≤ j que satisfacen las siguientes propiedades:
1. fii = idAi
2. fik = fij ◦ fjk para todos i ≤ j ≤ k
Entonces, decimos que el par (A, F) es un sistema proyectivo.

En general, a lo largo de este trabajo sólo han sido utilizado sistemas proyectivos en los
cuales el conjunto de ı́ndices tiene un orden total (mucho más que dirigido). En el caso en
que el conjunto de ı́ndices sea N denotaremos al sistema proyectivo (A) = (An )n∈N mediante

. . . → An → An−1 → . . . → A1

donde las flechas representan los morfismos que, dados la condición 2. de la definición y el
hecho de que el orden es total, están completamente determinados por los elementos fn,n+1 .

Definición 6.8. Dado (A, F) un sistema proyectivo, con A = (Ai )i∈I ,Qdefinimos el lı́mite
proyectivo del sistema como el subgrupo lim Ai del producto directo i∈I Ai dado por
←−
Y
lim Ai := {(ai ) ∈ Ai | ai = fij (aj ) para todo i ≤ j}
←−
i∈I

Llamemos A = lim Ai . Quedan definidas canónicamente las proyecciones πi : A → Ai ,


←−
que son las proyecciones usuales del producto directo restringidas a A.

Vale la pena mencionar que esta construcción puede ser llevada a cabo en anillos, módu-
los, álgebras, etc, adecuando los morfismos a la categorı́a correspondiente. Es más, en
cualquier categorı́a podemos definir, dado un sistema proyectivo (Xi , fij ) deinifido como
antes pero ahora con los objetos y morfismos en una categorı́a C, su lı́mite proyectivo es
el objeto X en la misma categorı́a, junto con morfismos πi : X → Xi (proyecciones) que
satisfacen πi = fij ◦ πj . El lı́mite (X, πi ) debe verificar la siguiente propiedad universal:
dado cualquier otro par (Y, ψi ) con estas propiedades, existe un único morfismo u : Y → X
tal que el diagrama
11
Ver http://en.wikipedia.org/wiki/Quadratic reciprocity
12
No todos los autores exigen esta condición
Los Números p-ádicos y el Teorema de Hasse-Minkowski 45

conmuta para todo i, j. (Notar que no necesariamente existe el lı́mite proyectivo en


cualquier categorı́a)

Para concluir, veamos el siguiente resultado de lı́mites proyectivos, que ha sido utilizado
en la sección de ecuaciones y polinomios p-ádicos:

Lema 6.9. Sea . . . → Dn → Dn−1 → . . . → D1 un sistema proyectivo, con D = lim Dn su


←−
lı́mite proyectivo. Entonces si los Dn son finitos y no vacı́os, D es distinto de vacı́o.

Demostración: Si los morfismos son todos suryectivos, entonces se puede construir de


manera natural un elemento de D a partir de cualquier elemento de D1 (vamos tomando
preimagenes por los morfismos, y en cada paso obtenemos algo no vacı́o ya que son todos
epimorfismos). Vamos a reducir el caso general al recien mencionado:
Sea Dn,p = fn,n+p (Dn+p ), la imagen de Dn+p en Dn . Fijando n, vemos que como

Dn,p+1 = fn,(n+p+1) (Dn+p+1 ) = fn,(n+p) f(n+p),(n+p+1) (Dn+p+1 ) ⊆ fn,(n+p) (Dn+p ) = Dn,p

entonces (Dn,p )p es una familia decreciente de conjuntos finitos no vacı́os. Luego, a partir de
un P suficientemente grande, Dn,p = Dn,P para todo p ≥ P . Sea En := Dn,P . Es inmediato,
nuevamente utilizando la definición de los morfismos del sistema proyectivo, que el morfismo
f(n−1),n : Dn → Dn−1 se restringe como tal y da un morfismo suryectivo En → En−1 (pues
f(n−1),n (Dn,p ) = Dn−1,p para cualquier p). Ahora bien, como los En son no vacı́os, tenemos
por el caso mencionado en el comienzo que lim En 6= ∅. Luego, como En ⊆ Dn para todo
←−
n, se tiene que lim Dn 6= ∅. 
←−
Los Números p-ádicos y el Teorema de Hasse-Minkowski 46

Referencias
[1] A. J. Baker, “An Introduction to p-adic numbers and p-adic Analysis,” 2006.

[2] J.-P. Serre, “A Course in Arithmetic,” Springer-Verlag, 1996.

[3] Y. Amice, “Les Nombres p-adiques,” Press Univ. de France, 1975.

[4] A. Gamzon, “The Hasse-Minkowski Theorem (Thesis)”, Univ. of Connecticut, 2006.

También podría gustarte