Está en la página 1de 31

Normas, desigualdades y dualidad

1
H. A. Helfgott
1
Versin preliminar del 3 de junio de 2005
ndice general
Prefacio v
Captulo 1. Principios bsicos 1
1. La norma
r
. La desigualdad del tringulo. 1
2. Comparaciones entre normas 2
3. Normas y dualidad 3
4. Auto-dualidad, productos escalares y desigualdad de Cauchy 5
5. Operadores duales. Principio de la gran criba 8
6. Analsis de Fourier en Z/p. Transformada de Fourier como isometra. 10
Captulo 2. Aplicaciones en la teora de nmeros 13
1. La desigualdad de Cauchy y el anlisis de Fourier en la combinatoria aditiva 13
2. La gran criba: desigualdades 14
3. La gran criba como tal 19
Apndice: lemas sobre los primos. 23
Bibliografa 25
iii
Prefacio
Notacin. Sean f, g funciones denidas en un subconjunto de los reales. Al escribir g f,
queremos decir que [g(x)[ < c
1
[f(x)[ para todo x > c
2
, donde c
1
y c
2
son constantes positivas. Por
O(f(x)) entendemos una funcin g no especicada tal que g f. Por lo tanto, h(x) = O(f(x)) es
lo mismo que h f.
Por o(f(x)) denotamos cualquier funcin g tal que, para todo > 0, hay un X tal que [g(x)[ <
[f(x)[ para todo x > X. Finalmente, escribimos f g si, para todo > 0, hay un X tal que
[f(x) g(x)[ < [g(x)[ para todo x > X. (Decimos tambin que f y g son asintticas.)
Si las constantes c
1
, c
2
, (constantes implcitas) no son en verdad completamente constantes
(constantes absolutas), sino que dependen de, digamos, A y B, entonces escribimos A y B bajo la
relacin:
A,B
, O
A,B
( ); una constante no absoluta se escribe C
A,B
. Lo mismo vale si la relacin
entre y X depende de A y B: o
A,B
( ),
A,B
.
v
CAPTULO 1
Principios bsicos
1. La norma
r
. La desigualdad del tringulo.
Consideremos elementos x de R
n
, esto es, vectores x = (x
1
, , x
n
) con x
i
real, 1 i n.
Recuerden que la longitud de x es simplemente
_
x
2
1
+ +x
2
n
, por el teorema de Pitgoras.
Trabajaremos con un concepto mas general de longitud, llamado norma. Para cada x R
n
y cada
nmero real r que no sea igual a cero, podemos denir la norma
1

2
de la manera siguiente:
(1.1.1) [x[
r
=
_
1
n
n

x=1
[x
i
[
r
_
1/r
.
En particular, si r = 2, la norma [x[
2
es igual a la longitud de x dividida por

n.
En el espacio ordinario, la linea es el camino ms corto entre dos puntos; en particular, dados
vectores x
1
, x
2
, , x
m
, la longitud del vector x
1
+x
2
+ +x
m
es menor o igual a la suma de las
longitudes de x
1
, , x
m
. La misma aseveracion es cierta de la norma
r
, si es que r 1:
(1.1.2) [x
1
+x
2
+ +x
m
[
r
[x
1
[
r
+[x
2
[
r
+ +[x
m
[
r
.
Esta aseveracion lleva el nombre de desigualdad de Minkowski o simplemente desigualdad del trin-
gulo para la norma
r
.
Si r > 1, la desigualdad del triangulo es una igualdad s y slo s x
1
, . . . , x
m
son multiplos no
negativos uno del otro, i.e., s y solo s todos apuntan en exactamente la misma direccin.
Es fcil probar (1.1.2) para m > 2 asumiendo que (1.1.2) es verdad para m = 2. Por lo tanto,
necesitamos probar (1.1.2) slo para m = 2. Por conveniencia, escribiremos en lo inmediato x en
vez de x
1
y y en vez de x
2
.
Problema 1 (La prueba original de Minkowski). Muchos problemas clsicos de mximos y
mnimos como, por ejemplo, el problema de encontrar la gura de permetro dado que rodee
un mximo de rea ceden al enfoque siguiente. Digamos que queremos mostrar que el mximo
se obtiene slo en un caso en particular. (La estrategia para encontrar un mnimo es la misma.)
Supongamos que se llega al mximo en algn otro caso; el plan es mostrar que una pequea
variacin de este supuesto mximo, escogida segn nuestra conveniencia, lleva a un incremento en
el valor de la funcin a ser maximizada. As llegamos a una contradiccin.
Entonces no hemos terminado todava, ya que es posible que una funcin no tenga un mximo
en ningn lugar. Esta posibilidad puede ser eliminada si es que en verdad no es el caso mediante
el uso de algn afn del hecho siguiente: una funcin continua restringida a una caja cerrada
y R
n
: [y
i
[ N debe adoptar un mnimo y un mximo
2
.
Enfoquemos la desigualdad del tringulo como un problema de mximos y mnimos: para x
jo, mostrar que f
x
(y) = [x + y[
r
[y[
r
toma su mximo s y slo s x = ty para algn nmero
t 0. Sea r > 1.
(a) Reduzca el problema al caso de x, y (R
+
0
)
n
, i.e., x, y con coordenadas no negativas
solamente. Muestre que el caso r = 1 es trivial.
1
Los analistas funcionales generalmente utilizan p en vez de r en este contexto; por lo tanto, hablan de la norma

p
, lo cual es la misma cosa que la norma
r
. Seguimos [6] en su utilizacion de
r
, en parte para evitar cualquier
confusion con los nmeros primos p.
2
En general, la imgen de un conjunto compacto bajo una funcin continua es compacto, y un subconjunto de
R
n
es compacto s y slo s es cerrado y acotado (teorema de Heine-Borel).
1
2 1. PRINCIPIOS BSICOS
(b) Sea r > 1. Fije x (R
+
0
)
n
. Tome y (R
+
0
)
n
tal que y ,= tx para t 0. Muestre, entonces,
que existe un ndice i tal que
f
x
(y)
y
i
< 0.
(c) Sea N > 0 arbitrario. Considere la caja cerrada y R
n
: [y
i
[ N. Muestre que el
mximo de f
x
(y) en la caja puede ser alcanzado slo cuando y = tx para algn t 0. (Se
debe considerar el caso de y en la supercie de la caja. Use (b) en toda su fuerza.)
(d) Muestre que el mximo de f
x
(y) dentro de una caja cerrada es alcanzado s y slo s
y = tx para algn t 0.
(e) Deduzca de (d) que f
x
(y) alcanza su mximo dentro de R
n
s y slo s y = tx para algn
t 0.
(f) Concluya que la desigualdad del tringulo es cierta, y que es una igualdad slo cuando
y = tx para algn t 0.
La desigualdad del tringulo no se cumple si r < 1. En verdad, la desigualdad opuesta es cierta:
para r < 1 y x
1
, , x
m
(R
+
0
)
n
,
(1.1.3) [x
1
+x
2
+ +x
m
[
r
[x
1
[
r
+[x
2
[
r
+ +[x
m
[
r
,
con igualdad slo si x
1
, . . . , x
m
son multiplos no negativos uno del otro.
Problema 2. Adapte su solucin al problema 1 para probar (1.1.3).
* * *
Sea V un espacio vectorial sobre el cuerpo k C. (Pinsese de k = Q, k = R, k = C.) Una norma
sobre V es un smbolo [ [ que toma valores reales y satisface las propiedades siguientes:
(a) Para cada v V , tenemos [v[ 0. Mas an, [v[ = 0 s y slo s v = 0.
(b) [cv[ = [c[[v[ para cada c k.
(c) Para v, w V cualesquiera, la desigualdad del tringulo se cumple: [v + w[ [v[ +[ w[.
A un espacio vectorial V con una norma [ [ se le llama, naturalmente, espacio con norma.
En la terminologa dada,
r
es una norma r 1 (gracias a (1.1.2)) pero no una norma para
r < 1 (gracias a (1.1.3)).
En la prueba de Minkowski de la desigualdad del tringulo para
r
, r 1, el hecho que V sea
una espacio vectorial sobre R de una manera crucial: tomamos derivadas. Por supuesto, se pueden
sacar derivadas sobre C, y, de manera formal, tambin sobre cuerpos mucho mas generales. An
as, ser bueno tener una prueba de la desigualdad del tringulo que no use derivadas en absoluto.
Ver la 4.
2. Comparaciones entre normas
Para cada v R
n
y todo r, s con < r < s < ,
(1.2.1) [v[
r
[v[
s
(desigualdad de Jensen),
con igualdad s y slo s v
1
= v
2
= = v
n
.
Problema 3 (Prueba de la desigualdad de Jensen). (a) Asumiendo que (1.2.1) es cier-
ta para v R
n1
, reduzca (1.2.1) para v R
n
a la desigualdad

n1
n
x
r
+
y
r
n

1/r
<

n1
n
x
s
+
y
s
n

1/s
para y > x 0.
(b) Reduzca

n1
n
x
r
+
1
n
y
r

1/r
<

n1
n
x
s
+
1
n
y
s

1/s
para y > x 0 a

n1
n
+
1
n
u
r

1/r
<

n1
n
+
1
n
u
s

1/s
para u > 1.
(c) Pruebe que, para u 0 dado, la funcin r

n1
n
+
1
n
u
r

1/r
es estrictamente creciente.
Denimos
[v[

= lm
r
[v[
r
, [v[

= lm
r
[v[
r
.
Problema 4. (a) Pruebe que [v[

= max
i
[v
i
[, [v[

= mn
i
[v
i
[.
(b) Muestre que la desigualdad de Jensen vale an si r, s o ambos son iguales a o (y
r < s).
3. NORMAS Y DUALIDAD 3
Problema 5. Muestre que
lm
r0
+
[v[
r
= lm
r0

[v[
r
= ([v
1
[ [v
n
[)
1/n
(la media geomtrica, MG).
Como
[v[
1
=
n
1
|v
1
|
+ +
1
|v
n
|
(la media harmnica, MH)
y
[v[
1
=
[v
1
[ + +[v
n
[
n
(la media aritmtica, MA)
La desigualdad de Jensen implica directamente que
mn[v
i
[ MH MG MA max [v
i
[,
con igualdad s y solo s v = 0.
* * *
Dada una function integrable (de Riemann, de Lebesgue. . . ) f : X R en un espacio X de
medida 1 (digamos X = [0, 1]), podemos denir
(1.2.2) [f[
r
=
__
X
[f(x)[
r
dx
_
1/r
.
Problema 6. Muestre utilizando su proceso de lmite favorito que las desigualdades de
Minkowski y de Jensen valen para (1.2.2). Mas adelante, muestre que la desigualdad de Hlder (y
por lo tanto la de Cauchy) tambien vale para (1.2.2). (Por razones histricas, la desigualdad de
Cauchy para (1.2.2) se llama desigualdad de Cauchy-Bunyakovsky-Schwarz, o a veces simplemente
Cauchy-Schwarz, a pesar de la prioridad de Bunyakovsky sobre Schwarz en la generalizacin a la
integral (1.2.2). La desigualdad de Cauchy es en verdad ms fcil de transferir a (1.2.2) que la de
Minkowski o Jensen. Ver el problema 22.
Problema 7. Estrictamente hablando, el espacio vectorial de todas las funciones integrables
f de Riemann o Lebesgue sobre X no es un espacio con norma, ya que [f[
r
puede ser 0 an si f
no es idnticamente cero. Cmo puede esto ser remediado?
Problema 8 (Normalizacin). Sea la medida de X diferente de 1. Mantenga la denicin de
[f[
r
como en (1.2.2).
(a) Muestre que la desigualdad de Minkowski todavia vale, pero la de Jensen (1.2.1) en general
no. (Ms tarde, muestre que las desigualdades de Hlder y Cauchy todava valen cuando
la medida de X no es 1.)
(b) Muestre como (1.2.1) puede ser modicada para [X[ ,= 1, [X[ ,= de tal manera que la
desigualdad de Jensen valga.
(c) Si [X[ = , reemplaze (1.2.1) por una desigualdad entre [f[
1
, [f[
r
y [f[
s
(para 1 < r < s).
(d) Reinterprete la
r
norma en R
n
(ya sea con su denicin (1.1.1) o con la ms simple,
y a veces usada, [x[
r
= [

n
i=1
x
r
i
[
1/r
, como un caso especial de la norma (1.2.2) para
funciones sobre X = 1, 2, . . . , n con una medida apropiada. Concluir que la desigualdad
de Minkowski (pero no la de Jensen) todava vale para [x[
r
= [

n
i=1
x
r
i
[
1/r
.
3. Normas y dualidad
En general, una funcin linear f de un espacio vectorial V
1
sobre un cuerpo k a un espacio
vectorial V
2
tambin sobre k es simplemente una function f : V
1
V
2
tal que
3
(a) f(v +w) = f(v) +f(w) para todo v, w V
1
,
(b) f(cv) = cf(v) para todo v V
1
y para todo c k.
3
En adelante, omitiremos, como es costumbre, las echas sobre los vectores a menos que haya riesgo de confusin.
4 1. PRINCIPIOS BSICOS
En particular, una funcin linear f de R
n
a R es una function f : R
n
R que satisface (a)
f(v +w) = f(v) +f(w) para todo v, w R
n
, y (b) f(cv) = cf(v) para todo v R
n
y todo c R.
Dados v, w R
n
, denimos el producto escalar
(1.3.1) v, w) =
1
n
n

i=1
v
i
w
i
.
Problema 9. (a) Sea w R
n
. Muestre que la funcin f
w
: v v, w) es linear.
(b) Sea f : R
n
R una funcin linear. Muestre que existe un w R
n
tal que la funcin
v v, w) de R
n
a R es idntica a f.
Acabamos de ver que R
n
puede ser identicado como conjunto con el conjunto de funciones
lineares de R
n
a R (tambin llamado el dual de R
n
). Es ahora fcil probar que R
n
y el dual de R
n
pueden ser identicados como espacios vectoriales.
Problema 10. (a) Muestre que f
cw
= cf
w
para todo w R
n
y todo c R.
(b) Muestre que f
w
1
+w
2
= f
w
1
+f
w
2
para w
1
, w
2
R
n
cualesquiera.
Queda por probar que R
n
y el dual de R
n
se pueden identicar como espacios de normas. Para
ello, debemos escoger una norma
r
para R
n
, y tambin debemos explicar que quiere decir una
norma en un espacio vectorial de funciones lineares, tal como el dual de R
n
.
Sea f : V
1
V
2
una funcin linear de un espacio con norma a otro. Denimos la norma de
operador de f como
(1.3.2) [f[ = sup
vV
1
,v=0
[f(v)[
[v[
,
donde la norma en el numerador es la norma de V
2
y la norma en el denominador es la norma de
V
1
.
Ahora sean V
1
= R
n
y V
2
= R, donde V
1
tiene la norma de
r
, r 1, y a V
2
se le da simplemente
el valor absoluto en R como norma. Tenemos entonces una norma de operador (dada por (1.3.2))
sobre el dual de R
n
. Qu es una norma, concretamente?
Veremos que, bajo la identicacion del dual de R
n
con R
n
, la norma de operador del dual de
R
n
(donde a R
n
se le da la norma
r
) es simplemente la norma
s
sobre R
n
, donde s =
1
1
1
r
, o,
para decirlo mas simtricamente, s es el nmero tal que 1 =
1
r
+
1
s
. Decimos que s es el exponente
dual a r.
Problema 11. Muestre que lo que debemos probar se puede replantear como sigue: para
v, w R
n
y todo r, s 1 con
1
r
+
1
s
= 1,
(1.3.3) [v, w)[ [v[
r
[w[
s
(desigualdad de Hlder),
donde la igualdad se logra para por lo menos un v por cada w.
Por supuesto, an tenemos que probar la desigualdad de Hlder.
Problema 12. Muestre que la desigualdad de Hlder no depende de la normalizacin como
la desigualdad de Minkowski, y al contrario de la de Jensen: en otras palabras, la desigualdad de
Hlder es equivalente a
n

i=1
x
i
y
i

_
n

i=1
x
r
i
_
1/r
_
n

i=1
y
s
i
_
1/s
.
Problema 13. (a) Muestre que es suciente probar la desigualdad de Hlder para n = 2.
(b) Pruebe que la desigualdad de Hlder para n = 2 puede reducirse a la aseveracin siguiente:
(1 +x)
1/r
(1 +y)
11/r
1 +x
1/r
y
11/r
para x, y 0, r 1.
(c) Muestre que, para y 0, r 1 jos, x (1+x)
1/r
(1+y)
11/r
(1+x
1/r
y
11/r
) toma
su mnimo (para x [0, 1) cuando x = y, y que este mnimo es 0.
(d) Concluya que la desigualdad de Hlder es verdadera. Muestre tambin que es una igualdad
solo cuando [v
i
[
r
= c[w
i
[
s
para algn c R y todo i = 1, 2, , n.
4. AUTO-DUALIDAD, PRODUCTOS ESCALARES Y DESIGUALDAD DE CAUCHY 5
4. Auto-dualidad, productos escalares y desigualdad de Cauchy
Un caso importante de la desigualdad de Hlder (1.3.3) ocurre cuando r = s = 2:
[v, w)[ [v[
2
[w[
2
.
En efecto, el dual de R
n
como un espacio con norma
2
se identica con R
n
como un espacio con
norma
2
. En otras partes, R
n
con norma
2
es su propio dual.
La desigualdad de Cauchy tiene muchas pruebas independientes de las de Hlder.
Problema 14. (a) Como antes, reduzca el caso general al caso n = 2. Muestre tambin
que el factor de
1
n
aparece en ambos lados y por lo tanto puede ser eliminado.
(b) Como antes, muestre que es suciente probar que
1 +xy (1 +x
2
)
1/2
(1 +y
2
)
1/2
for x, y 0.
(c) Pruebe lo mismo sin utilizar lmites. Puede usar el obvio pero extremadamente til hecho
que el cuadrado de un nmero real es siempre no-negativo
4
.
Como , ) y [ [ son el producto escalar usual y la norma Euclideana [ [
2
, debemos ser capaces
de ver la desigualdad de Cauchy en trminos geomtricos.
Problema 15. (a) Reduzca la desigualdad de Cauchy al caso donde v
2
= = v
n
= 0
y w
3
= = w
n
= 0 por medio de rotaciones.
(b) Escriba v = (a, 0, . . . , 0), w = (b cos , b sin, 0, . . . , 0). Muestre que v, w) = ab cos ,
[v[
2
= a, [w[
2
= b. Deduzca la desigualdad de Cauchy.
En esta ltima prueba, utilizamos el hecho que el producto escalar y la norma Euclideana [ [
2
son invariantes bajo rotaciones. En otras palabras, hay un gran grupo de transformaciones lineares
(es decir, el grupo de rotaciones) que preservan el producto escalar y la norma
2
.
Problema 16. Muestre que ninguna norma
r
para r ,= 2 es invariante bajo un grupo tan
rico de transformaciones lineares como el grupo de rotaciones.
* * *
Podemos denir la norma
2
en terminos del producto escalar en R
n
: [v[
2
=
_
v, v). En general,
as como podemos denir un espacio con norma, podemos denir un espacio con producto escalar.
Sea V un espacio vectorial sobre un cuerpo k R. Un producto escalar sobre V es un smbolo
, ) que toma valores reales y satisface los axiomas siguientes:
(a) cv, w) = cv, w) = v, cw),
(b) u +v, w) = u, w) +v, w),
(c) v, w) = w, v),
(d) v, v) 0, con igualdad s y slo s v = 0.
De (b) o (c) se deduce que v, 0) = 0, v) = 0 para todo v. De la condicin para la igualdad en
(d) se deduce que, para todo v ,= 0, hay un w tal que v, w) ,= 0; en otras palabras, bajo nuestra
denicin, el producto escalar debe ser no degenerado.
Para todo producto escalar , ), el smbolo [v[ =
_
v, v) satisface las condiciones para ser una
norma. Ahora veremos que esta norma siempre satisface la desigualdad de Cauchy; tendremos una
prueba general de la desigualdad de Cauchy, en la cual, necesariamente, usaremos slo el axioma
(d) como nica desigualdad de la cual partir (ya que es la nica que tenemos).
Problema 17.
Muestre que v, w)
1
2
v, v)+
1
2
w, w) =
1
2
[v[
2
+
1
2
[w[
2
para v, w V cualesquiera. Qu desigualdad
podramos usar para concluir, si solo la desigualdad usada fuera en la direccin opuesta, o una
igualdad? Cuando es esa desigualdad una igualdad?
4
En cierto sentido, una desigualdad es siempre un enunciado analtico, en el sentido que utiliza, si no lmites, por
lo menos el ordenamiento de los reales, o como mnimo el ordenamiento de los enteros. Los enunciados algebraicos
tienden a ser igualdades o equivalencias. Para probar un enunciado analtico, se necesita generalmente un germen
analtico, por as decirlo; el hecho que el cuadrado de un real sea no-negativo juega el rol de un germen prcticamente
mnimo. Como pronto veremos, otros enunciados muy similares pueden jugar el mismo rol.
6 1. PRINCIPIOS BSICOS
Por el mismo argumento que en la parte 17, tenemos v
1
, tv
2
)
1
2
[v
1
[
2
+
1
2
[tv
2
[
2
. Para que valor de t
es la desigualdad aludida anteriormente una igualdad? Escoja t apropiadamente y pruebe Cauchy.
* * *
Surge la siguiente pregunta: cuando es una norma inducida por un producto escalar? En otras
palabras, dada una norma [ [ en un espacio vectorial V , cuando hay un producto escalar , ) en
V tal que [v[ =
_
v, v) para todo v V ?
La siguiente condicin es necesaria y suciente: para v, w V cualesquiera,
(1.4.1) [v +w[ +[v w[ = 2([v[ +[w[).
Problema 18. (a) Muestre que (1.4.1) es una condicin necesaria.
(b) Suponga que (1.4.1) vale. Dena un producto escalar , ) en trminos de [ [. Muestre
que el producto escalar satisface axiomas (a)(d), y que, mas an, es no degenerado.
Problema 19. Muestre que, si r ,= 2, la norma
r
no es inducida por un producto escalar.
* * *
Es posible probar la desigualdad de Hlder utilizando la desigualdad de Cauchy, y la desigual-
dad de Minkowski a travs de la de Hlder, de manera bastante abstracta. El motivo es el siguiente:
hay, como he visto, pruebas casi completamente algebraicas de la desigualdad de Cauchy; de esta
manera conseguimos pruebas de las desigualdades de Hlder y Minkowski de naturaleza ms bien
formal. En particular, estas pruebas valdrn sin la menor alteracin para las normas dadas por
integrales sin necesidad de engorrosos procesos de lmite
5
.
Podemos ver tanto las normas (1.1.1) y el producto escalar (1.3.1), as como las normas y
productos escalares no normalizados
(1.4.2) [x[
r
=
_

i
[x
i
[
r
_
1/r
, v, w) =
n

i=1
v
i
w
i
pueden verse como casos especiales de las normas y el producto escalar para integrales de Lebesgue.
Para obtener (1.1.1) y (1.3.1), denimos X = 1, 2, . . . , n y escogemos para X la medida tal
que (x) =
1
n
; para obtener (1.4.2), denimos X = 1, 2, . . . , n y escogimos (x) = 1.
De una vez extenderemos nuestra denicin del producto escalar a espacios vectoriales com-
plejos. Un producto escalar en un espacio vectorial complejo V es una funcin , ) : V V C
que satisface los mismos axiomas que un producto escalar en un espacio vectorial real, con las
siguientes diferencias:
(a) cv, w) = cv, w), en vez de v, cw) = cv, w),
(b) v, w) = w, v), en vez de v, w) = w, v).
Denotamos por z el conjugado de un nmero complejo z = a +bi, esto es, z = a bi. Como antes,
v, v) es un real no negativo, y es igual a cero slo s v = 0.
Problema 20. La prueba de la desigualdad de Cauchy esbozada en el problema 17 se transere
con facilidad a los espacios vectoriales complejos. Verique esta aseveracin.
Problema 21. Para v, w C
n
, dena el producto escalar como sigue:
(1.4.3) v, w) =
1
n
n

j=1
v
j
w
j
.
Muestre que el producto as denido satisface todos los axiomas del producto escalar, con las
modicaciones listadas arriba para el caso complejo. Porqu es que (1.3.1) es un caso particular de
(1.4.3)?
5
Si r es irracional, siempre sera necesario algn proceso de lmite en la prueba de por lo menos algunas
aseveraciones sobre la norma | |
r
. Empero, este sera un proceso de lmite sobre los reales, y no sobre las funciones
integrables.
4. AUTO-DUALIDAD, PRODUCTOS ESCALARES Y DESIGUALDAD DE CAUCHY 7
Sea X un espacio de medida nita. Podemos denir, como antes, la norma
r
sobre las funciones
f : X C:
(1.4.4) [f[
r
=
__
X
[f(x)[
r
_
1/r
.
Tambien denimos el producto escalar de f, g : X C:
(1.4.5) f, g) =
_
X
f(x)g(x)dx.
Ya que las normas y el producto escalar en R
n
son casos especiales de (1.4.4) y (1.4.5), traba-
jaremos con integrales en el resto de la seccin.
Problema 22. Muestre que (1.4.4) y (1.4.5) satisfacen los axiomas de normas y productos
escalares. La desigualdad de Cauchy para las integrales (1.4.4) y (1.4.5) se deduce directamente de
la prueba abstracta en el problema 17, la cual utiliza solamente los axiomas mencionados.
Problema 23 (Hlder a travs de Cauchy). (a) Utilizando la desigualdad de Cauchy re-
petidamente, muestre que, para m 1, u = 2
m
,
__
X
[f
1
(x)[ [f
u
(x)[
_
u

__
X
[f
1
(x)[
u
_

__
X
[f
2
(x)[
u
_

__
X
[f
u
(x)[
u
_
,
donde f
1
, . . . , f
u
: X C son funciones integrables cualesquiera.
(b) Muestre que la desigualdad de Hlder vale para r de la forma r =
2
m
k
, donde k
1, 2, , 2
m
.
(c) Pruebe la desigualdad de Hlder en general, por continuidad.
(d) Muestre que la desigualdad de Hlder es una igualdad slo en el caso especicado en el
Problema 13, parte d.
Problema 24 (Minkowski a travs de Hlder; prueba de F. Riesz). Tratemos de probar la
desigualdad de Minkowski
(1.4.6)
__
X
[f(x) +g(x)[
r
dx
_
1/r

__
X
[f(x)[
r
dx
_
1/r
+
__
X
[g(x)[
r
dx
_
1/r
,
donde f, g : X R, a travs de la desigualdad de Hlder (1.3.3).
(a) Para comenzar, reduzca (1.4.6) al caso de f, g : X R con valores no negativos solamente.
(Entonces los valores absolutos ya no son necesarios.)
(b) Necesitamos expresar
_
X
(f(x) + g(x))
r
dx como un producto escalar v, w). Explore las
posibilidades.
(c) Si v = v
1
+v
2
, tenemos v, w) = v
1
, w)+v
2
, u). Que se obtiene si se aplica la desigualdad
de Hlder a ambos terminos (por separado) del lado derecho de esta igualdad?
En estas notas trabajamos siempre con X de medida nita. Gran parte de lo que estamos
desarrollando vale tambin para X de medida innita, el cual es un caso con numerosas aplicaciones;
empero, tambin es un caso con muchas dicultades adicionales, debidas en parte al hecho que,
para una norma dada, una funcin continua f : X C de un espacio de medida innita a C no
tiene integral
_
X
f(x) nita las ms de las veces. (Hay complicaciones severas que aparecen incluso
cuando el espacio X es de medida nita pero no compacto. Ver el problema 30.) El caso ms
sencillo con X innito es el de X = N con (x = 1. Entonces una funcin f : X C de norma

1
es lo mismo que una serie absolutamente convergente, el espacio de funciones de f : X C de
norma
2
es el espacio de Hilbert de dimensin enumerable, cuya teor dista mucho de ser trivial.
* * *
En la teora de nmeros, el siguiente caso especial de la desigualdad de Cauchy es muy utilizado.
En su primera forma, tambin es un caso especial de la desigualdad de Jensen.
Problema 25. (a) Sean a
1
, . . . , a
n
R. Muestre que
(1.4.7)
_
n

i=1
a
i
_
2
n
n

i=1
a
2
i
.
8 1. PRINCIPIOS BSICOS
(b) Supongamos que a lo mas m de los a
i
son no nulos. Muestre que, entonces,
(1.4.8)
_
n

i=1
a
i
_
2
m
n

i=1
a
2
i
.
La situacion siguiente es muy comn en la teora de numeros analtica.
Problema 26. Sean a
i,j
C para 1 i n, 1 j m, donde no todos los
a
i,j
son reales positivos. Queremos acotar [

n
i=1

n
j=1
a
i,j
[. Muestre que el cuadrado de
[

n
i=1

n
j=1
a
i,j
[ es a lo ms
(1.4.9)

_
n
m

j
1
=1
m

j
2
=1
_
n

i=1
a
i,j
1
a
i,j
2
_
Tpicamente, separariamos entonces la suma doble exterior de (1.4.9) en una parte diagonal
m

j=1
_
n

i=1
a
i,j
1
a
i,j
2
_
2
,
que consiste de todos los trminos con j
1
= j
2
, y una parte no diagonal
m

j
1
=1
m

j
2
=1
j
1
=j
2
a
i,j
1
a
i,j
2
,
que consiste de todos los otros trminos. Entonces acotaramos la parte diagonal por fuerza bruta
(gracias a su pequeo nmero de trminos) y trataramos de obtener cancelacin en las sumas de
la forma
n

i=1
a
i,j
1
a
i,j
2
,
para la mayora de los pares (j
1
, j
2
) con j
1
,= j
2
. (Obtener cancelacin consiste en mostrar que
los argumentos (ngulos) de los nmeros complejos a
i,j
1
a
i,j
2
son lo sucientemente distintos como
para que las contribuciones de los termines a
i,j
1
a
i,j
2
a la suma se eliminen en gran parte las unas
a las otras. Claro est, a
i,j
1
a
i,j
2
podran ser todos reales; en ese caso, el signo juega el rol del
argumento (arg(r) = 0 para r > 0, arg(r) = para r < 0).
5. Operadores duales. Principio de la gran criba
Sean V , W espacios vectoriales sobre R o C dotados de productos escalares. Sea A : V W
un operador linear (es decir, una funcin linear) de V a W. Decimos que un operador linear
A

: W V es el operador dual a A, si para v V , w W cualesquiera,


w, Av) = A

w, v).
Si V = R
m
, W = R
n
, o V = C
m
, W = C
n
, y , ) es el producto escalar usual
6
, todo operador
linear A : V W tiene un nico dual. Esto se puede ver de la manera siguiente. El producto
escalar se puede expresar como sigue:
x, y) = t
x
y = (x
1
, x
2
, , x
n
)
_
_
_
_
_
y
1
y
2
.
.
.
y
n
_
_
_
_
_
para x, y C
n
o x, y R
n
, y lo mismo con m en vez de m para x, y C
m
, o x, y R
m
. (El
producto de t
x
y y es simplemente un producto matricial. Denotamos por t
v
la transposicin de
6
Por cierto, cualquier producto escalar en C
n
es equivalente al producto escalar usual en C
n
bajo alguna
transformacin linear invertible de C
n
a C
n
. Esto es equivalente al hecho que toda matriz Hermitiana (M = t
M
) es
diagonalizable (en C).
5. OPERADORES DUALES. PRINCIPIO DE LA GRAN CRIBA 9
un vector vertical en uno horizontal, y, ms generalmente, denotamos por t
A
la transposicin de
una matriz A.) El operador A se puede expresar como una matriz con m columnas y n las:
A(v) =
_
_
_
_
a
1,1
a
1,2
. . . a
1,m
a
2,1
a
2,2
. . . a
2,m
. . . . . . . . . . . .
a
n,1
a
n,2
. . . a
n,m
_
_
_
_
_
_
_
v
1
.
.
.
v
m
_
_
_
para v V . Por lo tanto, para v V , w W,
w, Av) = t
w
Av = t
w
A v = t
t
A
w
v = t
A
w, v),
por lo cual el dual A

de A existe y es simplemente la transposicin t


A
del conjugado A de la
expresin como matriz del operador A.
Problema 27. Muestre que, para dos espacios lineares cualesquiera V , W sobre R o C, el
dual A

de un operador linear A de V a W es nico, si es que existe.


Sean V = R
m
, W = R
n
o V = C
m
, W = C
n
. Asignemos la norma
r
1
a V y la norma
r
2
a W, para 1 r
1
, r
2
arbitrarios. Un operador linear A de V a W tiene una norma [A[
r
1
,r
2
dada por (1.3.2). El operador dual A

de A va de W a V . Vase A

como un operador linear de


W con la norma
s
2
a V con la norma
s
1
, donde s
1
y s
2
son los exponentes duales a r
1
y r
2
,
respectivamente.
La norma de A

como operador de un espacio de norma


s
2
a un espacio de norma
s
1
no es
otra sino la norma de A:
(1.5.1) [A

[
s
2
,s
1
= [A[
r
1
,r
2
Esta igualdad es la esencia de la gran criba. En su corazn yace una desigualdad.
Problema 28 (Prueba de (1.5.1)). (a) Por denicin, [A[
r
1
,r
2
=

vV
v=0
|Av|
r
2
|v|
r
1
.
Demuestre que
sup
vV
v=0
[Av[
r
2
[v[
r
1
= sup
wW
w=0
w, Av)
[w[
s
2
[v[
r
1
.
(b) Pruebe que, en general, se puede invertir el orden de los sup:
sup
xX
sup
yY
f(x, y) = sup
yY
sup
xX
f(x, y).
(c) Muestre que
sup
vV
v=0
sup
wW
w=0
w, Av)
[w[
s
2
[v[
r
1
= sup
vV
v=0
sup
wW
w=0
A

w, v)
[w[
s
2
[v[
r
1
= sup
wW
w=0
[A

w[
s
1
[w[
s
2
.
(d) Concluya que [A[
r
1
,r
2
= [A

[
s
2
,s
1
.
Las aplicaciones de (1.5.1) (ver 2) se hacen a menudo a partir de la forma concreta siguiente.
Problema 29. Sean dados m, n Z, a
i,j

1im,1jn
con a
i,j
C, r
1
, r
2
[1, ]. Supong-
amos que se nos pide probar que
_
_
n

j=1

i=1
a
i,j
x
j

r
2
_
_
1/r
2
C
_
m

i=1
[x
i
[
r
1
_
1/r
1
para todo x R
m
. Muestre que basta probar que
_
_
m

i=1

j=1
a
i,j
y
j

s
1
_
_
1/s
1
C
_
_
n

j=1
[y
j
[
s
2
_
_
1/s
2
para todo y R
n
.
* * *
10 1. PRINCIPIOS BSICOS
Problema 30. Un operador linear A : V W de un espacio vectorial con norma a otro
se llama acotado si la norma [A[ (en el sentido de (1.3.2) es nita. En general, todo operador
acotado tiene un dual, au cuando V o W tienen dimension innita. Veamos un caso particular
pero sumamente importante.
Sean tanto V como W iguales al espacio de funciones integrables f : X C con X compacto
(y por ende de medida nita). Demos a V la norma
r
1
y a W la norma
r
2
. Supongamos que el
operador A es
A(f) =
_
X
(x, y)f(x)dx,
donde : X X C es una funcin integrable y acotada (llamada ncleo del operador A; de A
mismo se dice que es un operador integral). Muestre que A tiene un operador dual.
El ncleo juega el rol de la matriz de A cuando V , W son de dimensin nita. Ntese que la
prueba de (1.5.1) es vlida para V y W de dimensin general.
6. Analsis de Fourier en Z/p. Transformada de Fourier como isometra.
El cuerpo Z/p se puede denir simplemente
7
como el conjunto 0, 1, . . . , p 1 dotado de la
adicin y la multiplicacin mdulo p:
3 + 5 = 1, 3 5 = 5, 3 5 = 1, 3
1
= 5 en Z/p, p = 7.
Problema 31. Pruebe que Z/p satisface todos los axiomas de un cuerpo. El paso menos
sencillo es mostrar que todo x Z/p no nulo tiene un inverso x
1
Z/p. Muestre que esto
se deduce del siguiente enunciado: dados a, b Z primos entre s, existen m, n Z tales que
am + bn = 1. Pruebe esto a su vez modicando el algoritmo de Euclides, el cual encuentra el
mximo comn denominador de a y b (igual a 1, en nuestro caso).
El anlisis de Fourier sobre R/Z, el cual no es sino el anlisis de Fourier de las funciones de
perodo 1 de R a C, se basa en el hecho que las funciones
n
: x e
2inx
, n Z,
(a) son ortogonales entre s (respecto al producto escalar para funciones de R/Z a C);
(b) son de norma
2
igual a 1;
(c) son caracteres aditivos, i.e.,
n
(x +y) =
n
(x)(y);
(d) generan un subespacio denso del espacio de funciones integrables de R/Z a R.
Anlogamente, consideremos las funciones
y
: x e
2ixy/p
para y Z/p.
Problema 32. Demuestre que las funciones
y
tienen perodo p, y por lo tanto pueden ser
vistas como funciones de Z/p a C. Dote a Z/p de la medida tal que (x) = 1/p. Muestre
que las funciones
y
son ortogonales entre s, tienen norma
2
igual a 1, son caracteres aditivos, y
generan el espacio de funciones integrables de R/Z.
Problema 33. Utilizando el problema 32, pruebe que toda funcin f : Z/p C puede ser
expresada como una serie de Fourier
f(x) =

yZ/p
a
y

y
(x) =

yZ/p
a
y
e
2ixy/p
,
dnde a
y
Z/p. Muestre que
a
y
=
y
, f) =
1
p

yZ/p
e
2ixy
.
Los coecientes a
y
son denominados coecientes de Fourier. Denimos la transformada de
Fourier

f : Z/p C de la manera siguiente:

f(y) = a
y
.
Veremos ahora que dos propiedades de la transformacin de Fourier f

f para f : R/Z C
tambin funcionan para f : Z/p C.
7
Los puristas preeren denir Z/p como el conjunto de clases de equivalencia de Z mdulo pZ, dotado de las
operaciones inducidas por la adicin y la multiplicacin en Z.
6. ANALSIS DE FOURIER EN Z/p. TRANSFORMADA DE FOURIER COMO ISOMETRA. 11
Problema 34. Pruebe que [

f[
2
=
1
p
[f[
2
. En otras palabras, la transformacin

h de Fourier es
una isometra multiplicada por
1
p
. (Una isometra es una transformacin que preserva la norma.)
Problema 35. La convolucin f g de dos funciones f, g : Z/p C es la funcin x
1
p

yZ/p
f(y)g(x y). Muestre que

f g =

f g.
CAPTULO 2
Aplicaciones en la teora de nmeros
1. La desigualdad de Cauchy y el anlisis de Fourier en la combinatoria aditiva
La combinatoria aditiva se ocupa de las maneras de representar elementos de un grupo (gen-
eralmente abeliano) como suma de elementos dados.
Problema 36. Sea A un conjunto nito de enteros. Sea k un entero positivo jo. Denimos
r(n) como el nmero de maneras de expresar n de la manera siguiente:
n = a
1
+ +a
k
a
k+1
a
2k
,
donde a
1
, a
2
, . . . , a
2k
son elementos cualesquiera de A. Queremos probar que r(n) r(0) para todo
n.
(a) Sea t(m) el nmero de soluciones de
a
1
+ +a
k
= m
con a
1
, . . . , a
k
A. Muestre que r(n) =

mZ
t(m)t(m+n).
(b) Pruebe que

mZ
t(m)t(m+n)

m
(t(m))
2
= r(0).
* * *
Dado un subconjunto A Z/p, denotamos por A su nmero de elementos, y por
A
: Z/p C
su funcin caracterstica

A
(x) =
_
1 if x A,
0 if x , A.
Por lo tanto, [A[ = [
A
[
1
= [
A
[
2
2
.
Denimos
A+A = x +y : x, y A, A = x : x A para Z/p.
Es de esperarse que, para un A tpico o dentro de lo normal, el nmero de elementos de A+A
no sea menor que una constante por [A[
2
. Por otra parte, si A = 1, 2, . . . , k, entonces [A+A[ es
slamente 2[A[ 1. Lo mismo es cierto si A es una progresin aritmtica cualquiera, mdulo p.
Mostraremos que, si bien [A + A[ puede ser pequeo, [A + A[ no lo ser para algn S,
donde S Z/p es un subconjunto cualquiera. (Para que el resultado no sea trivial o vacuo, es
necesario que S tenga un cierto nmero mnimo de elementos.)
Problema 37 ([10], Lemma 2). (a) Pruebe que, para cualquier Z/p,
p [
A

A
[
2
2
= [A[
2
+[(a
1
, b
1
, a
2
, b
2
) : a
1
, b
1
, a
2
, b
2
A, a
1
,= a
2
, a
1
+b
1
= a
2
+b
2
[.
(b) Muestre que, en consecuencia,

S
p [
A

A
[
2
2
[S[[A[
2
+[A[
4
.
Que cota inferior se le puede dar entonces a max
S
p [
A

A
[
2
2
?
(c) Acote [A + A[ en trminos de [
A

A
[
2
2
y [
A

A
[
1
. Deduzca que existe un S
tal que
[A+A[ [A[
2
[S[/([A[
2
+[S[).
13
14 2. APLICACIONES EN LA TEORA DE NMEROS
Problema 38 ([7], Lemma 2.5). Veremos que se puede obtener una cota para [A + A[
complementaria a aquella obtenida en el problema 37: a veces es ms fuerte que esta, y a veces
ms debil. Usaremos tanto el anlisis de Fourier como la desigualdad de Cauchy.
(a) Muestre que

S
[
A

A
[
2
2
= p

S
[
A

A
[
2
2
[S[[

A(0)[
4
+p
2
([
A
[
2
2
)
2
=
1
p
4
[S[[A[
4
+
1
p
2
[A[
2
.
(b) Partiendo de (a), muestre que existe un S tal que
[
A

A
[
2
2

[A[
4
p
4
+
1
p
2
[S[
[A[
2
.
(c) Demuestre que existe un S tal que
[A+A[ p
[
A

A
[
2
1
[
A

A
[
2
2
=
_
1
p
+
1
[S[[A[
2
/p
_
1
.
(d) Concluya que, si [S[[A[
2
> p
2
, existe un S tal que [A+A[ contiene ms de la mitad
de los elementos de Z/p. Muestre tambin que, si [S[[A[ > p
1+
, entonces [A + A[ >
1
2
mn(p, [A[
1+
).
Qu cota inferior se le puede dar a [A + A[ para por lo menos la mitad de los
elementos de S? Qu cota se puede dar para por lo menos 9 de cada 10 elementos de
S? (Retorne a la parte (b).)
2. La gran criba: desigualdades
criba. (De cribo). 1. f. Cuero ordenadamente agujereado y
jo en un aro de madera, que sirve para cribar. Tambin se
fabrica de plancha metlica con agujeros, o con red de
malla de alambre.
2. f. Cada uno de los aparatos mecnicos que se emplean
en agricultura para cribar semillas, o en minera para lavar
y limpiar los minerales.
[13], Criba
Una criba es un mtodo que nos permite contar cuantos elementos de un conjunto dado no
son eliminados por una sucesin de criterios. Generalmente, se trata de conjuntos de enteros, y de
criterios de divisibilidad.
Podemos utilizar una criba para encontrar primos: comenzamos con el conjunto A de todos
los enteros de 1 a n; para cada primo p n
1/2
, eliminamos todos los elementos de A divisibles
por p; si llevamos cuenta de cuantos elementos son eliminados en cada paso, cuidandonos de no
contar ningn elemento por partida doble, terminaremos con el nmero de primos de 1 a n.
Problema 39 (Criba de EraststenesLegendre). Hay n enteros de 1 a n. De stos, n/2| son
divisibles por 2, y n/3| son divisibles por 3. El nmero de enteros de 1 a n que no son divisibles
ni por dos ni por tres no es n
n
2
|
n
3
|, ya que los elementos divisibles por 6 son contados
por partida doble. Compensando este hecho, obtenemos que el nmero de enteros de 1 a n es
n
n
2
|
n
3
| +
n
6
|.
(a) Muestre que, en general, el nmero de enteros de 1 a n sin factores primos con D es
(2.2.1)

d|D
(d)
_
n
d
_
= n

d|D
(d)
1
d
+O((D)) = n

p|D
_
1
1
p
_
+O((D)),
donde (d) es el nmero de divisores (enteros positivos) de d, O(x) denota una cantidad
acotada en valor absoluto por Cx, donde C es una constante (en este caso 1) y (d) es
2. LA GRAN CRIBA: DESIGUALDADES 15
la funcin de Mbius
(d) =
_

_
1 si d tiene un nmero par de divisores primos, ninguno repetido
1 si d tiene un nmero impar de divisores primos, ninguno repetido
0 si p
2
[d para algn primo p.
Puede usar (y demostrar) la formula de inversin de Mbius:
(2.2.2)

d|D
(d) =
_
1 si D = 1,
0 si D > 1.
(b) Denotemos por (x) el nmero de primos de 1 a x. Pruebe que
(2.2.3) (n) (n
1/2
)
n

p
1
2
log n
_
1 +
1
p
_.
Gracias al teorema de Mertens (2.3.7), podemos ver que la cota dada por (2.2.3) es simplemente
(n) (n
1/2
)
n
log log n
,
lo cual es bastante pobre comparado con la realidad (ver el apndice 3). El mtodo del problema 39
tiene la virtud de ser adaptable al estudio de muchos conjuntos aparte del de los nmeros primos
por ejemplo, una modicacin nos da la asinttica correcta para el nmero de enteros de 1 a n
libres de cuadrados, i.e., no divisibles por ningn cuadrado d
2
, d > 1. An as, podemos ver que
se trata de un mtodo mas bien dbil.
La idea de las pequeas cribas (criba pura de Brun, criba de Brun, criba de Selberg, criba
de Rosser-Iwaniec) consiste en aproximar y truncar (d) en (2.2.1) de tal manera que el error as
incurrido sea mucho menor que la mejora en el trmino de error (inicialmente O((d))) de (2.2.1).
La gran criba sigue un enfoque distinto, aunque, como veremos ms tarde, con ciertos reen-
cuentros con el de las pequeas cribas (en particular, la criba de Selberg). La primera gran criba
fue concebida y formulada por Linnik [11] para situaciones en las cuales hay un gran nmero
de residuos por primo a ser excluidos. Rnyi encontr un resultado mas fuerte que el de Linnik
mediante un enfoque probabilstico. Desde ese entonces, la gran criba ha sido mejorada, pero por
lo menos su enunciado ha conservado un fuerte resabio probabilstico, por lo menos en el sentido
formal.
* * *
Sea A Z un conjunto nito. Denimos
Z = [A[, Z(d) = [a A : d[a[.
Lo razonable es suponer que Z(p) sea aproximadamente Z/p para un prmo tpico p. Esto no
puede cierto para todo A y todo p; tomemos, por ejemplo, el caso de A igual al conjunto de
todos los primos de 1 a n. Empero, el conjunto de primos es en cierto sentido penalizado por
su excepcionalidad; queremos mostrar que un conjunto puede ser excepcional slo en cuanto sea
pequeo.
Problema 40. Estimaremos la norma
2
de la desviacin de Z(p) con respecto a Z/p.
(a) Sea A 1, 2, . . . , n. Se nos da el problema de mostrar que
(2.2.4)

pX
p
_
Z(p)
Z
p
_
2
C
X,n
[A[
para alguna constante C
X,n
dependiente slo de X y n. Reformule (2.2.4) como una
aseveracin sobre la norma
1
[A[
2,2
de un operador A : R
n
R
m
, donde m es el nmero
de primos X. Note que [A[ = [x[
2
2
, donde x
j
= 1 para j A y x
j
= 0 para j / A.
(b) Encuentre el dual A

de A. Escriba su norma [A

[
2,2
.
1
En toda esta seccin, puede utilizar la norma
2
no normalizada

n
j=1
|x
j
|
2
, si esto le resulta ms conveniente.
16 2. APLICACIONES EN LA TEORA DE NMEROS
(c) Proceda como en (1.4.9) y lo que le sigue, inviertiendo el orden de la suma y separando los
trminos diagonales de los no diagonales. En el problema presente, la parte no diagonal
dar el trmino de error, y la parte diagonal dar el trmino principal para valores tpicos
de X y n.
(d) Estime las contribuciones de la partes diagonal y no diagonal. Concluya que
(2.2.5)

pX
p
_
Z(p)
Z
p
_
2
(n +X
2
)[A[.
(e) Qu cota superior para el nmero de primos de 1 a n nos da (2.2.5)?
Como puede verse, el enunciado (2.2.5) es tn dbil como la criba de Eraststenes-Legendre
cuando se trata de contar primos. Hay dos direcciones posibles en las que podemos proceder:
(a) podemos tratar de mejorar la cota (2.2.5);
(b) podemos tratar de generalizarla para que detecte no slo las desviaciones en el nmero
de elementos de A divisibles por p, sino las deviaciones en el nmero de elementos de A
congruentes mod p a distintos elementos de Z/p.
Comenzaremos por (b), y en el proceso encontraremos una manera de realizar (a). Primero veremos
que la desviaciones del promedio en Z/p son visibles en la transformada de Fourier.
Problema 41. (a) Dada una funcin f : Z/p C una funcin, sea E
f
=
1
p

p1
j=0
f(j).
Muestre que
p1

x=0
[f(x) E
f
[
2
= p
p1

x=1
[

f(x)[
2
.
(b) Dena
Z(d, a) = [x A : x a mod d[, S(r) =

xA
e
2irx
para a, d enteros, r real. Muestre que
(2.2.6) p
p1

a=0
_
Z(p, a)
Z
p
_
2
=
p1

a=1
[S(a/p)[
2
.
(c) Dado x C
n
, podemos plantear en general
Z(d, a) =

1jn
ja mod d
x
j
, S(r) =

1jn
x
j
e
2irj
.
Muestre que (2.2.6) an vale.
Problema 42. Pruebe que, para n y cualesquiera,
n

j=1
e
2ij
= e(i(n + 1))
sinn
sin
.
(Utilize la identidad

n
j=1
g
j
=
g
n+1
g
g1
.)
Problema 43. Nuestra meta ahora es acotar

pX
p
p1

a=0
_
Z(p, a)
Z
p
_
2
.
Gracias a (2.2.6), nos bastar con acotar
(2.2.7)

pX
p1

a=1
[S(a/p)[
2
.
Exprese (2.2.7) de la forma [Ax[
2
2
para un operador linear A : C
n
C
m
, donde m es el nmero de
pares (p, a) con p X y 1 a < p. Proceda como antes: exprese [A

x[
2
2
para x C
m
como una
2. LA GRAN CRIBA: DESIGUALDADES 17
suma de trminos diagonales y no diagonales. Simplique las sumas

n
j=1
e
2ixj
provenientes de
los trminos no diagonales mediante la identidad obtenida en el problema 42; no las acote todava.
(O actelas, despus de todo; probablemente obtendr una cota de
_
n +O(X
2
log X) para lo
norma, lo cual fue el mejor resultado en algun momento, pero ya ha sido superado.)
La contribucin total de los trminos diagonales es n

m
j=1
[x
j
[
2
. La suma de los trminos no
diagonales es
(2.2.8)

p
1
X

p
2
X
p
1
1

a
1
=1
p
2
1

a
2
=1
(p
1
,a
1
)=(p
2
,a
2
)
x
(p
1
,a
1
)
e
i(n+1)a
1
/p
1
x
(p
2
,a
2
)
e
i(n+1)a
2
/p
2
sinn
sin
.
Problema 44 (Un lema tcnico). Sean
r
R dados tales que [
r
1

r
2
[ para r
1
, r
2
distintos cualesquiera, donde > 0 es un positivo arbitrario. Queremos obtener la cota
(2.2.9)

r
1

r
2
r
1
=r
2
z
r
1
z
r
2

r
1

r
2

r
[z
r
[
2
para z
1
, z
2
, . . . , z
n
C cualesquiera.
(a) Probar (2.2.9) es lo mismo que mostrar que, para todo z, [z, Az)[

[z[
2
2
, donde A
i,j
=
1

j
si i ,= j, y A
i,i
= 0. Dado que A es una matriz antisimtrica, que estamos tratando
de probar acerca del mayor autovalor (en valor absoluto)
0
de A? (Por lo mismo que A
es antisimtrica, todos sus autovalores son puramente imaginarios.)
(b) Cual es el mayor autovalor de t
A
A, en trminos de
0
? Sea v
0
un autovector de A corre-
spondiente a
0
. Cul es el valor de t
v
0
t
A
Av
0
, en trminos de
0
?
(c) Desarrolle t
v
t
A
Av, utilizando la identidad
1

i

k
1

j

k
=
1

j

i
_
1

i

k

j

k
_
.
Asumiendo v es un autovector de A (i.e.,

j=i
v
j

j
= v
i
para todo i y algn pura-
mente imaginario), simplique y obtenga tanta cancelacin en t
v
t
A
Av como sea posible.
Despues del uso de la ms simple de las desigualdades que conocemos en parte de lo que
queda, debe obtener la cota superior
(2.2.10) 3

i
[v
i
[
2

k
1
(
i

k
)
2
.
(d) Utilize el hecho que [
i

j
[ > , asi como la conocida igualdad

n=1
1
n
2
=

2
6
(Euler),
para acotar (2.2.10). Obtenga, nalmente, (2.2.9).
Problema 45 (Corolarios de (2.2.9)). (a) Sean
r
R dados tales que [
r
1

r
2
[
para r
1
, r
2
distintos cualesquiera, donde > 0 es un positivo arbitrario. Procediendo a
partir de (2.2.9), queremos obtener la cota
(2.2.11)

r
1

r
2
r
1
=r
2
z
r
1
z
r
2
sin(
r
1

r
2
)

r
[z
r
[
2
para z
1
, z
2
, . . . , z
n
C cualesquiera. Aplique (2.2.9) a los nmeros con doble ndice
m,r
=
m +
r
, z
m,r
= (1)
m
z
r
, donde 1 m K y K es un parmetro a jar ms tarde.
Reemplaze la condicin (m
1
, r
1
) ,= (m
2
, r
2
) por r ,= s (porqu es que esto no cambia el
resultado?), dena k = mn y reemplaze la suma con respecto a m
1
y m
2
por una suma
con respecto a k, con pesos K[k[. Divida por K, deje que K y utilize la igualdad
lm
K

K
k=K
(1)
k
k+
=

sin
(la cual, como la suma de Euler antes utilizada, puede
probarse por integracin de contornos en el plano complejo).
18 2. APLICACIONES EN LA TEORA DE NMEROS
(b) Ahora queremos obtener
(2.2.12)

r
1

r
2
r
1
=r
2
z
r
1
z
r
2
sin2x(
r
1

r
2
)
sin(
r
1

r
2
)

r
[z
r
[
2
para x R y z
1
, z
2
, . . . , z
n
C cualesquiera (y los
r
R satisfacen [
r
1

r
2
[ .
Basta con aplicar (2.2.11 dos veces por separado, con z ligeramente diferente del z dado
en cada caso (de manera que los dos nuevos z incorporen x), y sumar los dos resultados.
Ahora podemos nalmente probar la formas modernas
2
(2.2.14) y (2.2.15) de la gran criba.
Problema 46. (a) Aplique (2.2.12) al trmino no-diagonal (2.2.8) para obtener la criba
de Rnyi
3
:
(2.2.13)

pX
p
p1

a=0
_
Z(p, a)
Z
p
_
2
=

pX
p1

a=1
[S(a/p)[
2
(n +X
2
)
n

j=1
[x
j
[
2
.
(b) A decir verdad, para obtener (2.2.13), utilizamos el dato que p es primo slo mediante el
hecho que, cuando p
1
, p
2
son primos X y a
1
, a
2
son enteros tales que (p
1
, a
1
) ,= (p
2
, a
2
),
a
1
p
1
, a
2
p
2
, entonces

a
1
p
1

a
2
p
2

1
p
1
p
2

1
X
2
.
Ahora bien, esto es cierto para enteros generales q
1
, q
2
X en vez de primos p
1
, p
2
X,
con tal que mcd(a
1
, q
1
) = 1, mcd(a
2
, q
2
) = 1. Deduzca que
(2.2.14)

1qX
q1

a=0
mcd(a,q)=1
[S(a/q)[
2
(n +X
2
)
n

j=1
[x
j
[
2
(Roth [15], Bombieri [3])
(c) Queremos expresar

0a<q:mcd(a,q)=1
[S(a/q)[
2
en trminos de Z(d, a), para as poder
replantear (2.2.14) de una manera parecida a (2.2.5). Muestre primero que
q

d|q
(d)
d
Z
_
q
d
, h
_
=

1aq
mcd(a,q)=1
S(q, a)e
2i
ah
q
.
(Utilize la siguiente consecuencia inmediata (y ubicua) de la frmula de inversin de
Mbius (2.2.2):

1aq:mcd(a,q)=1
c
a
=

d
(d)

1aq:d|q
c
a
para c
a
cualesquiera.)
Luego muestre que
q

a=1
mcd(a,q)=1
[S(a/q)[
2
= q
q

h=1
_
_

d|q
(d)
d
Z
_
q
d
, h
_
_
_
2
.
Concluya que (2.2.14) tiene la forma equivalente
(2.2.15)

1qX
q
q

a=1
_
_

d|q
(d)
d
Z
_
q
d
, a
_
_
_
2
(n +X
2
)
n

j=1
[x
j
[
2
.
Las desigualdades (2.2.14) y (2.2.15) son esencialmente ptimas. Lo que queda es derivar sus
consecuencias.
2
Aditivas, ya que los trminos j e
2ija/q
implcitos en S(a/q) son caracteres aditivos, esto es, homo-
morsmos de Z (como grupo aditivo) al crculo de radio unidad (como grupo multiplicativo). Existen tambin
formulaciones multiplicativas de la gran criba; ver, e.g., [2], 4.
3
Con un factor (n + X
2
) mucho ms pequeo, y por lo tanto mucho mejor, que el original de Rnyi por lo
menos para X > n
1/3
.
3. LA GRAN CRIBA COMO TAL 19
3. La gran criba como tal
Comenzemos por denir un problema de criba de manera un tanto general. Sean dados
(a) un conjunto S 1, 2, . . . , n,
(b) un conjunto de primos P, y
(c) para cada p P, un subconjunto
p
Z/p de cardinalidad
p
= [
p
[,
tales que, para p P, a
p
y s S cualesquiera, tenemos s , a mod p. En otras palabras, las
clases en
p
les son prohibidas a los elementos de S. Nuestra tarea es entonces acotar superiormente
el nmero de elementos [S[ de S.
Si
p
esta acotado, decimos que tenemos una situacin de pequea criba; si, por el contrario,

p
crece y a menudo lo hace de manera proporcional a p decimos que se requiere una gran
criba.
Por razones histricas, a (2.2.14) y (2.2.15) se les llama desigualdades de gran criba; empero,
mostraremos como deducir de ellas tanto la primera gran criba (Linnik, 1941) como una criba
moderna vlida para
p
cualesquiera. En el caso de
p
acotado, este criba general es equivalente a
una versin un tanto restringida de una de las pequeas cribas ms conocidas: la criba cuadrtica
de Selberg.
Problema 47 (Gran criba de Linnik). Sea P = p primo : p

n. Utilizando (2.2.13),
pruebe que, para todo , 0 < < 1,
(2.3.1) [S[
n

2
[p P :
p
> p[
,
donde la constante implcita es absoluta.
La primera aplicacin dada a la gran criba (por Linnik mismo) fue una respuesta parcial a
la siguiente interrogante. Decimos que a es un residuo cuadrtico modulo p si existe un entero b
tal que a b
2
mod p. Ahora bien, uno espera que los residuos y los no residuos cuadrticos estn
entremezclados, en parte porque no hay razn por la cual no lo estn. He aqu la pregunta: que cota
inferior podemos dar para el no residuo ms pequeo? En otras palabras, podemos encontrar k
dependiente de p tal que al menos un elemento de 1, 2, . . . , k deba ser un no residuo cuadrtico?
Linnik logr probar que uno puede tomar k igual a una potencia arbitrariamente pequea de
p, salvo para un nmero muy limitado de excepciones. Antes de seguir sus pasos, necesitamos un
lema por lo dems muy til.
Problema 48 (Nmeros lisos o friables). Probaremos lo siguiente: para todo > 0, existe
un > 0 tal que, para todo N, el nmero de enteros n 1, 2, . . . , N todos cuyos divisores primos
son N

es por lo menos N. En otras maneras, una proporcin positiva de todos los enteros
son bastante friables. En verdad, probaremos algo mas preciso: sea l(N, z) el nmero de enteros
n 1, 2, . . . , N todos cuyos divisores primos son z; entonces, para todo u > 0,
(2.3.2) l(N, N
u
) (u)N,
donde : (0, ) R es una funcin diferenciable denida por iteracin:
(2.3.3)
(u) = 1 si u 1,
(u) = 1
_
1
u

_
v
1 v
_
dv
v
si u < 1.
Ntese que, para denir el valor (u) para
1
k+1
u <
1
k
, se utilizan slo los valores de (w)
para w
u
1u

1
k
. Se sugiere una estrategia de induccin: probar (2.3.2) para 1/2 u 1, y,
luego, para
1
k+1
u <
1
k
, asumiendo (2.3.2) para u
1
k
.
(a) Cuntos factores primos p > N
1/2
puede tener un nmero n N? Pruebe (2.3.2) para
1/2 u 1, excluyendo, para cada p > N
1/2
, los 1 n N divisibles por p.
(b) El problema de evitar excluir un elemento n 1, . . . , N ms de una vez torna el enfoque
directo de (a) improcedente
4
. Sigamos una de las estrategias ms comunes. Pruebe el
4
Esta es, en general, la razn por la cual cribar no es trivial.
20 2. APLICACIONES EN LA TEORA DE NMEROS
lemma de Buchstab:
l(N, p

) = l(N, p)

k=1
l
_
N
p
k
, p

_
,
donde p

y p son dos nmeros primos consecutivos cualesquiera (p

< p). Deduzca que,


para y, z cualesquiera con y < z,
(2.3.4) l(N, y) = l(N, z)

y<pz
l
_
N
p
, p

k=2
l
_
N
p
k
, p

_
,
donde p

denota el primo inmediatamente precedente a p.


(c) Sea u
0

_
1
k+1
,
1
k
_
. Dena y = N
u
0
, z = N
k
. Acote el ltimo trmino del lado derecho
de (2.3.4) por o(N) y estime el segundo trmino asumiendo (2.3.2) para u
1
k
. Concluya
que (2.3.3) vale para u
0
.
Problema 49 (Teorema de Linnik). Sea > 0. Para N arbitrario, sea P el conjunto de
primos p N tales que 1, 2, 3, . . . , N

| son todos residuos cuadrticos mod p. Probaremos que


[P[ < C

, donde C

es una constante que depende slo de .


(a) Sea N = n
2
, P como dicho, y S = 1 s N : q primo, q[s q < N

. Dados s S
y p P, que se puede decir acerca de los factores primos de s, considerados mdulo p?
Qu se puede decir acerca de s en s, mdulo p? En que clases
p
es que s no puede estar?
(b) Cunto es
p
? Aplique la gran criba de Linnik (2.3.1) para concluir.
(c) Pruebe el siguiente corolario: para todo > 0, el nmero de primos
5
p N tales que
1, 2, 3, . . . , p

| son todos residuos cuadrticos mod p esta acotado por

log log N.
* * *
Derivaremos ahora de (2.2.14) la criba general prometida.
Problema 50. Sea dado un problema de criba por S [1, n], P, y
p

pP
. Sea Q el
conjunto de todos los q X iguales a productos de primos distintos en P. Probaremos que
(2.3.5) [S[
N +X
2

qQ

p|q

p
p
p
(Montgomery [12])
(a) Dena J(q) =

p|q

p
p
p
. Verique que basta probar
(2.3.6)

1aq
gcd(a,q)=1
[S(a/q)[
2
[S(0)[
2
J(q),
donde S(r) =

1jn
e
2ijr
x
j
(como de costumbre), q Q y x C
n
es tal que x
j
= 0
para j / S.
(b) Muestre que, si sabemos (2.3.6) para q primo y todo x C
n
tal que x
j
= 0 para j / S,
podemos probar (2.3.6) para q no primo y cualquier x C
n
dado con x
j
= 0 para j / S.
(c) Sea Z(p, a) =

1jn:ja mod p
x
j
. Demuestre que
p1

a=1
[S(a/p)[
2
= p
p

a=1
[Z(p, a)[
2
[S(0)[
2
.
Utilizando el hecho que Z(p, a) = 0 para a /
p
, pruebe tambin que
[S(0)[
2
(p
p
)
p

a=1
[S(p, a)[
2
,
donde se aplica una de las desigualdades que conocemos. Concluya que (2.3.6) vale para
q = p primo.
5
Es una vieja conjetura de Vinogradov que el nmero de tales primos est en verdad acotado superiormente
por una constante. Esta conjetura esta an abierta. Si se asume la hiptesis generalizada de Riemann, se puede
probar la aseveracin de la conjetura, an con p

reemplazado por 2(log p)


2
(Ankeny, [1]).
3. LA GRAN CRIBA COMO TAL 21
* * *
Veamos ahora algunas aplicaciones de (2.3.5) como pequea criba, es decir, para
p
pequeo.
Problema 51 (Brun-Titchmarsh).
Problema 52 (Densidad de primos gemelos).
Apndice: lemas sobre los primos.
Sea (n) el nmero de primos de 1 a n. El teorema de los nmeros primos (Hadamard de
la Valle-Poussin) arma que (n)
n
log n
. El primer resultado parcial hacia el teorema de los
nmeros primos (conjeturado por Gauss y Legendre) fue el teorema de Chebyshev (1848):
log 2 (1 +o(1))
n
log n
< (n) < 2 log 2 (1 +o(1))
n
log n
.
Se puede probar por integracin
x

n=1
1
n
= log x + +o(1),
donde es una constante absoluta (llamada constante de Euler). El teorema de Chebyshev basta
para probar el teorema de Mertens:
(2.3.7)

px
_
1
1
p
_

log x
.
Para las pruebas, ver, por ejemplo, [9], cp. 2.
23
Bibliografa
[1] Ankeny, N. C., The least quadratic non-residue, Ann. of Math. 55 (1952), no. 1, 6572.
[2] Bombieri, E., Le grand crible dans la thorie analytique des nombres, Astrisque 18 (1987).
[3] Bombieri, E., On the large sieve, Mathematika 12 (1965), 201225.
[4] Charles, D. X., Sieve methods, manuscrito, http://www.cs.wisc.edu/~cdx/Sieve.pdf
[5] Davenport, H., Multiplicative number theory, Markham, Chicago, 1967.
[6] Hardy, G. H., Littlewood, J. E., y G. Plya, Inequalities, 2da ed., Cambridge University Press, 1952.
[7] Helfgott, H. A., Growth and generation in SL
2
(Z/p), prepublicacin.
[8] Iwaniec, H., Sieve methods, manuscrito.
[9] Iwaniec, H., y E. Kowalski, Analytic number theory, AMS, Providence, RI, 2004.
[10] Konyagin, S. V., A sum-product estimate in elds of prime order, prepublicacin.
[11] Linnik, Yu. V., La gran criba, Dokl. Akad. Nauk SSSR 30 (1941), 292294 (en ruso).
[12] Montgomery, H. L., A note on the large sieve, J. London Math. Soc. 43 (1968), 9398.
[13] Real Academia Espaola, Diccionario de la lengua espaola, 22da ed., Espasa-Calpe, Madrid, 2001.
[14] Rnyi, A., On the large sieve of Ju. V. Linnik, Compositio Math. 8 (1950), 6875.
[15] Roth, K., On the large sieves of Linnik and Renyi, Mathematika 12 (1965), 19.
25

También podría gustarte