Está en la página 1de 324

Notas para un Curso Básico de Álgebra Conmutativa

Luis M. Pardo
Índice

Part 1. Álgebra Conmutativa para pre-universitarios 7

Capı́tulo 1. Algunos Prerequisitos de Álgebra


(...all novelty is but oblivion) 9
1.1. Semigrupo, monoide, grupo, acciones 10
1.1.1. Las Nociones Básicas 10
1.1.2. Acciones de un Grupo 15
1.1.3. Ejercicios de la Sección 1.1 19
1.2. El Grupo Simétrico 21
1.2.1. Las Permutaciones son composición de ciclos: Órbitas 21
1.2.2. Índice de una Permutación 26
1.2.3. Ejercicios y Problemas de la Sección 1.2 28
1.3. Anillos, Ideales, Morfismos de Anillos 30
1.3.1. Anillos de Polinomios y de Series de Potencias Formales en varias variables 37
1.3.2. Otros ejemplos 41
1.3.3. Ejercicios y Problemas de la Sección 1.3 42
1.4. Módulos, Submódulos, Morfismos de Módulos 45
1.4.1. Operaciones Básicas con Submódulos e Ideales 48
1.4.2. Módulos Libres y Bases 51
1.4.3. Teoremas de Isomorfı́a 55
1.4.4. Ejercicios y Problemas de la Sección 1.4 57
1.5. Determinante, Teorema de Hamilton-Cayley 62
1.5.1. La acción de (Mn (R)[X], +) sobre Mn (R): Teorema de Hamilton-Cayley 70
1.5.2. Ejercicios y Probemas de la Sección 1.5 73

Capı́tulo 2.Ideales Primos y Maximales


(À la Recherche du Temps Perdu) 75
2.1. Elementos primos, irreducibles, dominios euclı́deos 76
2.1.1. Dominios de Ideales Principales: propiedades básicas y ejemplos 76
2.1.2. Existencia de Factorización en Primos en Dominios de Ideales Principales 80
2.1.3. Dominios Euclı́deos 82
2.1.4. Existencia de Factorización en Primos en Dominios Euclı́deos 86
2.1.5. Existen dominios de ideales principales que no son dominios euclı́deos:
Dedekind-Hasse (Opcional) 87
2.1.6. Divisiones del algoritmo de Euclides en Z 91
2.1.7. Eliminación Univariada Clásica. 93
2.1.8. Ejercicios de la Sección 2.1 99
2.2. Ideales Primos, Maximales 104
2.2.1. Ideales Primos y Maximales 104
2.2.2. La noción de rango de un R−módulo libre 108
2.2.3. Libres de Torsión sobre Dominios de Ideales Principales 110
2.2.4. Libres de Torsión sobre Dominios Euclı́deos (Opcional) 118
2.2.5. Ejercicios de la Sección 2.2 121
2.3. Dominios de Factorización Única: Lema de Gauss 126
2.3.1. Dominios de Factorización Única 126
2.3.2. El Lema de Gauss 131
2.3.3. Ejercicios de la Sección 2.3 137
2.4. Anillos e Ideales de la Geometrı́a 137
3
4 ÍNDICE

2.5. Formal Normal de Smith 144


2.5.1. Motivaciones 144
2.5.2. Matrices de Operaciones Elementales sobre DIP’s 145
2.5.3. Matrices elementales particulares 147
2.5.4. Orlar una matriz 150
2.5.5. “Algoritmo”:Hacer ceros por filas o columnas 151
2.5.6. Diagonalización de una matriz sobre un DIP: “algoritmo” 153
2.5.7. Resolución de Ecuaciones Lineales Diofánticas 155
2.5.8. Estructura de Grupos Abelianos Finitamente Generados 158
2.5.9. Ejercicios de la Sección 2.5 159

Capı́tulo 3. El Teorema Chino de los Restos


(..nanos gigantum humeris insidentes) 163
3.1. Introducción 163
3.2. El anillo producto y el TCR 163
3.3. El Teorema Chino de los Restos en el caso R = Z (Opcional) 166
3.3.1. En relación con el problema de Sun Tzu. 167
3.3.2. Una Aplicación en computación: Cálculo del Determinante por Algoritmos
Modulares. 168
3.3.3. Secretos Compartidos. 172
3.3.4. Ejercicios de la Sección 3.3 172
3.4. El Teorema Chino de los Restos en el caso R := K[X]. 173
3.4.1. La Forma Canónica de Jordan. 174
3.4.2. Teorı́a del Endomorfismo y el Máximo Común Divisor en K[X] (Opcional). 177
3.4.3. Ejercicios de la Sección 3.4 180

Capı́tulo 4. Nociones un poco más avanzadas: localización, radicales, categorı́as.


(Don’t Give up!) 185
4.1. Introducción 185
4.2. Local, Localización 186
4.2.1. Anillos Locales y Semi-locales: Gérmenes de Funciones 186
4.2.2. Localización 187
4.3. Ideal asociado a una variedad: radical y radical de Jacobson 188
4.3.1. Ideal de un Objeto Geométrico 188
4.3.2. Radical y Radical de Jacobson 190
4.4. Funciones vs Objetos 192
4.4.1. El Lenguaje de las Categorı́as. 192
4.4.2. Categorı́as 192
4.4.3. Functores y Equivalencias Naturales 193
4.4.4. Variación de un primer tema clásico: El Teorema de Stone–Cech 195
4.4.5. Variación de un segundo tema clásico: El Lema de Urysohn y el Teorema de
Extensión de Tietze. 196
4.4.6. Variación de un tercer tema clásico: Extensión de funciones en Variedades
Diferenciables 196
4.5. Cuestiones y Problemas 197

Part 2. La elegancia del pensamiento de E. Noether 199

Capı́tulo 5. Una Prueba Elemental de Nullstellensatz de Hilbert 201


5.1. Una demostración elemental del Nullstellensatz de Hilbert: Parte I 201
5.2. Un cambio de coordenadas útil 204
5.3. Tests de Nulidad para Polinomios. 205
5.3.1. El Test de Schwartz–Zippel. 206
5.3.2. Cuestores. 208
5.3.3. Witness Theorem. 208
5.3.4. Tests de Nulidad para Números Dados por Esquemas de Evaluación. 210
5.4. Una demostración elemental del Nullstellensatz de Hilbert: Parte II 210
5.4.1. Nullstellensatz de Hilbert 211
ÍNDICE 5

5.4.2. Nullstellensatz de Hilbert: Cuerpos finitos 212


5.4.3. Nullstellensatz: Identidad de Bézout 213
5.4.4. Nullstellensatz: Maximales 219
5.4.5. Nullstellensatz: Rabinowitsch 220

Capı́tulo 6. Anillos y Módulos Noetherianos: Primeras propiedades 223


6.1. Introducción 223
6.2. Diagramas Conmutativos, Complejos y Sucesiones Exactas 224
6.3. El Bi-functor HomR (−, −), localización, y propiedades locales 227
6.4. Anillos y Módulos Noetherianos 229
6.4.1. Condición de cadena ascendente para submódulos e ideales 229
6.4.2. El Teorema de la Base de Hilbert 231
6.5. Descomposición Primaria 234
6.5.1. Un par de resultados técnios peliminares: NAK y otros 234
6.5.2. Descomposicón Primaria: Teorema de Lasker–Noether 235
6.6. Temas Opcionales 239
6.6.1. Snake Lemma 239
6.6.2. Libres, Proyectivos, Inyectivos y Planos (Opcional) 240
6.7. Cuestiones y Problemas 240

Capı́tulo 7.Suplementos sobre Noetherianidad: Teorema de Unicidad, Espacios


Topológicos, Anillos y Módulos Artinianos 243
7.1. Introducción 243
7.2. Primer Teorema de Unicidad de la Descomposición Primaria: Asociados, Soporte 243
7.3. Espacios Topológiocs Noetherianos: Componentes Irreducibles 247
7.4. Anillos y Módulos de Artin 249
7.5. Dimensión de Krull 252
7.5.1. Dimensión de Krull en espacios topológicos noetherianos 254
7.6. Cuestions y Problemas 258

Part 3. Sublimando el pensamiento de Noether : Álgebra Local 259

Capı́tulo 8. EL Teorema de la Dimensión Local 261


8.0.1. El Polinomio de Hilbert-Samuel 261
8.0.2. Teorema de la Dimensión Local 268

Capı́tulo 9. Extensiones Enteras de Anillos: Going Up y Going Down 273


9.1. Extensiones Enteras de Anillos 273
9.2. Going–Up y Going–Down 273
9.2.1. Going–Up 274
9.2.2. Going–Down 274
9.3. Dimensión en K−álgebras: Normalización de Noether y álgebras Cohen-Macaulay 275
9.3.1. El Lema de Normalización de Noether 275
9.3.2. Grado y Normalización de Noether 282
9.4. Cuestiones y Problemas 283

Capı́tulo 10. El Teorema de la Función Implı́cita : Fibras de Levantamiento. 285


10.1. Introducción 285
10.2. Anillos y módulos topológicos : filtraciones y completados 287
10.2.1. Graduaciones y filtraciones a−ádicas 290
10.2.2. El Lema de Artin–Rees y el Teorema de la Intersección de Krull. 291
10.3. Propiedades del Completado : Anillos de Zariski. 292
10.4. Los Teoremas de División y Preparación de Weierstrass. 293
10.5. Anillos Locales Regulares. 295
10.5.1. Criterio del Jacobiano. 295
10.5.2. Teorema de Estructura de Cohen. 296
10.6. Teorema de la Función Implı́cita. 297
10.6.1. El Lema de Hensel. 297
6 ÍNDICE

10.6.2. El Operador de Newton No–Arquimediano 298


Apéndice A. Naı̈ve Set Theory
(la Nada y la palabra) 301
A.1. Algunas Consideraciones Preliminares 302
A.2. Conjuntos. Pertenencia. 303
A.2.1. Observaciones preliminares. 304
A.3. Inclusión de conjuntos. Subconjuntos, operaciones elementales. 304
A.3.1. El retı́culo P(X). 305
A.3.2. Leyes de Morgan. 305
A.3.3. Generalizaciones de Unión e Intersección. 306
A.3.4. Ejemplo: Conjuntos y Subconjuntos como Grafos No orientados. 306
A.3.5. Ejemplo: Marcas de teléfonos móviles 307
A.3.6. Ejemplo: un grafo infinito elemental. 307
A.4. Producto Cartesiano (list). Correspondencias y Relaciones. 307
A.4.1. Correspondencias. 308
A.4.2. Relaciones. 309
A.4.3. Relaciones de Orden= Clausura Transitiva de un grafo acı́clico orientado. 309
A.4.4. Relaciones de Equivalencia=Clausura Transitiva de Grafos. 312
A.4.5. Clasificando y Etiquetando elementos: Conjunto Cociente. 313
A.5. Aplicaciones. Cardinales. 314
A.5.1. Determinismo/Indeterminismo. 316
A.5.2. Imagen, Anti-imagen y otras propiedades. 317
A.5.3. Aplicaciones Biyectivas. Cardinales. 319
A.6. Ejercicios y Problemas 321
Apéndice. Bibliografı́a 323
Part 1

Álgebra Conmutativa para


pre-universitarios
CAPı́TULO 1

Algunos Prerequisitos de Álgebra


(...all novelty is but oblivion)

Está bien que se mida con la dura


sombra que una columna en el estı́o
arroja o con el agua de aquel rı́o
en que Heráclito vio nuestra locura
...
La arena de los ciclos es la misma
e infinita es la historia de la arena;
...
la invulnerable eternidad se abisma.
...
Todo lo arrastra y pierde este incansable
hilo sutil de arena numerosa.
No he de salvarme yo, fortuita cosa
De tiempo, que es materia deleznable.

Solomon saith,
There is no new thing upon the earth.
So that as Plato had an imagination,
That all knowledge was but remembrance;
so Solomon giveth his sentence:
That all novelty is but oblivion.
(R. Bacon)

Índice
1.1. Semigrupo, monoide, grupo, acciones 10
1.1.1. Las Nociones Básicas 10
1.1.2. Acciones de un Grupo 15
1.1.3. Ejercicios de la Sección 1.1 19
1.2. El Grupo Simétrico 21
1.2.1. Las Permutaciones son composición de ciclos: Órbitas 21
1.2.2. Índice de una Permutación 26
1.2.3. Ejercicios y Problemas de la Sección 1.2 28
1.3. Anillos, Ideales, Morfismos de Anillos 30
1.3.1. Anillos de Polinomios y de Series de Potencias Formales en varias variables 37
1.3.2. Otros ejemplos 41
1.3.3. Ejercicios y Problemas de la Sección 1.3 42
1.4. Módulos, Submódulos, Morfismos de Módulos 45
1.4.1. Operaciones Básicas con Submódulos e Ideales 48
1.4.2. Módulos Libres y Bases 51
1.4.3. Teoremas de Isomorfı́a 55
1.4.4. Ejercicios y Problemas de la Sección 1.4 57
1.5. Determinante, Teorema de Hamilton-Cayley 62
1.5.1. La acción de (Mn (R)[X], +) sobre Mn (R): Teorema de Hamilton-Cayley 70
1.5.2. Ejercicios y Probemas de la Sección 1.5 73

9
10 1. PRE-ÁLGEBRA

1.1. Semigrupo, monoide, grupo, acciones


1.1.1. Las Nociones Básicas. Comencemos recordando algunas nociones básicas
Definición 1 (Semi-grupo, Monoide). Un semigrupo es un par (S, ∗), donde S es un con-
junto no vacı́o y ∗ es una aplicación
∗: S×S −→ S
(a, b) 7−→ a ∗ b,
Donde S × S = {(x, y) : x, y ∈ S} es el producto cartesiano de S consigo mismo y, además,
verifica la siguiente propiedad:
Propiedad Asociativa: (x ∗ y) ∗ z = x ∗ (y ∗ z), ∀x, y, z ∈ S.
A la aplicación ∗ se la denomina Operación Interna del semi-grupo. Un semigrupo (S, ∗) se
denomina monoide si verifica la siguiente propiedad adicional:
Existencia de Elemento Neutro: ∃e ∈ S, e ∗ x = x ∗ e = x, ∀x ∈ S.
Al elemento e, si existe, se le denomina Elemento Neutro del monoide.
Un semigrupo (o un monoide) (S, ∗) se dice conmutativo o abeliano si verifica la siguiente
propiedad adicional:
Propiedad Conmutativa: ∀x, y ∈ S, x ∗ y = y ∗ x.

Proposición 1.1.1. Si (S, ∗) es un monoide, el elemento neutro es único y suele denotarse


mediante eS o, simplemente, e o 1 si no hay confusión en el lenguaje.
Demostración. Sea e1 y e2 son dos elementos de S neutros en el sentido de la definición
precedente, tendremos que
e1 e2 = e1 porque e2 es neutro,
mientras que
e1 e2 = e2 porque e1 es neutro,
Con lo que hemos concluido que e1 = e2 como se indica en el enunciado. 

Definición 2 (Morfismo de semi-grupos, monoides). Un morfismo entre dos semigrupos


(S, ∗), (T, ⊥) es una aplicación entre los respectivos conjuntos:
f: S −→ T
a 7−→ f (a),
que derifica la siguiente propiedad:
f (x ∗ y) = f (x) ⊥ f (y).
Un morfismo entre dos monoides (M, ∗), (N, ·), con respectivos elementos neutros eM y eN , es
un morfismo de semi-grupos fM −→ N que verifica, además, la siguiente propiedad:
f (eM ) = eN .

Ejemplo 1.1.2. El conjunto (Nn , +) es un monoide conmutativo con la operación:


+ : Nn × Nn −→ Nn ,
dada mediante:
(µ1 , . . . , µn ) + (θ1 , . . . , θn ) := (µ1 + θ1 , . . . , µ1 + θ1 ).
Más aún, la siguiente aplicación es un morfismo de monoides entre (Nn , +) y (N, +), llamada
grado: | · | : Nn −→ N, dada mediante
|(µ1 , . . . , µn )| = µ1 + · · · + µn .
A los elementos de Nn , en este contexto, se les suele llamar exponentes o exponentes monomi-
ales.
1.1. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 11

Definición 3 (Grupo). Un grupo es un monoide (G, ∗) que verifica la siguiente propiedad


adicional:
Existencia de Inverso: ∀x ∈ G, ∃x0 ∈ G, x ∗ x0 = x0 ∗ x = eG ,
donde eG es el elemento neutro de (G, ∗). Para cada x ∈ G, todo elemento x0 tal que x0 ∗ x =
x0 ∗ x = eG se denomina inverso de x y se denota x−1 . Un grupo abeliano es un grupo cuyo
monoide subyacente es conmutativo.
Ejemplo 1.1.3. El conjunto (Zn , +) con la operación:
+ : Zn × Zn −→ Zn ,
dada mediante:
(µ1 , . . . , µn ) + (θ1 , . . . , θn ) := (µ1 + θ1 , . . . , µ1 + θ1 ),
es un grupo abeliano.

Notación 1.1.4 (Notación para Grupos Abelianos). Es habitual que los grupos abelianos
se representen mediante notación aditiva. Es decir, se suelen presentar mediante la forma
“(G, +) es un grupo abeliano”. El elemento neutro de un grupo abeliano (G, +) se suele denotar
mediante 0G o, simplemente, 0, cuando no haya confusión. Para cada elemento g ∈ G de un
grupo abeliano (G, +) el inverso de g se denomina “el opuesto de g” y se suele denotar mediante
−g.

Proposición 1.1.5. Si (G, ·) es un grupo, cada elemento x ∈ G posee un único elemento


inverso.
Demostración. Ya hemos visto que (G, ·) posee un único elemento neutro. Ahora supong-
amos que x ∈ G posee dos posiles elementos neutros x0 , x00 ∈ G. Por la propiedad asociativa se
tiene:
x0 = x0 · e = x0 · (x · x00 ) = (x0 · x) · x00 = e · x00 = x00 .
Y se tiene el enunciado. 
Definición 4 (Subgrupo). Dado un grupo (G, ∗), un subgrupo es un subconjunto no vacı́o
G1 ⊆ G tal que se verifica la siguiente propiedad:
∀x, y ∈ G1 , xy −1 ∈ G1 .

Definición 5 (Morfismo de grupos). Un morfismo de grupos es un morfismo de monoides.


Dados dos grupos (G, ∗), (H, ⊥), un morfismo entre estos dos grupos es un morfismo entre los
subyacentes monoides. Es decir, f : (G, ∗) −→ (H, ⊥) es morfismo de grupos si f (eG ) = eH y
∀x, y ∈ G, f (x ∗ y) = f (x) ⊥ f (y).

Proposición 1.1.6. Si ϕ : (G, ∗) −→ (H, ⊥) es un morfismo entre dos grupos, entonces,


−1
∀x, y ∈ G, ϕ(x ∗ y −1 ) = ϕ(x) ⊥ (ϕ(y)) .
En particular, los morfismos de grupos transforman los inversos de los elementos del primer
grupo, en inversos de la imagen.
Demostración. Basta con que que los morfismos de grupo transforman inversos en in-
versos. Supongamos ϕ : (G, ∗) −→ (H, ⊥) un morfismo de grupos y sea g ∈ G, entonces,
−1
ϕ(g −1 ) = (ϕ(x)) .
Para verificarlo, baste con observar que
ϕ(g) ⊥ ϕ(g −1 ) = ϕ(g ∗ g −1 ) = ϕ(eG ) = eH ,
y
ϕ(g −1 ) ⊥ ϕ(g) = ϕ(g −1 ∗ g) = ϕ(eG ) = eH .

12 1. PRE-ÁLGEBRA

Proposición 1.1.7. Sea f : (G, ∗) −→ (H, ⊥) un morfismo de grupos. Sean S ⊆ G y T ⊆ H


dos subgrupos de G y H respectivamente. Entonces, tambiéon se tiene que f (S) es subgrupo de
H y f −1 (T ) es subgrupo de G.
Entre los subgrupos obtenidos como imagen y anti-imagen de subrgupos por morfismos de grupos,
son destacables el núcleo y la imagen, respectivamente definidos mediante:
ker(f ) := f −1 ({eH }) := {x ∈ G : f (x) = eH }.
Im(f ) := f (G).
Demostración. Queda como ejercicio. 
Observación 1.1.8 (La terminologı́a de los morfismos). En ocasiones se encuentra la ter-
minologı́a homomorfismo en lugar de morfismo que hemos usado en la Definición precedente.
Esta terminologı́a irá acompañada de sufijos “de monoide”, “de grupo”, “de espacios vectori-
ales” etcétera. Pero, a la hora de clasificar o comprender los morfismos son también importantes
los prefijos. Consideraremos algunos usuales. Ası́, sea
f : X −→ Y,
un morfismo de alguna clase. Se pueden clasificar:
• Endo–: se usa la forma “endomorfismo”, cuando X = Y ,
• Mono–: se usa a menudo la forma “monomorfismo”, cuando exista g : Y −→ X
aplicación, tal que g ◦ f = IdX , donde ◦ es la composición e IdX es la identidad sobre
X. Esto es equivalente a inyectividad siempre que la categorı́a tenga como sustrato
la Categorı́a de Conjuntos. En otros casos, se usa una definición alternativa (ver más
abajo) y se dice, para esta noción, que es un morfismo inyectivo.
• Epi–: se usa a menudo en la forma “epimorfismo”, cuando exista g : Y −→ X
aplicación, tal que f ◦g = IdY , donde ◦ es de nuevo la composición e IdY es la identidad
sobre Y . Esto es equivalente a suprayectividad siempre que la categorı́a tenga como
sustrato la Categorı́a de Conjuntos. En otros casos, se usa una definición alternativa
(ver más abajo) y se dice, para esta noción, que es un morfismo suprayectivo.
• Iso–: se usa en la forma “isomorfismo”, cuando exista g : Y −→ X morfismo (de la
clase que corresponda), tal que
f ◦ g = IdY , g ◦ f = IdX .
Este es el uso habitual en todas las categorı́as, independientemente del sustrato. En
muchos casos, isomorfismo es equivalente a ser inyectivo y biyectivo a la vez.
• Auto–: se usa bajo la forma “automorfismo” y es automorfismo cuando es endomor-
fismo e isomorfismo a la vez.
Observación 1.1.9 (Isomorfismos en Topologı́a: homeomorfismos). En Topologı́a se usa
la noción de “aplicación continua” en lugar de morfismo, “aplicación continua inyectiva” en lugar
de morfismo inyectivo, “aplicación continua suprayectiva” en lugar de morfismo suprayectivo
y, un término que no debe confundirse, “homeomorfismo” en lugar de isomorfismo. Pero son
nociones indénticas, aunque con nombres distintos sólo porque a los topólogos les gustarı́a
diferenciarse. Lo que no es diéntico en Topologı́a es la equivalencia entre isomorfismo y morfismo
biyectivo. Por ejemplo, es obvio que existe una aplicación biyectiva entre el intervalo [0, 1) y la
esfera unidad S 1 . Además es continua y viene dada mediante:
exp : [0, 1) −→ S1
t 7−→ e2πti .
Es continua, biyectiva, pero no es homeomorfismo porque su inversa no es continua. Es decir,
en general, isomorfismo no ha de coindicir con morfismo inyectivo y suprayectivo a la vez.

Observación 1.1.10 (Isomorfismo en Geometrı́a Diferencial: Difeomorfismo). En Ge-


ometrı́a Diferencial se puede usar la noción de “aplicación diferenciable” en lugar de morfismo,
“aplicación diferenciable inyectiva” en lugar de morfismo inyectivo, “aplicación diferenciable
suprayectiva” en lugar de morfismo suprayectivo y “difeomorfismo” en lugar de isomorfismo.
Sin embargo, en Geometrı́a Diferencial es muy importante compaginar el comportamiento como
aplicación con el comportamiento sobre el espacio tangente, con lo que tendremos, inmersiones,
embebimientos y submersiones con especiales definiciones y propiedades.
1.1. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 13

En Teorı́a de Grupos, como en las categorı́as generales, se usan formas especiales de las nociones
de monomorfismo y epimorfismo, que discutimos en la Definición siguiente.

Definición 6 (Monomorfismos y Epimorfismos entre Grupos, en el lenguaje de


categorı́as). Sea f : (G, ∗) −→ (H, ⊥) un morfismo de grupos.
i) Monomorfismo de Grupos: Decimos que f es un monomorfismo de grupos si para todo
grupo (T, ?) y cualesquiera dos morfismos α1 , α2 : (T, ?) −→ (G, ∗), se tiene:
f ◦ α1 = f ◦ α1 =⇒ α1 = α2 .
ii) Epimorfismo de Grupos: Decimos que f es un monomorfismo de grupos si para todo
grupo (T, ?) y cualesquiera dos morfismos α1 , α2 : (H, ⊥) −→ (T, ?), se tiene:
α1 ◦ f = α1 ◦ f =⇒ α1 = α2 .

Para mejor recordar estas nociones, consideremos los siguientes dos diagramas que reflejan la
condición de monomorfismo y epimorfismo:
• Con las anteriores notaciones, f es monomorfismo si para todo grupo (T, ?) y cua-
lesquiera dos morfismos α1 , α2 : (T, ?) −→ (G, ∗), si el siguiente diagrama es conmu-
tativo:
(T, ?)

α1

f
IdT  (G, ∗) (H, ⊥)

α2

(T, ?)

entonces, α1 = α2 .
• Con las anteriores notaciones, f es epimorfismo si para todo grupo (T, ?) y cualesquiera
dos morfismos α1 , α2 : (H, ⊥) −→ (T, ?), si el siguiente diagrama es conmutativo:
(T, ?)

α1

f
(G, ∗) (H, ⊥)  IdT

α2

(T, ?)

entonces, α1 = α2 .
Proposición 1.1.11. Con las anteriores notaciones, sea f : (G, ∗) −→ (H, ⊥) un morfismo de
grupos.
i) El morfismo f es morfismo inyectivo si y solamente si
ker(f ) := {x ∈ G : f (x) = eH } = {eG }.
ii) El morfismo f es monomofismo (en el sentido de categorı́a de grupos) si y solamente
si f es morfismo inyectivo.
iii) (Teorema de Schreier) El morfismo f es epimorfismo (en el sentido de categorı́a
de grupos) si y solamente si f es un morfismo suprayectivo.
Demostración. Demostraremos cada ı́tem separadamente:
14 1. PRE-ÁLGEBRA

i) Es evidente que si f es inyectiva ker(f ) = {eG }. Recı́procamente, si ker(f ) = {eG },


supongamos que tenemos x, y ∈ G tales que f (x) = f (y). Entonces, xy −1 ∈ ker(f ) y,
por tanto, x = y con lo que tenemos la inyectividad.
ii) Si f es inyectiva, se verifica obviamente la propiedad indicada con lo que tenemos la
implicación ⇐=. Recı́procamente, supongamos que f es un monoformismo de gru-
pos. Consideremos ker(f ) con la operación inducida por la de (G, ∗) como grupo y
consideremos los siguientes dos morfismos:
α1 : (ker(f ), ∗) ,→ (G, ∗)
x 7 →
− x,

α2 : (ker(f ), ∗) ,→ (G, ∗)
x 7 →
− eG .
Es decir, α1 es la inclusión y α2 es claramente la “aplicación nula”, en el sentido de
que va siempre al elemento neutro. Entonces, es obvio que f ◦ α1 = f ◦ α2 . Por tanto,
si f es monomorfismo, α1 = α2 y, necesariamente, ker(f ) ⊆ {eG }.
iii) Para Demostrar el Teorema de Schreier, veamos algunos detalles. En primer lugar, es
obvio que si f es suprayectiva, entonces, se verifica la condición de epimorfismo. El
Teorema de Schreier es justamente la prueba del recı́proco. Consideremos el subrgupo
L := Im(f ) := f (G), subgrupo de H y supongamos que existe a ∈ H \ L. Consider-
emos el conjunto de las clases a izquierda módulo L (nótese que no hemos supuesto
que L sea subgrupo normal, luego no es el cociente) junto, y de manera disjunta, el
elemento a ∈ H \ L, es decir:

X := {xL : x ∈ H} {a},

donde ∪˙ sgnifica unión disjunta. Sea (S (X), ◦) el grupo de las permutaciones del
conjunto X con la composición ◦ como operación. Definamos la siguiente permutación
sobre X:
σ: X −→  X
 a, si s = L = eH L ∈ X,
s 7−→ σ(s) := L, si s = a,
s, en el resto de los casos.

Definamos dos morfismos φ, ψ : (H, ⊥) −→ (S (X), ◦) del modo siguiente:


φ: H −→ S (X)
x 7−→ φ(x) := φx ∈ S (S),
donde la permutación φx viene dada por:
φx : X −→  X
xyL, si s = yL,
s 7−→
a, si s = a
De otro lado definamos
ψ: H −→ S (X)
x 7−→ σ ◦ φx ◦ σ −1 ∈ S (S),
Ahora hay que probar la siguiente afirmación:
(1.1.1) L = {z ∈ H : φ(z) = ψ(z)}.
Dejamos para más abajo la prueba de esta afirmación y damos por obvio que ambos son
morfismos de grupos. Asumiendo esta igualdad, veamos que φ ◦ f = ψ ◦ f . Pues si x ∈ G, sea
entonces y = f (x) ∈ Im(f ) = f (G) = L. Pero como φ(y) = ψ(y), para todo y ∈ L, tendremos
que φ ◦ f (x) = ψ ◦ f (x) para cualquier x ∈ G, luego φ ◦ f = ψ ◦ f y como f es epimorfismo,
concluiremos que ψ = φ. En particular, tenemos que φ(a) = ψ(a), con lo que a ∈ L, a pesar de
que nuestra hipótesis era que a 63 L, llegando a contradicción.
Demostración de la igualdad (1.1.1):
1.1. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 15

• Demostración del contenido L ⊆ {z ∈ H : φ(z) = ψ(z)}: Sea z ∈ L. Por definición


de φ, tenemos que φz (s) = φz (yL) = (zy)L para cada s = yL ∈ X y φz (a) = a. De
otro lado,
ψ(z) := σ ◦ φz ◦ σ −1 ∈ S (X).
Entonces, si s = yL ∈ X \ {a}, con y ∈ H, tenemos que s 6= L si y solamente si
y 6∈ L = Im(f ). En este caso, σ(s) = s y σ −1 (s) = s, y se tiene:
ψ(z)(s) = σ ◦ φz ◦ σ −1 (yL) = σ ◦ φz (yL) = σ ((zy)L) .
De nuevo, (zy)L 6= a y (zy)L 6= L. La primera afrimación es obvia, la segunda se
basa en el hecho de que z ∈ L. Pues si (zy)L = L es porque zy ∈ L, como z ∈ L,
esto implicarı́a que y ∈ L y hemos supuesto que yL 6= L. Por tanto, tendremos que si
s = yL ∈ X \ {L, a}, con y ∈ Hse tiene:
ψ(z)(s) = σ ((zy)L) = (zy)L = φz (yL).
En los dos casos que quedan, es obvio, por las definiciones de las funciones, que:
ψ(z)(a) = φz (a),
y
ψ(z)(L) = φz (L).
Con ello hemos probado que las dos permutaciones ψ(z) y φz coinciden en todo punto
s ∈ X y, por tanto, ψ(z) = φz , cuando z ∈ L.
• Demostración del contenido L ⊇ {z ∈ H : φ(z) = ψ(z)}: Sea z ∈ H y supongamos
que z 6∈ L = Im(f ). Tenemos que
ψ(z)(a) = σ ◦ φz ◦ σ −1 (a) = σ ◦ φz (L) = σ(zL).
Como z 6∈ L, entonces zL 6= L y, por tanto, σ(zL) = zL. De otro lado,
φz (a) = a,
y habremos probado que ψ(z) 6= φz , con lo que hemos probado el contenido buscado.


1.1.2. Acciones de un Grupo.


Definición 7 (Acción de un grupo). Sea X un conjunto y (G, ∗) un grupo. Una acción de
G sobre X es una aplicación:
·G : G × X −→ X
(g, x) 7−→ g · x,
verificando
i) Dados cualesquiera g1 , g2 ∈ G y x ∈ X se tiene:
g1 ·G (g2 ·G x) = (g1 ∗ g2 ) ·G x.
ii) Si e ∈ G es el elemento neutro de G se tiene, para cada x ∈ X:
e · x = x.

Observación 1.1.12. Unos pocos comentarios preliminares:


i) La primera de las propiedades indicadas en la definición indica que se tiene una cierta
asociativiodad entre la operación de grupo ∗ y la acción ·. Por eso se suelen denotar
con el mismo sı́mbolo (i.e. escribir (G, ·) para el grupo y ·G para la acción “externa”
del grupo sobre el conjunto X. Progresivamente iremos suprimiendo el sı́mbolo · de
las operaciones, siempre que no genere confusión alguna.
ii) Un ejemplo de acción es la llamada acción a izquierda de un grupo (G, ·) sobre sı́
mismo:
·G : G × G −→ G
(g, x) 7−→ g · x.
16 1. PRE-ÁLGEBRA

iii) Junto a las acciones a izquierda se suelen introducir las acciones “a derecha”. Una
acción a derecha es una transformación
·G : G × X −→ X
(g, x) 7−→ x · g,
verificando
(a) Dados cualesquiera g1 , g2 ∈ G y x ∈ X se tiene:
(x ·G g1 ) ·G g2 = x ∗ ·G (g1 ∗ g2 ) .
(b) Si e ∈ G es el elemento neutro de G se tiene, para cada x ∈ X:
e · x = x.
iv) Consideremos el grupo simétrico sobre un conjunto X, (S (X), ◦) con la operación
dada de la forma siguiente:
◦ : S (X) × S (X) −→ S (X)
(1.1.2)
(σ, τ ) 7−→ σ ◦ τ.
De manera natural define una acción sobre el conjunto X mediante:
◦S : S (X) × X −→ X
(1.1.3)
(σ, x) 7−→ σ(x).
Se trata de una acción a izquierda sobre X. Nótese que hemos “invertido” la forma
en la que algunos autores presentan la operación en el grupo simétrico. Lo hacemos
para preservar la acción a izquierda que define.
v) Las acciones a izquierda y a derecha están relacionadas de modo obvio. Si R : G ×
X −→ X es una acción a derecha de un grupo G sobre un conjunto X, la siguiente es
una acción a izquierda:
L := R−1 : G × X −→ X
(g, x) 7−→ xRg −1 .
Esto determina una biyección entre ambos tipos de acciones. En lo que queda nos
ocupamos sólo de acciones a izquierda.

Definición 8 (Órbitas). Sea (G, ·) un grupo, M un conjunto, eG : G × M −→ M una acción


de grupo, S ⊆ G un subgrupo, N ⊆ M un subconjunto y x ∈ M un elemento. Definimos las
diferentes órbitas:
i) Definimos la órbita definida por S sobre N mediante:
OS (N ) := {gx : g ∈ S, x ∈ N }.
ii) Para cada elemento x ∈ X, se define la órbita a izquierda de x por la acción de S al
conjunto:
OS (x) := {gx : g ∈ S}.

Observación 1.1.13. Varios comentarios sobre la acción de grupo y las órbitas.


i) Obviamente se tiene la siguiente igualdad:
[
OS (N ) := OS (x).
x∈N

ii) Dada la acción de un grupo sobre sı́ mismo, las órbitas (por la acción a la izquierda)
de un elemento σ ∈ G con respecto a un subgrupo S ⊆ G serán las clases a derecha,
es decir, se trata de:
OS (σ) := Sσ := {gσ : g ∈ S}.
En este caso, también se pueden considerar las órbitas a la derecha (interpretando la
acción a la derecha):
(R)
OS (σ) := σS := {σg : g ∈ S}.
Esta es la notación más habitual para las clases módulo un subgrupo. En el caso de
subgrupos normales se estudia la realción entre ambos tipos de clases.
1.1. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 17

iii) La relación de semejanza de matrices. Sea K un cuerpo, Mn (K) el conjunto de las


matrices n × n con coordenadas en K y GL(n, K) el grupo general lineal sobre K.
Entonces, tenemos la acción de GL(n, K) sobre Mn (K) dado mediante:
·GL(n,K) : GL(n, K) × Mn (K) −→ Mn (K)
(P, A) 7−→ P AP −1 ,
Las órbitas, en este caso, es el conjunto de las matrices semejantes a la matriz A.

Proposición 1.1.14. Sea (G, ·) un grupo y sea


G × X −→ X
una acción del grupo G sobre un conjunto X no vacı́o. Sea S ⊆ G un subgrupo. Entonces, la
clase siguiente, define una partición de X y, en particular, una relación de equivalencia:
{OS (x) : x ∈ X}.
En particular, se verifica para cada par de elementos x, y ∈ X:
\
OS (x) OS (y) 6= ∅ ⇐⇒ OS (x) = OS (y).
La relación de equivalencia está, obviamente definida por las ŕobitas del modo siguiente:
x ∼ y ⇐⇒ OS (x) = OS (y).
El conjunto cociente son, obviamente, las órbitas.
Demostración. Bastará con que probemos la siguiente propiedad:
Si z ∈ OS (x) ∩ OS (y) ⇐= y ∈ OS (x). Para probarlo, tenemos que existen σ1 , σ2 ∈ S tales que:
z = σ1 (x) = σ2 (y).
Por tanto,
y = σ2−1 (x) = σ2−1 (σ1 (x)) = σ2−1 · σ1 (x) ∈ OS (x),


puesto que, al ser S subgrupo, σ2−1 · σ1 ∈ S. A partir de aquı́, es obvio que si yOS (x), entonces,
σ(y) ∈ OS (x) para cada σ ∈ S (S es subgrupo de G). Con lo que hemos probado que si:
∃z ∈ OS (x) ∩ OS (y) ⇐= OS (y) ∈ OS (x).
Cambiando la prueba (“mutatis mutandis”) los papeles jugados por x e y, concluiremos que
también se verifica:
∃z ∈ OS (x) ∩ OS (y) ⇐= OS (x) ∈ OS (y).
Por tanto, hemos probado:
\
OS (x) OS (y) 6= ∅ ⇐= OS (x) = OS (y).
El recı́proco es obviamente cierto, con lo que tenemos la equivalencia.
Supondremos, abusando del Axioma de Elección, que podemos elegir representantes “canónicos”
de cada órbita, es decir, eligiendo elementos {xi : i ∈ I} ⊆ X tales que
{OS (xi ) : i ∈ I} = {OS (x) : x ∈ X},
verificando
Ox (xi ) ∩ OS (xj ) = ∅ ⇐⇒ i 6= j.
Tenemos ası́ la partición buscada
[ ˙
X= OS (xi ),
i∈I
que define una relación de equivalencia sobre X, cuyas clases de equivalencia son las órbitas.
Obviamente, se tendrá que
x ∼ y ⇐⇒ OS (x) = OS (y).

Observación 1.1.15. La parte usualmente difı́cil cuando se trata de acciones de grupos sobre
conjuntos es la determinación de las órbitas y, en particular, la determinación de representantes
significativos (llamados “canónicos”) de cada una de las órbitas. Entre los ejemplos se puden
ver varias acciones de grupo y se trata de determinar representantes canónicos de las órbitas,
para lo que los alumnos han sido adiestrados en diversas asignaturas precdentes a ésta.
18 1. PRE-ÁLGEBRA

Definición 9 (Acciones Transitivas y Fieles). Una acción de un grupo (G, ·) sobre un


conjunto M dad mediante ·G : G × M −→ M se dice transitvia si verifica:
∀x, y ∈ M, ∃g ∈ G, g · x = g · y.
La acción se llama fiel si verifica:
∀g1 , g2 ∈ G, ∃x ∈ M, g1 · x 6= g2 · x.

Proposición 1.1.16. Sea (G, ·) un grupo y ·G : G × M −→ M una acción a izquierda de G


sobre el conjunto M . Entonces, se tiene:
i) Para cada g ∈ G, la acción permite definir la “traslación por g a la izquierda”, del
modo siguiente:
Lg : M −→ M
m 7−→ g · m.
Entonces, Lg es una biyección de M .
ii) El siguiente es un morfismo de grupos, donde (S (M ), ◦) es el grupo simétrico con la
composición (ver Sección siguiente):
L: (G, ·) −→ (S (M ), ◦)
g 7−→ Lg .
iii) Si la acción es fiel, entonces, L es un monomorfismo de grupos y, en particular, G se
identifica con un subgrupo del grupo simétrico S (M ).
Demostración. Baste observar la identidad siguiente y dejar la prueba como ejercicio:
−1
(Lg ) = Lg−1 , ∀g ∈ G.

Definición 10 (Estabilizador de un elemento). Sea (G, ·) un grupo, X un conjunto y
·G : G × X −→ X una acción de G sobre X. Sea x ∈ X un elemento. Definimos el estabilizador
de x con respecto a la acción de ·G como el subgrupo de G dado mediante:
StabG (x) := {g ∈ G : g ·G x = x}.

Es, obviamente, un subgrupo de G.

Proposición 1.1.17. Sea (G, ·) un grupo, X un conjunto y ·G : G × X −→ X una acción de


G sobre X. Supongamos que la acción ·G es transitiva.
i) Sea x0 ∈ X un elemento cualquiera de X y sea S := StabG (x0 ). Entonces, X es
biyectable al conjunto de clases definido por S en G1. Es decir, existe una biyecciń
natural entre X y el conjunto:
G/ ∼S := {aS : a ∈ G}.
ii) Si, además, existiera un punto y0 ∈ X tal que su estabilizador T := StabG (y0 ) es
subgrupo normal de G, el conjunto X serı́a biyectable a un grupo cociente: G/T .
Demostración. Probemos la afirmación i). Para ello, consideremos la siguiente aplicacón:
ϕ : G −→ X
g 7−→ gx0
La aplicación ϕ es suprayectiva. Para hacerla inyectiva consideraremos las clases de G/ ∼S . Es
decir definimos:
Φ : G/ ∼S := {gS : g ∈ G} −→ X
gS 7−→ gx0 .
Lo primero es ver que está bien definida, es decir, que es aplicación. Claramente se tiene que el
dominio y el rango son los apropiados, ası́ que tenemos una correspondencia y sólo queda por
ver que la imagen de cada clase gS es única. Ahora bien, supongamos g 0 ∈ gS un elemento tal
1Nótese que un subgrupo S de un grupo G define una relación de equivalencia mediante a ∼ b sii a−1 b ∈ S.
S
Pero el conjunto cociente G/ ∼S , formado por las clases de equivalencia, no necesariamente es un grupo con la
operación natural. Para ello es necesario que S sea subgrupo normal.
1.1. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 19

que g 0 S = gS o, equivalentemente, g 0 ∼S g. Entonces, g 0 = gτ donde τ ∈ S = StabG (x0 ). Por


tanto,
g 0 x0 = (gτ )x0 = g(τ x0 ) = gx0 ,
donde hemos usado que τ x0 = x0 por estar en el estabilizador. La suprayectividad es clara
porque ϕ es suprayectiva (o, equivalentemente, porque la acción es transitiva). En cuanto
a la inyectividad de Φ, nótese que si Φ(gS) = Φ(g 0 S) es porque gx0 = g 0 x0 , en particular
(g 0 )−1 gx0 = x0 y (g 0 )−1 g está en el estabilizador de x0 , lo que significa (g 0 )−1 g ∈ S y g 0 S = gS.
Para la afirmación ii), simplemente nótese que la afirmación i) no depende del punto x0 elegido.
Si, además, y0 es tal que su estabilizador es un subgrupo normal, entonces G/ ∼T tiene es-
tructura de grupo cociente, que suele denotarse por G/T (ver Problema 7 más adelante). Por
tantom el conjunto X es, en realidad, un cociente G/T camuflado. 

1.1.3. Ejercicios de la Sección 1.1.


Problema 1. Considerar el conjunto Nn y sobre él la estructura de monoide definida mediante
la suma coordenada a coordenada (Nn , +). Consideremos la aplicación grado definida sobre Nn
del modo siguiente:
| · | : Nn −→ N,
definida para cada µ := (µ1 , . . . , µn ) ∈ Nn , entonces
|µ| := µ1 + · · · + µn ∈ N.
A la aplicación | · | se la denomina grado total del multi-ı́ndice (o exponente monomial) µ. Se
pide:
i) Probad que, efectivamente, (Nn , +) es un monoide.
ii) Hay que probar que el par (2Z, ·), donde 2Z son los enteros pares y · es el producto.
Pruébese que se trata de un semi-grupo que no es monoide.
iii) Probad la siguiente igualdad para cada d ∈ N:
 
n d+n−1
]{µ ∈ N : |µ| = d} = .
n−1
Problema 2. Pruébese la Proposición 1.1.7 anterior.
Problema 3. Verifica que un morfismo de grupos f : (G, ∗) −→ (H, ⊥) es biyectivo si y
solamente si es isomorfismo, es decir, si y solamente si existe otro morfismo de grupos f 0 :
(H, ⊥) −→ (G, ∗) tal que:
f ◦ f 0 = IdH , f 0 ◦ f = IdG ,
donde ◦ denota composición de aplicaciones e IdG , IdH son, respectivamente, los morfismos
identidad. Concluir que un isomorfismo es un morfismo que es monomorfismo y epimorfismo
en el sentido de la Definición 6.
Problema 4. Hay que probar que si (G, ∗) es un grupo y G1 ⊆ G es un subgrupo, entonces el
neutro eG ∈ G1 .
Problema 5. Consideremos el conjunto O(n) de las matrices n × n ortogonales sobre R. Es
decir,
O(n) := {O ∈ Mn (R) : Ot = O−1 },
donde O∗ es la transpuesta de O. Se pide:
i) Se debe probar que (O(n), ·) es un grupo con la operación producto de matrices.
ii) Se tiene que probar que la siguiente es una acción de O(n) sobre Mn (R):
·O : O(n) × Mn (R) −→ Mn (R)
(O, M ) 7−→ OM Ot .
iii) Determinar las órbitas de una matriz M ∈ Mn (R) simétrica e identificarlas con alguna
relación de equivalencia entre matrices. ¿Existe algún representante canónica de esa
clase de equivalencia?. ( Hint: Buscad en internet (o en vuestra bibliografı́a personal
o apuntes) la Factorización de Schur real de matrices reales y explicar qué tiene que
ver con este enunciado).
20 1. PRE-ÁLGEBRA

Problema 6. Consideremos el conjunto U (n) de las matrices n × n unitarias sobre C. Es


decir,
U (n) := {U ∈ Mn (C) : U ∗ = U −1 },
donde U ∗ es la transpuesta de la conjugada de U . Se pide:
i) Probad que (U (n), ·) es un grupo con la operación producto de matrices.
ii) Probad que la siguiente es una acción de U (n) sobre Mn (C):
·U : U (n) × Mn (C) −→ Mn (C)
(U, M ) 7−→ U M U ∗.
iii) Determinar las órbitas de una matriz M ∈ Mn (C) e identificarlas con alguna relación
de equivalencia entre matrices. ¿Existe algún representante canónica de esa clase de
equivalencia?. ( Hint: Buscad en internet (o en vuestra bibliografı́a personal o apuntes)
la Factorización de Schur de matrices complejas y explicar qué tiene que ver con este
enunciado).
Problema 7 (Subgrupo Normal). Sea (G, ∗) un grupo y G1 un subgrupo. Decimos que G1
es un subgrupo normal de G si verifica la siguiente propiedad adicional:
∀x ∈ G, xG1 x−1 := {x ∗ g ∗ x−1 : g ∈ G1 } ⊆ G1 .
Probad que las siguientes propiedades son equivalentes:
i) G1 es un subgrupo normal de (G, ∗),
ii) ∀x ∈ G, xG1 x−1 = G1 ,
iii) ∀x ∈ G, xG1 = {x ∗ g : g ∈ G1 } = {g ∗ x : g ∈ G1 } = G1 x.
Hay que probar que para todo morfismo de grupos, el núcleo es un subgrupo normal.
Problema 8. Se debe probar que todo subgrupo de un grupo abeliano es un subgrupo normal.
Buscar un ejemplo de un grupo donde no se dé esta propiedad (Pista: Intentarlo con S3 y el
subgrupo H = {Id, (1 2)}).
Problema 9. Probad que todo grupo finito de cardinal menor o igual a 5 es un grupo abeliano.
¿Es eso cierto también para grupos de cardinal 6?.
Problema 10 (Grupo cociente). Sea (G, ∗) un grupo y G1 un subgrupo normal. Hay que
probar que la siguiente es una relación de equivalencia entre elementos de G:
a ∼G1 b ⇔ ab−1 ∈ G1 .
Consideremos el conjunto cociente de G por esa relación de equivalencia R/ ∼G1 . Probad que
para cada elemento x ∈ G, su clase de equivalencia con respecto a esa relación ∼G1 verifica:
[x]∼G ; = {y ∈ G : y ∼G1 x} = xG1 = G1 x.
1

Denotemos mediante G/G1 a ese conjunto cociente y definamos la siguiente correspondencia:


∗ : G/G1 × G/G1 −→ G/G1
(xG1 , yG1 ) 7−→ (x ∗ y)G1 .
Pruébese que ∗ es una aplicación y que (G/G1 , ∗) es un grupo (llamado grupo cociente de G
por el subgrupo normal G1 . Probad, adicionalmente, que la siguiente es aplicación y que es
epimorfismo de grupos:
π : G −→ G/G1
x 7−→ xG1 .
Problema 11 (Primer Teorema de Isomorfı́a). Sea f : (G, ∗) −→ (H, ⊥) un morfismo de
grupos. Entonces, existe un isomorfismo de grupos dado del modo siguiente:
f˜ : (G/Ker(f )) −→ Im(f )
xKer(f ) 7−→ f˜(xKer(f )) = f (x).
Se debe probar esta afirmación.
Problema 12. Buscar alguna identificación del grupo cociente (R/Z, +).
1.2. EL GRUPO SIMÉTRICO 21

Problema 13 (Producto (cartesiano) de grupos). Dados dos grupos (G, ∗), (H, ⊥), se
define una estructura de grupo sobre el proructo cartesiano G × H del modo siguiente:
2
·: (G × H) −→ G×H
((g1 , h1 ), (g2 , h2 )) 7−→ (g1 ∗ g2 , h1 ⊥ h2 ).
Se suele denominar producto semi-directo de los grupos G y H y se representa, en ocasiones,
mediante G o H. Se pide:
i) Probad que (G × H, ·) es un grupo con la anterior operación.
ii) Consideremos el conjunto Mn×m (K) de las matrices n×m (con n filas y m columnas)
y coordenadas en un cuerpo K. Consideremos el grupo producto GL(n, K)×GL(m, K)
y definamos siguiente:
·Gauss : (GL(n, K) × GL(m, K)) × Mn×m (K) −→ Mn×m (K)
((P, Q), M ) 7−→ P AQ−1 .
Hay que probar que es una acción del grypo producto GL(n, K) × GL(m, K) sobre
Mn×m (K).
iii) Para cada elemento M ∈ Mn×m (K) detectar la relación de equivalencia a sociada a
esta acción. Determina algún representante canónico.
Problema 14. Define acciones de grupos sobre conjuntos en los casos siguientes y trata de
determinar representantes canónicos de las órbitas.
i) Afinidades sobre el espacio afı́n Rn .
ii) Homografı́as (también proyectividades) actuando sobre el espacio proyectivo Pn (R).
iii) Isometrı́as sobre el espacio afı́n real Rn .
iv) Movimientos sobre el espacio afı́n real Rn .
v) Isometrı́as lineales sobre la esfera real S n−1 .
vi) Isometrı́as sobre el espacio proyectivo real Pn (R).
vii) Homemomorfismos sobre espacios topológicos.
Problema 15. Probar que el grupo ortogonal O(n) define una acción natural sobre la esfera
unidad S n−1 := {x ∈ Rn : ||x||22 = 1} y que esa acción es transitiva. Decidir si esa acción
es fiel. Hacer lo mismo con la acción de O(n) sobre bolas (abiertas y/o cerradas) en Rn con
centro en el origen y radio variable.
Problema 16. Demostrar la Proposición 1.1.16 anterior.
Problema 17. Lee los dos textos citados al principio del Capı́tulo. Pertenecen a dos autores
distintos y distantes en el tiempo (del segundo he incluido el nombre). Trata de averiguar qué
relación hay entre ellos, completa el poema citado por el primero e indica si el texto del segundo
tiene algo que ver con el Capı́tulo.

1.2. El Grupo Simétrico


1.2.1. Las Permutaciones son composición de ciclos: Órbitas. Denotemos medi-
ante In := {1, . . . , n} ⊆ N al conjunto formado por los n primeros números naturales estricta-
mente positivos. Escribamos I0 = ∅ en el caso 0 ∈ N.
Definición 11. Se define el grupo simétrico de orden n! como el par (Sn , ◦), donde Sn es un
conjunto dado mediante la identidad siguiente:
Sn := {σ : In −→ In : σ es una biyección},
donde ◦ es la composición de aplicaciones definida como en la igualdad (??) anterior, esto es,:
◦ : Sn × Sn −→ Sn
(σ, µ) 7−→ σ ◦ µ.
Los elementos de Sn se denominan permutaciones.
Observación 1.2.1. Aunque se indica en la definición y no se prueba por obvio, el par (Sn , ◦)
es un grupo y su orden (es decir, su cardinal) es efectivamente n!.
22 1. PRE-ÁLGEBRA

Definición 12 (Permutaciones sobre un conjunto finito). Sea X un conjunto finito


(de cardinal ](X) = n ∈ N). Definimos el grupo de las permutaciones sobre X como el par
(S (X), ◦), donde
S (X) := {σ : X −→ X : σ es biyectiva},
y ◦ es la composición de aplicaciones. Los elementos de X se denominan permutaciones del
conjunto finito X.
Definición 13 (Ciclo). Sea X un conjunto finito y sea σ : X −→ X una permutación sobre X.
Decimos que σ es un ciclo de orden k si existe un elemento x ∈ X verificando las propiedades
siguientes:
i) x = x0 = σ 0 (x), x1 = σ(x), . . . , xk−1 = σ k−1 (x), x = σ k (x) = σ(xk−1 ).
ii) Para todo y ∈ X \ {x0 , . . . , xk−1 }, σ(y) = y.
Notación 1.2.2 (Notación para los ciclos). Para un ciclo σ : In −→ In como el descrito en
la definición anterior, se suele utiliar la notación (x0 x1 · · · xk−1 ) para describirle. Ası́, por
ejemplo, tomando I5 := {1, 2, 3, 4, 5}, el ciclo de orden 3 descrito mediante (4 3 1), representa
la permutación  
1 2 3 4 5
.
4 2 1 3 5
Definición 14 (Órbita de un elemento). Sea X un conjunto finito y sean x ∈ X un elemento
y sea σ ∈ S (X) una permutación. Definimos la órbita de x mediante σ como el conjunto:
Orbσ (x) := {σ i (x) : i ∈ Z}.

Observación 1.2.3. La anterior noción de órbita está ligada a la noción de ŕbita definida en
la Sección anterior. La órbita que hemos denotado mediante Orbσ (x) es precisamente la órbita
sobre x ∈ X definida por la acción del grupo simétrico S (X) sobre X (definida en la identidad
(1.1.3) de la Sección anterior). Aquı́ para cada elemento σ ∈ S (X) consideramos el subgrupo
Sσ := hσi := {σ n : n ∈ Z} que genera. Siguiendo con las nociones introducidas en la Definición
8, concluiremos que
Orbσ (x) = Ohσi (x).

Proposición 1.2.4. Las órbitas de cada elemento x ∈ X, siendo X un conjunto finito, son
finitas, su cardinal está acotado por ](X) y son siempre positivas, es decir, para cada x ∈ X y
para cada σ ∈ S (X), existe un número natural n ∈ N tal que la órbita está dada mediante:
Orbσ (x) := {x = σ 0 (x), σ 1 (x), . . . , σ n−1 (x)}.
En particular, el cardinal de la órbita es n (= ](Orbσ (x))) y viene dado por:
n = min{m ∈ N ; σ m (x) = x}.
Demostración. Para ver la finitud, baste con observar que Orbσ (x) ⊆ X, luego necesari-
amente es un conjunto finito. De otro lado, existe una infinidad de pares de ı́ndices i, j ∈ Z
tales que σ i (x) = σ j (x), con j > i. Podemos considerar el subconjunto de los naturales:
A := {t ∈ N \ {0} : ∃ i, j ∈ Z, t = j − i, σ i (x) = σ j (x)}.
Ya hemos visto que se trata de un conjunto no vacı́o de números naturales, por tanto, posee
mı́nimo y sea n ese mı́nimo. Nótese que n es también el mı́nimo natural m ∈ N tal que
σ m (x) = x. Probemos que
(1.2.1) Orbσ (x) = {σ i (x) : 0 ≤ i ≤ n − 1},
y habremos terminado. El contenido ⊇ es obvio, ası́ que nos ocuparemos del segundo. Supong-
amos y = σ i (x) ∈ Orbσ (x), con i ∈ Z. Aplicando división euclı́dea en Z, existirán q, r ∈ Z tales
que:
i = qn + r,
con 0 ≤ r ≤ n − 1. Entonces, tendremos:
σ i (x) = σ r (σ qn (x)) = σ r (x) ∈ {σ i (x) : 0 ≤ i ≤ n − 1},
porque σ n (x) = x y, por tanto, σ qn (x) = x para todo q ∈ Z. Por tanto, tenemos probado el
contenido ⊆ y la igualdad entre ambos conjuntos en la ecuación (1.2.1) anterior. 
1.2. EL GRUPO SIMÉTRICO 23

Corollario 1.2.5. Con las notaciones de la Proposición anterior, dados x, y ∈ X, si σ(y) ∈


Orbσ (x), entonces,
Orbσ (y) ⊆ Orbσ (x),
y, en particular, y ∈ Orbσ (x). Más, aún, se tiene que
Orb : σ(x) ∩ Orbσ (y) 6= ∅ ⇐⇒ Orbσ (x) = Orbσ (y).
En particular, para cada x ∈ X y cada órbita Orbσ (x) definida por algún elemento σ ∈ S (X),
se tiene que
σ(X \ Orbσ (x)) ⊆ (X \ Orbσ (x)).
Y la restricción de σ a X \ Orbσ (x) es una permutación de X \ Orbσ (x), i.e. σ |X\Orbσ (x) ∈
S (X \ Orbσ (x)).
Demostración. No es sino la traducción al caso de permutaciones de la Proposición 1.1.14
anterior. Por definir las órbitas una partición, se tendrá que y 6∈ Orbσ (x), se ha de tener que
σ(y) 6∈ Orbσ (x). En suma, tenemos probado que
σ(X \ Orbσ (x)) ⊆ (X \ Orbσ (x)).
Por tanto, tenemos la siguiente aplicación dada por la restricción de σ a X \ Orbσ (x):
σ |X\Orbσ (x) : X \ Orbσ (x) −→ X \ Orbσ (x).
Además, como σ es inyectiva, también lo seráu su restricción σ |X\Orbσ (x) . Como esta restricción
es inyectiva y el conjunto X \ Orbσ (x) es finito, entonces esta restricción es necesariamente
suprayectiva. Por tanto, σ |X\Orbσ (x) es una biyección y es, por tanto, una permutación en
S (X \ Orbσ (x)). 

Proposición 1.2.6 (Órbitas y Ciclos). Sea X un conjunto finito y sea S (X) el grupo de las
permutaciones sobre X. Se tiene:
i) Para cada órbita O := Orbσ (x) de cardinal t, determinada por un elemento x ∈ X y
una permutación σ ∈ S (X), existe un único ciclo τO ∈ S (X) de orden t tal que:
τO |O = σ, τO |X\O = Id,
es decir τO sobre O se comporta como σ y τO sobre el complementario X \ O se
comporta como la identidad.
ii) Para cada ciclo σ ∈ S (X) de orden t, existe una órbita O = Orbσ (x) de cardinal t y
tal que σ = τO .
Demostración. Veamos cada afirmación separadamente.
i) Para la primera afirmación basta con observar que
O = Orbσ (x) := {x = x0 = σ 0 (x), x1 = σ 1 (x), . . . , xt−1 = σ t−1 (x) = σ(xt−2 )},
y, además, σ(xt−1 ) = x0 = x. Considerando τO como el ciclo siguiente:
τO := (x0 x1 x2 · · · xt−1 ),
tenemos las propiedades indicadas, dado que
• τO (xi ) = xi+1 = σ(xi ), para cada i, 0 ≤ i ≤ t − 2,
• τO (y) = y para todo y ∈ X \ O,
• τO (xt−1 ) = x0 = x = σ(xt−1 )).
ii) Para la segunda afirmación, si σ ∈ S (X) es un ciclo de orden t es porque existe x ∈ X
tal que la órbita O := Orbσ (x) tiene cardinal t y verifica:
Orbσ (x) = {x0 = σ 0 (x), σ 1 (x), . . . , σ t−1 (x)},
y σ t (x) = x. Adicionalmente, σ |X\O = Id. Por tanto τO = σ con las notaciones de la
afirmación (1).

Observación 1.2.7. La anterior Proposición nos indica que existe una biyección entre las
órbitas (ordenadas y definidas por cualquier permutación) y los ciclos que, además, transforma
cardinal de las órbitas en orden de ciclo. Ver Problema ??.
24 1. PRE-ÁLGEBRA

Proposición 1.2.8. Dados X e Y dos conjuntos finitos del mismo cardinal, entonces, los
respectivos grupos de permutaciones (S (X), ◦) y (S (Y ), ◦)son isomorfos como grupos. Más
aún, el isomorfismo respeta ciclos, órbitas y cardinal de las órbitas. Recı́procamente, si estos
grupos de permutaciones son isomorfos, entonces X e Y son biyectables y, por tanto, tienen el
mismo cardinal.
Demostración. Supongamos que existe f : X −→ Y una biyección entre los conjuntos
X e Y (o, lo que es lo mismo, que tienen el mismo cardinal). Entonces, podemos definir una
transformación:
f ∗ : S (X) −→ S (Y )
σ 7−→ f ◦ σ ◦ f −1 ,
donde f −1 : Y −→ X es la inversa de f (que existe por ser f biyección) y f ◦ σ ◦ f −1 : Y −→ Y
es la composición de estas tres aplicaciones, es decir,
f ◦ σ ◦ f −1 (y) = f (σ(f −1 (y))), ∀y ∈ Y.
Es claro que f ∗ es una biyección cuya inversa es la aplicación:
f∗ : S (Y ) −→ S (X)
τ 7−→ f −1 ◦ τ ◦ f.
Es decir, se verifica:
f ∗ ◦ f∗ = IdS (X) , f∗ ◦ f ∗ = IdS (Y ) .
Es claro también (mera verificación) que tanto f ∗ como f∗ son morfismos de grupo, con lo que
queda probado que S (X) y S (Y ) son isomorfos. En cuanto al hecho de que se preserven los
ciclos y las órbitas, simplemente se trata de verificar que si σ ∈ S (X) es un ciclo de orden k,
entonces f ∗ (σ) es un ciclo del mismo orden. Y lo mismo sucede para τ ∈ S (Y ) y f∗ (τ ). En
cuanto a las órbitas, se tiene la identidad siguiente:
f (Orbσ (x)) = Orbf ∗ (σ) (f (x)),
para cada x ∈ X y para cada σ ∈ S (X). Basta con escribir las identidades respectivas y
comprobar. Lo mismo se puede hacer con las órbitas de todo elemento y ∈ Y y toda permutación
τ ∈ S (Y ). Para la última afirmación del enunciado. Recuérdese, antes de nada, que decir “
X es un conjunto finito de cardinal n ∈ N” es lo mismo que decir que existe una biyección
entre X e In para algún n ∈ N”. Por tanto, S (X) será isomorfo al grupo Sn de orden n!.
En particular, si dos grupos S (X) y S (Y ) son isomorfos, ambos tendrán el mismo cardinal
(por ser biyectivos) y dicho cardinal coincidirá con algún n!. Pero, entonces, necesariamente, los
cardinales de X y de Y han de ser iguales a n ∈ N y esto significa que X e Y son biyectables. 
Proposición 1.2.9. Toda permutación sobre un conjunto finito es composición de un número
finito de ciclos.
Demostración. Demostremos el resultado por inducción sobre el cardinal de X. Si X
es un conjunto de cardinal 1 el resultado es obvio porque sólo hay una permutación que es,
además, un ciclo: la identidad. Supongamos ](X) = n ≥ 1 y sea σ ∈ S (X) una permutación.
Claramente σ define diversas órbitas en X según cuál sea el punto inicial. Supongamos O =
Orbσ (x) una órbita en X definida por un elemento x ∈ X y de cardinal maximal. Sea τO el
ciclo asociado a esa órbita y tal que τO |O = σ |O (según la Proposición 1.2.6). Si la órbita
O tuviera cardinal n, entonces, τO = σ y σ ya serı́a un ciclo de orden n. En caso contrario,
tendremos que O ⊆ X y tendremos el conjunto Y = X \ O 6= ∅. Pero las órbitas no son vacı́as,
con lo que Y es u conjunto de cardinal estrictamente menor que X, es decir, ](Y ) ≤ n − 1.
Consideremos ahora una nueva permutación sobre X : σ e : X −→ X dada mediante:
e := τO−1 ◦ σ.
σ
e(x) = x para todo x ∈ O y σ
Nótese que σ e(y) = σ(y) ∈ Y = X \ O para todo y ∈ Y = X \ O
por lo discutido en el Corolario 1.2.5. En particular, podemos considerar la restricción
e |Y = σ |Y : Y −→ Y.
σ̄ := σ
Por hipótesis inductiva, concluimos que σ̄ es una unión finita de ciclos de Y . Es decir,
σ̄ = τ1 ◦ · · · ◦ τr ,
1.2. EL GRUPO SIMÉTRICO 25

donde τi ∈ S (Y ) es un ciclo de orden ni . Para casa i, 1 ≤ i ≤ r, sea


τei : X −→  X
τi (x), si x ∈ Y
x 7−→
x, en caso contrario.
Ahora observamos que τei es una biyección de X en sı́ mismo y, por tanto, τei ∈ S (X). Más
aún, τei es un ciclo del mismo orden que τi . Por último, observemos que
e(x) = (τe1 ◦ · · · ◦ τe1 ) (x),
σ
para cada x ∈ X. Nótese que si x ∈ O, tenemos
e(x) = (τe1 ◦ · · · ◦ τe1 ) (x) = x,
x=σ
por la propia definición de τei . Pero, si x ∈ Y = X \ O, tendremos que
e(x) = (τ1 ◦ · · · ◦ τ1 ) (x).
σ(x) = σ
En particular, σ
e es una composición de ciclos
(τO−1 ◦ σ) = σ
e = (τe1 ◦ · · · ◦ τe1 ) ,
y, finalmente, tenemos
σ = τO ◦ σ
e = (τe1 ◦ · · · ◦ τe1 ) ,
y habremos concluido que σ es una composición finita de ciclos como pretendı́amos. 
Definición 15 (Transposiciones). A los ciclos de orden 2 se les denomina transposiciones.

Definición 16 (Transposiciones adyacentes). Consideremos X = In := {1, . . . , n}. Lla-


maremos transposiciones adyacentes a todas las transposiciones (i j) ∈ S (In ), tales que
i ∈ {1, . . . , n − 1} y j = i + 1.
Observación 1.2.10. Nótese que la transposición (i i + 1) = (i + 1 i), con lo que la definición
anterior incluye como transposiciones adyacentes tanto (1 2), (2 3) como (2 1), (3 2) por ser las
mismas. En particular, si X = In las únicas transposiciones adyacentes son:
(1 2), (2 3), . . . , (n − 1 n).
Teorema 1.2.11. Se verifican las siguientes propiedades:
i) Toda permutación sobre un conjunto finito es una composición finita de transposi-
ciones.
ii) Toda permutación sobre In es una composición finita de transposiciones adyacentes.
De hecho, toda transposición es composición de un número impar de transposiciones
adyacentes.
En particular, el conjunto de las transposiciones es un conjunto de generadores del grupo
simétrico, Más aún, para cualquier conjunto finito X y para cada biyección f : X −→ In ,
el grupo S (X) está generado por las permutaciones adyacentes.
Demostración. i) Por lo visto en la Proposición 1.2.9, basta con que probemos que
los ciclos de cualquier orden se pueden dar como composición finita de transposiciones.
Lo haremos por inducción en el orden.
Dado un ciclo de orden 3 (x1 x2 x3 ) podemos reescrbirlo como la composición de dos
transposiciones:
(x1 x2 x3 ) = (x1 x3 ) ◦ (x1 x2 ).
Para un ciclo de orden r, (x1 x2 · · · xr ), tenemos que
(x1 x2 · · · xr ) = (x1 x3 · · · xr ) ◦ (x1 x2 ),
y la propiedad se sigue por inducción. Se trata simplemente de verificar las identidades.
Escribamos f = (x1 x2 · · · xr ), g = (x1 x3 · · · xr ) y h = (x1 x2 ). Tenemos que
h(x1 ) = x2 ; h(x2 ) = x1 ; h(y) = y, ∀y ∈ X \ {x1 , x2 }.
Mientras que
g(x1 ) = x3 , g(xi ) = xi+1 , ∀i, 3 ≤ i ≤ r − 1; g(xr ) = x1 ; g(y) = y, ∀y ∈ X \ {x1 , x3 , . . . , xr }.
Por tanto,
26 1. PRE-ÁLGEBRA

• g(h(x1 )) = g(x2 ) = x2 = f (x1 ),


• g(h(x2 )) = g(x1 ) = x3 = f (x2 ),
• g(h(xi )) = g(xi ) = xi+1 = f (xi ), ∀i, 3 ≤ i ≤ r − 1,
• g(h(xr )) = g(xr ) = x1 = f (xr ),
• g(h(y)) = g(y) = y = f (y), ∀y ∈ X \ {x1 , x2 , . . . , xr }.
Obsérvese que el número de transposiciones es igual al orden del ciclo (ver Problema
21 más abajo).
ii) Para la segunda afirmación basta con que probemos que toda transposición es com-
posición de un número impar de transposiciones adyacentes. La demostración es
evidente dado que
(k l) = (k k + 1) ◦ (k + 1 k + 2) ◦ · · · (l − 1 l) ◦ (l − 1 l − 2) ◦ · · · ◦ (k + 1 k).
El número de transposiciones adyacentes es (k − l) + (k − l) − 1 = 2(k − l) − 1.

1.2.2. Índice de una Permutación. Consideremos en esta Subsección X = In {1, . . . , n}
y el grupo simétrico Sn . Consideremos el conjunto de ı́ndices
A := {(i, j) ∈ In2 : i < j}.
Nótese que el cardinal de A satisface:
n(n − 1)
](A) = 1 + 2 + · · · + (n − 1) =.
2
Para una permutación σ ∈ Sn , obtendremos una descomposición de A en dos subconjuntos
disjuntos [
A = A+ (σ) A− (σ),
donde
A+ (σ) := {(i, j) ∈ A : σ(i) < σ(j)}, A− (σ) := {(i, j) ∈ A : σ(i) > σ(j)}.
Los elementos de A− (σ) se llaman inversiones de la permutación σ. Denotaremos por
N+ (σ) := ](A+ (σ)), N− (σ) := ](A− (σ)),
y al número N− (σ) se le llama el número de inversiones de la permutación σ.
Observación 1.2.12. Las siguientes propiedades son obvias de verificar:
i) Si Id ∈ Sn es la identidad, N− (Id) = 0.
ii) Para cualquier transposición σ ∈ Sn , se tiene N− (σ) = 1.
Definición 17 (Índice de una Permutación). Con las anteriores notaciones, se llama
ı́ndice de una permutación σ ∈ Sn al elemento del grupo multiplicativo Z∗ := {+1, −1}, dado
mediante:
N (σ)
I(σ) := (−1) − ∈ Z∗ .
Teorema 1.2.13. El ı́ndice define un homomorfismo de grupos:
I: (Sn , ◦) −→ (Z∗ , ·)
N (σ)
σ 7−→ I(σ) := (−1) − ,
donde la operación · sobre Z∗ es la multiplicación. En otras palabras, se verifican las dos
propiedades siguientes:
i) I(Id) = 1 ∈ Z∗ ,
ii) Para todo par de permutaciones σ, τ ∈ Sn , se tiene:
I(σ ◦ τ ) = I(σ) · I(τ ).
Demostración. Nótese que se trata de probar simplemente que para todo par de per-
mutaciones σ, τ ∈ Sn , se tiene:
I(σ ◦ τ ) = I(σ) · I(τ ).
Obsérvese, además, que esta propiedad es equivalente a probar que
N− (σ ◦ τ ) = N− (σ) + N− (τ ), mod 2.
1.2. EL GRUPO SIMÉTRICO 27

Para ello, comencemos definiendo los conjuntos siguientes para una permutación σ fijada:
τ + (A+ (τ )) = {(τ (i), τ (j)) : (i, j) ∈ A+ (τ )},
τ − (A− (τ )) = {(τ (j), τ (i)) : (i, j) ∈ A− (τ )}.
Comencemos observando que
[
A = τ + (A+ (τ )) τ − (A− (τ )),
siendo ésta una unión disjunta. La razón es obvia, dado (i, j) ∈ A, han de existir i1 , j1 ∈ In
tales que i = τ (i1 ), j = τ (j1 ). Ahora se tiene:
• Si i1 < j1 , como (i, j) ∈ A (i.e. i < j), entonces (i1 , j1 ) ∈ A+ (τ ) y, por tanto,
(i, j) = (τ (i1 , τ (j1 )) ∈ τ + (A+ (τ )).
• Si i1 > j1 , como (i, j) ∈ A (i.e. i < j), entonces (j1 , i1 ) ∈ A− (τ ) y, por tanto,
(i, j) = (τ (j1 ), τ (i1 )) ∈ τ − (A− (τ )).
De otro lado, como τ es una biyección, es fácil concluir que los cardinales verifican:
N+ (τ ) = ](τ + (A+ (τ ))), N− (τ ) = ](τ − (A− (τ ))).
Ahora, consideremos los siguientes cuatro conjuntos disjuntos dos a dos y sus cardinales:
• El conjunto A++ (σ, τ ), de cardinal N++ (σ, τ ) = ](A++ (σ, τ )), dado mediante:
A++ (σ, τ ) := {(i, j) ∈ A+ (σ) : (i, j) ∈ τ + (A+ (τ ))}.
• El conjunto A+− (σ, τ ), de cardinal N+− (σ, τ ) = ](A+− (σ, τ )), dado mediante:
A+− (σ, τ ) := {(i, j) ∈ A+ (σ) : (i, j) ∈ τ − (A− (τ ))}.
• El conjunto A−+ (σ, τ ), de cardinal N−+ (σ, τ ) = ](A−+ (σ, τ )), dado mediante:
A−+ (σ, τ ) := {(i, j) ∈ A− (σ) : (i, j) ∈ τ + (A+ (τ ))}.
• El conjunto A−− (σ, τ ), de cardinal N−− (σ, τ ) = ](A−− (σ, τ )), dado mediante:
A−− (σ, τ ) := {(i, j) ∈ A− (σ) : (i, j) ∈ τ − (A− (τ ))}.
Las siguientes propiedades son de mera comprobación:
[
A+ (σ ◦ τ ) = A++ (σ, τ ) A−− (σ, τ ),
[
A− (σ ◦ τ ) = A+− (σ, τ ) A−+ (σ, τ ),
[
A+ (σ) = A++ (σ, τ ) A+− (σ, τ ),
[
A− (σ) = A−+ (σ, τ ) A−− (σ, τ ),
[
τ + (A+ (τ )) = A++ (σ, τ ) A−+ (σ, τ ),
[
τ − (A− (τ )) = A+− (σ, τ ) A−− (σ, τ ).
Con estas identidades conjuntistas de fácil verificación, obtenemos (entre otras) las siguientes
relaciones ehtre los cardinales:
N− (σ) = N−+ (σ, τ ) + N−− (σ, τ ),
N− (τ ) = ](τ − (A− (τ )) = N+− (σ, τ ) + N−− (σ, τ ),
N− (σ ◦ τ ) = N+− (σ, τ ) + N−+ (σ, τ )
Sumando las dos primeras identidades obtenemos
N− (σ)+N− (τ ) = N−+ (σ, τ )+N−− (σ, τ )+N+− (σ, τ )+N−− (σ, τ ) = N−+ (σ, τ )+N−− (σ, τ )+2(N−− (σ, τ )).
Por tanto, tenemos
N− (σ) + N− (τ ) = N− (σ ◦ τ ) + 2(N−− (σ, τ )),
y esto último implica:
N− (σ◦τ ) N− (σ)+N− (τ )
I(σ ◦ τ ) = (−1) = (−1) = I(σ) · I(τ ),
que es la identidad buscada. 
28 1. PRE-ÁLGEBRA

Corollario 1.2.14. Sea σ ∈ Sn una permutación y sea


σ = τ1 ◦ τ2 ◦ · · · ◦ τm ,
una descomposición de σ como composición de transposiciones. Entonces,
m
I(σ) = (−1) .
En particular, dadas dos representaciones de una permutación σ ∈ Sn como composición de
transposiciones
σ = τ1 ◦ τ2 ◦ · · · ◦ τr = ρ1 ◦ ρ2 ◦ · · · ◦ ρm ,
se tiene que r = m mod 2.
Demostración. Es evidente, por ser el ı́ndice un morfismo de grupos, que
Ym
I(σ) = I(τi ).
i=1

Pero, como el ı́ndice de una transposición es (−1), concluiremos I(σ) = (−1)m como pretende
el enunciado. Para la segunda afirmación, baste ver que si tenemos dos descomposiciones de
una permutación como las descritas, entonces,
I(σ) = (−1)r = (−1)m ,
por lo que m y r han de verificar r = m mod 2. 
Corollario 1.2.15. Sea X un conjunto finito cualquiera, entonces dadas dos representaciones
de una permutación σ ∈ S (X) como composición de transposiciones en X:
σ = τ1 ◦ τ2 ◦ · · · ◦ τr = ρ1 ◦ ρ2 ◦ · · · ◦ ρm ,
se tiene que r = m mod 2.
Demostración. Basta con usar el isomorfismo de S (X) con un Sn cualquiera. 
Esta forma de ver el ı́ndice de una permutación como algo que depende solamente del número
de transposiciones implicadas, permite generalizar la noción de ı́ndice para un conjunto finito
cualquiera X del modo siguiente.
Definición 18 (Índice de una permutación de un conjunto cualquiera). Sea X un conjunto
finito cualquiera y sea σ ∈ S (X) una biyección de X. Llamamos ı́ndice de σ al valor
I(σ) := (−1)m ,
donde σ admite una descomposición como producto de m transposiciones de X.
Observación 1.2.16. Obsérvese que el ı́ndice ası́ definido permite construir un morfismo de
grupos:
I : (S (X), ◦) −→ (Z∗ , ·)
σ 7−→ I(σ).
1.2.3. Ejercicios y Problemas de la Sección 1.2.
Problema 18. Probad las siguientes propiedades:
i) Pruébese que (Sn , ◦) es un grupo (es decir, verificar que ◦ está bien definida como
aplicación (i.e. que es operación interna) y que verifica la propiedad asociativa, que
posee elemento neutro y que todo elemento posee un inverso).
ii) Probad que el cardinal ](Sn ) = n! (Pista: por inducción en n).
Problema 19. Para un conjunto X, el rupo simétrico S (X) define una acción natural sobre
X. Probar que esa acción es transitiva y fiel.
Problema 20. Verificar todos los detalles de la demostración de la Proposición 1.2.8. Es decir,
todas las identidades entre conjuntos y aplicaciones no probadas con detalle y las afirmaciones
como f ∗ y f∗ son morfismos de grupo, etc.
Problema 21. Sea X un conjunto finito y consideremos un ciclo de orden r en S (X). Hay
que probar que ese ciclo puede ser dado como la composición de r − 1 transposiciones. (Pista:
Por inducción en r).
1.2. EL GRUPO SIMÉTRICO 29

Problema 22. Consideremos In := {1, . . . , n}, el grupo simétrico Sn y escribamos τi para la


transposición adyacente τi := (i i + 1). Prueba que se verifican las siguientes propiedades:
i) τi2 = Id,
ii) τi ◦ τi+1 ◦ τi = τi+1 ◦ τi ◦ τi+1 .
iii) τi ◦ τj = τj ◦ τi , siempre que |i − j| ≥ 2.
Problema 23. Prueba que el ı́ndice de una permutación σ ∈ S (X), siendo X un conjunto
finito, es invariante por biyecciones de X con conjuntos finitos de la forma In .
Problema 24. Pruébese que el conjunto de todas las permutaciones en Sn que tienen ı́ndice
1 es un subgrupo normal de Sn . A este subgrupo se le conoce como el subgrupo alternado y se
denota por An ⊆ Sn . Pruébese que An es un subgrupo normal de Sn y se verifica:
Sn /An ∼= Z/2Z.
Problema 25. Sea O(n) el grupo de las matrices orotogonales n × n con coordenadas reales y
sea SO(n) es grupo especial ortogonal de las matrices orotogonales con determinante 1. Probad
que SO(n) es un subgrupo normal de O(n) y que se verifica el siguiente isomorfismo de grupos:
O(n)/SO(n) = ∼ Z/2Z.

Problema 26 (Sólo para alumnos que haya superado la asignatura Matemática Disc-
reta). Un grafo orientado es un par G := (V, E) donde V es un conjunto no vacı́o (cuyos
elementos son llamados nodos o vértices) y E ⊆ V × V es un conjunto finito de pares de nodos
de V llamados aristas. Un grafo no orientado es un grafo orientado G tal que el conjunto de
las aristas verifica:
∀x, y ∈ V, (x, y) ∈ E ⇐⇒ (y, x) ∈ E.
Un automorfismo de un grafo es un elemento σ ∈ S (V ) tal que
∀x, y ∈ V, (x, y) ∈ E ⇐⇒ (σ(x), σ(y)) ∈ E.
Se pide:
i) Hay que probar que los grafos no orientados pueden definirse como los pares (V, E),
donde V es un cojunto no vacı́o y E es un subconjunto del conjunto P(V ) de todos
los subconjuntos de V que verifica:
∀X ∈ E, 1 ≤ ](X) ≤ 2.
ii) Hay que probar que el conjunto Aut(G ) de automorfismos de un grafo orientado forma
un grupo con la operación composición de aplicaciones. ¿Es abeliano?.
iii) Sea G un grafo no orientado con vértices V . Consideremos el subgrupo G ⊆ S (V )
generado por las transposiciones
G := h{(i j) : {i, j} ∈ E}i.
¿Son los elementos de G automorfismos del grafo G (i.e. G ⊆ Aut(G ))?. Razona la
respuesta.
iv) Probad que el grupo simétrico S (V ) es el grupo Aut(Kn ), donde Kn es el grafo com-
pleto de n vérices (i.e. el grafo con todas las aristas posibles).
v) Busca en internet (Wiki, por ejemplo) información sobre el enunciado del Teorema
de Frucht y el enunciado del Problema de Galois Inverso. Cópialos y trata de explicar
sus significados.
vi) Busca en internet información sobre los grafos de Cayley. Explica su construcción.
Problema 27. Es decir, supongamos que X es un conjunto finito de cardinal n y consideremos
el conjunto:
n
[
Xn∗ := X i,
i=0
i
Qi
donde X := k=1 X es el producto cartesiano de X consigo mismo i veces. Nótese que se trata
del conjunto de las palabras sobre el alfabeto X de longitud menor or igual que n. Para cada
permutación σ ∈ S (X) y cada x ∈ X, definamos la órbita ordenada Orbσ (x) ∈ Xn∗ mediante:
Orbσ (x) := (x, σ(x), . . . , σ t−1 (x)) ∈ X t ⊆ Xn∗ .
30 1. PRE-ÁLGEBRA

Consideremos el conjunto O(X) ⊆ Xn∗ formado por todas esas órbitas ordenadas:
O(X) := {Orbσ (x) : σ ∈ S (X), x ∈ X}.
Sobre el conjunto de las órbitas ordenadas O(X) definamos la relación siguiente:
Dadas dos órbitas ordenadas Orbσ (x), Orbτ (y) ∈ O(X), diremos que son equivalentes y lo
denotaremos mediante Orbσ (x) ≡ Orbτ (y) si y solamente si verifican:
τ |Orbσ (x) = σ |Orbτ (y) ∧ y ∈ Orbσ (x).
Hay que probar que ésta es una relación de equivalencia sobre O(X). Denotemos por O(X) el
conjunto cociente siguiente:
O(X) := O(X)/ ≡ .
De otro lado, consideremos el conjunto formado por todos los ciclos sobre X, es decir:
C(X) := {τ ∈ S (X) : τ es un ciclo}.
Definamos la correspondencia siguiente:
Φ: h O(X) i −→ C(X)
Orbσ (x) 7−→ τO := (x σ(x) σ 2 (x) · · · σ t−1 (x)),

h i
donde Orbσ (x) es la clase de equivalencia definida por la órbita ordenada Orbσ (x).

Se pide probar las afirmaciones siguientes:
i) Probad que si dos órbitas ordenadas son equivalentes entonces tienen el mismo cardi-
nal.
ii) Probad que la correspondencia Φ es aplicación (i.e. está bien definida).
iii) Probad que Φ es una biyección.

1.3. Anillos, Ideales, Morfismos de Anillos


Definición 19 (Anillo). Un anillo (conmutativo con unidad) es una terna (R, +, ·), donde
i) (R, +) es un grupo abeliano, cuyo elemento neutro se suele denotar por 0R ,
ii) (R, ·) es un monoide conmutativo, cuyo elemento neutro se suele denotar por 1R ,
iii) se verifica la propiedad distributiva siguiente:
∀a, b, c ∈ R, a · (b + c) = a · b + a · c.
Al elemento neutro del grupo abeliano (R, +) lo denotaremos por 0R o, simpemente, 0 y al
elemento neutro del monoide (R, ·) lo denotaremos por 1R o, simplemente, 1.

Observación 1.3.1 (Simplemente “anillo”). En este curso, “ Álgebra Conmutativa”, todos


los anillos serán conmutativos con unidad, por lo que simplificaremos diciendo “Sea (R, +, ·)
un anillo.” queriendo decir “Sea (R, +, ·) anillo conmutativo con unidad”.
Terminológicamente, podemos establecer tres niveles del uso posible del término “anillo”.
• Casi-anillo: Es una terna (R, +, ·) en las que (R, +) es un grupo (no necesariamente
conmutativo), (R, ·) es un semi-grupo y se da la distributiva, per solamente en una de
las direcciones. Por ejemplo, si (G, ∗) es un grupo definamos M (G) como el conjunto
de todas las aplicaciones de G en sı́ mismo. Sobre el conjunto M (G) podemos definir
la operación f ∗ g, entre dos elementos f, g ∈ M (G) de la manera obvia. Añadamos la
composición de aplicaciones ◦ y tendremos que (M (G), ∗, ◦) es un casi-anillo. Es una
noción que no carece de interés, pero es poco común su estudio.
• Pseudo-anillo (Anillo “sin unidad”): Es una terna (R, +, ·) en las que se da la
propiedad distributiva, (R, +) es un grupo abeliano y (R, ·) es un semi-grupo, pero
no necesariamente tiene unidad. Este caso es poco habitual. Un ejemplo podı́a ser
cualquier ideal propio, como los números enteros pares (2Z, +, ·). Pero no es una
noción demasiado interesante ni es comúnmente aceptado.
• Anillo : Es una terna (R, +, ·) en las que se da la propiedad distributiva, (R, +) es
un grupo abeliano y (R, ·) es un monoide. Este uso es el más habitual. Un ejemplo
podı́a ser el conjunto de los endomorfismos sobre un espacio vectorial o las matrices
cuadradas (Mn (K), +, ·). Es el más aceptado, salvo que se trate de un curso de
“Álgebra Conmutativa”, como es nuestro caso.
1.3. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 31

• Anillo Conmutativo (o, simplemente, anillo): que es el uso que daremos en este curso.
La definición de anillo tiene sus precursos en D. Hilbert y A. Fraenkel, pero es E. Noether quien
estabiliza la noción actualmente aceptada en su trabajo [Noether, 1921]. Será la escuela de E.
Noether, y especilamente, la obra de su discı́pulo W. Krull (cf. [Krull, 29], [Krull, 35]) la que
más influirá en la concepción del Álgebra Conmutativa moderna. Obviamente, el conocimiento
de estos aspectos ha evolucionado mucho en los últimos ochenta años, ganando relevancia en
Geometrı́a Algebraica y, en general, en Geometrı́a a partir de la fundamentación de la Geometrı́a
propuesta por A. Grothendieck en sus EGA’s y SGA’s. Este curso no es, por desgracia, sino
una pre-introducción al conocimiento de la “Teorı́a de Anillos”.

Observación 1.3.2. Si (R, +, ·) es un anillo, entonces:


∀x ∈ R, x · 0 = 0.
Para probarlo, obsérvese que
x · 0 + x · 1 = x · (1 + 0) = x · 1 = x.
Como (R, +) es un grupo, concluiremos que si x · 0 + x = x, entonces, x · 0 = 0. En particular,
concluimos que si R es un anillo y R 6= {0} (es decir, si R posee algún elemento además del
neutro de la suma), entonces 1 6= 0. La razón es que si x ∈ R, con x 6= 0, tendremos que,
de una parte, x · 0 = 0 y, por otro lado, x · 1 = x. Por tanto, si 1 = 0 en R, concluirı́amos
x = 0 y, necesariamente, R = {0}. Para excluir este caso patológico y nulamente interesante,
supondremos, a partir de ahora, que todo anillo R es tal que 1R 6= 0R o, equivalentemente, que
R 6= {0}.

Ejemplo 1.3.3. Los ejemplos más elementales de anillos son obviamente los cuerpos, como
Q, R, C, o anillos que no son cuerpos como Z. Veremos, sin embargo, que hay muchos más
ejemplos. También son ejemplos de anillos los anillos de polinomios en una variable con coefi-
cientes en los anteriores anillos.
Para una definición formal de los anillos de polinomios, sea (R, +, ·) un anillo y consideremos
los siguientes dos conjuntos de sucesiones de elementos de R:
(1.3.1) R[[X]] := RN := {(an )n∈N ∈ RN : an ∈ R, ∀n ∈ N}.
Definimos el subconjunto siguiente:
(1.3.2) R[X] := {(an )n∈N ∈ RN : ∃I ⊆ N, finito, an = 0, ∀n ∈ N \ I}.
Ahora definimos dos operaciones sobre estos dos conjuntos
+: R[[X]] × R[[X]]  −→ R[[X]], ∗: R[[X]] × R[[X]]  −→ R[[X]]
(an )n∈N , (bn )n∈N 7−→ (an + bn )n∈N . (an )n∈N , (bn )n∈N 7−→ (cn )n∈N ,
donde
X
(1.3.3) ck := ai bj , ∀k ∈ N.
i+j=k

Nótese la relación existente entre la peración ∗ entre elementos de R[[X]] y la convolución de


funciones estudiada en Análisis. De hecho, podrı́amos decir directamente que ∗ es la operación
de convolución. La terna (R[[X]], +, ∗) es un anillo conmutativo con unidad, conocido como el
anillo de series de potencias formales en una variable. De hecho, por tradición no se
usa la notación sucesional (an )n∈N ni la notacón funcional a : N −→ R, sino la notación en
forma de serie no necesariamente convergente:
X
(an )n∈N se denota mediante an X n ,
n∈N

aunque ambas notaciones representan el mismo elemento. Se suele usar la terminologı́a coefi-
ciente n−ésimo para referirise al elemento n−ésimo an de la sucesión.
Ambas operaciones se comportant bien sobre el subconjunto R[X] ⊆ R[[X]], con lo que también
están bien definidas las operaciones siguientes:
+: R[X] × R[X]  −→ R[X], ∗: R[X] × R[[X]]  −→ R[X]
(an )n∈N , (bn )n∈N 7−→ (an + bn )n∈N . (an )n∈N , (bn )n∈N 7−→ (cn )n∈N ,
32 1. PRE-ÁLGEBRA

donde los elementos ck están igualmente definidos mediante la convolución definida en la


Ecuación (1.3.3) anterior. De nuevo, la terna (R[X], +, ∗) define un anillo conmutativo con
unidad, conocido como el anillo de polinomios univariados. Tendremos ası́ nuevos ejemplos
de anillo como Z[X], Q[X], R[X], C[X] (anillos de polinomios) o Z[[X]], Q[[X]], R[[X]], C[[X]]
(anillos de series de potencias formales) on coeficientes respectvamente en Z, Q, R, C.
En el caso de los polinomios f = (an )n∈N ∈ R[X] se usa una noción cómoda (que no tiene
sentido en el caso de las series). Es el grado de un polinomio f como el anterior, y que
se define mediante:
deg(f ) := max{k ∈ N : ak 6= 0}.
Si f = (an )n∈N es la sucesión nula, escribiremos f = 0 y definiremos su grado mediante
deg(0) = −1. Por eso, para un polinomio f = (an )n∈N ∈ R[X], de grado d := deg(f ) se suele
denotar mediante la suma formal:
X d
f := ai Xi .
i=0
Al coeficiente ad 6= 0, con d = deg(f ), se le denomina coeficiente director de f .

Ejemplo 1.3.4 (Enteros de Gauss). Un sencillo ejemplo de anillo es el anillo de los enteros
de Gauss Z[i], formado por los números complejos de la forma:
Z[i] := {a + bi : a, b ∈ Z},
donde i2 = −1.
Procedamos con un poco más de terminologı́a, necesaria para poder describir más ejemplos.
Definición 20 (Subanillos, ideales, morfismos, unidades). Dado un anillo (R, +, ·), lla-
maremos:
i) Subanillo: a todo subgrupo (S, +) de (R, +) tal que 1R ∈ S y S es cerrado para la
operación producto, esto es,
∀a, b ∈ S, a · b ∈ S.
ii) Ideal: a todo subgrupo (a, +) de (R, +) tal que se verifica:
∀a ∈ R, ∀b ∈ a, a · b ∈ S.
El ideal R se denominan ideal impropio de R. Los demás, incluyendo el ideal (0), se
denominan propios.
iii) Morfismo de anillos: Dados dos anillos (R, +, ·) y (T, +, ·), llamamos morfismo entre
los anillos R y T a todo morfismo de grupos f : (R, +) −→ (T, +) tal que:
• f (1R ) = 1T ,
• ∀a, b ∈ R, f (a · b) = f (a) · f (b).
iv) Unidades en el anillo: A todos los elemenos a ∈ R tales que existe a0 ∈ R, con
aa0 = a0 a = 1R . Denotamos por R∗ al conjunto de las unidades del anillo R y forma
un grupo abeliano con la operación producto (R∗ , ·) llamado grupo de las unidades del
anillo R.
v) Un anillo R se denomina cuerpo si R∗ = R \ {0}.

Definición 21 (Mono, epi, iso, endo, auto....morfismo de anillos). Sean (R, +, ·) y


(T, +, ·) dos anillos y sea f : (R, +, ·) −→ (T, +, ·) un morfismo de anillos. Diremos que f es
monomorfismo (resp. epimorfismo, isomorfismo, endomorfismo, automorfismo) si lo es como
morfismo de grupos f : (R, +) −→ (T, +) (resp. ı́dem).

Proposición 1.3.5 (Propiedades elementales). Se tienen las siguientes propiedades ele-


mentales:
i) Los subanillos T de un anillo S son ideales si y solamente si R = T .
ii) Los morfismos de anillos transforman subanillos en subanillos en ambas direcciones.
Es decir, si f : R −→ T es un morfismo de anillos, se tiene:
1.3. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 33

• Si S es subanillo de R, entonces f (S) := {f (x) : x ∈ S} es un subanillo de T .


En particular, Im(f ) = f (R) no es necesariamente ideal de T , pero sigue siendo
cierto que f es epimorfismo si y solamente si Im(f ) = T .
• Si U es un subanillo de T , entonces f −1 (U ) := {x ∈ R : f (x) ∈ U } es un
subanillo de R.
iii) Las imágenes inversas de ideales son ideales, pero no necesariamente lo son las imágenes
directas. Es decir, si f : R −→ T es un morfismo de anillos, se tiene:
• Si b es un ideal de T , entonces f −1 (b) := {x ∈ R : f (x) ∈ a} es un ideal de R.
En particular el núcleo ker(f ) := f −1 ({0}) es un ideal de R y f es monomorfismo
si y solamente si ker(f ) = (0) es el ideal nulo.
• Si b es un ideal de R, en general no es cierto que f (a) sea ideal de T .
Cuando no hay confusión sobre el morfismo f , al ideal f −1 (b) se le denota mediante
bc y se le denomina contracción del ideal b de T .
iv) Un subgrupo a del grupo aditivo de un anillo (R, +, ·) es ideal si y solamente si el
grupo cociente (R/a, +) es anillo con la correspondencia siguiente:
· : R/a × R/a −→ R/a,
dada mediante
(x + a)(y + a) := xy + a, ∀x + a, y + a ∈ R/a.
Al anillo R/a se le denomina anillo cociente de R por el ideal a. Además, la ‘royección
canónica:
π : R −→ R/a
x 7−→ x + a,
es un epimorfismo de anillos.
v) Un anillo es cuerpo si y solamente si los únicos ideales son (0) y el ideal impropio.
En particular, si K es un cuerpo y f : K −→ R es un morfismo de anillos, entonces
f es inyectivo (monomorfismo) y K se puede identificar con un subcuerpo de R (i.e.
un subanillo de R que, además, es cuerpo con las operaciones inducidas por las de R).
Demostración. La mayorı́a de estas propiedades son evidentes y no necesitan de mayor
discusión. 
Ejemplo 1.3.6 (Ideal Principal). Dado un anillo R y un elemento a ∈ R, se define el ideal
principal generado por a como el conjunto siguiente:
(a) := {λa : λ ∈ R}.
Es un sencillo ejercicio verificar que (a) es ideal en R. En ocasiones utilizaremos la notación
aR. Esto conduce a todos los anillos cociente R/(a) (o R/aR). Entre ellos podemos considerar
los anillos cocientes Z/mZ, donde m es un entero cualquiera en Z.
Es también un ejercicio sencillo probar que (a) = R si y solamente si a ∈ R∗ .

Ejemplo 1.3.7. Con las notaciones anteriores, R[X] es un subanillo de R[[X]] y existe un
monomorfismo de anillos entre R y R[X] que permite idenfiticar R con un subanillo de R[X].

Definición 22 (Divisores de cero, Dominio de Integridad). En un anillo (R, +, ·) se dice


que un elemento x ∈ R es un divisor de cero si existe otro elemento no nulo y ∈ A tales que
xy = 0.
Un anillo sin divisores de cero no nulos se denomina dominio de integridad.

Ejemplo 1.3.8. Son ejemplos de dominios de integridad los siguientes:


i) Los cuerpos son dominios de integridad.
ii) Si R es un dominio de integridad también lo son los anillos de polinomios en una
variable con coeficientes en R: R[X]. Para probarlo, consideremos el grado deg :
R[X] −→ N ∪ {−1}. Es sencillo demostrar que si R es un dominio de integridad,
entonces el grado de un polinomo univariado satisface las dos propiedades siguientes
para dos polinomios no nulos f, g ∈ R[X]:
deg(f + g) ≤ max{deg(f ), deg(g)}.
34 1. PRE-ÁLGEBRA

deg(f g) = deg(f ) + deg(g).


La segunda propiedad se transforma en desiguladad (≤) en el caso de que R no sea
dominio de integridad. Con estas dos propiedades es claro que si R es dominio de
integridad, el producto de dos polinomios no nulos es un polinomio no nulo y, por
tanto, también R[X] es dominio de integridad. Dejamos para más adelante el probar
que si R es dominio de itegridad también lo es el anillo de series R[[X]] (ver Teorem
1.3.28).
iii) Los subanillos de dominios de integridad también son dominios de integridad. El anillo
de los enteros Z es dominio de integridad.

Teorema 1.3.9 (División Euclı́dea en R[X]). Sea R un dominio de integridad y g ∈ R[X]


un polinomio mónico (i.e. un polinomio cuyo coeficiente director es una unidad en R∗ o,
equivalentemente, g es de la forma:
g = uX d + ad−1 X d−1 + · · · + a1 X + a0 ,
con ai ∈ R y u ∈ R∗ ).
Entonces, existe división por g en R[X], es decir, para todo f ∈ R[X] existen q, r ∈ R[X] tales
que se verifican las dos propiedades siguientes:
i) f = qg + r,
ii) deg(r) ≤ deg(g) − 1.
Además, q y r son únicos con esa propiedad.
Demostración. Probemos, en primer lugar, la existencia de q y r. Para ello, consideremos
el conjunto
I := {deg(f ) : f no admite una descomposición f = qg + r satisfaciendo (2)} ⊆ N.
Si el conjunto I fuera vacı́o, poseerı́a un elemento mı́nimo t := min(I). Sea f ∈ R[X] tal que
deg(f ) = t, el mı́nimo de I. Supongamos:
f := bt X t + bt−1 X t−1 + · · · + b0 ,
con bi ∈ R. Supongamos que g tiene la forma:
g = uX d + ad−1 X d−1 + · · · + a1 X + a0 ,
con ai ∈ R y u ∈ R∗ . Tenemos que d ≤ t. Porque si d < t tendrı́amos la representación
f := 0g + f,
que satisface la condición (2) del enunciado. Como d ≤ t y u ∈ R∗ , sea u−1 el inverso de u en
(R∗ , · · · ), podemos considerar el polinomio
h := f − bt u−1 X t−d g ∈ R[X].
Es un ejercicio de mera comprobación que h ∈ R[X] es un polinomio cuyo grado deg(h) <
t = deg(f ). Como t es el mı́nimo del conjunto I. Como deg(h) 6∈ I, entonces, existe una
descomposición del tipo:
h = qg + r,
con deg(r) ≤ deg(g) − 1. Concluiremos entonces que:
f = bt u−1 X t−d + q g + r,


con deg(r) ≤ deg(g) − 1. Con ello concluirı́amos que t = deg(f ) 6∈ I, contradiciendo el hecho
de ser t := min(I). Luego la única opción es que I sea vacı́o y se sigue la existencia de q y r
para cada f ∈ R[X].
Supongamos ahora que un polinomio admitiera dos descomposiciones del tipo indicado:
f = q1 g + r1 = q2 g + r2 ,
con deg(ri ) ≤ deg(g) − 1. Entonces tendremos:
q1 g + r1 = q2 g + r2 =⇒ (q1 − q2 )g = r1 − r2 .
Usando los grados tendremos que
deg(q1 − q2 ) + deg(g) = deg(r1 − r2 ) ≤ max{deg(r1 ), deg(r2 )} ≤ deg(g) − 1.
Por tanto, necesariamente q1 = q2 y r1 = r2 y tendremos la unicidad. 
1.3. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 35

Observación 1.3.10. Nótese que la propiedad “el coeficiente director es una unidad en R”
es una condición necesaria. Por ejemplo, dividir X por 2X en Z[X] no es posible con las
condiciones de la División euclı́dea.

Corollario 1.3.11. Si K es un cuerpo, entonces K[X] admite división euclı́dea, esto es, se
verifica:
Dados f, g ∈ K[X], g 6= 0, existen q, r ∈ K[X] tales que se verifican las dos propiedades
siguientes:
i) f = qg + r,
ii) deg(r) ≤ deg(g) − 1.
Además, q y r son únicos con esa propiedad.
Demostración. Es obvio dado que todo polinomio no nulo en K[X] posee un coeficiente
director que es una unidad en K. 
Utilicemos este Teorema para mostrar ejemplos de extensiones de Z.
Ejemplo 1.3.12 (Enteros de Gauss, de nuevo). Es fácil ver que se tiene la identificación
Z[i] := Z[X]/(X 2 + 1).
Por ello, y por el Teorema precedente, podemos entender los enteros de Gauss como los restos
de la división por el polinomio mónico X 2 + 1. Claramente, tenemos una identificación
Z[i] := {a + bX : a, b ∈ Z},
donde a + bX denota la clase a + bX + (X 2 + 1) en el anillo cociente Z[X]/(X 2 + 1).

Ejemplo 1.3.13 (Enteros de Eisenstein). El anillo de los enteros de Eisenstein. Consider-


emos el polinomio X 3 − 1 ∈ Z[X] y su factorización:
X 3 − 1 = (X − 1)(X 2 + X + 1).
Podemos considerar el anillo cociente
Z[X]/(X 2 + X + 1).
Es fácil, de nuevo, comprobar que es el anillo de restos de la división por el polinomo mónico
X 2 + X + 1. Podemos escribir:
Z[X]/(X 2 + X + 1) = {a + bX : a, b ∈ Z},
donde a + bX denota la clase a + bX + (X 2 + X + 1) en el anillo cociente Z[X]/(X 2 + X + 1).
De hecho, podemos considerar el número complejo

−1 + −3
ω := ∈ C,
2
y considerar el subanillo de C:
Z[ω] := {a + bω : a, b ∈ Z}.
Es un sencillo ejercicio verificar que este anillo coincide con el anillo de enteros de Eisenstein,
es decir,
Z[ω] = Z[X]/(X 2 + X + 1).

Observación 1.3.14 (Operations matter!). En los dos ejemplos anteriores, hemos mostrado
los anillos Z[i] y Z[ω]. Para cada uno de ellos disponemos de una biyección:
ϕ : Z[i] −→ Z2 , ϕ(a + bi) = (a, b)
ψ : Z[ω] −→ Z2 , ψ(a + bω) = (a, b).
Cada una de ellas define una estructura de anillo en Z2 del modo siguiente.
• (Z2 , +, ∗1 ) siendo (Z2 , +) la estructura natural de grupo abeliano libre de rango 2 y
el producto viene dado por:
(a, b) ∗1 (c, d) := ϕ(ϕ−1 (a, b)ϕ−1 (c, d)) = (ac − db, ad + bc).
36 1. PRE-ÁLGEBRA

• (Z2 , +, ∗2 ) siendo (Z2 , +) la estructura natural de grupo abeliano libre de rango 2 y


el producto viene dado por2 :
(a, b) ∗2 (c, d) := ψ(ψ −1 (a, b)ψ −1 (c, d)) = (ac − bd, ad + bc − bd).
Pero, incluso, podemos definir una estructura más de anillo en Z2 del modo siguiente. Se trata
de la estructura (Z2 , +, ·), donde (Z2 , +) es la estructura usual de grupo, meintras que
·: Z2 × Z2 −→ Z2
((a, b), (c, d)) 7−→ (ac, bd).
La conclución es que tenemos tres estructuras de anillo definidas sobre Z2 y las tres son diferentes
y no isomorfas. Para verlo, baste con observar lo siguiente:
• Las estructuras (Z2 , +, ∗1 ) y (Z2 , +, ∗2 ) le dan a Z2 una estructura de dominio de
integridad. En cambio, (Z2 , +, ·) no es dominio de integridad porque (1, 0) · (0, 1) =
(0, 0) y (Z2 , +, ·) posee divisores de cero no nulos.
• Las estructuras (Z2 , +, ∗1 ) y (Z2 , +, ∗2 ) tampoco son isomorfas entre sı́ porque el
número de elementos unidad en cada una de ellas es distinto. Esto se comprueba
probando que:
Z[i]∗ = {±1, ±i}, Z[ω]∗ = {±1, ±ω, ±ω 2 }.
Dado que el segundo posee 6 elementos unidad y el primero posee solamente 4, es
imposible que sean isomorfos.
La moraleja es que las operaciones sı́ importan y que en un mismo conjunto, incluso en un
mismo grupo abeliano, podemos inducir muy diferentes estructuras de anillo. En ocasiones
(y, muy comúnmente, en la literatura) se usa la expresión “...Sea R un anillo...”. Aunque
no se esté escribiendo explı́citamente, se está sobre-entendiendo la estructura subyacente y las
operaciones.

Ejemplo 1.3.15 (Los anillos Z[ m]). Sea m ∈ Z un entero que no es un cuadrado. Podemos
considerar el anillo cociente: √
Z[ m] := Z[X]/(X 2 − m).
Como en los casos anteriores, por ser X 2 − m mónico, tenemos la identificación siguiente:
√ √
Z[ m] = {a + b m : a, b ∈ Z} = {a + bX : a, b ∈ Z},
donde a + bX = a + bX + (X 2 − m) es la clase residual definida por a + bX. Como subanillos
de C, todos ellos son dominios de integridad pero toman estructuras y formas muy diversas.
Pongamos un par de ejmplos. Por supuesto, los enteros de Gauss son un caso particular.
√ √
• El anillo Z[ −5]. El elemento 2 ∈ Z deja de ser un primo si lo miramos en Z[ −5]
porque tendremos que 6 admite dos factorizaciones distintas:
√ √
6 = 2 · 3 = (1 + −5) · (1 − −5).

• El anillo Z[ 2] tiene una infinidad de unidades dado que:
√ √
±(1 + 2)n ∈ Z[ 2]∗ ,
√ √
para todo n ∈ N. La razón es que, obviamente, se tiene (1 + 2)(1 − 2) = −1.
2
Esto
√ confiere una estructura muy distinta a Z a través del isomorfismo de grupos con
Z[ 2].

Ejemplo 1.3.16 (Los anillos Z[ 1+2 m ]). Supongamos que m ∈ Z no es un cuadrado en Z y
consideremos el polinomio
√ √
2 1+ m 1− m
4X − 4X + (1 − m) = 4(X − )(X − ) ∈ Z[X].
2 2
Consideremos una de las raı́ces en C y pensemos en el conjunto siguiente:
√ √
1+ m 1+ m
Z+Z = {a + b : a, b ∈ Z}.
2 2
2Nótese que ω 2 = −1 − ω y que (a + bω)(c + dω) es igual a ac − db + (ad + bc − bd)ω.
1.3. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 37

Este conjunto es obviamente un subgrupo de (C, +) pero no siempre es un anillo. De hecho, la


condición clave es la siguiente:
m = 1 mod 4.
Si m 6= 1 mod 4, se tiene que:
√ √ √ √ √
1+ m 1+ m 1+ m1− m 1−m 1+ m
(1 − )= = 6∈ Z + Z .
2 2 2 2 4 2

Por tanto, si m 6= 1 mod 4, tenemos que el producto de dos elementos de Z + Z 1+2 m no

necesariamente está en Z + Z 1+2 m , con lo que, en este caso, no es un anillo. Sin embargo, si
m = 1 mod 4, podemos reemplazar el polinomio original por el siguiente:
1−m
4X 2 − 4X + (1 − m) = 4(X 2 − X + ).
4
El polinomio X 2 − X + 1−m 4 ∈ Z[X] y tendremos:
√ √ √
1+ m 1+ m 1+ m 1−m
Z[ ]=Z+Z = {a + b : a, b ∈ Z} = Z[X]/(X 2 − X + ),
2 2 2 4
y recuperamos la analogı́a con situaciones anteriores y una nueva estructura de anillo sobre Z2 .

1.3.1. Anillos de Polinomios y de Series de Potencias Formales en varias vari-


ables. Sea X un conjunto cualquiera y sea R un anillo. El conjunto Ap(X, R) de las aplica-
ciones de X en R es claramente un anillo con las operaciones naturales de suma y producto de
aplicaciones. El caso de los polinomios es una reinterpretación de Ap(X, R) que definiremos a
continuación.
Observación 1.3.17 (deglex:=Grado + lexicográfico). Recordemos que podemos identi-
ficar (vı́a biyección) Nn con N de varias formas distintas. Cada una de esas biyecciones supone
la introducción de un orden en Nn . Lo que haremos ahora es el proceso inverso: destacar un
orden en Nn (que defina una biyección con N) que es, además un orden monomial (un orden
monomial es un buen orden ≤ en Nn tal que verifica:
∀µ, θ, τ ∈ Nn , si µ ≤ τ, entonces µ + θ ≤ τ + θ.)
Un ejemplo de orden monomial es el deglex, también denominado “grado + lexicográfico”
(≤deglex ) , que se define del modo siguiente. Sea ≤lex el orden lexicográfico en Nn . Obsérves
que ≤lex no es un orden que permita biyectar Nn con N. Entonces, definimos: para µ, θ ∈ Nn ,
diremos que µ ≤deglex θ si se verifica:
[|µ| < |θ|] ∨ [(|µ| = |θ|) ∧ (µ ≤lex θ)] .
Consideremos el grupo aditivo (Ap(Nn , R), +) y definamos la función producto siguiente:
∗ : Ap(Nn , R) × Ap(Nn , R) −→ Ap(Nn , R),
dada mediante: Dadas f, g ∈ Ap(Nn , R), definamos: f ∗ g : Nn −→ R, mediante:
X
f ∗ g(µ) := f (θ)g(τ ).
θ,τ ∈Nn ,θ+τ =µ

Obsérvese que esta operación producto es la versión discreta de la convolución de funciones


medibles. Finalmente, definamos Ap0 (Nn , R) como aquellas aplicaciones que se anulan salvo en
un número finito de ı́ndices, Esto es,
Ap0 (Nn , R) := {f : Nn −→ R : ∃I ⊆ Nn , I finito, f (µ) = 0, ∀µ 6∈ I}.
Proposición 1.3.18. Con las anteriores notaciones:
i) La terna (Ap(Nn , R), +, ∗) es un anillo conmutativo con unidad que se denomina anillo
de series de potencias formales en n variables con coeficientes en R y se denota me-
diante R[[X1 , . . . , Xn ]]
ii) La terna (Ap0 (Nn , R), +, ∗) es un anillo conmutativo con unidad que se denomina
anillo de polinomios en n variables con coeficientes en R y se denota mediante R[X1 , . . . , Xn ].
De hecho, Ap0 (Nn , R) es un subanillo propio de Ap0 (Nn , R).
Demostración. Se trata simplemente de verificar las propiedades indicadas. 
38 1. PRE-ÁLGEBRA

La siguiente es una Proposición de fácil demostración:


Proposición 1.3.19. Con las anteriores notaciones se tiene:
i) Ap(N, Ap(Nn−1 , R)) = Ap(Nn , R) y Ap(Nm , Ap(Nn−m , R)) = Ap(Nn , R), para cada
m ∈ N, m ≤ n.
ii) Ap0 (N, Ap0 (Nn−1 , R)) = Ap0 (Nn , R) y Ap0 (Nm , Ap0 (Nn−m , R)) = Ap0 (Nn , R), para
cada m ∈ N, m ≤ n.

Observación 1.3.20. En otras palabras, y usando la notación anterior con [’s, estamos diciendo
que R[[X1 , . . . , Xn−1 ]][[Xn ]] = R[[X1 , . . . , Xn ]] y R[X1 , . . . , Xn−1 ][Xn ] = R[X1 , . . . , Xn ], por
ejemplo. Es útil para argumentos inductivos.
Notación 1.3.21 (Monomios, términos, grado). Hay una notación estandarizada de estos
objetos. Supongamos dado µ := (µ1 , . . . , µn ) ∈ Nn un exponente monomial. Se define el
monomio X µ := X1µ1 X2µ2 · · · Xnµn ∈ R[X1 , . . . , Xn ] = Ap0 (Nn , R) como la transformación X µ :
Nn −→ R, dada mediante:

1, si θ = µ,
X µ (θ) :=
0, en caso contrario.
Dado a ∈ R, se define el el término aX µ ∈ R[X1 , . . . , Xn ] como como la transformación
aX µ : Nn −→ R, dada mediante:

a, si θ = µ,
aX µ (θ) :=
0, en caso contrario.
Se dice que a es el coeficiente de aX µ , que µ es su exponente y que |µ| ∈ N es el grado del
término.
Lema 1.3.22. Con estas notaciones, R es un subanillo de R[X1 , . . . , Xn ], identificando R con
el conjunto de términos:
{λX (0) : λ ∈ R},
donde (0) = (0, . . . , 0) ∈ Nn es el elemento neutro de Nn como monoide. Escribiremos 1 en
lugar de X (0) y a ∈ R[[X1 , . . . , Xn ]] en lugar de aX (0) , para cada a ∈ R.
Demostración. Obvio. 

Notación 1.3.23. Definamos, además, los siguientes elementos de Ap(Nn , R): {X1 , . . . , Xn }
dados mediante las reglas siguientes:

1, si θ = (1, 0, 0, . . . , 0),
X1 : Nn −→ R, X1 (θ) :=
0, en caso contrario.

1, si θ = (0, 1, 0, . . . , 0),
X2 : Nn −→ R, X2 (θ) :=
0, en caso contrario.
..
.

1, si θ = (0, 0, 0, . . . , 1),
Xn : Nn −→ R, Xn (θ) :=
0, en caso contrario.
Se denominan las variables X1 , . . . , Xn . Podemos definir también las potencias de variables a
partir de la operación producto ∗ de Ap(Nn , R).:
Xi0 := 1, Xi1 := Xi , Xi2 := Xi ∗ Xi ,

Xit := Xit−1 ∗ Xi .
Lema 1.3.24. Con las anteriores notaciones, dado µ = (µ1 , . . . , µn ) ∈ Nn , se tiene:
X µ = X1µ1 ∗ · · · ∗ Xnµn .
Demostración. Es un ejercicio obvio. 
1.3. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 39

Observación 1.3.25. En ocasiones se “olvida” que la operación entre variables no es la op-


eración convolución ∗ y se omite. Por eso encontraremos como notación estandarizada la sigu-
iente:
X µ = X1µ1 · · · Xnµn .
Debe tenerse cuidado con esta omisión y ser siempre consciente de su presencia, sobre todo
cuando se comparan las operaciones producto de polinomios y series con las operaciones pro-
ducto de aplicaciones que veremos más adelante.
Proposición 1.3.26. Con las anteriores notaciones, para cada polinomio f ∈ Ap0 (Nn , R) existe
un conjunto finitio supp(f ) ⊆ Nn y existen {aµ : µ ∈ supp(f )} ⊆ R \ {0} tales que:
X X
f := aµ X µ = aµ X1µ1 ∗ · · · ∗ Xnµn .
µ∈supp(f ) µ∈supp(f )

Al menor conjunto finito supp(f ) se le denomina soporte de f y se caracteriza mediante:


supp(f ) := {µ ∈ Nn : aµ 6= 0},
y, obviamente, se verifica que f 6= 0 si y solamente si supp(f ) 6= ∅. Al siguiente valor se le
denomina el grado de f :
deg(f ) := max{|µ| : µ ∈ supp(f ), aµ 6= 0}.
Demostración. Mero ejercicio de comprobación a partir de las definiciones. 
Observación 1.3.27. En el caso de series de potencias formales también se admite una repre-
sentación de la forma siguiente: Dada f ∈ R[[X1 , . . . , Xn ]], escribiremos:
X
f := aµ X µ ,
µ∈Nn

aunque, obviamente, por ser una suma infinita es un lı́mite y require de varias discusiones
adicionales como la introducción de una topologı́a y de una métrica.

Teorema 1.3.28. Si R es dominio de integridad, también lo son R[X1 , . . . , Xn ] y R[[X1 , . . . , Xn ]].


Demostración. Las propiedades (i) y (ii) son meras propiedades de comprobación. Para
probarlas basta con verificar las propiedades una a una. Para la condición de dominio de
integridad, probaremos el caso de R[X1 , . . . , Xn ] y dejaremos como ejercicio la demostración
el caso de series de potencias formales. Para comenzar, obsérvese que deglex (recordar la
Observación 1.3.17) define un orden total en Nn . De hecho, define una biyección entre Nn y
N. Consideremos ahora dos polinomios f, g ∈ R[X1 , . . . , Xn ] no nulos. Sean I, J ∈ Nn son dos
conjuntos finitos dados como los respectivos soportes de f y g (recordar la Proposición 1.3.26).
Es decir, suponemos
X X
f := aµ X µ , g := bµ X µ ,
µ∈Nn µ∈Nn
siendo
I = supp(f ) := {µ ∈ Nn : aµ 6= 0},
J = supp(g) := {µ ∈ Nn : bµ 6= 0}.
Tendremos entonces,
X X
f := aµ X µ , g := bµ X µ .
µ∈I µ∈J
Consideremos agora el conjunto
I + J := {µ + ν ∈ Nn : µ ∈ I, ν ∈ J}.
Obsérvese que I +J es un conjunto finito y el soporte del polinomio producto f ·g está contenido
en I + J. De hecho, se tiene
 
X X
f ·g =  aµ bν  X τ .
τ ∈I+J µ∈I,ν∈J,µ+ν=τ
40 1. PRE-ÁLGEBRA

obsérvese también que la relación de orden deglex respeta la suma de exponentes, es decir,
dados µ, ν, τ ∈ Nn , entonces,

µ ≤deglex ν =⇒ µ + τ ≤deglex ν + τ.

En particular, consideremos
µ0 := min(I), ν0 := min(J).
Tendremos que µ0 + ν0 = min(I + J). El argumento es obvio, dado que µ0 + ν0 ∈ I + J y,
además, µ0 + ν0 ≤ µ + ν, para todo µ ∈ I y ν ∈ J. Consideremos la suma
 
X
 aµ bν  ,
µ∈I,ν∈J,µ+ν=τ

y observamos que el conjunto

{(µ, ν) ∈ I × J : µ + ν = µ0 + ν0 } = {(µ0 , ν0 )}.

Entonces la anterior suma verifica:


 
X
 aµ bν  = aµ0 bν0 .
µ∈I,ν∈J,µ+ν=τ

Más aún, como µ0 ∈ supp(f ) y ν0 ∈ supp(g), se tiene que aµ0 6= 0 y bν0 6= 0 en R. Como R
es un dominio de integridad, entonces aµ0 bν0 6= 0 en R. Finalmente, aµ0 bν0 es el coeficiente del
monomio X µ0 +ν0 en f · g y es no nulo, con lo que µ0 + ν0 ∈ supp(f · g) 6= ∅, luego (recordando
la Proposición 1.3.26) f · g 6= 0 en R[X1 , . . . , Xn ]. 

Proposición 1.3.29. Sea K un cuerpo y K[X1 , . . . , Xn ] el anillo de polinomios en n variables


con coeficientes en K. Entonces,
i) K[X1 , . . . , Xn ] es un K−espacio vectorial, con base dada por los monomios

{X µ : µ ∈ Nn }.

ii) Dado un polinomio f ∈ K[X1 , . . . , Xn ], tenemos una representación:


X
f := aµ X µ ,
µ∈I

donde I ⊆ Nn es un conjunto finito, {aµ : µ ∈ I} ⊆ K. Definiremos grado de f


como el máximo de los grados de los términos no nulos en una descomposición como
la anterior. Es una noción bien definida.
iii) Dado un entero d ∈ N, denotaremos por Hd (X1 , . . . , Xn ) al K−subespacio vectorial
de K[X1 , . . . , Xn ] generado por los monomios de grado d, es decir, generado por:

{X µ : |µ| = d, µ ∈ Nn }.

Entonces, Hd (X1 , . . . , Xn ) es un espacio vectorial de dimensión finita e igual a


 
d+n−1
dimK Hd (X1 , . . . , Xn ) = .
n−1

Más aún, tenemos la descomposición de K[X1 , . . . , Xn ] en suma directa de subespacios


siguiente:
M
K[X1 , . . . , Xn ] := Hd (X1 , . . . , Xn ).
d∈N

Demostración. Las afirmaciones son de mera comprobación. 


1.3. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 41

1.3.2. Otros ejemplos.


Ejemplo 1.3.30 (Aplicaciones). A diferencia del caso de polinomios, podemos considerar X un
conjunto cualquiera y el conjunto Ap(X, R), donde R es un anillo cualquiera. Podemos definir
dos operaciones, de una parte consideramos el grupo aditivo (Ap(X, R), +), con la suma usual
de funciones, de otra parte podemos definir una operación producto:
· : Ap(X, R)2 −→ Ap(X, R)
(f, g) 7−→ f · g,
donde
f ·g : X −→ R
x 7−→ f (x) · g(x),
y f (x) · g(x) representa el producto en R.
Proposición 1.3.31. Con las anteriores notaciones (Ap(X, R), +, ·) es un anillo conmutativo
con unidad.
Demostración. Mero ejercicio de comprobación de propiedades. 
n n
Observación 1.3.32. No deben confundirse (Ap(N , R), +, ·) y (Ap(N , R), +, ∗). Aunque
ambos anillos tienen el mismo conjunto como sustrato Ap(Nn , R), al haber considerado dos
operaciones producto distintas (· y ∗), se puede comprobar que ambos anillos no serán isomorfos.

Ejemplo 1.3.33 (Funciones Booleanas). Son funciones básicas en Lógica y en diseño de


Circuitos Digitales. Por ahora nos vamos a conformar con definirlas. Comenzamos observando
la identificación {0, 1} = Z/2Z que identifica los valores boooleanos {0, 1} (o también en su ver-
siones verdadero/falso: {V, F}) con el cuerpo primo de caracterı́stica 2. Se denomina función
booleana de n variables a toda aplicación: f : {0, 1}n −→ {0, 1}. Se define el conjunto de
funciones booleanas
Bn := {f : {0, 1}n −→ {0, 1} : f es aplicación}.
Es fácil de observar que podemos identificar
Bn ∼= P({0, 1}n ),
es decir, el conjunto de funciones booleanas con el conjunto de todos los subconjuntos de {0, 1}n .
La biyección entre ambos conjuntos es dada por las funciones caracterı́sticas:
• Dado un subconjunto L ∈ P({0, 1}n ), definimos la función booleana χL ∈ Bn dada
mediante:
∀x ∈ {0, 1}n , χL (x) = 1 ⇐⇒ x ∈ X.
• Recı́procamente, dada una función booleana f ∈ Bn , definimos el lenguaje aceptado
por f como L := f −1 ({1}) ∈ P({0, 1}n ).
Ahora, identificando {0, 1} con Z/2Z, observamos que Bn := Ap({0, 1}n , Z/2Z) y tiene una
estructura de anillo natural a través de las operaciones del cuerpo Z/2Z.

Podemos concluir:
Proposición 1.3.34. El conjunto de funciones booleanas Bn tiene una estructura natural de
anillo conmutativo con unidad, es biyectable al conjunto P({0, 1}n ) y tiene, por tanto, cardinal
dado por la siguiente identidad:
n
] (Bn ) = 22 .
Demostración. Es lo discutido en párrafos previos. 
Ejemplo 1.3.35 (Funciones Holomorfas). Un ejemplo de dominio de integridad que se sale
del contexto de este curso es el siguiente:
• Sea U ⊆ Rn un abierto y consideramos el siguiente conjunto:
C ω (U ) := {f : U −→ R : f es analı́tica en U }.
Es un sencillo ejercicio de análisis, probar que C ω (U ) es un subanillo de (Ap(X, R), +, ·)
y, por tanto, un anillo con las operaciones habituales de suma y producto de funciones.
Se llama el anillo de las funciones analı́ticas sobre U .
42 1. PRE-ÁLGEBRA

• Sea U ⊆ Cn un abierto y consideramos el siguiente conjunto:


H(U ) := {f : U −→ C : f es analı́tica en U }.
Un clásico ejercicio de Análisis consiste en probar que H(U ) es un subanillo de
(Ap(X, C), +, ·) y, por tanto, un anillo con las operaciones habituales de suma y pro-
ducto de funciones. A las funciones en H(U ) se las denomina funciones holomorfas
y a H(U ) se denomina anillo de las funciones holomorfas definidas en U .
Se tiene el siguiente resultado:
Teorema 1.3.36. Sea X ⊆ C un abierto no vacı́o. Entonces, el anillo de funciones holomorfas
definidas en X H(X) es un dominio de integridad si y solamente si X es un abierto conexo.
Demostración. Baste con observar que el conjunto de ceros de una función holomorfa
compleja no nula es un conjunto numerable sin puntos de acumulación (i.e. que los ceros de
funciones holomorfas son puntos aislados 3). Con este resultado, supongamos que X es abierto
conexo y que el producto de dos funciones f, g ∈ H(X) es tal que f g se anula idénticamente en
X. Entonces, podemos observar que
X = VX (f ) ∪ VX (g),
donde VX (f ) y VX (g) son los ceros en X de f y g necesariamente. Pero X es un abierto en
Cn , luego no es numerable, mientras que la unión de dos numerables es numerable. Esto quiere
decir que si f 6= 0 y g 6= 0, entonces tendrı́amos X como unión de dos numerables llegando a
contradicción. Luego, necesariamente X = VX (f ) o X = VX (g), lo que equivale a decir f = 0
o g = 0 y H(X) es dominio de integridad.
Para el recı́proco, baste con observar lo siguiente: Si X no fuera conexo, posee una descom-
posición como unión de dos abiertos disjuntos X = X1 ∪ X2 . Entonces, podemos definir dos
funciones no nulas f1 , f2 : X −→ C, del modo siguiente:

1 si x ∈ Xi
fi (x) :=
0 en caso contrario
Obviamente f1 f2 = 0 y ninguna de ellas es nula. 
Observación 1.3.37. [Las funciones C ∞ y los divisores de cero] Este resultado es también
cierto en el caso de funciones analı́ticas reales sobre abiertos X ⊆ R, es decir C ω (X) es dominio
de integridad si y solamente si X es conexo. En cambio, el resultado no es cierto para funciones
diferenciables o para funciones continuas. Si tratamos con funciones C ∞ (R) podemos encontrar
dos funciones f+ y f− : R −→ R tales que ambas son infinitamente diferenciables y verifican:


 f+ (x) = 0, f− (x) = 1, si x ∈ (−∞, −1)
f+ (x) = 0, si x ∈ (−1, 0)


 f − (x) = 0, si x ∈ (0, 1)
f+ (x) = 1, f− (x) = 0, si x ∈ (1, +∞)

Claramente f+ f− = 0 y ninguna de ellas dos es un función nula, con lo que C ∞ (R) no es dominio
de integridad. Como ejercicio se propone buscar esas dos funciones en el caso X = R.

1.3.3. Ejercicios y Problemas de la Sección 1.3.


Problema 28. Pruébese que todas las afirmaciones descritas en la Proposición 1.3.5.
Problema 29. Pruébese la Proposición 1.3.31.
Problema 30. Pruébese la Proposición 1.3.34.
Problema 31. Pruébense las siguientes igualdades que caracterizan las unidades R∗ de los
anillos que se indican:
i) Z[i]∗ = {±1, ±i} ∼= (Z/4Z).
ii) Si Z[ω] es el anillo de Eisenstein, probrar
Z[ω]∗ = {±1, ±ω, ±ω 2 }.
3Buscar “Zero (Complex Analysis)” en Wikipedia
1.3. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 43

iii) Si m < −1 es un entero, probar que:



Z[ m]∗ = {±1}.
iv) Si m ∈ Z es un entero tal que m ≡ 1 mod 4 y m < −3, entonces
  √ ∗
1+ m
Z = {±1}.
2
Problema 32. Sea K un cuerpo y consideremos el conjunto de los polinomios en una variable
de grado a lo sumo d y con coneficientes en K. Esto es, el conjunto:
K[X]d := {f ∈ K[X] : deg(f ) ≤ d}.
Probad:
• (K[X]d , +) es un grupo con la suma de polinomios univariados.
• (K[X]d , +, ·K ) es un espacio vectorial de dimensión d + 1 con base monomial:
Md (X) := {1, X, X 2 , . . . , X d }.
• Pero (K[X]d , +, ·) no es anillo con las operaciones habituales de suma y producto de
polinomios.
Problema 33 (Funciones continuas). Sea (X, T ) un espacio topológico y sea U ⊆ X un abierto.
Consideramos el siguiente conjunto:
C 0 (U ) := {f : U −→ R : f es continua}.
Hay que probar que C 0 (U ) es un subanillo de (Ap(X, R), +, ·) y, por tanto, un anillo con las
operaciones habituales de suma y producto de funciones.
Problema 34 (Funciones continuas a valores complejos). Sea (X, T ) un espacio topológico y
sea U ⊆ X un abierto. Consideramos el siguiente conjunto:
C 0 (U, C) := {f : U −→ C : f es continua}.
Se debe probar que C 0 (U, C) es un subanillo de (Ap(X, C), +, ·) y, por tanto, un anillo con
las operaciones habituales de suma y producto de funciones. ¿Qué relación tienen C 0 (U ) y
C 0 (U, C)?.
Problema 35 (Funciones Diferenciables). Sea k ∈ N ∪ {∞}, k ≥ 1 y sea M una variedad
diferenciable de clase C ∞ . Sea U ⊆ M un abierto y consideramos el siguiente conjunto:
C k (U ) := {f : U −→ R : f es k veces diferenciable con derivada k−ésima continua}.
Probad que C k (U ) es un subanillo de (Ap(U, R), +, ·) y, por tanto, un anillo con las operaciones
habituales de suma y producto de funciones.
Problema 36. Buscar ejemplos de funciones no nulas f+ y f− de clase C ∞ (R) y tales que
f+ f− = 0 en todo R y que se citan en la observación 1.3.37. Concluir que C k (R) no es dominio
de integridad para todo k, 0 ≤ k ≤ ∞. (Pista: Considerar la función f :−→ R siguiente:

0, si x ≤ 0
f (x)
e−1/x , si x > 0.
Problema 37. Buscar ejemplos de abiertos X en R tales que cada contenido es estricto (ver
cursos previos de Análisis Matemático) y, por tanto, dan lugar a un contenido estricto de
anillos:
• X tal que R ( C ω (X),
• X tal que C ω (X) ( C ∞ (X),
• X tal que C ∞ (X) ( C k (X), con k < ∞,
• X tal que C 2 (X) ( C 1 (X),
• X tal que C 1 (X) ( C 0 (X).
Problema 38. Sea x un elemento nilpotente de un anillo R (un elemento x ∈ R se llama
nilpotente si ∃n ∈ N, xn = 0 ∈ R). Probad que 1 + x ∈ R∗ . Deducir que la suma de un
elemento nilpotente y una unidad en un anillo es una unidad del anillo.
44 1. PRE-ÁLGEBRA

Problema 39. Sea f = a0 +a1 X +· · ·+an X n ∈ R[X] un polinomio univariado con coeficientes
en un anillo R. Probad que f es una unidad en R[X] si y solamente si a0 es una unidad en R
y a1 , . . . , an son nilpotentes en R.
Problema 40. Con las notaciones del problema anterior, probar que f es nilpotente si y
solamente si a0 , a1 , . . . , an son nilpotentes en R.
Problema 41. Con las notaciones de los problemas anteriores, probar que f es divisor de
cero en R[X] si y solamente si existe a ∈ R \ {0} tal que af = 0. ( Hint: Suponed que
f = a0 + a1 X + · · · + an X n , con an 6= 0, y considerad el conjunto de todos los polinomios
en R[X] que anulan f , es decir, AnnR[X] (f ) := {g ∈ R[X] : gf = 0}, que es un ideal de
R[X]. Considérese el conjunto de los grados de los polinomios no nulos en AnnR[X] (f ), es
decir, N (f ) := {deg(g) : g 6= 0, g ∈ AnnR[X] (f )}. Si f es un divisor de cero, entonces
N (f ) ⊆ N es un cojunto no vacı́o que posee un mı́nimo. Sea m := min(N (f )) ese mı́nimo
y sea g ∈ AnnR[X] (f ) un polinomio de grado m (y, por tanto, g 6= 0). Supongamos g =
b0 + b1 X + · · · + bm X m , con bm 6= 0. Sabemos que gf = 0 y consideremos el polinomio an g.
Del hecho gf = 0, concluimos que an bm = 0 y, además, an g es un polinomio de grado menor
o igual que m − 1. Pero, además, an g ∈ AnnR[X] (f ) por ser ideal. Por tanto, an g = 0.
Inductivamente, concluir que ai g = 0 para todo i, 0 ≤ i ≤ n. Concluid que, si se da ai g = 0,
para cada i, 0 ≤ i ≤ n, entonces, en particular, ai bm = 0 para cada i, 0 ≤ i ≤ n. Concluid,
finalmente, que bm f = 0 y bm 6= 0, que es lo buscado en el problema. )
Problema 42 (Funciones Polinomiales sobre un conjunto V ). Sea R un anillo y sea
V ⊆ Rn un subjconjunto cualquiera. Se definen las funciones polinomiales sobre V del modo
siguiente:
i) Son funciones polinomiales las siguientes:
(a) Son funciones polinomiales sobre V las constantes. Es decir, dado a ∈ R, la
siguiente es una función polinomial sobre V :
a: V −→ R
x 7−→ a.
(b) Son funciones polinomiales sobre V las proyecciones. Es decir, para cada i, 1 ≤
i ≤ n, la siguiente es una función polinomial sobre V :
πi : V −→ R
(x1 , . . . , xn ) 7−→ xi .
ii) Las funciones polinomiales son estables por las siguientes reglas:
(a) Las funciones polinomiales son estables por la suma de funciones. Es decir, dadas
dos funciones polinomiales f, g : V −→ R, la siguiente es una función polinomial
sobre V :
f + g : V −→ R
x 7−→ f (x) + g(x).
(b) Las funciones polinomiales son estables por el producto de funciones. Es decir,
dadas dos funciones polinomiales f, g : V −→ R, la siguiente es una función
polinomial sobre V :
f ·g : V −→ R
x 7−→ f (x) · g(x).
Se define el anillo de funciones polinomiales R[V ] sobre V con respecto al anillo R como el
menor subanillo de Ap(V, R) que satisface las propiedades (1) y (2) anteriores. Se podrı́a denotar
como R[π1 , . . . , πn ] salvo que haya confusión con el subconjunto V ⊆ Rn de referencia. Pruébese
que dado un subconjunto V ⊆ Rn , entonces existe un epimorfismo natural de anillos
Φ : R[X1 , . . . , Xn ] −→ R[V ],
tal que Φ(a) = a, ∀a ∈ R y Φ(Xi ) = πi , para 1 ≤ i ≤ n.
Problema 43. Probad que si K es un cuerpo infinito, y V = K n , entonces el morfismo de
anillos
Φ : K[X1 , . . . , Xn ] −→ K[V ],
1.4. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 45

definido en el problema anterior es un isomorfismo de anillo. Prueba que si K es un cuerpo


finito, entonces el núcleo Ker(Φ) del morfismo anterior es no nulo y Φ no es inyectiva.
Problema 44. Prueba que si K es un cuerpo infinito, f ∈ K[X1 , . . . , Xn ] es un polinomio
y ϕf := Φ(f ) es la función polinomial asociada a f mediante Φ del Problema 43 anterior,
Entonces, si ϕf (x) = 0, ∀x ∈ K n , se tiene f = 0 en K[X1 , . . . , Xn ]. Comprobar que esta
implicación no es cierta cuando K no es un cuerpo infinito.
Problema 45. Probad que el anillo de funciones booelanas Bn está identificado con Ap((Z/2Z)n , Z/2Z)
y con el anillo de funciones polinomiales Z/2Z[(Z/2Z)n ].
Problema 46. Un polinomio f ∈ K[X1 , . . . , Xn ] se dice homogéneo si es una suma finita de
términos del mismo grado. Prueba que para todo polinomio homogéneo f ∈ Hd (X0 , . . . , Xn )
(con d no divisible por la caracterı́stica de K) se verifica la siguiente identidad (Identidad de
Leibnitz):
n
X ∂f
df := Xi .
i=0
∂X i

Concluir que todo polinomio homogéneo f (cuyo grado no es divisible por la caracterı́stica del
cuerpo) está en el ideal homogéneo generado por sus derivadas parciales, i.e.
 
∂f ∂f ∂f
f∈ , ,..., .
∂X0 ∂X1 ∂Xn
Problema 47. Probad que si U = U1 ∪ U2 ⊆ X es un abierto en un espacio topológico (X, T )
con dos componentes conexas U1 , U2 disjuntas, entonces C 0 (U ) no es dominio de integridad.

1.4. Módulos, Submódulos, Morfismos de Módulos


Definición 23 (Módulo). Sea (R, +, ·) un anillo. Llamaremos R−módulo a toda terna
(M, +, ·R ) donde:
i) (M, +) es un grupo abeliano,
ii) ·R : R × M −→ M es una aplicación, que se representa mediante ·R (x, m) := xm,
verificando:
(a) Propiedad Distributiva I: ∀x ∈ R, ∀m, n ∈ M, x(m + n) = xm + xn.
(b) Propiedad Distributiva II: ∀x, y ∈ R, ∀m ∈ M, (x + y)m = xm + ym.
(c) Propiedad Asociativa: ∀x, y ∈ R, ∀m ∈ N, (xy)m = x(ym).
(d) Elemento Neutro: ∀m ∈ M, 1m = m.

Ejemplo 1.4.1. Los siguientes son ejemplos básicos de módulos:


i) Los ejemplos más evidentes de módulos son los espacios vectoriales: Un espacio vec-
torial V sobre un cuerpo K no es otra cosa que un K−módulo (ambas nociones son
equivalentes).
ii) Los anillos son módulos sobre sı́ mismos.
iii) En un sentido general se habla de módulo producto y módulo co-producto o suma.
Dada una familia de módulos {Mi : i ∈ I}, denotaremos
Y [
Mi := {ϕ : I −→ Mi : ϕ(i) ∈ Mi , ∀i ∈ I}.
i∈I i∈I
a M Y
Mi = Mi := {ϕ ∈ Mi : ∃J ⊆ I, J finito, ϕ(i) = 0, ∀i 6∈ J}.
i∈I i∈I i∈I
iv) Sea f : R −→ B un morfismo de anillos. Podemos definir sobre B una estructura de
R−módulo sobre B mediante:
∗f : R × B −→ B
(1.4.1)
(x, b) 7−→ x ∗f b := f (x) ·B b,
donde ·B es el producto de B como anillo. Se llama la estructura de R−módulo so-
bre B determinada por el morfismo f . Se dice que B es una R−álgebra. Esto incluye el
caso de subanillos (f será la inclusión) y, por tanto, son R−álgebras C 0 (X), C 1 (X), . . . , C ∞ , . . .
y son C−álgebras C 0 (X, C) y H(X).
46 1. PRE-ÁLGEBRA

v) Si A y B son dos anillos y supongamos que B tiene una estructura de A−módulo


como la siguiente:
∗A : A × B −→ B
(λ, b) 7−→ λ ∗A b,
entonces podemos definir un morfismo de anillos ϕA −→ B a partir de esa operación
externa y dada mediante:
ϕ : A −→ B
λ 7−→ ϕ(λ) := λ ∗A 1B ,
donde 1B es el elemento unidad del producto de B como anillo. Entonces, si constru-
imos la estructura de A−módulo de B asociada a este morfismo de anillos ϕ: la op-
eración externa ∗ϕ definida omo en la identidad (1.4.1) anterior, se tendrá: ∗ϕ = ∗A .
Es decir, los morfismos entre dos anillos R y B anillos están identificados con las
estructuras de R−módulo sobre B. El poblema 49 pedirá que se verifiquen todos los
detalles de esta afirmación y, por tanto, la frase recientemente citada.
vi) Los anillos R[X1 , . . . , Xn ] y R[[X1 , . . . , Xn ]] tienen una estructura natural de R−módulo
y son R−álgebras.
vii) Los conjuntos de matrices Mn×m (R) tienen una estructura natural de R−módulo.
Ejemplo 1.4.2 (Grupos Abelianos). Los grupos abelianos no son otra cosa que Z−módulos
(ambas nociones son equivalentes). Obviamente, todo Z−módulo es un grupo abeliano, ası́ que
se trata de ver el otro contenido. Para ello consideremos la siguiente notación para un grupo
abeliano (G, +):
Dado m ∈ N y g ∈ G, definamos:
• Si m = 0 ∈ N, definamos 0 · g = 0G ,
• Si m ≥ 1, definamos m · g = g + (m − 1) · g.
Para cada número entero n ∈ Z, definamos
• Si n ∈ N, definamos n · g ∈ G es el definido en el apartado anterior,
• Si n ≤ 0, definamos n · g = (−n) · (−g) (que está definido porque (−n) ∈ N).
Tenemos una aplicación:
·Z : Z × G −→ G
(n, g) 7−→ n · g.
Además, (G, +, ·Z ) es un Z−módulo.

Ejemplo 1.4.3 (Teorı́a del Endomorfismo). Sea V un espacio vectorial sobre un cuerpo K,
ϕ : V −→ V una aplicación lineal. Podemos definir una estructura de K[X]−módulo sobre
V que se conoce como Teorı́a del Endomorfismo. Se define del modo siguiente: Definamos
recursivamente:
• ϕ0 = IdV (la identidad),
• ϕ1 = ϕ,
• Para n ≥ 2, ϕn := ϕ ◦ ϕn−1 , donde ◦ es la composición.
Dado p ∈ K[X], de la forma:
p := ao + a1 X + a2 X 2 + · · · an X n ,
definimos p(ϕ) : V −→ V mediante:
p(ϕ) := a0 IdV + a1 ϕ + a2 ϕ ◦ ϕ + · · · + an ϕn .
Finalmente, definimos
·K[X] : K[X] × V −→ V
(p(X), v) 7−→ p(ϕ)(v) ∈ V.
Se tiene que (V, +, ·K[X] ) es un K[X]−módulo.

Definición 24 (Submódulos, morfismos). Sea R un anillo y sean M, M 0 dos R−módulos.


i) Un subgrupo (N, +) del grupo aditivo (M, +) se dice submódulo de M si, además,
verifica:
∀x ∈ R, ∀n ∈ N, xn ∈ N.
1.4. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 47

ii) Un morfismo de grupos f : (M, +) −→ (M 0 , +) se dice morfismo de R−módulos si


verifica:
∀x ∈ R, ∀m ∈ M, f (xm) = xf (m).
El conjunto de todos los morfismos de R−módulo entre M y M 0 se denota mediante
HomR (M, M 0 ).

Ejemplo 1.4.4. i) Los submódulos de un anillo, como módulo sobre sı́ mismo, son, pre-
cisamente, los ideales.
ii) Los submódulos de los espacios vectoriales son los subespacios.
iii) Los submódulos de los grupos abelianos son los subgrupos.
iv) Obviamente los subgrupos (0) y M de M son submódulos.
Ejemplo 1.4.5. i) En el caso de espacios vectoriales, HomK (V, W ) son las aplicaciones
lineales.
ii) En el caso de grupos abelianos, HomZ (A, B) son los morfismos de grupos entre A y
B.

Observación 1.4.6. Obsérvese que los morfismos de R−módulos f : M −→ N , preservan el


anillo R. En cambio, si f : R −→ B es un morfismo de anillos, cambia el anillo y nos permite
defnir una estructura de R−módulo sobre cualquier B−módulo. Estas estructuras cambian,
obviamente, la percpeción del módulo. Como ejemplo clásico el espacio vectorial complejo Cn es
un C−espacio vectorial de dimensión n, pero es también un R−espacio vectorial de dimensión
2n. Ası́, C es una recta compleja, pero un plano real. De modo similar, tenemos el morfismo
dado por la inclusión Q ,→ R. Si n ≥ 1, Rn es un espacio vectorial de dimensión R sobre
R pero tiene dimensión infinita no numerable como Q−epacio vectorial. De hecho, el único
espacio vectorial real V que tiene dimensión numerable como Q−espacio vectorial es el espacio
vectorial nulo V = (0).

Proposición 1.4.7. Sean M y N dos módulos sobre un anillo R.


i) Un subgrupo N de (M, +) es submódulo si y solamente el grupo cociente (M/N, +) es
R−módulo con la operación ∗R : R × M/N −→ M/N dada mediante:
x ∗R (m + N ) := xm + N, ∀x ∈ R, ∀m + N ∈ M/N.
ii) Para cada morfismo f : M −→ N se verifica:
(a) Para cada submódulo S de M , f (S) := {f (m) : m ∈ S} es submódulo de N .
Un caso particular es el submódulo imagen Im(f ) := f (M ).
(b) Para cada submódulo T de N , f −1 (T ) := {m ∈ M ; f (m) ∈ T } es un submódulo
de M . Un caso particular es el núcleo ker(f ) := f −1 ((0)).
iii) El conjunto HomR (M, N ) es un R−módulo con las operaciones:
+ : HomR (M, N ) × HomR (M, N ) −→ HomR (M, N ),
y
·R : R × HomR (M, N ) −→ HomR (M, N ),
dadas para cada f, g : M −→ N , y x ∈ R, definimos f +g : M −→ N y xf : M −→ N ,
dadas por:
f + g(m) := f (m) + g(m), ∀m ∈ M,
y
(xf )(m) := xf (m), ∀m ∈ M.
Demostración. La prueba es un mero ejercicio. 
Obviamente esta Proposición nos da toda una colección adicional de módulos a través de op-
eraciones de cociente y tomar morfismos.

Definición 25 (Núcleo, Imagen, Co–Núcleo). Dado un morfismo de R−módulos f :


M −→ N , se definen los siguientes submódulos asociados a f :
i) Núcleo del morfismo f : ker(f ) := {x ∈ M : f (x) = 0} = f −1 {h0i}, que es submódulo
de M .
48 1. PRE-ÁLGEBRA

ii) Imagen de f : Im(f ) := {y ∈ N : ∃x ∈ M, f (x) = y} = f (M ), que es submódulo de


N
iii) Co–núcleo al R−módulo Co − ker(f ) := N/ Im(f ).
Proposición 1.4.8. Dado un morfismo de R−módulos f : M −→ N , se verifican las siguientes
propiedades:
i) Son equivalentes las propiedades siguientes:
• f es inyectiva,
• ker(f ) = 0.
En este caso decimos que f es un monomorfismo.
ii) Son equivalentes las propiedades siguientes:
• f es suprayectiva,
• Im(f ) = N ,
• Co − ker(f ) = 0.
En este caso diremos que f es un epimorfismo.
iii) Son equivalentes las propiedades siguientes:
• f es biyectiva,
• ker(f ) = 0 y Co − ker(f) = 0.
En este caso diremos que f es un isomorfismo y su inversa f −1 : N −→ M también
es un morfismo de R−módulos.
Demostración. Igual que en el caso de la Proposición precedente, las afirmaciones son
obvias. 
1.4.1. Operaciones Básicas con Submódulos e Ideales.
Proposición 1.4.9. La intersección de una familia cualquiera de submódulos es un submódulo.
Del mismo modo, la intersección de una familia cualquiera de ideales es un ideal.
Demostración. Mero ejercicio de comprobación formal. 

Definición 26 (Submódulo Generado por un Conjunto). Dado un subconjunto F ⊆ M de


un R−módulo M. Llamaremos submódulo generado por F al menor submódulo que le contiene.
Es decir, usando la Proposición precedente, el submódulo generado por F y que denotaremos
por RhF i viene dado por la siguiente identidad:
\
RhF i := {N : F ⊆ N, N es submódulo de M }.
Diremos que F es un Sistema Generador del submódulo N de M si N = RhF i.
Del mismo modo definiremos el ideal de un anillo R generado por un conunto S como el menor
ideal de R que contiene a S. Pero la notación que usaremos es ligeramente diferente y escribire-
mos (S) para denotar el ideal generado por S.

Proposición 1.4.10. Sea M un R−módulo y F ⊆ F un subconjunto. La siguiente expresión


caracteriza el submódulo generado por F :
X
RhF i := {m ∈ M : ∃G ⊆ F finito, y ∃{xg ∈ R : g ∈ G} ⊆ R, tales que m = xg g}.
g∈G

En particular, una identidad similar se tandrá para ideales de un anillo. Es decir, si S ⊆ R es


un conjunto de un anillo R se tiene:
X
(F ) := {m ∈ R : ∃G ⊆ S finito, y ∃{xg ∈ R : g ∈ G} ⊆ R, tales que m = xg g}.
g∈G

Demostración. Bastará con hacerlo para submódulos porque, al cabo, los ideales de un
anillo R son sus submódulos como R−módulo. Para pobar la identidad basta con demostrar
primero que la expresión de la derecha define un submódulo de M . Esto es mera escritura
cuidadosa de la fórmula expresada. Una vez probado que es submódulo, se prueba que para
cualquier otro submódulo N de M que contenga a F , N debe contener todos los elementos
que aparecen en el conjunto de la derecha de la igualdad buscada. Como RhF i es el menor
submódulo que contiene a F la prueba se concluirá. 
1.4. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 49

Notación 1.4.11 (Módulos, submódulos e ideales finitamente generados). Módulos y


submódulos finitamente generados serán aquellos generados por un conjunto finito de elemen-
tos. Escribiremos Rm para denotar al submódulo generador por {m} En ocasiones escribire-
mos Rm1 + · · · + Rmr para denotar al módulo Rhm1 , . . . , mr i generado por el conjunto finito
{m1 , . . . , mr }. Para ideales, sin embargo, escribiremos (a1 , . . . , am ) para denotar el ideal gen-
erado por la familia {a1 , . . . , am }. Nótese que, en el caso de un conjunto de generadores finito
se tiene:
• (Para submódulos) dado m ∈ M , se tiene m ∈ Rhm1 , . . . , mr i si y solamente si existen
x1 , . . . , xr ∈ R tales que:
X r
m= xi m i .
i=1
• (Para ideales) dado x ∈ R, se tiene x ∈ (a1 , . . . , ar ) si y solamente si existen x1 , . . . , xr ∈
R tales que:
Xr
x= xi ai .
i=1

Observación 1.4.12. Sea M un R−módulo finitamente generado. Entonces, puedo considerar


el conjunto de todos los subconjuntos finitos que generan M . Es decir
G(M ) := {S ⊆ M : RhSi = M, ](M ) ∈ N}.
A su vez, podemos considerar el conjunto de todos los cardinales de conjuntos finitos que
generan M .
S (M ) := {n ∈ N : ∃S ∈ G(M ), ](S) = n}.
Como es un subconjunto de los naturales y no es vacı́o, entonces posee algún mı́nimo:
n0 ; = min (S (M )) ∈ N.
Al número n0 se le llama número mı́nimo de generadores de M y a todo S ∈ G(M ) tal que
su cardinal coincide con n0 (i.e. ](S) = n0 ) se le denomina conjunto (o sistema) minimal
de generadores de M . Es evidente que si K es un cuerpo y V es un K−espacio vectorial
finitamente generado sobre K, entonces V es un espacio vectorial de dimensión finita y el
Teorema del Reemplazamiento nos dice que todo sistema minimal de generadores de V es una
base de V . Esto no ocurre igual para módulos, lo que obliga a hablar de R−módulos libres en
la Subsección 1.4.2 siguiente.

Definición 27 (R−álgebras finitas y finitamente generadas). Con estas notaciones:


• Una R−álgebra B se llama finitamente generada si es isomorfa a un cociente de algún
anillo de polinomios R[X1 , . . . , Xn ] por alguno de sus ideales a.
• Una R−álgebra B se dice finita si B es un R−módulo finitamente generado.

Definición 28 (Suma de Submódulos e Ideales). Dada una familia {Ni : i ∈ I} de


submódulos de un R−módulo M , llamaremos submódulo suma de los submódulos de esta familia
al submódulo generador por la unión de todos ellos.
X
Ni := Rh∪i∈I Ni i.
i∈I
P
Del mismo modo dada una familia de ideales {ai : i ∈ I}, denotaremos por i∈I ai al ideal
suma de esa familia.

Definición 29 (Ideales y Anillos Principales). Un ideal generado por un sólo elemento se


llama ideal principal y el anillo se dice principal si todos sus ideales son principales.

Ejemplo 1.4.13. Los ideales (0) y (1) son principales. En particular, los cuerpos son anillos
pricipales.

Teorema 1.4.14. i) Los anillos Z y K[X], cuando K es un cuerpo, son principales.


50 1. PRE-ÁLGEBRA

ii) El anillo Z[X] no es principal. El ideal a := (2, X) no puede ser generado por un solo
elemento de Z[X].
Demostración. En el caso de Z, como en el caso de K[X], el argumento se basa en probar
la existencia de máximo común divisor. Pondremos, como recordatorio, la prueba en el caso
K[X]. Usando el valor absoluto en lugar del grado, de obtiene el enunciado para el caso Z. Sea
a un ideal en K[X] y consideremos el conjunto siguiente:
D(a) := {deg(f ) : f ∈ a, f 6= 0} ⊆ N.
Si a = (0), entonces es principal y hemos terminado. Si a 6= 0, entonces existe f ∈ a, con f 6= 0
y, por tanto, D(a) es un conjunto no vacı́o de números naturales. Por tanto, posee un mı́nimo.
Sea d0 := min(D(a)) ese mı́nimo y sea f0 ∈ a un elemento no nulo tal que deg(f0 ) = d0 .
Consideremos el ideal principal (f0 ) ⊆ a. Veanos que ambos ideales son iguales. Sea g ∈ a.
Usando la división euclı́dea, existirán q, r ∈ K[X] tales que
• g = qf0 + r,
• deg(r) ≤ deg(f0 ) − 1.
Por la primera afirmación r = g + (−q)f0 ∈ a. Si r 6= 0, entonces deg(r) ∈ D(a) y deg(r) <
min(D(a)), lo cual es imposible. Por tanto, r = 0, g = qf0 ∈ (f0 ) y tendremos probado que
a ⊆ (f0 ) como pretendı́amos. Para la segunda afirmación, supongamos que a = (2, X) es un
ideal principal. Entonces, existe un elemento no nulo (y no unidad) f = ad X d + · · · + a0 ∈ Z[X]
tal que
a = (2, X) = (f ).
Por tanto, existen polinomios qq , q2 ∈ Z[X] tales que
2 = q1 f, X = q2 f.
La primera identidad (i.e. 2 = q1 f ) nos indica que todos los coeficientes de f deben ser divisores
enteros de 2 y, por tanto, están en {±1, ±2}. La segunda identidad (i.e. X = q2 f ) nos indica
que todos los coeficientes de f son divisores de 1. Por tanto, juntando ambas afirmaciones, los
coeficientes deben estar en {±1}. De otro lado, ambas identidades indican que el grado de f
habrı́a de ser 0, con lo que, necesariamente f es una unidad. Pero (f ) = a no es el ideal total,
es un ideal propio y llegamos a contradicción. 

Definición 30 (Producto de ideales y de ideales por submódulos). Se trata de las


nociones siguientes:
i) Dados dos ideales a y b de un anillo R, definimos el ideal producto como el ideal ab
generado por {xy : x ∈ a, y ∈ b}.
ii) Dado un ideal a de un anillo R y un submódulo N de un R−módulo M , escribiremos
aN para designar al submódulo generado por:
{xm : x ∈ a, m ∈ N }.

Proposición 1.4.15 (Producto y generadores). Sea a y b dos ideales en un anillo R,


respetivamente generados por conjuntos finitos
a = (f1 , . . . , fr ), b = (g1 , . . . , gs ).
Entonces, el ideal producto ab está generado del modo siguiente:
ab = ({fi gj : 1 ≤ i ≤ r, 1 ≤ j ≤ s}).
Una propiedad análoga se verifica para el producto de ideales por submódulos.
Demostración. Ejercicio de comprobación. 

Afirmaciones análogas son obvias para ideales y módulos generados por familias cualesquiera.
Proposición 1.4.16 (Propiedades Elementales para ideales). Las operaciones intersección,
suma y producto de ideales verifican las usuales propiedades asociativas, conmutativa, existencia
de elemento neutro. Además:
1.4. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 51

• Se verifica la Ley Modular de la intersección con respecto a la suma (por ser simple-
mente subgrupos). Es decir,
a ∩ (b + c) ⊇ a ∩ b + a ∩ c,
además, si b ⊆ a o c ⊆ a, el anterior contenido es una igualdad. Nótese que también
se da la igualdad si b ⊆ c o si c ⊆ b de manera obvia.
• La propiedad distributiva del producto con respecto a la suma.
a.(b + c) = a.b + a.b.
1.4.2. Módulos Libres y Bases. Comencemos con un par de ejemplos:
Ejemplo 1.4.17. Dado un conjunto X cuaquiera, retomemos el conjunto Ap(X, R) de las
aplicaciones de un conjunto X en el anillo R. Vimos que tenı́a una estructura de grupo abeliano
con la suma de aplicaciones. También le dotamos de una estructura de anillo con el producto
elemento a elemento de aplicaciones (una estructura que se diferenciaba de la convolución
usada para definir polinomios y series de potencias formales). Ahora podemos dotar a ese
grupo abeliano (Ap(X, R), +) de una estructura de R−módulo mediante:
·R : R × Ap(X, R) −→ Ap(X, R)
(λ, f ) 7−→ λf,
donde la aplicación λf viene dada por
λf : X −→ R
x 7−→ λ · f (x).
Es un sencillo ejercicio verificar que (Ap(X, R), +, ·R ) es un R−módulo. Le denotaremos me-
diante las notaciones usuales como
Y
Ap(X, R) = RX = R.
X

Si ahora considero el subconjunto:


Ap0 (X, R) := {f ∈ Ap(X, R) : ∃J ⊆ X, J finito tal quef (x) = 0, ∀x ∈ X \ J},
Es sencillo verificar que Ap0 (X, R) es un submódulo de Ap(X, R) con su estrtucra de R−módulo.
Usualmente denotaremos a este submódulo mediante:
M
Ap0 (X, R) := R.
X

Obviamente, si X es un conjunto finito se tiene RX =


L
X R. De hecho, si X es finito y
biyectable con el conjunto de números naturales {1, . . . , n}, la notación habitual es escribir Rn
en lugar de RX o R{1,...,n} .

Definición 31 (R−módulo libre). Un R−módulo M se L denomina R−módulo libre si es


isomorfo como R−módulo a algún R−módulo de la forma X R, para algún conjunto X.

Observación 1.4.18. La Teorı́a de Módulos serı́a una sencilla traslación (con pocas variaciones)
de muchas de las ideas del Álgebra Lineal (la parte más “lineal” de la Matemática, por ausencia
de “ramificaciones”). Afortunadamente, los módulos interesantes tienden a no ser libres y, quizá
por ello, son más interesantes (lo lineal-trivial es muy aburrido). Para ver que no todo módulo
es libre baste con observar que un grupo abeliano finito no puede ser Z−módulo libre porque,
si lo fuera, su cardinal serı́a, al menos, numerable infinito y no finito. Pero podemos hablar de
bases como en los espacios vectoriales con la definición siguiente:

Definición 32 (Base de un R−módulo libre). Se llama base de un subódulo N de un


R−módulo M , a todo subconjunto β ⊆ N tal que se verifican las siguientes dos propiedades:
i) El conjunto β es sistema generador de N como submódulo de M , es decir,
M := Rhβi.
52 1. PRE-ÁLGEBRA

ii) Los elementos de β son una familia libre (también llamada linealmente independiente)
sobre R, es decir, para cualquier conjunto J finito, para cualquier lista indiciada por
J de elementos {vj : j ∈ J} ⊆ β, y para cualesquiera {aj ∈ R : j ∈ J}, se tiene que
si X
aj vj = 0,
j∈J
entonces aj = 0, ∀j ∈ J.
smallskip
Proposición 1.4.19. Sean M y N dos R−módulos, y f : M −→ N un morfismo de R−módulos.
Sea T ⊆ M un submódulo y β ⊆ T un subconjunto de T .
Entonces, se tiene:
i) Si β es un sistema generador de T , entonces, f (β) es un sistema generador de f (T ).
Es decir,
T = Rhβi =⇒ f (T ) := Rhf (β)i.
De hecho, f es epimorfismo si y solamente si transforma cualquier sistema generador
de M en un sistema generador de N .
ii) Si f es monomorfismo y β es una familia de elementos de M linealmente independiente
sobre R, entonces, f (β) es una familia de elementos de N linealmente independientes
sobre R.
iii) Si f es un isomorfismo y β es una base de T como R−módulo entonces, f (β) es una
base de f (T ) como R−módulo.
Demostración. Los alumnos han debido probar similares afirmaciones en el caso de es-
pacio vectoriales, por lo que obvio el incluir quı́ una prueba; pero propongo probarlo como
Problema 51. 
Proposición 1.4.20. Un R−módulo es libre si y sólo si posee alguna base.
Demostración. Veamos que si M es un R−módulo libre entonces posee una base. Para
verlo, recordemos
L que M es un R−módulo libre si y sólo si es isomorfo a un R−módulo
L de
la forma X R. Por tanto, usando la Proposición precedente, bastará con probar que X R
posee una base y transferirla, vı́a el isomorfismo, a una base de M .
L
Para construir una base de X R = Ap0 (X, R), consideremos para cada x ∈ X consideremos
el siguiente elemento ex ∈ bigoplusX R:
ex : X −→  R
1, si y = x
z 7−→
0, en otro caso.
L
Veamos que el conjunto βX := {ex : x ∈ X} es una base del R−módulo libre X R. Para
ello, consideremos f ∈ Ap(X, R) un elemento cualquiera. por definición sabemos que existe
un conjunto J ⊆ X finito tal que f (x) = 0 para todo x ∈ X \ J. Consideremos entonces el
siguiente elemento: X
g := f (y)ey .
y∈J
Es un elemento del submódulo RhβX i gneerado por βX : como J es finito, la suma es una suma
finita y como RhβX i es submódulo g ∈ RhβX i. Pero es, además, sencillo observar que f y g
coinciden como aplicaciones. La razón es que si x 6∈ J es claro que tanto g(x) como f (x) valen
0 y, por tanto, conciden. En el caso de x ∈ J se tendrá que
X
g(x) = f (y)ey (x) = f (x)ex (x) = f (x).
y∈J

De otro lado, es fácil ver que la familia βX es una familia de elementos linealmente indepnden-
dientes sobre R. Si tomamos J ⊆ X un conjunto finito y unos elementos {λx ∈ R : x ∈ J}, y
si suponemos X
ax ex = 0,
x∈J
1.4. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 53

entonces esa es una igualdad como funciones, por lo que



X 0, si y 6∈ J
0= ax ex (y) =
ax = ax ex (y) si y = x ∈ J.
x∈J
L
Con lo que tendremos la conclusión buscada y βX es base de X R.
Supongamos ahora que un R−mL d́ulo M posee
L una base β := {vi : i ∈ I} ⊆ M . Conluyamos
que, entonces, M es isomorfo a I R = β R y habremos probado que M es un R−módulo
libre. Nótese que ya L
hemos asumido
L que β e I son conjuntos biyectables y que, como tales
conjuntos biyectables I R y β R son isomorfos. De todos modos, es fácil definir la siguiente
correspondencia: L
Φ: I R = Ap0 (I, R) −→ P M
f 7−→ i∈I f (i)vi .
La primera dificultad es probar que se trata efecetivamente de una aplicación. Para ello,
recordemos que f ∈ Ap0 (I, R), luego existe J ⊆ I finito tal que f (i) = 0 para todo i ∈ I \ J.
Por tanto, la suma que hemos usado para definir Φ tiene algo de “mentirosa”, puesto que, en
realidad, es una suma finita: X X
f (i)vi = f (j)vj ,
i∈I j∈J
y la segunda es una suma finita de elementos de M que, por tanto, es un elemento de M .
Tendremos ası́ probado que se trata de una aplicación. Verificar que se trata de un morfismo
de R−módulos es un aburrido ejercicio de comprobación que recomendamos al lectorL para
familiarizarse con el asunto, pero que omitimos or obvio. Además, si βI es la base de IR
usada en la primera parte de esta Demostración, es claro que Φ(βI ) = β. Como β es un sistema
generador de M , usando la Proposición precedente, conluimos que f es epimorfismo. Para
ver que
L tenemos un monomorfismo tampoco hay ue hacer mucho esfuerzo. Supogamos que
f ∈ I R es un elemento del ker(Φ). Entonces,
X
0 = Φ(f ) := f (i) = vi ,
i∈J

donde J ⊆ I es un cnjunto finito tal que f (i) = 0 para cada i ∈ I \ J. Pero, por ser β una
familia libre de elemntos de M y por la identidad que acabamos de escribir (que es una suma
finita de mútiplos “escalares” de los elementos de β igualada a cero) concluiremos sin esfuerzo
que f (j) = 0 para todo j ∈ J, con lo que f debe ser la aplicación nula. 
Observación 1.4.21 (Módulos libres y morfismos). En la prueba de la Proposición prece-
dente ya se deja entrever una propiedad esencial de los morfismos que parten de los módulos
libres: para determinar un morfismo de R−módulos entre un módulo libre M y otro módulo N
cualquiera, basta con determinar una imagen de una base. Fijemos esa idea.

Proposición 1.4.22 (Propiedades básicas de los módulos libres). Se tienen las siguientes
propiedades:
i) Sean M y N dos R−módulos y supongamos que M es un R−módulo libre. Sea β =
{vi : i ∈ I} una base de M como R−módulo libre. Sea {ni : i ∈ I} una familia
cualquiera de elementos de N . Entonces, existe un único mofrismo de R−módulos
f ∈ HomR (M, N ) tal que
f (vi ) = ni , ∀i ∈ I.
ii) Si M y N son dos R−módulos libres, fijadas unas bases β y β 0 en M y N , las repre-
sentaciones (coordenadas en R) en la base β 0 de las imágenes de los elementos de la
base β determinan unı́vocamente los morfismos de R−módulos entre M y N . En par-
ticular, si M y N son R−módulos libres con bases finitas, el R−módulo HomR (M, N )
es también un R−módulo libre.
iii) Sumas directas de R−módulos libres son libres. Es decir, dada una familia {Mi : i ∈
I} una familia cualquiera de R−módulos libres (con I conjunto de cualquier cardinal),
entonces, el siguiente es un R−módulo libre:
⊕i∈I Mi .
54 1. PRE-ÁLGEBRA

iv) Producto cartesianos finitos de R−módulos libres es un R−módulo libre. Qr Es decir, si


{M1 , . . . , Mr } es una familia finita de R−módulos libres, el producto i=1 Mi es un
R−módulo libre.
Demostración. Las afirmaciones son esencialmente de mera verificación. Las proponemos
como Problema. 

Definición 33 (R−módulos libres (de rango finito)). Se denomina R−módulo libre de


rango finito a todo R−módulo M que posee una base β de cardinal finito. Diremos R−módulo
libre de rango igual all cardinal de β, es decir ](β)4.

Ejemplo 1.4.23 (Ejemplos de módulos libres de rango finito). Los siguientes son ejem-
plos de R−m‘ódulos libres y no libres:
i) Un espacio vectorial V sobre un cuerpo K son módulos libres, al rango se le llama
dimensión y está determinado de forma unı́voca.
ii) Los anillos son módulos libres sobre sı́ mismos de rango acotado por 1.
iii) Los conjuntos de matrices Mn×m (R) tienen una estructura natural de R−módulo libre
de rango acotado por nm.
iv) Los polinomios homogéneos de grado fijado con coeficientes en R (el conjunto Hd (X1 , . . . , Xn ))
tendremos un R−módulo libre de rango acotado por
 
d+n−1
.
n−1
v) Los grupos abelianos finitos no son nunca Z−módulos libres. En particular, no son
Z−módulos libres los de la forma:
r
Y
G := (Z/pi Z) ,
i=1

con pi ∈ Z no nulos.
Proposición 1.4.24. Todo R−módulo finitamente generado es el cociente de un R−módulo
libre de rango finito por uno de sus submódulos. En particular, todo grupo abeliano finitamente
generado es de la forma (i.e. isomorfo) a un Z−módulo cociente del tipo Zn /N , donde N es un
subgrupo de Zn . No es cierto, en general, que todo R−módulo finitamente generado sea libre.
Demostración. Para probar la afirmación positiva, consideremoses M un R−módulo fini-
tamente generado. Sea X := {m1 , . . . , mr } un conjunto de generadores de M . Consideremos
F := Rr = Ap({1, . . . , r}, R). Nótese que F es un R−módulo libre de rango finito. Considere-
mos la correspondencia siguiente:
Φ: F −→ Pr M
(x1 , . . . , xr ) 7−→ i=1 xi mi .

Es claro que Φ es una aplicación y es un ejercicio de comprobación el verificar que es un


epimorfismo de R−módulos. Mientras que los ejemplos de Z−módulos con torsión son buenos
ejemplos de módulos finitamente generados que no son libres. Por ejemplo los siguientes:
Z/2Z × Z/3Z,
no pueden ser Z−módulos libres porque son de cardinal finito y el único Z−módulo libre de
cardinal finito es (0). 

Observación 1.4.25 (Módulos libres de rango finito y matrices). Sean M y N dos


R−módulos libres de rangos respectivos m y n. Supongamos β := {α1 , . . . , αm } una base de

4Nos permitimos una licencia que resolveremos más adelante en el curso: hablamos del rango como el
cardinal de una base, pero no hemos probado aún que dos bases de un R−módulo libre tengan que tener el
mismo cardial. Lo haremos en el Capı́tulo siguiente (Subsección 2.2.2) con poco esfuerzo adicional, pero nos
permitimos esa licencia literaria para poder habar con comodidad en los términos de las ideas que siguen a esta
Definición.
1.4. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 55

M y β 0 = {ω1 , . . . , ωn } una base de N . Consideremos una matrix


 
a1,1 a1,2 · · · a1,m
 a2,1 a2,2 · · · a2,m 
M :=  . ..  ∈ Mn×m (R).
 
 .. ..
. . 
an,1 an,2 ··· an,m
Entonces, existe un único morfismo de R−módulos f : M −→ N tal que
f (αi ) := a1,j ω1 + · · · + an,j ωn .
De hecho, ese único morfismo toma la forma
m
X n
X
f( xi αi ) = yj ωj ,
i=1 j=1

si y solamente si     
a1,1 a1,2 ··· a1,m x1 y1
 a2,1 a2,2 ··· a2,m   x2   y2 
..   ..  =  ..  .
    
 .. ..
 . . .  .   . 
an,1 an,2 ··· an,m xm yn

Proposición 1.4.26 (Matrices y morfismos entre módulos libres de rango finito). Sean
M y N dos R−módulos con bases respectivas β y β 0 de respectivos cardinales m y n. Entonces,
existe un isomorfismo de R−módulos
Φ : Mn×m (R) −→ HomR (M, N ).
Para cada f ∈ HomR (M, N ), la matriz Φ−1 (f ) = A ∈ Mn×m (R) se la denomina matriz de f
en las bases β y β 0 .
Demostración. Es casi obvio desde la observación precedente y lo dejamos como ejercicio.
Debe tenerse en cuenta que no hemos demostrado la unicidad del rango, aspecto éste que
dejaremos para el Capı́tulo siguiente. 
1.4.3. Teoremas de Isomorfı́a.
Teorema 1.4.27 (Primer Teorema de Isomorfı́a). Dado f : M −→ N un morfismo de
R−módulos, f induce un isomorfismo
f˜ : M/ ker(f ) −→ Im(f ) ⊆ N,
dado mediante f˜(m + ker(f )) = f (m).
Demostración. Es la misma demostración de lo hecho para grupos en el Problema ??. 
Teorema 1.4.28 (Otros Teoremas de Isomorfı́a). Se verifican los siguientes resultados:
i) Segundo Teorema de Isomorfı́a para Módulos: Sean N ⊆ M ⊆ L R−módulos, entonces
se tiene un isomorfismo
(L/N ) / ∼
(M/N ) = L/M.
ii) Tercer Teorema de Isomorfı́a para Módulos: Dados M1 y M2 submódulos de un
R−módulo M , se tiene el isomorfismo canónico:
(M1 + M2 ) /M1 ∼ = M2 / (M1 ∩ M2 ) .
Demostración. Para la primera afirmación, consideremos la siguiente correspondencia:
π: (L/N ) −→ (L/M )
x + N 7−→ x + M.
Veamos, en primer lugar, que π es una aplicación. Para ello, sean x, y ∈ L tales que x + N =
y + N , es decir, x − y ∈ N . Pero, como N ⊆ M , se tiene también x − y ∈ M . Por tanto, la
definición de π no depende del representane elegido de una clase (i.e. π(x + N ) = π(y + N ) en
56 1. PRE-ÁLGEBRA

el caso expuesto) y se tiene que π es aplicación. Para ver que es morfismo de R−módulos basta
con observar que se verifican las siguientes propiedades ∀x, y ∈ L y ∀λ ∈ R:
π((x+N )+(y +N )) = π((x+y)+N ) = (x+y)+M = (x+M )+(y +M ) = π(x+N )+π(y +N ),
π(λ(x + N )) = π((λx) + N )) = (λx) + M = λ(x + M ) = λπ(x + N ).
Para ver que π es un epimorfismo (i.e. suprayectiva) baste con observar que
∀x + M ∈ (L/M ), ∃(x + N ) ∈ (L/N ), π(x + N ) = x + M.
En cuanto a la inyectividad, basta con verificar la siguiente ingualdad:
ker(π) = {y + N ∈ (L/N ) : π(y + N ) = y + M = 0 + M } = {y + N : y ∈ M } = (M/N ).
Aplicando el Primer Teorema de Isomorfı́a (Teorema ??) concluiremos
(L/N ) / (L/N ) / ∼
(M/N ) = ker(π) = Im(π) = (L/M ).
Para el Tercer Teorema de Isomorfı́a consideremos los morfismos siguientes:
ι : M2 −→ M1 + M2 , π : M1 + M2 −→ (M1 + M2 )/M1
x 7−→ x z 7−→ z + M1 ,
donde ι es la inclusión canónica y π es la proyección canónica sobre el módulo cociente. Con-
sideremos el morfismo φ := π ◦ ι dado por la composición de ι y π. Probaremos las siguientes
propiedades:
• φ es un epimorfismo
• ker(φ) = M1 ∩ M2 .
Para ver que φ e suprayectiva, consideremos un elemento z + M1 ∈ (M1 + M2 )/M1 . Como
z ∈ M1 + M2 , han de existir x ∈ M1 e y ∈ M2 tales que z = x + y. Entonces, nótese que
z + M1 = (x + y) + M1 = y + M1 = π(y) = π(ι(y)) = φ(y) ∈ Im(φ),
y habremos probado que φ es suprayectiva. En cuanto al núcleo, sea x ∈ M2 tal que φ(x) =
0 + M1 ∈ (M1 + M1 )/M1 . Se tiene que
φ(x) = x + M1 = 0 + M1 ⇐⇒ x ∈ M1 .
Por tanto, x ∈ ker(φ) si y solamente si x ∈ M1 ∩ M2 . De nuevo, aplicando el Primer Teorema
de Isomorfı́a concluimos
M2 / ker(φ) = M2 / (M1 ∩ M2 ) ∼
= Im(φ) = (M1 + M2 ) /M1 .

Proposición 1.4.29 (Ideales y Submódulos del Cociente). Dentro de la prueba de los
Teoremas de Isomorfı́a, tendremos las siguientes propiedades:
i) Los ideales del anillo cociente R/a son de la forma b/a, donde b es un ideal de R que
contiene al ideal a.
ii) Los submódulos del módulo cociente M/N son de la forma L/N , donde L es un
submódulo de M que contiene al submódulo N .
Además esa relación es biyectiva y preserva el orden.
Demostración. Aunque las afirmaciones son evidentes, veamos en detalle las relaciones:
• En el caso de anillos. Sea a ⊆/ R un ideal en el anillo R. Por ser ideal R/a posee
una estructura natural de anillo ya discutida anteriormente. Tenemos, además, un
epi–morfismo de anillos dado por la proyección canónica:
π : R −→ R/a
x 7−→ x + a.
Para un ideal b de R, uno puede observar que la imagen por π de b es dada por:
π(b) := {x + a : x ∈ b}.
Es fácil observar que π(b) = π(b + a) y que b + a es un ideal de R que contiene a a.
Por eso, si b es un ideal de R que contiene a a, entonces, π(b) es un ideal de R/a que
1.4. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 57

denotaremos mediante b/a.


De otro lado, para un ideal i de R/a, la anti–imagen por π es dada por
π −1 (i) = {x ∈ R : x + a ∈ i}.
Por lo visto anteriormente, π −1 (i) es ideal en R y dado que 0 + a ∈ i, uno concluye
que a ⊆ π −1 (i).
Con estas observaciones, es claro que la siguiente define una biyección entre ideales:
{b ⊆ R : b ⊇ a, b es ideal} −→ {i ⊆ R/a : i es ideal}
b 7−→ π(b) = b/a,

cuya inversa es dada por i 7−→ π −1 (i).


• En el caso de R−módulos. Se trata esencialmente del mismo tipo de argumento. Sea
N
subseteqM un submódulo del R−módulo M . El cociente M/N posee una estructura
natural de R−módulo anillo ya discutida. Tenemos, además, un epi–morfismo de
R−módulos dado por la proyección canónica:
π : M −→ M/N
x 7−→ x + N.
Para un Submódulo L de M , uno puede observar que la imagen por π de L es dada
por:
π(L) := {x + N : x ∈ L}.
Es fácil observar que π(L) = π(L + N ) y que L + N es un submódulo de M que
contiene a N . Por eso, si L es un submódulo de M que contiene a N , entonces, π(L)
es un submódulo de M/N que denotaremos mediante L/N .
De otro lado, para un submódulo K de M/N , la anti–imagen por π es dada por
π −1 (K) = {x ∈ M : x + N ∈ K}.
Por lo visto anteriormente, π −1 (K) es submódulo de M y dado que 0 + N ∈ K, uno
concluye que N ⊆ π −1 (K).
Con estas observaciones, es, de nuevo, claro que la siguiente define una biyección entre
submódulos:
{L submódulo de M : L ⊇ N } −→ {K submódulo de M/N }
L 7−→ π(L) = L/N,

cuya inversa es dada por K 7−→ π −1 (K).




1.4.4. Ejercicios y Problemas de la Sección 1.4.


Problema 48. Probad la siguiente variante del algoritmo de la división de Euclides:
Dados a, b ∈ N dos enteros positivos no nulos, existe q, r ∈ Z tales que:
i) a = qb + r,
ii) 0 ≤ |r| ≤ b/2.
Problema 49 (Morfismos de anillos y estructuras de anillos como R−módulos).
Se trata de probar que para dos anillos R y B, Los morfismos de anillos entre R y B y las
estructuras de R−módulo de B est’an identificadas. Definamos los siguientes conjuntos:
i) El conjunto de todos los morfismos de anillo entre R y B:
M orf (R, B) := {f : R −→ B : h es morfismo de anillos}.
ii) El conjunto de todas las posibles estructuras de R−módulo sobre B:
R − M od(B) := {∗R : R × B −→ B : B es R−módulo con la operación ∗R }.
58 1. PRE-ÁLGEBRA

Definamos la transformación:
Φ : M orf (R, B) −→ R − M od(R, B)
f 7−→ ∗f ,
donde ∗f es la operación definida por la Identidad (49) de la lista de ejemplos dada en Ejemplo
1.4.1. Pruébese que Π es una biyección entre esos dos conjuntos y, por tanto, que morfismos
dentre anillos R y B es lo mismo que considerar estruturas de R−módulo sobre B. Las nota-
ciones M orf (R, B) y R − M od(B) no se volverán a usar y sólo sirven para clarificar la noción
de R−álgebra.
Problema 50 (Subespacios invariantes de un endomorfismo). Sea V un espacio vectorial
de dimensión finita sobre un cuerpo K y sea f : V −→ V un endomorfismo. Consideremos la
estructura de K[X]−módulo inducida en V por el enfomorfismo f : (V, +, ·K[X] ). Recuérdese
que un subespacio vectorial W de V se dice f −invariante sii f (W ) ⊆ W . Pruébese que son
equivalentes para cada subespacio W de V :
i) El subespacio W es f −invariante.
ii) W es un submódulo de V visto como K[X]−módulo.
Problema 51. Probar la Proposición 1.4.19.
Problema 52. Sea R un anillo, a un ideal de R y M un R−ódulo. Sea aM el submódulo pro-
ducto de a por M . Sea M/aM el R−módulo cociente. Probad que la siguiente correspondencia:
·R/a : (R/a) × (M/aM ) −→ (M/aM )
(x + a, m + aM ) 7−→ xm + aM,
define una estructura de R/a−módulo sobre M/aM .
Problema 53. Consideremos el ideal a := 3Z del anillo Z y el Z−módulo M = Z6 . Probad
que el Z/3Z−módulo M/aM es el espacio vectorial sobre Z/3Z dado como (Z/3Z)6 .
Problema 54 (Caracterización del producto mediante propiedad universal). Probad
que el producto de R−módulos verifica la siguiente propiedad universal: Q
Sea {Mi : i ∈ I} una familia de R−módulos.
Q Para cada i ∈ I, sea πi : i∈I Mi −→ Mi la
proyección canónica. Entonces, el par ( i∈I Mi , {πi : i ∈ I}) verifica que
Dado cualquier otro par (N, {ϕi : N −→ Mi : i ∈ I}), donde N es un R−módulo y
ϕi ∈ HomR (N, Q Mi ) para cada i ∈ I, entonces existe un único morfismo de R−módulos
f ∈ HomR (N, i∈I Mi ) tal que
πi ◦ f = ϕi , ∀i ∈ I.
Q
Probad que la anterior propiedad caracteriza de manera única (salvo isomorfismo) a i∈I Mi .
Problema 55 (Caracterización del co-producto mediante propiedad universal). Probad
que el co-producto de R−módulos verifica la siguiente propiedad universal: `
Sea {Mi : i ∈ I} una familia de R−módulos.
` Para cada i ∈ I, sea λi : Mi ,→ i∈I Mi la
inmersión canónica. Entonces, El par ( i∈I Mi , {λi : i ∈ I}) verifica que
Dado cualquier otro par (N, {ϕi : Mi −→ N : i ∈ I}), donde N es un R−módulo y
ϕi ∈ Hom` R (Mi , N ) para cada i ∈ I, entonces existe un único morfismo de R−módulos
f ∈ HomR ( i∈I Mi , N ) tal que
f ◦ λi = ϕi , ∀i ∈ I.
`
Prueba que la anterior propiedad caracteriza de manera única (salvo
` isomorfismo) a L i∈I Mi .
Cuando se hablar de R−módulos, la notación del co-producto se reemplaza por y se
denomina suma directa. En este curso, por tanto, escribiremos:
M a
Mi := Mi .
i∈I i∈I

Problema 56. Prueba las dos primeras afirmaciones de la Proposición 1.4.22.


Problema 57. Prueba las dos últimas afirmaciones de la Proposición 1.4.22. En particular,
prueba los siguientes hechos:
1.4. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 59

i) Probad que si {Mi : i ∈ I} es una familia cualquiera de R−módulos libres, el


co-producto o suma directa ⊕i∈I Mi tambiés es un R−módulo libre. En particular,
muestra cómo construir una base de ⊕i∈I Mi a partir de una familia {βi : i ∈ I} de
tal modo que βi es base de Mi .
ii) Probad que si {MQ 1 , . . . , Mr } es una familia cualquiera de R−módulos libres, el pro-
r
ducto cartesiano i=1 Mi tambiés Qr es un R−módulo libre. En particular, muestra
cómo construir una base de i=1 Mi a partir de una familia {βi : 1 ≤ i ≤ r} de tal
modo que βi es base deQMi .
iii) Discute si el producto i∈I Mi de una familia cualquiera de R−módulos libres {Mi :
i ∈ I} es R−módulo libre. (Hint: pensar en el anillo de series de potencials formales
Z[[X]] = ZN = N Z. 5.)
Q

Problema 58. Probad las afirmaciones de la Proposición 1.4.26.


Problema 59. Sea f : S −→ R un morfismo de anillos. Probad que si (M, +, ·R ) es un
R−módulo, la siguiente operación “externa”:
·S : S × M −→ M
(s, m) 7−→ f (s) ·R M
define una estructura de S−módulo sobre M .
Dados M y N dos R−módulos y dado ϕ : M −→ N un morfismo de R−módulos entre M
y N (i.e. ϕ ∈ HomR (M, N )), pruébese que, entonces, ϕ ∈ HomS (M, N ), donde suponemos
en M y en N las respectivas estructuras de S−módulos definidas por el morfismo de anillos
f : S −→ R. En particular, se define un monomorfismo de grupos y S−módulos
HomR (M, N ) ,−→ HomS (M, N ).
Verifica esta última afirmación.
Problema 60. Sea N un R−módulo y X un conjunto. Consideremos el conjunto Ap(X, N ) =
N X y las operación suma que hace de él un grupo abeliano (N X , +). Probad que la siguiente
es una operación externa:
·R : R × N X −→ NX
(λ, σ) 7−→ λσ : X −→ N,
donde
λσ : X −→ N
x 7−→ λ ·R σ(x).
Probad adicionalmente que
i) (N X , +, ·R ) es un R−módulo.
ii) Para cada R−módulo libre M , de base X, y para cada R−módulo N cualquiera, los
siguientes R−módulos son isomorfos:
R, N ) ∼
M
HomR ( = NX.
X

Problema 61. Sean X e Y dos conjuntos del mismo cardinal (i.e. dos conjuntos biyectables).
X Y
Pruébese que, entonces, los R−m’odulos LR y RLson isomorfos. Pruébese tambiens que, bajos
las mismas hipótesis, los R−módulos XR y Y R también son isomorfos. Discútase si el
recı́proco es cierto en alguno de los casos.
Problema 62. Si M y N son dos R−módulos libres (de rango finito o infinito), entonces
HomR (M, N ) es también un R−módulo libre de rango finito. Pruébese.
Problema 63. Pruébese la Ley Modular para submódulos de un R−módulo. Pruébese también
que si a es un ideal de un anillo R y N1 , N2 son dos submódulos de un R−módulo M , entonces
se verifica la distributiva siguiente:
a (N1 + N2 ) = aN1 + aN2 .

5Buscar en la web si se resiste......


60 1. PRE-ÁLGEBRA

Problema 64 (La filtración p−ádica sobre un anillo R). En este problema estudiaremos
la métrica definida en un anillo R, mediante la filtración p−ádica definida por un ideal p sobre
R. Esta filtración viene dada por la cadena descende de ideales de R siguiente:
R ⊇ p ⊇ p2 ⊇ p3 ⊇ · · · ⊇ pn ⊇ · · ·
i) Probad que la siguiente es una topologı́a sobre R:
T := {U ⊆ R : ∀x ∈ U, ∃n ∈ N, x + pn ⊆ U },
donde x + pn := {x + y : y ∈ pn }.
ii) Probad que en el espacio topológio (R, T ) las siguientes son aplicaciones continuas:
−: R×R −→ R
(a, b) 7−→ a + (−b).
× : R × R −→ R
(a, b) 7−→ a · b.
iii) Probad que la siguiente es una base de entornos de 0 ∈ R para la topologı́a T :
{pn : n ∈ N}.
Probad, asimismo, que la siguiente es una base de entornos de cualquier punto x ∈ R:
{x + pn : n ∈ N}.
iv) Supongamos que la filtración p−ádica verifica la siguiente propiedad:
\
pn = (0).
n∈N

Probad que la siguiente función (llamada la función de orden de un punto x ∈ R con


respecto a la filtración p−ádica) está bien definida:
ordp : R −→ R ∪ {+∞}
x 7−→ ordp (x) := max{k ∈ N : x ∈ pk },
donde se sobre-entiende que ordp (0) = +∞.
v) Con las mismas hipótesis del ı́tem anterior, probad que la siguiente aplicación está
bien definida:
| · |p : R −→ R
x 7−→ |x|p := eord1p (x) ,
donde se sobre-entiende que |0|p = 0 y e ∈ R es una constante e > 1 fija. Probad
que esta apicación, llamada valor absoluto p−ádico sobre R, satisface las propiedades
siguientes:
• Es positiva: |x|p ≥ 0, ∀x ∈ R,
• Sólo se anula en x = 0, es decir |x|p = 0 ⇐⇒ x = 0.
• Se porta bien para el producto en el anillo R:
∀x, y ∈ R, |x · y|p ≤ |x|p |y|p .
• Verifica la desigualdad triangular fuerte sobre R, es decir,
∀x, y ∈ R, |x + y|p ≤ max{|x|p , |y|p }.
Se dice que | · |p es un valor absoluto no arquimediano sobre R.
vi) Concluid que la toplogı́a definida por la filtración p−ádica sobre R (con la hipótesis
∩n∈N pn = (0)) es metrizable. Es decir, hay que probar que la siguiente es una métrica
(i.e. distancia) sobre R:
distp : R × R −→ R ∪ {+∞}
(x, y) 7−→ distp (x, y) := |x − y|p .
Probad que si B p (x, ε) es la bola cerrada de centro x ∈ R y radio ε > 0 sobre R con
respecto a la distancia distp , entonces,
1
B p (x, n ) = x + pn .
e
Concluir que la topologı́a definida por la métrica distp coincide con la topologı́a T
descrita anteriormente.
1.4. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 61

Problema 65 (Las métricas p−ádicas sobre Q). Consideremos el anillo Z y el ideal p := pZ,
definido por un elemento primo p ∈ N, p 6= 0. Denotemos por ordp a la función de orden ordp
definda por el ideal p y para cada x ∈ Z, denotemos mediante | · |p el valor absoluto p−ádico
sobre Z definido mediante la igualdad siguiente:
1
|x|p := ord (x) .
p p
Extendamos esta métrica al cuerpo Q mediante:
| · |p : Q −→ R
x |x|p
y 7−→ | xy |p := |y|p .

Se pide probar las afirmaciones siguientes:


i) La función | · |p está bien definida y es un valor absoluto no arquimediano sobre Q,
esto es, verifica las siguientes propiedades:
• Es positiva: |x|p ≥ 0, ∀x ∈ R,
• Sólo se anula en x = 0, es decir |x|p = 0 ⇐⇒ x = 0.
• Se porta bien para el producto en el anillo R:
∀x, y ∈ R, |x · y|p = |x|p |y|p .
• Verifica la desigualdad triangular fuerte sobre R, es decir,
∀x, y ∈ R, |x + y|p ≤ max{|x|p , |y|p }.
ii) La función distancia que induce es una métrica sobre Q. Es decir, la siguiente función
es una métrica sobre Q:
distp : R × R −→ R ∪ {+∞}
(x, y) 7−→ distp (x, y) := |x − y|p .
Probad, asimismo, que si B p (x, ε) es la bola cerrada de centro x ∈ Q y radio ε > 0
sobre Q con respecto a la distancia distp , entonces,
a
B p (0, 1) = ZpZ := { ∈ Q : p - b}.
b
Probad que esta bola es un subanillo del cuerpo de números racionales (llamado local-
ización de Z en pZ. Conlcuir que los siguientes son ideales en ZpZ y hallar generadores:
1
B p (0, n ).
p
Concluir que la cadena de bolas siguiente:
1 1
B p (0, 1) ⊇ B p (0, n ) ⊇ · · · ⊇ B p (0, n ) ⊇ · · ·
p p
es una filtración q−ádica sobre ZpZ y detectar el ideal.
iii) Fórmula del producto de Weil: Denotemos mediante | · ·0 : Q −→ R, el valor absoluto
usual sobre Q. Probad la siguiente igualdad, conocida como fórmula del producto de
Weil,:  
Y
 |x|p  |x|0 = 1, ∀x ∈ Q.
p∈N, p ≥ 1 es primo
Nótese que hay que probar que este producto es finito antes de poder probar la igualdad.
iv) Buscad en internet referencias relativas al completado del espacio métrico (Q, distp ),
conocido como cuerpo de los números p−ádicos Qp .
Problema 66. Sea K un cuerpo, K[[X]] el anillo de series de potencias formales y m := (X)
el ideal generado por la serie X. Consideremos la filtración m−ádica sobre K[[X]] y sean ord0 y
|·|X respectivamente las funciones de orden y el valor absoluto definidos por este ideal m = (X).
Pruébese que, efectivamente la función de orden y el valor absoluto están bien definidos y
verifican las propiedades adecuadas6. Sea distX la distancia asociada al valor absoluto | · |X .
Probar la equivalencia entre las siguientes propiedades para cualesquiera series f, g ∈ K[[X]]:
6Por lo visto en problemas anteriores, basta con ver que ∩∞ mn = (0) en K[[X]]
n=0
62 1. PRE-ÁLGEBRA

i) ord0 (f − g) ≥ k,
ii) |f − g|X ≤ e1k ,
iii) distX (f, g) ≤ e1k ,
iv) Si las siguientes son las expensiones como series de Taylor de f y g:

X ∞
X
f := ai X i , g= bi X i ,
i=0 i=0
Entonces, ai = bi , para todo i ∈ N. 0 ≤ i ≤ k.
Reflexionad sobre la relación entre esta noción de orden ord0 y la introducida en el curso de
variable compleja (orden como cero de f − g). Reflexionad sobre el significado de la métrica
m−ádica en K[[X]].

1.5. Determinante, Teorema de Hamilton-Cayley


En esta Sección recordaremos algunas propiedades básicas del determinante de matrices con
coordenadss en un cuerpo.
Definición 34 (Determinante). Sea R un cuerpo y sea Mn (R) el R−módulo de las matrices
n × n con coordenadas en R. Definimos la función determinante del modo siguiente:
det : Mn (R) −→ RQ
P n
A := (ai,j )1≤i,j≤n 7−→ σ∈Sn I(σ) i=1 ai,σ(i) .

Sean i, j ∈ In y consideremos el conjunto de las permutaciones que transforman i en j, es decir,


Sn (i, j) = {σ ∈ Sn : σ(i) = j}.
Estudiaremos estos conjuntos que definen una partición de Sn como unión disjunta dada del
modo siguiente para cada i ∈ In :
[n
Sn = Sn (i, j).
j=1
Consideremos ahora i ∈ In y consideremos la siguiente permutación τi,n ∈ Sn :
τi,n : In −→ In ,
dad mediante: 
 r, si 1 ≤ r ≤ i − 1
τi,n (r) := n, si r = i
r − 1, si i + 1 ≤ r ≤ n

Observamos que τi,n ∈ Sn (i, n) y, además, viene dada como una composición de transposiciones:
τi,n = (n n − 1) ◦ (n − 1 n − 2) ◦ · · · ◦ (i + 2 i + 1) ◦ (i + 1 i).
En particular, el ı́ndice de τi,n satisface
n−i
I(τi,n ) = (−1) .
Lema 1.5.1. Con las anteriores notaciones, la siguiente es una biyección para cualesquiera
ı́ndices i, j ∈ In :
φi,j : Sn (n, n) −→ Sn (i, j)
−1
σ 7−→ τj,n ◦ σ ◦ τi,n .
Más aún, para cada σ el ı́ndice de φ(σ) satisface:
2n−(i+j)
I(φi,j (σ)) = (−1) I(σ).
Demostración. La igualdad entre los ı́ndices se sigue, obviamente, del valor de los ı́ndices
de τi,n y τj,n . Es decir, por ser morfismo de grupos, el ı́ndice satisface:
−1 2n−(i+j)
I(φi,j (σ)) = I(τj,n )I(σ)I(τi,n ) = I(τj,n )I(σ)I(τi,n ) = (−1) I(σ).
En cuanto al hecho de ser una biyección, baste con observar, en primer lugar, que para todo
σ ∈ Sn (n, n), φi,j (σ) ∈ Sn (i, j). Pero esto es claro, dado que:
−1 −1 −1
φi,j (σ)(i) = τj,n (σ(τi,n (i))) = τj,n (σ(n)) = τj,n (n) = j.
1.5. DETERMINANTE, TEOREMA DE HAMILTON-CAYLEY 63

De otro lado, podemos definir la aplicación:


ψi,j : Sn (i, j) −→ Sn (n, n)
−1
σ 7−→ τj,n ◦ σ ◦ τi,n .
Es fácil verificar que
φi,j ◦ ψi,j = IdSn (i,j) , ψi,j ◦ φi,j = IdSn (n,n) .
Por tanto, φi,j es una aplicación que posee inversa y la inversa satisface φ−1
i,j = ψi,j y es, por
tanto, biyectiva. 
Lema 1.5.2. Con las anteriores notaciones, la siguiente aplicación es una biyección:
Φ : Sn (n, n) −→ Sn−1
σ 7−→ σ |In−1 ,
donde σ |In−1 es la restricción de σ a In−1 = {1, 2, . . . , n − 1}. Nótese que, además, los ı́ndices
satisfacen:
I(Φ(σ)) = I(σ), ∀σ ∈ Sn .
Demostración. Lo primero que hay que observar es que Φ está bien definida. Es decir,
que la restricción σ |In−1 es un elemento de Sn−1 . Esto es obvio porque σ ∈ Sn (n, n). Por
tanto, para todo r ∈ In−1 , σ(r) 6= n y, por tanto, σ(r) ∈ In−1 , luego se tiene una aplicación
inyectiva:
σ |In−1 : In−1 −→ In−1 .
Por ser inyectiva y ser In−1 de cardinal finito, concluimos que σ |In−1 es biyectiva y σ |In−1 ∈
Sn−1 . Que la aplicación Φ es inyectiva se sigue obviamente de su definción. Es decir, dadas
σ, σ 0 ∈ Sn (n, n), si Φ(σ) = Φ(σ 0 ), entonces,
σ(r) = σ |In−1 (r) = σ 0 |In−1 (r) = σ 0 (r), ∀r ∈ {1, . . . , n − 1}.
Como, además, σ(n) = n y σ 0 (n) = n (porque ambas están en Sn (n, n)), concluimos que σ = σ 0
y que Φ es inyectiva. No es difı́cil verificar que la siguiente aplicación es la inversa de Φ:
Φ−1 : Sn−1 −→ Sn (n, n)
σ 7−→ σ
e,
donde 
σ(r), si 1 ≤ r ≤ n − 1,
σ
e(r) =
n, si r = n
En cuanto a la relación entre los ı́ndices, obsérvese que si τ ∈ Sn−1 es una transposición, en-
tonces τe ∈ Sn es también una transposición. Además, si σ ∈ Sn−1 admite una descomposición
como composición de transposiciones:
σ = τ1 ◦ τ2 ◦ · · · ◦ τr ,
tenemos que
r
I(σ) = (−1) ,
mientras que
e = τe1 ◦ τe2 ◦ · · · ◦ τer ,
σ
es también una descomposición de σ
e como composición de transposiciones, por lo que
r
I(e
σ ) = (−1) ,
y se tiene la afirmación buscada. 

Notación 1.5.3. Sea A = (ai,j )1≤i,j≤n ∈ Mn (R). Para cada par de ı́ndices definimos la
siguiente submatriz:
Ai,j := (bk,` )1≤k,`≤n−1 ∈ Mn−1 (R),
definida mediante:


 ak,` , si 1 ≤ k ≤ i − 1 y 1 ≤ ` ≤ j − 1
ak−1,` , si i + 1 ≤ k ≤ n y 1 ≤ ` ≤ j − 1

bk,` :=

 ak,`−1 , si 1 ≤ k ≤ i − 1 y j + 1 ≤ ` ≤ n
ak−1,`−1 , si i + 1 ≤ k ≤ n y j + 1 ≤ ` ≤ n

64 1. PRE-ÁLGEBRA

Nótese que la matrix Ai,j es la matrix obtenida a partir de la matrix A, suprimiendo las filas i
y j y reordenando los ı́ndices.
Teorema 1.5.4 (Fórmula de Laplace). Con las anteriores notaciones, sea A = (ai,j )1≤i,j≤n ∈
Mn (R) una matriz cuadrada con coordenadas en el anillo R. Entonces, para cada i, 1 ≤ i ≤ n,
tenemos:
Xn
i+j
det(A) := ai,j (−1) det(Ai,j ),
j=1
donde Ai,j ∈ Mn−1 (R) es la matriz obtenida suprimiendo las filas i y j de la matriz A.
Demostración. Comencemos con la descripción del determinante mediante la fórmula
inicial:
X Y n
det(A) = I(σ) ak,σ(k) .
σ∈Sn k=1
Usamos la decomposiciṕn de Sn siguiente, válida para cada ı́ndice i:
n
[
Sn = Sn (i, j).
j=1

Esto nos da una descripción del sumatorio anteror mediante:


 
n
X X n
Y
det(A) =  I(σ) ak,σ(k)  .
j=1 σ∈Sn (i,j) k=1

Pero si σ ∈ Sn (i, j), tenemos que ai,σ(i) = ai,j , lo que nos permite escribir este sumatorio
mediante:  
n
X X Yn
det(A) = ai,j  I(σ) ak,σ(k)  .
j=1 σ∈Sn (i,j) k=1,k6=i

Ahora consideremos la biyección:


φi,j : Sn (n, n) −→ Sn (i, j).
Entonces,
   
X n
Y X n
Y
ai,j  I(σ) ak,σ(k)  = ai,j  I(φi,j (σ)) ak,φi,j (σ)(k)  .
σ∈Sn (i,j) k=1,k6=i σ∈Sn (n,n) k=1,k6=i

i+j
Pero I(φ−1
i,j (σ)) = (−1) I(σ), con lo que tenemos:
   
X n
Y X n
Y
i+j
ai,j  I(σ) ak,σ(k)  = (−1) ai,j  I(σ) ak,φi,j (σ)(k)  .
σ∈Sn (i,j) k=1,k6=i σ∈Sn (n,n) k=1,k6=i

Consideremos, para σ ∈ Sn (n, n) el producto siguiente:


n
Y
ak,τ (k) ,
k=1,k6=i

donde τ ∈ Sn (i, j) es dada mediante


−1
τ = φi,j (σ) = τj,n ◦ σ ◦ τi,n .
Consideremos la restricción σ 0 := σ |In−1 = Φ(σ) = Φ(φ−1 i,j (τ )) ∈ Sn−1 . Entonces, se tiene la
siguiente igualdad:
n
Y n−1
Y
ak,τ (k) = bt,σ0 (t) ,
k=1,k6=i t=1

donde Ai,j = (bk,` )1≤k,`≤n−1 es la submatriz obtenida de A suprimiendo la fila i y la columna


j como en la notación anterior. Para verificar esta igualdad iremos caso por caso probando que
ambas expresiones contienen los mismo factores.
1.5. DETERMINANTE, TEOREMA DE HAMILTON-CAYLEY 65

• Caso I: Supongamos 1 ≤ t ≤ i − 1 y 1 ≤ σ 0 (t) ≤ j − 1. En este caso


bt,σ0 (t) = at,σ0 (t) = at,σ(t) .
−1
Pero, además, τ (t) = τj,n (σ(τi,n (t))), como 1 ≤ t ≤ i − 1m tendremos τi,n (t) = t
−1
y tendremos τ (t) = τj,n (σ(t)). Pero como σ(t) ≤ j − 1, concluimos τ (t) = σ(t) y
tendremos:
bt,σ0 (t) = at,σ0 (t) = at,σ(t) = at,τ (t) .
• Caso II: Supongamos 1 ≤ t ≤ i − 1 y j ≤ σ 0 (t) ≤ n − 1. En este caso
bt,σ0 (t) = at,σ0 (t)+1 = at,σ(t)+1 .
−1
Pero, además, τ (t) = τj,n (σ(τi,n (t))), como 1 ≤ t ≤ i − 1 tendremos τi,n (t) = t 6= n
−1
y tendremos τ (t) = τj,n (σ(t)). Pero como j ≤ σ(t) ≤ n − 1, concluimos τ (t) =
−1
τj,n (σ(t)) = σ(t) + 1 y tendremos:
bt,σ0 (t) = at,σ0 (t)+1 = at,σ(t)+1 = at,τ (t) .
• Caso III: Supongamos i ≤ t ≤ n − 1 y 1 ≤ σ 0 (t) ≤ j − 1. En este caso
bt,σ0 (t) = at+1,σ0 (t) = at+1,σ(t) .
−1
Pero, además, τ (t + 1) = τj,n (σ(τi,n (t + 1))), como i ≤ t ≤ n − 1 tendremos i + 1 ≤
−1
t+1 ≤ n y τi,n (t+1) = t y tendremos τ (t+1) = τj,n (σ(t)). Pero como 1 ≤ σ(t) ≤ j −1,
−1
concluimos τ (t + 1) = τj,n (σ(t)) = σ(t) y tendremos:
bt,σ0 (t) = at+1,σ0 (t) = at+1,σ(t) = at+1,τ (t+1) .
• Caso IV: Supongamos i ≤ t ≤ n − 1 y j ≤ σ 0 (t) ≤ n − 1. En este caso
bt,σ0 (t) = at+1,σ0 (t)+1 = at+1,σ(t)+ .
−1
Pero, además, τ (t + 1) = τj,n (σ(τi,n (t + 1))), como i ≤ t ≤ n − 1 tendremos i + 1 ≤
−1
t+1 ≤ n y τi,n (t+1) = t y tendremos τ (t+1) = τj,n (σ(t)). Pero como j ≤ σ(t) ≤ n−1,
−1
concluimos τ (t + 1) = τj,n (σ(t)) = σ(t) + 1 y tendremos:
bt,σ0 (t) = at+1,σ0 (t)+1 = at+1,σ(t)+1 = at+1,τ (t+1) .
En suma, estas identidades nos permiten concluir que:
   
X Yn X n−1
Y
i+j
ai,j  I(σ) ak,σ(k)  = (−1) ai,j  I(σ) bt,σ|In−1 (t)  .
σ∈Sn (i,j) k=1,k6=i σ∈Sn (n,n) t=1

Como la aplicación σ 7−→ σ |In−1 define una biyección entre Sn (n, n) y Sn−1 que preserva los
ı́ndices. Esto conduce a
   
X Yn X n−1
Y
i+j
ai,j  I(σ) ak,σ(k)  = (−1) ai,j  I(σ 0 ) bt,σ0 (t)  .
σ∈Sn (i,j) k=1,k6=i σ 0 ∈Sn−1 t=1

Es decir,  
X n
Y i+j
ai,j  I(σ) ak,σ(k)  = (−1) ai,j det(Ai,j ),
σ∈Sn (i,j) k=1,k6=i

donde Ai,j es la matriz obtenida de A suprimiendo fila i y columna j. Con todo esto concluimos
n
X i+j
det(A) = ai,j (−1) det(Ai,j ),
j=1

y tenemos la fórmula de Laplace. 


Definición 35 (Transpuesta de una matriz). Llamaremos transpuesta de una matriz A y
lo denotaremos mediante At a la matriz obtenida intercambiando filas por columnas en A.

Proposición 1.5.5. Para cada matriz A ∈ Mn (R), se tiene que det(A) = det(At ).
66 1. PRE-ÁLGEBRA

Demostración. Baste con notar que la siguiente es una biyección sobre el grupo simétrico:
−1
: Sn −→ Sn
σ 7−→ σ −1 ,
donde σ −1 es la inversa de σ. 
Proposición 1.5.6. Si una matrix A ∈ Mn (R) posee una fila (o una columna) idénticamente
cero, entonces det(A) = 0.
Demostración. Basta con aplicar la fórmula de Laplace, bien por filas o bien por colum-
nas (a través de la transpuesta). 
Definición 36 (Matrix Adjunta de una dada). Sea A = (ai,j )1≤i,j≤n ∈ Mn (R). Se define
la matriz adjunta de A como la matriz
Adj(A) := (ci,j )t1≤i,j≤n ∈ Mn (R),
donde
i+j
ci,j = (−1) det(Ai,j ).

Lema 1.5.7. Sea A una matriz con dos filas iguales, entonces det(A) = 0. Lo mismo sucede si
dos columnas de A son iguales.
Demostración. Queda como ejercicio. 
Teorema 1.5.8 (Fórmula de Laplace Generalizada). Con las anteriores notaciones, para
cada matriz A = (ai,j )1≤i,j≤n ∈ Mn (R), se tiene:
AAdj(A) = Adj(A) · A = det(A)Idn ∈ Mn (R),
donde Idn es la matriz identidad n × n.
Demostración. Para probarlo, bastará con que escribamos las dos matrices:
 
a1,1 a1,2 a1,3 · · · a1,n
 a2,1 a2,2 a2,3 · · · a2,n 
 
A :=  a3,1 a3,2 a3,3 · · · a3,n  .
 
 .. .. .. .
.. 
 . . . 
an,1 an,2 an,3 ··· an,n
Por su parte, después de transponer, tenemos
(−1)1+1 det(A1,1 ) (−1)2+1 det(A2,1 ) (−1)3+1 det(A3,1 ) (−1)n+1 det(An,1 )
 
···
 (−1)1+2 det(A1,2 ) (−1)2+2 det(A2,2 ) (−1)3+2 det(A3,2 ) ··· (−1)n+2 det(An,2 ) 
1+3
det(A1,3 ) (−1)2+3 det(A2,3 ) (−1)3+3 det(A3,3 ) (−1)n+3 det(An,3 )
 
Adj(A) :=  (−1)
 ··· .

 .. .. .. .. 
 . . . . 
(−1)1+n det(A1,n ) (−1)2+n det(A2,n ) (−1)3+n det(A3,n ) · · · (−1)n+n det(An,n )
Al mutiplicar tendremos AAdj(A) = (di,j )1≤i,j≤n ∈ Mn (R), donde
n
X
di,j = ai,k (−1)k+j det(Aj,k ).
k=1
Ahora, si i = j, tenemos que
n
X
di,i = ai,k (−1)k+j det(Ai,k ) = det(A),
k=1
conforme a la fórmula de Laplace. En el caso i 6= j, tendremos que
n
X
di,j = ai,k (−1)k+j det(Aj,k ),
k=1
está relacionado con el determinante de una matriz M obtenida del modo siguiente:
• La fila j−ésima de M es la fila i−ésima de A: (ai,1 , ai,2 , . . . , ai,n )
• Las restantes filas de M son las filas de A.
1.5. DETERMINANTE, TEOREMA DE HAMILTON-CAYLEY 67

Obviamente, las matrices Mj,k = Aj,k y, usando la fórmula de Laplace, obtenemos que
n
X
di,j = ai,k (−1)k+j det(Aj,k ) = det(M ) = 0,
k=1

porque M posee dos filas iguales: la fila i−ésima y la fila j−ésima. Por tanto, se tiene el
resultado enunciado. 

Corollario 1.5.9. Si A ∈ Mn (R) es una matriz tal que det(A) ∈ R∗ es una unidad de R,
entonces, A es una matriz inversible y, además,
A−1 = det(A)−1 Adj(A) ∈ Mn (R).

Teorema 1.5.10 (Determinante del Producto de Matrices). Sean A, B ∈ Mn (R) dos


matrices, entonces
det(AB) = det(A) det(B).
Demostración. Supongamos que las matrices A y B vienen dadas por la igualdad sigu-
iente:
A := (ai,j )1≤i,j≤n , B := (bi,j )1≤i,j≤n .
Escribamos
AB := (ci,j )1≤i,j≤n ,
donde
n
X
ci,j := ai,k dk,j .
k=1
Con estas notaciones, tendremos:
n n n
!
X Y X Y X
det(AB) = I(σ) ci,σ(i) = I(σ) ai,ki bki ,σ(i) .
σ∈Sn i=1 σ∈Sn i=1 ki =1

Aplicando la distributiva, podemos reescribir esta expresión como:


 
X X n
Y 
det(AB) =  I(σ) ai,ki bki ,σ(i)  .
σ∈Sn n
(k1 ,...,kn )∈In i=1

Lo que podemos reescribir también mediante:


n
!
X X Y 
det(AB) = I(σ) ai,ki bki ,σ(i) .
n
(k1 ,...,kn )∈In σ∈Sn i=1

Consideremos ahora un elemento cualquiera k := (k1 , . . . , kn ) ∈ Inn y definamos la matriz


Mk := (mt,` )1≤t,`≤n ,
donde
mt,` = bkt ,` .
Obsérvese que, fijado k ∈ Inn ,
se tiene
n
! n
! n
! n
!
X Y  Y X Y Y
I(σ) ai,ki bki ,σ(i) = ai,ki I(σ) bki ,σ(i) = ai,ki det(Mk ).
σ∈Sn i=1 i=1 σ∈Sn i=1 i=1

Por ello concluimos: !


X n
Y
det(AB) = ai,ki det(Mk ).
n
(k1 ,...,kn )∈In i=1

Consideremos el subconjunto Tn ⊆ Inn de las listas de ı́ndices k = (k1 , . . . , kn ) tales que hay dos
lugares distintos i 6= j tales que ki = kj , esto es :
Tn := {k = (k1 , . . . , kn ) ∈ Inn : ∃i, j, i 6= j, ki = kj }.
68 1. PRE-ÁLGEBRA

Obsérvese que si k = (k1 , . . . , kn ) ∈ Tn es tal que ki = kj con i 6= j, la matriz Mk tiene dos


filas iguales: las filas i y j de Mk son iguales. Por tanto, det(Mk ) = 0 y tendremos que
n
!
X Y 
∀k = (k1 , . . . , kn ) ∈ Tn , I(σ) ai,ki bki ,σ(i) = 0.
σ∈Sn i=1

Por tanto, concluimos


n
! n
!
X Y X Y
det(AB) = ai,ki det(Mk ) = ai,ki det(Mk ).
n i=1 i=1
(k1 ,...,kn )∈In k=(k1 ,...,kn )∈Inn \Tn
Supongamos ahora k = (k1 , . . . , kn ) ∈ Inn \ Tn . Consideremos la aplicación siguiente:
τk : In −→ In
i 7−→ ki .
Como k ∈ Inn \ Tn , tenemos que para todo par i, j, i 6= j, ki 6= kj . Por tanto,
τk (i) 6= τk (j), ∀i, j ∈ In , i 6= j.
Es decirm τk es una aplicación inyectiva de In en sı́ mismo y como In es finito, concluiremos
que τk es una biyección. De hecho, hemos probado que tenemos una aplicación
τ : Inn \ Tn −→ Sn
k 7−→ τk .
Es un ejercicio de mera comprobación el observar que σ es una biyección. Más aún, obsérvese
que si k ∈ Inn \ Tn , la matriz Mk es la matriz B en la que hemos permutado las filas mediante
la permutación τk . Podemos, pues conlcuir que:
det(Mk ) = I(σk ) det(B).
Luego !
X n
Y
det(Mk ) = I(σ) bki ,σ(i) = I(σk )det(B),
σ∈Sn i=1
lo que implica:
!  
X n
Y X n
Y
det(AB) = ai,τ I(σk )det(B) = det(B)  I(σk ) ai,τ .
k (i) k (i)
k=(k1 ,...,kn )∈Inn \Tn i=1 k=(k1 ,...,kn )∈Inn \Tn i=1

Pero como τ es una biyección, también podemos escribir la identidad anterior mediante:
 
X Yn
det(AB) =  I(ρ) ai,ρ(i)  det(B) = det(A) det(B).
ρ∈Sn i=1

Lo que termina la demostración. 


Corollario 1.5.11. Una matriz A ∈ Mn (R) es inversible si y solamente si det(A) ∈ R∗ es
una unidad de R. En este caso, det(A−1 ) = det(A)−1 ∈ R∗ .
Por último, si A es una matriz inversible, el determinante de la matriz adjunta verifica det (Adj (A)) =
det(A)n−1 .
Demostración. Ya hemos probado una de las implicaciones en el Corolario 1.5.9 anterior.
En cuanto a la otra, si A es inversible, entonces, posee inversa y se verifica:
AA−1 = Idn .
Por tanto, det(AA−1 ) = 1 y se satisface:
det(A) det(A−1 ) = det(AA−1 ) = 1,
con lo que det(A) ∈ R∗ . En cuanto a la matriz adjunta:
det(A) det(Adj(A)) = det(AAdj(A)) = det(A)n det(Idn ) = det(A)n .
Como det(A) es inversible en R, esta igualdad implica det(Adj(A)) = det(A)n−1 y habremos
terminado. 
1.5. DETERMINANTE, TEOREMA DE HAMILTON-CAYLEY 69

Corollario 1.5.12 (El determinante es un morfismo de grupos). Sea R un anillo y sea


(R∗ , ·) el grupo multiplicatio de sus unidades. Definamos el conjunto
GL(n, R) := {A ∈ Mn (R) : det(A) ∈ R∗ },
el conjunto de las matrices inversibles con coordenadas en R. Se tiene:
i) (GL(n, R), ·), con la operación “producto de matrices”, es un grupo, no necesariamente
abeliano.
ii) La siguiente correspondencia es un morfismo de grupos:
det : (GL(n, R), ·) −→ (R∗ , ·)
A 7−→ det(A).
iii) El núcleo del morfismo det anterior es un subgrupo normal de GL(n, R).
iv) Consideremos el subrgupo ({±1}, ·) de (R∗ , ·). La imagen inversa det−1 ({±1}) es un
subgrupo normal de GL(n, R) denominado llamado grupo de las matrices unimod-
ulares7 sobre R:
U nin (R) := {A ∈ GL(n, R) : det(A)2 = 1}.
En el caso de R = Z, U nin (R) = GL(n, Z).
v) En los casos R = R o R = C los subgrupos de matrices ortogonales y unitarias son
subgrupos del grupo de matrices unimodulares sobre R o C.
Demostración. Mero ejercicio de comprobación. 
Definición 37 (Polinomio Caracterı́stico). Sea A ∈ Mn (R) una matriz con coordenadas
en un anillo R. Llamaremos polinomio caracterı́stico de A al polinomio dado mediante:
χA (X) := det(XIdn − A) ∈ R[X].

Lema 1.5.13. Si A ∈ Mn (R) es un matrix cuadrada con n filas y n columnas y coeficientes en


R, entonces χA (X) es un polinomio mónico de grado n y coenficientes en R, es decir,
n−1
X
χA (X) := X n + ai X i ∈ R[X].
i=0

Demostración. Por inducción en n. Es claro que se verifica en el caso n = 1. Para n ≥ 2,


tomemos la fórmula de Laplace. y escribamos
 
X − a1,1 −a1,2 ··· −a1,n
 −a2,1 X − a2,2 · · · 6 − a2,n 
AX := XIdn − A =  .
 
.. . . .
.
 . . . 
−an.1 −an.2 ··· X − an,n
Por la fórmula de Laplace, queda
n
X
(1.5.1) χA (X) = det(XIdn − a) = (X − a1,1 ) det((AX )1,1 ) + (−1)i+j a1,j det((AX )1,j ).
j=2

Ahora, obsérvese que la matrix obtenida sumrpimiendo filas i y j de AX es la matrix (XIdn−1 −


Ai,j ), es decir
(AX )i,j = (Ai,j )X := (XIdn−1 − Ai,j ).
Por tanto,
det((AX )i,j ) = det(XIdn−1 − Ai,j ) = χAi,j (X).
Aplicando la hipótesis inductiva, det((AX )i,j ) es un polinomio mónico de grado n − 1 con
coeficientes en R. Observando ahora la Identidad 1.5.1 concluimos que, obvamente, χA (X) es
mónico de grado n con coeficientes en R y la prueba queda terminada. 
7Algunos autores prefieren llamar matrices unimodulares sobre un anillo R simplemente a las matrices
inversibles (i.e. a las matrices en GL(n, R)). Personalmente, prefiero distinguir los dos nombres, siendo unas
las matrices inversibles (i.e. las de GL(n, R)) y otras las unimodulares (i.e. las de U nin (R)). Ası́ es como os lo
presento en estas páginas.
70 1. PRE-ÁLGEBRA

1.5.1. La acción de (Mn (R)[X], +) sobre Mn (R): Teorema de Hamilton-Cayley.


Comencemos con una sencilla acción del anillo de polinomios R[X] sobre el R−módulo Mn (R)
de las matrices cuadradas con coordenadas en R.
Proposición 1.5.14 (La acción de R[X] sobre Mn (R)). Sea R un anillo y R[X] el anillo de
polinomios en una variable con coeficientes en R. Entonces (R[X], +) define una acción sobre
Mn (R) mediante:
·R[X] : R[X] × Mn (R) −→ MP
n (R)
m
(p(X), M ) 7−→ p(M ) := i=0 ai M i ,
Pm
siendo p(X) := i=0 ai X i ∈ R[X].
La acción tiene un buen comportamiento con respecto a la operación producto de R[X]. Es
decir, dados p, q ∈ R[X], dado h ∈ R[X] el producto de ambos polinomios (i.e. h = p · q) y dada
cualquier matriz M ∈ Mn (R), se tiene:
h(M ) = p(M )q(M ) = q(M )p(M ).
Demostración. Es un ejercicio de mera comprobación. 

Vamos a extender esta acción a un anillo no conmutativo con unidad, formado por las matrices
con coeficientes en Mn (R). Recordemos que (Mn (R0 ), +, ·) es un anillo no conmutativo con
unidad para cualquier anillo R0 . Si R es un anillo, y R0 = R[X] es el anillo de polinomios en
una variable con coeficientes en R, entonces (Mn (R[X]), +, .) también es un anillo, en general
no conmutativo, con unidad. Además, como Mn (R0 ) es un R0 −módulo libre, también podemos
concluir que Mn (R[X]) es un R[X]−módulo libre de rango n2 .
Además, como R ⊆ R[X], tenemos un sub-anillo Mn (R) ⊆ Mn (R[X]). Por tanto, dado
p(X) ∈ R[X] y M (X) ∈ Mn (R[X]) tiene sentido considerar las matrices
p(X)M (X) ∈ Mn (R[X]).
Para ser más precisos, si M := (ai,j (X))1≤i,j≤n , estas matrices producto son, en realidad, el
producto de matrices
  
p(X) 0 ··· 0 a1,1 (X) a1,2 (X) . . . a1,n (X)
 0 p(X) · · · 0   a2,1 (X) a2,2 (X) · · · a2,n (X) 
 
p(X)M (X) =  . .

.. . . .. .
 .. ..   .. ..
 
. . 
0 0 ··· p(X) an,1 (X) an,2 (X) · · · an,n (X)
Podemos escribir:  
p(X) 0 ··· 0
 0 p(X) · · · 0 
(p(X)Idn ) =  . ,
 
.. ..
 .. . . 
0 0 ··· p(X)
y, además, este tipo de matrices diagonales verifica:
p(X)M (X) = (p(X)Idn )M (X) = M (X)(p(X)Idn ).
Incluso podemos considerar el conjunto Mn (R)[X] como el conjunto de la forma:
m
X
Mn (R)[X] := {N ∈ Mn (R[X]) : ∃m ∈ N, ∃B0 , . . . , Bm ∈ Mn (R), N = Bk X k },
k=0
k k k
donde Bk X = Bk ·(X Idn ) = (X Idn )·Bk en el sentido de lo discutido anteriormente. Nótese
que si p(X) ∈ R[X] es un polinomio sobre R hemos identificado p(X) con el polinomio sobre
Mn (R) dado mediante p(X)Idn ∈ Mn (R)[X].

Es un sencillo ejercicio probar la siguiente:


Proposición 1.5.15. Con las anteriores notaciones, se tiene:
i) Mn (R)[X] es un subanillo de Mn (R[X]). Es más, Mn (R)[X] es el menor subanillo
de Mn (R[X]) que contiene a Mn (R) y las matrices {X k Idn : k ∈ N}.
1.5. DETERMINANTE, TEOREMA DE HAMILTON-CAYLEY 71

ii) Más aún Mn (R)[X] = Mn (R[X]). Es decir, todo elemento M (X) ∈ Mn (R[X])
admite una única representación de la forma
Xm
M (X) = Mk X k ,
k=0

con Mk ∈ Mn (R).
iii) Dados M (X), N (X) ∈ Mn (R)[X] y sea H(X) = M (X)N (X) ∈ Mn (R)[X]. En-
tonces, si
m
X n
X
M (X) := Mi X i , N (X) := Nj X j ,
i=0 j=0
donde Mi , Nj ∈ Mn (R), entonces,
m+n
X
H= Ck X k ,
k=0
donde
 
X
(1.5.2) Ck :=  Mi Nj  .
i+j=k

Observación 1.5.16. Un detalle importante en la proposición anterior es la identidad descrita


en el apartado iii) (Identidad (1.5.2) anterior):
 
X
Ck :=  Mi Nj  .
i+j=k

Como en el caso del anillo de polinomios, esta igualdad es consecuencia de aplicar las distribu-
tivas al producto de las matrices de polinomios M (X) y N (X). Es decir,
m
! n 
n+m
 
X X X X
Mi X i  Nj X j  = Mi X i Nj X j  .
 
M (X) · N (X) = 
i=0 j=0 k=0 i+j=k

Por lo discutido anteriormente, las matrices X i Idn conmutan con cualquier matrix en Mn (R[X]),
con lo que tendremos
   
X n+m
X X
M i X i Nj X j  = Mi Nj  X i+j ,
 
M (X) · N (X) =  
i+j=k k=0 i+j=k

lo que da la identidad descrita en (1.5.2). Pero debe tenerse en cuenta que, en esta “con-
volución”, el orden de multiplicación (Mi Nj ) importa, salvo que todas las matrices Mi y Nj
conmuten entre sı́, lo que es un caso excepcional. Es decir, el orden en el que aparecen los
factores en la Identidad (1.5.2) es relevante.

Proposición 1.5.17 (La acción de Mn (R[X]) sobre Mn (R)). Con las anteriores notaciones,
definamos la correspondencia siguiente:
·Mn (R[X]) Mn (R[X])
Pm × Mn (R) −→ MP
n (R)
m
(M := i=0 Mi X i , A) 7−→ M (A) := i=0 Mi Ai .
Se tiene:
i) La anterior correspondencia define una acción del grupo aditivo (Mn (R[X]), +) sobre
Mn (R).
ii) Dicha acción extiende la acción de R[X] sobre Mn (R) descrita en la Proposición
1.5.14 anterior: Dado p(X) ∈ R[X], consideremos p(X)Idn ∈ Mn (R[X]) y sea A ∈
Mn (R), entonces
(p(X)Idn ) ·Mn (R[X]) A = p(A),
donde p(A) es el valor del polinomio p ∈ R[X] en la matrix A ∈ Mn (R) como en la
Proposición 1.5.14 anterior.
72 1. PRE-ÁLGEBRA

Demostración. Ejercicio de comprobación 

Observación 1.5.18. En La Proposición 1.5.14 observamos que la acción de R[X] sobre Mn (R)
se “porta bien” con respecto a la operación producto en R[X]. En esta nueva acción debemos
ser más cuidadosos: se necesita un hipótesis adicional sobre ciertos elementos en Mn (R) que
conmtan para el producto de matrices. Es lo que se destaca en la siguiente Proposición, que
hemos decidido escribir separadamente.

Proposición 1.5.19. Sean M (X), N (X) ∈ Mn (R[X]) y A ∈ Mn (R). Sea H(X) ∈ Mn (R[X])
dado mediante M (X)N (X) = H(X) (producto en Mn (R[X])). Supongamos que:
m
X n
X
M (X) := Mi X i , N (X) := Nj X j ,
i=0 j=0

con Mi , Nj ∈ Mn (R). Supongamos también que A conmuta en Mn (R) con los coeficientes de
N . Es decir, supongamos que
ANj = Nj A, ∀j, 0 ≤ j ≤ n.
Entonces, se veirifica:
H(A) = M (A) · N (A),
donde · es el producto en Mn (R).
Demostración. Daremos una prueba por simplicidad y por su implicación en el Teorema
de Hamilton-Cayley. Tenemos:
m
X n
X
M (X) := Mi X i , N (X) := Nj X j .
i=0 j=0

Luego
m
X n
X
M (A) := Mi Ai , N (A) := Nj Aj .
i=0 j=0

Entonces,
m
! n

m+n
 
X X X X
M (A)N (A) = M i Ai  Nj Aj  =  M i Ai Nj Aj  .
i=0 j=0 k=0 i+j=k

Usando el hecho de que ANj = Nj A y la distributiva del producto en Mn (R), concluiremos:


 
m
X X
M (A)N (A) =  Mi Nj  Ai+j = H(A).
k=0 i+j=k

Teorema 1.5.20 (Teorema de Hamilton-Cayley). Con las anteriores notaciones, sea n ≥


1 un entero positivo, R un anillo y A ∈ Mn (R) una matrix n × n con coordenadas en R.
Sea χA (X) ∈ R[X] en polinomio caracterı́stico de A (conforme a la Definición 37 anterior).
Entonces,
χA (A) = 0, en Mn (R).
Demostración. Apliquemos la Fórmula de Laplace generalizada (ver Teorema 1.5.8 an-
terior). Consideremos en anillo R0 := R[X], y sea AX la matrix en Mn (R[X]) dada mediante:
AX := (XIdn − A) ∈ Mn (R0 ).
Sea Adj(AX ) la matriz adjunta de AX en Mn (R[X]). Por la Fórmula de Laplace generalizada
tendremos la siguiente igualdad en Mn (R[X]):
(1.5.3) Adj(AX )AX = Adj(XIdn − A)(XIdn − A) = χA (X)Idn .
1.5. DETERMINANTE, TEOREMA DE HAMILTON-CAYLEY 73

Apliquemos ahora la Proposición 1.5.19 precedente. Tenemos, dos matrices en Mn (R)[X] que
podemos denotar por
n−1
X
M (X) = Adj(AX ) := Bi X i , N (X) := Idn X − A.
i=0

Los coeficientes de N (X) son precisamente la matriz identidad Idn y la matrix (−A). Clara-
mente, A conmuta con los coeficientes (en Mn (R) de N (X). Por tanto, si H(X) = M (X)N (X)
se tendrá:
H(A) = M (A)N (A).
Ahora bien, N (A) = Idn A − A = 0, luego M (A) = 0 en Mn (R). Pero, además, Obsérvese que
H(X) = χA (X)Idn ,
con lo que
H(A) = χA (A),
y tendremos que
χA (A) = 0,
como querı́amos demostrar. 
1.5.2. Ejercicios y Probemas de la Sección 1.5.
Problema 67. Probad el Lema 1.5.7.(Pista: aplicar inducción en n. Para el caso n = 2 es
obvio. Para los casos superiores, suponer que las dos primeras filas son idénticas y desarrollar
el determinante a partir de la fila tercera, usando la fórmula de Laplace. Observar que todas
las submatrices A3,j son (n − 1) × (n − 1) y poseen dos filas idénticas (la fila 1 y la fila 2).
Concluir que det(A3,j ) = 0 para todo j y concluir el enunciado.
Problema 68. Prueba alternativa del Lema 1.5.7. Si R es un dominio de integridad, tienen
sentido y está bien definida la caracterı́stica del anillo R que, además, será un número primo.
Ası́, si R es un dominio de integridad de caracterı́tica distinta de dos, prueba que, usando la
fórmula de Laplace por cada una de las dos filas iguales, se tiene det(M ) = − det(M ) y, por
ser la caracterı́stica distinta de 2, concluir que, necesariamente, det(M ) = 0.
Problema 69. Prueba adicional del Lema 1.5.7. Consideremos el morfismo de grupos dado
por el ı́ndice de las permutaciones:
I : Sn −→ Z∗ .
Se pide:
i) Pruébese que el núcleo de I, es decir, el conjunto de las permutaciones de orden par,
es un subgrupo normal de Sn . Llamado el grupo alternado An .
ii) Pruébese que el cardinal de Sn es 2](An ), por ser isomorfos Z∗ y el grupo cociente:
Sn /An .
iii) Probad que la siguiente es una biyección entre An y su complementario en Sn :
Φ := Φ1,2 : An −→ Sn \ An ,
σ 7−→ σ ◦ (1 2).
iv) Probad que si Φ es la biyección anterior, el ı́ndice verifica I(Φ(σ)) = −I(σ), ∀σ ∈ An .
v) Probad que, para cada matriz A := (ai,j ) ∈ Mn (R), se tiene:
n
! n
!
X Y X Y
det(A) := ai,σ(i) − ai,Φ(σ)(i) .
σ∈An i=1 σ∈An i=1

vi) Pruébese que si las filas 1 y 2 de una matriz A son iguales, para cada σ ∈ An se tiene
que
Yn n
Y
ai,σ(i) = ai,Φ(σ)(i) .
i=1 i=1
vii) Concluir que si una matriz A tiene dos filas iguales, entonces, su determinante verifica
det(A) = 0.
74 1. PRE-ÁLGEBRA

Problema 70. Probad que si a una fila se le suma otra fila multiplicada por un escalar en el
anillo, el determinante no cambia. (Pista: usar el Lema 1.5.7 y la fórmula de Laplace.)
Problema 71. Probad que dada una matriz A ∈ Mn (R) y dada la matriz A0 ∈ Mn (R) obtenida
intercambiando dos filas, entonces det(A) = − det(A0 ). Hacer lo mismo por columnas. (Pista:
usar la biyección de Sn consigo mismo dada mediante: σ 7−→ σ ◦ (i j), donde (i j) es la
transposición que se indica).
Problema 72. Probad las siguientes propiedades de las matrices transpuestas:
i) (At )t = A,
ii) (A + B)t = At + B t ,
iii) (AB)t = B t At ,
iv) (λA)t = λ(A)t , ∀λ ∈ R, A ∈ Mn (R).
Problema 73. Probad que si A ∈ Mn (R) es una matriz y χA (X) ∈ R[X] es su polinomio
caracterı́stico, el término independiente de χA (X) (i.e. χA (0) ∈ R) se relaciona con det(A) del
modosiguiente:
χA (0) := (−1)n det(A).
Más aún, supongamos que el polinomo caracterı́stico χA (X) tiene la forma siguiente:
χA (X) := X n + an−1 X n−1 + · · · + a1 X + a0 ∈ R[X].
Pruébese también que la matriz adjunta de A (construida como en 36) verifica:
Adj(A) = (−1)n+1 An−1 + an−1 An−2 + · · · + a1 Idn .


Problema 74. Sea R un anillo y A ∈ Mn (R). Definamos el conjunto siguiente:


AnnR[X] (A) := {p ∈ R[X] : p(A) = 0}.
Probad:
i) AnnR[X] (A) es un ideal de R[X], llamado el anulador de A.
ii) AnnR[X] (A) es un ideal no trivial que contiene un polinomio con coeficiente director
unitario (unidad en R∗ ).
iii) ¿Es AnnR[X] (A) un ideal principal en R[X]?. Intentar demostrarlo si R = K es un
cuerpo o si R = Z. √
iv) Consideremos el dominio de integridad R = Z[ 3 16] dado mediante:
√ √ √
R = Z[ 16] := {a + b 16 + c( 16)2 : a, b, c ∈ Z}.
3 3 3

Pruébese que la siguiente matriz A ∈ M3 (R)


 √
3

√0 2 16
A :=  2 3 16 √0 4 ,
3
4 16 0
• El polinomio caracterı́stico χA (X) ∈ R[X] es un polinomo mónico de grado 3.
Hallarlo.
• La matriz verifica que f ∈ AnnR[X] (A), donde f es el polinomio
√ √
f (X) := 2X 2 − ( 16)2 − 16( 16) ∈ R[X].
3 3

Probad que no hay ningún polinomio mónico de grado 2 que se anule en A.


• Deducid que AnnR[X] (A) no siempre es un ideal principal en R[X], ni siquiera
cuando R es dominio.
Problema 75. Probad el Corolario 1.5.12.
Problema 76. Revisa todas las pruebas de la Sección sobre el determinante (Sección 1.5) y
detecta las erratas que encuentres.
CAPı́TULO 2

Ideales Primos y Maximales


(À la Recherche du Temps Perdu)

Et tout d’un coup le souvenir m’est apparu. Ce goût, c’était


celui du petit morceau de madeleine que le dimanche matin à
Combray.... La vue de la petite madeleine ne m’avait rien
rappelé avant que je n’y eusse goûté; .... leur image avait
quitté ces jours de Combray pour se lier à d’autres plus
récents; .... Mais, quand d’un passé ancien rien ne subsiste,
après la mort des êtres, après la destruction des choses,
seules, plus frêles mais plus vivaces, plus immatérielles, plus
persistantes, plus fidèles, l’odeur et la saveur restent encore
longtemps, comme des âmes, à se rappeler, à attendre, à
espérer, sur la ruine de tout le reste, à porter sans fléchir,
sur leur gouttelette presque impalpable, l’édifice immense du
souvenir.
Et dès que j’eus reconnu le goût du morceau de madeleine
trempé dans le tilleul que me donnait ma tante (....), aussitôt
la vieille maison grise sur la rue, où était sa chambre, vint
comme un décor de théâtre s’appliquer au petit pavillon
donnant sur le jardin, ...; ; et avec la maison, la ville, la
Place ..... Et comme dans ce jeu où les Japonais s’amusent
....de même maintenant toutes les fleurs de notre jardin et
celles du parc de M. Swann, et les nymphéas de la Vivonne,
et les bonnes gens du village et leurs petits logis et l’église et
tout Combray et ses environs, tout cela qui prend forme et
solidité, est sorti, ville et jardins, de ma tasse de thé....

75
76 2. PRIMOS Y MAXIMALES

Índice
2.1. Elementos primos, irreducibles, dominios euclı́deos 76
2.1.1. Dominios de Ideales Principales: propiedades básicas y ejemplos 76
2.1.1.1. Construcción: Cuerpo Cociente (o cuerpo de fracciones) de un Dominio
de Integridad 78
2.1.2. Existencia de Factorización en Primos en Dominios de Ideales Principales 80
2.1.3. Dominios Euclı́deos 82
2.1.4. Existencia de Factorización en Primos en Dominios Euclı́deos 86
2.1.5. Existen dominios de ideales principales que no son dominios euclı́deos:
Dedekind-Hasse (Opcional) 87
2.1.6. Divisiones del algoritmo de Euclides en Z 91
2.1.7. Eliminación Univariada Clásica. 93
2.1.7.1. Mutiplicar por un polinomio. 96
2.1.8. Ejercicios de la Sección 2.1 99
2.1.8.1. El algoritmo de Berlekamp 101
2.1.8.2. El Sistema Criptográfico RSA 102
2.2. Ideales Primos, Maximales 104
2.2.1. Ideales Primos y Maximales 104
2.2.2. La noción de rango de un R−módulo libre 108
2.2.3. Libres de Torsión sobre Dominios de Ideales Principales 110
2.2.4. Libres de Torsión sobre Dominios Euclı́deos (Opcional) 118
2.2.5. Ejercicios de la Sección 2.2 121
2.3. Dominios de Factorización Única: Lema de Gauss 126
2.3.1. Dominios de Factorización Única 126
2.3.2. El Lema de Gauss 131
2.3.3. Ejercicios de la Sección 2.3 137
2.4. Anillos e Ideales de la Geometrı́a 137
2.5. Formal Normal de Smith 144
2.5.1. Motivaciones 144
2.5.1.1. Ecuaciones diofánticas 144
2.5.1.2. Módulos Finitamente Generados sobre un DIP 145
2.5.2. Matrices de Operaciones Elementales sobre DIP’s 145
2.5.3. Matrices elementales particulares 147
2.5.4. Orlar una matriz 150
2.5.5. “Algoritmo”:Hacer ceros por filas o columnas 151
2.5.5.1. Hacer ceros por filas y columnas 152
2.5.6. Diagonalización de una matriz sobre un DIP: “algoritmo” 153
2.5.7. Resolución de Ecuaciones Lineales Diofánticas 155
2.5.8. Estructura de Grupos Abelianos Finitamente Generados 158
2.5.9. Ejercicios de la Sección 2.5 159

2.1. Elementos primos, irreducibles, dominios euclı́deos


2.1.1. Dominios de Ideales Principales: propiedades básicas y ejemplos.
Definición 38 (Dominios de Ideales Principales). Un dominio de ideales principales es
un dominio de integridad que es anillo principal, esto es, tal que todo ideal es principal.

Ejemplo 2.1.1. A partir de los Teoremas 1.4.14 y 1.3.28 anteriores, se tienen los siguientes
ejemplos:
i) El anillo Z es un dominio de ideales principales.
ii) El anillo K[X] es un dominio de ideales principales, cuando K es un cuerpo.
iii) El anillo Z[X] es un dominio de integridad, pero no es un anillo principal.
iv) El anillo K[X, Y ], cuando K es un cuerpo, es dominio de integridad pero no es anillo
principal. Para verlo, baste con ver que el ideal m := (X, Y ) no es un ideal principal.
Para verlo, baste con ver que si fuera un ideal principal, entonces, las variables X e
Y poseerı́an un divisor común no unidad. Pero, nótese que m es un ideal propio de
2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 77

K[X, Y ] porque:
m := {f ∈ K[X, Y ] : f (0, 0) = 0}.
Finalmente, las variables X e Y no pueden tener un divisor no unidad común en
K[X, Y ]. Dejamos como ejercicio, verificar esta última condición.
v) El anillo cociente Z/6Z es un anillo principal, pero no es dominio de integridad.

Notación 2.1.2. Utilizaremos la notación x | y para indicar y ∈ (x) y diremos que x divide a
y.

Lema 2.1.3. Si R es un dominio de ideales principales, a un ideal de R y a, b dos generadores


de a entonces, existe u ∈ R∗ tal que ua = b. Es decir,
a = (a) = (b) =⇒ ∃u ∈ R∗ , ua = b.
Demostración. Obvio dado que b ∈ (a) =⇒ ∃x ∈ R, b = xa y a ∈ (b) =⇒ ∃y ∈ R, a =
yb, entonces
a = yb = yxa =⇒ (1 − yx)a = 0,
con lo que o bien a 6= 0 (e, en ese caso, a = (0) = (b) y, por tanto, b = 0) o bien (1 − xy) = 0
de donde se concluye que x ∈ R∗ . 

Definición 39. Se dice que dos elementos a, b ∈ R en un dominio de integridad R son asociados
si (a) = (b) o, equivalentemente, si difieren en una unidad de R. Se denotará mediante a ∼ b.

Definición 40 (Máximo Común Divisor en Dominios de Ideales Principales). Sea R


un dominio de ideales principales y sea F = {ai i ∈ I} ⊆ R un conjunto de elementos del anillo.
Llamaremos máximo común divisor de F a cualquier generador del ideal principal a = (F) ⊆ R
generador por el conjunto F. En el caso finito F = {a1 , . . . , am }, escribiremos gcd(a1 , . . . , am )
para designar su máximo común divisor, i.e.
gcd(F) = h ⇐⇒ (h) = (F),
y
gcd(a1 , . . . , am ) = h ⇐⇒ (h) = (a1 , . . . , am ).

Observación 2.1.4. Obsérvese que, en primer lugar, la noción de máximo común divisor sólo
tiene sentido tal y como la hemos definido en el caso de que el ideal generado por F sea principal
y eso se da cuando R es dominio de ideales principales. Si hay ideales que no son principales,
entonces hay elementos que no poseen máximo común divisor en el sentido en que lo hemos
definido. Volveremos a este caso en el caso de dominios de factorización única.

Teorema 2.1.5 (Identidad de Bézout (sin cotas)). Sea R un dominio de ideales princi-
pales y sea a1 , . . . , an ∈ R un conjunto finito de elementos. Sea h su máximo común divisor.
Entonces, existen x1 , . . . , xn ∈ R tales que
h = x1 a1 + · · · + ax an .
Demostración. Es obvio por que h es el máximo común divisor si y solamente si (h) =
(a1 , . . . , an ), con lo que se tiene que dar la propiedad indicada. 

Teorema 2.1.6 (Identidad de Bézout (caso infinito))). Sea R un dominio de ideales


principales y sea F = {ai : i ∈ I} un conjunto cualquiera de elementos de R. Sea h su
máximo común divisor. Entonces, existe un conjunto finito J ⊆ I y existen {xi : i ∈ I} ⊆ R
tales que X
h= xj a j .
j∈J

Demostración. Es obvio por que h es el máximo común divisor si y solamente si (h) =


(F), con lo que se tiene que dar la propiedad indicada. 
78 2. PRIMOS Y MAXIMALES

Definición 41 (Elementos irreducibles y elementos primos). Sea R un dominio de


integridad.
i) Un elemento p ∈ R se dice irreducible si satisface:
∀a ∈ R, a | p, =⇒ [a ∈ R∗ ] ∨ [a ∼ p].
ii) Un elemento p ∈ R se dice primo si satisface:
∀a, b ∈ R, p | ab, =⇒ [p | a] ∨ [p | b].

Ejemplo 2.1.7. Se tiene los siguientes ejemplos:


i) Si R es un dominio de integridad, entonces 0 ∈ R es un elemento primo. De hecho,
R es dominio si y solamente 0 es primo.
ii) El elemento 2 ∈ Z es primo e irreducible
√ en Z.
iii) El elemento 2 es irreducible en Z[ −5] pero no es primo, dado que:
√ √
2 | (1 − −5)(1 + −5) = 6,
pero √ √
2 - (1 − −5), 2 - (1 + −5).

La irreducibilidad de 2 en Z[ −5] se prueba del modo siguiente:
√ √ √ √
2 = (a + b −5)(c + d −5) =⇒ 2 = (a − b −5)(c − d −5),
aplicando conjugación en C y dado que a, b, c, d ∈ Z. Entonces, tendremos
√ √ √ √
4 = 22 = (a + b −5)(a − b −5)(c + d −5)(c − d −5) = (a2 + 5b2 )(c2 + 5b2 ).
Por tanto, a2 +5b2 es un divisor de 4 en Z. Nótese que si b 6= 0, entonces, a2 +5b2 ≥ 5
y no podrı́a ser un divisor entero de 4. Por tanto, es necesario b = 0 y tendremos que
los únicos casos posibles son
(a, b) ∈ {(±1, 0), (±2, 0)}.
√ √ √
√ −5) = ±1 y es unidad en Z[ −5] o bien (a+b −5) = ±2
En estos casos o bien (a+b
y es asociado a 2 en Z[ −5].

Proposición 2.1.8. Si R es un dominio de integridad, todo elemento p ∈ R que sea primo, ha


de ser irreducible en R.
Demostración. Es consecuencia inmediata de las definiciones. Si p ∈ R es primo y a | p
en R, entonces, ∃b ∈ R tal que p = ab. Por ser p primo, y p | ab, se ha de tener una de las dos
opciones siguientes:
• o bien p | a, en cuyo caso p ∼ a y son asociados
• o bien p | b, en cuyo caso es fácil deducir que a ha de ser una unidad de R.
En cualquier caso, p es irreducible. 

2.1.1.1. Construcción: Cuerpo Cociente (o cuerpo de fracciones) de un Dominio de Inte-


gridad. Sea R un dominio de integridad y consideremos en siguiente conjunto S := R \ {0}.
Consideremos el conjunto R × S y definamos la siguiente relación:
∀(a, s), (b, r) ∈ R × S, (a, s) ∼ (b, r) ⇐⇒ ar − bs = 0.
Se prueba que
i) La relación ∼ anterior es una relación de equivalencia.
ii) Denotaremos mediante qf (R) o S −1 R al conjunto cociente y a las clases de equivalencia
[(a, s)]∼ ∈ qf (R) la denotaremos mediante as . Definimos la siguientes correspondencias
en qf (R):
+ : qf (R) × qf (R) −→ qf (R), 6 · : qf (R) × qf (R) −→ qf (R)
( as , rb ) 7−→ ar+bs
rs , 6 ( as , rb ) 7−→ ab
rs
Entonces, ambas correspondencias son aplicaciones y (qf (R), +, ·) es un cuerpo que
se denomina cuerpo cociente o cuerpo de fracciones de R.
iii) Todo dominio de integridad es subanillo de su cuerpo de fracciones.
2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 79

iv) Se tiene, por ejemplo,


√ √
qf (Z) = Q, qf (Z[i]) = Q(i), qf (Z[ m) = Q( m),
v) El cuerpo de fracciones de K[X] es el cuerpo de funciones racionales en una variable
con coeficientes en K y se denota mediante:
p(X)
K(X) := { : p, q ∈ K[X]}.
q(X)
Se tiene que qf (Z[X]) = qf (Q[X]) = Q(X), luego diversos dominios pueden tener el
mism cuerpo de fracciones.
Proposición 2.1.9. Sea R un dominio de integridad y sea F = qf (R). Supongamos que R
verifica la sguiente curiosa propiedad:
“Para todo polinomio f ∈ R[X] de grado 2, si f posee una raı́z en F , entonces el polinomio
factoriza como el producto de dos polinomios de grado 1 en R[X]”.

Entonces, todo elemento de R es irreducible si y solamente si es primo.


Demostración. Supongamos que p ∈ R es irreducible y que existen a, b ∈ R tales que
p | ab. COnsideremos el siguiente polnomio con coefieicntes en F [X]:
a b
f (X) = p(X − )(X − ).
p p
Es fácil verificar que
 
2 a+b ab
f (X) = pX − p X+ = pX 2 − (a + b)X + r ∈ R[X],
p p
donde ab = pr, para algún elemento r ∈ R. Por tanto, tenemos un polinomio f (X) ∈ R[X] que
posee una solución en F (de hecho, dos ap y pb ). Aplicando la propiedad indicada, tendemos que
f facoriza en producto de dos polinomios de grado 1 en R[X]. Es decir
f (X) = (cX + d)(eX + `), (eX + c), (cX + `) ∈ R[X].
Pero eso implicarı́a p = ce y p es irreducible. Luego o bien c o bien e son unidades en R.
Supongamos que c ∈ R∗ es unidad. Entonces, p = ce =⇒ e = c−1 p. Luego,
f (X) = c(X + c−1 d)(c−1 pX + `).
Luego
a b
= −c−1 d ∈ R ∨ = −c−1 d ∈ R.
p p
Es decir, habremos probado que, tomando x = −c−1 d ∈ R e y = −c−1 d ∈ R, se tiene:
[∃x ∈ R, a = px] ∨ [∃y ∈ R, b = py] .
con lo cual concluimos que p | a o p | b y tendremos que p es un elemento primo. 

Teorema 2.1.10. En un dominio de ideales principales, un elemento p ∈ R es primo si y


solamente si es irreducible.
Demostración. Hemos visto que “primo” =⇒ “irreducible”, ası́ que toca probar la afir-
mación recı́proca. Supongamos que p ∈ R es un elemento irrducible y supongamos que p | (ab),
con a, b ∈ R dos elementos no unidades. Supongamos ab = rp, con r ∈ R. Supongamos que
p - a y consideremos el ideal suma (p) + (a) = (p, a) ⊆ R. Como R es dominio de ideales
principales, tendremos que existe un elemento c ∈ R tal que
(c) = (p, a).
Además, p ∈ (p, a) con lo que p ∈ (c) y, por tanto, c | p. Como p es irreducible, caben dos
opciones:
O bien p ∼ c, en cuyo caso (p) = (c) y, en consecuencia, (p) = (p, a), con lo cual a ∈ (p) y p | a,
lo que es imposible por hipótesis.
O bien c ∈ R∗ es una unidad en R, con lo cual
R = (c) = (a, p),
80 2. PRIMOS Y MAXIMALES

En este caso, tendremos que existe x, y ∈ R tales que 1 = xp + ya. Luego,


b = b · 1 = b(xp + ya) = xbp + yba = (ab + yr)p,
con lo cual habremos concluido que p | b y tendremos probada la primalidad de p. 

2.1.2. Existencia de Factorización en Primos en Dominios de Ideales Princi-


pales. En esta Subsección vamos a demostrar la existencia de factorización de los elementos
de dominios de ideales pincipales como producto de irreducibles. Dado que ya hemos visto que
en dominios de ideales principales primo equivale a irreducible (ver Teorema 2.1.10), podemos
usar indistintamente en ambos casos los términos primo o irreducible sin necesidad de explicar
que son la misma noción. La demostración en el caso de dominios de ideales principales usa un
argumento Noetheriano que, a su vez, depende del Axioma de Elección Dependiente. Posteior-
mente veremos que, si es un doinio euclı́deo, este Axioma no es necesario, con el enunciado del
Teorema 2.1.23 en la Subsección 2.1.4 posterior.
En términos históricos debe destacarse que estas demostraciones subyacen a la noción de Anillos
Noetherianos. Se trata de los anillos introducidos por Emmy Noether (y continuados por sus
alumnos y seguidores) que son los anillos que satisfacen la Condición de Cadena Ascendete para
ideales. De hecho, el Teoema de Lasker-Noether será simplemente, una extnesión natural de lo
que se cuenta en esta Subsección. El lector interesado puede profundizar su conocimiento en
torno a esta discusión en el Capı́tulo 6. Para el Teorema de Lasker-Noether puede seguirse la
Subsección 6.5.2.
Para hacer nuestra prueba de existencia de factorización en el caso de dominios de ideales
principales cualesquiera, necesitamos añadir un axioma a nuestra “teorı́a de conjuntos”. una
versión más suave el Lema de Zorn, conocido como el Axioma de Elección Dependiente. 1

Definición 42 (Axioma de Elección Dependiente). Sea X un conjunto no vacı́o y R ⊆


X × X una relación. Supongamos que R satisface la siguiente propiedad:
∀a ∈ X, ∃b ∈ X, aRb.
Entonces, existe una sucesión {xn : n ∈ N} ⊆ X de tal modo que xn Rxn+1 , ∀n ∈ N.

Proposición 2.1.11. Las siguiente propiedades se verifican en un dominio de ideales principales


R:
i) Condición de Cadena Ascendente de Ideales: Toda cadena ascendente numer-
able de ideales se estabiliza, es decir, dada una cadena de ideales de R:
a0 ⊆ a1 ⊆ a2 ⊆ · · · ⊆ an ⊆ · · · ,
existe m ∈ N tal que an = am , para todo m ≥ n.
ii) Bajo el Axioma de Elección Dependiente, se verifica que todo conjunto no vacı́o de
ideales de R posee elemento maximal. Es decir, dado S := {ai : i ∈ I} un conjunto
no vacı́o de ideales de R, entonces existe i0 ∈ I tal que si existe i ∈ I verificando
ai0 ⊆ ai , entonces ai0 = ai .
Demostración. Tratemos los dos casos separadamente.
i) Si tenemos una cadena de ideales de R:
a0 ⊆ a1 ⊆ a2 ⊆ · · · ⊆ an ⊆ · · · ,
consideremos el conjunto [
a := an .
n∈N
Es fácil comprobar que a es un ideal de R y, como R es dominio de ideales principales,
entonces a es principal. En particular a = (p) para algún p ∈ R. Pero
[
p∈ an ,
n∈N

1Para más infromación ver http://en.wikipedia.org/wiki/Axiom_of_dependent_choice.


2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 81

luego ha de existir m ∈ N tal que p ∈ am . Pero, entonces tenemos


[
am ⊆ an = a, a = (p) ⊆ am .
n∈N

Luego a = am . Por tanto, para todo n ≥ m tenemos:


[
am ⊆ an (por ser cadena) y an ⊆ an = a = am ,
n∈N

con lo que tenemos que la cadena se estabiliza a partir del lugar m.


ii) En el otro caso usemos el Axioma de Elección Dependiente. Consideremos S un
conjunto no vacı́o de ideales de R y supongamos que S no posee elemento maximal para
la inclusión ⊆. Consideremos la relación “contenido estricto” ($) sobre S. Entonces,
se tiene:
∀a ∈ S, a no es maximal,
luego
∀a ∈ S, ∃b ∈ S, a $ b.
Aplicando el Axioma de Elección Dependiente, existirá una sucesión de elementos en
{an : n ∈ N} ⊆ S tal que an $ an+1 . Tenemos ası́ una cadena ascendente de ideales
de R que no se estabiliza:
a0 $ a1 $ a2 $ · · · $ an $ · · · .
Esto contradice el apartado i) de esta misma Proposición. Por tanto, la hipótesis de
que S no posee elemento maximal y habremos terminado.


Teorema 2.1.12. Suponiendo el Axioma de Elección dependiente, todo dominio de ideales


principales que no sea cuerpo, posee elementos primos e irreducibles no nulos.
Demostración. Consideremos el conjunto de todos los ideales no nulos y propios de R
S := {a : (0) $ a $ R}.
Como R no es cuerpo, S 6= ∅ es no vacı́o. Por tanto, posee un elemento maximal. Sea a un
elemento maximal de S. Como R es dominio de ideales principales, a = (p). Veamos que p es
necesariamente primo. Si p no fuera primo, no serı́a irreducible y, por tanto, es reducible. Pero
esto significa que existen x, y ∈ R tales que:
• p = xy
• x 6∈ R∗ , y 6∈ R∗ ,
• x 6∼ p, y 6∼ p.
Por tanto, tenemos
(p) $ (x) $ R,
luego (x) ∈ S contradiciendo la maximalidad de (p). 

Teorema 2.1.13 (Existencia de Factorización en dominios de ideales principales).


Suponiendo el Axioma de Elección Dependiente, en dominios de ideales principales, todo ele-
mento es producto finito de unidades e irreducibles.
Demostración. Razonemos por reducción al absurdo. Supongamos que hay elementos
en R que no son producto finito de unidades e irreducibles. Esto quiere decir que el siguiente
conjunto es no vacı́o:
S := {a = (a) : a no es producto finito de irreducibles y unidades de R}.
Por tanto, S posee un elemento maximal m = (p). Es claro que m 6= (0) porque 0 es primo y
p no es producto finito de primos. También es claro que m = (p) $ R porque p no puede ser
unidad. Finalmente, p no es irreducible porque (p) ∈ S. Luego, existen x, y ∈ R tales que:
• p = xy
• x 6∈ R∗ , y 6∈ R∗ ,
• x 6∼ p, y 6∼ p.
82 2. PRIMOS Y MAXIMALES

Pero, entonces, tendremos


m j (x) $ R, m j (y) $ R,
luego (x) 6∈ S, (y) 6∈ S. En consecuencia, x e y han de ser producto finito de unidades
e irreducibles. Por lo tanto p = xy ha de ser producto finito de unidades e irreducibles y
concluimos que m = (p) 6∈ S lo que contradice el hecho de ser elemento maximal en S. Como
nuestra hipótesis era que S =
6 ∅, debemos concluir que S = ∅ y que todo elemento de R es
producto finito de unidades e irreducibles. 

2.1.3. Dominios Euclı́deos. Se trata de un caso particular de dominio de ideales prin-


cipales.
Definición 43 (Función euclı́dea sobre un dominio). Sea R un dominio de integri-
dad. Una aplicación φ : R −→ Z se denomina función euclı́dea sobre R si satisface las dos
propiedades siguientes:
i) φ(ab) ≥ φ(a), ∀a, b ∈ R, b 6= 0.
ii) Si a, b ∈ R con b 6= 0, entonces existen q, r ∈ R tales que
• a = qb + r,
• φ(r) < φ(a).
Un dominio que posee al menos una función euclı́dea se denomina dominio euclı́deo.
Ejemplo 2.1.14. Se tienen los ejemplos siguientes:
i) El anillo de los enteros Z posee la función euclı́dea dada por el valor absoluto.
ii) El anillo de polinomios en una variable con coeficientes en un cuerpo posee como
función euclı́dea al grado deg (cf. Teorema 1.3.9 del Capı́tulo anterior) definido del
modo siguiente:
n, si f = an X n + · · · + a0 , an 6= 0

deg(f ) :=
−1, f =0
iii) El “resto” en dominios euclı́deos no es necesariamente único. Ası́, dados a, b ∈ Z,
b 6= 0 y dados q, r ∈ R tales que
a = qb + r, |r| ≤ |b| − 1,
El par (q, r) no es necesariamente único. Por ejemplo,
5 = 2 · 3 − 1 = 1 · 3 + 2,
y los pares (2, −1) y (1, 2) satisfacen la condición ii) de las funciones euclı́deas.
iv) El “resto” y el “cociente” sı́ son únicos en el caso de K[X], cuando K es un cuerpo. De
hecho, algunos autores (cf [Rha, 62], [Jo, 67]) han demostrado el siguiente resultado
que no reproduciremos aquı́:
Teorema 2.1.15. Sea (R, φ) un dominio euclı́deo. Supongamos que para cada par
a, b ∈ R, con b 6= 0, el resto y el cociente de la división euclı́dea está determinado de
manera unı́voca. Entonces, o bien R es un cuerpo o bien R = F [X], donde F es un
cuerpo.
Proposición 2.1.16. Si (R, φ) es un dominio euclı́deo, se verifican las propiedades siguientes:
i) Si b 6= 0, b ∈ R, entonces φ(b) ≥ φ(1).
ii) Más aún, para todo a ∈ R, a 6= 0, φ(a) > φ(0).
iii) Si (a) = (b), entonces φ(a) = φ(b), para cualesquiera a, b ∈ R.
iv) Si a | b y φ(a) = φ(b), entonces (a) = (b), para cualesquiera a, b ∈ R.
v) Un elemento a ∈ R es unidad (i.e. a ∈ R∗ ) si y solamente si φ(a) = φ(1).
Demostración. La propiedad i) es consecuencia inmediata de la primera propiedad que
ha de verificar una función euclı́dea, esto es, si b 6= 0, se tiene:
φ(b) = φ(b · 1) ≥ φ(1).
Sin embargo, la propiedad ii) es más fuerte por lo siguiente. Sea a ∈ R, a 6= 0. Apliquemos la
división euclı́dea y tendremos que existen q, r ∈ R tales que
0 = qa + r,
2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 83

y φ(r) < φ(a). Supongamos que φ(a) ≤ φ(0). Entonces, φ(r) ≤ φ(a) − 1 < φ(0), con lo que
tendrı́amos que r 6= 0. Pero R es un dominio de integridad y tenemos que r = (−q) · a. Por
tanto, (−q) 6= 0 y, por la primera de las propiedades de las funciones euclı́deas, concluiremos
que
φ(r) = φ((−q)a) ≥ φ(a),
contradiciendo la hipótesis φ(r) < φ(a). La conclusión será, por tanto, que φ(a) > φ(0) si a 6= 0.
La propiedad iii) es casi evidente. Si alguno de los elementos a, b ∈ R fueran nulo, la propiedad
se sigue de modo evidente. Supongamos que ninguno de los dos es nulo (i.e. a 6= 0 y b 6= 0).
Entonces, (a) = (b) significa que podemos escibir a = ub y b = ra, para algunos valores u, r ∈ R,
Por tanto, de nuevo por la primera propiedad de las funciones euclı́deas, tenemos:
φ(a) = φ(u · b) ≥ φ(b), porque u 6= 0,

φ(b) = φ(r · a) ≥ φ(a), porque r 6= 0,


Para la propiedad iv), supongamos que a | b y φ(a) = φ(b). Supongamos que b 6= 0. En el
caso b = 0, concluirı́amos φ(a) = φ(b) = φ(0), por cuanto se tendrı́a a = 0 y la obvia igualdad
(a) = (b). Con la hipótesis b 6= 0, podemos escribir
a = qb + r,
con φ(r) < φ(b) = φ(a). Pero existe s ∈ R tal que b = sa, por lo que concluimos
a = qb + r = qsa + r =⇒ (1 − qs) · a = r.
Si (1 − qs) 6= 0, por la primera propiedad de las funciones euclı́deas, enonces,
φ(r) = φ((1 − qs) · a) ≥ φ(a) = φ(b) < φ(r).
Lo que nos lleva a contradicción. En conclusión, (1 − qs) = 0, por cuanto s es una unidad en
R y, por lo tanto, b = sa, s ∈ R∗ , lo que implica a = qb = s−1 b ∈ (b) y, por tanto, (a) ⊆ (b) y
tenemos la igualdad entre los dos ideales.
Para la propiedad v), tenemos que φ(a) ≥ φ(1) siempre, por la propiedad i). Si a ∈ R∗ es
unidad, entonces, sea s ∈ R∗ su inverso y tenemos as = 1. Obviamente, a 6= 0 y s 6= 0 porque
son unidadees, luego
φ(1) = φ(a · s) ≥ φ(a).
Para la afirmación recı́proca, si φ(a) = φ(1), dado que 1 | a, usando la propiedad iv) nos lleva
a que (1) = (a) y, por tanto, a es una unidad en R∗ . 

Teorema 2.1.17. Sea R un dominio de integridad. Si R posee alguna función euclı́dea definida
en él, entonces R es un dominio de ideales principales.
Demostración. Recordemos que todo subconjunto de Z acotado inferiormente posee
mı́nimo. El caso del ideal nulo (0) es obvio: es un ideal principal. Sea a un ideal de R,
a 6= (0), y consideremos el conjunto:
Sa := {φ(a) : a ∈ a, a 6= 0}.
Como φ(a) ≥ φ(0), para todo a ∈ R, a 6= 0, el conjunto Sa es un subconjunto de Z acotado
inferiormente. Por tanto, posee un mı́nimo. Sea n := min(Sa ) el mı́nimo de Sa .
Sea a ∈ a un elemento no nulo tal que φ(a) = n (existe porque n es un mı́nimo). Es claro
que (a) ⊆ a. Veamos que se verifica el recı́proco de esta inclusión. Sea b ∈ a otro elemento
cualquiera. Hagamos la división euclı́dea
b = qa + r, φ(r) < φ(a) = n.
Nótese que r ∈ a porque r = b + (−q)a ∈ a. Por tanto, si r 6= 0, φ(r) ∈ Sa . Pero φ(a) = n =
min(Sa ), luego no es posible que φ(r) ∈ Sa y la única posibilidad es que r = 0. En ese caso
tendremos que b = qa, luego a | b o, equivalentemente, b ∈ (a), con lo que habremos probado
la igualdad entre los ideales (a) y a. 
84 2. PRIMOS Y MAXIMALES

Teorema 2.1.18 (Algoritmo de Euclides). Sea (R, φ) un dominio euclı́deo y sean a, b ∈ R


tales que φ(a) ≥ φ(b). Definamos la siguiente suceción de elementos de de R:

r0 := a, r1 := b.
Para i ≥ 2, si ri−1 6= 0, definamos
ri = ri−2 − qi−1 ri−1 ,
con φ(ri ) < φ(ri−1 ) − 1. Entonces, se tiene:
i) La sucesión {ri : i ∈ N} es una sucesión finita, esto es, existe k ∈ N tal que rk = 0
ii) Con las notaciones anteriores, sea j el máximo valor tal que rj 6= 0, entonces,
rj = gcd(a, b).
Demostración. Veamos que la sucesión no puede prolongarse indefinidamente. Nótese
que tenemos una cadena descendente de elementos de Z:
φ(r0 ) ≥ φ(r1 ) > φ(r2 ) > φ(r3 ) > · · · > φ(rj ).
Además, esta cadena descendente está inferiormente acotada porque φ(a) ≥ φ(0), para todo
a 6= 0. Entonces, ha de existir un k tal que rk = 0, como afirma la propiedad i).
Definamos el ideal a := (a, b) generador por los dos elementos dados. Obsérvese la siguiente
cadena de identidades:
a = (a, b) = (r0 , r1 ) = (r1 , r2 ) = (r2 , r3 ) = · · · = (ri , ri+1 ).
Es decir el ideal no cambia. La razón es que, por construcción, dados (rn , rn+1 ) el elemento
rn+1 es dado mediante:
rn+2 = rn + (−qn )rn+1 ∈ (rn , rn+1 ) = a.
Con lo cual (rn+1 , rn+2 ) ⊆ (rn , rn+1 ) = a. Pero también se tiene
rn = rn+2 + qn rn+1 ∈ (rn , rn+1 ) = a.
Con lo que rn ∈ (rn+1 , rn+2 ) y, por tanto, (rn , rn+1 ) ⊆ (rn+1 , rn+2 ), de donde concluimos
a = (rn+1 , rn+2 ).
Ahora, sea j el máximo tal que rj 6= 0. Entonces, rj+1 = 0 y tendremos
a = (rj , rj+1 ) = (rj , 0) = (rj ).
Y, por tantom rj es el máximo común divisor de a y b. 

Teorema 2.1.19 (Identidad de Bézout con cotas). Sea (R, φ) un dominio euclı́deo. Sean
a, b ∈ R dos elementos no nulos, y sea h su máximo común divisor.
i) Supongamos que la función euclı́dea φ verifica las propiedades siguientes:
(a) ∀a, b ∈ R, φ(a + b) ≤ φ(a) + φ(b),
(b) ∀a, b ∈ R, φ(ab) = φ(a)φ(b), ∀a, b ∈ R, ab 6= 0.
(c) φ(a) > 0, ∀a ∈ R, a 6= 0.
Entonces, existen x, y ∈ R tales que
h = xa + yb,
con
φ(x) ≤ φ(b), φ(y) ≤ φ(a).
ii) Si, en lugar de las propiedades anteriores, la función euclı́dea φ verifica las siguientes;
(a) ∀a, b ∈ R, φ(a + b) ≤ max{φ(a), φ(b)},
(b) ∀a, b ∈ R, φ(ab) = φ(a) + φ(b), ∀a, b ∈ R, ab 6= 0.
(c) φ(a) > 0, ∀a ∈ R, a 6= 0.
Entonces, si a, b 6∈ R∗ (es decir, si ninguno de los dos es unidad) , existen x, y ∈ R
tales que
h = xa + yb,
con
φ(x) < φ(b), φ(y) < φ(a).
2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 85

Demostración. Supongamos que h es el máximo común divisor de a y b. Entonces,


existen α, β ∈ R tales que
h = αa + βb.
Supongamos que φ(a) ≥ φ(b): Por ser dominio euclı́deo, existen q, x ∈ R tales que
α = qb + x, φ(x) < φ(b).
Entonces,
h = (qb + x)a + βb = xa + (β + qa)b.
Ahora, escribamos y = (β + qa) y tenemos φ(h) ≤ min{φ(a), φ(b)} por ser h | a y h | b. que
φ((β + qa))b) = φ(h − xa).
• En el caso i) tendremos:
φ(y)φ(b) = φ((β + qa))φ(b) = φ((β + qa))b) ≤ φ(h) + φ(xa).
Luego
φ(y)φ(b) ≤ φ(h) + φ(x)φ(a) ≤ (1 + φ(x))φ(a).
Pero φ(x) ≤ φ(b) − 1 y φ(h) ≤ φ(b), por lo que tendremos:
φ(y)φ(b) ≤ φ(b) + (φ(b) − 1)φ(a) = φ(b)φ(a).
Si b 6= 0, claramente tendremos φ(b) 6= 0 y φ(y) ≤ φ(a).
• En el caso ii), si x 6= 0, tendremos
φ(y) + φ(b) = φ(yb) = φ((β + qa))b) ≤ max{φ(h), φ(xa)} = max{φ(h), φ(x) + φ(a)}.
Como h es un divisor de a, entonces φ(h) ≤ φ(a). De otro lado, como x 6= 0 φ(x) > 0
y φ(x) ∈ Z, Por tanto, φ(x) ≥ 1 y, en conclusión, φ(x) + φ(a) ≥ φ(a) ≥ φ(h). Es decir,
en este caso tendremos:
φ(y) + φ(b) ≤ max{φ(h), φ(x) + φ(a)} = φ(x) + φ(a).
φ(y) + φ(b) ≤ φ(x) + φ(a) ≤ φ(b) − 1 + φ(a) = (φ(a) − 1) + φ(b).
Concluimos que
φ(y) ≤ φ(a) − 1,
como pretendı́amos.
En el caso x = 0, tendremos que el máximo común divisor h de a y b ha de verificar
h = xa + yb = yb.
Por tanto, y es una unidad de anillo, φ(y) = φ(1) y φ(a) ≥ φ(y). Como a no es unidad,
se tiene φ(a) > φ(y) y φ(x) < φ(b) como pretendı́amos.


Los dos casos del Teorema anterior se corresponden con los casos básicos R = Z (caso (i)) y
R = K[X] (caso ii)). Esto se expresa mediante los siguientes Corolarios:
Corollario 2.1.20 (Bézout con cotas en Z). Sean a, b ∈ Z dos enteros no nulos, y sea h
su máximo común divisor. Entonces, existen x, y ∈ R tales que
h = xa + yb,
con
|x| ≤ |b|, |y| ≤ |a|.
Demostración. Basta con observar que el valor absoluto | · | verifica las condiciones indi-
cadas en el Teorema anterior. 
Corollario 2.1.21 (Bézout con cotas en K[X]). Sean a, b ∈ K[X] dos polinomios univari-
ados no nulos y no unidades (i.e. a, f 6∈ K), y sea h su máximo común divisor.
Entonces, existen α, β ∈ K[X] tales que
h = αa + βb,
con
deg(α) < deg(b), deg(β) < deg(a).
Demostración. Simplemente recordar (K[X], deg) como anillo euclı́deo. 
86 2. PRIMOS Y MAXIMALES

Observación 2.1.22. El algoritmo de Euclides es un buen algoritmo para el cálculo de máximos


comunes divisores. Distinguiremos dos casos: Z y K[X]. En el primer caso, analizaremos el
número de divisiones necesarias para calcular el gcd de dos números enteros. En el segundo
caso, trataremos el caso de polinomios univariados con técnicas de eliminación a la Sylvester.
2.1.4. Existencia de Factorización en Primos en Dominios Euclı́deos. En la Sub-
sección 2.1.2 anterior, hemos demostrado que todo elemento de un dominio de ideales principales
admite una factorización como producto de elementos primos. También hemos visto que los do-
minios euclı́deos son dominios de ideales principales (ver Teorema 2.1.17), con lo que podı́amos
concluir que en los dominios euclı́deos todo elemento se factoriza en producto finito de primos.
Sin embargo, para probar el Teorema 2.1.13 sobre los dominios de ideales principales, hemos
usado el Axioma de Elección Dependiente. Para aquellos puristas que no deseen admitir este
axioma de la Teorı́a de Conjuntos, redemostramos el enunciado, sólo en el caso de dominios
euclı́deos, para lo cual basta con usar que el orden usual de los naturales es un buen orden.

Teorema 2.1.23 (Existencia de factorización en dominios euclı́deos). Sea (R, φ) un do-


minio euclı́deo. Entonces, todo elemento a ∈ R es producto finito de elementos primos (o irre-
ducibles) y unidades en R. Es decir, para cada a ∈ R, existen u ∈ R∗ y existen {p1 , . . . , pn } ⊆ R
un conjunto finito de primos tales que
a = up1 · · · pn .
Demostración. Como los dominios euclı́deos son dominios de ideales principales, los el-
ementos son primos si y solamente si con irreducibles. Si a ∈ R∗ es unidad, ya tenemos la
prueba. Si a ∈ R no es unidad, consideremos el siguiente conjunto.
Sa := {φ(p) : p no es producto finito de irreducibles y unidades, (a) ⊆ (p)} ⊆ Z.
Supongamos que a no es producto de irreducibles y unidades. Entonces, φ(a) ∈ Sa 6= ∅ es
un conjunto no vacı́o de números enteros. Además está acotado inferiormente por φ(1). Todo
conjunto no vacı́o y acotado inferiormente de enteros posee elemento minimal. Por tanto, Sa
posee un mı́nimo.
Sea φ(p) = min(Sa ) ese mı́nimo de tal modo que p no es producto de irreducibles y unidades.
Luego p no es unidad, ni tampoco es irreducible. Pero esto significa que existen x, y ∈ R tales
que:
• p = xy
• x 6∈ R∗ , y 6∈ R∗ ,
• x 6∼ p, y 6∼ p.
Esto significa que los siguientes contenidos son estrictos:
(p) $ (x) $ R, (p) $ (y) $ R.
En particular, φ(p) > φ(x) y φ(p) > φ(y) como consecuencia de esos contenidos estrictos. Luego
φ(x) 6∈ Sa , φ(y) 6∈ Sa .
Además, se tiene
(a) ⊆ (x), (a) ⊆ (y).
Por tanto, de las dos condiciones que definen Sa , φ(x) no puede satisfacer la primera de esas
condiciones “x no es producto finito de irreducibles y unidades”. Luego x es producto finito de
unidades e irreducibles. Y lo mismo pasa con y. Es decir,
x = uq1 q2 · · · qn , y = vt1 t2 · · · tm ,

donde u, v ∈ R y {q1 , q2 , . . . , qn , t1 , t2 , . . . , tm } son irreducibles en R. Pero, entonces, como
p = xy concluimos:
p = (uv)q1 q2 · · · qn t1 t2 · · · tm ,
y habremos concluido que p es producto finito de irreducibles y unidades. Luego la única opción
es que Sa = ∅ y, por tanto, a debe ser un producto finito de unidades e irreducibles. 

Corollario 2.1.24. Si R es un dominio euclı́deo y no es cuerpo, entonces existen elementos


irreducible no nulos en R, es decir,
{(p) : p es primo en R} =
6 ∅.
2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 87

Demostración. Basta con observar que si R no es un cuerpo, debe existir un elemento


a ∈ R \ R∗ y a 6= 0. Entonces a es producto finito de unidades e irreducibles. Pero como no es
unidad, debe haber algún divisor irreducible de a y como a 6= 0 debe haber algún irreducible
no nulo que es divisor de a, luego hay algún irreducible (o primo) no nulo en R. 

2.1.5. Existen dominios de ideales principales que no son dominios euclı́deos:


Dedekind-Hasse (Opcional). Hemos visto que los dominios euclı́deos son dominios de ideales
principales. Es conveniente observar que este contenido es estricto. Los ejemplos se conocen
desde [Mtz, 49], aquı́ usaremos la prueba que se exhiben en [Wls, 73], basada en el Criterio
de Dedekind-Hasse, para probar que nuestro ejemplo es un dominio de ideales principales. Para
probar que no es euclı́deo, usaremos la no existencia de divisor lateral universal descrita en el
Problema 93 anterior. Veámos el Ejemplo: Consideremos el anillo
 √ 
1 + −19
R := Z .
2
Lema 2.1.25. El anillo √
 
1+ −19
R=Z ,
2
no es dominio euclı́deo.
Demostración. Comencemos recordando el conjunto de las unidades de este anillo (que
hemos estudiado en el Problema 31) donde vimos la siguiente igualdad:
  √ ∗
1 + −19
Z = {±1}.
2
Seguidamente recordemos el Problema 93. El él vimos que si un aillo no psee divisores laterales
universales, entonces no puede ser dominio euclı́deo para ninguna función euclı́dea posible.
Supongamos que tal divisor lateral universal existe y sea
 √   √ 
1 + −19 1 + −19
u := a + b ∈Z ,
2 2

−19
con a, b ∈ Z ese elemento. Entonces, dado el elemento 2 ∈ Z[ 1+ 2 ], u debe dividir a alguna
de las tres cantidades siguientes:
1 = 2 − 1, 2 = 2 − 0, 3 := 2 + (−1).
Como los divisores laterales universales no son unidades, podemos descartar que u | 1 y nos
quedamos con las otras dos posibilidades.
Definamos la función
h √ i
Φ√−19 : Z 1+ 2−19 −→ Z+
 √ 
2
y 2
1+ −19
7−→ x + 2 − −19y

x+y 2 .

2

Nótese que se trata de multiplicar por el conjugado complejo y, por tanto, da lugar al módulo.
Esto es
  √    √    √ 

1 + −19 1 + −19 1 + −19
Φ −19 x + y = x+y x+y ,
2 2 2
donde · significa conjugado complejo. Por tanto, Φ√−19 calcula el valor absoluto (el módulo)
del número complejo al que se le aplica y, en particular, es un entero positivo. Más aún, nótese
que

y 2 −19y 2
   
1 + −19
= x2 + xy + 5y 2 ∈ Z,


Φ −19 x + y = x+

2 2 2
es un número entero siempre que x e y sean enteros. Usaremos esta función y supongamos que
u | 2 o u | 3.
88 2. PRIMOS Y MAXIMALES

• Supongamos la primera opción: u | 2. Entonces, han de existir x, y ∈ Z tales que


  √    √    √ 
1 + −19 1 + −19 1 + −19
u x+y = a+b x+y = 2.
2 2 2
pero, entonces,
  √    √ 
1 + −19 1 + −19
Φ√−19 a + b Φ√−19 x + y = Φ√−19 (2) = 4.
2 2
Por tanto, el siguiente número entero es un divisor entero positivo de 4:
  √ 
1 + −19

Φ −19 a + b = a2 + ab + 5b2 .
2
Pero eso sólo es posible si b = 0 (porque si b es un entero no nulo, a2 +ab+5b2 ≥ 5 > 4).
En el caso b = 0, necesaiamente u = a ∈ {±2}. Pero, si u es un elemento de
ese conjunto, por ser divisor lateral universal, debe ser divisor de alguno de los tres
elementos siguientes:
 √   √   √ 
1 + −19 1 + −19 1 + −19
− 1, , + 1,
2 2 2
lo que no es posible en ningún caso.
• Supongamos la segunda opción: u | 3. Entonces, han de existir enteros x, y ∈ Z tales
que se da la siguiente igualdad:
  √    √ 
1 + −19 1 + −19
a+b x+y = 3.
2 2
De nuevo, usando Φ√−19 , tendremos que

a2 + ab + 5b2 x2 + xy + 5y 2 = 9.
 

Distingamos dos casos:  


– Si b 6= 0, entonces, a2 + ab + 5b2 > 3, con lo que, forzosamente, a2 + ab + 5b2 =
9 y, x2 + xy + 5y 2 = 1. Pero
 √  √  √ 
1 + −19 1 − −19 1 + −19
1− = ∈Z .
2 2 2
Por tanto, tendremos
  √    √ 
2 2
 1 + −19 1 − −19
1 = x + xy + 5y = x + y x+y ,
2 2
y, en consecuencia,
  √    √ ∗
1 + −19 1 + −19
x+y ∈ Z = {±1}.
2 2
Por tanto, u ∈ {±3} y u debe ser un divisor lateral universal, luego debe dividir,
como en el caso precedente, a alguno de los siguientes elementos:
 √   √   √ 
1 + −19 1 + −19 1 + −19
− 1, , + 1,
2 2 2
lo que no es posible en ningún caso con u ∈ {±3}.
– En el caso b = 0, u = a será un divisor entero de 3 y no es unidad, con lo que
u ∈ {±3} y tenemos la misma dificultad que en el caso anterior.
En conclusión, el anillo
 √ 
1+ −19
Z
2
no posee divisores laterales universales, con lo que no es dominio euclı́deo. 
2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 89

Proposición 2.1.26 (Criterio de Dedekind-Hasse). Sea R un anillo cualquiera decimos


que R verifica el criterio de Dedekind-Hasse si verifica lo siguiente: Existe | · | : R −→ N una
función definida positiva (i.e. [|a| ≥ 0, ∀a ∈ R], y [|a| = 0 ⇐⇒ a = 0]). Supongamos que para
cualesquiera x, y ∈ R no nulos se verifica la propiedad siguiente:
“O bien y | x o bien existen u, v ∈ R tales que 0 < |ux − vy| < |y|.”
Entonces, R es un dominio de ideales principales.
Demostración. Es bastante evidente. Consideremos a un ideal de R, supongamos que
a 6= (0), que ya serı́a un ideal principal, y consideremos el siguiente conjunto no vacı́o de
números naturales:
N := {|a| ∈ N : a ∈ a, a 6= 0}.
Este conjunto posee un mı́nimo, |y| ∈ N , con y ∈ a, y 6= 0. Por tanto, el ideal b = (y) es
principal y b ⊆ a. Ahora consideremos x ∈ a un elemento cualquiera no nulo. Entonces, por
la condición verificada por | · |, o bien y | x (en cuyo caso x ∈ b = (y), o bien existen u, v ∈ R
tales que
0 < |xu − yv| < |y|.
Pero, en este segundo caso, como x, y ∈ a, entonces, ux, vy ∈ a (porque es ideal) y, finalmente,
ux−vy ∈ a. Pero la desigualdad anterior nos dice que ux−vy 6= 0 y contradice la minimalidad de
|y| en N . Por tanto, no se puede dar la segunda condición para ningún x ∈ a y, en consecuencia,
y | x, para todo x ∈ a, con lo que habremos probado la igualdad a = b. 
Lema 2.1.27. El anillo  √ 
1+ −19
R=Z
2
verifica el criterio de Dedekind-Hasse para el cuadrado del valor absoluto complejo.
Demostración. Recuérdese que el cuadrado del valor absoluto complejo es la función
Φ√−19 usada el la demostración del Lema 2.1.25 anterior. Por simplicidad de la notación
escribiremos Φ en lugar de Φ√−19 .
Consideremos x, y ∈ R dos elementos no nulos tales que y - x. Entonces, queremos probar que
existen u, v ∈ R tales que
0 < Φ(ux − vy) < Φ(y).
Pero, nótese que Φ(rs) = Φ(r)Φ(s) (es el cuadrado de la norma usual en C), luego esta última
desiigualdad es equivalente a:
 
x
0 < Φ(u − v) < 1.
y
Como y - x, tendremos que existen a, b, c ∈ Z enteros, con c > 0 y gcd(a, b, c) = 1 tales que
  √
x a + b −19
= .
y c
Distingamos varios casos:
• Supongamos c ≥ 5. Como gcd(a, b, c) = 1, existen d, e, f ∈ Z tales que
ae + bd + cf = 1.
√  
Elijamos u = d + e −19 y el producto u xy tiene la forma siguiente:
√ √

   
x a + b −19  (ad − 19be) + (ae + bd) −19
u = d + e −19 = .
y c c
Luego, como ae + bd = 1 − cf , tendremos


 
x (ad − 19be) −19
u = + − f −19.
y c c
Como (ad − 19be), c ∈ Z, podemos aplicar el algoritmo euclı́deo en Z (modificado con
la condición descrita en el Problema 48 y tendremos:
(ad − 19be) = qc + r,
90 2. PRIMOS Y MAXIMALES

con 0 ≤ |r| ≤ 2c . Por tanto, queda:




 
x r −19
u =q+ + − f −19.
y c c
Esto nos lleva a


 
x r + −19
u − (q − f −19) = .
y c

Poniendo v = (q − f −19), tendremos:
  √
x r + −19
u −v = ,
y c
con lo que queda solemente por probar que si c > 5, se tiene

r + −19 (r2 + 19) r2 19 1 19
Φ( )= 2
≤ 2
+ < + < 1.
c c c 36 4 36
En el caso c = 5, tendremos r ≤ 2 y, por tanto,

r + −19 r2 19 4 19
Φ( )≤ 2 + < + < 1.
c c 25 25 25
Quedan sólo los caso c = 2, 3, 4. Veámoslos separamente.
• Si c = 2. Como gcd(a, b, c) = gdc(a, b, 2) = 1, es claro que a y b tienen distinta paridad
(ni ambos son pares, ni ambos son impares, simultáneamente), luego a − b − 1 ∈ 2Z.
Elijamos v dado por:
√  √   √ 
(a − 1) + b −19 (a − b − 1) 1 + −19 1 + −19
v= = +b ∈Z .
2 2 2 2
Elijamos u = 1 y tenemos
 
x 1
Φ(u − v) = Φ( ) < 1.
y 2
• Si c = 3. Como gcd(a, b, c) = gcd(a, b, 3) = 1 tendremos que
a2 + 19b2 = a2 + b2 6= 0 mod 3,
2 2
porque 3 es primo en Z[i] y si 3 | (a + b ), entonces 3 | (a + bi) o 3 | (a − bi). En
cualquiera de las dos opciones, 3 deberı́a ser divisor de a y b simultáneamente, lo que
contradice el hecho gcd(a, b, 3) = 1.
Aplicando división euclı́dea, existirán q, r ∈ N, con r 6= 0 y r < 3 tal que
a2 + 19b2 = q3 + r.

Elijamos u = a − b 19 y v = q ∈ Z, tendremos
(a2 + 19b2 ) (a2 + 19b2 ) − 3q
 
x r
Φ(u − v) = Φ( − q) = Φ( ) = Φ( ) < 1.
y 3 3 3
• Si c = 4. Como gcd(a, b, c) = gcd(a, b, 4) = 1, entonces, a y b no poseen la misma
paridad. En particular, a + b y a − b son ambos impares y no divisibles por 2. Ahora,
obsérves que
a2 + 19b2 = a2 .b2 6= 0 mod 4,
porque 2 - (a + b) y 2 - (a − b). Repetimos el mismo argumento que en el caso 3.
Hallamos cociente y resto de la división de a2 + b2 19 por 4:
a2 + 19b2 = q4 + r,

con u = a − b −19 y v = q, tendremos que
 
x
Φ(u − v) < 1.
y

2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 91

Corollario 2.1.28 (Un ejemplo de un DIP que no es eculı́deo). El anillo


 √ 
1 + −19
R=Z
2
es un dominio de ideales principales que no es dominio euclı́deo.
Demostración. El Lema 2.1.25 nos muestra que no es un dominio euclı́deo y el Lema
2.1.27 prueba que verifica la condición de Dedekind-Hasse y es, por tanto, un dominio de
ideales principales. 
2.1.6. Divisiones del algoritmo de Euclides en Z.
Definición 44 (Números de Fibonacci). Se define la sucesión de números de Fibonacci
{Fn : n ∈ N} ⊆ Z como la sucesión dada mediante:
[F0 = 0], [F1 = 1], [∀n ∈ N, n ≥ 2, Fn = Fn−1 + Fn−2 ].
Proposición 2.1.29 (Fórmula de de Moivre–Binet). La sucesión de Fibonacci {Fn : n ∈
N} satisface:
ϕn − ψ n
(2.1.1) Fn := √ ,
5
donde √ √
1+ 5 1− 5
ϕ := , ψ := .
2 2
Demostración. Consideremos la ecuación con coeficientes en Z siguiente:
X 2 − X − 1 = 0.
Las soluciones de esta ecuación son dadas por:
√ ! √ !
2 1+ 5 1− 5
X −X −1= X − X− = (X − ϕ)(X − ψ).
2 2
Nótese que multiplicando esta ecuación por potencias de X, transformamos la ecuación inicial
en
X n−2 (X 2 − X − 1) = X n − X n−1 − X n−2 .
Como ϕ y ψ son ceros de X 2 − X − 1 también lo serán de estas ecuaciones, con lo que podemos
concluir:
(2.1.2) ϕn − ϕn−1 − ϕn−2 = 0, ψ n − ψ n−1 − ψ n−2 = 0.
Ahora bien, para n = 0 y para n = 1 la identidad 2.1.1 se satisface:

ϕ0 − ψ 0 1−1
0 = F0 = √ = √ ,
5 5

1+ 5
√ √ √
ϕ1 − ψ 1 2 − 1−2 5 2 25 5
F1 = √ = √ = √ = √ = 1.
5 5 5 5
Para n ≥ 1 tendemos, aplicando la hipótesis inductiva:
ϕn−1 − ψ n−1 ϕn−2 − ψ n−2 ϕn−1 + ϕn−2 ψ n−1 + ψ n−2
Fn = Fn−1 + Fn−2 = √ + √ = √ − √ .
5 5 5 5
Usando las identidades de 2.1.2 concluimos:
ϕn−1 + ϕn−2 ψ n−1 + ψ n−2 ϕn ψn ϕn − ψ n
Fn = √ − √ =√ −√ = √ .
5 5 5 5 5


Corollario 2.1.30. Con las anteriores notaciones:


 ϕn 1
Fn = √ + ,
5 2
donde b·c es la función “parte entera”.
92 2. PRIMOS Y MAXIMALES

Demostración. Baste con observar que


ψn 1
|√ | < .
5 2


EL siguiente resultado es un histórico debido a G. Lamé (cf. [Lm, 1844]) y conocido desde
1844.
Teorema 2.1.31 (Lamé, 1844). Sean a > b > 0 dos números enteros positivos, supongamos
que el algoritmo de Euclides, aplicado a a y b realiza n divisiones. Entonces,
Fn+1 ≤ a, Fn ≤ b.
Demostración. Comencemos considerando la sucesión de divisiones realizadas por el al-
goritmo de Euclides:


 r0 = a,



 r1 = b,


 r0 = q1 r1 + r2 , 0 ≤ r2 ≤ r1 − 1,
.. ..


(2.1.3) . .
r = qi−1 ri−1 + ri , 0 ≤ ri ≤ ri−1 − 1,

i−2




 .. ..
. .




rn−1 = qn rn + rn+1 , rn+1 = 0.

En la que se hacen n divisiones. Podemos revisar esta secuencia de divisiones, para hacer alguna
observación.
Es claro que se tiene:
r0 > r1 > r2 > r3 > · · · > rn−1 > rn > rn+1 = 0.
Es una cadena estructamente decreciente y, en particular, rn 6= 0 porque, en otro caso,
habrı́amos hecho n − 1 divisiones. Pero, además, por ser decreciente qi 6= 0 para todo i.
Y es que si qi = 0 para algún i, tendrı́amos:
ri−2 = 0ri−1 + ri = ri , 0 ≤ ri ≤ ri−1 − 1 ≤ ri−2 − 2,
lo que nos llevarı́a a contradicción. En particular, tenemos qi ≥ 1 para todo i.
Ahora comencemos por debajo. Tenemos que rn+1 = 0, pero rn 6= 0, luego:
rn+1 = 0 = F0
rn ≥ 1 = F1 .
Además, cada qi ≥ 1, luego
rn−1 = qn rn + rn+1 ≥ rn + rn+1 ≥ F0 + F1 = F2 .
Procediento inductivamente, tendremos, por ser qi ≥ 1:

 rn−2 = qn−1 rn−1 + rn ≥ rn−1 + rn ≥ F2 + F1 = F3 ,
..



.




ri−2 = qi−1 ri−1 + ri ≥ ri−1 + ri ≥ Fn−i+2 + Fn−i+1 = Fn−(i−2)+1 ,

(2.1.4) ..
.




r1 = q2 r2 + r3 ≥ r2 + r3 ≥ Fn−1 + Fn−2 = Fn ,




r0 = q1 r1 + r2 ≥ r1 + r2 ≥ Fn−1 + Fn = Fn+1 .

En conclusión, hemos probado que


a = r0 ≥ Fn+1 , b = r1 ≥ Fn .


Definición 45 (Talla de un número natural). Dado un número natural a ∈ N, denotaremos


por `b (a) el número de dı́gitos necesarios para escribir a en base b. Se tiene que
`b (a) = blogb (a) + 1c,
2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 93

Corollario 2.1.32. Dados dos números enteros a, b ∈ Z, el número de divisiones necesario


para hallar el máximo común divisor de ambos está acotado linealmente por el número de dı́gitos
necesarios para escribir ambos números. Es decir, el número n de divisiones está acotado por
max{logc (|a|), logc (|b|)} + logc ( ϕ5 )
n≤ .
logc (ϕ)
donde logc es el logaritmo en base c.
Demostración. Si se hacen n divisiones, tenemos que Fn+1 ≤ max{|a|, |b|}. Como
ϕn+1 1 1 ϕn+1 ϕn+1
Fn+1 = b √ + c ≥ √ √ = .
5 2 5 5 5
Tomando logaritmos tenemos
(n + 1) logc (ϕ) − logc (5) ≤ log(Fn+1 ) ≤ max{logc (|a|), logc (|b|)},
Concluimos
1
(n + 1) ≤ (max{logc (|a|), logc (|b|)} + logc (5)) .
logc (ϕ)
Y, por tanto, tenemos
max{logc (|a|), logc (|b|)} + logc (5)
n≤ − 1.
logc (ϕ)

max{logc (|a|), logc (|b|)} + logc (5) − logc (ϕ) max{logc (|a|), logc (|b|)} + logc ( ϕ5 )
n≤ = .
logc (ϕ) logc (ϕ)

2.1.7. Eliminación Univariada Clásica. Una de las aplicaciones de la Identidad de
Bézout anterior son los tratamientos de Bézout, Sturm y Sylvester de la Eliminación Univariada
clásica. Comencemos con un poco de terminologı́a que los alumnos han visto en el curso de
Teorı́a de Galois.
Definición 46 (Cuerpo Algebraicamente Cerrado). Un cuerpo K se dice algebraicamente
cerrado si para todo polinomio f ∈ K[X] \ K (i.e. no nulo y no unidad) existe ζ ∈ K tal que
f (ζ) = 0.

Proposición 2.1.33 (Teorema del Resto (aka Ruffini)). Sea R un dominio de integridad,
f ∈ R[X] un polinomio y sea ζ ∈ R. El resto de la división de f por (X − ζ) (conforme a lo
descrito en el Teorema 1.3.9) es f (ζ) ∈ R. En particular, son equivalentes:
i) f (ζ) = 0,
ii) (X − ζ) | f en R[X].
Más aún, si R = K es un cuerpo, son equivalentes
i) El cuerpo K es algebraicamente cerrado
ii) Para todo d ∈ N, d ≥ 1 y para todo polinomio f ∈ K[X] de grado d, existen ζ1 , . . . , ζr ∈
K, distintos dos a dos, y m1 , . . . , mr ∈ K y a ∈ K, a 6= 0 tales que:
• m1 + m2 + · · · + mr = d,
• La siguiente igualdad se da en K[X]:
f = a(X − ζ1 )m1 (X − ζ2 )m2 · · · (X − ζr )mr .
Los elementos ζ1 , . . . , ζr ∈ K se llaman las raı́ces o los ceros del polinomio f en K y los
números entereos positivos m1 , . . . , mr se denominan (respectivamente) las multiplicidades de
esas raı́ces.
Demostración. Para la primera afirmación, apliquemos la división euclı́dea (como en el
Teorema 1.3.9) y tendremos que existen q, r ∈ R[X] tales que deg(r) ≤ deg(X −ζ)−1 = 1−1 = 0
(i.e. r ∈ R es una constante) y se verifica:
f (X) = q(X)(X − ζ) + r(X).
94 2. PRIMOS Y MAXIMALES

Evaluando en ζ ∈ R en los dos lados obtenemos:


f (ζ) = q(ζ)(ζ − ζ) + r(ζ) = q(η)0 − r(ζ) = r(ζ).
Pero como r es una constante r(ζ) = r y tenemos f (ζ) = r = 0 como pretendı́amos. La
implicación (X − ζ) | f =⇒ f (ζ) = 0 es obvia.
Para el caso en que R = K sea un cuerpo algebraicamente cerrado, procedamos por inducción
en d. Para el caso d = 1 la propiedad es obvia porque f = aX + b = a(X + a−1 b) por ser
a ∈ K \ {0}. Tomando ζ = −a−1 b habremos terminado.
Para el caso d ≥ 1, la definición de cuerpo algebraicamente cerrado, nos garantiza que existe
ζ ∈ K tal que f (ζ) = 0. Por tanto, (X − ζ) | f y tendremos que exite g ∈ K[X] tal que
f = (X − ζ)g.
por tanto deg(g) = d − 1 y, por hipótesis inductiva, tendremos que existen ζ1 , . . . , ζr ∈ K,
m1 , . . . , mr ∈ K y a ∈ K, a 6= 0 tales que:
i) m1 + m2 + · · · + mr = d − 1,
ii) La siguiente igualdad se da en K[X]:
g = a(X − ζ1 )m1 (X − ζ2 )m2 · · · (X − ζr )mr .
Luego
f = a(X − ζ)(X − ζ1 )m1 (X − ζ2 )m2 · · · (X − ζr )mr .
y tenemos la afirmación en el caso d.
Nos queda pro probar que si se verifica la propiedad descrita, entonces K es algebraicamente
cerrado. Pero eso es obvio: cualquier polinomio f ∈ K[X] de grado positivo, admite una
factorización como la descrita y, entonces, posee al menos un cero en K. 

Corollario 2.1.34. Si K es un cuerpo algebraicamente cerrado, los elementos irreducibles (y


los elementos primos) de K[X] son:
[
{0} {a(X − ζ) : a ∈ K \ {0}, ζ ∈ K}.

Demostración. Obvio desde la Proposición predente. Lo único que conviene recordar es


que, como K[X] es un dominio de ideales principales (por ser dominio euclı́deo) un elemento
es primo si y solamente si es irreducible (ver Teorema 2.1.10). 

Proposición 2.1.35. Todo cuerpo algebraicamente cerrado tiene cardinal infinito.


Demostración. Supongamos que K = {a1 , . . . , am } fuera un cuerpo finito. Definamos
entonces el siguiente polinomio f ∈ K[X]:
f := (X − a1 )(X − a2 ) · · · (X − am ) + 1.
Claramente f (ζ) = 1 para cualquier ζ ∈ K y, por tanto, f no posee ninguna raı́z en K o, lo
que es lo mismo, K no puede ser algebraicamente cerrado. 

Definición 47 (Clausura Algebraica). Si K es un cuerpo, llamamos clausura algebraica de


K al menor cuerpo algebraicamente cerrado que contiene a K.

Observación 2.1.36. El concepto “menor” en la definición anterior debe entenderse como


“menor salvo K−isomorfismo de cuerpos”. Es decir, la clausura algebraica de un cuerpo K
será un cuerpo K algebraicamente cerrado que satisface las siguientes propiedades:
• K es algebraicamente cerrado,
• K ⊆ K (o, salvo isomorfismo, K contiene una copia isomorfa de K),
• Para todo cuerpo L algebraicaente cerrado que contiene a K, existe ϕ : K −→ L un
morfismo de anillos tal que ϕ |K = IdK .
Nótese que la existencia de un morfismo de anillos implica, por ser cuerpos todos ellos, que es
un monomorfismo y, por tanto, K es isomorfo a un subcuerpo de L.
Un resultado importante, que no desmotraremos en este curso, sino en el curso correspondiente,
afirma lo siguiente.
2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 95

Teorema 2.1.37 (Existencia de Clausura Algebraica). Suponiendo el Lema de Zorn, todo


cuerpo posee una clausura algebraica y ésta es única salvo isomorfismo de cuerpos. Más aún, la
clausura algebraica de un cuerpo es la mayor extensión algebraica de ese cuerpo. En particular,
si K es la clausura algebraica de K, todos los elementos α ∈ K son algebraicos sobre K, es
decir,
∀α ∈ K, ∃f ∈ K[X] \ K, f (α) = 0.

Ejemplo 2.1.38. El “Teorema Fundamental del Álgebra” (un Teorema de Análisis) dice que
C es un cuerpo algebraicamente cerrado. Por tanto, los elementos irreducibles de C[X] son los
dados mediante:
[
{0} {a(X − ζ) : a ∈ C \ {0}, ζ ∈ C}.
Por la relación entre R y C es fácil deducir que los elementos irreducibles de R[X] son los dados
por la siguiente colección:
[ [
{0} {a(X − ζ) : a ∈ R \ {0}, ζ ∈ R} {a((X − b)2 + c2 ) ; a, c ∈ R \ {0}, b ∈ R}.

Además, C es la clausura algebraica de R. En el caso de Q es claro que Q no es un cuerpo


algebraicamente cerrado porque X 2 + 1 no posee raı́ces en Q. Por ejemplo, el polinomio
√ √
X 4 + 1 = (X 2 − 2X + 1)(X 2 + 2X + 1),
muestra que los irreducibles en Q[X] no tiene por qué ser irreducibles en R[X]. También puede
probarse que Q[X] posee elementos irreducibles de grado tan grande como se quiera. La clausura
algebraica Q de Q son los elementos de C algebraicos sobre Q, es decir,
Q = {ζ ∈ C : ∃f ∈ Q[X], f (ζ) = 0}.
En el caso de cuerpos finitos, las clausura algebraicas Fp de los cuerpos primos Fp , con p ∈ N
primo no nulo,
Fp := Z/pZ,
tienen cardinal infinito, a pesar de que Fp es un cuerpo finito.

Consideremos, en lo que queda de Subsección, que K la clausura algebraica del cuerpo K de


coeficientes. Se tiene el siguiente resultado clásico:
Lema 2.1.39. Dados dos polinomios f, g ∈ K[X] no nulos, son equivalentes:
i) ∃ζ ∈ K, tal que f (ζ) = g(ζ) = 0
ii) Si h es un máximo común divisor de f y g en K[X], entonces deg(h) ≥ 1.
Demostración. Para la primera implicación, considérese que existe ζ ∈ K tal que f (ζ) = 0
y g(ζ) = 0. Consideremos el siguiente conjunto a ⊆ k[X] dado mediante:
a := {p(X) ∈ K[X] : p(ζ) = 0}.
Es sencillo comprobar que a es un ideal de K[X]. Además, no es el ideal nulo (i.e. a 6= (0))
porque, como hemos indicado más arriba, todos los elementos de K son algebraicos sobre K.
Esto significa que, como ζ es algebraico sobre K, existe un polinomio no constante p ∈ K[X]
tal que p(ζ) = 0. Luego p ∈ a 6= (0) y, adicionalmente, a 6= (1), porque 1 no se anula en ζ. En
conclusión, a es un ideal propio de K[X] es un dominio de ideales principales, a = (h) es un
ideal principal no nulo y distinto del total. En términos de extensiones de cuerpos, el generador
h es el polinomio mı́nimo de ζ sobre K o, con otras notaciones, h = IrrK (ζ) ∈ K[X]. Como
f (ζ) = g(ζ) = 0, entonces, f, g ∈ a y, por tanto, h | f y h | g y h es no constante. Por tanto,
deg(gdc(f, g)) ≥ 1 y habremos terminado.
Para la otra implicación, sea h = gcd(f, g) y supongamos deg(h) ≥ 1 (es decir, h no es con-
stante). Como K es un cuerpo algebraicamente cerrado, todo polinomio no constante posee, al
menos, una raı́z. Es decir, existe ζ ∈ K tal que h(ζ) = 0. Como h es el máximo común divisor
de f y g, h | f y h | g, obviamente se tiene f (ζ) = 0 y g(ζ) = 0 como indica la propiedad
(1). 
96 2. PRIMOS Y MAXIMALES

2.1.7.1. Mutiplicar por un polinomio. Consideremos el conjunto K[X]d formado por los
polinomios univariados de grado a lo sumo d, es decir, K[X] :=:= {f ∈ K[X] : deg(f ) ≤ d}.
Como se indica en el Problema 32, con las operaciones suma y producto por un escalar en K,
tenemos que:
(K[X]d , +, ·K ),
es un K−espacio vectorial de dimensión d + 1. Una base ordenada es la dada por los monomios
{1, X, X 2 , . . . , X d }. Ahora consideremos un polinomio no nulo f := am X m +am−1 X m−1 +· · ·+
a1 X + a0 y supongamos am 6= 0. Es claro que para cada polinomio g ∈ K[X]d , el polinomio f g
es de grado d + m. Esto nos permite definir, una aplicación
ρf : K[X]m −→ K[X]d+m ,
dado mediante:
ρf (g) := f g.
Se tiene:
Proposición 2.1.40. La aplicación ρf : K[X]m −→ K[X]m+d es una aplicación lineal que,
en las respectivas bases monomiales, viene dada por la matriz Sm+1 (f ) ∈ M(d+m+1)×(m+1) (K)
(i.e. m + d + 1 filas y m + 1 columnas), dada mediante la expresión siguiente:
 
a0 0 ··· 0
a1 a0 ··· 0 
 .. .. ..
 
.. 
.
 . . . 

ad ad−1 · · · ad−m 

Sm+1 (f ) := 

.
 0 a d · · · ad−m+1 
0
 0 · · · ad−m+2 
. . .. ..
 .. ..

. . 
0 0 ··· ad
Demostración. Supongamos que las coordenadas de un polinomio g ∈ K[X]m en la base
monomial {1, X, X 2 , . . . , X m } son dadas mediante la lista (z0 , z1 , . . . , zm ). En otras palabras,
estamos diciendo que
g = z0 + z1 X + z2 X 2 + · · · + zm X m .
Ahora mutiplicamos
f g := c0 + c1 X + c2 X 2 + · · · cm+d X m+d ,
donde
X
ck := ai zj .
i+j=k

Escrita esta expresión en forma matricial (suponiendo d ≥ m por simplicidad de la expresión)


tendremos:
···
   
a0 0 0 c0
 a1 a0 ··· 0   c1 
 .. .. .  .. 
   
. . . 
 .
 . . .    . 
  
 am
 am−1 · · · a0  z0

 cm 
 
am+1
 am ··· a1   z1  cm+1 
   

 .. .. . .. ..   z2   .. 
 . . .   =  . .
   ..   
 ad
 ad−1 · · · ad−m 
 .   cd 
 
 0
 ad · · · ad−m+1 
 zm
 cd+1 
 
 0
 0 · · · ad−m+2 

 cd+2 
 
 . .. .. ..  . 
 .. .

. . .   . 
0 0 ··· ad cd+m

2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 97

Teorema 2.1.41 (Resultante de Sylvester–Bézout). Sean f y g dos polinomios no con-


stantes en K[X] de grados respectivos n y m. Consideremos la matriz Sylv(f, g) ∈ Mn+m (K)
(llamada matriz de Sylvester-Bézout de f y g) dada mediante:
Sylv(f, g) := (Sm (f ) | Sn (g)) .
Son equivalentes:
i) ∃ζ ∈ K, tal que f (ζ) = g(ζ) = 0
ii) Si h es un máximo común divisor de f y g en K[X], deg(h) ≥ 1.
iii) El rango de la matriz de Sylvester es menor que n + m − 1,
iv) El determinante Res(f, g) := det(Sylv(f, g)) = 0.
Al determinante Res(f, g) := det (Sylv(f, g)) se le denomina resultante de f y g.
Demostración. Comencemos considerando la aplicación lineal siguiente:
Sf,g : K[X]m−1 × K[X]n−1 −→ K[X]n+m−1
(2.1.5)
(a, b) 7−→ af + bg.
Es claro que es una aplicación lineal, que está bien definida y, consideremos las bases siguientes:
• En K[X]n+m la base monomial dada mediante Γ := {1, X, X 2 , . . . , X n+m−1 }
• En K[X]m−1 y en K[X]n−1 las respectivas bases monomiales. En el producto K[X]m−1 ×
K[X]n−1 la base “producto” de las respectivas bases monomiales:
[
β := {(X i , 0) : 0 ≤ i ≤ m − 1} {(0, X j ) : 0 ≤ j ≤ n − 1}.
Obsérvese que, en particular, los espacios vectoriales K[X]m−1 ×K[X]n−1 y K[X]n+m−1 tienen
la misma dimensión n + m. Además, la matriz de Sf,g (que es aplicación lineal) en las bases β
y Γ es, exactamente, Sylv(f, g), donde
 m n 
z }| { z }| {
 a0 0 · · · 0 b0 0 ··· 0 
· · · 0 b1 ···
 
 a1 a0 b0 0 
 .. .. .. .. .. .. .. .. 
 
 . . . . . . . . 
 .. .. .. ..
 
.. .. 
 . . . a0 . . . b0 
 
Sylv(f, g) := (Sm (f ) | Sn (g)) =  .. .. .. .. ..  ∈ Mn+m (K),
 an an−1 · · ·
 . . . . . 

 . . .
. .
.

 0
 an . . bm bm−1 · · · .  
 . .. .. .. .. .. 
 .. . . . 0 bm . . 
 
 . . . . . . . .. 
 .. .. .. .. .. .. .. . 
0 0 ··· an 0 0 ··· bm
siendo
f := an X n + an−1 X n−1 + · · · + a1 X + a0 ,
y
g := bm X m + bm−1 X m−1 + · · · + b1 X + b0 .
Por tanto, concluimos que Sf,g es un isomorfismo si y solamente si Sylv(f, g) tienen rango
n + m o, equivalentemente, det(Sylv(f, g)) 6= 0. En particular, si Sf,g es isomorfismo, el
elemento 1 ∈ K[X]n+m−1 está en la imagen Im(Sf,g ). Esto último significa solamente que
1 = af + bg y por tanto tenemos probado ¬(3) ⇒ ¬(2). En conclusión, tenemos probadas las
implicaciones :
(1) ⇔ (2) ⇒ (3) ⇔ (4),
de las afirmaciones descritas en el enunciado. Queda por ver (3) ⇒ (2). Para ello, supongamos
que Sylv(f, g) no tiene rango máximo n + m. Entonces, Sf,g no es isomorfismo y existe h ∈
K[X]n+m que no está en la imagen de Sf,g . Veamos que, entonces, h 6∈ (f, g) y habremos
concluido que (f, g) = (f ) + (g) 6= K[X], con lo que ambos ideales no son co–maximales y
gcd(f, g) no es una constante no nula en K[X]. Supongamos que h 6∈ Im(Sf,g ) y supongamos
que h ∈ (f, g). Entonces, existen a, b ∈ K[X] tales que h = af + bg. Ahora aplicamos el
mismo argumento usado en la prueba de la identidad de Bézout con cotas (Teorema 2.1.19 y
98 2. PRIMOS Y MAXIMALES

Corolario 2.1.21 anteriores). Elegimos α := rem(a, g) con deg(α) ≤ deg(g) − 1. Con lo cual
α ∈ K[X]m−1 . Sea q el cociente de la división de a por g y definamos β = qf + b. Tenemos
(2.1.6) h = af + bg = αf + (qf + b)g = αf + βg.
De nuevo, es fácil probar que
deg(βg) ≤ max{deg(h), deg(α) + deg(f )} ≤ n + m − 1.
Por tanto, deg(β) ≤ n − 1 y β ∈ K[X]n−1 . La identidad (2.1.6) significa h = αf + βg =
Sf,g (α, β). Y, por tanto, llegarı́amos a contradicción, dado que h 6∈ Im(Sf,g ). 

Corollario 2.1.42. El grado del máximo común divisor de dos polinomios f y g es el grado
del polinomio no nulo de menor grado en Im(Sf,g ). Más aún, del grado del máximo común
divisor de f y g es el co-rango de Im(Sf,g ) en K[X]n+m−1 . Es decir,
deg (gcd(f, g)) = co − rankK[X]n+m−1 (Im(Sf,g )) = (n + m) − dim (Im(Sf,g )) .
En otros términos
deg (gcd(f, g)) = (n + m) − rak (Sylv(f, g)) .
Demostración. La primera de las afirmaciones es evidente. El polinomio no de menor
grado h ∈ Im(Sf,g ) es el máximo común divisor de f y g.
Pero podemos determinar ese grado de manera precisa, simplemente oncociendo el rango de la
matrix Sylv(f, g). Para ello, consideremos un polinomio cualquiera p ∈ Im(Sf,g ) y consideremos
el subespacio vectorial sobre K generador por la familia siguiente (dependiente de p y de n + m:
Bp := {p, Xp, X 2 p, . . . , X n+m−1−d p} ⊆ K[X]n+m−1 ,
donde d := deg(p). Nótese que el cardinal de Bp es igual a n + m − d. Sea Ωp el subespacio
vectorial generado por Bp en K[X]m+n−1 . Supongamos que
p := ad X d + ad−1 X d−1 + · · · + a1 X + a0 ,
con ad 6= 0. Si escribimos las coordenadas de los vectores de p en la base monomial de
K[X]n+m−1 y configuramos la mtriz cuyas columnas son esas coordenadas, nos queda:
 (n+m)−d 
z }| {
a0
 0 ··· 0  
a1
 a0 ··· 0  
. .. .. .. 
 .. . . .
 
. .. .. 
 .. . . a0 
 
. .. .. .. 
. . .
. . .

.. .. 
ad ad−1 . .
 
 .. 
···
 
0 ad .
 .. .. .. .
 
. . . .. 
 
0 0 · · · ad 

Es claro que se trata de una matriz con (n + m) − d columnas, que contiene una submatriz
triangular superior con ad 6= 0 en la diagional y (n + m) − d filas y columnas. Por tanto,
esta matriz tiene rango (n + m) − d. Esto implica que los vectores en Bp son linealmente
independientes y, por tanto, el subespacio Ωp es un subespacio de dimensión igual a (n + m) − d.
De otro lado, si p ∈ Im(Sf,g ), entonces es claro que todo Bp ⊆ Im(Sf,g ) y, por tanto, Ωp ⊆
Im(Sf,g ). Además, esta afirmación es una equivalencia. (ver Problema 99 más abajo).
Ahora, consideremos el máximo común divisor h := gcd(f, g) y supongamos t := deg(h). Por
lo dicho más arriba, es el polinomio no nulo de menor grado en Im(Sf,g ). COnsideremos la
familia Bh y el subpesacio Ωh . Como h ∈ Im(Sf,g ), entonces Ωh ⊆ Im(Sf,g ), luego
(n + m) − t = dim(Ωh ) ≤ dim(Im(Sf,g )) = rank(Sylv(f, g)).
2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 99

De otro lado, supongamos p ∈ Ima(Sf,g ) un polinomio no nulo cualquiera. Aplicando división


euclı́dea, tendremos:
p = qh + r,
con deg(r) ≤ deg(h) − 1 = t − 1. Es fácil observar que qh está en Ωh . Para ellos, baste observar
que deg(p) ≤ n + m − 1, luego deg(q) ≤ n + m − 1 − t y podemos escribir:
q := bn+m−1−t X n+m−1−t + · · · + B1 X + b0 .
Por tanto,
n+m−1−t
X
bi X i h ∈ Ωh .

qh =
i=0
Como h ∈ Im(Sf,g ), entonces Ωh ⊆ Im(Sf,g ), luego qh ∈ Im(Sf,g ). Dado que p ∈ Im(Sf,g ).
Por tanto, r = p − qh ∈ Im(Sf,g ). Si r 6= 0, entonces existirı́a un polinomio r ∈ Im(Sf,g ) cuyo
grado satisface deg(r) < deg(h), contradiciendo que el grado de h es el mı́nimo de los grados
de los polinomios no nulos en Im(Sf,g ). Por tanto, necesariamente, r = 0. Con ello, hemos
probado que dado cualquier p ∈ Im(Sf,g ) implica que p ∈ Ωh . En particular, Im(Sf,g ) ⊆ Ωh y
concluiremos que:
rank(Sylv(f, g)) = dim(Ima(Sf,g ) ≤ dim(Ωh ) = (n + m) − t.
Hebramos probado ası́ la igualdad buscada en el enunciado:
(n + m) = deg(gdc(f, g)) + rank(Sylv(f, g)),
concluyendo la prueba del enunciado del Corolario. 

2.1.8. Ejercicios de la Sección 2.1.


Problema 77. Usando las matrices Sm (f ) que se describen en la Subsección 2.1.7, hay que
probar que la división euclı́dea en el anillo de polinomios es, en realidad, la resolución de un
sistema de ecuaciones lineales compatible y determinado. Describe ese sistema de ecuaciones.
Problema 78. Prueba las siguientes afirmaciones:
i) Verificar que si K = Q es el cuerpo de los racionales, el siguiente conjunto no es ideal
en Q[X]:
{f ∈ Q[X] : f (0) ∈ Z}.
ii) Verificar que si a ∈ Q, el conjunto siguiente es un ideal principal de Q[X]:
ma := {f ∈ Q[X] : f (a) = 0}.
Hallar un generador. Comprobar que ma no es subanillo de Q[X] y que 1 6∈ ma .
iii) Si a ∈ C es un número complejo, algebraico sobre Q. Describir quién es el siguiente
conjunto:
ma := {f ∈ Q[X] : f (a) = 0}.
¿ Es ideal principal?, ¿Quién es su generador?.
iv) Hacer el mismo análisis de ma cuando a ∈ C es un número trascendente sobre Q.
Problema 79. Sea p ∈ N un primo. √ Sea m ∈ Z un entero con m ≤ −(p + 1). Prueba que,
entonces, p es irreducible en Z [ m].
Problema 80. Sea p ∈ N un primo. Sea mh∈ Z uni entero con m ≡ 1 mod 4 y m ≤ −(4p + 1).

Prueba que, entonces, p es irreducible en Z 1+2 m .

Problema
√ √ Sea m ∈ Z un entero positivo que no es un cuadrado
81. √ perfecto.

Sea α =
a + b m ∈ Z[ m]. Prueba que si a2 − mb2 ∈ {±1}, entonces α ∈ (Z[ m]) .
Problema 82. Como en el problema previo, sea m ∈ Z √ un entero √
positivo que no es un
1+ m 1+ m
cuadrado perfecto y tal que m = 1 mod 4. Sea α = a + b 2 ∈ Z[ 2 ]. Prueba que si se
verifica  
1−m 2
a2 + ab + b ∈ {±1},
4
 √ ∗
entonces α ∈ Z[ 1+2 m ] .
100 2. PRIMOS Y MAXIMALES

Problema 83. Con las notaciones habituales, hay que realizar las siguientes tareas:
• Prueba que el ideal (1 − 3i, 3 − i) es un ideal principal
√ en el anillo de Gauss Z[i].
• Prueba las siguientes
√ relaciones
√ entre ideales de Z[ −5]:
i) (2, 1 + √−5) = (2, 1 − √−5),
ii) (3, 1 + √−5) 6= (3, 1 − √−5),
iii) (2, 1 + √−5) 6= (3, 1 + √−5),
iv) (2, 1 + −5) 6= (3, 1 − −5).
Problema 84. Verifica el número de divisiones para hallar el máximo común divisor mediante
el método de Euclides en los casos siguientes. Intenta comparar con aplicar el método escolar
basado en la Criba de Eratóstenes.
i) a = 8633, b = 4171
ii) a = 15251, b = 1751,
iii) a = 123521, b = 20467,
iv) a = 942373, b = 6589,
v) a = 1015103, b = 1073287.
Problema 85. Sea R un dominio de integridad. Sean a, b, c ∈ R tales que (a, c) = R. Prueba
que (a, bc) = (a, b).
√ √ √
Problema 86. Prueba que 17 − 3 3 y 83 + 47 3 son asociados en Z[ 3].
√ √
Problema 87. Expresar 2 + 8 −5 como producto de irreducibles √ en Z[ −5]. ¿Es posible
hallar más de una expresión?. Intentar lo mismo con 6. ¿Es Z[ −5] dominio de factorización
única?, ¿será un dominio de ideales principales?.
√ √
Problema
√ 88. Prueba que 10 no es primo en Z[ 10] y probar que sı́ es irreducible. Concluir
que Z[ 10] no es un dominio de ideales principales.
Problema 89. Sea r ∈ Z \ {−2, 0} un entero y consideremos el polinomio:
f (X) := X 3 + rX + 1.
Sea R el anillo cociente Z[X]/(f ). Prueba que R es un dominio de integridad. Sea θ := X + (f )
la clase definida por el elemento X ∈ Z[X]. Prueba que θ ∈ R∗ .
Problema 90. Sea m ∈ Z un entero sin factores primos múltiples. Definamos la función:

φm : Q[ √ m] −→ Q,
a + b m 7−→ |a2 − mb2 |.
Nótese que √ √ √
φm (a + b m) = |(a + b m)(a − b m)|.
Prueba que se verifican las siguientes propiedades:

i) φm (Z[ m] ⊆ N,
ii) φm (x) = 0√⇐⇒ x = 0,
iii) ∀x, y ∈ Z[ m], φm (xy) = φm √(x)φm (y),
iv) φm (xy) ≥ φm (x), ∀x, y ∈ Z[ m], y 6= 0.
√ √
Problema 91. Sea φm y Z[ m] como en el problema anterior. Prueba que (Z[ m], φm ) es
un dominio euclı́deo si y solamente si se verifica la siguiente propiedad:
√ √ 
∀x, y ∈ Q, ∃a, b ∈ Z, tales que φm (x + y m) − (a + b m) < 1
Problema
√ 92. Prueba que si m ∈ Z es un entero negativo sin factores múltiples, entonces
(Z[ m], φm ) es dominio euclı́deo si y solamente si m ∈ {−2, −1}.
Problema 93 (Divisor Lateral Universal). Sea R un dominio de integridad que no es
cuerpo. Un elemento u ∈ R que no está en R∗ ∪ {0} se denomina divisor lateral universal en
R si verifica:
∀x ∈ R, ∃z ∈ R∗ ∪ {0}, tal que u | x − z.
Se pide probar las afirmaciones siguientes :
i) Si (R, φ) es un dominio euclı́deo, entonces posee divisor lateral universal. (Pista:
Elegir un elemento u ∈ R que minimice {φ(x) : x ∈ R, x 6∈ R∗ ∪ {0}}).
2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 101

m es un entero sin factores múltiples, tal que m = 2, 3 mod 4 y m < −2, entonces
ii) Si √
Z[ m] no posee divisores√laterales universales y, en consecuencia, no existe ninguna
función euclı́dea sobre Z[ m]. (Pista: si hubiera divisor universal √ lateral, entonces
tiene que ser divisor de alguno de los elemntos 2 − 1, 2 + 0, 2 + 1 en Z[ m]. Los únicos
divisores laterales posible serán
√ {±2,
√ ±3}.
√ Pero ninguno de esos 4 elementos divide a
ninguno de los elementos m − 1, m, m + 1.)
2.1.8.1. El algoritmo de Berlekamp. La siguiente serie de problemas muestra un algoritmo
de factorización de polinomios sobre un cuerpo finito, conocido como algoritmo de Berlekamp
([Be, 70]).
Problema 94. Pruébese la siguiente propiedad, base del algorimo de factorización de Berlekamp;
Sea Fq el cuerpo finito de q elementos. Sea g ∈ Fq [T ] un polinomio cualquiera, entonces, se
tiene : Y
g(T )q − g(T ) := (g(T ) − x)
x∈Fq
Qr
Problema 95. Supongamos ahora que f := i=1 fi es una factorización de un polinomio
f ∈ Fq [T ], sabiendo que
gcd(fi , fj ) = 1,
i.e. suponemos que f no posee factores irreducibles múltiples.
Consideremos el anillo cociente :
R := Fq [T ]/(f )
Para cada g ∈ Fq [T ], denotemos por g ∈ R su clase módulo f . Pruébese la siguiente afirmación :
Para cada g ∈ Fq [T ] tal que g q − g = 0 es cierta en R, y para cada factor irreducible fi de f ,
existe un único xi ∈ Fq tal que :
f | g(T ) − xi
en Fq [T ].
Problema 96. Con las anteriores notaciones, pruébese la siguiente afirmación:
Para cada punto (x1 , . . . , xr ) ∈ Frq existe un polinomio g ∈ Fq [T ] de grado estrictamente menor
que el grado de f tal que :
gq − g = 0 en R y g + (fi ) = xi + (fi ) en Fq [T ]/(fi ).
( Hint: Se requiere el uso del Teorema Chino de los Restos en Fq [T ]. Buscar información más
adelante en este mismo texto.)
Problema 97. Con las anteriores notaciones, pruébese la afirmación siguiente:
El conjunto de polinomios g ∈ Fq [T ] de grado menor estricto que el grado de f y tales que
g q − g = 0 en R es un Fq −espacio vectorial cuya dimensión coincide con el número de factores
irreducibles de f .
Problema 98. Defı́nase, usando los Problemas precedentes, un algoritmo que decide si un
polinomio univariado f ∈ Fq [T ], sin factores múltiples, es irreducible o no en Fq [T ].
Problema 99. Sean Bp y Ωp la familia de polinomios y el subespacio vectorial de K[X]n+m−1
descritos en la prueba del Corolario 2.1.42. Prueba que p ∈ Im(Sf,g ) si y solamente si Ωp ⊆
Im(Sf,g ).
Problema 100. Diseña un algoritmo que calcula el máximo común divisor de dos polinomios
sin hace ni una división y usando solamente Álgebra Lineal básica. Usando el Corolario 2.1.42,
divide las etapas es las siguientes:
• Dados f, g ∈ K[X] de grados respectivos n y m, hallar la matriz Sylv(f, g).
• Hallar el rango de la matriz Sylv(f, g).
• Construir un sistema de ecuaciones polynomiales cuya matriz de coeficientes sea la
matriz de Sylvester Sylv(f, g), con alguna matriz identidad añadida, y cuyas solu-
ciones sean:
– El máximo común divisor de f y g,
– Los polinomios de la Identidad de Bézout para f , g y su máximo común divisor.
Trata de estimar cuántas operaciones en el cuerpo de coeficientes ( operaciones en {+, −, ×, ·−1 }
y tests de signo = 0?) son necesarias para hallar el máximo común divisor de dos polinomios
con tu método.
102 2. PRIMOS Y MAXIMALES

2.1.8.2. El Sistema Criptográfico RSA. Lo que sigue es una serie de problemas que expli-
can el funcionamiento interno del sistema criptográfico RSA a través de una serie de sencillos
problemas (cf. [RSA, 78]).
Problema 101 (Función de Euler). Definiremos la función de Euler ϕ : N −→ N del modo
siguiente :
ϕ(n) := ]{m ∈ N : m ≤ n, gcd(m, n) = 1}.
Se pide probar las siguientes afirmaciones:
i) La función de Euler es el cardinal del grupo multiplicativo de las unidades de Z/nZ),
es decir,
∗
ϕ(n) = ] (Z/nZ) .
ii) Para cada número natural n ∈ N, n ≥ 2, las siguientes propiedades son equivalentes :
(a) n ∈ Z es primo,
(b) Z/nZ es un dominio de integridad.
(c) Z/nZ es un cuerpo
(d) ϕ(n) := n − 1
(e) (Z/nZ)∗ con la operación producto es un grupo abeliano de orden n − 1.
Problema 102 (Teorema Pequeño de Fermat (versión débil)). Probar la siguiente afir-
mación:
Sea p ∈ N un número primo y n ∈ N un número natural, entonces
ϕ(pn ) = pn − pn−1 .
Probar, como consecuencia el teorema Pequeño de Fermat:
Dado n ∈ N un número primo, n ≥ 2. Entonces, para cada x ∈ Z/nZ \ {0}, se tiene :
xn−1 ≡ 1 mod n.
Verifica que esta propiedad no caracteriza a los números primos. Desgraciadamente hay más
números que los números primos verificando esta propiedad. Son los llamados números de
Carmichael. El más pequeño número de Carmichael conocido que no es primo es 561. Prueba
que no es primo y sı́ verifica la condición del Teorema Pequeño de Fermat. Busca información
adicional sobre los número de Carmichael en Wikipedia e incorpóralo al Problema.
Problema 103 (Teorema Pequeño de Fermat (versión fuerte)). Prueba el siguiente
enunciado usado por [Pr, 75]:
Un número natural n ∈ N, n ≥ 2 es un número primo si y solamente si una cualquiera de las
siguienets condiciones son equivalentes :
i) (Z/nZ)∗ es un grupo cclio de orden n − 1,
ii) La ecuación X n−1 − 1 posee una raı́z primitiva en el anillo Z/nZ.
Problema 104. Prueba que la función de Euler satisface: ϕ(1) = 1 y para n ≥ 2 se tiene:
X
ϕ(m) = n
m|n

Problema 105 (La función de Euler es multiplicativa). Prueba que la función de Euler
es mutiplicativa. Es decir, dados n, m ∈ N, n, m ≥ 2 dos números naturales coprimos (i.e.
gcd(m, n) = 1), entonces
ϕ(nm) = ϕ(n)ϕ(m).
Concluir que si p y q son dos primos no nulos y distintos en Z, entonces
ϕ(pq) = (p − 1)(q − 1).
Hint: usa el teormea de los Chinos sobre Z (visto en Introducción al Lenguaje Matemático) o
la versión más avanzada en Teorema 3.2.2.
Problema 106 (RSA: Definición de Clave Pública). Se trata de suponer una red de
usuarios (tipo internet o cualquier red social) que ponen a disposición de todo el mundo una
clave pública. Si los mimebros de esa red son los elementos de un conjunto I, cada individuo
publicará una clave pública Ni que será visible para todo miembro de la red. El siguiente proceso
determina como un individuo i prepara su clave pública Ni := (n, e).
2.1. PRIMOS, IRREDUCIBLES, DOMINIOS EUCLÍDEOS 103

• El individuo i elige dos números primos grandes que ólo él conoce y que denotaremos
por p y q. Para ello usará distintos Tests de Primalidad disponibles en el mercado.
• El individuo prepara su clave pública n := pq, pero se reserva el coocimiento de p y
q. Adicionalmente, calcula la función de Euler ϕ(n) = (p − 1)(q − 1). Prueba que
existen primos p y q tales que p < q < 2p, para p suficentemente grande. Pruébese que
n y ϕ(n) son co-primos en este caso. El valor de la función de Euler ϕ(n) se oculta
provisionalmente para preparar las claves.
• Seguidamente el individuo halla un elemento e ∈ N tal que 1 < e < ϕ(n) y tal que
gcd(e, ϕ(n)) = 1. Pruébese que ese elemento e existe.
• Pruébese que, en el caso p < q < 2p, el resto e de la división de n por ϕ(n) puede ser
elegido para ese propósito. Pruébese que ese resto vale e = p + q − 1. Nótese que, sin
embargo, eligiendo e como ese resto, cualquier agente de la red pública descubrirá los
mensajes que se envı́en hacia el miembro que haya elegido e como clave.
• Pruébese que el número e elegido anteriomente posee inverso en el anillo cociente
Z/ϕ(n)Z.
• Hállese el inverso d ∈ N de e en Z/ϕ(n)Z. Hint: usar la Identidad de Bézout con
cotas en Z (ver Corolario 2.1.20).
El usuario define su clave pública cono el par de núeros enteros (n, e). El usuario se guarda su
clave privada d y tira todo el resto de la infromación y los cálulos realizados. Verifica que si se
conoce el valor de la función de Euler ϕ(n), se puede conocer la clave privada d. Verifica que
la función de Euler se puede conocer a partir de los dos primos p y q. Deduce que factorizar
número enteros dados como producto de dos primos, permite “romper” la clave privada de todo
usuario de esa red encriptada.
Problema 107. Verifica que, en el sistema de clave pública anterior, si de un usuario i se
conocen su clave pública (n, e) y su clave privada d, se pueden hallar los dos números primos
p y q de la factorización de n. Verifica también que se puede calcular fácilmente la función de
Euler ϕ(n) a partir de n, d y e.
Problema 108 (Codificación y decodificación de un mensaje en RSA). Los mensajes
se presentan como números, bien usando usna asignación de números de dos dı́gitos a cada
sı́mbolo del teclado o por otro medio (alfabeto ASCII, por ejemplo, buscar en wiki ASCII y
su codificación en base 2). El individuo i (con clave pública (ni , ei ) quiere enviar un mensaje
M ∈ N al individuo j (con clave pública (nj , ej )). Para empezar elige M con gcd(M, nj ) = 1

(es decir, M ≤ nj − 1 y M ∈ (Z/nj Z) ). En caso de que no sea ası́, el individuo i trocea M en
varias partes, cada una de las cuales es menor que nj − 1 y es unidad. Proceden como sigue:
i) El emisor i del mensaje procede como sigue :
• Calcula el criptograma C := M ej (mod nj ) y lo expone públicamente. Manda un
mensaje al individuo j indicándole que le ha dejado un mensaje. Todo el mundo
puede leer el Criptograma C y todos saben que es para el individuo j de parte de
i.
Prueba que el individuo i puede escribir el criptograma C con el sólo conocimiento de
su mensaje y la clave pública del individuo j.

ii) El receptor j del mensaje procede como sigue:


• Calcula el criptograma C 0 := C dj (mod nj ) y lee el mensaje.
Prueba que el receptor j puede hallar C 0 y que recupera el mensaje original M de i,
es decir, prueba que
C 0 = M mod nj .
Problema 109. Usando en sistema criptográfico de clave pública RSA anterior, con varios
usuarios
{(ni , ei ) : i ∈ I},
de tal modo que cada usuario y sólo cada usuario, conoce su clave privada di . Supongamos
que tres individuos i, j, k realizan las tareas siguientes: i envı́a a j el mensaje M siguiendo el
procedimiento anterior. El individuo k puede ver:
• Las claves públicas de i y j : (ni , ei ), (nj , ej ).
• El criptoograma C publicado por i como mensaje a j.
104 2. PRIMOS Y MAXIMALES

Intenta definir el procedimiento algorı́tmico que debe seguir el individuo k para descrifrar en
mensaje M a partir de esta información. Deduce si es fácil o difı́cil factorizar números enteros.
Explica el error que se produce cuando, en los algoritmos escolares, se ensea a clacular el
máximo común divisor de dos números enteros. Busca en wikipedia algunos de los sistemas de
comunicación segura basados en RSA (ssh, PGP, SSL/TLS, S/MIME). Resume lo que entiendas
sobre estos protocolos.
Problema 110 (Autentificación y Firma Digital). De nuevo supongamos una read formada
por individuos de los que se conocen sus claves públicas:
{(ni , ei ) : i ∈ I}.
Los individuos quieren enviarse mensaje encriptados con la conidicón de que el receptor pueda
verificar que el emisor es el individuo previsto y no otro individuo de la red
haciéonse pasar por él.

El individuo i de clave (ni , ei ) quiere enviar un mensaje M cifrado y firmado al individuo j (de
clave (nj , ej )). Procede como sigue:
• Calcula la siguiente cntidad que sólo él conoce porque s’olo es conoce su clave privada
propia di :
C1 := M di mod ni .
• Calcula:
e
C2 := C1 j mod nj .
y lo hace público a toda la red.
El individuo j puede recuperar la información oroginal sin conocer la clave pribada di del emisor.
Además, puede estar seguro de que esa informaciń viene “firmada” por el individuo i. Procede
como sigue:
• El individuo j debe calcular:
d
C3 := C2 j mod nj ,
y lo puede conocer porque C2 es público y dj es su clave privada que sólo j conoce.
• Posteriormente el individuo j calcula:
C4 := C3ei mod ni .
Verifica que el individuo j puede calcular C4 y que se verifica:
M = C4 mod ni .
Explica por qué ese mensaje de i para j viene firmado por i con su clave digital (privada).
Problema 111. Un sistema de clave pública es seguro por la razón siguiente: En un sistema
basado en “libro de claves”, basta con que un miembro externo a un red {ci : i ∈ I} sobe el
libro de claves de uno de los mirmbos ci de la red para disponer de toda la información que
los miembros de la red están distribuyendo unos a otros. Es el fallo de sistemas tipo la famosa
máquina Enigma (busca n internet). En cambio en sistema de clave pública (tipo RSA) este
problema no se produce: si alguien roba la clave privada de un miembro, sólo podrá descrifrar
la información que emita el individuo robado, pero no podrá disponer de otra información
circulando en esa red y que no onvlucre al individuo robado. Explica la razón.

2.2. Ideales Primos, Maximales


2.2.1. Ideales Primos y Maximales.
Definición 48 (Ideales Primos y Maximales). Sea R un anillo:
i) Un ideal p ⊆
/ R, se llama primo si el anillo cociente R/p es un dominio de integridad.
Denotaremos por Spec(R) al conjunto de todos los ideales primos del anillo R y lo
denominaremos espectro primo de R.
ii) Un ideal m ⊆ / R, se llama maximal si el anillo cociente R/m es un cuerpo. Deno-
taremos por Spm(R) al conjunto de todos los ideales maximales del anillo R y lo
denominaremos espectro maximal de R.
2.2. IDEALES PRIMOS, MAXIMALES 105

Ejemplo 2.2.1. i) Un ideal R es dominio de integridad si y solamente si (0) ∈ Spec(R).


ii) Todo ideal maximal es obviamente primo (y tenemos Spm(R) ⊆ Spec(R)), pero el
recı́proco no es cierto en general. Ası́, (0) ∈ Spec(Z) \ Spm(Z) 6= ∅.
iii) Obviamente si K es un cuerpo Spec(K) = Spm(K) = {(0)} y está definido por un
único elemento.
iv) En un dominio de ideales principales, un ideal p = (p) es un ideal primo si y solamente
si el generador p es un elemento primo o, equivalentemente, irreducible.
v) En un dominio de ideales principales, los ideales maximales son los ideales primos no
nulos.
vi) Los anillos para los cuales Spm(R) = Spec(R) se denominan anillos de dimensión
cero y si verifican ciertas condiciones de cadena, los llamaremos Anillos de Artin
(pero esto corresponde a Capı́tulos más avanzados del curso).
vii) Los conjuntos Spec(R) y Spm(R) son conjuntos parcialmente ordenados con respecto
a la inclusión ⊆.

Proposición 2.2.2. Las siguientes son caracterizaciones alternativas de ideales primos y max-
imales en un anillo R:
• Un ideal p ⊆
/ R es primo si verifica:

∀x, y ∈ R, xy ∈ p =⇒ (x ∈ p) ∨ (y ∈ p).
• Un ideal m ⊆/ R es maximal si y solamente si es maximal en el conjunto de los ideales
a⊆/ R ordenados por la inclusión. Es decir m ⊆/ R es maximal si y solamente si para
cualquier ideal a de R, tal que a ⊆/ R, se tiene
m ⊆ a =⇒ m = a.
Demostración. Para la primera de las afirmaciones obsérvese que xy ∈ p es equivalente
a
(x + p)(y + p) = 0, en R/p,
mientras que x ∈ p e y ∈ p son respectivamente equivalentes a
x + p = 0, y + p = 0, en R/p.
Con estas observaciones es clara la equivalencia entre las afirmaciones R/p es dominio de in-
tegridad y la descrita en la primera de las afirmaciones de esta proposición. Para la segunda
afirmación, recordemos que R/m es un cuerpo si y solamente si sus únicos ideales son (0) y R/m
y que los ideales del anillo cociente R/m están en biyección con los ideales de R que contienen
a m. Por tanto, R/m es un cuerpo si y solamente si para cualquier ideal a ⊆ / R, tal que m ⊆ a
se ha de tener
(a/m = (0)) ∨ (a/m = R/m) .
Como, para todo ideal a ⊆ / R, se ha de tener a/m 6= R/m, concluimos la equivalencia entre
ambas caracterizaciones. 

Corollario 2.2.3. Sea R un dominio de ideales principales, entonces


Spm(R) := {(p) : p es irreducible y p 6= 0}.
Es decir, los maximales en los dominios de ideales principales son los ideales primos no nulos
o, equivalentemente, los generados por elementos irreducibles.
Demostración. El resultado es consecuencia inmediata del Teorema 2.1.10. Lo que vamos
a hacer es dar una demostración equivalente, pero descriptiva en términos de ideales maximales.
Supongamos que p 6= 0 es un elemento irreducible de un dominio de ideales principales y sea
m := (p) el ideal que genera. Supongamos a un ideal propio de R tal que
m ⊆ a ( (1) = R.
Entonces, a = (a) por ser R un dominio de ideales principales y a | p. Como p es irreducible
concluiremos que o bien a ∈ R∗ (lo que no es el caso porque (a) = a ( R) o bien a ∼ p (i.e.
son asociados) con lo que (p) = (a) o, equivalentemente, m = a y tenemos la maximalidad de
m. Recı́procamente, si m ∈ Spm(R) es un ideal maximal de R y dado que R es dominio de
ideales principales, existe q ∈ R tal que m = (q). Veamos que q es necesariamente irreducible.
106 2. PRIMOS Y MAXIMALES

Porque si x | q, entonces, si x 6∈ R∗ (i.e. x no es unidad), entonces, tenemos m ⊆ (x) ( R, la


maximalidad de m nos indica que m = (x) lo que implica que q ∼ x y hemos probado que q es
irreducible. Dado que los ideales maximales son primos, todo elemento irreducible no nulo es
primo por generar un ideal primo. 

Corollario 2.2.4. Si a ⊆
/ R es un ideal de un anillo R, podemos observar:
i) Los ideales primos del anillo cociente R/a está biyectivamente identificados con los
ideales primos de Spec(R) que contienen al ideal a, mediante la transformación
p 7−→ p/a.
En particular, se tiene:
Spec(R/a) := {p/a : p ⊇ a, p ∈ Spec(R)}.
ii) Los ideales maximales del anillo cociente R/a está biyectivamente identificados con los
ideales maximales de Spm(R) que contienen al ideal a, mediante la transformación
p 7−→ p/a.
En particular, se tiene:
Spm(R/a) := {p/a : p ⊇ a, p ∈ Spm(R)}.
Demostración. Retomamos la Observación 1.4.29 y los Teoremas de Isomorfı́a. A partir
de los Teoremas de Isomorfı́a, tenemos para cada ideal b ⊆
/ R de R que cotiene a a el ideal del
anillo cociente b/a dado mediante:
b/a := {x + a : x ∈ b}.
Además, tenemos el isomorfismo de anillos:
 
R/a
/b/a −→ R/b,

dado mediante:
(x + a) + (b/a) 7−→ x + b.
Por tanto, se tiene:
 
R/a
• R/b es dominio de integridad si y solamente si /b/a es dominio de integridad.
Traducido, esto significa b ∈ Spec(R)

si y solamente si b/a ∈ Spec(R/a.
R/a 
• R/b es cuerpo si y solamente si / b/a es cuerpo. Traducido, esto significa
b ∈ Spm(R) si y solamente si b/a ∈ Spm(R/a.
La identificación entre los ideales de R/a y los ideales en R que contienen a a ya fue discutida
en la Observación 1.4.29, lo que completa la demostración. 

Recordemos de la Proposición 1.3.5 la noción de contracción de un ideal a través de un morfismo


de anillos.
Proposición 2.2.5 (Contracción de primos y maximales). Sea f : R −→ T un morfismo
de anillos y q ∈ Spec(T ) un ideal primo de T . Entonces, la contracción qc := f −1 (q es un ideal
primo de R. Lo mismo no sucede si reemplazamos primos por maximales.
Demostración. Consideremos f : R −→ T y la componemos con la proyección π : T −→
T /q y tendremos el morfismo de anillos:
π ◦ f : R −→ T /q.
Usando el primer Teorema de Isomorfı́a (Teorema 1.4.27), tendremos una aplicación inyectiva
(y morfismo de anillos):
ϕ : R/ker(π ◦ f ) −→ T /q.
Con lo que R/ker(π ◦f ) está indentificado con un subanillo de T /q. Además, como q es un ideal
primo de T , el cociente T /q es un dominio de integridad y también son dominios de integridad
2.2. IDEALES PRIMOS, MAXIMALES 107

todos sus subanillos. En particular, R/ker(π ◦ f ) es un dominio de integridad. Lo único que


falta para probar el enunciado es probar la siguiente igualdad:
−1
ker(π ◦ f ) = (π ◦ f ) ((0)) = f −1 (ker(π)) = f −1 (q) = qc .
Para el caso de los ideales maximales baste con considerar le inclusión i : Z −→ Q y observar
que (0) ∈ Spm(Q), mientras que (0) = i−1 ((0)) no es ideal maximal en Z. 
El enunciado que sigue es el único caso en el que utilizaremos el Lema de Zorn en estas notas.
En todo caso, para aquellos anillos que interesan en este curso (los anillos noetherianos) el
enunciado se puede probar sin el Lema de Zorn, aunque con una versión más débil.
Recuérdese que un conjunto parcialmente ordenado (T, ≤) se denomina cadena si la relación
de orden ≤ es una relación de orden total. Dado un conjunto parcialmente ordenado (S, ≤)
llamaremos cadena en (S, ≤) a todo subconjunto T ⊆ S tal que con la relación de orden
inducida por la de S, se tenga que (T, ≤) es una cadena. El axioma de Zorn se enuncia del
modo siguiente:

Definición 49 (Lema de Zorn). Sea (S, ≤) un conjunto parcialmente ordenado. Si, para
toda cadena T ⊆ S existe cota superior en (S, ≤), entonces, existe elemento maximal en (S, ≤).

Se tiene:
Proposición 2.2.6. Asumiendo el Lema de Zorn, todo anillo R posee al menos un ideal max-
imal (i.e. Spm(R) 6= ∅).
Demostración. Para demostrarlo, consideremos el conjunto I(R) de todos los ideales
a ⊆/ R. Ordenemos I(R) con la inclusión y tendremos el conjunto parcialmente ordenado
(I(R), ⊆).
Sea (T ⊆ I(R) una cadena en (I(R), ⊆). Supongamos
T := {ai : i ∈ I}.
Entonces, se puede comprobar fácilmente que se verifica:
S
• El conjunto a := i∈I ai es un ideal de R. Para ello, obsérvese que si x, y ∈ a, entonces
existen i, j ∈ I tales que x ∈ ai , y ∈ aj . Por ser T cadena tendremos ai ⊆ aj o aj ⊆ ai .
En el primer caso, x, y ∈ aj o, en el segundo, x, y ∈ ai . Por ser ai y aj ideales, ésto
implica que, en el primer caso, x + y ∈ aj ⊆ a o, en el segundo caso, x + y ∈ ai ⊆ a.
En cualquier caso, x + y ∈ a. Con mayor facilidad se probarı́a que ∀x ∈ R, ∀y ∈ a, se
ha de tener xy ∈ a.
• 1 6∈ a. Esto es más simple, dado que ai ∈ I(R), tenemos 1 6∈ ai , para todo i ∈ I, con
lo que 1 6∈ a y habremos terminado.
Es claro, además, que a es una cota superior de T en I(R). En consecuencia, aplicando el Lema
de Zorn, debe existir un elemento maximal en I(R) y por lo antedicho, ese elemento maximal
está en Spm(R). 

Corollario 2.2.7. Asumiendo el Lema de Zorn, si a ⊆/ R es un ideal de R, entonces, existe


un ideal maximal m ∈ Spm(R), tal que a ⊆ m. Adicionalmente, existirá p ∈ Spec(R) tal que
a ⊆ m.
Demostración. A partir de la Observación 1.4.29, tenemos que los ideales del anillo
cociente R/a están identificados con los ideales de R que contienen a a. Además, el corolario
2.2.4 anterior identifica los maximales del coeciente R/a con los maximales de R que contienen
a a. En consecuencia, si R/a tiene al gún maximal es de la forma m/a, siendo m ∈ Spm(R)
y m ⊇ a. Ası́, la Proposición anterior, que asume el Lema de Zorn, implica la existencia de
ideales maximales que contienen al ideal a. 

Corollario 2.2.8. Con las mismas hipótesis, si R es un anillo, sus unidades son los elementos
que no pertenecen a ningún ideal maximal. Es decir,
 
\ [
R∗ := (R \ m) = R \  m .
m∈Spm(R) m∈Spm(R)
108 2. PRIMOS Y MAXIMALES

Demostración. Si un elemento x ∈ R no es unidad, entonces, el ideal (x) que genera


satisface (x) ⊆
/ R. Existirá un maximal m ⊇ (x) y, por tanto, x ∈ m. Recı́procamente, si x ∈ m,
con m ∈ Spm(R), entonces x 6∈ R∗ . Pues si x fuera unidad en R, tendrı́amos que existe x0 ∈ R,
tal que x0 x = 1 y, en particular, concluirı́amos
1 = x0 x ∈ m = R,
contradiciendo el hecho m ⊆
/ R. 

2.2.2. La noción de rango de un R−módulo libre. En el Capı́tulo anterior (ver, por


ejemplo, la Definición 33) hemos usado la expresión R−módulo libre de rango finito. Pero, en
realidad, no hemos definido que es el rango. Pasamos a analizarlo ahora. Supondremos que los
alumnos ya conocen pruebas del siguiente enunciado que, en general, asumen el Lema de Zorn.
Nosotros lo asumiremos igualmente en esta discusión:
Teorema 2.2.9 (Teorema de la dimensión). Sea K un cuerpo, sea V un espacio vectorial.
Entonces,
i) V posee una base como espacio vectorial.
ii) Dadas β1 y β1 dos bases de V como K−espacio vectorial. Entonces β1 y β2 son
conjuntos biyectables.
Al cardinal de cualquiera de sus bases, lo llamaremos dimensión de V sobre K.

Observación 2.2.10 (Axioma de Elección y Existencia de Bases). Debe señalarse el


detalle del Axioma de Elección en este enunciado. En 1984, A. Blass demostró que con la
axiomática de Zermelo-Frenkel, el Axioma de Elección es equivalente a la existencia de base para
cualquier espcaio vectorial de cualquier dimensión. Ver la referencia más abajo 2. Recuérdese
que el Axioma de Elección significa que el Producto Cartesiando de conjuntos no vacı́os es no
vacı́o o, equivalentemente,
Dada una familia de conjuntos
Q no vacı́os {Si : i ∈ I} existe un elemento en el producto
cartesiano (xi ) : i ∈ I ∈ i∈I Si .
Observación 2.2.11 (Lema de Zorn e Igualdad de los cardinales de las bases). Es
probable que los alumnos hayan visto este enunciado sólo en el caso de dimensión finita (Teorema
del Reemplazamiento). Para la dimensión infinita se necesita algo más sofisticado, incluyendo
el Lema de Zorn, la tricotomı́a de los cardinales (i.e. que todos los cardinales son comparables)
y el Ultrafilter Lemma como axiomas adicionales de la Teorı́a de Conjuntos (ZFA o similares).
Por eso, a partir de este punto supondremos que el resultado es aceptado y se desarrolla en
función del caso que conozcan. H. Läuchli 3 mostró un ejemplo de axiomática de ZFA con un
espacio vectorial que posee dos bases de distinto cardinal.

Recomendamos al lector revisar la noción de base de un R−módulo introducida en la Definición


32. Recuérdese también la noción de R−módulo libre y sus propiedades elementales discutidas
en la Proposición 1.4.22.
Ejemplo 2.2.12. i) Si M es un R−módulo libre de rango finito, entonces existe n ∈ N
tal que M es isomorfo a algún Rn . Queda por probar que Rn no es isomorfo a Rm
cuando m 6= n.
ii) El R−módulo R[X1 , . . . , Xn ] tiene por base el conjunto de todos los monomios
{X µ : µ ∈ Nn },
iii) El R−módulo de los polinomios homogéos en n variables y de grado d tiene por base
{X µ : µ = (µ1 , . . . , µn ) ∈ Nn , |µ| = µ1 + · · · + µn = d},
que es un conjunto de cardinal d+n−1
n−1 .
iv) El R−módulo de las matrices Mn×m (R) posee una base de cardinal nm.

2A. Blass, Existence of Basis Implies the Axiom of Choice. Contemporary Mathematics 31 (1984) 31-33.
3H. Läuchli, Auswahlaxiom in der Algebra, Commentarii Mathematici Helvetici, 37 (1962-1963), 1-18.
2.2. IDEALES PRIMOS, MAXIMALES 109

Lema 2.2.13. Sea R un anillo, m ∈ Spm(R) un ideal maximal, sea k(m) el cuerpo R/m y con-
sideremos la estructura de k(m)−espacio vectorial inducida en M/mM conforme a lo indicado
en el Problema 52. Sea β := {mi : i ∈ I} un subconjunto de M y denotemos por β/m al
subconjunto de M/mM dado mediante:
β/m := {mi + mM : i ∈ I}.
Si β es una base de M como R−módulo libre, entonces β/m es una base de M/mM como
k(m)−espacio vectorial. En particular, si β es base, los cardinales de β y β/m coinciden.
Demostración. Comencemos probando que si β es base de M como R−módulo, entonces
β y β/m son biyectables. Para ello, definamos la aplicación:
Φ: β −→ β/m
mi 7−→ mi + mM.
Por definición de β/m esta aplicación es suprayectiva. Veamos que es inyectiva. Ası́, dados
mi , mj ∈ β, con mi 6= mj , tales que Φ(mi ) = Φ(mj ). Entonces,
mi − mj ∈ mM.
Como β es un sistema generador de M , existirán J ⊆ I finito y {λi ∈ m : i ∈ J} tales que
X
mi − mj = λk mk .
k∈J

O, equivalentemente, X
mi − mj + (−λk )mk = 0.
k∈J
Como β es una familia linealmente independiente, tiene que darse i, j ∈ J. Si no fuera ası́, por
ejemplo si i 6∈ J, la anterior identidad mostrarı́a una combinación lineal finita, igualada a 0, en
la que no todos los coeficientes en R son nulos (porque 1 6= 0). Por tanto, debe darse i, j ∈ J
con lo que queda una identidad de la forma:
X
(1 − λi )mi + (1 − λj )mj + λk mk = 0.
k∈J\{i,j}

Pero como β es base, concluiremos que necesariamente ha de darse:


(1 − λi ) = 0, (1 − λj ) = 0, λk = 0, ∀k ∈ J.
En particular tendrı́amos 1 = λi ∈ m y m $ R es un ideal maximal y propio, con lo que
llegarı́amos a contradiccón. Por tanto Φ es biyectiva y los cardinales verifican:
](β) = ](β/m).
Veamos ahora que, si β es base de M como R−módulo, entonces β/m es base de M/mM como
k(m)−espacio vectorial.
Para empezar veamos que es sistema generador.
Dado m + mM ∈ M/mM un elemento cualquiera, como m ∈ M , y β es sistema generador,
sabemos que existe un conjunto finito J ⊆ I y un subconjunto {λi ∈ R : i ∈ J} tal que
X
m= λi mi .
i∈J

Tomando clases módulo mM , tendremos:


X
m + mM = (λi + m)(mi + mM ).
i∈J

Como λi + m ∈ k(m) y J es finito, concluiremos que para cualquier m + mM ∈ M/mM está


en el subespacio generador por β/m y, por tanto, este conjunto es generador de M/mM como
k(m)−espacio vectorial.
En cuanto a ser sistema linealmente independiente, la prueba es análoga a la del caso de dos
elementos. Es decir, supongamos que existe J ⊆ I y existen {λi ∈ R : i ∈ J} tales que
X
(λi + m)(mi + mM ) = 0 + mM, en M/mM .
i∈J
110 2. PRIMOS Y MAXIMALES

Es decir, X
λi mi ∈ mM.
i∈J
Por tanto, existirá otro conjunto finito T ⊆ I y constantes {θk ∈ m : k ∈ T } tales que
X X
λi mi = θk mk .
i∈J k∈T

Esta identidad se transforma en la siguiente:


X X X
(λi − θk )mk + λi mi + (−θk )mk = 0.
i∈J∩T i∈J\T k∈T \K

Concluiremos que
i) Para cada i ∈ J ∩ T , λi = θi ∈ m. Luego λi + m = 0 + m, para todo i ∈ J ∩ T .
ii) Para cada i ∈ J \ T , λi = 0. Luego λi + m = 0 + m, para todo i ∈ J \ T .
iii) Para cada k ∈ T \ J, θk = 0.
Habremos concluido que λi +m = 0, para todo i ∈ J y, por tanto, β/m es un sistema de vectores
linealmente independientes en el k(m)− espacio vectorial M/mM . 

Corollario 2.2.14. Dos bases de un R−módulo libre tienen el mismo cardinal. En particular
Rn es isomorfo a Rm si y solamente si n = m. Un módulo es de rango finito n si y solamente
si es isomorfo a Rn .
Demostración. Son consecuencia inmediata del Lema previo. 

Corollario 2.2.15. Si un R−módulo M es libre de rango n, y m ∈ Spm(R) es un ideal primo


n
de R, entonces M/mM es isomorfo como R/m− espacio vectorial a (A/m) .
Demostración. Obvio. 

Ejemplo 2.2.16. Sea K un cuerpo y sea f ∈ K[X] un polinomio no nulo. Entonces, el anillo
cociente K[X]/(f ) no es un K[X]−módulo libre. Simplemente porque todo K[X]−módulo libre
tiene que teneer dmensión infinita como espacio vectorial sobre K, mientras que K[X]/(f ) es
un K−espacio vectorial finitamente generado.

Proposición 2.2.17. Sea M y N dos R−módulos libres de rangos respectivos m y n. Entonces,


existe un isomorfismo de R−módulos entre HomR (M, N ) y Mn×m (R). En particular, cuando
M y N son R−módulos libres de rango finito, HomR (M, N ) también lo es y su rango coincide
con rankR (M ) rankR (N ).
Demostración. Sin pérdida de la generalidad podemos suponer que M = Rm y N = Rn .
Podemos, además, fijar dos bases ordenadas β1 en M y β2 en N . Sin pérdida de la generalidad,
podemos suponer que son las llamadas bases canónicas. Ahora, para cada ϕ ∈ HomR (M, N ),
definamos la matrix M (ϕ) ∈ Mn×m (R) cuyas columnas sean las imágenes (en Rn ) de los
elementos de la base β1 . M (ϕ) es una matriz con n filas y m columnas. Queda como ejercicio
comprobar que M : HomR (M, N ) −→ Mn×m (R) es un isomorfismo de R−módulos. Es el
mismo argumento obvio ya hecho en el caso del Álgebra Lineal. 
2.2.3. Libres de Torsión sobre Dominios de Ideales Principales. Comencemos
recordando los módulos finitamente generados y el caso particular de los R−módulos finita-
mente generados sobre dominios de ideales principales en esta Proposición.
Proposición 2.2.18. Sea R un dominio de ideales principales y M un R−módulo finitamente
generado. Entonces, todos los submódulos de M son finitamente generados.
Demostración. Demostraremos el resultado por inducción en el número mı́nimo de gen-
eradores de M (recordar la Observación 1.4.12). Ası́, denotemos por n(M ) el número mı́nimo
de generadores de M sobre R.
2.2. IDEALES PRIMOS, MAXIMALES 111

En el caso n(M ) = 1, tenemos que M está generador por un conjunto formado por un único
elemento. Esto es, tenemos Rha1 i. Ahora considero el siguiente morfismo de R−módulos:
π: R −→ M
x 7−→ xa.
Es evidente que π es suprayectiva (porque {a1 } genera M ). Sea a := ker(π) el núcleo de π
que es un submódulo de R (y, por tanto, un ideal de R). Por el Primer Teorema de Isomorfı́a
(ver la Subsección 1.4.1) tendremos un isomorfismo de R−módulos entre R/a y M . Por ese
isomorfismo, los submódulos de M son los submódulos de R/a que son los ideales de R/a. Por
la observación 1.4.29, los ideales de R/a) son los ideales de R que contienen a a y, como R es
dominio de ideales principales, sus ideales son principales y los ideales de R/a son de la forma
Rhx + ai donde x ∈ R. En particular, los submódulos de M están generados por, a lo sumo,
un sólo elemento y son finitamente generados.

En el caso n(M ) = n > 1, consideremos un sistema minimal de generadores de M β :=


{a1 , . . . , an}. Consideremos el submódulo M1 de M generado por {a2 , . . . , an }, es decir
M1 := Rha2 , . . . , an i.
Se tiene que M1 es finitamente generado y n(M1 ) ≤ n − 1 y, aplicando la hipótesis inductiva,
todo submódulo de M1 es finitamente generado. En particular, N ∩ M1 es finitamente generado
y puedo suponer:
N ∩ M1 := Rhc1 , . . . , cr i,
donde {c1 , . . . , cr } ⊆ N . De otro lado, consideremos el siguiente morfismo de R−módulos:
π: M −→ M/M1
x 7−→ x + M1 .
El morfismo π es suprayectivo y es fácil ver que
M/M1 := Rha1 + M1 i,
siendo n(M/M1 ) ≤ 1. Por lo discutido en el caso 1 anterior, todo submódulo de M/M1 estará
generador por un sólo elemento. Ahora consideremos la restricción
π |N : N −→ M/M1 .
Entonces, π |N (N ) = π(N ) = Rhb1 + M1 i está generado por un sólo elemento b1 + M1 , con
b1 ∈ N .

Considero el conjunto
β 0 := {c1 , . . . , cr } ∪ {b1 },
Y probemos que
N = Rhβ 0 i,
con lo que habrı́amos probado que N es finitamente generado.
Para ver esta igualdad, comencemos observando que c1 , . . . , cr ∈ N ∩ M1 ⊆ N y b1 ∈ N , con lo
cual β 0 ⊆ N y como Rhβ 0 i es el menor submódulo que contiene a β 0 , tendremos una primera
inclusión Rhβ 0 i ⊆ N .

Para la otra inclusión, consideremos m ∈ N un elemento cualquiera. Consideremos su imagen


π(m) = m + M1 ∈ π(N ) ⊆ M/M1 .
Entonces, existirá λ ∈ R tal que
π(m) = m + M1 = λb1 + M1 ,
o, equivalentemente,
m − λb1 ∈ M1 .
Como m ∈ N y b1 ∈ N , se tiene, en realidad,
m − λb1 ∈ M1 ∩ N.
112 2. PRIMOS Y MAXIMALES

Por tanto, como M1 ∩ N = Rhc1 , . . . , cr i, existirán θ1 , . . . , θr ∈ R tales que


r
X
m − λb1 = θ i ci ,
i=1
y, por tanto,
r
X
m = (−λ)b1 + θi ci ∈ Rhβ 0 i,
i=1
con lo que habremos probado N ⊆ Rhβ 0 i y R es finitamente generado. 
Corollario 2.2.19. Si R es un dominio de ideales principales, todo R−módulo finitamente
generado es el co-núcleo de un morfismo entre módulos libres. Es decir, existe una matriz
A ∈ Mm×n (R) que define un morfismo de R−módulos
ϕA : Rn −→ Rm ,
(x1 , . . . , xn ) 7−→ ϕA (x1 , . . . , xn ) := (y1 , . . . , ym ),
dado mediante:
   
y1 x1
 y2   x2 
ϕA (x1 , . . . , xn ) = (y1 , . . . , ym ) ⇐⇒   = A .
   
.. ..
 .   . 
ym xn
De tal modo que M es el co-núcleo de ϕA , esto es,
M= ∼ Rm / Im(ϕA ).

Demostración. Por ser M finitamente generado, existe un epimorfismo π : Rm −→ M


de R−módulos. Por el Primer Teorema de Isomorfı́a, tendremos que
M=∼ Rm /K, K = ker(π).
Como K es un submódulo de Rn , existe, a su vez, un R−módulo libre de rango finito Rn y
un morfismo suprayectivo de R−módulos ψ : Rn −→ K. Obviamente, ψ puede verso como un
morfismo entre R−módulos libres ψ : Rn −→ Rm , tal que su imagen verifica Im(ψ) = K =
ker(π). Entonces, M es el co-núcleo de ψ. Ahora, aplicando la Proposición 2.2.17, tenemos que
necesariamente ψ ha de ser de la forma ϕA para alguna matriz A ∈ Mm×n (R). 

Definición 50 (Elemento de torsión). Sea M un R−módulo. Un elemento m ∈ M se


denomina elemento de torsión si existe λ ∈ R, no nulo (i.e. λ 6= 0) tal que λm = 0 en M .
Denotaremos por
AnnR (m) := {λ ∈ R : λm = 0}.
Es un ideal de R (llamado el anulador de m) y se verifica AnnR (m) 6= (0) si y solamente si m
es un elemento de torsión.
Denotaremos por T orR (M ) al conjunto de los elementos de torsión de M .
Un módulo que no posee elementos de torsión no nulos se denomina R−módulo libre de torsión.

Observación 2.2.20. Si R es un dominio de integridad, el conjunto T orR (M ) es un submódulo


de M . En general, si R no es dominio de integridad, T orR (M ) no necesariamente es submódulo.
La razón es que, en ese caso, puede no ser subgrupo para la suma. Por ejemplo, si R := Z/6Z
y si M = Z/6Z, los elementos de torsión son los divisores de cero de Z/6Z que es dado como
la unión de los ideales (2Z/6Z) ∪ (3Z/6Z). Y claramente, (2 + 6Z) + (3 + 6Z) = 5 + 6Z no es
elemento de torsión porque es unidad en el anillo. En general, si R es un anillo y M = R es
visto como R−módulo sobre sı́ mismo, los elementos de torsión de M son, precisamente, los
divisores de cero de R. Por eso, en general, a los elementos de torsión se les denomina también
divisores de cero del R−módulo. Conservaremos nuestra terminologı́a con T orR (M ) porque nos
ocuparemos, en este Capı́tulo, solamente del caso de anillos R que son dominios de integridad.
Proposición 2.2.21. Sea R un dominio de integridad y M un R−módulo libre. Entonces M
es libre de torsión.
2.2. IDEALES PRIMOS, MAXIMALES 113

Demostración. Como M es libre posee una base β := {mi : i ∈ I}. Si m ∈ M fuera un


elemento no nulo y de torsión, tendrı́amos que existe J ⊆ I un conjunto finito y {λj : j ∈ J}
tales que X
m= λj mj .
j∈J
Como m 6= 0, J es no vacı́o y algunos de los λj han de ser no nulos. De hecho, podemos suponer
que todos son no nulos (i.e. podemos suponer que λj 6= 0, ∀i ∈ J 6= ∅).
Como m es un elemento de torsión, existe λ ∈ R, λ 6= 0, tal que se verifica:
 
X X
0 = λm = λ  λj mj  = (λλj ) mj .
j∈J j∈J

Pero como β es base, entonces debemos tener:


λλj = 0, λj 6= 0, ∀j ∈ J.
Como R es un dominio de integridad, entonces se tiene que producir λ = 0 y habremos llegado
a contradicción. 
Ejemplo 2.2.22. Se tienen los siguientes ejemplos:
i) Todo R−módulo de la forma Rn es libre de torsión cuando R es dominio. Por ejemplo,
Zm es Z−módulo libre de torsión, K[X]n es un K[X]−módulo libre de torsión.
ii) Si R es un dominio, R[X1 , . . . , Xn ] es un R−módulo libre de torsión. Lo mismo se
puede decir de Hd (X1 , . . . , Xn ).
iii) Todos los grupos cı́clicos finitos poseen elementos de torsión no nulos. Por ejemplo,
todos los Z−módulos de la forma Z/mZ, con m ∈ N, m ≥ 2.
iv) La existencia de elementos de torsión no nulos depende del anillo y no solamente
del conjunto de elementos de M . Nótese que los Z/mZ−módulos (Z/mZ)n son
Z−módulos que poseen elementos de torsión no nulos, pero, si p ∈ N es primo, los
Z/pZ−módulos (Z/pZ)n son Z/pZ−espacio vectoriales y son libres de torsión como
Z/pZ−módulos. En cambio, si m ∈ N es no primo, los Z/mZ−módulos (Z/mZ)n
también poseen elementos de torsión como Z/mZ−módulos. Por ejemplo, el elemento
(2 + 6Z, 0 + Z/6Z) en (Z/6Z)2 es un elemento de torsión no nulo sobre Z/6Z, dado
que
AnnZ/6Z ((2 + Z/6Z, 0 + Z/6Z)) = (3 + Z/6Z) ⊆ Z/6Z.
v) Argumentos similares al apartado anterior pueden construirse cuando se tratan módulos
sobre K[X].
Vamos a proceder a caracterizar la condición de ser libre de torsión en el caso de R−módulos
libres finitamente generados sobre un dominio de ideales principales en las páginas siguientes.
Lema 2.2.23. Todo módulo libre finitamente generado es proyectivo. Es decir, dado un epi-
morfismo de R−módulos f : M −→ F tal que F es R−módulo libre y finitamente generado,
entonces, existe g : F −→ M un morfismo de R−módulos tal que f ◦ g = IdF .
Demostración. Supongamos que {e1 , . . . , es } es una base de F como R−módulo libre.
Entonces, existen m1 , . . . , ms ∈ M tales que f (ei ) = mi , para cada i, 1 ≤ i ≤ s. Definamos
g: F −→ M
x1 e1 + · · · + xs es 7−→ x1 m1 + · · · + xs ms .
Es fácil verificar que g es un morfismo de R−módulos y que verifica la condición indicada. 
Teorema 2.2.24. Si R es un dominio de ideales principales, todo submódulo de un R−módulo
libre y finitamente generado es libre. Más aún, si M es un R−ódulo libre de rango finito y si
F es un submódulo de M , entonces F es libre de rango finito y satisface:
rankR (F ) ≤ rankR (M ).
Demostración. Bastará con que hagamos el caso M = Rn . Supongamos que N es un
submódulo de Rn y demostremos, por inducción en n, que N es un R−módulo libre. Para
ello, recordemos que en el caso n = 1, los submódulos de R son los ideales del anillo R y son
114 2. PRIMOS Y MAXIMALES

principales, luego son libres. Además, como R es un dominio de ideales principales, todo los
ideales de R son principales y, por tanto, su rango est’a acotado por 1.
Supongamos el resultado cierto para n − 1 y veamos el caso n. Comencemos considerando la
proyección canónica π1 : Rn −→ Rn−1 que “olvida” la primera coordenada. Consideremos el
submódulo π1 (N ) ⊆ Rn−1 . Por hipótesis inductiva, π1 (N ) es un R−módulo libre. Por tanto,
tenemos un epimorfismo de R−módulos:
π := π1 |N : N −→ π1 (N ),
dado por la restricción de π1 a N . Como π1 (N ) es libre, es, por tanto, proyectivo, y ha de
existir un morfismo de R−módulos g : π1 (N ) −→ N tal que π ◦ g = Idπ1 (N ) .
Finalmente, definamos la siguiente aplicación, recordando que, en el caso finito, producto y
suma directa coinciden:
f : N −→ π1 (N ) ⊕ ker(π)
n 7−→ (π1 (n), n − g (π1 (n))) .
En primer lugar, veamos que está bien definida, para lo cual sólo tenemos que ver que para
cada n ∈ N , n − g(π1 (n)) ∈ ker(π). Esto es evidente porque
π (n − g (π1 (n))) = π(n) − π (g(π1 (n))) = π(n) − π1 (n) = 0,
porque π ◦ g = Idπ1 (N ) y π = π1 |N .
Ahora observemos que ker(π) = ker(π1 ) ∩ N . Pero ker(π1 ) = R × {0}n−1 por definición de
π1 . Luego ker(π1 ) es un R−módulo libre de rango 1 (por ser isomorfo a R) y N ∩ ker(π1 )
es un submódulo de un R−módulo libre de rango 1. Por lo visto en el caso de rango 1,
ker(π) = ker(π1 ) ∩ N es un R−módulo libre.
Finalmente, es fácil verificar que f es un isomorfismo de R−módulos. Es evidente que es
morfismo. Ahora, si (m1 , m2 ) ∈ π1 (N ) ⊕ ker(π), considero el elemento:
n := g(m1 ) + m2 ∈ N.
Nótese que π(n) = π(g(m1 )) + π(m2 ) = m1 por que π ◦ g = Idπ1 (N ) y π(m2 ) = 0 porque
m2 ∈ ker(π). De otro lado,
n − g (π1 (n)) = (g(m1 ) + m2 ) − g (π1 (n)) = (g(m1 ) + m2 ) − g(m1 ) = m2 .
Por tanto, f es un epimorfismo de R−módulos. En cuanto a la inyectividad,
(0, 0) = f (n) = (π1 (n), n − g (π1 (n))) ,
implica que π(n) = π1 (n) = 0, luego g (π1 (n)) = 0 y, por tanto, n − g (π1 (n)) = n = 0, lo que
implica la inyectividad. Por último, para la prpiedad de los rangos, tenemos que
rankR (N ) = rankR (π(N ) ⊕ ker(π)) = rankR (π(N )) + rankR (ker(π)) .
Ahora es claro que π(N ) es submódulo de Rn−1 y, por hipótesis inductiva, rankR (π(N )) ≤ n−1.
Por su parte, ker(π) es isomorfo a un submódulo de R, con lo qye rankR (ker(ı)) ≤ 1. Con lo
que conluimos que rankR (N )leqn como pretendı́amos. 
Teorema 2.2.25. Sea R un dominio de ideales principales y M un R−módulos finitamente
generado y libre de torsión. Entonces, todo sistema generador de M de cardinal minimal es
base de M .
Es decir, si R es dominio de ideales principales y M es finitamente generado, entonces,
M es libre de torsión ⇐⇒ M es libre
Demostración. Supongamos que S := {e1 , . . . , em } es un conjunto minimal de gener-
adores de M como R−módulo, qu existe porque M es finitamente generado. Dentro de ese con-
junto podemos elegir un subconjunto maximal de elementos linealmente independientes sobre R.
Salvo reordenación de los ı́ndices, podemos suponer que existe s ≤ m tal que S := {e1 , . . . , es }
son un conjunto maximal de elementos de S linealmente independientes sobre R. Sea F el
submódulo que genera S, que es un R−módulo libre. Si s = m, entonces F = M y habremos
terminado.
Supongamos que fuera posible que s < m. Entonces, para cada i, s + 1 ≤ i ≤ m, existe λi ∈ R
no nulo tal que λi ei ∈ F . Basta con ver que {e1 , . . . , es , ei } ha de verificar una combinación
lineal no trivial igualada a cero y que, en esa combinación lineal, el coeficiente de ei ha de ser
2.2. IDEALES PRIMOS, MAXIMALES 115

Qm
no nulo. Definamos Λ := i=s+1 λi ∈ R. Tenemos que Λ 6= 0 en R porque R es un dominio de
integridad. Definamos la aplicación siguiente:
Λ: M −→ F
m 7−→ Λm.
Lo primero que hay que ver es que está bien definida. Ahora bien Λej ∈ F para 1 ≤ j ≤ s
porque ej ∈ F . De otro lado,
 
Y
Λei =  λi  λi ei ∈ F,
k6=i

porque λi ∈ F . Por tanto, está bien definida, es suprayectiva y es fácil verificar que es mrfismo
de R−módulos.
De otro lado, como M es libre de torsión, entonces Λ serı́a inyectiva y, por tanto, un isomorfismo
de R−módulos. En conclusión, M es isomorfo a un R−módulo libre de rango s < m lo que nos
llear´ia a contradicción con la minimalidad de m. 

Ejemplo 2.2.26. Los sigientes ejemplos son también ejemplos donde los módulos lo son sobre
dominios euclı́deos.
i) Los Z−módulos libres de torsión y finitamente generados son los isomorfos a Zn . Todo
submódulo de Zn es libre y de rango finito. Pero el rango del submódulo no es siempre
estrictamente menor que el rango del módulo libre del que partı́amos. Por ejemplo,
3
(2Z) es un Z−módulo libre de rango 3 que es submódulo de Z3 que también es libre
de rango 3, pero no son iguales.
ii) Los K[X]−módulos libres de torsión y finitamente generados son los isormorfos a
K[X]n . Lo mismo se aplica a sus submódulos y al rango.
iii) En el Ejemplo de la Teorı́a del endomorfismo (ver 1.4.3), la estructura de K[X]−módulo
del espacio vectorial V , de dimensión finita sobre K, con respecto a un endomorfismo
ϕ : V −→ V no es la estructura de un K[X]−módulo libre. En particular no es libre
de torsión y todos los elementos v ∈ V poseen anulador no trivial. De hecho, el ideal
AnnK[X] (v) := {p ∈ K[X] : p ·K[X] v = p(ϕ)(v) = 0},
es un ideal principal en K[X] generado por un polinomio que se denomina polinomio
mı́nimo del endomorfismo ϕ con respecto al vector v.

Observación 2.2.27 (Contraejemplos). Las hipótesis del Teorema 2.2.25 precdente son in-
evitables.
i) Sobre dominios de ideales principales, hay módulos libres de torsión que no son libres,
porque no son fintamente generados. A modo de ejemplo, Q es un Z−módulo libre de
torsión. Ahora bien, cuales quiera dos números racionales son linealmente dependi-
entes sobre Z (ver Problema 117). Por tanto, si Q es un Z−módulo libre, la base sólo
puede tener un elemento y Q serı́a libre de rango 1. Pero, entonces, todos los números
racionales tendrı́an el mismo denominador, lo que no es el caso.
ii) Sobre anillos que no son dominios de ideales principales, hay módulos libres de torsión
y finitamente generados que no son libres. El ejemlo más simple es el anillo K[X, Y ]
y el ideal m := (X, Y ). Se trata de un ideal de un dominio de integridad, ası́ que es
un módulo libre de torsión. Es claro, por su definición que es un ideal (y, por tanto,
un módulo) finitamente generado sobre K[X, Y ]. Sin embargo, no es libre. Si fuera
libre, entonces serı́a un ideal principal (ver Problema 118) y ya hemos indicado que m
no es un ideal principal en los Ejemplos 2.1.1.

Teorema 2.2.28. Sea R un dominio de ideales principales. Entonces, todo módulo finitamente
generado M , admite una descomposición de la forma:
M∼ = F (M ) ⊕ T orR (M ),
donde F (M ) es un R−módulo libre de rango finito. El R−módulo libre F (M ) es, además,
isomorfo a M/T orR (M ).
116 2. PRIMOS Y MAXIMALES

Demostración. Para ello, consideremos el R−módulo cociente:


F (M ) := M/T orR (M ).
y veamos que es un R−módulo libre de torsión. Es claro que si m + T orR (M ) 6= 0, entonces m
no es un elemento de torsión. Dado λ ∈ R, si
λ(m + T orR (M )) = 0 + T orR (M ),
entontes λm ∈ T orR (M ). Por tanto, existe θ ∈ R no nulo tal que (θλ)m = 0. Pero si λ 6= 0
y si θ 6= 0, entonces, por ser R un dominio, λθ 6= 0 y, necesariamente, m habrı́a de ser un
elemento de torsión, llegando a contradicción. Como F (M ) es libre de torsión y es finitamente
generado, entonces, F (M ) es un R−módulo libre. Consideremos una base finita de F (M ) como
R−módulo libre:
β := {mi + T orR (M ) : 1 ≤ i ≤ n}.
Y consideremos representantes de los elementos de esa base en M
β1 := {m1 , . . . , mn }.
Observamos que los elementos de β1 son linealmente independientes en M . Si fueran linealmente
dependientes también lo serı́an las clases módulo T orR (M ) que ellos representan. Por tanto,
generan un submódulo N de M que es un R−módulo libre. Probemos:
• El submódulo N de M es isomorfo a F (M ).
• el siguiente es un isomorfismo de R−módulos:
ϕ : N × T orR (M ) −→ M
(x, y) 7−→ x + y.
Es sencillo ver que ϕ es morfismo de R−módulos y que es monomorfismo. Para ver que es
inyectiva baste tomar (x, y) ∈ N × T orR (M ) tales que ϕ(x, y) = x + y = 0. Entonces, y = −x,
luego x ∈ T orR (M ). Pero x es combinación lineal de m1 , . . . , mr , es decir
n
X
x= λi mi ,
i=1

para valores λ1 , . . . , λn ∈ R. Por tanto, tenemos


n
X
λi (mi + T orR (M )) = 0 + T orR (M ).
i=1

Como β es base de F (M ) concluiremos que, necesariamente, λ1 = · · · = λn = 0 y, por tanto,


x = 0 y, en consecuencia, y = 0.
Finalmente, veamos que es suprayectiva. Dado m ∈ M , tomemos la clase m + T orR (M ) y
tendremos que existen λ1 , . . . , λn ∈ R tales que:
n
X
m + T orR (M ) = λi (mi + T orR (M )).
i=1

Tomando
n
X
x= λi mi ∈ N,
i=1
y
n
X
y =m− λi mi ∈ T orR (M ),
i=1

concluiremos que ϕ(x, y) = m ye tenemos que ϕ es epimorfismo, concluyendo la prueba del


enunciado. 

Corollario 2.2.29. Todo grupo abeliano finitamente generado es el cociente de dos Z−módulos
libres de rango finito.
2.2. IDEALES PRIMOS, MAXIMALES 117

Demostración. Recuérdese que un grupo abeliano G se dice finitamente generado si existe


n ∈ N y existe un epimorfismo de grupos
π : Zn −→ G.
Como π es morfismo de grupos abelianos, también se tiene π ∈ HomZ (Zn , G). Consideremos
ahora K = ker(π) ⊆ Zn el núcleo del morfismo π. Ahora, todo submódulo de Zn es un
Z−módulo libre de rango finito. Aplicando el Primer Teorema de Isomorfı́a (Teorema 1.4.27)
tendremos:
G∼= Zn /K.


Corollario 2.2.30 (Estructura de Grupos Abelianos Finitamente Generados (Parte


I)). Sea G un grupo abeliano finitamente generado, entonces, existen r, m ∈ N, G es isomorfo
al producto de grupos abelianos:
Zr × G1 ,
donde G1 es un grupo abeliano finito (i.e. de cardinal finito) igual a m.
Demostración. Por el resultado precedente, como Z es un dominio de ideales principales
y G es un Z−módulo finitamente generado, podemos concluir que
G := F (G) × T orZ (G).
Como F (G) es libre y finitamente generado, entonces F (G) = Zr y nos queda por analizar
solamente T orZ (G) y probar que es un grupo abeliano ded cardinal finito.
Ahora, T orZ (G) es un Z−módulo totalmente de torsión y finitamente generado. Sea {g1 , . . . , gt }
un sistema generador de cardinal minimal de T orZ (G). Definamos:
ϕ: Zt −→ T or (G)
Pt Z
(x1 , . . . , xt ) 7−→ i=1 xi gi .

Claramente, ϕ es un morfismo suprayectivo de Z−módulos y denotemos por K su núcleo. De


otro lado, como g1 , . . . , gt son todo elementos de torsión, para cada i, 1 ≤ i ≤ t, existe mi ∈ N,
mi ≥ 1 tal que mi gi = 0 en G (es decir, mi ∈ AnnZ (gi )). Entonces, es fácil observar que el
siguiente subgrupo libre de Zt está contenido en K:
t
Y
mi Z ⊆ K.
i=1

Por tanto, usando el Primer y el Segundo Teorema de Isomorfı́a, observamos que


 Q 
t t
Z / mi Z
T orZ (G) ∼
= Zt /K ∼
i=1

= / Q
t
 .
K/ i=1 mi Z
Q 
t
Por tanto, T orZ (G) es un cociente del grupo abeliano G0 := Zt / i=1 mi Z , por un subgrupo
suyo. Pero, el grupo G0 es un grupo abeliano de cardinal finito: es un producto de grupos
cı́clicos
Yt
0
G := (Z/mi Z) ,
i=1

luego también es de cardinal finito cualquiera de sus cocientes. Hemos probado ası́ que T orZ (G)
es un grupo abeliano de cardinal (orden) finito. 

Observación 2.2.31. Veremos más adelante que todo grupo abeliano finito es un producto
finito de grupos cı́clicos y por tanto, T orZ (G) es un producto finito de grupos cı́clicos de orden
finito.
118 2. PRIMOS Y MAXIMALES

Corollario 2.2.32. Todo conjunto de soluciones de un sistema lineal de ecuaciones diofánticas


homogéneas es un Z−módulo libre. Es decir, sea dada una matriz A ∈ Mn×m (Z) con n filas, m
columnas y coordenadas en Z. Consideremos el conjunto de soluciones del sistema de ecuaciones
diofánticas homogéneo definido por A:
   
x1 0
 x2   0 
(x1 , . . . , xn ) ∈ Zn , A  .  =  .  ∈ Zm .
   
 ..   .. 
xn 0
El conjunto de soluciones diofánticas de este sistema homogéneo es un Z−módulo libre (submódulo
de Zn ) de rango finito.
Demostración. Es obvio que el conjunto de soluciones es submódulo de Zn (por ser
homogéneas). Entonces, por lo visto anteriormente, es libre de torsión y, por tanto, es un
Z−módulo libre. 

2.2.4. Libres de Torsión sobre Dominios Euclı́deos (Opcional). En la Sección


precedente (Subsección 2.2.4 hemos demostrado el Teorema 2.2.25 que muestra que en el caso
de módulos finitamente generados sobre un dominio de ideales principales, libre equivale sobre
libre de torsión. Ahora vaos a hacer una prueba distinta en el caso de dominios euclı́deos. La
razón de incluir este segundo enunciado es que contiene una cierta forma de poder controlar
cómo se produce este resultado en función del crecimiento y decrecimiento de los coeficientes.
Lo dejamos como Subsección opcional del curso.

Proposición 2.2.33. Sea (R, φ) un dominio euclı́deo y sea M un R−módulo finitamente gen-
erado. Sea β := {a1 , . . . , an } un sistema generador de M y sea Λ := (λ1 , . . . , λn ) ∈ Rn una
lista de elementos de R (tantos como elementos tiene el sistema generador). Supongamos que
gcd(λ1 , . . . , λn ) = (1).
Entonces, existe un sistema generador de M con el mismo cardinal que β
β 0 := {b1 , . . . , bn },
de tal modo que
n
X
b1 ; = λi ai .
i=1

Demostración. Dada una lista Λ = (λ1 , . . . , λn ) ∈ Rn , definamos el conjunto: J(Λ) :=


{i ∈ {1, . . . , n} : λi 6= 0}, y la función:
r
X
Φ(Λ) := φ(λi ).
i=1

Nótese que si gcd(λ1 , . . . , λn ) = 1, necesariamente J(Λ) 6= ∅.

Comencemos observando que la propiedad se verifica si alguno de los λi es unidad en R: Porque


si existe i ∈ J(Λ) tal que λi ∈ R∗ , podemos suponer, reordenando los elementos de la base y
de la lista si fuera necesario, que i = 1 y que λ1 ∈ R∗ . En ese caso, el conjunto
β 0 := {b1 , a2 , . . . , an },
Pn
con b1 := i=1 λi ai , es también un sistema generador de M , dado que
n
!
X
−1 −1
a1 := λ1 b1 − λ1 λi ai .
i=2

Y la afirmación se verifica obviamente.


Nótese que como gcd(λ1 , . . . , λn ) = 1, J(Λ) 6= ∅ y necesariamente se ha de tener:
Φ(Λ) ≥ φ(1) + (n − 1)φ(0) > nφ(0).
2.2. IDEALES PRIMOS, MAXIMALES 119

La razón es simple. Como hemos visto, en la Proposición 2.1.16, que φ(a) > φ(0) para todo
a ∈ R, a 6= 0, y que φ(a) ≥ φ(1), si a 6= 0. Podemos suponer, por ejemplo, que 1 ∈ J(Λ) 6= ∅ y,
por tanto,
Xn
Φ(Λ) ≥ φ(λ1 ) + φ(λi ) ≥ φ(λ1 ) + (n − 1)φ(0) ≥ φ(1) + (n − 1)φ(0).
i=2
Como Φ(Λ) ∈ Z y Φ(Λ) ≥ φ(1)+(n−1)φ(0), probaremos la Proposición por inducción en Φ(Λ).

Supongamos Φ(Λ) = φ(1) + (n − 1)φ(0). Como J(Λ) 6= ∅, podemos suponer, reordenando los
ı́ndices si fuera necesario que 1 ∈ J(Λ), es decir, λ1 6= 0. Entonces tenemos,
n
X
(φ(λ1 ) − φ(1)) + (φ(λi ) − φ(0)) = 0.
i=1
Como φ(λ1 ) − φ(1) ≥ 0 y φ(λi ) − φ(0) ≥ 0 para todo i, 2 ≤ i ≤ n, esta suma es una suma de
enteros positivos igualada a cero, por cuanto, tendrı́amos:
φ(λ1 ) − φ(1) = 0, φ(λ2 ) − φ(0) = 0, . . . , φ(λ2 ) − φ(0) = 0.
Por tanto λ1 ∈ R∗ y λi = 0, 2 ≤ i ≤ n. Pero, entonces, estarı́amos en el caso que ya hemos
visto que se verifica por defecto.
Supongamos ahora que Φ(Λ) = m > φ(1). Si alguno de los λi es unidad, ya habremos terminado.
Supongamos, entonces, que ninguno de los λi es unidad. Supongamos
Λ := (λ1 , . . . , λn ),
con la propiedad gcd(λ1 , . . . , λn ) = 1. Entonces, el conjunto J(Λ) no puede ser un conjunto de
cardinal 1. Porque si J(Λ) tuviera un sólo elemento, por ejemplo J(Λ) = {i}, tendrı́amos
gcd(λ1 , . . . , λn ) = gcd(0, . . . , 0, λi , 0, . . . , 0) = λi .
Como Φ(Λ) = m > φ(1) + (n − 1)φ(0), concluirı́amos que
Φ(Λ) = φ(λi ) + (n − 1)φ(0) = m > φ(1) + (n − 1)φ(0),
con lo que λi no serı́a unidad de R y, por tanto, gcd(λ1 , . . . , λn ) 6= 1, contradiciendo nuestras
hipótesis.

Dado que J(Λ) posee más de un elemento, podemos suponer que 1, 2 ∈ J y que φ(λ1 ) ≥ φ(λ2 ).
Además, como ninguno de los dos es unidad, se tiene:
φ(λ1 ) ≥ φ(λ2 ) > φ(1) ≥ 0.
Podemos aplicar divisón euclı́dea y tendremos que existen q, r ∈ R tales que
λ1 = qλ2 + r, φ(r) < φ(λ2 ) ≤ φ(λ1 ).
Ahora consideremos la lista
Λ1 := (r, λ2 , . . . , λn ) ∈ Rn .
Nótese que gcd(r, λ2 , . . . , λn ) = 1 porque se tiene la coincidencia de ideales:
a := (r, λ2 , . . . , λn ) = (λ1 , λ2 , . . . , λn ) = b.
Para verlo, es claro que b ⊆ a, dado que λ1 = qλ2 + r ∈ b. Pero también se tiene que a ⊆ b,
dado que r = λ1 − qλ2 ∈ b.
De otro lado, se tiene
n
X n
X
Φ(Λ1 ) = φ(r) + < φ(λ1 ) + φ(λi ) = Φ(Λ).
i=2 i=2

Consideremos ahora la lista de elementos de M dada mediante:


β1 := {a1 , (a2 + qa1 ), a3 , . . . , an },
junto con la lista Λ1 antes introducida. Observamos que β1 es un sistema generador de M .
Para verlo, sea N el submódulo de M generador por β1 . Es claro que {a1 , a3 , . . . , an } ⊆ N .
Pero además,
a2 = (−1)a1 + (a2 + qa1 ) ∈ N,
120 2. PRIMOS Y MAXIMALES

con lo cual β ⊆ N y M ⊆ N ⊆ M .
Como Φ(Λ1 ) < Φ(Λ) podemos aplicar la hipótesis inductiva al par (β1 , Λ1 ) y existirá un sistema
generador β 0 := {b01 , b02 , . . . , b0n } de M tal que
b01 = ra1 + λ2 (a2 + qa1 ) + λ3 a3 + · · · λn an .
Ahora bien, el conjunto β es un conjunto de generadores de M que verifica:
b01 = (qλ2 + r)a1 + λ2 a2 + · · · + λn an = λ1 a1 + λ2 a2 + · · · + λn an ,
y β 0 verifica la propiedad enunciada para el (β, Λ), con lo que la Proposición queda demostrada
por inducción. 

Teorema 2.2.34. Sea (R, φ) un dominio euclı́deo y M un R−módulo libre de torsión y finita-
mente generado. Entonces, todo sistema generador de M de cardinal minimal es base de M .
En particular, si (R, φ) es euclı́deo y M es finitamente generado, entonces,
M es libre de torsión ⇐⇒ M es libre
Demostración. La segunda afirmación es consecuencia de la primera. Si M es finita-
mente generador, existe un sistema generador de M de cardinal minimal y, por tanto, si M es
libre de torsión, entonces ese sistema generador es base de M como R−módulo, por cuanto M
es libre. Para la otra implicación véase la Proposición 2.2.21 anterior.

Para la primera afirmación usaremos la Proposición 2.2.33 anterior. Sea β = {a1 , . . . , an } ⊆ M


un sistema generador minimal de M . Supongamos que β no fuera libre. Entonces, existe una
lista (λ1 , . . . , λn ) ∈ Rn de elementos no todos nulos tales que
λ1 a1 + · · · + λn an = 0.
Como R es dominio de ideales principales, sea h = gcd(λ1 , . . . , λn ) ∈ R. Como no todos los
λi son nulos y R es dominio, necesariamente se ha de tener h 6= 0. La identidad anterior será
ahora:
h (λ01 a1 + · · · + λ0n an ) = 0,
donde λ0i h = λ. Sea m := (λ01 a1 + · · · + λ0n an ) entonces hm = 0 y m es un elemento de torsión
de M . Como M es libre de torsión, entonces m ha de ser nulo, esto es, tenemos
(λ01 a1 + · · · + λ0n an ) = 0.
Pero, además gcd(λ01 , . . . , λ0n ) = 1, por ser hλ0i = λi y h = gcd(λ1 , . . . , λn ). Por tanto estamos
en las hipótesis de la Proposición 2.2.33 anterior con
β := {a1 , . . . , an },
y
Λ := (λ01 , . . . , λ0n ).
Por tanto, debe existir un sistema genedaor de M
β 0 := {b1 , . . . , bn },
donde
n
X
b1 = λ0i ai = 0.
i=1
Pero entonces, el siguiente conjunto
β 00 := {b2 , . . . , bn },
genera M como R−módulo y tiene cardinal n − 1, lo que contradice la minimalidad del cardinal
de β como generador de M . 

Obsérvese que, en este caso, el Teorema 2.2.24 pasa a ser un Corolario.


Corollario 2.2.35. Si (R, φ) es un dominio euclı́deo, todo submódulo de un R−módulo libre
finitamente generado es libre.
2.2. IDEALES PRIMOS, MAXIMALES 121

Demostración. Si M es un R−módulo libre finitamente generado, entonces es libre de


torsión. Si M es libre de torsión, todo submódulo suyo es libre de torsión. Además, por la
Proposición 2.2.18 todo submódulo de M es finitamente generado (porque R es sominio de
ideales principales y M es finitamente generado. Entonces, N es libre de torsión y finitamente
generado sobre un dominio euclı́deo, luego M es un R−módulo libre de rango finito. 

2.2.5. Ejercicios de la Sección 2.2.


Problema 112. Hallar Spec(Z[X]) y Spm(Z[X]).
Problema 113. En el Lema 2.2.23 Se definen los módulos proyectivos somo los R−módulos
P que satisfacen la propiedad siguiente:
Dado un R−módulo M cualquiera y una aplicación suprayectiva π : M −→ P , entonces, existe
g : P −→ M tal que
π ◦ f = IdP .
Pruébese que todo R−módulo proyectivo es un sumando directo de algún R−módulo libre.
Problema 114. Dar ejemplos de K[X]−módulos que tengas las propiedades que se indican a
continuación:
i) Un ejemplo de un K[X]−módulo M que posee elementos de torsión, pero existe un
polinomio f ∈ K[X] tal que M es un K[X]/(f )−módulo libre de torsión.
ii) Un ejemplo de un K[X]−módulo M que posee elementos de torsión, y tal que existe
f ∈ K[X] tal que M posee elementos de torsión no nulos como K[X]/(f )−módulo.
Problema 115. Prueba que si K es un cuerpo de cardinal infinito y si f ∈ K[X1 , . . . , Xn ] es
un polinomio no nulo, entonces existe (x1 , . . . , xn ) ∈ K n tal que p(x1 , . . . , xn ) 6= 0.
Problema 116 (Polinomio mı́nimo de un endomorfismo). Sea V un espacio vectorial de
dimensión finita sobre K, sea ϕ : V −→ V un endomorfismo, Sea
·K[X] : K[X] × V −→ V
(p(X), v) 7−→ p(ϕ)(v) ∈ V.
la operación de que hace que V sea un K[X]−módulo, como se discute en el Ejemplo 1.4.3.
Para cada v ∈ V , denotemos por µv ∈ K[X] el polinomio generador de AnnK[X] (V ) tal y como
se define en el Ejemplo 2.2.26. Sea
β := {v1 , . . . , vn }
una base de V como K−espacio vectorial. Prueba:
i) Existe un polinomio mónico y de grado n p ∈ K[X] tal que para todo v ∈ V p ∈
AnnK[X] (v).
ii) Los polinomios µv ∈ K[X] tienen todos grado acotado por n.
iii) Sea h(X) el mı́nimo común múltiplo de {µv1 , . . . , µvn } en K[X]. Entonces h ∈
AnnK[X] (v), para todo v ∈ V .
iv) Concluir que el h anterior es el polinomio de mı́nimo grado tal que h(ϕ) = 0 como
endomorfismo. Este polinomo es el polinomio mı́nimo de ϕ y se denotará mediante
µϕ .
v) Prueba que si K es un cuerpo infinito, existe un vector v ∈ V tal que
µv = µϕ .
Problema 117. Probar que Q es un Z−módulo libre de torsión. Probar asimismo que cua-
lesquiera dos números racionales son linealmente dependientes sobre Z. Concluir que si Q fuera
un Z−módulo libre, entonces tendrı́a rango 1.
Problema 118. Probar que si R es un dominio de integridad y a es un ideal de R que es,
además, libre como R−módulo, entonces a ha de ser un ideal principal.
Problema 119 (Matriz compañera de un polinomio). Sea K un cuerpo y sea f (X) ∈
K[X] un polinomio mónico con coeficientes en K. Supongamos:
f (X) := X n + an−1 X k−1 + · · · + a1 X + a0 .
122 2. PRIMOS Y MAXIMALES

Se denomina matriz compañera de f a la matriz


 
0 0 0 ··· 0 −a0
 1 0 0 ··· 0 −a1 
 
 0 1 0 ··· 0 −a2 
C(f ) :=  0 0 1 · · · .
 
 0 −a3 
 .. .. .. . . .. .. 
 . . . . . . 
0 0 0 ··· 1 −an−1
Se pide:
i) Hallar las matrices compañeras de los siguientes polinomios:
X 3 − 2X + 1, X 2 − 2X − 1, X 5 − 3X 3 + X + 1.
ii) Considerar el ideal a := (f ) generador por f en K[X] y el anillo cociente K[X]/a.
Prueba que K[X]/a es un espacio vectorial de dimensión finita sobre K y que la
siguiente es una base de K[X]/a como K−espacio vectorial:
β := {1 + a, X + a, . . . , X n−1 + a}.
iii) Hallar la dimensión de K[X]/a como K−espacio vectorial.
iv) Con las mismas notaciones, consideremos la siguiente correspondencia:
ηX := K[X]/a −→ K[X]/a
h+a 7−→ Xh + a.
Prueba que ηX es aplicación, probar que es un endomorfismo de K[X]/a como K−espacio
vectorial y probar que la matriz de coordenadas de ηX en la base β es justamente la
matriz compañera C(f ) del polinomio f dado.
v) Con las mismas notaciones, para cada polinimio g ∈ K[X] definamos la siguiente
correspondencia:
ηg := K[X]/a −→ K[X]/a
h+a 7−→ gh + a.
Prueba que es un endomorfismo de espacios vectoriales (que se denomina homotecia
de razón g de K[X]/a y que es un endomorfismo de K[X]−módulos. Prueba que se
dan las siguientes propiedades:
ηg1 +g2 = ηg1 + ηg2 , ηg1 g2 = ηg2 ◦ ηg1 = ηg1 ◦ ηg2 , ∀g1 , g2 ∈ K[X].
η0 = 0, η1 = IdK[X]/a .
vi) Prueba que la matriz de ηg en la base β anterior es
g(C(f )) ∈ Mn (K),
donde C(f ) es la matriz compañera de f y g(C(f )) es el resultado de evaluar g en
X = C(f ) matricialmente.
Problema 120. Con las mismas notaciones, si v ∈ V es un vector y µv es un polinomio de
grado k, el siguiente subespacio vectorial de V es submódulo como K[X]−módulo:
W (v, ϕ) := Khv, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)i.
(Pista: probar que es invariante con respecto a ϕ) Se pide también:
i) La dimensión de W (v, ϕ) es k. (Pista: probar que {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)} son
linealmente independientes sobre K).
ii) Consideremos la restricción de ϕ al subespacio W (v, ϕ) (tiene sentido porque W (v, ϕ)
es subespacio invariante):
φ := ϕ |W (v,ϕ) : W (v, ϕ) −→ W (v, ϕ)
w 7−→ ϕ(w).
Prueba que existe una base β de W (v, ϕ) tal que la matriz de φ en esa base β es la
matriz compañera del polinomio mı́nimo de f en v. (Pista: usar
β := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)}).
2.2. IDEALES PRIMOS, MAXIMALES 123

Problema 121. Con las notaciones de los problemas anteriores, sea ϕ : V −→ V un endo-
morfismo de un espacio vectorial V de dimensión n sobre un cuerpo K. Sea v ∈ V un vector
no nulo y sea µv el polinomio mı́nimo de ϕ en v. Supongamos que el grado de µv es k. Prueba
que se puede encontrar un subespacio V1 ⊆ V de dimensión n − k, tal que:
M
V = W (v, ϕ) V1 ,
y se satisface la siguiente propiedad: Existe una base {wk+1 , . . . , wn } de V1 tal que para todo i,
1 ≤ i ≤ n − k, existen ci ∈ K y hi ∈ V1 tales que
ϕ(wi ) = ci v + hi .
( Pista: Completa la base {v, ϕ(v), ϕ (v), . . . , ϕk−1 (v)} de W (v, ϕ) hasta obtener una base de
2

V : β0 := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v), uk+1 , . . . , un }. Denotemos por V0 el subespacio generado
por {uk+1 , . . . , un }. Para cada i, k + 1 ≤ i ≤ n, la imagen de ui a través de ϕ será de la forma:
k−1
X
ϕ(ui ) = c0 v + cj f j (v) + λui + hi ,
j=1

donde
• c0 , c1 , . . . , ck−1 , λ ∈ K,
• hi es un elemento del subespacio de V0 generado por los elementos que la base de V0
que no son ui . Es decir,
hi ∈ Kh{ut : t 6= i}.
Con estas notaciones, construye una solución (x0 , . . . , xk−2 ) ∈ K n−2 del siguiente sistema de
ecuaciones lineales: 

 Xk−2 + ck−1 = 0,


 Xk−3 + c k−2 + λX k−2 = 0
..



.


 Xt + c t+1 + λX t+1 = 0

 .
.
.




X0 + c1 + λX1 = 0.

Es decir, prueba que este sistema es compatible y considera (x0 , . . . , xk−2 ) ∈ K n−1 una solución.
Define c00 := c0 + λx0 . Define:
k−2
X
wi := ui + xi f t (v).
t=0
Verifica que, construyendo iterativamente wk+1 , . . . , wn , el subespacio V1 := Khwk+1 , . . . , wn i
generador por estos elementos verifica las condiciones indicadas, con
ϕ(wi ) = c0i v + Hi ,
con Hi ∈ V1 .) Adicionalmente, prueba que el conjunto β siguiente es base de V :
β := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v), wk+1 , . . . , wn }.
Prueba que la matriz de ϕ en la base β anterior tiene la forma siguiente:
 
C(µv ) N
M (ϕ) := ,
0 M
donde
• C(µv ) ∈ Mk (K) es la matriz compañera del polinomio mı́nimo µv ,
• 0 ∈ M(n−k)×k (K) es la matriz nula con n − k filas y k columnas,
• La matriz N ∈ Mk×(n−k) (K) es una matriz con k filas y n − k columnas en la que
sólo la primera fila puede contener elementos no nulos y tiene la forma:
 0
ck+1 c0k+2 · · · c0n

 0 0 ··· 0 
N :=  . ..  .
 
. .
. . .
 . . . . 
0 0 ··· 0
124 2. PRIMOS Y MAXIMALES

• La matriz M ∈ Mn−k (K) es una matriz cualquiera con n − k filas y columnas.


Problema 122. Con las notaciones de los problemas anteriores, sea ϕ : V −→ V un endo-
morfismo de un espacio vectorial V de dimensión n sobre un cuerpo K. Sea v ∈ V un vector
no nulo y sea µv el polinomio mı́nimo de ϕ en v. Supongamos que el grado de µv es k. Sea
V1 ⊆ V un subespacio de dimensión n − k, y sea una base {w1 , . . . , wn−k } de V1 tal que para
todo i, 1 ≤ i ≤ n − k, existen ci ∈ K y ωi ∈ V1 tales que
ϕ(wi ) = ci v + ω1 .
Sea β la siguiente base de V construida en el problema precedente :
β := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v), wk+1 , . . . , wn }.
Supongamos que la matriz de ϕ en la base β tiene, como en el problema precedente, la forma
siguiente:  
C(µv ) N
M (ϕ) := ,
0 M
donde
• C(µv ) ∈ Mk (K) es la matriz compañera del polinomio mı́nimo µv ,
• 0 ∈ M(n−k)×k (K) es la matriz nula con n − k filas y k columnas,
• La matriz N ∈ Mk×(n−k) (K) es una matriz con k filas y n − k columnas en la que
sólo la primera fila puede contener elementos no nulos y tiene la forma:
 
ck+1 ck+2 · · · cn
 0 0 ··· 0 
N :=  . . .
 
. ..
 .. .. . .. 
0 0 ··· 0
• La matriz M ∈ Mn−k (K) es una matriz cualquiera con n − k filas y columnas.
Prueba que si existe i, k + 1 ≤ i ≤ n tal que ci 6= 0, entonces el polinomio mı́nimo asociado a ϕ
con respecto al vector wi tiene grado estrictamente mayor que el grado del polinomio mı́nimo
µv , es decir, probar que
deg(µwi ) > deg(µv ).
(Pista: Prueba que los vectores siguientes son linealmente independientes en V :
{wi , f (wi ), . . . , f k−1 (wi ), f k (wi )}.
Para ello, hallar sus coordenadas en la base β a partir de las matrices dadas.)
Problema 123. Deducir del problema anterior que si K es un cuerpo (finito o infinito) y si
V es un espacio vectorial de dimensión finita sobre K, y si ϕ : V −→ V es un endomorfismo,
entonces existe un vector v ∈ V tal que µv es igual al polinomio mı́nimo de ϕ.
Problema 124 (Existencia de forma canónica racional de un endomorfismo). Prueba
que si ϕ : V −→ V es un endomorfismo de un espacio vectorial de dimensión finita n sobre K,
existen polinomios f1 (X), . . . , fr (X) tales que
Yr
fi = χA (X),
i=1
y existe una base β de V tal que la matriz de ϕ en la base β es de la forma:
 
C(f1 ) 0 0 ··· 0

 0 C(f2 ) 0 ··· 0  
M (ϕ) := 
 0 0 C(f 3 ) · · · 0  ,
 .. .. .. .. 
 . . . . 
0 0 0 · · · C(fr )
donde los 00 s son matrices nulas de tallas adecuadas y las matrices C(f1 ), . . . , C(fr ) son respec-
tivamente las matrices compañeras de f1 , . . . , fr . probar que los polinomios fi pueden elegirse
de tal modo que fi | fi−1 . En este caso, se dice que los polinomios {f1 , . . . , fr } son los factores
invariantes de ϕ. Se llama forma canónica racional (también forma cı́clica o forma canónica
de Frobenius, según los autores).
2.2. IDEALES PRIMOS, MAXIMALES 125

Problema 125 (Interpolación de Polinomios). Sea K un cuerpo y sean α1 , . . . , αn ∈ K ele-


mentos del cuerpo. Se denomina matriz de Vandermonde (Alexandre-Théophile Vandermonde)
n × m sobre K determinada por esta lista de valores, a la matriz:
1 α1 α12 · · · α1m
 
1 α2 α22 · · · α2m 
V dMn×m (α1 , . . . , αn ) :=  . ..  .
 
..
 .. . . 
1 αn αn · · · αnm
2

En el caso m = n − 1 escibiremos simplemente


V dM (α1 , . . . , αn ) = V dMn×m (α1 , . . . , αn ).
Se pide:
i) Considerar el K−espacio vectorial K[X]m de los polinomios univariados de grado
acotado por m. Y para el punto α := (α1 , . . . , αn ) ∈ K n , consideremos la aplicación
siguiente:
evalα : K[X]m −→ Kn
f 7−→ (f (α1 ), . . . , f (αn )).
Prueba que es una aplicación lineal entre K−espacios vectoriales. Considerar en
K[X]m la base monomial {1, X, X 2 , . . . , X m } y en K‘n la base canónica. probar que
la matriz de evalα en esas bases es la matriz de Vandermone, es decir, probar que:

M evalα = V dMn×m (α1 , . . . , αm ).
ii) Prueba que, en el caso m = n − 1, el determinante de la matriz de Vandermonde
verifica Y
det (V dM (α1 , . . . , αn )) = (αi − αj ) .
i<j
iii) Prueba que el determinante de la matriz de vandermonde Qn V dM (α1 , . . . , αn ) está rela-
cionado con el discriminante del polinomio f (X) := i=1 (X − αi ).
iv) Prueba que si m = n − 1, la aplicación lineal evalα es un isomorfismo de K−espacio
vectoriales si y solamente si αi 6= αj , ∀i 6= j.
v) Prueba que si m = n − 1, la aplicación lineal evalα es suprayectiva si y solamente si
αi 6= αj , ∀i 6= j.
vi) Concluir que si m ≥ n − 1 la aplicación lineal evalα es suprayectiva si y solamente si
αi 6= αj , ∀i 6= j.
Se llaman procedimientos de interpolación a todo procedimiento de resolución del sistema de
ecuaciones lineales:    
A0 b1
 A1   b2 
V dMn×m (α1 , . . . , αn )  .  =  .  ,
   
 ..   .. 
Am bn
n
donde los datos son el vector (b1 , . . . , bn ) ∈ K y el punto α = (α1 , . . . , αn ) ∈ K n , además del
grado m. A toda solución de ese sistema de ecuaciones (a0 , . . . , am ) ∈ K m+1 le corresponde un
único polinomio solución
f = am X m + · · · a1 X + a0 ∈ K[X]m .
Prueba que un problema de interpolación posee solución si αi 6= αj , ∀i 6= j.
Problema 126. Sea K un cuerpo cualquiera y p ∈ K[X] un polinomio de grado a lo sumo n.
Prueba que p no puede tener más de n raı́ces distintas en K. (Pista: recordar que raı́ces son
las soluciones de la ecuación p(X) = 0. Prueba la afirmación usando el Problema precedente).
Problema 127. Sea K un cuerpo cualquiera y A ∈ Mn (K) una matriz cuadrada. Se pide:
i) Prueba que A no puede tener más de n valores propios distintos.
ii) Prueba que si A posee n valores propios distintos, entonces es diagonalizable.
iii) Prueba que el recı́proco de la afirmación anterior no es cierto.
(Pista: Aplicar interpolación al polinomio caracterı́stico (para la afirmación i). Para las otras
usar la forma cı́clica del endomorfismo.)
126 2. PRIMOS Y MAXIMALES

2.3. Dominios de Factorización Única: Lema de Gauss


Trataremos de introducir aquı́ el Lema de Gauss, uno de los resultados clásicos y centrales en
la historia del Álgebra.

2.3.1. Dominios de Factorización Única.


Definición 51. Dos elementos irreducibles p, q ∈ R en un dominio de integridad R se dicen
co-primos si no son asociados, es decir, si p 6∼ q.

Observación 2.3.1. Nótese que dos irreducibles p y q en un dominio R son co-primos si y


solamente si p - q y q - q.

Definición 52 (Dominios de Factorización Única). Un dominio de integridad R se de-


nomina dominio de factorización única si se verifican las siguientes bpropiedades:
i) Existencia de Factorización: Para cada elemento x ∈ R \ {0} existen u ∈ R∗ , un
conjunto finito S := {pi ∈ R ; i ∈ I} ⊆ R de elementos irreducibles, co-primos dos a
dos, y números naturales positivos {αi : i ∈ I} ⊆ N, tales que
Y
x=u pαi .
i

i∈I

Es decir, todo elemento no nulo de R es producto finito (eventualmente vacı́o) de


unidades y elementos irreducibles de R. A la lista formada por la unidad u, los primos
en S y los exponentes αi , se le denomina factorización de x.
ii) Unicidad de la Factorización: Para cada elemento x ∈ R, x 6= 0, dadas dos
factorizaciones:
Y Y β
x=u pα
i =v
i
qj j ,
i∈I i∈J

donde u, v ∈ R son unidades, I y J son conjuntos finitos, αi , βj ∈ N son números
naturales no nulos y {pi : i ∈ I}, {qj : j ∈ J} son dos conjuntos de elementos
irreducibles y co-primos dos a dos, entonces,
• Los cardinales de I y J coinciden (i.e. ](I) = ](J)).
• Existe una biyección f : I −→ J, tal que
pi ∼ qf (i) , αi = βf (i) , ∀i ∈ I.
Es decir, la factorización es única salvo unidades de R y permutación entre los ı́ndices.

Proposición 2.3.2. Sea R un dominio de integridad en el que todo elemento es producto finito
de unidades y elementos primos. Entonces R es un dominio de factorización única.
Demostración. Supongamos que R es un dominio que satisface que todo elemento es
producto finito de primos y unidades. Ya satisface la condición de existencia de factorización
porque en dominios de integridad todo primo es irreducible. Nos queda por ver la Unicidad de
la factorización.

Sea, pues, x ∈ R un elemento no nulo con dos factorizaciones:


Y Y β
x=u pαi =v
i
qj j ,
i∈I i∈J

donde u, v ∈ R∗ son unidades, I y J son conjutnos finitos, αi , βj ∈ N son números naturales


no nulos y {pi : i ∈ I}, {qj : j ∈ J} son dos conjuntos de elementos primos y co-primos
dos a dos (es decir, ∀i, j ∈ I, i 6= j, pi 6∼ pj y ∀r, s ∈ I, r 6= s, qr 6∼ qs ). Tenemos los casos
siguientes:
• Si x ∈ R∗ , es decir, si x es unidad, entonces tanto I como J tienen que ser el conjunto
vacı́o. Si no fuera vacı́o alguno de ellos, entonces x no puede ser unidad. En ese caso
la unicidad de la factorización se verifica de manera obvia.
• Si x ∈ R \ (R∗ ∪ {0}), entonces ni I ni J son conjuntos vacı́os.
2.3. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 127

Nos ocupamos de este segundo caso. Para cada i ∈ I tenemos que, obviamente,
Y β
pi | x = v qj j .
i∈J

Como pi es primo, debe darse:


[pi | v] ∨ [∃j ∈ J, pi | qj ].
La primera opción no puede darse porque v ∈ R∗ es unidad, luego se tiene que dar la segunda,
es decir,
∃j ∈ J, pi | qj .
Pero como qj es primo, entonces, es irreducible, con lo que necesariamente, si pi | qj entonces,
pi ∼ qj . Probemos que sólo puede haber un j ∈ J tal que pi | qj .
Si existieran j1 , j2 ∈ J tales que pi | qj1 y pi | qj2 , por ser qj1 y qj2 irreducibles, entonces pi ∼ qj1
y pi ∼ qj2 . Por tanto, qj1 ∼ qj2 y necesariamente j1 = j2 .
Para cada i ∈ I, designemos por σ(i) = j ∈ J al único valor j ∈ J tal que pi | qj (o,
equivalentemente, al único j ∈ J tal que pi ∼ qj . Esto significa que la siguiente es un aplicación:
σ: I 7−→ J
i 7−→ σ(i).
Además, esta aplicación ha de ser inyectiva. Dados i1 , i2 ∈ I tales que σ(i1 ) = σ(i2 ) = j ∈ J.
Entonces tenemos pi1 ∼ qj y pi2 ∼ qj , luego pi1 ∼ pi2 y tendremos que, necesariamente, i1 = 22
y σ es una aplicación inyectiva.
Los mismos argumentos nos permitirán construir una aplicación
τ : J −→ I,
donde τ (j) = i si y solamente si qj ∼ qi . Es claro que τ es inyectiva y es fácil probar que
τ ◦ σ = IdI , σ ◦ τ = IdJ .
Para concluir la unicidad sólo falta concluir que αi = βσ(i) , ∀i ∈ I. Para ello, baste con recordar
que N es totalmente ordenadom, con lo que o bien αi ≥ βσ(i) o αi ≤ βσ(i) . Supongamos el
primer caso, esto es, supongamos que αi ≤ βσ(i) . Entonces, tendrı́amos:
   
Y α β −α Y β
x = pαi
i 
u αi
pk k  = qσ(i) σ(i)
qσ(i)
i
(u−1 v) qj j  .
k∈I\{i} j∈J\{σ(i)}

Además, como pi ∼ qσ(j) , existe ω ∈ R una unidad tal que
pi = ωqσ(i) .
Nos queda,
   
Y βσ(i) −αi αi −1
Y β

i
i u pα
k
k
= pα
i qσ(i)
i (ω u v) qj j  .
k∈I\{i} j∈J\{σ(i)}

Sacando “factor común” (R es un dominio), tendremos:


    
Y α βσ(i) −αi Y β

i
i 
u pk k  − qσ(i) (ω αi u−1 v) qj j  = 0.
k∈I\{i} j∈J\{σ(i)}

Como hemos supuesto que x 6= 0, entonces pi 6= 0 y, dado que R es dominio, tendremos:


    
Y α βσ(i) −αi Y β
u pk k  − qσ(i) (ω αi u−1 v) qj j  = 0,
k∈I\{i} j∈J\{σ(i)}

es decir  
Y β −αi Y β
u pα σ(i)
(ω αi u−1 v) qj j  .
k = qσ(i)
k

k∈I\{i} j∈J\{σ(i)}
128 2. PRIMOS Y MAXIMALES

Ahora si βσ(i) > αi , tendrı́amos βσ(i) − αi ≥ 1 y, por tanto,


Y α
qσ(i) | u pk k .
k∈I\{i}

Siendo qσ(i) primo, debe ocurrir que ∃k ∈ I, k 6= i tal que qσ(i) | pk , luego qσ(i) ∼ pk y, sabiendo
que qσ(i) ∼ pi , concluirı́amos pi ∼ pk , con k 6= i, lo que es contradictorio con las hipótesis
que satisfacen las dos factorizaciones. Por tanto βσ(i) ≥ αi y βσ(i) 6> αi . Lo cual implica
necesariamente que βσ(i) = αi y tenemos la unicidad de la factorización en R. 

Corollario 2.3.3. Todo dominio euclı́deo (resp. todo dominio de ideales principales) es do-
minio de factorización única.
Demostración. Obvio por los Teoremas 2.1.23 (caso de dominios euclı́deos) y Teorema
2.1.13 (caso de dominios de ideales principales). En ambos Teoremas se prueba la existencia
de factorización en irreducibles. De otro lado, en el Teorema 2.1.10 hemos probado que en los
dominios de ideales principales las nociones de primo e irreducible equivalen. Por tanto, se
tienen las hipótesis de la Proposición previa y tenemos probada la afirmación del Corolario. 

Proposición 2.3.4. En dominios de factorización única, un elemento x ∈ R es primo si y


solamente si es irreducible.
Demostración. Esto es válido tanto para elementos nulos como no nulos por ser dominio
de integridad. Como todo primo es irreducible en dominios de integridad, sólo falta probar que
todo elemento irreducible p ∈ R no nulo es primo. Para ello, supongamos a, b ∈ R tales que
p | ab, siendo p irreducible. Exntonces, existe h ∈ R tal que ph = ab.
Supongamos tres factorizaciones (una de a, otra de b y otra de h) dadas mediante:
Y Y β Y θ
a=u pα
i , b=v
i
qj j , h = ω pkk ,
i∈I j∈J k∈T

con las hipótesis habituales. Por tanto, tenemos dos factorizaciones de ab, Una que sale de
reordenar el producto siguiente:
Y Y β
ab = uv pα
i
i
qj j ,
i∈I j∈J

y otra que sale de reordenar el producto:


!
Y
ab = ph = h = ω p pθkk .
k∈T

En todo caso, p aparece con exponente positivo en esta última factorización de ab, luego tiene
que aparecer con exponente positivo en la primera factorización de ab (obtebnida reordenando
las de a y b). En consecuencia se tiene que verificar
[∃i ∈ I, p ∼ pi ] ∨ [∃j ∈ J, p ∼ qj ].
Pero, en este caso, se tiene:
[p | a] ∨ [p | b].
con lo que habremos probado la primalidad de p. 

Proposición 2.3.5. Sea R un dominio de factorización única y sea F := {ai : i ∈ I} ⊆ R


un conjunto de elementos de R. Supongamos que no todos los elementos de F son nulos.
Consideremos el siguiente subconjunto de R:
P(F) := {p ∈ R : p es primo, p | ai , ∀i ∈ I}.
Entonces, el conjunto cociente siguiente es finito:
P(F)/ ∼,
donde ∼ es la relación de equivalencia dada por la relación “ser asociados”.
2.3. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 129

Demostración. Sea ai0 ∈ F ⊆ R el elemento tal que ai0 6= 0. Ahora, todo primo p ∈ P(F)
verifica que es asociado a algún factor irreducible de ai0 . Es decir,
P(F)/ ∼⊆ {p ∈ R : p | ai0 }/ ∼ .
Pero, por la Unicidad de los dominios de factorización única, las clases de equivalencia del
segundo conjunto son finitas y habremos terminado. 

Definición 53 (Máximo común divisor en DFU’s). Sea R un dominio de factorización


única. Sea F := {ai ∈ R : i ∈ I} un conjunto de elementos de R que contiene al menos un ele-
mento no nulo. Consideremos un conjunto finito de representantes de las clases de equivalencia
de P(F):
P(F) = {[p1 ]∼ , . . . , [pm ]∼ }.
Entonces, existe un conjunto de unidades {ui ∈ R∗ i ∈ I} y un conjunto de números naturales
{αi,k : i ∈ I, 1 ≤ k ≤ m} tales que para cada i ∈ I se tiene una descomposición
Y α
ai = ui pk i,k ,
k∈Ω
donde para cada k ∈ N, 1 ≤ k ≤ m, existe un i ∈ I tal que αi,k 6= 0. Llamaremos DFU-máximo
común divisor de los elementos de F a todo elemento de R asociado al elemento:
Y min{α : i∈I}
i,k
gcdDFU (ai : i ∈ I) := pk .
k∈Ω

Observación 2.3.6. Si R es un dominio de factorización única, en el caso de que un conjunto


de elementos F sea finito y contenga un elemento no nulo, la definición anterior es exactamente
la habitual de “factores comunes (no nulos) con el menor exponente”. Es decir, si R es DFU y
F = {a1 , . . . , an } entonces, existen los siguientes elementos:
i) {p1 , . . . , pm } ⊆ R un conjunto finito de elementos primos, dos a dos co-primos, esto
es, pi 6∼ pj , ∀i, j, i 6= j.
ii) {ui : 1 ≤ i ≤ n} ⊆ R∗ un conjunto finito de unidades de R.
iii) {αi,j ∈ N : 1 ≤ i ≤ n, 1 ≤ j ≤ m} ⊆ N un conjunto finito de números naturales, de
tal manera que para cada j, existe i ∈ {1, . . . , n}, con αi,j 6= 0.
De tal manera que para cada i, 1 ≤ i ≤ n, se tiene:
m
α
Y
ai := ui pj i,j .
j=1

Entonces,
m
β
Y
gcdDFU := pj j ,
J=1
donde
βj := min{αi,j ∈ N : 1 ≤ i ≤ n}.

Proposición 2.3.7. Sea R un dominio de factorización única y sea F = {ai , : i ∈ I} ⊆ R


un conjunto de elementos que contiene algún elemento no nulo. Supongamos que el ideal a
generado por F es un ideal principal en R, esto es,
a = (F) = (h),
con h ∈ R. Entonces,
h ∼ gcdDFU (F).
Demostración. Por ser R un DFU, en virtud de la Proposición precedente, existirán los
objetos siguientes:
i) {p1 , . . . , pm } ⊆ R un conjunto finito de elementos primos, dos a dos co-primos, esto
es, pi 6∼ pj , ∀i, j, i 6= j.
ii) {ui : i ∈ I} ⊆ R∗ un conjunto de unidades de R.
iii) {αi,j ∈ N : i ∈ I, 1 ≤ j ≤ m} ⊆ N un conjunto de números naturales, de tal manera
que para cada j, existe i ∈ I, con αi,j 6= 0.
130 2. PRIMOS Y MAXIMALES

De tal manera que para cada i, 1 ≤ i ≤ n, se tiene:


m
α
Y
ai := ui pj i,j .
j=1

Nótese que la propiedad (iii) exigida significa que cada irreducible pj aparece en, al menos, uno
de los ai ’s. Entonces el DFU-máximo común divisor viene dado mediante:
m
β
Y
` := pl j ,
j=1

donde
βj := max{αi,j : 1 ≤ i ≤ n}.
De otro lado, sea h el generador del ideal a. Como ai ∈ a = (h) para cada i ∈ I, entonces,
tenemos
h | ai , ∀i ∈ I.
Ahora, como hemos visto anteriormente, en todo dominio de factorización única primo equivale a
irreducible. Luego los factores irreducibles de h son primos que dividen a los factores irreducibles
de los ai ’s. En particular, podemos suponer que
m
θ
Y
h=v pj j ,
j=1

para algún v ∈ R unidad y θj ∈ N, 1 ≤ j ≤ m. Ahora bien, como h | ai para cada i, entonces,
m
θ α
Y
pj j | pj i,j .
j=1
θ α
Como los pj son dos a dos co-primos, luego pj j | pj i,j con lo que concluimos:
θj ≤ min{αi,j : 1 ≤ i ≤ n} = βj .
Y, por lo tanto, h | `.
De otro lado, hemos dicho que h genera el ideal a generador por todos los ai ’s, luego h ∈ a.
Ahora bien ` | ai para cada i ∈ I, con lo que el ideal (`) contiene a todos los elementos ai ,
luego:
(h) = a = (F) ⊆ (`).
concluimos ası́ que ` | h y habremos probado que h ∼ `. 

Observación 2.3.8. A partir de esta proposición tenemos que, en el caso de que un conjunto
F genera un ideal principal, su generador es el DFU-máximo común divisor. Esto hace que no
se distinga entre las dos denominaciones y se diga simplemente “máximo común divisor” (y se
denote gcd(F)) al máximo común divisor de F y se suprime la referencia al prefijo DFU (y al
sub-ı́ndice DFU) a partir de este momento.

Observación 2.3.9. De otro lado, con las mismas notaciones, se tiene:


Si R es un dominio de factorización única, el ideal a = (F) ⊆ R es principal si y solamente si
gdc(F) ∈ (F).
En particular, tampoco se verifica la identidad de Bézout con el máximo común divisor si el
ideal generado no es principal.
A modo de ejemplos concretos, baste tomar:
• En Z[X], que no es DIP, :
gcd(2, X) = 1, pero 1 6∈ (2, X) 6= (1) = Z[X].
• En K[X1 , X2 ], que no es DIP, :
gcd(X1 , X2 ) = 1, pero 1 6∈ (X1 , X2 ) 6= (1) = K[X1 , X2 ].

Observación 2.3.10. El máximo común divisor verifica las propiedades siguientes (de obvia
verificación):
2.3. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 131

i) Dados {ai : i ∈ I} un conjunto de elementos de un DFU R no todos nulos, entonces,


gcd(ai : i ∈ I) = 1 ⇐⇒ ¬ (∃p ∈ R, (p ∈ R es primo) ∧ (p | ai , ∀i ∈ I)) .
ii) Si R es un dominio de ideales principales, el máximo común divisor es el generador
del ideal que generan los elementos de estudio. Esto es, si R es dominio de ideales
principales,
(gcd(ai : i ∈ I)) = (ai : i ∈ I).
iii) Si (R, φ) es un dominio euclı́deo el máximo común divisor verifica que
φ(gcd(ai : i ∈ I)) = max{φ(a) : a | ai , ∀i ∈ I}.
iv) Si R es un dominio de factorización única el máximo común divisor verifica:
∀a ∈ R, si a | ai , ∀i ∈ I =⇒ a | gcd(ai : i ∈ I).

2.3.2. El Lema de Gauss.


Definición 54 (Contenido y Parte Principal de un Polinomio). Sea R un dominio
de factorización única y sea f ∈ R[X] \ {0} un polinomio univariado con coeficientes en R.
Supongamos que
f = ad X d + ad−1 X d−1 + · · · + a1 X + a0 .
Llamaremos
i) Contenido de f y lo denotaremos por cont(f ) al máximo común divisor de sus coefi-
cientes, esto es, al elemento de R dado mediante:
cont(f ) = gcd(ad , ad−1 , . . . , a1 , ao ) ∈ R.
ii) Parte principal de f y lo denotaremos por pp(f ) al resultado de divir f por su con-
tenido, esto es, para cada i, 0 ≤ i ≤ d existe bi ∈ R tal que ai = bi cont(f ), llamamos
parte printipal al polinomio en R[X] dado mediante:
pp(f ) := bd X d + bd−1 X d−1 + · · · + b1 X + b0 ∈ R[X].
iii) Un polinomio se dice primitivo si su contenido es una unidad de R.

Observación 2.3.11. La definición del contenido es salvo unidades en R. Ası́, si escribimos


cont(f ) = a ∈ R, también es cierto que cont(f ) = b, para cualquier b ∈ R con a ∼ b.
Mantenemos la notación por respeto a la tradición, aunque señalamos que se trata de igualdades
“salvo unidades en R”.
Por su parte, la definición de pp(f ) nos da un polinomio en R[X] porque el contenido divide a
todos los coeficientes. Obviamente también, la parte principal de un polinomio es un polinomio
primitivo.

Lema 2.3.12. Sea R un dominio de factorización única, si q(X) ∈ R[X] es irreducible entonces
o bien q ∈ R y q irreducible en R o bien q ∈ R[X] \ R es un polinomio no constante y, en ese
caso, es un polinomio primitivo.
Demostración. De la descomposición q = cont(q)pp(q) deducimos que o bien cont(q) ∈
R∗ y q es primitivo o bien cont(q) 6∈ R∗ , en cuyo caso pp(f ) es una unidad en R[X] y, por
tanto, es una constante y q ∈ R∗ . En este segundo caso, q ∼ cont(q) en R y, necesariamente, q
es irreduible en R. 

Lema 2.3.13. Sea R un dominio de factorización única y sea f ∈ R[X] un polinomio primitivo.
Sea a ∈ R una constante no nula. Entonces,
cont(af ) = a, pp(af ) = f.
132 2. PRIMOS Y MAXIMALES

Demostración. Supongamos que


f = ad X d + ad−1 X d−1 + · · · + a1 X + a0 ∈ R[X],
un polinomio primitivo que,pord efinición, es no nulo. Supongamos ad 6= 0. Entonces
af = (aad )X d + (aad−1 )X d−1 + · · · + (aa1 )X + (aa0 ) ∈ R[X].
Tenemos claramente que
a | h = gcd({(aad ), (aad−1 ), . . . , (aa1 ), (aa0 )}).
Luego todos los primos divisores de a, son también factores primos de h. De otro lado, sea p
un primo que divide a h y supongamos que pβ | h, β ≥ 1. Esto significa que
pα | (aai ), ∀i, 0 ≤ i ≤ d.
Como el gcd(a0 , . . . , ad ) = 1, debe existir i0 tal que p - ai0 . Como p | (aai0 ) y p es primo,
entonces, necesariamente, p | a.
En particular, concluimos que los primos que dividen a h y los primos que dividen a p son los
mismos, siendo el exponente presente en a menor o igual que el exponente que tienen en h. Es
decir, podemos escribir:
n n
β α
Y Y
(2.3.1) h=u pj j , a = v pj j ,
j=1 j=1

para algunos primos {p1 , . . . , pn } ⊆ R, co-primos dos a dos, con u, v ∈ R∗ y βj ≥ αj ≥ 1.


Supongamos que existe un j tal que βj > αj . Sin pérdida de la generalidad, podemos suponer
que que j = 1 y tendremos que
a = pα
1 c, con p - c,
1

Sea i0 ∈ {0, . . . , d} tal que p1 - ai0 (existe porque gcd(a0 , . . . , ad ) = 1). Entonces,
pβ1 1 | (aai0 ), con p1 - ai0 .
Concluimos que
β1
aai0 = pα
1 cai0 = dp1 ,
1

luego
β1 β1 −α1
pα α1
1 cai0 − dp1 = 0 −→ p1 (cai0 − dp1
1
) = 0.
Como p1 6= 0 y R es un dominio de integridad, concluimos que:
cai0 = dp1β1 −α1 .
Como β1 > α1 , tendremos que β1 − α1 ≥ 1 y, por tanto,
p1 | p1β1 −α1 , p1β1 −α1 | cai0 .
En particular
p1 | cai0 con p1 - ai0 y p1 - c,
lo que contradice el carácter de primo de p1 y nos lleva a contradicción. Por tanto, no es posible
que β1 > α1 . Esto implica que, necesariamente, αj = βj para todo j, con 1 ≤ j ≤ n. Luego,
por las igualdades descritas en la Ecuación 2.3.1, tenemos que concluir que h y a son asociados
y, por tanto, a = cont(af ). 

Lema 2.3.14 (Gauss). Si R es un dominio de factorización única, el producto de polinomios


primitivos es primitivo.
Demostración. Supongamos que nos dan dos polinomios primitivos f, g ∈ R[X] dados
mediante:
f = ad X d + ad−1 X d−1 + · · · + a1 X + a0 ,
g = bm X m + bm−1 X m−1 + · · · + b1 X + b0 .
Supongamos ad 6= 0 y bm 6= 0. Entonces, el producto de f ‘por g es un polinomio de grado
d + m de la forma:
f g := cd+m X d+m + cd+m−1 X d+m−1 + · · · + c1 X + c0 ,
2.3. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 133

donde X
ck := ai bj , ∀k, 0 ≤ k ≤ d + m.
i+j=k
Sea, ahora, p ∈ R un elemento primo y supongamos que p divide al continente de f g, es decir,
p | ck , ∀k, 0 ≤ k ≤ d + m.
Como f y g son primitivos, debe existir un cofieciente ai de f al que p no divide y, por la misma
razón, debe existir otro coeficiente bj de g al que p no divide. Podemos definir:
i0 := min{i : p - ai }, j0 := min{j : p - bj }.
Consideremos el término k0 = i0 + j0 de f g, esto es,
X
ck0 := ai bj ∈ R.
i+j=k0

por hipótesis tenemos que p | ck0 . De otro lado, dado un par (i, j) tal que i + j = k0 , pero
i > i0 , tendremos:
i + j = k0 = i0 + j0 , i > i0 =⇒ j < j0 .
luego, como j0 es un mı́nimo, p | bj para cada j < j0 . Habremos probado que
p | (ai bj ), ∀(i, j), i + j = k0 , i > i0 .
De manera análoga se prueba que
p | (ai bj ), ∀(i, j), i + j = k0 , j > j0 .
Por tanto, podemos concluir que p divide a la suma de todos estos objetos (suma finita):
 
X X
p| (ai bj ) + (ai bj ) .
i+j=k0 ,i>i0 i+j=k0 ,j>j0

Pero, tenemos que


 
X X
ck0 = ai0 bj0 +  (ai bj ) + ai bj  ,
i+j=k0 ,i>i0 i+j=k0 ,j>j0

o, lo que es lo mismo
 
X X
ai0 bj0 = ck0 −  (ai bj ) + ai bj  ∈ (p),
i+j=k0 ,i>i0 i+j=k0 ,j>j0

donde (p) es el ideal generado por p en R. Por tanto, hemos concluido que p | ai0 bj0 y R es
DFU, luego p es primo. En particular,
[p | ai0 ] ∨ [p | bj0 ].
Pero ninguna de esas dos afirmaciones se puede dar por la propia definición de i0 y j0 (es decir,
porque p - ai0 y p - bj0 ). Por tanto, el contenido de f g no es divisible por ningún irreducible y,
en particular, cont(f g) debe ser una unidad en R, concluyendo la prueba del enunciado. 

Corollario 2.3.15. Dados dos polinomios univariados f, g ∈ R[X] no nulos, siendo R un


dominio de factorización única, entonces, se tiene:
pp(f g) = pp(f )pp(g), cont(f g) = cont(f )cont(g),
Demostración. Suponganos que tenemos:
a = cont(f ) ∈ R, f1 = pp(f ), b = cont(g) ∈ R, g1 = pp(g).
Entonces, por el resultado precedente, f1 g1 ∈ R[X] es un polinomio primitivo. Además, tenemos
f g = (ab)(f1 g1 ), con a 6= 0, b 6= 0
Luego por el Lema 2.3.13, concluimos que

cont(f g) = (ab), pp(f ) = f1 g1 ,


como afirma el enunciado. 
134 2. PRIMOS Y MAXIMALES

Corollario 2.3.16. Todo divisor en R[X] de un polinomio primitivo es primitivo.


Demostración. Si g | f y f ∈ R[X] es primitivo, entonces existe h ∈ R[X] tal que f = gh.
Por tanto, tenemos:
cont(f ) = 1 = cont(g)cont(h),
y, por tanto, los contenidos de g y h son unidades lo que significa que g y h han de ser
primitivos. 

Lema 2.3.17. Sea R un dominio de ideales principales, K su cuerpo de fracciones y f ∈ R[X]


un polinomio univariado primitivo. Entonces,
f es irreducible en R[X] ⇐⇒ f es irreducible en K[X].
Demostración. Hagamos la demostración de las dos implicaciones:
• =⇒: Supongamos que f es irreducible en K[X]. Y supongamos que f se puede
descomponer en producto f = gh con g, h ∈ R[X]. Entonces, la igualdad se da
también en K[X]. En consecuencia, por ser f irreducible en K[X], tiene que darse
f ∼ g o f ∼ h en K[X]. Supongamos que f ∼ g en K[X], entonces, deg(f ) = deg(g)
y existe λ ∈ K \ {0} tal que λg = f . Existirá b ∈ R tal que bλ ∈ R. Finalmente, sea
c = cont(g) y g1 = pp(g). Tenemos, entonces, que bλg = bf y, por tanto, usando el
Lema 2.3.13 tenemos
pp(bλg) = pp(bf ) = f, cont(bλg) = cont(bf ) = b.
De otro lado,
bλg = (bλc)g1 , con bλc ∈ R.
Por el Lema 2.3.13, como g1 ∈ R[X] es primitivo, tenemos que
cont(bλg) = bλc, pp(bλg) = g1 .
Por tanto,
f = pp(bλg) = g1 ,
Y habremos probado que f | g en R[X]. La condición g | f en R[X] ya la tenı́amos
luego f y g son asociados en R[X]. Los mismo se probarı́a en el caso f ∼ h en K[X],
con lo que habremos probado que
f = gh en K[X] =⇒ f ∼ g ∨ f ∼ h en R[X],
lo que prueba que f es irreducible en R[X].
• =⇒: Supogamos ahora que f es primitivo e irreducible en R[X]. Supongamos que
f = gh en K[X]. En este caso, existen a, b ∈ R \ {0} dos elementos no nulos tales que
ag ∈ R[X], bh ∈ R[X].
Por tanto, tendremos la siguiente igualdad en R[X]:
(ab)f = (ag)(bh).
Sean a1 = cont(ag), g1 = pp(ag), b1 = cont(bh), h1 = pp(bh), luego
(ab)f = (ag)(bh) = (a1 b1 )(g1 h1 ).
Tendremos, por el Lema 2.3.13:
pp((ab)f ) = f,
Mientras que por el Corolario 2.3.15
f = pp((ab)f ) = pp((ag)(bh)) = pp(ag)pp(bh) = g1 h1 .
Como f es irreducible en R[X], tendremos f | g1 o f | h1 en R[X]. Por tanto,
f | (ag) ∨ f | (bh), en R[X].
Como a 6= 0 y b 6= 0 en R, entonces son unidades en K, con lo que concluimos:
f | g ∨ f | h, en K[X].
Lo que implica que f es primo en K[X] y, por tanto, irreducible.

2.3. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 135

Corollario 2.3.18. Con las notaciones anteriores, sea f ∈ K[X] un polinomio no nulo.
Entonces, existe a ∈ R \ {0} tal que af ∈ R[X]. Además, si f es irreducible en K[X], la parte
principal pp(af ) ∈ R[X] es irreducible en R[X] y en K[X].
Demostración. Es lo que se ha probado en el resultado precedente. 

Lema 2.3.19. Sea R un dominio de factorización única, si q(X) ∈ R[X] \ {0} es irreducible
entonces o bien q ∈ R y q irreducible en R o bien q ∈ R[X] \ R es un polinomio no constante
y, en ese caso, es un polinomio primitivo.
Demostración. De la descomposición q = cont(q)pp(q) deducimos que o bien cont(q) ∈
R∗ y q es primitivo o bien cont(q) 6∈ R∗ , en cuyo caso pp(f ) es una unidad en R[X] y, por
tanto, es una constante y q ∈ R∗ . En este segundo caso, q ∼ cont(q) en R y, necesariamente, q
es irreduible en R. 

Teorema 2.3.20 (Lema de Gauss). Si R es un dominio de factorización única, también es


dominio de factorización única el anillo de polinomios R[X1 , . . . , Xn ], para cualquier n ∈ N.
Demostración. En primer lugar observemos que basta con probar la afirmación siguiente:
Afirmación. Si R es dominio de factorización única, entonces el anillo R[X], de polinomios
en una variable con coeficientes en R, también es dominio de factorización única.
Si tenemos probada la afirmación anterior, entonces podemos conluir el teorema por inducción
en n. Ası́, si n = 1, la Afirmación nos garantiza que R[X1 ] es un dominio de factorización única.
Y si n > 1, nótese que
R[X1 , . . . , Xn ] = R[X1 , . . . , Xn−1 ][Xn ].
Como, por hipótesis inductiva, R[X1 , . . . , Xn−1 ] es dominio de factorización única, entonces,
también lo es R[X1 , . . . , Xn−1 ][Xn ] por la Afirmación y, por tanto, también lo será R[X1 , . . . , Xn ].
Por tanto, nos centraremos solamente en probar la afirmación indicada.

Demostración de la Afirmación. Sea f ∈ R[X] un polinomio cualquiera no nulo. Descompong-


amos
f = cont(f )pp(f ).
Sea f1 = pp(f ) ∈ R[X]. Como K[X] es un dominio de factorización única, f1 se descompone
en factores irreducibles únicos en K[X], es decir,
m
Y
f1 ; = qj (X)αj ,
i=1
con qj (X) ∈ K[X] irreducible. Entonces, existen constantes ai ∈ R no nulas, tales que ai qi ∈
R[X] para cada i, 1 ≤ i ≤ m. Escribamos, Fi = pp(aqi ) y tenemos:
 
m m m m
αj α
Y Y Y Y
( aj )f1 = (aj qj (X))αj =  cont(aj qj )αj  Fj j .
j=1 j=1 j=1 j=1

Luego, como f1 es primitivo en R[X] tenemos que, usando el Corolario 2.3.15, concluimos:
     
m m m m m
α α α α
Y Y Y Y Y
f1 = pp  aj j  f1  = pp  cont(aj qj )αj  Fj j  = pp( Fj j ) = Fj j .
j=1 j=1 j=1 j=1 j=1

Además por el Lema 2.3.17, como Fj es primitivo, tendremos que la igualdad siguiente es una
descomposición de f1 en producto de elementos irreducibles en R[X]:
m
α
Y
f1 = Fj j .
j=1

De otro lado, cont(f ) ∈ R factoriza por ser R un dominuo de factorización única mediante:
n
Y
cont(f ) = pβkk ,
k=1
136 2. PRIMOS Y MAXIMALES

donde pk ∈ R es irreducible. Por el Problema 136, si pk es irreducible en R, entonces, pk es


irreducible en R[X]. En conclusión, tenemos la siguiente descomposición de f en producto de
irreducibles:
n m
α
Y Y
f = cont(f )pp(f ) = pβkk Fj j .
k=1 j=1

En cuanto a la unicidad, probemos la siguiente :

Afirmación. Si R es un Dominio de Factorización Única, un elemento f ∈ R[X] es primo si


y solamente si es irreducible.
Demostración de la Afirmación: Por lo visto hasta la fecha, basta con ver que si f ∈ R[X] es
irreducible, entonces es un elemento primo de R[X]. En el caso de que deg(f ) ≤ 0, f serı́a una
constante en R y ya hemos visto que en los dominios de factorización única primo e irreducible
son dos nociones coincidentes (ver Proposición 2.3.4). Supongamos entonces que deg(f ) ≥ 1.
Obsérvese, en primer lugar, que si f es irreducible, entonces, f es primitivo: los coeficientes de
f no pueden tener un máximo común divisor no trivial porque, si ası́ fuera, f serı́a divisible
por un factor irreducible del máximo común divisor de los coeficientes y no serı́a asociado a ese
divisor, que tampoco serı́a unidad en R ni en R[X] (ver Lema 2.3.12).
Supongamos, entonces, a, b ∈ R[X] tales que f | (ab) en R[X]. Por el Lema 2.3.17, f será un
elemento irreducible en K[X] y, como K[X] es un dominio de ideales principales, el Teorema
2.1.10 nos garantiza que f será un elemento primo en K[X]. Por tanto, o bien f | a en K[X] o
bien f | b en K[X]. Sin pérdida de la generalidad, supongamos que f | a en K[X] y concluyamos
que f | a en R[X]. Para ello, supongamos h ∈ K[X] tal que hf = a en K[X]. Tomando un
mı́nimo común múltiplo de los denominadores de h, d ∈ R, podemos suponer que dh ∈ R[X].
Por tanto, concluimos:
(dh)f = (ad).
Sean h1 = pp(dh), λ1 = cont(dh), a1 = ppa(a), λ2 = cont(a). Entonces, la anterior desigualdad
resulta:
λ1 (h1 f ) = λ2 a1 .
Por el Lema de Gauss (Lema 2.3.14) el producto de primitivos es primitivo y, por tanto, h1 f ∈
R[X] es primitivo. Por tanto, h1 f ∼
= a1 en R[X]. Es decir, existe una constante u ∈ R∗ tal que
uh1 f = a.
y, por tanto, f divide al polinomio a en R[X].

El final de la Demostración del Teorema: Juntando las dos afirmaciones anteriores, habremos
probado que todo elemento de R[X] es producto finito de unidades y primos de R[X]. Usando
la Proposición 2.3.2, concluiremos que R[X] es un dominio de factorización única. 

Corollario 2.3.21. Si R es un dominio de factorización única, K su cuerpo de fracciones y


f ∈ R[X] \ {0}. La factorización de f en irreducibles viene dada por:
n m
α
Y Y
f= pβkk Fj j ,
k=1 j=1

donde
Qn
i) cont(f ) = k=1 pβkk es una factorización del contenido de f en producto de irreducibles
de R, Q
m α
ii) pp(f ) = j=1 Fj j es una factorización de pp(f ) como producto de polinomios primi-
tivos e irreducibles en R[X] (y, por tanto, irreducibles en K[X]).
Demostración. Es lo visto en la demostración del Lema de Gauss precendente. 
2.4. ANILLOS E IDEALES EN LA GEOMETRÍA 137

2.3.3. Ejercicios de la Sección 2.3.


Problema 128. Prueba que la parte primitiva de un polinomio es un polinomio primitivo.
Problema 129. Demuestra la afirmación (i) de la Observación 2.3.10.
Problema 130. Demuestra la afirmación (ii) de la Observación 2.3.10
Problema 131. Demuestra la afirmación (iii) de la Observación 2.3.10
Problema 132. Demuestra la afirmación (iv) de la Observación 2.3.10
Problema 133. Demuestra la afirmación y los ejemplos descritos en la Observación 2.3.9
Problema 134. Definir contenido, parte principal y serie primitiva para series de potencias
formales σ ∈ R[[X]], donde R es un dominio de factorización única.
Prueba que si σ, τ ∈ R[[X]] son dos series primitivas, entonces su producto στ ∈ R[[X]] también
es primitiva. (Pista: seguir la prueba del Lema 2.3.14).
Problema 135. Prueba que si K es un cuerpo, el anillo de series de potencias formales K[[X]]
con coeficientes en K es un dominio de ideales principales. (Pista: Prueba que es un anillo con
un único ideal maximal).
Problema 136. Prueba que si R es un DFU y p ∈ R es irreducible, entonces p‘ es irreducible
en R[X] y en R[[X]].
Problema 137. Prueba que si R es un dominio de factorización única, entonces, el anillo de
series de potencias formales R[[X]] en una sola variable es un dominio de factorización única.
Problema 138. Prueba que si R es un dominio de factorización única, A ∈ Mn (R) una matriz
cuadrada con coordenadas en R, el anulador a := AnnR[X] (A) ⊆ R[X] es un ideal principal en
R[X] Se die que R es un dominio normal (o un dominio ı́ntegramente cerrado en su cuerpo de
fracciones).
Problema 139. Sea R un anillo cualquiera, no necesariamente un dominio de factorización
única. Generalicemos la noción de polinomio primitivo del modo siguiente: Un polinomio
f = a0 + a1 X + · · · + an X n ∈ R[X] se dice sub-primitivo si el ideal a := (a0 , . . . , an ) ⊆ R
que generan sus coeficientes satisface a = (1). Probar que dados dos polinomios f, g ∈ R[X] su
producto f g es un polinomio sub-primitivo si y solamente si f y g son sub-primitivos. ( Hint:
Para cada ideal maximal m de R, considérese el conjunto me = mR[X] la extensión de m a
R[X]. Es sencillo verificar que R[X]/me ∼ = (R/m)[X] que es un dominio de ideales principales
porque R/m es un cuerpo. Nótese que si f ∈ R[X], entonces f es sub-primitivo si y solamente
si la clase de f módulo me (f + me ) es no nulo para cualquier maximal m de R. La razón es
porque siempre hay un coeficiente de f que no está en el maximal m de R. Para concluir la
prueba, dados f, g ∈ R[X], supongamos que f g es sub-primtivo. Entonces, para cualquier ideal
maximal m de R, la clase f g + me 6= 0 en (R/m)[X]. Como f g + me = (f + me )(g + me ) 6= 0 y
(R/m)[X] es un dominio de integridad, entonces habremos conlcuido que f + me 6= y g + me 6= 0
en (R/m)[X] para cualquier maimal m de R. por tanto, tanto f como g son subprimitivos en
R[X]. El recı́proco se demuestra por aun argumento similar.)
Problema 140. Probad que el Lema de Gauss (Lema 2.3.14) puede demostrarse por un ar-
gumento idéntico al del problema anterior. Es decir, suponiendo que R es un dominio de
factorización única, repetir el argumento del problema anterior, reemplazando los ideales max-
imales m por los ideales primos p que son principales, es decir, por los ideales primos p de R
que están generados por un elemento irreducible.

2.4. Anillos e Ideales de la Geometrı́a


Esta sección se decicará a mostrar ejemplos de anillos e ideales que provienen de la Geometrı́a,
entendida como estudio de los objetos dados como soluciones (locales o globales) de sistemas
de ecuaciones definidas en un conjunto. Comencemos con unas notaciones básicas:
Definición 55. Sea X un conjunto no vacı́o, sea R un anillos y sea A ⊆ Ap(X, R) un subanillo
del conjunto de aplicaciones de X en R. Introducimos las siguientes nociones:
138 2. PRIMOS Y MAXIMALES

i) Variedad asociada a una función: Sae f ∈ A una función, definimos la variedad


en X asociada a f (o conjunto de ceros asociados a f ) como el subconjunto VX (f ) ⊆ X
dado por la igualdad siguiente:
VX (f ) := {x ∈ X : f (x) = 0}.
ii) Variedad asociada a un conjunto de funciones: Sae F ∈ A una conjunto de fun-
ciones en A, definimos la variedad en X asociada a F (o conjunto de ceros asociados
a F) como el subconjunto VX (f ) ⊆ X dado por la la igualdad siguiente:
\
VX (F) := {x ∈ X : f (x) = 0, ∀f ∈ F} = VX (f ).
f ∈F

En el caso de que F = {f1 , . . . , fs } sea un conjunto finito, escribiremos


VX (f1 , . . . , fs ) := {x ∈ X : f1 (0) =, . . . , fs (x) = 0}.

Observación 2.4.1. Es claro que VX (0) = X, luego X es una variedad (definida por el 0 ∈
A). Por eso, en ocasiones, se dice que VX (F) es una subvariedad de X. Al conjunto de
todas las posibles subvariedades de X definidas por subconjuntos del anillo A se las denomina
subvariedades A−definibles. Según los casos, cuando los anillos tienen semántica propia, las
subvariedades A− definibles tienen nombres especı́ficos.
Proposición 2.4.2. Sea X un conjunto no vacı́o, sea R un anillos y sea A ⊆ Ap(X, R) un
subanillo del conjunto de aplicaciones de X en R. Sea F ⊆ A un conjunto y a ⊆ A. Entonces,
VX (F) = VX (a).
Más aún, la variedad VX (a) es definida como el conjunto de ceros de cualquier conjunto de
generadores de a como ideal y es independiente del conjunto generador elegido.
En particular, las subvariedades A−definibles de X son las subvariedades definidas por los
ideales de A.
Demostración. Es claro que si F := {fi : i ∈ I} genera el ideal a en A, F ⊆ a y,
entonces, \ \
VX (a) = VX (f ) ⊆ VX (f ) = VX (F).
f ∈a f ∈F
Para el otro contenido, sea x ∈ VX (F) y sea f ∈ a un elemento cualquiera. Recordando la
definición de generadores de un ideal (Definición 26), si f ∈ a = (F) existen J ⊆ I un conjunto
finito, y existen {gj : j ∈ J} ⊆ A tales que:
X
f := aj fj .
j∈J

Como la suma de la parte derecha de la igualdad es finita, podemos concluir que


X X
f (x) = gj (x)fj (x) = gj (x).0 = 0.
j∈J j∈J

Por tanto, f (x) = 0 para cualquier f ∈ a, luego x ∈ VX (a) y habremos probado VX (F) ⊆ VX (a)
concluyendo el enunciado. El resto de las afirmaciones son obvias. 

Proposición 2.4.3. Sea X un conjunto no vacı́o, sea R un anillo y sea A ⊆ Ap(X, R) un


subanillo del conjunto de aplicaciones de X en R. Se tiene:
i) Si a ⊆ b son dos ideales del anillo A, entonces VX (b) ⊆ VX (a).
ii) ∅ = VX ((1)), donde (1) es el ideal generado por 1 en A (es decir, el propio A como
ideal dentro de sı́ mismo).
iii) X = VX ((0)), donde (0) = {0} es el ideal de A formado solamente por el 0 ∈ A.
iv) La intersección de una familia cualquiera {V (ai ) : i ∈ I} de subvariedades
PA−definibles
es también una variedad A−definible. De hecho, si b es el ideal suma i∈I ai en A
se tiene \ X
VX (ai ) = VX (b) = VX ( ai ).
i∈I i∈I
v) Si R es un dominio de integridad, dados f, g ∈ A, entonces VX (f g) = VX (f ) ∪ Vx (g).
2.4. ANILLOS E IDEALES EN LA GEOMETRÍA 139

vi) Si R es dominio de integridad, la unión finita de subvariedades A−definibles de X es


también una subvariedad A−definible. De hecho, dados a, b dos ideales de A, entonces
si c es el ideal producto ab en A se tiene
VX (a) ∪ VX (b) = V (c) = VX (ab).
Demostración. Hagamos un repaso a las distintas afirmaciones:
i) Supongamos a ⊆ b, entoces es claro que
\ \
VX (a) = VX (f ) ⊇ VX (f ) = VX (b).
f ∈a f ∈b

ii) Es obvio.
iii) Es obvio. P S
iv) Recuérdese (Definición 28) que i∈I ai es el ideal generador por i∈I ai . Obsérves,
además, que
[ [
VX ( ai ) := {x ∈ X : f (x) = 0, ∀f ∈ ai } ⊆ VX (ai ), ∀i ∈ I.
i∈I i∈I
Luego,
[ X \
(2.4.1) VX ( ai ) = VX ( ai ) ⊆ VX (ai ).
i∈I i∈I i∈I
T P
Para el otro contenido,
S sea x ∈P i∈I VX (ai ) y sea f ∈ i∈I ai dos elementos cua-
lesquiera. Como i∈I ai genera i∈I ai , existirá J ⊆ I un conjunto finito y para cada
(j) (j) (j) (j)
j ∈ J, existirán elementos {f1 , . . . , fkj } ⊆ aj y elementos {g1 , . . . , gkj } ⊆ A en
número finito y elementos tales que:
 
kj
(j) (j)
X X
f=  gi fi  .
j∈J i=1

Ahora, como la suma de la izquierda es una suma finita podemos escribir:


 
kj
(j) (j)
X X
f (x) =  gi (x)fi (x) .
j∈J i=1

Pero como x ∈ VX (ai ) para todo i ∈ I, también se tiene x ∈ VX (aj ) para todo j ∈ J.
(j) (j)
Como {f1 , . . . , fkj } ⊆ aj , para cada j ∈ J, entonces concluimos:
(j)
fi (x) = 0, ∀j ∈ J, ∀i, 1 ≤ i ≤ kj .
Por tanto, la igualdad precedente se puede escribir como:
   
kj kj
(j) (j) (j)
X X X X
f (x) =  gi (x)fi (x) =  gi (x) · 0 = 0,
j∈J i=1 j∈J i=1

donde hemos podido igualar


T a cero por ser suma finita. Hemos
P concluido que f (x) = 0
para cualesquiera x ∈ i∈I VX (ai ) y para cualquier f ∈ i∈I ai , por tanto,
\ X
VX (ai ) ⊆ VX ( ai ),
i∈I i∈I

lo cual nuto a la inclusión descrita en la ecuación 2.4.1 termina la demostración de


esta afirmación.
v) Sea f, g ∈ A, si x ∈ VX (f ) entonces f (x) = 0, luego f g(x) = f (x)g(x) = 0 y, por
tanto, x ∈ VX (f g). Haciendo lo mismo con los elementos de VX (g) concluiremos
VX (f ) ∪ VX (g) ⊆ VX (f g).
De otro lado, si x ∈ VX (f g), entnces f g(x) = f (x)g(x) = 0. Como R es un dominio
de integridad, y f (x), g(x) ∈ R, entonces tiene que darse f (x) = 0 o g(x) = 0. En
conclusión, si x ∈ VX (f g), entonces x ∈ VX (f ) o VX (g) y habremos probado:
VX (f ) ∪ VX (g) ⊇ VX (f g),
140 2. PRIMOS Y MAXIMALES

lo que con la inclusión anterior demuestra la afirmación buscada.


vi) Aplicando inducción, la afirmación sobre la unión finita se sigue inmediatamente si
somos capaces de demostrar que la unión de dos subvariedades es subvariedad. Con-
sideremos, entonces, este caso y sean a, b dos ideales de A y c es el ideal producto ab
en A. Hemos visto que
c = ab ⊆ a ∩ b,
Luego, c ⊆ a y c ⊆ b, lo cual implica
VX (a) ⊆ VX (c) = VX (ab), VX (b) ⊆ VX (c) = VX (ab),
con lo que concluimos:
(2.4.2) VX (a) ∪ VX (b) ⊆ VX (c) = VX (ab).
Para el otro contenido, necesitamos la hipótesis de que R es un dominio de integridad.
Recordemos que el ideal producto c es el ideal generador por el conjunto siguiente:
F := {f g : f ∈ a, g ∈ b}.
Por tanto, sus ceros comunes son los ceros comunes a uno cualquiera de los sistema
de generadores como ideal. Esto implica
\ \
VX (c) = VX (f g) = VX (f g).
f g∈F f ∈a,g∈b

Usando la propiedad (v) de este mismo enunciado, concluiremos:


\
VX (c) = (VX (f ) ∪ VX (g)) .
f ∈a,g∈b

Aplicando la distributiva de conjuntos concluiremos:


   
\ \
VX (c) =  VX (f ) ∪  VX (g) = VX (a) ∪ VX (b).
f ∈a g∈b

Observación 2.4.4 (Topologı́a de Zariski). De la anterior proposición se infiere, que dado


un conjunto X, un dominio de integridad R y un subanillo A de Ap(X, R) el conjunto de las
subvariedades A−definibles
{VX (a) : a es un ideal de R},
define una única topologı́a en X en la que dicho conjunto es la clase de cerrados. A esa topologı́a
se la denomina topologı́a de Zariski sobre X dada por el anillo A y la denotaremos mediante
TZ (A). Discutiremos los diversos ejemplos en las páginas que siguen.

Ejemplo 2.4.5 (Ceros de funciones continuas a valores reales). Sea (X, T ) un espacio
toplológico sea R = R el cuerpo de lso números reales y A = C 0 (X) el anillo de las funciones
contı́nuas de X en R. Podemos definir conjuntos como:
VX (f ) := {x ∈ X : f (x) = 0} := f −1 ({0}).
El conjunto VX (f ) es obviamente un cerrado en X y resulta fácil observar algunas identidades
elementales como las siguientes:
VX (f ) ∪ VX (g) := VX (f.g), VX (f ) ∩ VX (g) := VX (f 2 + g 2 ).
Sobre los reales se da un patologı́a especial y es que intersecciónes finitas de subvariedades
definidas por una sola ecuación son también subvariedades definidas por una sola ecuación.
Esto no necesraimente ocurre para una colección infinita de ecuaciones dadas por funciones
continuas a valores reales definidas sobre un espacio topológico.
En todo caso, observamos que la toplogı́a de Zariski TZ (C 0 (X)) definida sobre X por las fun-
ciones continuas es una topologı́a menos fina que la topologı́a T dada inicialmente, es decir,
TZ (C 0 (X)) ⊆ T .
2.4. ANILLOS E IDEALES EN LA GEOMETRÍA 141

Ejemplo 2.4.6 (Funciones diferenciables sobre abiertos de Rn ). Podemos suponer que


X ⊆ Rn es un abierto en Rn , que el anillo R = R es el cuerpo de los números reales y que nuesto
anillo A tiene en cuenta condiciones de diferenciablidad de algunas funciones. Por ejemplo,
A ∈ {C ω (X) ⊆ C ∞ (X) ⊆ C k (X) ⊆ C 1 (X)},
todos ellos subanillos de C 0 (X). De nuevo la topologı́a de Zariski definida por A es una toplogı́a
hecha de cerrados de X para la toplogı́a usual en X inducida por la de Rn . El siguiente resultado
suele ser atribuido a Withney:
Teorema 2.4.7 (Withney). Dado cualquier subconjunto cerrado F ⊆ Rn , existe una función
f ∈ C ∞ (Rn ) tal que
F = VRn (f ).
No haremos la prueba que corresponde aotro curso bien de Análisis o de Geometrı́a Diferencial.
En todo caso, este resultado permite concluir
Corollario 2.4.8. Si X es un abierto de Rn y A es un anillo en la familia
{C k (X) : 0 ≤ k ≤ ∞}.
Entonces, la topologı́a de Zariski sobre X definida por A es la toplogı́a usual, es decir,
TZ (A) = Tu .
Demostración. El Teorema atribuido a Withney nos garantiza que todo cerrado en X
es una variedad A−definible si A = C ∞ (X). Por tanto es también A−definible para todo los
anillos que contienen a A como subanillo y, además, son cerrados para las respectivas topologı́as
de Zariski. 

Ejemplo 2.4.9 (Subvariedades definidas localmente). Dadas dos variedades diferencibles


M y una función f : M −→ N , para cada punto a ∈ M denotaremos por Ta f la función
tangente alrededor del punto a. Es decir,
Ta f : Ta M −→ Tf (a) N.
Se tiene la siguiente caracterización clásica de las subvariedades de una variedad:
Teorema 2.4.10 (Caracterización de subvariedades). Sea M una variedad de dimensiń m y N
un subconjunto. Entonces, N es subvariedad de M si y solamente si para cada punto a ∈ N
existe un entorno abierto U de a en M y existen funciones f1 , . . . , fm−n ∈ C ∞ (U ) tales que
• N ∩ U = VU (f1 ), · · · , fm−n ).
• Dada la aplicación f := (f1 , . . . , fm−n ) : M −→ Rm−n , la aplicación tangente asociada
Ta f : Ta M −→ T0 Rm−n es suprayectiva (submersión), donde 0 ∈ Rn−m es el origen
de coordenadas.
Aunque no lo demostraremos, la prueba se basa en el Teorema del Rango Constante. En es-
encia, lo que dice este enunciado es que las suvariedades en términos de geometrı́a diferencial
son aquellos subconjuntos que, localmente, son cerrados para la toplogı́a de Zariski, dados por
un número finito de ecuaciones que satisfacen alguna propiedad adicional. Se dice que son,
localmente, cerrados lisos de la topologı́a de Zariski dada por el anillo de funciones C ∞ (X).

Ejemplo 2.4.11 (Ceros de una función a valores complejos). A partir de una función
continua f ∈ C 0 (X, C) podemos definir el conjunto de sus ceros comunes en X:
VX (f ) := {x ∈ X : f (x) = 0} := f −1 ({0}).
El conjunto VX (f ) es, de nuevo, cerrado en X y resulta fácil observar algunas identidades
elementales como VX (f ) ∪ VX (g) := VX (f.g).

Ejemplo 2.4.12 (Polinomiales K−definibles.). Sea K un cuerpo y K un cuerpo algebraica-


mente cerrado que le contiene. En muchos casos supondremos que K es la clausura algebraica de
K, pero dejamos abierta la posibilidad de que sea un cuerpo algebraicamente cerrado más am-
plio. Ahora consideremos aplicaciones Ap(Kn , K). Consideremos las proyecciones canńonicas:
πi : Kn −→ K, 1 ≤ i ≤ n,
142 2. PRIMOS Y MAXIMALES

donde πi es la proyección en la i−ésima coordenada. Consideremos ahora las aplicaciones


constantes definidas por elementos en K. Y consideremos el menor subanillo de Ap(Kn , K) que
contiene a las proyecciones {π1 , . . . , πn } y a las aplicaciones constantes definidas por elementos
de K. Denotemos ese anillo por K[Kn ] := K[π1 , . . . , πn ]. A este anillo se le denomina anillo
de las funciones polinomiales K−definibles sobre Kn .Se tiene el siguiente resultado:
Proposición 2.4.13. Con las anteriores notaciones,
K[Kn ] = K[π1 , . . . , πn ] ∼
= K[X1 , . . . , Xn ].
Demostración. Como ya hemos dicho, vamos a identificar πi con Xi . Por lo visto en
la subsección 1.3.1 todos los elementos f ∈ K[X1 , . . . , Xn ] admiten una representación de la
forma: X
f := aµ X1µ1 · · · , Xnµn .
|µ|≤d
Entonces, podemos asociar a cada f ∈ K[X1 , . . . , Xn ] una aplicación
ϕf : Kn −→ K,
mediante
X
(2.4.3) ϕf (x) := aµ π1 (x)µ1 · · · πn (x)µn .
|µ|≤d

Esto define una aplicación Φ : K[X1 , . . . , Xn ] −→ Ap(Kn , K) dada mediante Φ(f ) := ϕf ∈


Ap(Kn , K). Es claro también que Φ es un morfismo de anillos, luego la imagen Φ(K[X1 , . . . , Xn ])
es un subanillo de Ap(Kn , K). Es claro también que esa imagen contiene al cuerpo K (funciones
constantes en K dentro de Ap(Kn , K)). También es obvio que contiene a las proyecciones
πi := Φ(Xi ). Pero, además, si un subanillo contiene a K y a las proyecciones πi , 1 ≤ i ≤ n,
entonces también contiene a toda expresión de la forma dada en la Ecuación (2.4.3) anterior. Por
tanto, Φ(K[X1 , . . . , Xn ]) es el menor subanillo de Ap(Kn , K) que contiene a K a las proyecciones
π1 , . . . , πn . Es decir, Φ(K[X1 , . . . , Xn ]) = K[Kn ].
Para verificar la Proposición, sólo nos queda verificar que Φ es inyectiva. Para eso, recurrimos
al Problema 44. Como todo cuerpo algebraicamente cerrado es de cardinal infinito, dado
f ∈ K[X1 , . . . , Xn ], si ϕf (x) = 0, ∀x ∈ Kn , entonces f = 0 en K[X1 , . . . , Xn ] y Φ es inyectiva,
con lo que concluimos el enunciado. 
En muchos casos escribiremos f en lugar de ϕf para denotar la función polinomial definida por
un polinomio f ∈ K[X1 , . . . , Xn ]. En esos casos, se debe tener en mente la dualidad entre los
conceptos de función y polinomio.
Nótese también que esta identidad depende fuertemente de la condición K es un cuerpo de
cardinal infinito. Si hubiésemos considerado Ap(K n , K) con K cuerpo finito, no es cierto
que K[X1 , . . . , Xn ] sea isomorfo al menor subanillo de Ap(K n , K) que contiene a K y a las
proyecciones Pi : K n −→ K.

Ejemplo 2.4.14 (Variedades algebraicas afines). Sea K un cuerpo y K una extensión


algebraicamente cerrada de K. Consideremos ahora f ∈ K[X1 , . . . , Xn ] un polinomio con
coeficientes en K y sea ϕf : Kn −→ K la función polinomial que define. Denotaremos por
VK (f ) al conjunto:
VK (f ) := VKn (ϕf ) := {x ∈ Kn : ϕf (x) = 0} = ϕ−1
f (0).

De hecho, por simplicidad, escribiremos a partir de ahora f (x) = 0 en lugar de ϕf (x) = 0


y f −1 (0) en lugar de ϕ−1f (0). A todo conjunto de la forma VK (f ) con f ∈ K[X1 , . . . , Xn ]
se le denomina hipersuperficie algebraica afı́n K−definible. En el caso K = K, omitiremos
el subı́ndice K (escribiremos simplemente V (f )) y diremos que V (f ) es una hipersuperficie
algebraica afı́n.
Para un conjunto finito de polinomios f1 , . . . , fm ∈ K[X1 , . . . , Xn ] escribiremos
VK (f1 , . . . , fm ) = VK (f1 ) ∩ · · · VK (fm ).
n
Todo subconjunto de K de la forma VK (f1 , . . . , fm ), con f1 , . . . , fm ∈ K[X1 , . . . , Xn ] se denoina
variedad (o conjunto algebraico) afı́n K−definible. En el caso K = K, diremos simplemente
variedad algebraica afı́n.
2.4. ANILLOS E IDEALES EN LA GEOMETRÍA 143

En ocasiones, sin embargo, no interesa analizar toda la variedad algebraica afı́n VK (f1 , . . . , fm )
sino simplemente los llamados puntos K−racionales que denotaremos mediante:

VK (f1 , . . . , fm ) := VK (f1 , . . . , fm ) ∩ K n .
Estos objetos son especialmente relevantes cuando K es un cuerpo primo (i.e. K = Z/pZ o
K = Q) y se convierten en los objetos de estudio de la Geometrı́a Diofántica o Aritmética
(Teorı́a de Números).

Ejemplo 2.4.15 (Las Variedades Anaı́ticas). Se consideran esencialmente dos casos:


• A = C ω (X, R) con X ⊆ Rn abierto, es decir el anillo de funciones analı́ticas a valores
reales,
• A = H(X), con X ⊆ Cn un abierto, es decir el anillo de funciones holomorfas (i.e.
analı́ticas complejas) definidas en X.
En este caso, la toplogı́a de Zariski TZ (A) está formada sólo por una parte de los cerrados de
la toplogı́a usual en X (tanto en el caso real como en el complejo). De hecho, se puede probar
el siguiente resultado en Geometrı́a Analı́tica:
Proposición 2.4.16. Sea K = R ∨ C, sea X ⊆ Kn un abierto conexo y sea a un ideal en H(X)
(si K = C) o ideal en C ω (X) (si K = R). Entonces, VX (a) ⊆ X es o bien coincidente con X o
bien es un conjunto de interior vacı́o y de medida (de Lebesgue) nula. En particular, todos los
cerrados F ⊆ X propios de la toplogı́a de Zariski son conjuntos de interior vacı́o y medida de
Lebesgue nula.
La demostración no la daremos aquı́ porque exige una fuerte introducción previa en variable
compleja y funciones analı́ticas reales que no se corresponde al nivel del curso.
Ejemplo 2.4.17 (Variedades Proyectivas, Ideales Homogéneos). No podemos acabar sin
citar un ejemplo más de variedades (en el sentido de conjuntos de ceros) que son esenciales
para entender la Geometrı́a: Las variedades proyectivas.
Comencemos recordando el espacio proyectio. Sea K un cuerpo y K uns extensión. Consider-
emos el espacio vectorial Kn+1 , el subconjunto Kn+1 \ {0} y la relación de equivalencia sobre
Kn+1 \ {0} dada mediante:
x ∼ y ⇐⇒ ∃λ ∈ K, x = λy.
n+1

El conjunto cociente K \ {0} / ∼ se denomina espacio proyectivo de dimensión n sobre K
y se denota mediante Pn (K)4. Se considera la proyección canónica
π : Kn+1 \ {0} −→ Pn (K)
que, en los casos K = R ∨ C, define una topologı́a cociente (topologı́a final a través de π) en
Pn (K). A los puntos π(x0 , x1 , . . . , xn ) los representaremos mediante (x0 : x1 : · · · : xn ) al estilo
de la escuela “francesa”.
En estos casos, el espacio proyectivo también tiene una estructura de variedad diferenciable (de
Riemann en el caso K = R y de Kähler en el caso K = C).
• En el caso real, podemos identificar isométricamente (como variedades de Riemann)
Pn (R) con el cociente S n /S 0 , entendiendo por S 0 := {±1} la versión mutiplicatica del
grupo abeliano Z/2Z y la relación “ser puntos antipodales”. En esta caso, un punto
proyectivo repreernta dos puntos sobre S n .
• En el caso complejo, identificamos Pn (C) con el coenciente S 2n+1 /S 1 , donde S 2n+1
es la esfera unidad en Cn+1 con la métrica hermı́tica canónica y S 1 es visto como el
grupo de los números complejos de valor absoluto 1, actuando sobre S 2n+1 . En este
caso un punto en Pn (C) representa un gran cı́rculo (una geodésica) en S 2n+1 .
Supongamos dado ahora un polinomio f ∈ K[X0 , . . . , Xn ] y consideremos la función polinomial
que define:
f : Kn+1 −→ K.

4Otras notaciones que se encuentran en la literatuyra son: KPn , Pn K, etc... Nosotros mantendremos la
propuesta Pn (K).
144 2. PRIMOS Y MAXIMALES

Observamos que esta función no siempre es “trasladable” al espacio proyectivo. Para “trasladarla”
haremos un análisis adicional. Supongamos que f ∈ Hd es un polinomio homogéneo de grado d.
Entonces, para todo λ ∈ K y para todo x ∈ Kn+1 observamos que se tiene la igualdad siguiente:
f (λx) = λd f (x).
Esta identidad permite dos reflexiones en dos sentidos distintos:
• Si f es un polinomio homogéneo y x, y ∈ Kn+1 son dos representantes de un mismo
punto proyectivo x, y ∈ π −1 (ζ), ζ ∈ Pn (K), entonces f (x) = 0 si y solamente si f (y) =
0 y tiene sentido considerar el conjunto VPn (K) (f ) ⊆ Pn (K). Más aún, llamaremos
variedad proyectiva K−definible a todo subjconjunto V ⊆ Pn (K) tal que existe un
conjunto finito de polinomios homogéneos f1 , . . . , fs ∈ K[X0 , ldots, Xn ] verificando:
V = VPn (K) (f1 , . . . , fs ) := {ζ ∈ Pn (K); : f1 (ζ) = 0, . . . , fs (ζ) = 0}.
Los ideales a ⊆ K[X0 , . . . , Xn ] que son generados por un conjunto finito de polinomios
homogéneos se denominan ideales homogéneos en K[X0 , . . . , Xn ] y se denota medi-
ante VPn (K) (a) a la variedad proyectiva K−definible dada por uno cualquiera de sus
sistemas de generadores homogéneos. Cuando K = K y le dimensión n sea concocida,
escribiremos simplemente VP (a).
• Ya hemos visto que, en general, no tiene sentido considerar polinomios homogéneos
como funciones sobre un espacio proyectivo. Sin embargo, sı́ podemos considerar lo
siguiente: Sean f, g ∈ Hd ⊆ K[X0 , . . . , Xn ] dos polinomios homog’eneos del mismo
grado y sean y, y ∈ Kn+1 dos representantes del mismo punto proyectivo (x0 : x1 :
· · · : xn ) ∈ Pn (K). Sea D(g) := VPn (K) (g)c ⊆ Pn (K) el complementario de VPn (K) (g)
en Pn (K). Entonces, podemos definir la función:
f /g : D(g) ⊆ Pn (K) −→ K,
f (ζ)
ζ 7−→ g(ζ) .
Esta función está bien definida y no depende sino del punto proyectivo ζ y no de sus
representantes. Se denomina función regular (o función racional) K−definible sobre
Pn (K). Obérvese una interpretación aviesa de la función anterior como:
(f : g) : D(g) ⊆ Pn (K) −→ P1 (K),
ζ 7−→ (f (ζ) : g(ζ)).
Y VPn (K) (f ) ∩ D(g) son los puntos de D(g) que “se van al infinito” mediante (f : g).

2.5. Formal Normal de Smith


En la Subseccines 2.2.3 y 2.2.4 hemos visto que sobre dominios dominios de ideales principales y
sobre dominios euclı́deos, en el caso de módulos finitamente generados, libre equivale a libre de
torsión.Vamos a ver esta idea en acción a través de la diagonalización de matrices sobre ambos
casos de anillos.
2.5.1. Motivaciones.
2.5.1.1. Ecuaciones diofánticas. La forma normal de Smith nos permitirá analizar sistemas
de ecuaciones lineales sobre un DIP y nos permitirá disponer de “algoritmos” en el caso de que
ese anillo ea un dominio euclı́deo. En esencia, sean dados
i) Una matriz A ∈ scrMm×n (R) con m filas, n columnas y coordenadas en un dominio
de ideales principales R.
ii) Un elemento B ∈ Rm dado como columna.
iii) Una columna de variables X:
 
X1
 X2 
X :=  .  .
 
 .. 
Xn
el objetivo onsiste en resolver el sistema de ecuaciones sguiente:
(2.5.1) AX = B.
Se trata de resolver y responder a las siguentes preguntas:
2.5. FORMAL NORMAL DE SMITH 145

• ¿Es el sistema (2.5.1) compatible sobre Rn ?. Es decir, responde a la siguiente pregunta:


∃x := (x1 , . . . , xn ) ∈ Rn , Axt = B?,
donde xt significa traspuesta de x.
• Si el sistema (2.5.1) es compatible, hallar una solución particular x0 ∈ Rn de ese
sistema.
• Da una descripción completa del conjunto de todas las soluciones del sistema (2.5.1).
Para la tercera de las preguntas ya tenemos una resuesta parcial. Supongamos que x0 ∈ Rn
es una solución particular del sistema (2.5.1). Entonces, consideramos el conjunto K ⊆ Rn de
todas las soluciones del sistema mohogénoa asociado al sistema (2.5.1) anterior. Es decir, el
sistema:

(2.5.2) AX = 0,
donde 0 es el vector columna formado solamente por ceros. Entonces se tiene:
Proposición 2.5.1. Con las anteriores notaciones, supongamos que existe x0 ∈ Rn una
solución partiular de un sistema de ecuaciones del tipo (2.5.1) anterior y sea K ⊆ Rn el
conjunto de las solciones del sistema (2.5.2) homogéneo asociado. Entonces, el conjunto de
todas las soluciones del sistema (2.5.1) es dado por el conjunto:
x0 + K := {x0 + u : u ∈ K} ⊆ Rn .
Más aún, K es un submódulo libre de Rn de rango a lo sumo n. Una descripción completa de
las soluciones de un sistema (2.5.1) compatible vendrı́a dada por la siguiente información:
i) La solución particular x0 ∈ Rn ,
ii) Una base de K como R−módulo libre: β := {v1 , . . . , vn } ⊆ Rn .
El conjunto de todas las soluciones del sistema (2.5.1) en forma paramétrica vendrı́a dado por:
m
X
x0 + K := {x0 + ti vi : (t1 , . . . , tm ) ∈ Rm }.
i=1

Demostración. No hay mucho que demostrar en virtud de todo lo discutido en secciones


precedentes. Es obvio. 
2.5.1.2. Módulos Finitamente Generados sobre un DIP. De forma dual, también podemos
analizar el objetivo se esta Sección mediante el estudio de los R−módulos finiamente genrados
sobre un dominio de ideales principales. La siguiente Proposición explica el fenómeno del que
disponemos.
Proposición 2.5.2. Sea R un dominio de ideales principales y M un R−módulo finitamente
generado. Entonces, M es el cociente de dos R−módulos libres de rango finito sobre R o,
equivalentemente, M es el co-núcelo de un morfismo de R−módulos entre dos R−módulos
libres de rango finito.
Demostración. De nuevo es obvio a partir de lo visto en Secciones anteriores. Basta con
considerar un epimorfismo π : Rn −→ M que obviamente existe por ser M finitamente generado
sobre R. Entonces, el núcleo de π es un submódulo K ⊆ Rn y, por lo estudiado en secciones
anteriores, K es un R−módulo libre. Obviamente tendremos que M ∼ = Rn /K. Claramente
también, si consideramos la inclusión
i : K ,−→ Rn ,
M es el co-núcleo de esa inclusión. 
2.5.2. Matrices de Operaciones Elementales sobre DIP’s. Comenzamos con la de-
scripción de la construcción de la Forma Normal de Smith de una matriz. Comencemos recor-
dando aquı́ el Corolario 1.5.9
Corollario 2.5.3. Si A ∈ Mn (R) es una matriz tal que det(A) ∈ R∗ es una unidad de R,
entonces, A es una matriz inversible y, además,
A−1 = det(A)−1 Adj(A) ∈ Mn (R).
146 2. PRIMOS Y MAXIMALES

La siguiente es una definición de las matrices Elementales por filas sobre un dominio de ideales
principales.
Proposición 2.5.4. [Matrices Elementales sobre un dominio de integridad] Sean dados
m, n ∈ N dos enteros positivos y R un dominio de integridad. Sea P ∈ M2 (R) una matriz
inversible sobre R, dada mediante:  
α β
P := ,
σ τ
con inversa  
τ −β
P −1 := ε ,
−σ α
con ε = det(P )−1 ∈ R∗ .
Para r = m ∨ n. Para 1 ≤ i, j ≤ r, consideremos las matrices Ei,j (P ) ∈ Mr (R) siguientes:
 
1 0
 .. 

 . 

0 1 
 

 α β 

Ei,j (P ) := 
 .. .

 . 

 σ τ 


 1 0 


 . ..


0 1
Estas matrices, verifican las propiedades siguientes:
i) Las matrices Ei,j (P ) matrices inversibles en Mr (R) y sus inversas son Ei,j (P −1 ), es
decir Ei,j (P )Ei,j (P −1 ) = Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, de la forma:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 a c 

A := 
 .. ,

 . 

 b d 


 ∗ ∗

 . .

 . 
∗ ∗
donde ∗ representa elementos de R. Entonces, tomando r = m, la matriz Ei,j (P )A
es la matriz con una forma como la siguiente:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 αa + βb αc + βd 

Ei,j (P )A := 
 . .. ,

 

 σa + τ b σc + τ d 


 ∗ ∗
 .. 
 . 
∗ ∗
es decir,
• la fila i−ésima de Ei,j (P )A es la suma de la fila i−ésima de A multiplicada por
α más la fija j−ésima de A multiplicada por β,
2.5. FORMAL NORMAL DE SMITH 147

• la fila j−ésima de Ei,j (P )A es la suma de la fila i−ésima de A multiplicada por


σ más la fija j−ésima de A multiplicada por τ ,
dejando sin modificar el resto de filas.
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, como en el ejemplo
anterior, tomando r = n, la matriz AEi,j (P ) es la matriz de la forma:

∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 αa + σc βa + τ c 

AEi,j (P ) := 
 .. ,

 . 

 αb + σd βb + τ d 


 ∗ ∗
 .. 
 . 
∗ ∗
es decir,
• la columna i−ésima de AEi,j (P ) es la suma de la columna i−ésima de A multi-
plicada por α más la columna j−ésima de A multiplicada por σ,
• la columna j−ésima de AEi,j (P )A es la suma de la columna i−ésima de A mul-
tiplicada por β más la columna j−ésima de A multiplicada por τ ,
dejando sin modificar el resto de columnas.
A las matrices Ei,j (P ) anteriores se las denomina matrices elementales sobre un dominio de
ideales principales R.
Demostración. Ejercicio de mera comprobación. 
2.5.3. Matrices elementales particulares. Sea R un dominio de ideales principales.
Consideraremos las siguientes clases de matrices elementales:
Corollario 2.5.5 (Intercambiar dos filas o dos columnas). Consideremos la matriz
 
0 1
P := ∈ M2 (R).
1 0
Sea r = m ∨ n, entonces, las matrices
Ei,j := Ei,j (P ),
verifican las propiedades siguientes:
2
i) Son matrices inversibles en Mr (R) y sus inversas son ellas mismas, es decir Ei,j =
Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = m, la
matriz Ei,j A es la matriz obtenida intercambiando las filas i y j de la matriz A.
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = n, la matriz
AEi,j es la matriz obtenida intercambiando las columnas i y j de la matriz A.
Demostración. Basta con aplicar la Proposición 2.5.4. 
Corollario 2.5.6 (Multiplicar una fila o columna por una unidad). Sea u ∈ R∗ una
unidad en el anillo R. Consideremos la matriz
 
u 0
P := ∈ M2 (R),
0 1
cuya inversa es la matriz:
u−1
 
−1 0
P := ∈ M2 (R),
0 1
Sea r = m ∨ n, entonces, las matrices
Ti (u) := Ei,j (P ),
verifican las propiedades siguientes:
148 2. PRIMOS Y MAXIMALES

i) Son matrices inversibles en Mr (R) y sus inversas son dadas por la inversa de P , es
decir Ti (u)Ti (u−1 ) = Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = m, la
matriz Ti (u)A es la matriz obtenida multiplicando la fila i de A por u.
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = n, la matriz
ATi (u) es la matriz obtenida multiplicando la columna i de la matriz A por u.

Demostración. De nuevo, basta con aplicar la Proposición 2.5.4. 

Corollario 2.5.7 (Sumar a una fila o columna un múltiplo de otra fila o columna).
Sea a ∈ R un elemento cualquiera en el anillo R. Consideremos la matriz
 
1 0
P := ∈ M2 (R),
a 1

cuya inversa es la matriz:


 
−1 1 0
P := ∈ M2 (R),
−a 1
Sea r = m ∨ n, entonces, las matrices

Si,j (a) := Ei,j (P ),

verifican las propiedades siguientes:


i) Son matrices inversibles en Mr (R) y sus inversas son dadas por la inversa de P , es
decir Si,j (a)Si,j (−a) = Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = m, la
matriz Si,j (a)A es la matriz obtenida sumando a la fila i de A su fila j multiplicada
por a.
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = n, la matriz
ASi,j (a)) es la matriz obtenida sumando a la columna i de la matriz A la columna j
multiplicada por a.

Demostración. De nuevo, basta con aplicar la Proposición 2.5.4. 

Corollario 2.5.8 (Reemplazar dos elementos de una columna (o fila) por su máximo
común divisor y algún otro elemento en el ideal que generan). Sean a, b ∈ R dos
elementos en un dominio de ideales principales y sea h su máximo común divisor. Sean α, β ∈ R
dos elementos que verifican la identidad de Bézout para a y b. Es decir,

αa + βb = h.

Sean σ, τ ∈ R los elementos dados mediante:


a b
σ := , τ := .
h h
Sea P la matriz P ∈ M2 (R) dada mediante
 
α β
P := .
−τ σ

Se tiene:
i) La matriz P es una matriz inversible, con matriz inversa:
 
σ −β
P −1 := .
τ α

Por tanto, la matriz Ei,j (P ) asociada a esta operación elemental (en el sentido de la
Proposición 2.5.4 anterior) es inversible.
2.5. FORMAL NORMAL DE SMITH 149

ii) Supongamos dada una matriz A ∈ Mm×n (A) de la forma siguiente:


∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 a c 

A := 
 .. .

 . 

 b d 


 ∗ ∗ 


 . ..


∗ ∗
Entonces, se tiene:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 h ∗ 

Ei,j (P )A = 
 .. ,

 . 

 h0 ∗ 


 ∗ ∗
 .. 
 . 
∗ ∗
con h | h0 . Es decir, en la columna i−ésima hemos reemplazado los elementos {a, b}
por su máximo común divisor y otro elemento del ideal generado por {a, b} en R (en
la fila i−ésima de esa columna aparece el máximo común divisor y en la fila j−ésima
de esa columna otro elemento del mismo ideal).
iii) Con las mismas notaciones, supongamos que la matriz A es dada mediante:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 a b 

A := 
 . .. .

 

 c d 


 ∗ ∗
 . .

 . 
∗ ∗
Entonces, se tiene:
∗ ∗
 
 .. 

 . 

∗ ∗ 
h0
 

 h 

AEi,j (P ) = 
 .. ,

 . 

 ∗ ∗ 


 ∗ ∗
 .. 
 . 
∗ ∗
donde h | h0 . Es decir, en la fila i−ésima hemos reemplazado los elementos {a, b}
por su máximo común divisor y otro elemento del ideal generado por {a, b} en R (en
150 2. PRIMOS Y MAXIMALES

la columna i−ésima de esa fila aparece el máximo común divisor y en la columna


j−ésima de esa fila otro elemento del mismo ideal).
Demostración. Para la propiedad i) basta con observar que:
a b αa + βb
det(P ) = ασ − (−τ )β = α + β = = 1.
h h h
El resto se sigue de la Proposición 2.5.4. Para el resto de afirmaciones, basta con verificarlo
para matrices 2 × 2, y para operaciones elementales por filas. Ası́, sea A ∈ M2 (R) una matriz
de la forma:  
a c
A := .
b d
Se tiene que:     
α β a c h ∗
P A := = ,
−τ σ b d h0 ∗
donde h0 = (−τ )a + σb ∈ (a, b) = (h). Como h es el máximo común divisor de a y b, entonces
h | h0 y tenemos el resto de las afirmaciones.

2.5.4. Orlar una matriz. Sea dada una matriz A ∈ Mm×n (R), donde R es un dominio
de ideales principales.
Orlar la matriz A: Consiste en añadir a la matriz A las matrices identidades correspondi-
entes del modo siguiente:
 
Idm A
Orl(A) := .
0 Idn
A lo largo de proceso iremos haciendo cambios sobre Orl(A) cion las reglas siguientes: Supong-
amos que tenemos una matriz orlada de la forma:
 
S B
Orl := .
0 T
• Regla por filas: Cada vez que realicemos un cálculo sobre B por filas, se hará a lo
largo de toda la fila de Orl (es decir, afectará a la fila de B y a la fila correspondiente
de S).
• Regla por columnas: Cada vez que realicemos un cálculo sobre B por columnas,
se hará a lo largo de toda la columna de Orl (es decir, afectará a B y a la columna
correspondiente de T ).
Proposición 2.5.9. Supongamos realizados un número finito de pasos sobre la matriz Orl(A)
basados en operaciones elementales por filas y columnas del tipo descrito en las Proposición
2.5.4 (es decir, multiplicando por filas o columnas por matrices del tipo Ei,j (P ) y respetando
las dos reglas anteriores). Supongamos que obtenemos una matriz
 
S B
Orl := ,
0 T
tras ese número finito de pasos. Entonces,
SAT = B,
y, además, las matrices S y T son inversibles sobre R y son producto finito de matrices ele-
mentales del tipo Ei,j (P ).
Demostración. Las dos Reglas (por filas y columnas) con el uso de matrices elementales
se traducen, en realidad, en lo siguiente. Supongamos dada una matriz orlada:
 
S B
Orl := ,
0 T
tal que
SAT = B.
Si hacemos una operación por filas, determinada por una matriz Ei,j (P ) estmoa diciendo que
obtenemos una nueva matriz orlada:
2.5. FORMAL NORMAL DE SMITH 151

S0 B0
 
0
Orl := ,
0 T0
donde
S 0 = Ei,j (P )S, B 0 = Ei,j (P )B, T 0 = T.
Nótese que, al ser por filas, T permanece sin cambios. Entonces, podemos concluir:
• Si S ∈ GL(m, R) era inversible sobre R, como Ei,j (P ) es inversible sobre R, entonces
S 0 = Ei,j (P )S es también inversible.
• Si SAT = B, entonces
S 0 AT 0 = (Ei,j (P )S)AT = Ei,j (P )(SAT ) = Ei,j (P )B = B 0 .
Del mismo modo, la propiedad y la reglas sobre columnas significa lo siguiente: dada una matriz
orlada:
 
S B
Orl := ,
0 T
tal que
SAT = B.
Si hacemos una operación por columnas, determinada por una matriz Ei,j (P ) estmos diciendo
que obtenemos una nueva matriz orlada:

S0 B0
 
0
Orl := ,
0 T0
donde
S 0 = S, B 0 = BEi,j (P ), T 0 = T Ei,j (P ).
Por tanto, podemos concluir:
• Si T ∈ GL(n, R) era inversible sobre R, como Ei,j (P ) es inversible sobre R, entonces
T 0 = T Ei,j (P ) es también inversible.
• Si SAT = B, entonces
S 0 AT 0 = SA(T Ei,j (P )) = (SAT )Ei,j (P ) = BEi,j (P ) = B 0 .


2.5.5. “Algoritmo”:Hacer ceros por filas o columnas. Supongamos dada una matriz
A ∈ Mm×n (R) donde R es un dominio de ideales principales. Supongamos que la matriz A
tiene la forma:  
a1 ∗ · · · ∗
 a2 ∗ · · · ∗
A :=  . . ,
 
 .. ..
. .. 
am ∗ ··· ∗
Proposición 2.5.10. Conlas anteriores notationes, existe un número finito de operaciones
elementales por filas (i.e. multiplicar por matrices del tipo Ei,j (P )) que permiten transformar
Orl(A) en una matriz
 
S B
Orl := ,
0 T
tal que SAT = B, S y T son producto de matrices elementales Ei,j (P ) y B tiene la forma:
 
h ∗ ··· ∗
 0 ∗ · · · ∗
B :=  . . ,
 
 .. ..
. .. 
0 ∗ ··· ∗
donde h = gcd(a1 , . . . , am ).
Un resultado idéntico se obtiene reemplazando filas por columnas en la descripción anterior.
152 2. PRIMOS Y MAXIMALES

Demostración. Usaremos la Proposición 2.5.4. No pondremos las operaciones en la ma-


triz orlada para evitar repeticiones. A partir de esa Proposición es claro que podemos multiplicar
por una matriz de tipo E1,2 (P ) para obtener una nueva matriz con la forma siguiente:
 
h1 ∗ · · · ∗
 h01 ∗ · · · ∗
 
E1,2 (P )A :=  a3 ∗ · · · ∗ ,
 
 .. . .
. . .. 
 . 
am ∗ · · · ∗
donde h1 = gcd(a1 , a2 ) y h1 | h01 . Ahora, podemos restar a la segunda fila la primera multipli-
h0
cada por h11 ∈ R y no queda una matriz de la forma:
 
h1 ∗ · · · ∗
 0 ∗ ··· ∗
 
E1,2 (P )A :=  a3 ∗ · · · ∗ .

 .. .. .. 
 . . .
am ∗ ··· ∗
Repitiendo el proceso con a3 hasta am , obtendremos el resultado apetecido. 

2.5.5.1. Hacer ceros por filas y columnas. Su pongamos dada una matriz A ∈ Mm×n (R)
de la forma:  
a1,1 a1,2 ··· a1,n
 a2,1 ∗ ··· ∗ 
A :=  . ..  .
 
. ..
 . . . 
am,1 ∗ ··· ∗
Proposición 2.5.11. Supongamos que, con estas notaciones, realizamos de manera alternativa
las operaciones hacer ceros por columna o hacer filas en la primera filas y columnas. Entonces,
tras una secuencia finita de alternacias obtendremos una nueva matriz de la forma:
 
h1,1 0 · · · 0
 0 ∗ · · · ∗
A0 :=  . . .
 
 .. ..
. .. 
0 ∗ ··· ∗
Demostración. Obviamente, tras haber hecho ceros en la primera columna, por ejemplo,
al intentar seguidamente hacer ceros en la primera fila, podemos reincorporar elementos no
nulos en la primera columna, con lo que aparentemente hemos perdido lo ganado. Sin embargo,
suponemos que hacemos una serie de alternancias. Llemamos hi al resultado escrito en el lugar
1, 1 de la matriz obtenida tras i pasos. Observamos que, en cada caso, hi | hi−1 puesto que hi
el máximo común divisor de hi−1 con elementos de la primera fila o la primera columna. Por
tanto, tenemos una cadena de ideales en R. Definamos ai = (hi ) ⊆ R el ideal generado por hi .
Entonces, tenemos una cadena ascendente de ideales de R:
a0 ⊆ a1 ⊆ · · · ⊆ an ⊆ · · · ⊆ R,
donde h0 = a1,1 . Ahora interviene la condición noetheriana de los dominios de ideales princi-
pales. Obsérvese que esta cadena no puede ser infinita. La razón es la siguiente: consideremos
el conjunto
[
a := ai ⊆ R.
i∈N

Es una mera comprobación que a es un ideal de R. Por tanto, como R es dominio de ideales
principales, entonces, existe h ∈ R tal que a = (h). Pero si h ∈ a, entonces h ∈ as para algún
r ∈ N. Por tanto, hr | h. Pero, como hr ∈ a = (h), también tenemos h | hr . Luego hr y h son
asociados, a = ar y, en conclusión at = ar , ∀t ≥ r. Es decir, la cadena se estabiliza a partir del
lugar r.
2.5. FORMAL NORMAL DE SMITH 153

Supongamos, sin pérdida de la generalidad, que hr se obtuvo después de hacer ceros en la


primera columna y tenemos una matriz de la forma:
 
hr k1,2 · · · k1,n
0 ∗ ··· ∗ 
Ar :=  . ..  .
 
 .. . .. . 
0 ∗ ··· ∗
La siguiente operación serı́a hacer ceros en la primera fila y poner, en lugar de hr a hr+1 que es
hr+1 = gcd(hr , k1,2 , . . . , k1,n ).
Pero, como ar = ar+1 , hr y hr+1 son elementos asociados de R, luego también podemos escribir
hr = gcd(hr , k1,2 , . . . , k1,n ).
Esto quiere decir que hr | k1,i para todo i, 2 ≤ i ≤ n. Por tanto, al realizar el proceso de hacer
ceros en la primera columna podemos, simplemente, restar a cada columna, la primera columna
k
multiplicada por h1,i
r
∈ R y obtendremos una matriz de la forma deseada. 
2.5.6. Diagonalización de una matriz sobre un DIP: “algoritmo”.

Algoritmo 2.5.12. Input: Una matriz A ∈ Mm×n (R), con m ≥ n de la forma:


 
a1,1 a1,2 · · · a1,n
 a2,1 a2,2 · · · a2,n 
A :=  . ..  .
 
. . .
 . . . 
am,1 am,2 ··· am,n

Inicializar
P := Idm , Q := Idn , B := A.
k := 1 
P B
C := .
0 Q
bi,j := el elemento de R que ocupa el lugar (i, j) de la submatriz B de C.
Hacer ceros en la fila y columna k−ésimas. La matriz resultante se “guarda” en la matriz C,
eliminando la matriz precedente.
Mientras k < m do
Mientras ∃i, j, i ≥ k, j ≥ k, tales que bk,k - bi,j , do
* Intercambiar filas y columnas en C, hasta que bi,j ocupe el lugar
(k, k) de la nueva matriz B.
* Hacer ceros en la fila y columna k.
* Guardar en la matriz C los resultados de la acción precedente:
 
P B
C :=
0 Q
od
k := k + 1
od
Ouput: La matriz C que contiene como submatrices a las matrices P ∈ GL(m, R), Q ∈
GL(n, R) y B tales que P AQ = B y, además, B es diagonal y tiene la forma:
 
d1 0 · · · 0
 0 d2 · · · 0 
 .. . 0 
 
B :=  . . . . ..  ∈ Mm×n (R),
 
 0 0 · · · dr 
0 0
de tal modo que di | di+1 , 1 ≤ i ≤ r − 1.
154 2. PRIMOS Y MAXIMALES

Teorema 2.5.13 (Forma Normal de Smith). El anterior procedimiento es, de hecho, un


algoritmo que termina sus cálculos sobre cualquier matriz A cuyas coordenadas están en un
dominio de ideales principales. La matriz diagonal resultante se llama la Forma Normal de
Smith de A y es única salvo unidades en el anillos R. Más aún, los elementos d1 , . . . , dr de la
diagonal se llaman los factores invariantes de A. Se verifica, además, que di es dado por la
regla siguiente:
Sea gi (A) el máximo común divisor de los menores i×i de la matriz A. Supongamos g0 (A) = 1.
Entonces,
gi (A)
di = ,
gi−1 (A)
o, equivalentemente,
gi−1 (A)di = gi (A).
Demostración. Lo primero que hay que probar es que el proceso anterior es realmente
un algoritmo, es decir, que, una vez inicializado, termina sus cálculos sobre cualquier matriz.
La prueba de este hecho es idéntica a la prueba hecha en la Proposición 2.5.11 precedente. Es
consecuencia de la condición noetheriana de los dominios de ideales principales. Nótese que, en
el caso k = 1, el procedimiento coloca en el lugar (1, 1) al máximo común divisor de todas las
coordenadas de la matriz A recibida. Por tanto, el procedimiento acaba calculando una matriz
C cuya matriz B tiene la forma:
 
b1,1 0 ··· 0
 0 b2,2 · · · b2,n 
B :=  . ..  .
 
 .. ..
. . 
0 bm,2 ··· bm,n
Con la condición adicional de que b1,1 | bi,j , para todo (i, j) ∈ {2, . . . , m} × {2, n}. A partir de
este momento k ≥ 2, el procedimiento, se “olvida” de b1,1 y se centra en la submatriz B 0 dada
mediante:  
b2,2 b2,3 · · · b2,n
 b3,2 b3,3 · · · b3,n 
B 0 :=  . ..  .
 
 .. ..
. . 
bm,2 bm,3 ··· bm,n
Al repetir el proceso, calculamos el máximo común divisor de las coordenadas de esta matriz y
procedemos hasta concluir el objetivo. Dicho de otra manera, aplicando inducción, concluiremos
el resultado apetecido.
En cuanto a la condición de los factores invariantes en términos de los máximos comunes
divisores de los menores de la matriz inicial, basta también con aplicar inducción. El caso k = 1
es claro. El paso inductivo se basa en que las matrices P y Q usadas para las transformaciones
son producto de matrices elementales de las descritas anteriormente y no modifican el máximo
común divisor de los menores. Omitimos el detalle. 

Observación 2.5.14 (En el caso de dominios euclı́deos). En el caso de dominios euclı́deos,


podemos mejorar ligeramente el algoritmo 2.5.12 anterior. Consideremos la instrucción:

“Mientras ∃i, j, i ≥ k, j ≥ k, tales que bk,k - bi,j , do


* Intercambiar filas y columnas en C, hasta que bi,j ocupe el lugar
(k, k) de la nueva matriz B.”

En el caso de dominios euclı́deos (R, φ) se pueden evitar reiteraciones, sustituyendo por la regla
siguiente:

“Mientras ∃i, j, i ≥ k, j ≥ k, tales que bk,k - bi,j , do


* Reemplazar (haciendo operaciones elementales por filas y columnas en C)
en C, el término bi,j por el resto de su división por bk,k .
* Intercambiar filas y columnas en C, hasta que bi,j ocupe el lugar
(k, k) de la nueva matriz B.”
2.5. FORMAL NORMAL DE SMITH 155

Por ejemplo, en el caso de Z, buscarı́amos la coordenada bi,j que minimice el valor absoluto y
la llevarı́amos al lugar (k, k). En el caso de polinomios K[X], elegirı́amos la coordenada bi,j
que minimice el grado.
2.5.7. Resolución de Ecuaciones Lineales Diofánticas. Se denominan ecuaciones
diofánticas lineales a ecuaciones lineales del tipo siguiente:
(2.5.3) AX = B,
donde
i) A ∈ Mm×n (Z) es una matriz con m filas y n columnas con coordenadas en Z. Podemos
suponer:
..
 
a
 1,1 . a 1,n 
A :=  . .. ..  .
 .. . . 
am,1 · · · am,n
ii) X es un vector columna de variables:
 
X1
 .. 
X :=  . 
Xn
iii) B es un vector columna con coordenadas en Z:
 
b1
B :=  ...  ∈ Zm .
 

bm
El objetivo del estudio de las ecuaciones lineales diofánticas es estudiar la existencia de solu-
ciones en Zn de ecuaciones del tipo descrito en la identidad (2.5.3) anterior. Es decir, estudiar:
      
x1 a1,1 · · · a1,n x1 b1
 ..  n  .. . .. ..   ..  =  ... 
. .
∃ .  ∈ Z ,  . .
   

xn am,1 ··· am,n xn bm


El siguiente resultado no sólo caracteriza la existencia, sino que también caracteriza las solu-
ciones en caso de que existan.
Corollario 2.5.15. Sea dada una ecuación diofántica lineal
AX = B,
m
con A ∈ Mm×n (Z), B ∈ Z columna y X una columna de variables, como en las notaciones
anteriores. Sean P ∈ GL(m, Z) y Q ∈ GL(n, Z) dos matrices inversibles sobre Z y sea D ∈
Mm×n (Z) la matriz diagonal obtenida tras aplicar el algoritmo de cálculo de la forma Normal
de Smith anteriormente descrito, es decir,
 
d1 0 · · · 0
 0 d2 · · · 0 
 .. . 0 
 
D :=  . . . . ..  ∈ Mm×n (Z),
 
 0 0 · · · dr 
0 0
de tal modo que
P AQ = D.
Sea
b01
 

B 0 := P B =  ...  ∈ Zm .
 

b0m
Entonces,
i) El sistema de ecuaciones es compatible sobre Zn (es decir posee soluciones en Zn ) si
y solamente si se verifican las siguientes propiedades:
156 2. PRIMOS Y MAXIMALES

(a) b0i = 0, para todo i, con r + 1 ≤ i ≤ m.


(b) dj | b0j , para todo j, con 1 ≤ j ≤ r.
ii) Si el sistema es compatible sobre Zn , entonces, una solución del sistema viene dada
por la siguiente identidad:
 b0 
1

 d.1 
.
.
 
x1  b0r 
X0 :=  ...  = Q  dr  ∈ Zn ,
   
0
xn  
.
 .. 
0
iii) Si el sistema es compatible sobre Zn , el conjunto de todas las soluciones del sistema
AX = B viene dado por el conjunto siguiente:
X0 + N := {X0 + z : z ∈ N },
donde N es el submódulo libre de Zn generado por las n − r últimas columnas de Q.
Demostración. Nótese que Q : Zn −→ Zn define un isomorfismo dado que Q es una
matriz inversible sobre Z. Esto significa que podemos considerar un “cambio de variables” del
modo siguiente:
   
Y1 X1
Y =  ...  = Q−1 X = Q−1 X :=  ... 
   

Yn Xn
Y podemos considerar un nuevo sistema de ecuaciones lineales diofánticas lineales dado medi-
ante:
(AQ)Y = B.
Nótese que se tiene la obvia propiedad siguiente:
     
y1 x1 y1
 ..  n  ..   ..  n
 .  ∈ Z satisface (AQ)Y = B ⇔  .  = Q  .  ∈ Z satisface AX = B.
yn xn yn
Las condiciones de compatibilidad y los tipos de soluciones se preservan con la identificación
propuesta.
Ahora consideremos la ecuación (AQ)Y = B y recordemos que P ∈ GL(m, Z) es una matriz
inversible. Por tanto, podemos considerar una nueva ecuación lineal diofántica:
(P AQ)Y = B 0 ,
donde B 0 := P B es la matriz columna descrita en el enunciado. Es obvio que se tiene la
equivalenecia:
   
y1 y1
 ..  n  ..  n
 .  ∈ Z satisface (AQ)Y = B ⇔  .  ∈ Z satisface (P AQ)Y = B 0 .
yn yn
Ahora, como P AQ = D es una matriz diagonal, observamos que la ecuación (P AQ)Y = B 0
tiene la forma siguiente:
b01

 d1 Y1 =
b02



 d2 Y2 =
..



.



dr Yr = b0r
0
 0 = br+1




 ..
.




0 = b0m

2.5. FORMAL NORMAL DE SMITH 157

Ahora es evidente que este sistema de ecuaciones posee soluciones en Zn si y solamente si se


satisface: dj | b0j , 1 ≤ j ≤ r y b0i = 0, r + 1 ≤ i ≤ m, con lo que tenemos la primera de las
propiedades indicadas.
De otro lado, una “solución particular” a esta última ecuación serı́a la dada mediante
 b0 
1

 d.1 
.
.
 b0r 
 dr  ∈ Zn .
 
0
 
.
 .. 
0
Pero como sabemos que las soluciones de esta ecuación están relacionadas con las soluciones de
la ecuación AX = B a través de Q tendremos que una solución particular del sistema AX = B
es la dada mediante:  0 b1
 d.1 
.
.
 
x1  b0r 
 ..  n
 .  = Q  dr  ∈ Z ,
 
0
xn  
.
 .. 
0
y tenemos probada la afirmación ii) del enunciado. Para estudiar el conjunto de todas las
soluciones, baste con observar que se tiene la siguiente propiedad:
Dados x, z ∈ Zn soluciones del sistema AX = B, entonces x − z ∈ Zn es solución del sistema
AX = 0, donde 0 es el vector columna en Zm con coordenadas todas nulas. Por tanto, se
trata de estudiar cómo son todas las soluciones del sistema “homogéneo” AX = 0. De nuevos,
usando Q y P podemos observar que las soluciones de AX = 0 son dadas mediante QN , donde
N ⊆ Zn es el conjunto de las las soluciones del sistema homogéneo (AQ)Y = 0. Por ser P
inversible las soluciones de (AQ)Y = 0 con las solciones de (P AQ)Y = 0 y, de nuevo, son las
soluciones del sistema DY = 0 dado mediante:


 d1 Y1 = 0


 d 2 Y2 = 0
..



.



dr Yr = 0
0 = 0





 ..
.




0 = 0

O, equivalentemente, 

 d1 Y1 = 0
 d2 Y2

= 0
..


 .
dr Yr = 0

Luego las soluciones del sistema (P AQ)Y = 0 son los elementos de N := {0}r × Zn−r ⊆ Zn .
Concluiremos ası́ que las soluciones del sistema “homogéneo” original son los elementos del
siguiente conjunto:
Q {0}r × Zn−r .


Pero este submódulo es un submódulo libre de Zn y es, simplemente, el submódulo generado


por las imágenes a través de Q de los generadores de ({0}r × Zn−r ) que era un submóudlo
libre. Es decir, si ei Zn es el elemento de Zn (dado en columna) cuyas coordenadas son nulas
exceptuando la coordenada i−ésima que es 1 (i.e. la base “canónica” de Zn ). Entonces, un
sistema generador (y base como Z−módulo libre) de Q ({0}r × Zn−r ) es dada por:
Qer+1 , . . . , Qen .
158 2. PRIMOS Y MAXIMALES

Es obvio que estos n−r elementos son, precisamente, las n−r últimas columnas de Q y tenemos
probada la afirmación iii). 
2.5.8. Estructura de Grupos Abelianos Finitamente Generados.
Teorema 2.5.16 (Estructura de Grupos Abelianos Finitamente Generados). Sea (G, +)
un grupo abeliano finitamente generado. Entonces, G es isomorofo como grupo a una descom-
posición:
G∼= Zm ⊕ T orZ (G),
donde T orZ (G) son los elementos de torsión de G. Además, existen d1 , . . . , dr ∈ N, di ≥ 1,
verificando di | di+1 y se tiene:
Yr
T orZ (G) := (Z/di Z) .
i=1
Además, los elementos d1 , . . . , dr son únicos y se denominan factores invariantes de los ele-
mentos de torsión de G.
Demostración. Comencemos recordando que todo grupo abeliano finitamente generado
es el co-núcleo de un morfismo entre Z−módulos libres finitamente generados, es decir, existe
una matriz A ∈ Mm×n (Z) que define un morfismo de Z−módulos A : Zn −→ Zm , de tal modo
que G es isomorfo al cociente:
Zm /Im(A) ∼= G.
Más correctamente, tenemos una sucesión exacta
Zn −→ Zm −→ G −→ 0.
Ahora bien, usando la forma normal de Smith de A podemos disponer de isomorfismos de los
Z−módulos (dados por las matrices P y Q que nos conducen a un diagrama conmutativo de
Z−módulos que tiene la forma siguiente:
A
Zn −→ Zm −→ G −→ 0
Q ↓ ↓ P ↓
Zn −→ Zm −→ G −→ 0
D
donde D es una matriz diagonal, que puedo suponer de la forma:
 
d1 0 · · · 0
 0 d2 · · · 0 
 .. . 0 
 
D :=  . . . . ..  ∈ Mm×n (Z).
 
 0 0 · · · dr 
0 0
La conclusión obvia es que G es también isomorfo al conciente siguiente como Z−módulo:
Zm /Im(D) ∼ = G.
Ahora bien, por ser D diagonal es obvio que el conciente tiene la forma:
r
!
∼ ∼
Y
m
G = Z /Im(D) = (Z/di Z) ⊕ Zn−r .
i=1
Este isomorfismo indica obviamente que
r
!
T orZ (G) ∼
Y
= (Z/di Z) ,
i=1
y se sigue el Teorema de estructura. La unicidad se sigue de la unicidad de formas normales de
Smith. 
Como en la demostración del Teorema precedente no hemos usado la naturaleza euclı́dea de Z
ni ninguna otra propiedad especı́fica de Z que no sea la existencia de forma normal de Smith,
podemos dar también el Teorema de Estructura para cualquier módulo finitamente generado
sobre un dominio de ideales principales del modo siguiente:
2.5. FORMAL NORMAL DE SMITH 159

Teorema 2.5.17 (Estructura de Módulos Finitamente Generados sobre DIP). Sea R


un dominio de ideales principales y M un R−módulo finitamente generado. Entonces, M es
isomorofo como R−módulo a una descomposición:
M∼= Rm ⊕ T orR (M ),
donde T orR (M ) son los elementos de torsión de G, i.e.
T orR (M ) := {m ∈ M : AnnR (m) 6= (0)}.
Además, existen d1 , . . . , dr ∈ R verificando di | di+1 y se tiene:
r
Y
T orR (M ) := (Z/di Z) .
i=1

Además, los elementos d1 , . . . , dr son únicos (salvo unidades en R) y se denominan factores


invariantes de los elementos de torsión de M .
Demostración. Misma prueba que el caso de Z. 
2.5.9. Ejercicios de la Sección 2.5.
Problema 141. Calcular la forma Normal de Smith de las siguientes matrices sobre Z:
i)  
2 1
5 3
ii)  
2 −1 2
−6 3 6
iii)  
1 0 0
0 2 0
0 0 3
iv)  
9 8 7
6 5 4
3 2 1
Problema 142. En una empresa en crisis, los ejecutivos se reúnen, en una sala cerrada, para
decidir cómo salvar el problema de las pérdidas de beneficios en los últimos tres años. En sus
deliberaciones, usan papeles que se van pasando por la fotocopiadora de la planta donde debaten.
En una de sus salidas pierden un documento que queda enganchado en la fotocopiadora. Un
miembro del comité de empresa encuentra ese documento y descubre que contiene la siguiente
información:
• El 89% de los miembros de la plantilla que van a ser despedidos están casados y tienen,
al menos, uno hijo.
• El 97% de los miembros de la plantilla que van a ser despedido tienen hipoteca.
El comité de empresa se reúne, declara una huelga indefinida y se enfrenta a los directivos
reunidos en su sala. Sabiendo que la plantilla tiene 952 miembros, justifica la huelga indefinida
del comité de empresa.
Problema 143. Discutir si son compatibles y, en su caso, resolver los siguientes sistemas de
ecuaciones lineales diofánticos:
i) 
 X1 + X2 + 3X3 = 3
X1 + 3X2 + 5X3 = 7
X1 − 2X2 = −3

ii) 
4X1 + 2X2 + 6X3 = 0
X1 + 2X2 = 3
160 2. PRIMOS Y MAXIMALES

iii) 
 X1 + 2X2 + X3 + 2X4 = 3
X1 + X3 = 2
3X1 + 3X3 + 4X4 = 2

Problema 144. Prueba que para todo dominio de ideales principales R y para cada número
natural n ∈ N, los submódulos de rango r de Rn coinciden con los conjuntos de soluciones de
sistemas de ecuaciones homogéneos de la forma BX = 0, donde B ∈ M(n−r)×n (R) es una
matriz con n − r filas y n columnas de rango n − r.
Problema 145. Prueba que si M y N son dos R−módulos libres de rango finito, se tiene:
rankR (M ⊕ N ) = rankR (M × N ) = rankR (M ) + rankR (N ).
Prueba que si M es un submódulo de N con las anteriores condiciones, no es cierto que si
rankR (M ) = rankR (N ), entonces M = N .
Problema 146. Reflexionar sobre el significado del Teorema de Estructura para módulos fini-
tamente generados sobre DIP en el caso R = K[X] y M la estructura de K[X]−módulo definida
sobre un espacio vectorial finitamente generado V por un endomorfismo de K−espacios vecto-
riales f : V −→ V . ¿Tiene algo que ver con la forma de Frobenius del endomorfismo?.
Problema 147. Hallar la Forma Normal de Smith sobre Q[X] de la siguiente matriz:
 
X −2 −1 0 0
 0
 X −2 0 0 
 0 0 X −2 0 
0 0 0 X −2
Problema 148. Hacer lo mismo que en el problema anterior para las siguientes matrices:
 
X −2 −1 0 0
 0
 X −2 0 0  
 0 0 X −2 −1 
0 0 0 X −2
 
X −2 −1 0 0
 0
 X −2 −1 0  
 0 0 X −2 −1 
0 0 0 X −2
 
X −2 −1 0 0
 0
 X −2 0 0  
 0 0 X −3 −1 
0 0 0 X −3
 
X −2 0 0 0
 0
 X −2 0 0  
 0 0 X −3 0 
0 0 0 X −3
Problema 149. Considerar el grupo abeliano libre Zn y varios subgrupos que se citan a contin-
uación. Hallar la estructura del subgrupo de los elementos de torsión del grupo cociente Zn /H.
Decidir, en cada caso, si el grupo cociente es completamente de torsión o si su descomposición
posee “parte libre de torsión” (i.e. decidie si T or(Zn /H) = Zn /H en cada caso.
i) Supongamos n = 2 y H1 es el subgrupo de Z2 generado por {(1, 2), (3, 4)}.
ii) Supongamos n = 2 y H2 es el subgrupo de Z2 generado por {(2, 3)}.
iii) Supongamos n = 3 y H3 es el subgrupo de Z2 generado por {(1, 1, 1), (2, 4, 6), (3, 7, 11)}.
iv) Supongamos n = 3 y H4 es el subgrupo dado como la imagen del morfismo de grupos
siguiente:
A: Z2 −→ Z3
(x, y) 7−→ (2x − 2y, 4x + 2y, 2y).
Observar que, en este caso Z3 /H4 es el Co-núcleo de A.
2.5. FORMAL NORMAL DE SMITH 161

v) Supongamos n = 3 y H5 es el subgrupo dado como la imagen del morfismo de grupos


siguiente:
A: Z3 −→ Z3
(x, y, z) 7−→ (x + 2y + 3z, x + 4y + 7z, x + 6y + 11z).
Observar que, en este caso Z3 /H5 es el Co-núcleo de B.
Problema 150 (Retı́culos). Sea denomina retı́culo de dimensión n en Rn al Z−módulo libre
generado por una base de Rn . Se denota mediante Λ(β) := Zh{v1 , . . . , vn }i al retı́culo generado
en Rn por la base β := {v1 , . . . , vn }. Se llama paralelepı́pedo fundamental de un retı́culo Λ(β)
al polı́topo determinado por los puntos v1 , . . . , vn ∈ Rn y el origen. Es decir, el conjunto
X n
P(β) := { ti vi : ti ∈ [0, 1], }.
i=1
Se llama volumen de un retı́culo Λ(β) al volumen de su paralelepı́pedo fundamental.
i) Sea Λ(β) un retı́culo con paralelepı́pedo fundamental P(β). Sea M la matriz cuyas
columnas están formadas por las coordenadas de los vectores de la base β. Probar que
se satisface: p
vol(Λ(β)) =| det(M ) |= det(M t M ).
ii) Sean Λ un retı́culo y P ∈ GL(n, Z) una matriz inversible sobre Z. Pruébse que el
conjunto P Λ siguiente es también un retı́culo:
P Λ := {w ∈ Rn : ∃v ∈ Λ, wt = P v t }.
Pruébese también que vol(Λ) = vol(P Λ) para calquier P ∈ GL(n, Z).
iii) Sean Λ ⊆ Λ0 dos retı́culos, siendo Λ un submódulo de Λ0 del mismo rango (y, por
tanto, libre). Probar que vol(Λ) ≥ vol(Λ0 ).
iv) Con las condiciones anteriores, pruébese que el Z−módulo cociente Λ0 /Λ es un grupo
abeliano finito y que su orden satisface:
vol(Λ)
] (Λ0 /Λ) = .
vol(Λ0 )
v) Busca en internet el enunciado del Teorema del Cuerpo Convexo de Minkowski. Busca
también una demostración y trata de entenderla. Explica su significado.
vi) Sea K ⊆ Rn un cerrado convexo y acotado y sea Λ ⊆ Rn un retı́culo. Trata de estabecer
una relación entre el volumen de K, el volumen del paralelepı́pedo fundamental de Λ y
el número de puntos de la intersección de K con Λ. Diseña un algoritmo que aproxime
el volumen de un conjunto convexo mediante el número de puntos ](Λ ∩ K).
Problema 151. Lee el extracto de texto que aparece descrito al princpio del Capı́tulo. La “es-
cena” descrita es un cl’asico, amplia y universalmente reconocible para cualquiera mı́nimamete
educado, sin necesidad de acudir a Wikipedia. Explica quién fue su autor, a qué obra pertenece,
qué papel juega la evocación y la decadencia en su contenido semántico y sintático. ¿Tiene la
obra de este autor, y en especial el tı́tulo de su obra, algo que ver con el contenido del Capı́tulo.
CAPı́TULO 3

El Teorema Chino de los Restos


(..nanos gigantum humeris insidentes)

“..What Descartes did was a good step.


You have added much several ways, and
especially in taking the colours of thin
plates into philosophical consideration. If
I have seen a little further it is by
standing on the shoulders of Giants”.
I. Newton, 1676

Índice
3.1. Introducción 163
3.2. El anillo producto y el TCR 163
3.3. El Teorema Chino de los Restos en el caso R = Z (Opcional) 166
3.3.1. En relación con el problema de Sun Tzu. 167
3.3.2. Una Aplicación en computación: Cálculo del Determinante por Algoritmos
Modulares. 168
3.3.2.1. La Búsqueda de un Buen Número Primo. 170
3.3.2.2. Test de Primalidad. 170
3.3.2.3. Combinando el Teorema de Densidad de los Número Primos y los Tests
de Primalidad. 171
3.3.2.4. La Estrategia Final 171
3.3.3. Secretos Compartidos. 172
3.3.4. Ejercicios de la Sección 3.3 172
3.4. El Teorema Chino de los Restos en el caso R := K[X]. 173
3.4.1. La Forma Canónica de Jordan. 174
3.4.1.1. El álgebra K[X]/(f ). 174
3.4.2. Teorı́a del Endomorfismo y el Máximo Común Divisor en K[X] (Opcional). 177
3.4.3. Ejercicios de la Sección 3.4 180

3.1. Introducción
En esta Sección recordaremos el teorema Chino de los Restos y algunas de sus aplicaciones más
notables. Aunque se desconoce su origen preciso, las fuentes más clásicas apuntan al texto Sun
Zi suan-ching (traducido, malamente, como “Las Matemáticas Clásicas de Sun Zi”), publicado
en el tercer siglo antes de Cristo por Sun Tzu. Reaparece, con otros resultados interesantes
como el método de Newton, en 1274 en un texto de Qin Jiushao titulado Shushu Chiu-zhang.
El Problema que trata es el siguiente:
Problema Clásico 3.1.1. ¿Cuál es el número entero más pequeño tal que
f ≡ 2 mod 11, f ≡ 3 mod 5, f ≡ 2 mod 7?.

3.2. El anillo producto y el TCR


Proposición 3.2.1 (Definicón de Anillo Producto). Sean {Ri : 1 ≤ i ≤ r} una colección
finita de anillos. Definamos las opraciones siguientes:
Qr Qr Qr
+: ( i=1 Ri ) × ( i=1 Ri ) −→ ( i=1 Ri )
(3.2.1)
((x1 , . . . , xr ), (y1 , . . . , yr )) 7−→ (x1 + y1 , . . . , xr + yr ),
y
163
164 3. TEOREMA CHINO DE LOS RESTOS

Qr Qr Qr
·: ( i=1 Ri ) × ( i=1 Ri ) −→ ( i=1 Ri )
(3.2.2)
((x1 , . . . , xr ), (y1 , . . . , yr )) 7−→ (x1 y1 , . . . , xr yr ).
Se verifican las propiedades siguientes:
Qr
i) El conjunto ( i=1 Ri , +, ·) es un anillo Q conmutativo con unidad. El elemento neutro
r
para la suma es el elementoQ(0, . . . , 0) ∈ i=1 Ri y el elemento neutro para el producto
r
es el elemento (1, . . . , 1) ∈ i=1 Ri .
ii) Cualquiere
Qr elemento de la forma (x1 , . . . , xr ) con algún xi = 0, es un divisor de cero
de i=1 Ri .
Qr
Al anillo i=1 Ri se le denomina anillo producto de los anillos en la familia {Ri : i ∈ I}.
Qr
Demostración. Para comprobar que ( i=1 Ri , +, ·) es un anillo conmutativo con Qr unidad,
recuérdese el producto de grupos abelianos, lo que nos daráQla condición de grupo en ( i=1 Ri , +)
r
y el elemento neutro para la suma dado por (0, . . . , 0) ∈ i=1 Ri . Verificar que es anillo con la
operación producto es mera comprobación de las propiedades a partir de las que verifica cada
uno de los Ri . La otra propiedad señalada es obvia. 

Definición 56 (ideales co–maximales). Dos ideales a y b de un anillo R se denominan


co–maximales si a + b = R.
Algunos autores prefieren el término “co–primo” en lugar de co–maximales, es una cuestión de
gusto. Aquı́ elegiremos el término co–maximal como queda dicho.
Teorema 3.2.2 (Teorema Chino de los Restos). Sea {ai : 1 ≤ i ≤ n} un conjunto finito
de ideales en un anillo R. Supongamos que son dos a dos co–maximales (i.e. ai + aj = R,
∀i 6= j) y consideremos el morfismo de anillos:
Qn
Φ : R −→ i=1 (R/ai )
(3.2.3)
a 7−→ (a + a1 , a + a2 , . . . , a + an ).
Se tiene:
i) Φ es un epimorfismo de anillos.
ii) El núcleo verifica:
n
Y
ker(Φ) = ∩ni=1 ai = ai .
i=1
iii) φ induce un isomorfismo de anillos:
Qn
Φ
e: R/ (∩ni=1 ai ) −→ i=1 (R/ai )
(3.2.4)
x + (∩ni=1 ai ) 7−→ (x + a1 , x + a2 , . . . , x + an ).
Demostración. Comencemos observando que Φ está bien definida dado que es la com-
posición de los dos morfismos de anillo siguientes:
Qn
i : R −→ Rn := i=1 R
(3.2.5)
x 7−→ (x, x, . . . , x).
y
Qn n
Qn
(3.2.6) i=1 πi : R −→ i=1 (R/ai ) ,

donde πi : R −→ R/ai es la proyección canónica. A partir de aquı́, probemos las propiedades


descritas.
Comencemos considerando
Qn unos elementos especiales. Para cada i ∈ {1, . . . , n}, consideremos
el elemento ei ∈ i=1 (R/ai ) dado mediante:
n
Y
ei := (εi,1 + a1 , εi,2 + a2 , . . . , εi,n + an ) ∈ (R/ai ) ,
i=1

donde 
1, si i = j
εi,j :=
0, en caso contrario
3.2. EL ANILLO PRODUCTO Y EL TCR 165

Nótese que ei es el emento que “tiene un 0 en todos los lugares, excepto en el lugar Q i en el que
n
tiene un 1”. Consideremos ahora un elemento cualquiera ζ := (x1 +a1 , . . . , xn +an ) ∈ i=1 R/ai .
Se tiene la siguiente identidad:
n
X
(3.2.7) ζ := Φ(xi )ei .
i=1

Por tanto, probar que Φ es suprayectiva se reduce a probar que {e1 , . . . , en } ⊆ Im(Φ). Por
simplicidad de la expresión de la prueba, probemos que e1 ∈ Im(Φ) y, análogamente, se hará
para todos los otros elementos.
dado que a1 y ai son co–maximales para todo i 6= 1, 1 ≤ i ≤ n, podemos suponer que existen
xi ∈ a1 e yi ∈ ai tales que xi + yi = 1 en R. Definamos el elemento
n
Y n
Y
(3.2.8) z1 := yi = (1 − xi ).
i=2 i=2

Entonces, se tiene Φ(z1 ) = e1 . Para comprobarlo, recordemos que:


Φ(z1 ) := (z1 + a1 , z2 + a2 , . . . , z1 + an ).
Qn
• Como yj ∈Qaj , para todo j ≥ 2, entonces i=2 yi ∈ aj , para todos j ≥ 2 y, por tanto,
n
z1 + aj = i=2 yi + aj = 0 + aj , para todo Qn j ≥ 2. Qn
• De otro
Pn lado, desarrollando el producto i=2 (1−xi ) obtendremos z1 = i=2 (1−xi ) =
1 + i=2 xi hi (x2 , . . . , xn ), donde
n
Y
hi (x2 , . . . , xn ) = − (1 − xj ),
j=i+1

para 2 ≤ i ≤ n − 1 y hn = −1. En particular, hi (x2 , . . . , xn ) ∈ R. Para cada i,


2≤i≤ Pn, xi ∈ a1 , por tanto, xi hi (x2 , . . . , xn ) ∈ a1 , para cada i, 2 ≤ i ≤ n y, por
n
tanto, i=2 xi hi (x2 , . . . , xn ) ∈ a1 . Hemos concluido que z1 = 1 + h, con h ∈ a1 y,
finalmente, z1 + a1 = 1 + a1 .
Juntando estas afirmaciones, tendremos:
Φ(z1 ) := (1 + a1 , 0 + a2 , . . . , 0 + an ) = e1 ,
y queda probada la suprayectividad.

En cuanto al núcleo de Φ, es claro que dicho núcleo coincide con ∩ni=1 ai . Sin embargo, el
enunciado dice algo más. Dice que, en el caso de que los ideales sean co–maximales dos a dos,
entonces la intersección y el producto coinciden, es decir
n
Y n
\
ai = ai .
i=1 i=1
Qn Tn
Hay un contenido claro por las definiciones de los propios ideales i=1 ai ⊆ i=1 ai , luego sólo
queda por probar el recı́proco. Hagamos la prueba por inducción. Comencemos en el caso
n = 2. En ese caso, por ser a1 y a2 co–maximales, tendremos a1 + a2 = R y han de existir
x1 ∈ a1 y x2 ∈ a2 tales que x1 + x2 = 1. Sea ahora x ∈ a1 ∩ a2 .
• Como x ∈ a2 (por estar en a1 ∩ a2 ) y x1 ∈ a1 , entonces xx1 ∈ a1 a2 ,
• Recı́procamente, como x ∈ a1 (por estar en a1 ∩ a2 ) y x2 ∈ a2 , entonces xx2 ∈ a1 a2 .
En conclusión, xx1 , xx2 ∈ a1 a2 , luego
x = x · 1 = x(x2 + x2 ) = xx1 + xx2 ∈ a1 a2 ,
y queda probado el caso n = 2. Para el caso n, vamos a reproducir el argumento del modo
siguiente:
, 1 ≤ i ≤ n es una familia de ideales dos a dos co–maximales, entonces, los
Se tiene que si aiQ
ideales ai y bi := j6=i aj son co–maximales también (i.e. ai +bi = R). Para probarlo, haremos
solamente el caso i = 1 y el resto de los casos es análogo. Dado que a1 y ai son co–maximales,
han de existir xi ∈ a1 e yi ∈ ai , i ≥ 2, tales que
xi + yi = 1.
166 3. TEOREMA CHINO DE LOS RESTOS

Qn Qn
Consideremos ahora el elementos z1 := i=2 yi ∈ b1 = i=2 ai . De otro lado, como el la prueba
del epimorfismo, tendremos que
n
Y n
X
z1 = (1 − xi ) = 1 + xi hi (x2 , . . . , xn ) = 1 + h,
i=2 i=2
donde h ∈ a1 . Concluiremos ası́ que
1 = (−h) + z1 ,
siendo −h ∈ a1 y z1 ∈ b1 . Por tanto, a1 y b1 son co–maximales y, por el caso n = 2, tendremos
\
a1 b1 = a1 b1 .
Ahora aplicamos la hipótesis inductiva y concluimos
Yn \n
b1 = ai = ai ,
i=2 i=2

lo que, juntado con la igualdad inmediatamente anterior, implica la afirmación descrita en ii).
La afirmación iii) del enunciado es evidente a partir del primer Teorema de Isomorfı́a y de las
afirmaciones i) y ii). 

3.3. El Teorema Chino de los Restos en el caso R = Z (Opcional)


Utilizaremos los muchos resultados ya descritos sobre las propiedades básicas del anillo Z como
el Teorema 1.4.14, que nos indicaba que Z es un dominio de ideales principales, o la Identidad
de Bézout con cotas (ver Corolario 2.1.20). Seguidamente recordemos en el caso de dominios
de ideales principales, y en el caso de Z en particular, los significados de los ideales, suma,
producto e intersección.
Proposición 3.3.1. Dados n1 , . . . , nr ∈ Z números enteros y sean ai = (ni ) los ideales en Z
que generan. Entonces, se tienen las siguientes propiedades:
Pn
i) El ideal suma i=1 ai es el ideal generado por el máximo común divisor m := gcd(n1 , . . . , nr ).

ii) El ideal intersección a := ∩ni=1 ai es el ideal generado por el mı́nimo común múltiplo
m := mcm(n1 , . . . , nr ).
Qr
iii) El ideal producto b := i=1 ai es el ideal (N ), generado por el producto
r
Y
N := ni .
i=1

Finalmente, si gcd(ni , nj ) = 1 para todo i 6= j, entonces el mı́nimo común múltiplo m coincide


con N , esto es, en el caso de ser dos a dos co–maximales, se tiene:
r
Y
mcm(n1 , . . . , nr ) = ni .
i=1

Demostración. Ya se ha insistido abundantemente en la propiedad i), por lo que no insi-


stiremos en ello. El mı́nimo común múltiplo de varios números enteros se define, precisamente,
como el generador de la intersección de ideales. Recordémoslo: m = mcm(n1 , . . . , nr ) si y
solamente si se verifica:
• ni | m, para cada i, 1 ≤ i ≤ r.
• m es mı́nimo con esa propiedad.
Ahora nótese que la primera condición significa m ∈ (ni ) para cada i, 1 ≤ i ≤ r. Por tanto,
la primera condición significa m ∈ ∩ri=1 (ni ) y, por tanto, significa también (m) ⊆ ∩ri=1 ai . En
cuanto a la condición de minimalidad, recordemos el Teorema 1.4.14, en el cual se afirma que
el elemento no nulo de valor absoluto (resp. grado) mı́nimo en un ideal es el generador en
Z (resp. K[X]). Podemos ası́ concluir que si m es el mı́nimo con esa propiedad, entonces,
(m) = ∩ri=1 (ni ). Qr
De otro lado, por la definición del ideal producto, el ideal i=1 (ni ) es el ideal generado por los
productos de los generadores y, por tanto, el ideal generado por N .
3.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z (OPCIONAL) 167

La última de las afirmaciones es consecuencia inmediata del apartado ii) del Teorema Chino de
los Restos.QEfectivamente, si ni es una familia cuyos elementos son dos a dos co–maximales,
r
los ideales i=1 (ni ) y ∩ri=1 (ni ) han de coincidir y, por tanto, sus generadores son iguales (salvo
unidad en Z) por lo que podemos concluir que
r
Y
mcm(n1 , . . . , nr ) = ni ,
i=1
como se pretendı́a. 

El Teorema Chino de los Restos sobre Z se convierte en el enunciado siguiente:


Teorema 3.3.2 (Teorema Chino de los Restos en Z). Sean dados n Q1r, . . . , nr números
enteros positivos de tal modo que gcd(ni , nj ) = 1 para todo i 6= j. Sea N := i=1 ni . Entonces,
la siguiente aplicación es un isomorfismo de anillos:
e : Z/ (N ) −→ Qr
Φ i=1 (Z/(ni ))
(3.3.1)
x + (N ) 7−→ (x + (n1 ), x + (n2 ), . . . , x + (nr )).
Demostración. Es una trasliteración del Teorema Chino de los Restos anterior. 
3.3.1. En relación con el problema de Sun Tzu. Retomemos el enunciado:
Cuál es el número entero más pequeño tal que
f ≡ 2 mod 11, f ≡ 3 mod 5, f ≡ 2 mod 7?.
Nótese que 11, 5 y 7 son primos y, por tanto, co–maximales. Ahora se trata de hallar, conforme
a las ecuaciones (3.2.7) y (3.2.8) anteriores la siguiente información:
i) En primer lugar N := 7 · 5 · 11 = 385.
ii) En segundo lugar, los elementos z1 , z2 , z3 ∈ Z tales que (como en la prueba del Teorema
Chino de los Restos) se verifique:
Φ(z1 ) = e1 = (1 + (11), 0 + (5), 0 + (7)), Φ(z2 ) = e2 = (0 + (11), 1 + (5), 0 + (7)),
y
Φ(z3 ) = (0 + (11), 0 + (5), 1 + (7)).
Para ello, obsérvese (via la identidad de Bézout) que se tiene:
11 + (−2)5 = 1, (−2)7 + 3 · 5 = 1, 2 · 11 + (−3) · 7 = 1.
• Para z1 : elijamos x2 , x3 , y2 , y3 tales que x2 , x3 ∈ (11), y2 ∈ (5), y3 ∈ (7) y
x2 + y2 = 1, x3 + y3 = 1.
Es decir, x2 = 11, x3 = 2 · 11 = 22, y2 = (−2)5 = −10, y3 = (−3) · 7 = −21 y
Q3
definamos z1 := i=2 yi = (−10)(−21) = 210.
• Para z2 : elijamos x01 , x03 , y10 , y30 tales que x01 , x03 ∈ (5), y10 ∈ (11), y30 ∈ (7) y
x01 + y10 = 1, x03 + y30 = 1.
Es decir, x01 = (−2)5 = −10, x03 = 3 · 5 = 15, y10 = 11, y30 = (−2)7 = −14 y
definamos z2 := y10 y30 = 11(−14) = −154.
• Para z3 : elijamos x001 , x002 , y100 , y200 tales que x001 , x002 ∈ (7), y100 ∈ (11), y200 ∈ (5) y
x001 + y100 = 1, x002 + y200 = 1.
Es decir, x001 = (−3)·7 = −21, x002 = (−2)7 = −14, y100 = 2·11 = 22, y200 = 3·5 = 15
y definamos z3 := y100 y200 = 15 · 22 = 330.
Para mayor simplicidad podemos hacerlos todos positivos, reduciendo módulo N y
eligiendo:
z1 = 210, z2 = 231, z3 = 330.
iii) Con estos tres elementos y la fórmula (3.2.7) podemos hallar, dados x1 , x2 , x3 un
número x ∈ Z tal que
x mod (11) = x1 mod (11), x mod (5) = x2 mod (5), x mod (7) = x3 mod (7).
De hecho, tenemos que el número x1 z1 + x2 z2 + x3 z3 verificará:
Φ(x1 z1 + x2 z2 + x3 z3 ) = Φ(x1 )Φ(z1 ) + Φ(x2 )Φ(z2 ) + Φ(x3 )Φ(z3 ),
168 3. TEOREMA CHINO DE LOS RESTOS

lo que es una formulación equivalente.


iv) Con los datos del enunciado del texto de Sun Tzu, tendemos que
z := 2 · 210 + 3 · 231 + 2 · 330 mod 385 = 233,
satisface los requerimientos (si no se ha traspapelado algún error de cálculo por en
medio).

3.3.2. Una Aplicación en computación: Cálculo del Determinante por Algorit-


mos Modulares. Una de las aplicaciones más importantes del Teorema Chino de los Restos
sobre Z son los algoritmos modulares, usados en la programación de paquetes de software
simbólico comerciales como Maple, Mathematica y otros. Aquı́ ejemplificamos esta estrategia
con el ejemplo del cálculo del determinante de una matriz A ∈ Mn (Z) con coordenadas enteras.
El asunto es el siguiente:
En el algoritmo de Gauss clásico, aprendido en las asignaturas básicas de Álgebra Lineal, se
produce un fenómeno singular con la concatenación de elecciones de pivotes. Si supongo que
todas las coordenadas de la matriz A = (ai,j )1≤i,j≤n original, verifican |ai,j | ≤ H, tras haber
elegido k pivotes, el tamaño de los números enteros que aparecen en la matriz es del orden
k
H 2 . Esto significa, por ejemplo, que para matrices de tamaño 200 × 200 no existen suficientes
electrones en el Universo para almacenar los dı́gitos de uno de esos números enteros a razón de
un dı́gito por electrón. Ni que decir tiene de la imposibilidad de manejar matrices razonables
en la práctica con tamaños del orden 1000 × 1000.
La conclusión es que el método de Gauss, tal y como se enseña, no sirve. Surgen ası́ diversas
alternativas. Algunas hacen modificaciones del algoritmo de Gauss (con búsquedas de otros
pivotes y otras operaciones, reduciendo a cada paso), otros se centran en algoritmos bien par-
alelizables (que evitan el crecimiento de los resultados intermedios a través de estructurar las
operaciones a realizar mediante grafos bien paralelizables). Una vı́a más son los Algoritmos
Modulares que vamos a describir, basándonos en el TCR anterior. Comencemos recordando
los rudimentos del teorema de Gram–Schmidt 1 . Sea v1 , . . . , vn una base ordenada de Rn .
Definamos la secuencia de vectores v1∗ , . . . , vn∗ siguiente:
v1∗ := v1
hv2 ,v1∗ i
v2∗ := v2 − µ2,1 v1∗ , µ2,1 = hv1∗ ,v1∗ i
(3.3.2) ..
.
Pi−1 hvi ,vj∗ i
vi∗ := vi − j=1 µi,j vj∗ , µi,j := hvj∗ ,vj∗ i

Proposición 3.3.3. En las notaciones anteriores, v1 , . . . , vn una base de Rn . Sean v1∗ , . . . , vn∗
los vectores obtenidos tras aplicar Gram-Schmidt a esta base. Entonces,
i) ||vi∗ || ≤ ||vi ||,
ii) hvi∗ , vj∗ i = 0, para todo i 6= j.
Demostración. Son meras comprobaciones, la segunda propiedad implicando la primera.

Continuaremos con un clásico, conocido como Desigualdad de Hadamard.
Proposición 3.3.4 (Desigualdad de Hadamard). Sea A ∈ Mn (C) una matriz con coorde-
nadas complejas. Sean v1 , . . . , vn ∈ Cn los vectores dados por sus columnas. Entonces,
n
Y
|det(A)| ≤ ||vi ||2 ,
i=

donde || · ||2 denota la norma hermı́tica usual en Cn .


1Aunque parece que el método de cálculo de bases ortogonales ya era conocido por Laplace y habı́a sido
usado por Cauchy en 1836, se asigna este método a Jorgen P. Gram y Erhardt Schmidt. El trabajo de E. Schmidt
donde introdujo formalmente su método de ortogonalización es : Zur Theorie der linearen und nichtlinearen In-
tegralgleichungen. I Teil. Entwicklung willkürlichen Funktionen nach System vorgeschriebener. Mathematische
Annalen Vol. 63 (1907), 433–476. Los trabajos de Gram (un matemático “amateur” danés) son más difı́ciles
de rastrear para mı́ y no he sido capaz de saber con certeza dónde publicó sus resultados.
3.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z (OPCIONAL) 169

Demostración. Para demostrar el resultado utilizaremos la ortogonalización de Gram–


Schmidt. Dicho procedimiento establece que si A es la matriz dada, existe una matriz triangular
superior, con solo 1’s en la diagonal principal P tal que

P A = A1 ,

donde los vectores dados como las columnas de A1 son precisamente la base ortogonal, asociada
a los vectores columna de A :
{v1∗ , . . . , vn∗ }.
Ahora consideramos la matriz de Wishart de A:

W (A) := A∗ A,

donde A∗ es la traspuesta conjugada. Adicionalmente, se tiene :

|det(A)|2 = det(W (A) = det(AA∗ ).

Además,
hv1∗ , v1∗ i · · · hv1∗ , vn∗ i
 

det(A1 A∗1 )det  .. .. ..


.
 
. . .
hvn∗ , v1∗ i · · · ∗ ∗
hvn , vn i
Como hvi∗ , vj∗ i = 0 para i 6= j, tendremos
n
Y
|det(A1 )|2 = ||vi∗ ||2 .
i=1

Finalmente, usando la Proposición anterior,


n |
Y Y
|det(A)|2 = |det(A1 )|2 = ||vi∗ ||2 ≤ |vi ||2 .
i=1 i=1

Corollario 3.3.5. Sea A = (ai,j )1≤i,j≤n ∈ Mn (Z) una matriz con coordenadas enteras y
supongamos ||ai,j || ≤ H. Entonces,

|det(A)| ≤ H n .

Demostración. Obvio. 

Lema 3.3.6. Sea M ∈ Z un número entero positivo y sea a ∈ Z un número entero tal que su
valor absoluto verifica |a| ≤ M − 1. Sea x ∈ {0, . . . , 2M − 1} tal que :

x = a mod 2M.

Definamos :

x si 0 ≤ x ≤ M − 1
x
e :=
x − 2M si M + 1 ≤ x ≤ 2M − 1
Entonces, x
e = a.

Demostración. Es una mera comprobación a partir de las definiciones, que se deja como
ejercicio al lector. 
170 3. TEOREMA CHINO DE LOS RESTOS

3.3.2.1. La Búsqueda de un Buen Número Primo. Comencemos con un somero recordatorio


del Teorema de los Números Primos (véase, por ejemplo, el texto clásico de G.H. Hardy y E.M.
Wright, [HaWr, 38]). Este Teorema fue postulado tanto por A.-M. Legendre como por C.F.
Gauss, a base de evidencia numérica y fue demostrado simultánea e independientemente por
J. Hadamard y por Ch.-J. de la Vallée Poussin en 1896. Resultados más refinados han sido
logrados posteriormente. Por el momento, nos conformamos con versiones simples. Se trata de
unos de los grandes resultados en Teorı́a de Números. Una demostración puede verse también
en el texto de H. E. Rose ([Ro, 94], capı́tulos 12 y 13).
Comencemos con un poco de notación :
Notación 3.3.7. • Dadas dos funciones f, g : R −→ R, escribiremos f ∈ θ(g) cuando
f (x)
limx→∞ =1
g(x)
Obsérvese que f ∈ θ(g) ⇐⇒ g ∈ θ(f ).
• Definamos la función π : N −→ N dada por π(x) es el cardinal del conjunto de números
primos p tales que 2 ≤ p ≤ x.
Teorema 3.3.8 (Teorema (de Densidad) de los Números Primos). En las anteriores
notaciones,
π ∈ θ(Li(x)),
donde donde Z x
dt
Li(x) := ,
2 ln(t)
donde ln se refiere al logaritmo neperiano. Además, se tiene que, para x ≥ 55,2
x x
≥ π(x) ≥ .
ln(x) − 4 ln(x) + 2
3.3.2.2. Test de Primalidad. Se trata de un problema clásico tanto en Matemáticas como
en Informática.
Problema Clásico 3.3.9 (PRIMES). Dado un número natural n ∈ N, decidir si n es primo.
El algoritmo más inmediato es el algoritmo conocido como Criba de Eratóstenes. El problema
es el tiempo
√ necesario para ejecutarlo. Ası́ para decidir si un número n es primo hay que
realizar n operaciones elementales (operaciones bit). Se dice que es un algoritmo exponencial
o ineficiente porque el número de operaciones a realizar depende esencialmente del número n y
no de su tamaño que es log(n).
Se conocen algoritmos aleatorios (probabilistas eficientes en tiempo logO(1) (n)) desde mediados
de los años 70. Se conocen también como algoritmos Monte Carlo para testar composición y
son altamente eficaces en la práctica. Su aparición histórica es debida a los tests de composición
en la clase RP como son:
• El test de R. Solovay y V. Strassen de 1977 3.
• El test de M.O. Rabin y G. Miller de 1976–80 4.
Posteriormente se obtienen resultados eficientes en el trabajo de M. Agrawal, N. Kayal y N.
Saxena 5 muestran un algoritmo polinomial (en P, es decir en tiempo O(log9 (n)) ) para decidir
si un número natural dado es primo.
El algoritmo subyacente se basa en la idea siguiente :
Lema 3.3.10. Sea n ∈ N un número entero dado. Supongamos n > 2. Las siguientes
propiedades son equivalentes :
i) n ∈ N es un número primo.
2Aunque hay acotaciones más finas, nos bastan. Ver una prueba de la desigualdda expuesta en B. Rosser,
Explicit Bounds for Some Functions of Prime Numbers. American Journal of Mathematics 63 (1941), 211-232.
3R. Solovay, V. Strassen, A fast Monte Carlo test for primality. SIAM J. on Comput. 6 (1977), 84–85.
4Los trabajos de referencia son:
– G.L. Miller, Riemann’s hypothesis and tests for primality. J. Comput. Syst. Sci. 13 (1976), 300–317.
– M.O. Rabin, Probabilistic algorithms for testing primality. J. Number Theory 12 (1980), 128–138.

5M. Agrawal, N. Kayal, N. Saxena, PRIMES is in P. Annals of Math. 160 (2004), 781793.
3.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z (OPCIONAL) 171

ii) Para todo q, 1 ≤ q ≤ n − 1, se verifica :


 
n
= 0 mod p.
q
iii) Para cada a ∈ {0, . . . , p − 1}, los siguientes polinomios son iguales en Z/pZ[X] :
p
X p − a = (X − a) en Z/pZ[X].
La clave de la prueba es la formulación del item iii). Se trata de verificar esta propiedad (que
no es sino una comparación de coeficientes entre dos polinomios de grado p) y para todos los
valores a ∈ {0, . . . , p − 1}. Ası́ descrito el método propuesto por estos tres autores seguirı́a
siendo exponencial porque necesitarı́amos testar todos los coeficientes de O(p) polinomios de
grado p. El resultado principal de estos autores afirma que basta con hacer la comparación de
O(log 2 p) polinomios ( sólo valores pequeos de a) y que no es necesario hacer una comparación de
todos los coeficientes, sino una cantidad log O(1) p interpolaciones. No explicaremos más detalles
y orientamos al lector a la obra original, de sencilla lectura y, por ello, de gran creatividad.
3.3.2.3. Combinando el Teorema de Densidad de los Número Primos y los Tests de Pri-
malidad.
Proposición 3.3.11. Dado un número natural H ∈ N se pueden hallar números naturales
positivos n1 , . . . , nr verificando las siguientes propiedades:
i) El número de dı́gitos (talla bit, número de cifras) necesarios para representar el más
grande de estos números está acotado por 2 log2 (log2 (H)).
ii) La cantidad de números r es, a lo sumo log(H).
iii) Los números n1 , . . . , nr son co–primos dos a dos.
iv) Se verifica la siguiente desigualdad:
Yr
H≤ ni .
i=1
El número de operaciones elementales (bit) necesarias para calcularlos está acotado por
O(1)
log22 (H) log2 (log2 (H)).
Demostración. Elijamos un número entero positivo k ∈ N. Por el Teorema de Densidad
de los números primos, tenemos:
22k
2k ≤ ≤ π(22k ).
2k
Además, sean 2 := p1 ≤ p2 ≤ · · · ≤ p2k los números primos menores que 22k . Entonces,
k
2
2k
Y
2 ≤ pi .
i=

Entonces, eligiendo k := log2 (log2 (H)), tenemos 2k = log2 (H) números co–maximales, tales
que su producto es mayor que el número H dado. Más aún, el número primo pi más grande de
esta lista, es de valor absoluto menor que 22k = log22 (H) y, por tanto, su tamaño es, a lo sumo,
2 log2 (log2 (H)). Aplicando los algoritmos (como el AKS de Agrawal, Kayan y Saxena) tengo
que hacer 22k tests de primalidad y cada uno necesita O(k 9 ) operaciones bit. Lo que se puede
hacer en tiempo polinomial. 
3.3.2.4. La Estrategia Final. El resultado final serı́a el siguiente:
Teorema 3.3.12. Aplicando técnicas modulares al cálculo del determinante podemos concluir :
El determinante de una matriz A ∈ Mn (Z) cuyos coeficientes tienen tamaño (logaritmo) aco-
tado por h se puede calcular en tiempo
O(n4 log 2 n(log n + h)2 ).
La estrategia algorı́tmica para evitar el crecimiento es la siguiente:

Input: A := (ai,j )1≤i,j≤n ∈ Mn (Z) y H tal que ||ai,j || ≤ H.


Hallar (como el la Proposición 3.3.11) números enteros n1 , . . . , nr con r = 2(bn log(H)c + 1)
tales que
172 3. TEOREMA CHINO DE LOS RESTOS

Qr
• N := i=1 ni > 2H n ,
• gcd(ni , nj ) = 1, para todos i 6= j.
Comentario: El número más grande de esa lista es de tamaño (número de dı́gitos) acotado por
O(log2 (n) + log2 (log2 (H))), es decir, son muy pequeños.
Hallar: di := det(A) mod ni , para cada i, 1 ≤ i ≤ r.
Aplicando el Teorema Chino de los Restos, hallar
D mod N := Φ e −1 (d1 + (n1 ), d2 + (n2 ), . . . , dr + (nr )).
Aplicando el Lema 3.3.6 anterior:
Ouput: De ∈Z

3.3.3. Secretos Compartidos. Una de las aplicaciones estándar del Teorema Chino de
los Restos es el sistema de compartimentar la información llamado Secretos Compartidos (del
inglés “secret sharing”) y que se usa, por ejemplo, en los cajeros automáticos. Se trata de lo
siguiente : se dispone de una información codificada en un número entero n ∈ N. Ahora se
eligen r personas distintas, cada una de las cuales lleva asociado un módulo mi . Suponemos
que los módulos mi y mj son dos a dos comaximales. Ahora se entrega a cada persona la
información rem(n, mi ). Para poder recuperar la información inicial es necesario que todas
las personas estén dispuestas a aportar su información y ejecutar el algoritmo subyacente al
Teorema Chino de los Restos. Por ejemplo, el cajero (la máquina) posee posee una parte del
código de autorización de una cuenta/tarjeta y el propietario de la tarjeta una segunda parte:
su código personal PIN.
3.3.4. Ejercicios de la Sección 3.3.
Problema 152 (Versión Eficiente del TCR en Z). Supongamos dados números naturales
no nulos co-primos dos a dos {ai : 1 ≤ i ≤ m} ⊆ \{0}. Supongamos dada una secuencia de
restos modulares
x1 mod a1 , . . . , xm mod am .
Qm
Definamos M := i=1 ai y definamos:
M
Mi := , 1 ≤ i ≤ m.
ai
Probar:
i) Los enteros Mi y ai son co-primos dos a dos (i.e. gcd(Mi , ai ) = 1). Porbar que,
entonces, existe hi ∈ Z tal que Mi hi = 1 mod ai .
ii) Sea x ∈ Z el número entero dado por la siguiente igualdad:
m
X
x= (Mi hi xi ) .
i=1
Probar que si ϕ es el isomorfismo del Teorema Chino de los Restos, se tiene:
ϕ(x + M Z) = (x1 + a1 Z, . . . , xm + am Z).
iii) Probar que estas afirmaciones son válidas sobre todo dominio de ideales principales.
Problema 153. Hallar el entero positivo más pequeño tal que al dividirlo por 10, 17, y 19 da
restos 8, 11, y 14 respectivamente.
Problema 154. Supongamos que creamos un banco nuevo en el que aspiramos a que el número
de cuentas bancarias sea como mucho:
9.699.690.000 = 24 · 54 · 3 · 7 · 11 · 13 · 17 · 19.
Asociamos a cada cliente un número de cuenta PAN (Personal Account Number) entre 0 y este
número. Además, a cada cliente le reglamos una tarjeta de crédito que llevará asociado un
PIN (Personal Identification Number) a elección del usuario con 4 dı́gitos (es decir, un número
menor que 104 ). Por su parte, la tarjeta debe tener asignado un número CCN (Credit Card
Number) menor que 969.969. Proponemos un sistema de seguridad basado en el Teorema Chino
de los Restos. Se pide:
3.4. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R := K[X]. 173

i) Si un usuario tiene una cuenta con PAN=400.022. ¿Cuál ha de ser su PIN? y ¿cuál
ha de ser su CCN? con este esquema basado en TCR.
ii) Si un usuario nos pide por teléfono que su PIN sea PIN=2345, ¿Cuántas posibles
CCN le podrı́amos asignar a su tarjeta?
iii) En el caso inmediato anterior, ¿Es posible que la petición de PIN de un usuario, cuyo
PAN ya ha sido fijado, sea imposible?. ¿Cómo sugieres corregir ese efecto?.
Problema 155. Busca en internet uno de los Tests de Primalidad citados. Describe en qué
consiste el agoritmo que has elegido y aplı́calo a 4 números enteros de tu elección con, al menos,
4 dı́gitos cada uno. Explica los resultados de tu experimento.
Problema 156. Busca en internet el sistema criptográfico RSA (de Rivest, Shamir y Adle-
mann). Explica su funcionamiento, demuestra la veracidad de su funcionamiento, genera una
clave pública propia y comprueba su funcionamiento encriptando y desencriptando mensajes.
Haz lo mismo con mensajes firmados, generando dos usuarios con dos claves públicas.
Problema 157. Busca en wikipedia que es el sistema de seguridad TLS6 y explica cuál es su
relación con alguno de los contenidos anteriores. Abre tu navegador usual y trata de obtener
información sobre los protocolos de seguridad que se usan en conexión con una u otra página
web. Encuentra alguno que use TLS. Busca otras aplicaciones de esta versión del Teorema
Chino de los Restos.

3.4. El Teorema Chino de los Restos en el caso R := K[X].


Comenzemos recordando que K[X] es un dominio de ideales principales, dominio euclı́deo y
dominio de factorización única (i.e. véanse Teorema 1.4.14, Teorema 1.3.9, Teorema 2.3.20).
Retomamos el Ejemplo 1.4.3 y la serie de Problemas incluidos entre 116 y 124, incluyendo el
Problema 119. A partir de allı́, podemos concluir:
Proposición 3.4.1. Sea V un espacio vectorial de dimensión n sobre un cuerpo K, ϕ : V −→ V
una aplicación lineal. Entonces, V es un K[X]−módulo finitamente generado. Más aún, V es
isomorfo como K[X]−módulo a una descomposición
r
V ∼
Y
= K[X]/(fi (X)),
i=1
donde f1 , . . . , fr son los factores invariantes de ϕ como endomorfismo. En particular V es un
K[X]−módulo de torsión (i.e. todos sus elementos son elementos de torsión).
Demostración. Sin pérdida de la generalidad podemos suponer que ϕ viene dado, en una
cierta base
β := {v1 , . . . , vn },
por su forma de Frobenius (recordar Problema 124). Es decir:
 
C(f1 ) 0 0 0
 0 C(f2 ) 0 0 
M (ϕ) :=  ,
 
.. .. .. ..
 . . . . 
0 0 0 C(fr )
C(fi ) es la matriz compañera de un polinomio fi ∈ K[X] y f1 , . . . , fr son los factores invariantes
de ϕ. En particular, todos ellos son polinomios mónicos y, tomando di = deg(fi ), verifican:
• d1 ≥ d2 ≥ · · · ≥ dr ,
• f1 es el polinomio mı́nimo de ϕ,
• fi+1 | fi ,
• d1 + d2 + · · · + dr = n.
Supongamos, además,
i −1
dX
(i)
fi := X di + ak X k .
k=0
Obsérvese que se tienen las propiedades siguientes en la operación de K[X]−módulo:
6http://en.wikipedia.org/wiki/Transport_Layer_Security
174 3. TEOREMA CHINO DE LOS RESTOS

• Para 1 ≤ i ≤ d1 − 1, Xvi = vi+1


• Para i = d1 tendremos
1 −1
dX 1 −1
dX
d1 (1) (1)
Xvd1 = X v1 = − ak X k v1 =− ak vk+1 .
k=0 k=0

• En general, para d1 + d2 + · · · + ds + 1 ≤ i ≤ d1 + d2 + · · · + ds + ds+1 − 1, tendremos


Xvi = vi+1 .
• Para i = d1 + · · · + ds + ds+1 , tendremos
ds+1 −1
(ds+1 )
X
Xvd1 +···+ds +ds+1 = X ds+1 vd1 +···+ds +1 = − ak X k vd1 +···+ds +1 ,
k=0

y, por tanto,
ds+1 −1
(ds+1 )
X
Xvd1 +···+ds +ds+1 = − ak vd1 +···+ds +k+1 .
k=0

Estas identidades nos permiten definir el isomorfismo de K[X]−módulos siguiente:


r
Y
Φ: (K[X]/(fi (X))) −→ V,
i=1

definido del modo siguiente: dado


r
Y
Q := (q1 + (f1 ), q2 + (f2 ), . . . , qr + (fr )) ∈ (K[X]/(fi (X))) ,
i=1

definimos
Φ(Q) := q1 (X)v1 + q2 (X)vd1 +1 + · · · + qr (X)vd1 +···dr−1 +1 ,
y comprobar que Φ es un isomorfismo de K[X]−módulos. 

3.4.1. La Forma Canónica de Jordan. En la discusión anterior no hemos hecho in-


tervenir el Teorema Chino de los Restos. Ahora vamos a intentar hacerlo, recuperando su
formalismo original.
Teorema 3.4.2 (Teorema Chino de los Restos en K[X]). Sean dados f1 , . . . , fr ∈ K[X]
polinomios de tal modo que gcd(fi , fj ) = 1 para todo i 6= j. Entonces, la siguiente aplicación
es un isomorfismo de anillos:
e : K[Z]/ (g) −→ Qr
Φ i=1 (K[X]/(fi ))
(3.4.1)
x + (g) 7−→ (x + (f1 ), x + (f2 ), . . . , x + (fr )).

Además, Φ
e es isomrofismo de espacios vectoriales sobre K.

Demostración. De nuevo, es el enunciado exacto del Teorema Chino de los Restos de


Secciones anteriores. 

3.4.1.1. El álgebra K[X]/(f ). Supongamos f := X n + an−1 X n−1 + · · · + a1 X + a0 ∈ K[X],


un polinomio univariado que supondremos mónico por simplicidad de nuestra discusión. Con-
sideremos el anillo cociente K[X]/(f ). El problema 119 nos demostraba el siguiente enunciado:
Proposición 3.4.3. Con las anteriores notations, se tiene:
i) El anillo cociente K[X]/(f ) es una K−espacio vectorial de dimensión n sobre K.
ii) Una base de K[X]/(f ) como K−espacio vecyorial es dada por las clases de la base
monomial (también llamada base monomial) y descrita mediante:
β := {1 + (f ), X + (f ), X 2 + (f ), . . . , X n−1 + (f )}.
3.4. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R := K[X]. 175

iii) Dado X ∈ K[X], podemos definir la aplicación:


ηX : K[X]/(f ) −→ K[X]/(f )
h + (f ) 7−→ Xh + (f ),
es un endomorfismo de K[X]/(f ) como K−espacio vectorial. Más aún, la matriz
MX ∈ Mn (K), de ηX en la base β anterior, es, justamente, la matriz compañera de
f , esto es,  
0 0 0 ··· −a0
1
 0 0 ··· −a1 

0 1 0 ··· −a2 
MX := C(f ) = 0 .
 
 0 1 ··· −a3 
 .. .. .. .. .. 
. . . . . 
0 0 0 · · · −an−1
La matriz MX se denomina el tensor de multiplicación de la K−álgebra K[X]/(f ).
iv) Dado g ∈ K[X], podemos definir la aplicación:
ηg : K[X]/(f ) −→ K[X]/(f )
h + (f ) 7−→ gh + (f ),
es un endomorfismo de K[X]/(f ) como K−espacio vectorial. Nótese que dados g1 , g2 ∈
K[X] y λ ∈ K se tiene:
ηg1 +g2 = ηg1 + ηg2 , ηg1 ·g2 = ηg1 ◦ ηg2 , ηλg1 = ληg1 .
A los endomorfismos ηg se les denomina homotecias de razón g sobre K[X]/(f ).
v) En particular, la matriz Mg ∈ Mn (K), de ηg en la base β anterior, es, justamente,
Mg := g(MX ) = g(C(f )).

Proposición 3.4.4. Sea ζ ∈ K un elemento en un cuerpo K y consideremos el polinomio


mónico f = (X − ζ)n . Consideremos el anillo cociente K[X]/(f ). Se tiene:
i) La siguiente colección es una base de K[X]/(f ) como K− espacio vectorial, a la que
llamaremos base monomial en ζ de K[X]/(f ):
(n)
βζ := {1 + (f ), (X − ζ) + (f ), . . . , (X − ζ)n−1 + (f )}.
ii) La matriz en la base βζ de la homotecia ηX es, justamente, la caja de Jordan de orden
n y valor “propio” ζ. Es decir, la matriz J(ζ, n) ∈ Mn (K) dada mediante:
 
ζ 0 0 ··· 0 0
1 ζ 0 · · · 0 0
 
J(ζ, n) := 0 1 ζ · · · 0 0 .
 
 .. .. . . . .
. . .. 
. . . 
0 0 0 ··· 1 ζ
A la matriz J(ζ, n) se la denomina caja de Jordan de orden n en honor del matemático
C. Jordan 7 .
Demostración. La demostración de i) más “natural” pasa por usar el desarrollo de Tay-
lor en ζ de los polinomios. Expresamos ese noción del modo siguiente:
Dado cualquier polinomio univariado g ∈ K[X], de grado n, existen elementos únicos a0 , a1 , . . . , an ∈
K tales que
g = an (X − ζ)n + an−1 (X − ζ)n−1 + · · · a1 (X − ζ) + a0 .
Para ello, consideramos la siguiente transformación en K[X]:
Tζ : K[X] −→ K[X]
g 7−→ Tζ (g) := g(X + ζ).
7Camille Jordan introduce su forma canónica en su texto de 667 páginas “Traité des substitutions et des
équations algébriques”. Gauthier-Villars, Paris, 1870. Este tratado es un estudio completo de la teorı́a de E.
Galois, resolución de ecuaciones polinomiales univariadas, teorı́a de grupos y, en particular, contiene la forma
canónica de Jordan (que lo hizo sólo para un cuerpo finito, llamados “cuerpos de Galois”). El texto, usado en
la École Polytechnique, recibió en Premio Poncelet de la Academia de Ciencias de Parı́s.
176 3. TEOREMA CHINO DE LOS RESTOS

Es claro que Tζ es un isomorfismo de anillos cuyo inverso es T−ζ . Más aún, deg(Tζ (g)) = deg(g),
para cualquier g ∈ K[X]. Ahora bien, si g es un polinomio de grado n, entonces h(X) = Tζ (g) =
g(X + ζ) es un polinomio de grado n en K[X]. Por tanto, existen a0 , . . . , an ∈ K tales que

h = an X n + · · · a1 X + a0 .

Por tanto,
g = T−ζ (h) = T−ζ (Tζ (g)) = an (X − ζ)n + · · · + a1 (X − ζ) + a0 ,
y tenemos probada la afirmación. La u8nicidad se sigue de la unicidad de los coeficientes de
h = Tζ (g).
En particular, para la afirmación i), los restos en K[X]/(f ) se escriben de manera única como
(n)
combinación lineal de los elementos de la base βζ y tenemos que es sistema generador. Dado
(n)
que βζ es de cardinal n, y n es la dimensión de K[X]/(f ), tenemos que es base.
Para la afirmación ii), observemos la siguiente cadena:

ηX (1 + (f )) = ((X − ζ) + (f  )) + ζ (1 + (f )) = v2 + ζv1
ηX ((X − ζ) + (f ))  = (X − ζ)2 + (f ) + ζ ((X − ζ) + (f )) = v3 + ζv2
ηX (X − ζ)2 + (f ) = (X − ζ)3 + (f ) + ζ (X − ζ)2 + (f ) = v4 + ζv3
.. ..
 .  .
ηX (X − ζ)n−1 + (f ) = ((X − ζ)n + (f )) + ζ (X − ζ)n−1 + (f ) = 0 + ζvn−1 ,
(n)
donde hemos escrito βζ := {v1 , v2 , . . . , vn } y vi := (X − ζ)i−1 + (f ), para 1 ≤ i ≤ n. Esta
(n)
cadena de igualdades justifica que la matriz de ζX en la base βζ sea justamente la “caja” de
Jordan J(ζ, n). 

Estamos ya en condiciones de justificar una primera interpretación del Teorema Chino de los
Restos en el caso de polinomios mónicos que se descomponen completamente sobre un cuerpo
K.

Proposición 3.4.5. Sea f ∈ K[X] un polinomio mónico de grado n y supongamos que existen
ζ1 , . . . , ζr ∈ K, con ζi 6= ζj , y exponentes mi ∈ N, con mi ≥ 1, 1 ≤ i ≤ r, tales que:
r
Y
f (X) := (X − ζi )mi .
i=1

Consideremos:
• Sea Φe : K[X]/(f ) −→ Qr (K[X]/(X − ζi )mi ) el isomorfismo de anillos del Teo-
i=1
rema Chino de los Restos. Entonces, Φ e es también un isomorfismo de K−espacios
vectoriales.
• En K[X]/(f ) la base monomial βQ:= {1 + (f ), X + (f ), X 2 + (f ), . . . , X n−1 + (f )}.
r
• En el espacio vectorial producto i=1 (K[X]/(X − ζi )mi ), la base Γ inducida por las
(m )
bases βζi i en cada uno de los espacios vectoriales K[X]/(X − ζi )mi .
• Y sea MΦ la matriz del isomorfismo Φ e en las bases β y Γ.
Entonces, se tiene:
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ 2 , m2 ) ··· 0 
C(f ) := MΦ−1   MΦ .
 
.. . .. .. ..
 . . . 
0 0 ··· J(ζr , mr )

En paricular, C(f ) posee forma canónica de Jordan, ésta es única (salvo permutación de los
bloques) y la matriz de cambio de base es la matriz del Teorema Chino de los Restos.

Demostración. Obsérvese que si ζi 6= ζj , entonces, (X −ζi )k y (X −ζj )s son co–maximales


para k, s ≥ 1. Por tanto, el hecho de ser Φ
e un isomorfismo se sigue del Teorema Chino de los
3.4. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R := K[X]. 177

Restos. De otro lado, tenemos el siguiente diagrama conmutativo:


Φ
e
Qr
K[X]/(f ) −→ i=1 (K[X]/(X − ζi )mi )
Qr (i)
ηX ↓ ↓ i=1 ηX
Qr mi
K[X]/(f ) −→ i=1 (K[X]/(X − ζi ) )
Φe
Qr (i)
Este diagrama es conmutativo, donde i=1 ηX es el endomorfismo dado mediante el producto
de los endomorfimos
(i)
ηX : K[X]/(X − ζi )mi −→ K[X]/(X − ζi )mi .
La conmutatividad del diagrama nos dice que
r
!
(i)
Y
ηX e −1 ◦
=Φ ηX ◦ Φ.
e
i=1

Por lo visto anteriormente, MX = C(f ) es la matrix de la homotecia ηX en la base β.


(i) (i) (m )
De otro lado, M (ηX ) = J(ζi , mi ) es la matriz de ηX cuando se considera la base βζi i en
K[X]/(X − ζi )mi .
Qr (i)
En particular, la matriz M ( i=1 ηX ) en la base producto es la suma diagonal de las matrices
(i)
M (ηX ), es decir,
 
J(ζ1 , m1 ) 0 ··· 0
r  0 J(ζ2 , m2 ) · · · 0 
(i)
Y
M ( ηX ) =  .
 
.. . . . . .
.
i=1
 . . . . 
0 0 ··· J(ζr , mr )
Traduciendo la conmutatividad del diagrama a matrices, esto significa
r
!
(i)
Y
−1
M (ηX ) = M (Φ) ◦ M
e η ◦ M (Φ),
e
X
i=1

es decir  
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ 2 , m 2 ) ··· 0 
C(f ) = MΦ−1   MΦ ,
 
.. . . .. ..
 . . . . 
0 0 ··· J(ζr , mr )
que es la propiedad buscada. 

Observación 3.4.6 (La forma canónica de Jordan). Retomando los cursos básicos de
Álgebra Lineal, la anterior Proposición nos dice que si el polinomio mı́nimo de un endomorfismo
A se escinde completamente en un cuerpo, entonces, existe una única forma canónica de Jordan.
La unicidad viene dada por los divisores de la forma (X − ζ)m de los factores invariantes y las
matrices de paso de la forma de Frobenius (suma diagonal de matrices compañeras) a la forma
canónica de Jordan son las matrices del Teorema Chino de los Restos en bases adecuadas.
3.4.2. Teorı́a del Endomorfismo y el Máximo Común Divisor en K[X] (Op-
cional). Como aplicación final del Teorema Chino de los Restos (al menos en esta parte del
curso), veremos cómo predecir el grado del máximo común divisor de dos polinomios usando
Teorı́a del Endomorfismo y sin acudir a la matriz de Sylvester de la Eliminación Univariada
Clásica. Comencemos con algunos resultados clásicos de Álgebra Lineal.
Lema 3.4.7. Sea K un cuerpo, y sea K su clausura algebraica. Sea g ∈ K[X] un polinomio
univariado. Tendremos las iguientes propiedades :
i) Sea J(0, m) una caja de Jordan con valor propio 0 de tamaño m × m. Entonces,
178 3. TEOREMA CHINO DE LOS RESTOS

• Para todo k, 1 ≤ k ≤ m, se tiene :


 
0 0
J(0, m)k = ,
Idm−k 0
donde Idm−k es la matriz identidad (m − k) × (m − k) y los 0’s representan
matrices rectangulares de tamaño apropiado.
• Para todo k ≥ m, se tiene :
J(0, m)k = 0.
ii) Si J(ζ, m) es una caja de Jordan de orden m y valor propio ζ ∈ K y denotamos por
ordζ (g) como el máximo número natural k ∈ N tal que (X −ζ)k | g en K[X], entonces,
tenemos
rankg(J(ζ, m)) = max{0, m − ordζ (g)}.
Demostración. Las propiedades descritas en i) son las propiedades habituales de las
matrices nilpotentes, esto es, de las matrices tales que existe una potencia que se anula. Más
aún, son propiedades de las cajas de Jordan de valor propio 0. Para la propiedad ii), obsérves
que ha de existir h ∈ K[X] un polinomio tal que g = h(X)(X − ζ)k , donde:
• h(ζ) 6= 0,
• k = ordζ (g).
Ahora, observamos que
g(J(ζ, m)) = h(J(ζ, m))(J(ζ, m) − ζIdm )k ,
Obsérvese que  
h(ζ) 0 0 ··· 0
 ∗ h(ζ) 0 ··· 0 
 
 ∗ ∗ h(ζ) ··· 0
h(J(ζ, m)) =  ,

 .. .. .. .. ..
 . . . . .
∗ ∗ ∗ ··· h(ζ)
donde ∗ denota un elemento de K cuyo valor no nos ocupa. En otras palabras, h(J(ζ, m))
es una matriz triangular inferior con el valor h(ζ) en la diagonal principal, Como h(η) 6= 0,
entonces, es una matriz regular y, por tanto, el rango de g(J(ζ, m)) es igual al rango de ma
matriz (J(ζ, m) − ζIdm )k . Ahora observemos que
(J(ζ, m) − ζIdm )k = (J(0, m))k .
Luego el rango de g(J(ζ, m)) es igual a m − k si m ≥ k y 0 en caso contrario. ésto es lo que se
indica en el enunciado del Lema. 
Proposición 3.4.8 (Barnett, Grado del máximo común divisor de dos polinomios).
Dados dos polinomiso f, g ∈ K[X] supongamos que f es mónico. Entonces, el grado d del
máximo común divisor h de f y g satisface:
deg(f ) = rank(g(C(f )) + deg(h),
donde C(f ) es la matriz compañera de f .
Demostración. En primer lugar, podemos suponer que existen ζ1 , . . . , ζr ∈ K, con ζi 6=
ζj , cuando i 6= j, y existen m1 , . . . , mr ∈ N, con mi ≥ 1, 1 ≤ i ≤ r, tales que
r
Y
f (X) := (X − ζi )mi .
i=1
Pr
En particular tenemos i=1 mi = deg(f ) = m. Gracias al Teorema Chino de los Restos
podemos suponer que existe una matriz regular P con coordenadas en K tal que
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ2 , m2 ) · · · 0 
C(f ) = P −1   P.
 
.. . .. .
..
 . ··· 
0 0 ··· J(ζr , mr )
3.4. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R := K[X]. 179

Entonces,
 
g(J(ζ1 , m1 )) 0 ··· 0
 0 g(J(ζ 2 , m2 )) ··· 0 
g(C(f )) = P −1   P.
 
.. . . ..
 . . ··· . 
0 0 ··· g(J(ζr , mr ))
Como P es una matriz regular, el rango de la matriz g(C(f )) viene dado por:
 
g(J(ζ1 , m1 )) 0 ··· 0
 0 g(J(ζ2 , m2 )) · · · 0  X r
rank(g(C(f )) = rank  = rank(g(J(ζi , mi ))).
 
.. .. .
.. 
 . . ···  i=1
0 0 · · · g(J(ζr , mr ))
Ahora, usando el Lema anterior, tendremos:
X r
rank(g(C(f ))) = max{0, mi − ordζi (g)}.
i=1

Escribamos νi := ordζi (g) por simplicidad notacional. Para concluir, probemos que la suma
descrita a la derecha es igual a deg(f ) − deg(h) donde h es el gcd(f, g).
Supongamos, entonces, que
Yr
g = p(X) (X − ζi )νi ,
i=1
donde p(ζi ) 6= 0 para todo i y νi = ordζi (g). El máximo común divisor de g y f vendrá dado
por la igualdad
Y r
h(X) := (X − ζi )min{mi ,νi } .
i=1
Luego
r
X
deg(h) = min{mi , νi }.
i=1
Pero, nótese que
mi − min{mi , νi } = max{0, mi − νi }.
Por tanto,
r
X r
X r
X
deg(h) = min{mi , νi } = mi − max{0, mi − νi } = deg(f ) − rank(g(C(f ))),
i=1 i=1 i=1
como se pretende en el enunciado. 
Observación 3.4.9. En el caso de la que la caracterı́stica de los cuerpos K y K es cero, podemos
describir con detalle la matriz g(J(ζ, m)) mediante las derivadas sucesivas
···
 
g(ζ) 0 0 0
0
 g (ζ) g(ζ) 0 ··· 0 
1 00 0
· · ·
 
g(J(ζ, m)) = 
 2 g (ζ) g (ζ) g(ζ) 0 ,

 .. .. .. .. .. 
 . . . . . 
1 (m−1) 1 (m−2) 1 (m−3)
(m−1)! g (ζ) (m−2)! g (ζ) (m−3)! g (ζ) · · · g(ζ)

donde g 0 (α), g 00 (α), . . . , g (m−1) (α) son las sucesivas derivadas.


Corollario 3.4.10. Con las anteriores notaciones, el grado del máximo común dividor de f
y g con f mónico satisface:
deg (gcd(f, g)) = dim ker (Mg ) .
Demostración. Obvio desde lo anterior, dado que
dim (ker(Mg ) = deg(f ) − rank (Mg ) .

180 3. TEOREMA CHINO DE LOS RESTOS

Algoritmo 3.4.11 (Cálculo del gcd en dimensión intrı́nseca).


Input: Dos polinomios f, g ∈ K[X], siendo g mónico.
Output: El polinomio h = gcd(f, g) ∈ K[X].

initialize: M := C(g) % la matriz compañera de g.

eval: N := f (M ) % la matriz de ηf sobre Ag .

compute: β una base de KN := ker(N )

compute: la matriz B de ηX |KN : KN −→ KN en la base β. % posible por ser


ηX −invariante.

output: h(X) := χB (X) := det(XId − B) % el polinomio caracterı́stico de B.

end

Corollario 3.4.12. El anterior algoritmo calcula el máximo común divisor de f y g y del


ω
número de operaciones aritméticas a realizar es del orden O (deg(f ) (deg(g)) ), donde ω es el
exponente del álgebra lineal. Nótese que el álgebra lineal implicada es del orden de deg(g) para
operaciones Gaussianas y deg(gcd(f, g)) para el cálculo de un polinomio caracterı́stico.
Demostración. Basta con seguir la descomposición del núcelo y probar la invarianza del
núcleo de ηg con respecto a cualquier homotecia ηh . EN particular, ocurre con ηX y se habrá
terminado. Mera Comprobación. 
3.4.3. Ejercicios de la Sección 3.4.
Problema 158 (Funciones polinomiales y cuerpos finitos). Sea K un cuerpo y consider-
emos el anillo K[K] de las aplicaciones polinomiales K−definibles sobre K. Sea I(K) ⊆ K[X]
el ideal formado por todos los polinomios p ∈ K[X] que se anulan idénticamente sobre K. Para
cada punto ζ ∈ K sea mζ el ideal de todos los polinomios que se anulan sobre ζ. Se pide:
i) Probar que K es un cuerpo finito si y soamente si I(K) 6= (0).
ii) Probar que K es algebraicamente cerrado si y sólo si se verifica:
 
[
K[X] \  mζ  = ∅
ζ∈K

iii) Probar que si K tiene, al menos, n elementos distintos α1 , . . . , αn ∈ K, para todo


m ∈ N, m ≥ n − 1 el ideal intersección n := ∩ni=1 mαi verifica que n ∩ K[X]m es un
espacio vectorial de dimensión m − n + 1.
iv) Concluir si K tiene, al menos, n elementos distintos α1 , . . . , αn ∈ K, entonces
las soluciones de un problema de interpolación con datos (b1 , . . . , bn ), punto α =
(α1 , . . . , αn ) ∈ K n , y grado m ≥ n − 1 es una variedad afı́n lineal de dimensión
m − n + 1.
Problema 159 (Interpolación de Lagrange). Sea K un cuerpo que tiene, al menos, n
elementos distintos α1 , . . . , αn ∈ K. Sea (b1 , . . . , bn ) ∈ K n un punto en el espacio afı́n
n−dimensional y sea m ≥ n − 1. Consideremos el Problema de Interpolación definido por
estos tres elementos sobre K.
   
A0 b1
 A1   b2 
V dMn×m (α1 , . . . , αn )  .  =  .  .
   
 ..   .. 
Am bn
Se pide:
3.4. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R := K[X]. 181

i) Interpolación de Lagrange: Probar que el siguiente polinomio es la única solución


de grado menor o igual que n − 1 en K[X]m del problema de interpolación anterior:
n Q
j6=i (X − αj )
X
fLg := bi Q .
i=1 j6=i (αi − αj )

ii) Probar que si f, g ∈ K[X] son dos soluciones del Problema de Interpolación, entonces,
f − g es una solución del Problema de Interpolación homogéneo:
   
A0 0
 A1  0
V dMn×m (α1 , . . . , αn )  .  =  .  .
   
 ..   .. 
Am 0
Probar que el connunto de soluciones de este Problema de Interpolación homogéneo es
la intersección n ∩ K[X]m , donde n es el ideal dado mediante: n := ∩ni=1 mαi .
iii) Con las notaciones anteriores, probar que el conjunto de todas las soluciones del Prob-
lema de Interpolación inicial es dado mediante:
fLg + (n ∩ K[X]m ) = {fLg + h : h ∈ n ∩ K[X]m }.
Problema 160 (Ecuaciones Diferenciales Homogéneas con coeficientes constantes).
Definamos el siguiente conjunto:
C ω (R, C) := {f : R −→ C : f es analı́tica}.
Probar que C ω (R, C) es un anillo conmutativo con unidad. Denotemos este anillo por R :=
C ω (R, C) y sean Mn (C) y Mn (R) respectivamente, las matrices n × n con coordenadas en C y
R. Para una matriz A ∈ Mn (C), consideraremos sistemas de ecuaciones diferenciales lineales
homogéneos coeficientes constantes con condición inicial de la forma siguiente:

A · X(t) = Ẋ(t),
(3.4.2)
X(0) = v,
donde
   0   
x1 (t) x1 (t) v1
X(t) :=  ...  , Ẋ(t) :=  ...  , v =  ..  ∈ Cn .
    
. 
xn (t) x0n (t) vn
Dada una caja de Jordan J(λ, m) ∈ Mm (C), definamos la matriz
 
1 0 0 ··· 0

 t 1 0 ··· 0 

2
t
eJ(λ,m)t λt 
:= e 

2! t 1 ··· 0 
.
.. .. .. .. .. 

 . . . . . 

tm−1 tm−2 tmi −3
(m−1)! (m−2)! (m−3)! ··· 1
Se pide:
i) Probar que eJ(λ,m)t ∈ Mm (C ω (R, C)).
ii) Probar que una solución en C ω (R, C)n de la ecuación diferencial dada por la Ecuación
(3.4.2), tomando A = J(λ, m) es la dada mediante:
   
x1 (t) v1
 ..  J(λ,m)t  .. 
 . =e  . .
xn (t) vn
iii) Sean A, B ∈ Mn (C) dos matrices complejas semejantes. Sea P ∈ GL(n, C) tal que
P AP −1 = B.
182 3. TEOREMA CHINO DE LOS RESTOS

Probar que las soluciones de la Ecuación Diferencial (3.4.2) están en biyección con
las soluciones de la siguiente Ecuación Diferencial:

B · Y (t) = Ẏ (t),
(3.4.3)
X(0) = w,
donde w = P −1 v ∈ Cn . ( Pista: Probar que la relación Y 7−→ X = P −1 Y define la
biyección entre las soluciones).
iv) Dada la matriz A ∈ Mn (C) suma diagonal de cajas de Jordan siguiente:
 
J(λ1 , m1 ) 0 ··· 0
 0 J(λ2 , m2 ) · · · 0 
A :=  .
 
.. . . .
.
 . . . 
0 0 ··· J(λr , mr )
Probar que una solución de la Ecuación Diferencial (3.4.2) para esta matriz A viene
dada mediante:
   J(λ ,m )t  
x1 (t) e 1 1 ··· 0 v1
 ..  At .
.. . .. .
.. .
X(t) =  .  = e v :=    ..  .
  

xn (t) 0 · · · eJ(λr ,mr )t vn


v) Dar una expresión general de la solución de la Ecuación Diferencial (3.4.2) usando la
forma canónica de Jordan de la matriz A y la matriz de paso P ∈ GL(, n, C).
Problema 161. Al princpio del Capı́tulo aparece una frase que I. Newton escribión en respuesta
a su competidor R. Hooke. Sin embargo, la frase “like dwarfs standing on the shoulders of
giants” no es originaria de Newton. Busca su origen y explica su significado. ¿Pensaba Newton
que él era bajito de estautura?, ¿Crees que la sociedad actual conoce el sentido y significado de
esa frase?.
Problema 162. Se proponen varias tareas:
• Localiza el siguiente texto de A. Grothendieck “Allons-nous continuer la recherche
scientifique ? ”.
• Tradúcelo, haya su fuente, dale un contexto. Especialmente, averigua quién fue A.
Grothendieck e interpreta lo que quiere decir con el discurso completo.
• Traduce la expresión “C’est un con”, en el contexto del que habla Grotendieck. Explica
por qué él la considera detestable y expresa algún argmento por el que esa expresión y
todas sus traduciones a cada uno de los idiomas actuales o futuros, deberı́an prohibirse,
explusarse del mundo Matemático y, en general, del mundo cientı́fico.
• Explica si existe un abuso de semejantes descalificaciones en Twiter sobre cualquier
aspecto de la vida o en el contexto educativo sobre los alumnos. ¿Crees que deberı́a
mantenerse o exluirse?, ¿Es un debate nuevo o viejo?.
• Busca en la Biblioteca de la UC algún otro texto de A. Grothendieck distinto de su
tesis y sus primeros trabajos (o sea, busca algún EGA o SGA, que alguna hay). Trata
de leerlo y resume su contenido, desde tu punto de vista.
• Responde, desde tu perspectiva: ¿Son las Matemáticas un hecho individual o social?.

“...Pour illustrer ce point, j’aimerais donner ici un exemple très concret. Je suis allé, il y a
deux semaines, faire un tour en Bretagne. J’ai eu l’occasion, entre autres, de passer à Nantes
o j’ai vu des amis, o j’ai parlé dans une Maison de Jeunes et de la Culture (MJC) sur le
genre de problèmes que nous abordons aujourd’hui. J’y étais le lundi. Comme les collègues
de l’Université de Nantes étaient avertis de ma venue, ils avaient demandé in extremis que je
vienne, le lendemain après-midi, pour faire une causerie sur des sujets mathématiques avec eux.
Or il s’est trouvé que, le jour même de ma venue, un des mathématiciens de Nantes, M. Moli-
naro, s’est suicidé. Donc, à cause de cet incident malheureux, la causerie mathématique qui
était prévue a été annulée. Au lieu de ceci, j’ai alors contacté un certain nombre de collègues
pour demander s’il était possible que l’on se réunisse pour parler un peu de la vie mathématique
à l’intérieur du département de mathématiques à l’Université et pour parler également un peu
de ce suicide. Il y a eu une séance extrêmement révélatrice du malaise général, cette après-midi
3.4. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R := K[X]. 183

là à Nantes, o manifestement tout le monde présent avec une exception je dirais sentait bien
clairement que ce suicide était lié de très très près au genre de choses que, précisément, on
discutait la veille au soir à la MJC.
En fait, je donnerai peut-être un ou deux détails. Il s’est trouvé que Molinaro avait deux
thésards auxquels il faisait faire des thèses de troisième cycle je crois que ce n’était pas des
thèses d’état. Or, ces thèses furent considérées comme n’étant pas de valeur scientifique suff-
isante. Elles furent jugées très sévèrement par Dieudonné qui est un bon collègue à moi et avec
lequel j’ai écrit un gros traité de géométrie algébrique. Je le connais donc très bien, c’est un
homme qui a un jugement scientifique très sr, qui est très exigeant sur la qualité d’un travail
scientifique. Ainsi, alors que ces thèses étaient discutées par la Commission pour l’inscription
sur la liste d’aptitude aux fonctions de l’Enseignement Supérieur, il les a saqués et l’inscription
a été refusée. Ceci, bien entendu, a été ressenti comme une sorte d’affront personnel par Moli-
naro qui avait déjà eu des difficultés auparavant et il s’est suicidé sur ces circonstances. En fait,
j’ai eu un ami mathématicien, qui s’appelait Terenhfel qui s’est également suicidé. Je connais
un certain nombre de mathématiciens je parle surtout ici de mathématiciens puisque c’est le
milieu que j’ai le mieux connu qui sont devenus fous.
Je ne pense pas que cela soit une chose propre aux mathématiques. Je pense que le genre,
disons, d’atmosphère qui prévaut dans le monde scientifique, qu’il soit mathématique ou non,
une sorte d’atmosphère à l’air extrêmement raréfié, et la pression qui s’exerce sur les chercheurs
sont pour beaucoup dans l’évolution de ces cas malheureux.
Ceci concernant le plaisir que nous prenons à faire de la recherche scientifique. Je crois qu’il
peut y avoir plaisir, mais je suis arrivé à la conclusion que le plaisir des uns, le plaisir
des gens haut placés, le plaisir des brillants, se fait aux dépends d’une répression
véritable vis-à-vis du scientifique moyen....
Mais, d’autre part, quand je parle d’une vie qui est digne d’être vécue, il ne s’agit pas seulement
de ma vie à moi, il s’agit de la vie de tous. Et je me rends compte que l’épanouissement que j’ai
pu réaliser dans une direction très limitée se faisait au dépends des possibilités d’épanouissement
d’autres personnes. Si certaines personnes se sont trouvées sous une pression psy-
chologique si forte qu’elles en sont parfois venues au suicide, c’est bien à cause
d’un consensus dominant qui faisait que la valeur de la personne était jugée, par
exemple, d’après sa virtuosité technique à démontrer des théorèmes, c’est-à-dire
à effectuer des opérations excessivement spécialisées alors que, précisément, tout
le reste de la personne était complètement laissée dans l’ombre. C’est une chose que
j’ai expérimenté maintes fois. Quand on parle d’une certaine personne et que je demande “Qui
est-ce ?”, on me répond “C’est un con”, En voulant dire par là, entre mathématiciens, que
c’est un type qui soit démontre des théorèmes qui ne sont pas très intéressants, soit démontre
des théorèmes qui sont faux, ou bien ne démontre pas de théorèmes du tout.
Donc, là, j’ai défini un peu négativement ce que j’entends par une vie qui soit digne d’être
vécue. Je pense que, pour tout le monde, il y a possibilité d’épanouissement sans
que nous soyons jugés par les autres, par des critères aussi étroits, aussi étriqués.
En fait, je pense que cette échelle de valeurs a un effet directement mutilant sur
les possibilités d’épanouissement. Enfin, c’est un des aspects, je ne prétends pas répondre
ici à la question soulevée qui est très vaste ; mais dans l’optique o nous nous plaçons ici, en
partant de la pratique scientifique, c’est ce que je vois de plus immédiat à répondre....”
CAPı́TULO 4

Nociones un poco más avanzadas: localización, radicales,


categorı́as.
(Don’t Give up!)

in this proud land we grew up strong


we were wanted all along
I was taught to fight, taught to win
I never thought I could fail
....
don’t give up
you’re not beaten yet
don’t give up
I know you can make it good
....
don’t give up
you’re not the only one
don’t give up
no reason to be ashamed
.....
don’t give up
’cause I believe there’s a place
there’s a place where we belong

Índice
4.1. Introducción 185
4.2. Local, Localización 186
4.2.1. Anillos Locales y Semi-locales: Gérmenes de Funciones 186
4.2.2. Localización 187
4.3. Ideal asociado a una variedad: radical y radical de Jacobson 188
4.3.1. Ideal de un Objeto Geométrico 188
4.3.2. Radical y Radical de Jacobson 190
4.4. Funciones vs Objetos 192
4.4.1. El Lenguaje de las Categorı́as. 192
4.4.2. Categorı́as 192
4.4.3. Functores y Equivalencias Naturales 193
4.4.4. Variación de un primer tema clásico: El Teorema de Stone–Cech 195
4.4.5. Variación de un segundo tema clásico: El Lema de Urysohn y el Teorema
de Extensión de Tietze. 196
4.4.6. Variación de un tercer tema clásico: Extensión de funciones en Variedades
Diferenciables 196
4.5. Cuestiones y Problemas 197

4.1. Introducción
En este Capı́tulo avanzaremos un poco más las nociones esenciales del curso. Nos adentraremos
en anillos locales, localización, radical y radical de Jacobson. Morivaremos a través de ejemp-
los de anillos locales provenientes de la Geometrı́a. Adicionalmente, intruciremos unas pocas
expresiones al uso del Lenguaje de las Categorı́as, fuertemente desconocido por los alumnos.
185
186 4. UN POCO MÁS AVANZADAS

4.2. Local, Localización


4.2.1. Anillos Locales y Semi-locales: Gérmenes de Funciones.
Definición 57 (Anillo local). Un anillo R se denomina local si posee un único ideal maximal.
Se suele decir (R, m) es un anillo local para distinguir el único elemento de Spm(R). Al cuerpo
correspondiente κ(m) := R/m se le denomia cuerpo residual del anillo local.

Se denomina anillo semi–local a todo anillo con un número finito de ideales maximales (i.e.
](Spm(R)) < ∞).

Ejemplo 4.2.1. Como primer ejemplo de anillos locales tenemos los cuerpos. Ejemplos de
anillos semilocales sonlos siguientes:
Sea k = K un cuerpo algebraicamente cerrado. Sea f ∈ k[X] un polinomio no constante y sea
R el anillo cociente R := k[X]/(f ). Entonces R es un anillo semilocal: sus ideales maximales
son los ideales maximales de k[X] que contienen al polinomio f . De hecho, usando el Teorema
Chino de los Restos anterior, si f factoriza mediante:
r
Y
f := (X − ζi )mi ,
l=1

los ideales maximales del anillo cociente R son los ideales de la forma (X − ζi )/(f ) y el anillo
cociente es local si y solamente si f = (X − ζi )mi .

El término local viene, sin embargo, de la Geometrı́a y del estudio “local” de funciones y objetos
geométricos. Usaremos la noción de gérmen para explicar esa noción local.

Ejemplo 4.2.2 (Gérmen de Conjunto en un punto). Dado un espacio topológico X y un punto


p ∈ X, se define la siguiente relación de equivalencia entre los subconjuntos que contienen a p:

A ∼p B ⇔ ∃U entorno de p tal que A ∩ U = B ∩ U.


A las clases del conjunto cociente se les llama gémenes de subconjuntos de X en el punto p.
Denotaremos por Ap al gérmen del conjunto A ⊆ X en el punto p. El estudio local de un objeto
geométrico A ⊆ X alrededor de un punto p consiste en el estudio del gérmen Ap .

Ejemplo 4.2.3 (Gérmen de Función en un punto). Dado un espacio topológico X y un punto


p ∈ X, se define la siguiente relación de equivalencia entre las funciones continuas definidas en
algún entorno de a p:
f ∼p g ⇔ ∃U entorno de p tal que las restricciones f |U = g |U .
A las clases del conjunto cociente se les llama gémenes de funciones en el punto p. Denotaremos
por fp al gérmen de una función f : U −→ K (K = R ∨ C) definida en algún entorno del punto
p. El estudio local de una f alrededor de un punto p consiste en el estudio del gérmen fp .

Ejemplo 4.2.4. Los siguientes son ejemplos de anillos locales:


• Cp0 (X) := {fp : f es continua en algún entorno de p} es local y su único ideal maxi-
mal es
mp := I({p}) := {fp ∈ Cp0 (X) : f (p) = 0}.
• Cp∞ (X) :: {fp : f es infinitamente diferenciable en algún entorno de p} y su único
ideal maximal es
mp := I({p}) := {fp ∈ Cp∞ (X) : f (p) = 0}.
• Cpω : {fp : f es analı́tica en algún entorno de p} y su único ideal maximal es
mp := I({p}) := {fp ∈ Cpω : f (p) = 0}.
• Hp : {fp : f es holomorfa en algún entorno de p} y su único ideal maximal es
mp := I({p}) := {fp ∈ Hp : f (p) = 0}.
4.2. LOCAL, LOCALIZACIÓN 187

Observación 4.2.5. Como comentario general, el estudio local de funciones y objetos geométricos,
coincide con el estudio de anillos locales (de funciones, por ejemplo).

Proposición 4.2.6. i) Sea R un anillo y m 6= (1) un ideal de R tal que


∀x ∈ R \ m =⇒ x ∈ R∗ ,
entonces R es anillo local de maximal m.
ii) Sea R un anillo y m un ideal maximal tal que cada elemento de 1 + m es unidad de
R. Entonces, R es anillo local de maximal m.
Demostración.– La primera de las afirmaciones es evidente. En cuanto a la segunda, supong-
amos sea x 6∈ m. Entonces, el ideal suma m + (x) ⊇ m. Como m es maximao y x 6∈ m, en
anterior contenido es estricto y, por tanto, m + (x) = R. En particular, uno puede escribir
1 = λx + y con λ ∈ R e y ∈ m. Entonces, λx = 1 − y ∈ 1 + m, luego λx ∈ R∗ y, por ende,
x ∈ R∗ . 
4.2.2. Localización. Sean R un anillo y M un R−módulo. Un subconjunto S ⊆ R se
dice sistema multiplicativo si verifica:
• 1 ∈ S, 0 6∈ S, y
• ∀x, y ∈ S, xy ∈ S.
Ejemplo 4.2.7. i) Un anillo R es un dominio de integridad si y solamente si R \ {(0)}
es un sistema multiplicativo de R.
ii) Un ideal p ⊆
/ R es primo si y solamente si R \ p es un sistema multiplicativo.
iii) Un elemento f de un anillo R se denomina nilpotente si existe n ∈ N tal que f n = 0.
Dado un elemento no nilpotente f ∈ R de un anillo, el siguiente conjunto también es
un sistema mutiplicativo: Sf := {1, f, f 2 , f 3 , . . . , f n , . . .} = {f n : n ∈ N}. Nótese
que f es nilpotente si y solamente si 0 ∈ Sf

Dado un sistema multiplicativo S en R, podemos definir una relación de equivalencia sobre el


conjunto R × S del modo siguiente:
(x, s) ∼ (x0 , s0 ) ≡ ∃r ∈ S, s(s0 x − sx0 ) = 0.
A las clases de equivalencia definidas por el elemento (x, s) se las denota mediante x/s y al
conjunto cociente se le denota S −1 R.

Proposición 4.2.8 (Localización de anillos). Con las notaciones anteriores, el conjunto


S −1 R posee una estructura natural de anillo con las operaciones siguientes:
+ : S 1 R × S −1 R −→ S −1 R, · : S 1 R × S −1 R −→ S −1 R
(x/s, x0 /s0 ) 7−→ (s x + sx0 )/ss0 ,
0
(x/s, x0 /s0 ) 7−→ xx0 /ss0 .
Al anillo S −1 R se le denomina localización de R en S y se tiene un morfismo natural de anillos
dado mediante i : R −→ S −1 R, i(x) = x/1 ∈ S −1 R.
Demostración.– Es un mero ejercicio de comprobación. 

Ejemplo 4.2.9. • Si R es un dominio de integridad y S := R \ {0}, entonces S −1 R es


un cuerpo que se denomina cuerpo de fracciones de R y se suele denotar por qf (R).
• Además del elemental ejemplo del paso de Z a Q (cuerpo de fracciones de R) podemos
añadir el caso del dominio de integridad H(X) de las funciones holomorfas complejas
definidas en un abierto X ⊆ Cn . A su cuerpo de fracciones se le denota M(X) y se
le denomina cuerpo de funciones meromorfas definidas en X.
• Si p ∈ Spec(R) es un ideal primo y S := R \ p, a la localización se la denota mediante
Rp y se denomina localización de R en el primo p. Obsérvese, por ejemplo, que en el
caso R = Z y p = pZ = (p) se puede usar cualquiera de las dos notaciones sigientes
ZpZ o Z(p) , pero no se debe usar la notación Zp , que es otro tipo de localización.
• Si f ∈ R es un elemento que no es nilpotente en R, podemos considerar la localización
de R por el sistema multiplicativo Sf = {f n : n ∈ N}. Al anillo Sf−1 R se le denotará
por Rf . Por ejemplo, en el caso R = Z, Zp es la localización con denominadores en
el conjunto {pn : n ∈ N}.
188 4. UN POCO MÁS AVANZADAS

Observación 4.2.10. Si R es un dominio de integridad y S es un sistema multiplicativo de R,


podemos siempre considerar los elementos de S −1 R como elementos del cuerpo de fracciones
qf (R). En este caso, tendremos una cadena de inclusiones, cada uno de los cuales es subanillo
del siguiente:
R ⊆ S −1 R ⊆ qf (R).
Por ejemplo, los elementos de Zp son los números racionales cuyo denominador es una potencia
del primo p. Sin embargo, si R no es dominio de integridad alguno de esos contenidos puede
carecer de sentido. A modo de ejemplo, tomemos el anillo Z/6Z y consideremos los dos primos
que componen su espectro {(2), (3)}, con i := i + 6Z. En la localización (Z/6Z)(2) sólo hay dos
elementos. Compruébese.
Podemos dar una caracterización en forma de propiedad universal de la localización de anillos:
Proposición 4.2.11 (Caracterización mediante propiedad Universal). Sea f : R −→ R0 un
morfismo de anillos y S ⊆ R un sistema multiplicativamente cerrado de R. Entonces, si f (s) ∈
(R0 )∗ es una unidad, para cada s ∈ S, existe un único morfismo de anillos S −1 f : S −1 R −→ R0
tal que f = S −1 f ◦ g.
Además, la anterior propiedad universal caracteriza S −1 R salvo isomorfismo de anillos.
Demostración.– Omitimos la prueba dado que apenas si usaremos este enunciado. 
Dado un sistema multiplicativo S en un anillo R y M un R−módulo, podemos definir una
relación de equivalencia sobre el conjunto m × S del modo siguiente:
(m, s) ∼ (m0 , s0 ) ≡ ∃r ∈ S, s(s0 m − sm0 ) = 0.
A las clases de equivalencia definidas por el elemento (m, s) se las denota mediante m/s y al
conjunto cociente se le denota S −1 M .

Proposición 4.2.12 (Localización de Módulos). Con las notaciones anteriores, el conjunto


S −1 M posee una estructura natural de S −1 R−módulo con las operaciones siguientes:
+ : S 1 M × S −1 M −→ S −1 M, ·S −1 R : S 1 R × S −1 M −→ S −1 m
(m/s, m0 /s0 ) 7−→ (s m + sm0 )/ss0 ,
0
(x/s, m/s0 ) 7−→ xm/ss0 .
Al S −1 R−módulo S −1 M se le denomina localización de M en S.
Demostración.– Es un mero ejercicio de comprobación. 

Observación 4.2.13. Del mismo modo denotaremos por Mp a todo S −1 M , donde M es un


R−módulo y S = R \ p es sistema multiplicativo, donde p ∈ Spec(R).
Ejemplo 4.2.14. Sea F := Zn un Z−módulo libre de rango finito, Podemos mostrar las difer-
entes localizaciones:
• Tomando S := Z \ {0}, la localización S −1 F = Qn es el Q−espacio vectorial de
dimensión n. De hehco, todos los A−espacios vectoriales de dimensión finita son
localizaciones de la forma S −1 F , donde F es un módulo libre sobre Z.
n
• Tomando Sp := Z \ p, las localizaciones Sp−1 F = (Zp ) . Y se trata de un módulo libre
sobre un anillo local.
n
• Tomando Sf := {f n : n ∈ N}, las localizaciones Sf−1 F = (Zf ) . Y se trata de un
módulo libre sobre un anillo Zf .

4.3. Ideal asociado a una variedad: radical y radical de Jacobson


4.3.1. Ideal de un Objeto Geométrico.
Definición 58 (Ideal asociado a un subconjunto). Con las notaciones anteriores, sean X
un espacio topológico R uno de los anillos de funciones introducidas en el Capı́tulo anteriior.
Considerermos F ⊆ X, definimos IR (F ) como el ideal en R dado por:
IR (F ) := {f ∈ R : f (x) = 0, ∀x ∈ F }.
4.3. IDEAL ASOCIADO A UNA VARIEDAD: RADICAL Y RADICAL DE JACOBSON 189

Observación 4.3.1. Es obvio que es un ideal. Obviamente en cada caso hemos de especificar
el anillo sobre el que trabajamos. Los ideales respectivos son distintos, obviamente, aún cuando
estemos en el caso de subanillos como, por ejemplo, en el caso de la siguiente cadena de sub–
anillos:
R[X1 , . . . , Xn ] ⊆ C ω (X) ⊆ C ∞ (X) ⊆ C 0 (X),
tendremos ası́ la cadena de los “respectivos” ideales;
IR[X1 ,...,Xn ] (F ) ⊆ IC ω (X) (F ) ⊆ IC ∞ (X) (F ) ⊆ IC 0 (X) (F ),
que no coincidirán.
Usualmente se omiten los sub–ı́ndices (escribiremos I(F )) y se sobre–entiende el anillo por el
contexto.

Proposición 4.3.2. Con las anteriores notaciones, sean X el conjunto, R el anillo de fun-
ciones. Se verifican las propiedades siguientes:
i) Si F ⊆ G son dos subconjuntos de X, I(G) ⊆ I(F ).
ii) I(X)
S = 0, I(∅) T = R.
iii) I( i∈I Fi ) = i∈I I(Fi ).
iv) Además, la clausura en la topologı́a de Zariski de cualquier subconjunto viene dada
mediante:
Z
F = V (I(F )).
Demostración.–
S La dos primeras afirmaciones son evidentes. Para la tercera, es claro que si
f ∈ I( i∈I Fi ), se anula en todos los puntos deTesa unión. Aplicando (1) obtendremos que
f ∈ I(Fi ), para todo i ∈ I. De otro lado,
S si f ∈ i∈I I(Fi ), entonces, f se anula en todos los
Fi ’s y, por tanto, se anula en la unión i∈I Fi .
La propiedad (4), aún siendo sencilla, tiene algún interés en su prueba. Recordemos la topologı́a
de Zariski, descrita en la Observación 2.4.4 del Capı́tulo anterior. En particular, V (I(F )) es
cerrado en esa topologı́a y, claramente, F ⊆ V (I(F )). Por tanto, tenemos un primer contenido
Z Z
F ⊆ V (I(F )). De otro lado, por la propia definición de la topologı́a de Zariski, como F es
cerrado, debe existir un ideal a en R tal que:
Z
(4.3.1) F ⊆F = V (a) ⊆ V (I(F )).
Como F ⊆ V (a), para cada f ∈ a, f |F ≡ 0. Pero, entonces, para cada f ∈ a, tenemos que f ∈
I(F ) y habremos probado que a ⊆ I(F ). Finalmente, usando la primera de las afirmaciones de
Z
la Proposición 2.4.3 anterior, concluiremos V (I(F )) ⊆ V (a), por cuanto F = V (a) = V (I(F ))
y habremos terminado. 

Corollario 4.3.3. Con las notaciones anteriores, para cualquier cerrado Zariski F ⊆ X, se
tiene
F = V (I(F )).

Observación 4.3.4 (Nullstellensätze: ¿Diccionario Álgebra–Geometrı́a?). Los resulta-


dos anteriores nos permiten reescribir una relación entre los objetos geométricos y algunos de
los ideales del anillo de funciones considerado. Definimos
Z := {F ⊆ X : F es cerrado Zariski en X}.
I := {a ⊆ R : a es un ideal de R}.
Y las transformaciones
V : I −→ Z, I: Z −→ I
a 7−→ V (a), F 7−→ IR (F ).
Se verifica que para todo F ∈ Z se tiene:
V (IR (F )) = F,
con lo que V ◦ IR = Id |Z es la identidad y se concluye que IR es inyectiva y que V es
suprayectiva.
190 4. UN POCO MÁS AVANZADAS

A la caracterización de los ideales que están en la imagen de IR se los conoce como Teoremas
de los Ceros o Nullstellensätze. Ası́, D. Hilbert y L. Kronecker caracterizaron los ideales de
la imagen de IR en el caso R = K[X1 , . . . , Xn ], cuando K es un cuerpo algebraicamente cerrado.
Se conoce como Nullstellensatz de Hilbert. Caracterizaciones para el caso real o el caso analı́tico
se salen de las potencialidades de un curso como éste, aunque se pueden referenciar.
4.3.2. Radical y Radical de Jacobson. Recordemos que un elemento x de un anillo R
se denomina nilpotente si existe una potencia suya que se hace nula.

Proposición 4.3.5 (Definición de Nilradical). El conjunto √ 0 de todos los elementos nilpo-
tentes de un anillo R es un ideal de R y el anillo cociente R/ 0 no tiene elementos nilpotentes
no nulos. Diremos que un anillo es reducido si no posee elementos nilpotentes no nulos.
Demostración.– Basta con probar que se portan bien para la suma y para el producto con
elementos del anillo. Para ello, sean x, y ∈ R tales que xm = 0 e y n = 0, con n, m ∈ N y z ∈ R.
Entonces, Tendremos que
(zy)m = 0,
y
n+m
X
n+m
(x + y) = cn+m,k xk y n+m−k = 0,
i=0
n+m

donde cn+m,k es o bien el número combinatorio k o 0 dependiendo de la estructura de
grupo abeliano de R. 
Proposición 4.3.6. Sea R un anillo, entonces
√ \
0 := p.
p∈Spec(R)

Demostración.–
√ Dado que 0 ∈ p para cada p ∈ Spec(R), entonces todo elemento nilpotente
x ∈ 0 verifica que existe n ∈ N, tal que xn ∈ p, para cada p ∈ Spec(R). Para cada primo p,
sea np ∈ N el más pequeño exponente tal que xnp ∈ p. Entonces, xnp −1 x ∈ √p y, como p es primo
y xnp −1 6∈ p, concluiremos que x ∈ p. Habremos probado ası́ el contenido 0 ⊆ p∈Spec(R) p.
T
T
Para el otro contenido, supongamos f ∈ p∈Spec(R) p y supongamos que f no es nilpotente.
Consideremos el sistema multiplicativo Sf y la localización Rf . Entonces, Rf posee un elemento
maximal m y consideremos q := mc la contracción a R de m (recordar la Proposición 2.2.5 del
Capı́tulo anterior). Es decir, sea
q := {x ∈ R : x/1 ∈ m, en Rf }.
Como q es la contracción de un ideal primo, entonces es un ideal primo de R. Pero, además,
f 6∈ q. Porque si f ∈ q, entonces f /1 ∈ m y f /1 ∈ (Rf )∗ es una unidad (un inverso es 1/f ∈ Rf )
con lo que m contendrı́a una unidad de Rf y no serı́a ideal maximal. En consecuencia, tenemos
que f 6∈ q y q ∈ Spec(R), con lo que si√f no es nilpotente, no puede estar en la intersección
T T
p∈Spec(R) p. Es decir, hemos probado 0 ⊇ p∈Spec(R) p y el enunciado. 

Definición 59 (Radical de un ideal). Para un ideal a en un anillo R, denotaremos por a
(y lo denominaremos radical) al conjunto de los elementos f ∈ R tales que su clase f + a es
nilpotente en el anillo cociente R/a.

Proposición 4.3.7. Se tiene la siguiente igualdad para todo ideal a de un anilo R:



a := {x ∈ R : ∃n ∈ N, xn ∈ a}.
Demostración.– Es una mera reescritura de la Definición anterior, teniendo en cuenta la
operación definida en el cociente. 
Recordando la Observación 1.4.29 del anterior Capı́tulo, tenemos una identificación entre los
ideales primos de R/a y los ideales primos de R que contienen a a:

{p ∈ Spec(R) : p ⊇ a} −→ Spec(R/a)
p 7−→ p/a.
Esto conduce a la siguiente caracterización (obvia) del radical de un ideal:
4.3. IDEAL ASOCIADO A UNA VARIEDAD: RADICAL Y RADICAL DE JACOBSON 191

Corollario 4.3.8. Para cada ideal a de un anillo R se tiene:


√ \
a = {p ∈ Spec(R) : p ⊇ a}.

Definición 60. Los ideales tales que a = a se denominan ideales radicales del anillo R.

Ejemplo 4.3.9. • En el caso de los anillos R := Z, K[X], K[X], los ideales primos son
los ideales principales generados por elementos irreducibles (f ). En estos mismo casos,
n
consideremos f ∈ R un elemento p irreducible y consideremos el ideal (f ) generado por
n
una potencia de f . Entonces, (f ) = (f ).
n1 nr
• En dominios de ideales principales,
p si f := p1 · · · pr es la descomposición de f como
producto de irreducibles, se tiene (f ) = (p1 · · · pr ) es el ideal generado por el producto
de los factores primos de f elevados todos a potencia 1. En particular, un ideal (f )
es radical en un dominio de ideales principales si y solamente si es un producto de
factores irreducibles de multiplicidad 1.
• En general, en un dominio de factorización única R, los ideales principales son radi-
cales si y solamente si sus factores irreducibles tienen todos multiplicidad 1.
• Todos los ideales de la forma IR (F ) descritos anteriormente √ son ideales radicales.
Obsérvese, además, que si a es un ideal de R, entonces, a ⊆ I(V (a)).

Ejemplo 4.3.10 (Discriminante de un polinomio). Sea k un cuerpo de caracterı́stica cero


y f ∈ k[X] un polinomio. Definimos la derivada de f en la forma siguiente:
Si f = X n + an−1 X n−1 + · · · a1 X + a0 , definimos
f 0 (X) := nX n−1 + (n − 1)an−1 X n−2 + · · · + 2a2 X + a1 ∈ k[X].
Entonces, son equivalentes:
• El ideal (f ) es un ideal radical en k[X],
• La resultante Res(f, f 0 ) 6= 0,
• El siguiente determinante (llamado discriminante del polinomio f ) es no nula:
DiscX (f ) := det(f 0 (C(f )) 6= 0.
• El endomorfismo C(f ) es diagonalizable en alguna clausura algebraica K de k.
Dejaremos como ejercicio la demostración de las relaciones siguientes:
Proposición 4.3.11 (Propiedades del Radical). Sea a, b dos ideales de un anillo R. Se
tiene:
p√ √
i) √ a =√ a, √

ii) √ab = a ∩ b = a ∩ b,
iii) a = R siiqa = R,
√ √ √
iv) a + b = a + b,

v) Si p ∈ Spec(R), pn = p, para todo n > 0.

Definición 61 (Radical de Jacobson). Sea a un ideal de un anillo R. Llamaremos radical


de Jacobson de a a la intersección de todos los ideales maximales de R que contienen a a. Es
decir,

J
\
a := {m ∈ Spm(R) : m ⊇ a}.
Se denomina radical de Jacobson del anillo R al radical de Jacobson del ideal (0).
La siguiente es una de las propiedades al uso:
p
Proposición 4.3.12. Sea NR = J (0) el radical de Jacobson de un anillo R. Se tiene:
x ∈ NR ⇐⇒ 1 − xy ∈ R∗ , ∀y ∈ R.
192 4. UN POCO MÁS AVANZADAS

Demostración.– Recuérdese que R∗ son, precisamente, los elementos que no están en ningún
ideal maximal de R. Por tanto, si x está en todos los ideales maximales de R, entonces, también
está en todos los maximales de R cualquier elemento yx, para cada y ∈ R. Finalmente, 1 − xy
no puede estar en ningún maximal de R porque, en caso contrario, 1 estarı́a en ese maximal.
Luego hemos probado la implicación ⇒.
Para la otra implicación, supongamos que 1 − xy ∈ R∗ para todo y ∈ R y sea m un ideal
maximal de R. Supongamos que x 6∈ m. Entonces, m + (x) = R, y existen m ∈ m e y ∈ R tales
que 1 = m + xy. Pero esta última igualdad significarı́a que u = 1 − xy ∈ m y, al mismo tiempo,
por hipótesis, 1 − xy ∈ R∗ , llegando a contradicción con la existencia de un maximal m de R
tal que x 6∈ m. 

Definición 62 (Cociente de Ideales). Dados a, b dos ideales de un anillo R, su ideal cociente


está definido mediante:
(a : b) := {x ∈ R : xb ⊆ a}.
Al ideal cociente ((0) : b) se le denomina anulador del ideal b y se denota por Ann(b).
En particular si D son los divisores de un anillo R, tendremos
[
D= Ann((x)).
x6=0

No probarenmos las siguiente propiedades del cociente que son dejadas como ejercicio:
Proposición 4.3.13 (Propiedades del Cociente de Ideales). Sea a, b, c ideales de un anillo
R. Se tiene:
i) a ⊆ (a : b),
ii) (a : b)b ⊆ a,
iii) ((a : b) : c) = (a : bc) = ((a : c) : b),
i : b) = ∩i (ai : b),
iv) (∩i aP
v) (a : i bi ) = ∩i (a : ai ).

4.4. Funciones vs Objetos


4.4.1. El Lenguaje de las Categorı́as. El lenguaje de las categorı́as fue introducido a
mediados de de los años 40 por S. Eilenberg y S. MacLane (cf. [EiMc, 45]) como un intento
de desarrollar un lenguaje común a diversas ramas de la Matemática y sus interacciones, dis-
tinta de la Metamatemática impulsada por la Lógica. UNa de las derivaciones del lenguaje
de las Categorı́as fue el desarrollo del ÁLgebra Homológica. El Álgebra Homlógica fué intro-
ducida por H. Poincaré y D. Hilbert como un intento de interacción entre topologı́a y álgebra,
fundamentalmente, para disponer de grupos más “manejables” que los grupos de homotopı́a.
Posteriormente, el Álgebra Homológica evoluciona aprovechándose del lenguaje de las cate-
gorı́as, hasta convertirse en una parte propia de la Matemática. Esta integración de las dos
ideologı́as se produce en el clásico de H. Cartan y S. Eilenberg [CaEi, 56]. Un par de textos
clásicos, varias veces re–editados, que constituyen una Introducción a estos temas son [Mc, 75]
o [HiSt, 97].
Aquı́ hacemos un resumen acelerado del lenguaje, sin entrar en más detalles por falta de tiempo.

4.4.2. Categorı́as.
Definición 63 (Categorı́as). Una categorı́a es un par C := (Obj C , HomC ), donde:
• Obj C es una clase formada por conjuntos, cuyos elementos X ∈ Obj C se denominan
objetocs de la categorı́a C
• HomC es una aplicación que a cada dos objetos X, Y ∈ Obj C les asigna un conjunto
HomC (X, Y ) que se denomina morfismos de la categorı́a C entre los objetos X e Y .
Además, dados tres objetos X, Y, Z ∈ Obj C , existe una transformación:
◦ : HomC (X, Y ) × HomC (Y, Z) −→ HomC (X, Z)
(f, g) 7−→ g ◦ f,
y que verifica las siguientes propiedades:
4.4. FUNCIONES VS OBJETOS 193

i) Para cada objeto X ∈ Obj C existe un morfismo IdX ∈ HomC (X, X) tal que para
cada f ∈ HomC (X, Y ) y para cada g ∈ HomC (Z, Y ), se verifica:
f ◦ IdX = f, Idx ◦ g = g.
ii) Dados 4 objetos X, Y, Z, T ∈ Obj C y dados tres morfismos f ∈ HomC (X, Y ),
g ∈ HomC (Y, Z), h ∈ HomC (Z, T ), se tiene:
h ◦ (g ◦ f ) = (h ◦ g) ◦ f.

Ejemplo 4.4.1 (Ejemplos de Categorı́as). Los ejemplos usados en anteriormente sirven


para ilustrar la noción de categorı́as.
i) La Categorı́a de los Espacios Topológicos (T ): Los objetos Obj T son los espacios
topológicos, los morfismos HomT (X, Y ) := C 0 (X, Y ) son las funciones continuas entre
X e Y.
ii) La Categorı́a de los Espacios Vectoriales (EVK ) : Los objetos Obj son los espa-
cios vectoriales sobre un cuerpo K fijado, los morfismos HomEVK (X, Y ) := HomK (X, Y )
son las aplicaciones K−lineales entre X e Y .
iii) La Categorı́a de las Variedades Diferenciables (M): Los objetos Obj son
las variedades diferenciables ( C ∞ , por ejemplo) y los morfismos HomC ∞ (X, Y ) :=
C ∞ (X, Y ) son las funciones infinitamente diferenciables entre X e Y .
iv) La Categorı́a de los Grupos (G): Los objetos Obj son los grupos, los morfismos
HomG (X, Y ) := Hom(X, Y ) son los morfismos de grupo entre X e Y .
v) La Categorı́a de los Módulos sobre un anillo (MR ): Los objetos Obj MR son
los R−módulos (R fijado), los morfismos HomMR (X, Y ) := HomR (X, Y ) son los
morfismos de R−módulo entre X e Y .
vi) La Categorı́a de los Anillos (R): Los objetos Obj son los anillos conmutativos con
unidad, los morfismos Hom(X, Y ) := Hom(X, Y ) son los morfismos de anillo entre
X e Y.
vii) · · · los ejemplos son muchos.

El objetivo de la Teorı́a de categorı́as es detectar coincidencias entre diversas categorı́as teniendo


en cuenta solamente los comportamientos de objetos y morfismos. Comencemos, definiendo
algunos tipos elementales de morfismos.
Definición 64 (Tipos elementales de Morfismos). Dados dos objetos X, Y en una cate-
gorı́a y un morfismo f ∈ HomC (X, Y ), definiremos las condiciones para que f sea
• monomorfismo: Si existe g ∈ HomC (Y, X) tal que g ◦ f = IdX ,
• epimorfismo: Si existe g ∈ HomC (Y, X) tal que f ◦ g = IdY ,
• isomorfismo: Si existe g ∈ HomC (Y, X) tal que g ◦ f = IdX , f ◦ g = IdY .

Ejemplos de monomorfismos, epimorfismos e isomorfismos en las distintas categorı́s son cono-


cidos. Si acaso, recordar que, en el caso de espacios topológicos, los isomorfismos se llaman
homeomorfismos, mientras que en el caso de variedades diferenciables o analı́ticas, se habla de
difeomorfismo y, por ejemplo, en el caso de espacios métricos, se tratan las isometrı́as. Son el
mismo concepto aunque en distintas categorı́as.
4.4.3. Functores y Equivalencias Naturales. Para poder identificar dos categorı́as, el
Álgebra Homológica acude a la noción de functor y de equivalencia natural (introducida por S.
Eilenberg).
Definición 65 (Functor Covariante). Sea C y D dos categorı́as, con objetos Obj C y Obj D
y morfismos HomC (X, Y ), HomD (X 0 , Y 0 ). Un functor covariante F entre las categorı́as C y D
es una transformación con dos ingredientes:
• Una aplicación F : Obj C −→ Obj D , y
• para cada par de objetos X, Y ∈ Obj D una aplicación (que denotaremos con las misma
letra):
F : HomC (X, Y ) −→ HomD (F (X), F (Y )),
verificando las siguientes propiedades:
194 4. UN POCO MÁS AVANZADAS

i) Dados f ∈ HomC (X, Y ) y g ∈ HomC (Y, Z), se tiene:


F (g ◦ f ) := F (g) ◦ F (f ).
ii) Para cada objeto X ∈ Obj C , se tiene:
F (IdX ) = IdF (X) .
Definición 66 (Functor Contravariante). Sea C y D dos categorı́as, con objetos Obj C y
Obj D y morfismos HomC (X, Y ), HomD (X 0 , Y 0 ). Un functor covariante F entre las categorı́as
C y D es una transformación con dos ingredientes:
• Una aplicación F : Obj C −→ Obj D ,
• para cada par de objetos X, Y ∈ Obj D una aplicación (que denotaremos con las misma
letra):
F : HomC (X, Y ) −→ HomD (F (Y ), F (X)),
verificando las siguientes propiedades:
i) Dados f ∈ HomC (X, Y ) y g ∈ HomC (Y, Z), se tiene:
F (g ◦ f ) := F (f ) ◦ F (g).
ii) Para cada objeto X ∈ Obj C , se tiene:
F (IdX ) = IdF (X) .
Ejemplo 4.4.2 (Ejemplos de Functores). Los siguientes son ejemplos de Functores entre
distintas categorı́as, con diversos significados:
i) Consideremos las categorı́as T de espacios topológicos y R de anillos. Consideremos
una transformación C 0 del tipo siguiente:
• A cada espacio topológico X ∈ Obj T se le asocia el objeto C 0 (X) := HomT (X, R) :=
C 0 (X, R) de las funciones continuas de X en R.
• A cada par de espacios topológicos X, Y y a cada morfismo f ∈ C 0 (X, Y ) (es
decir, función contı́nua de X a Y , le asociamos el morfismo de anillos
C 0 (f ) : C 0 (Y ) −→ C 0 (X),
h 7−→ h ◦ f.
Claramente se trata de un functor contra–variante de la categorı́a de espacios topológicos
en la categorı́a de anillos.
ii) Consideremos un functor de la categorı́a EVK en sı́ misma, que denotaremos por ∗ y
lo llamaremos el paso al dual.
• A cada espacio vectorial X ∈ Obj EVK se le asocia el objeto X ∗ := HomK (X, K),
usualmente conocido como el espacio dual de X sobre K.
• A cada par de espacios vectoriales sobre K X, Y y a cada morfismo f ∈ HomK (X, Y )
(es decir, a cada aplicación K−lineal le asociamos la aplicación K−lineal
f∗ : Y ∗ −→ X ∗,
h 7−→ h ◦ f.
Claramente es un functor contra-variante de la categorı́a de espacio vectoriales en sı́
misma.
iii) Consideremos ahora la categorı́a M de las variedades diferenciables y el functor C ∞
de M en la categorı́a R de anillos. Se define análogamente al caso del functor C 0 .
Esto es
• A cada variedad diferenciable X ∈ Obj M se le asocia el objeto C ∞ (X) :=
HomM (X, R) := C ∞ (X, R) de las funciones infinitamente diferenciables de X
en R.
• A cada par de variedades diferenciables X, Y y a cada morfismo f ∈ C ∞ (X, Y ) (es
decir, función infinitamente diferebnciable de X a Y , le asociamos el morfismo
de anillos
C ∞ (f ) : C ∞ (Y ) −→ C ∞ (X),
h 7−→ h ◦ f.
Claramente se trata de otro functor contra–variante.
4.4. FUNCIONES VS OBJETOS 195

Ejemplo 4.4.3 (El Bi–functor HomR (−, −)). A partir del R−módulo HomR (M, N ) defini-
mos dos functores uno co–variante y otro contravariante, que discutiremos más adelante. A la
combinación de los dos se le denomina, usualmente, bi–functor HomR (−, −).
i) El functor co–variante HomR (M, −): Sea M un R−módulo fijo. Definimos el
functor HomR (M, −) de la categorı́a de R−módulos en sı́ misma del modo siguiente:
• A cada R−módulo N le asociamos el R−módulo HomR (M, N ).
• A cada morfismo f : N −→ N 0 entre dos R−módulos, le asociamos
HomR (M, f ) : HomR (M, N ) −→ HomR (M, N 0 ),
g 7−→ f ◦ g.
Se trata de un functor co–variante.
ii) El functor contra–variante HomR (−, N ): Fijemos ahora un R−módulo N . Defin-
imos el functor HomR (−, N ) de la categorı́a de R−módulos en sı́ misma del modo
siguiente:
• A cada R−módulo M le asociamos el R−módulo HomR (M, N ).
• A cada morfismo f : M −→ M 0 entre dos R−módulos, le asociamos
HomR (f, N ) : HomR (M 0 , N ) −→ HomR (M, N ),
h 7−→ h ◦ f.
Se trata de un functor contra–variante.

Definición 67 (Equivalencia Natural entre Functores Covariantes). Sea C y D dos


categorı́as, con objetos Obj C y Obj D y morfismos HomC (X, Y ), HomD (X 0 , Y 0 ). Dos functores
covariantes F y G entre las categorı́as C y D se dicen naturalemente equivalentes si para cada
objeto X ∈ Obj C , existe un isomorfismo ϕX : F (X) −→ G(X) tal que dados X, Y ∈ Obj C y
dado un morfismo cualquiera f ∈ HomC (X, Y ) se verifica:
ϕY ◦ F (f ) = G(f ) ◦ ϕX .

Gráficamente tendremos que el siguiente diagrama es conmutativo:


ϕ
F (X) −→X G(X)
F (f ) ↓ ↓ G(f )
F (Y ) −→
ϕY G(Y )
Definición 68 (Equivalencia Natural entre Functores Contravariantes). Se define de
manera análoga al caso covariante, teniendo en cuenta la condición de contravariantes.

Definición 69 (Equivalencia Natural entre Categorı́as). Dos categorı́as C y D se dicen


naturalmente equivalentes si existen functores (covariantes o contravariantes) F entre C y D y
G entre D y C tales que la composición G ◦ F es naturalmente equivalente a la identidad IdC y
F ◦ G es naturalemnte equivalente a la identidad IdD .
4.4.4. Variación de un primer tema clásico: El Teorema de Stone–Cech. Un
ejemplo clásico es el famoso Teorema de Stone-Cech y otros autores1, que puede consultarse en
[GiJe, 76] y se puede reescribir del modo siguiente:
Teorema 4.4.4 (Banach-Stone-Cech-Gelfand-Kolmogorov). Si X, Y son dos espacios topológicos
compactos de Hausdorff y f : X −→ Y es una función continua tal que C 0 (f ) es isomorfismo
de R−álgebras entre C 0 (X) y C 0 (Y ), entonces f es un homeomorfismo.
En realidad el resultado en más completo y afirma lo siguiente:
Corollario 4.4.5. Sea CT la categorı́a de los espacios topológios compactos. Entonces, existe
una equivalencia natural entre CT y la subcategorı́a de anillos determinada por las R−álgebras
de la forma C 0 (X), donde X es una espacio tpológico compacto.

1Véanse, por ejemplo, el trabajo reciente:


H.-L. Gau, J.-S. Jeang, N.-C. Wong, An algebraic approach to the Banach–Stone Theorem for separating linear
bijections. Tai. J. of Math. 6 (2002) 399–403.
196 4. UN POCO MÁS AVANZADAS

Dicho de otor modo, ambas categorı́as son equivalentes y lo mismo da estudiar los espacios
topológicos compactos o esta subclase de la categorı́a de anillos. Éstees el propósito de establecer
equivalencias naturales: establecer conexiones entre teorı́as matemáticas que permitan transferir
en ambos sentidos información, resultados y, por ende, conocimiento.
4.4.5. Variación de un segundo tema clásico: El Lema de Urysohn y el Teorema
de Extensión de Tietze.
Definición 70 (Espacio Topológico Normal). Un espacio topológico (X, T ) se dice normal si
verifica la siguiente propiedad para sus cerrados: Dados dos cerrados F, G ∈ T c , disjuntos,
existen dos abiertos A, B ∈ T tales que F ⊆ A, G ⊆ B y A ∩ B = ∅.

Ejemplo 4.4.6. Unos pocos ejemplos convencionales: espacios métricos, espacios compactos
de Hausdorff. Mientras que Cn es normal con la topologı́a usual y no lo es con la topologı́a de
Zariski.

Teorema 4.4.7 (Lema de Urysohn). Sea X un espacio topológico normal, dados F, G dos
cerrados en X, existe una función f ∈ C 0 (X) tal que f (X) ⊆ [0, 1] y se tiene:
f |F = 0, f |G = 1.

Este resultado es conocido como el primer resultado no trivial en Topologı́a. Se puede obvia-
mente probar que un espacio topológico es normal si y solamente si verifica la propiedad descrita
en el Lema de Urysohn. Una de sus consecuencias más famosas es el siguiente resultado:
Teorema 4.4.8 (Teorema de Extensión de Tietze–Urysohn). Sea F un cerrado en un espacio
topológico normal X. Entonces, para cada f ∈ C 0 (F ) existe una función continua ϕ ∈ C 0 (X)
tal que
ϕ |F = f.

Una interpretación casi inmediata del Teorema de Tietze (en nuestro contexto) es la siguiente.
Consideremos X un espacio topológico y sea F ⊆ X un cerrado. Tenemos un morfismo de
anillos dado por la restricción:
ρ : C 0 (X) −→ C 0 (F ),
ϕ 7−→ ϕ |F .
Claramente se trata de un morfismo de anillos y se tiene el siguiente enunciado equivalente del
Teorema de Tietze:

Teorema 4.4.9 (Teorema de Extensión de Tietze–Urysohn). Con las anteriores notaciones, si


X es un espacio topológico normal, entonces ρ es un epimorfismo de anillos, Ker(ρ) = I(F ) y
se tiene el siguiente isomorfismo de anillos:
C 0 (F ) ∼
= C 0 (X)/I(F ).
4.4.6. Variación de un tercer tema clásico: Extensión de funciones en Var-
iedades Diferenciables.
Definición 71 (Espacio topológico paracompacto). Un espacio topológico se denomina para-
compacto si cada cubrimiento abierto posee un subcubrimiento localmente finito. Es decir, si
dado un cubrimiento {Ui : i ∈ I} por abiertos de X, existe un subcubrimiento {Uj : j ∈ J},
J ⊆ I, tal que para x ∈ X, existe un entorno Vx de x en X tal que
] ({j ∈ J : Vx ∩ Uj 6= ∅}) < ∞.
Definición 72 (Partición de la Unidad). Sea X un espacio topológico, una partición de la
unidad es una familia de funciones continuas {ϕi : i ∈ I} ⊆ C 0 (X) verificando:
• Para cada x ∈ X, el cardinal de los i ∈ I tales que ϕi (x) 6= 0 es finito.
• Para cada x ∈ X, X
ϕi (x) = 1.
i∈I
4.5. CUESTIONES Y PROBLEMAS 197

Se dice que una partición de la unidad {ϕi : i ∈ I} ⊆ C 0 (X) está subordinada a un cubrimiento
abierto {Ui : i ∈ I} de X si supp(ϕi ) ⊆ Ui para cada i ∈ I 2.
Teorema 4.4.10. Si X es un espacio topológico paracompacto, entonces posee particiones de
la unidad y particiones de la unidad subordinadas a cubrimientos abiertos.
Las variedades diferenciables, cuando aparezcan en los ejemplos, se suponen siempre paracom-
pactas.
Teorema 4.4.11. Dada una variedad diferenciable (paracompacta) M y un cubrimiento abierto
de M , existe un subcubrimiento abierto localmente finito y una partición de la unidad {fi : i ∈
I} subordinada al subcubrimiento y tal que para cada i ∈ I, fi ∈ C ∞ (M ).
Observación 4.4.12. El Teorema 2.4.7 es consecuencia de la existencia de particiones de unidad
en variedades paracompactas.
Definición 73 (Funciones lisas en un subespacio). Sea F un cerrado en una variedad difer-
enciable M , una función continua f : F −→ R se dice que es C ∞ sobre F si para cada x ∈ F ,
existen un entorno abierto Ux de x en M y una función C ∞ , ϕx : Ux −→ R tal que
ϕx |Ux ∩F = f |F ∩Ux .
Se denota por C ∞ (F ) al anillo de las funciones lisas definidas sobre F .
Corollario 4.4.13. Con las anteriores notaciones, para cualquier cerrado F en X, la re-
stricción:
ρ : C ∞ (M ) −→ C ∞ (F )
ϕ 7−→ ϕ |F ,
es un epimorfismo de anillos. Más aún, el siguiente es un isomorfismo de anillos:
C ∞ (F ) ∼
= C ∞ (M )/I(F ).

4.5. Cuestiones y Problemas


Problema 163. Probar las afirmaciones descritas en el Ejemplo 4.2.14

Problema 164. Probar las equivalencias del Ejemplo 4.3.10.

Problema 165. Discutir las equivalencias del Ejemplo 4.3.10 en el caso de que la caracterı́stica
del cuerpo sea positiva.

Problema 166. Probar la equivalencia siguiente para un cuerpo k cualquiera y un endomor-


fismo M ∈ Mn (k) con polinomio mı́nimo m(X) ∈ k[X].
• El ideal generador por m en k[X] (conocido como el Anulador de la matriz M ) es un
ideal radical.
• El endomorfismo M es diagonalizable sobre alguna clausura algebraica K de k, es
decir, existen matrices P ∈ GL(n, K) y valores ζ1 , . . . , ζn ∈ K, tales que
 
ζ1 0 · · · 0
 0 ζ2 · · · 0 
P M P −1 =  . . .
 
 .. ..
. .. 
0 0 ··· ζn

Problema 167. Demostrar las afirmaciones expuestas en la Proposición 4.3.11.

2Recuérdese que el soporte supp(f ) de una función es la clausura del conjunto de puntos donde la
función no se anula.
198 4. UN POCO MÁS AVANZADAS

Problema 168 (La topologı́a de Zariski en Spec(R)). Comencemos con un aspecto nota-
cional: Sea R un anillo, p ∈ Spec(R) y f ∈ R. Denotemos mediante f (p) la clase f + p ∈ R/p.
Nótese que es una notación, aunque no debe entenderse f funcionalmente, pero nos permite
definir los siguientes conjuntos. dado a un ideal de R, definamos
V (a) := {p ∈ Spec(R) : f (p) = 0 ∈ R/p}.
Del mismo modo, dado F ⊆ Spec(R) podemos definir
I(F ) := {f ∈ R : f (p) = 0, ∀p ∈ F }.
Probar las afirmaciones siguientes:
i) V (a) = {pT ∈ Spec(R) : p ⊇ a}.
ii) I(F ) := {p ∈ Spec(R) : p ⊇ (F )}, donde (F ) es el ideal geberado por F .
iii) Existe una única topologı́a en Spec(R) cuyos cerrados son los subconjuntos de la forma
V (a) (llamada topologı́ de Zariski en el espectro Spec(R)).
iv) Un subconjunto F ⊆ Spec(R) √ es cerrado si y solamente si V (I(F )) = F .
v) Para cada ideal a de R, a = I(V (a)).
vi) Existe una biyección entre los ideales radicales de R y los cerrados de Spec(R) para
la topologı́a de Zariski.
vii) Dado un morfismo de anillos ϕ : R −→ T , la aplicación
Spec(ϕ) : Spec(T ) −→ Spec(T )
p 7−→ pc := ϕ−1 (p),
es una aplicación continua para las respectivas topologı́as de Zariski. Concluir que
Spec define un functor contravariante de la catefgorı́a de anillos en la actegorı́a de
espacios topológicos.

Problema 169 (La topologı́a de Zariski en el espectro maximal Spm(R)). Analizar


cuáles de las anteriores propiedades permanecen si cambiamos Spec(R) por Spm(R).

Problema 170 (Stone–Cech). Tratar de establecer, en el caso de que X sea un espacio


topológico compacto, cuál es la relación existente entre X y el espectro maximal Spm(C 0 (X))
con la toplogı́a de zariski. ¿Es un homemorfismo?.

Problema 171. Demostrar las afirmaciones expuestas en la Proposición 4.3.13.

Problema 172. Constuir functores entre la categorı́a de espacios topológicos triangulables T T


y la categorı́a de grupos a través de grupo de homotopı́a π1 (X).
Problema 173. Busca la canción de Peter Gabriel citada al comienzo del Capı́tulo. Completa
su letra y haz una interpretación libre que te parezca más sincera.
Part 2

La elegancia del pensamiento de E.


Noether
CAPı́TULO 5

Una Prueba Elemental de Nullstellensatz de Hilbert

El objetivo de estas páginas es dar una demostración elemental del Nullstellensatz de Hilbert.
A partir de él, obtendremos un diccionario álgebra-geometrı́a con el que podemos trabajar.

5.1. Una demostración elemental del Nullstellensatz de Hilbert: Parte I


Los contenidos de esta sección están inspirados en el trabajo de E. Arrondo [Ar, 06]. Comen-
zamos con la siguiente observación:
Lema 5.1.1. Sea R un dominio de integridad y sea g ∈ R[X] un polinomio mónico univariado
en R[X] (i.e. un polinomio cuyo coeficiente director es una unidad en el anillo R). Entonces,
la R−álgebra cociente:
Ag := R[X]/(g),
es un R−módulo libre finitamente generado. Una base como R−módulo libre (la base monomial)
viene dada por:
2 d−1
β := {1, X, X , . . . , X },
k
donde d := degX (g) es el grado de g con respecto a la variable X y X es la clase de restos
X k + (g).
Demostración. Es un sencillo ejercicio análogo al caso de polinomios. La única obser-
vación significativa es que al ser g mónico tenemos garantizada la división euclı́dea por g. Es
decir, para todo f ∈ R[X] existen q, r ∈ R[X] tales que:
• f = qg + r,
• deg(r) ≤ deg(g) − 1.
Y, además, por ser R dominio de integridad, el resto r es único para cada f . Estas dos ideas
bastan para concluir la afirmación. 
Lema 5.1.2. Sea R un dominio de integridad, g ∈ R[X] un polinomio mónico y sea f ∈
R[X] un polinomio cualquiera. Consideremos la R−álgebra cociente Ag del Lema anterior y el
endomorfismo:

η f : Ag −→ Ag
h 7−→ f h,
donde h y f h son, respectivamente, las clases h + (g) y f h + (g). Entonces,
i) La matriz de ηf en la base monomial β descrita en el Lema anterior es f (C(g)), donde
C(g) es la matriz compañera de g, es decir,
−u−1 a0
 
0 0 0 ···
1 0 0 · · · −u−1 a1 
−u−1 a2 
 
0 1 0 · · ·
C(g) = 0 0 1 · · · −u−1 a3  ∈ Md (R),
 
 
 .. .. . . .. .
.. 
. . . . 
0 0 0 ··· −u−1 ad−1
donde g = uX d + an−1 X d−1 + · · · + a1 X + a0 , siendo u ∈ R∗ unidad en R.
ii) El determinante ResX (f, g) := det(f (C(g))) ∈ R está en el ideal generado por (f, g)
en R[X] (y se denomina la resultante de f y g con especto a la variable X). Es decir,
existen a, b ∈ R[X] tales que:
ResX (f, g) = af + bg ∈ R[X].
201
202 5. UNA PRUEBA ELEMENTAL DE NULLSTELLENSATZ DE HILBERT

iii) El endomorfismo ηf es un isomorfismo de R−módulos libres si y solamente si ResX (f, g) ∈


R∗ es una unidad de R.
Demostración. • Para la afirmación (2), utilizaremos el Teorema de Hamilton-
Cayley para R−módulos libres finitamente generados. Denotemos mediante χf (T ) ∈
R[T ] el polinomio caracterı́stico de ηf con respecto a la base β. Por el Teorema
de Hamilton-Cayley, el endomorfismo χf (ηf ) = 0 como endomorfismo de Ag . En
particular, χf (ηf )(1) = 0 ∈ Ag . Ahora, supongamos
χg (T ) := T d + bd−1 T d−1 + · · · + b1 T + b0 ∈ R[T ],
con b0 := det(f (C(g))) := det(f (C(g))) + (g) ∈ R ⊆ Ag es la clase residual del
elemento det(f (C(g))) módulo el ideal (g) generado por g en R[X]. Entonces, se
tiene:
χf (ηf )(1) = ηfd (1) + bd−1 ηfd−1 + · · · + b1 ηf (1) + b0 1 = 0,
o, lo que es lo mismo,
d d−1
χf (ηf )(1) = f + bd−1 f + · · · + b1 f + b0 1 = 0.
Dicho de otra manera, sea hi ∈ R[X] tal que hi := hi + (g) = bi ∈ Ag . Tenemos
probado, sacando f factor común, que se verifica:
d−1
!
d−1 X i−1
det(f (C(g))) + f f + hi f = 0, en Ag .
i=1
En otras palabras,
d−1
!
X
det(f (C(g))) + f f d−1 + hi f i−1 = 0, en Ag .
i=1
 Pd−1 
Dicho de otra manera, definiendo a := − f d−1 + i=1 hi f i−1 ∈ R[X], tenemos que
det(f (C(g))) − af ∈ (g) en R[X].
Luego existe b ∈ R[X], tal que
det(f (C(g))) = af + bg ∈ (f, g) ⊆ R[X].

Lema 5.1.3 (cf. [Ar, 06]). Sea a un ideal propio en K[X1 , . . . , Xn ], donde K es un cuerpo y
sea K la clausura algebraica de K. Supongamos que n = 1 o n > 1 y se verifica:
i) Existe un polinomio g ∈ a que es mónico con respecto a la variable Xn ,
ii) El ideal contracción b := ac = a ∩ K[X1 , . . . , Xn−1 ] es propio y existe
a := (a1 , . . . , an−1 ) ∈ Kn−1 ,
tal que h(a) = 0 para todo h ∈ b.
Entonces, existe a ∈ Kn tal que f (a) = 0 para todo f ∈ a. Es decir, VKn (a) 6= ∅.
Demostración. Para el caso n = 1, es obvio: Si a es un ideal propio en K[X], entonces
es un ideal principal a = (f ) y f no es cero ni unidad en K[X1 ]. Por tanto, f posee, al menos,
una raı́z α ∈ K y, por tanto, VK (a) 6= ∅.
Para el caso n = 2, basta con observar que la propiedad ii) se verifica dado que b es un ideal
propio de K[X1 ] por ser a propio. El resto del argumento es igual al caso general que sigue a
continuación:
Para el caso n > 1, consideremos el ideal b := ac = a ∩ K[X1 , . . . , Xn−1 ]. Como a es un
ideal propio en K[X1 , . . . , Xn ], tenemos que 1 6∈ a, por tanto 1 6∈ b y b es un ideal propio de
K[X1 , . . . , Xn−1 ] o b = (0). En ambos casos, y asumiendo la hipótesis ii), existe
a := (a1 , . . . , an−1 ) ∈ Kn−1 ,
tal que h(a) = 0 para todo h ∈ b. Consideremos ahora el siguiente conjunto:
c := {f (a1 , . . . , an−1 , Xn ) ∈ K[X] : f ∈ a}.
5.1. UNA DEMOSTRACIÓN ELEMENTAL DEL NULLSTELLENSATZ DE HILBERT: PARTE I 203

Se trata, claramente, de un ideal en el anillo de polinomios univariados K[Xn ]. Veamos que


c ⊆/ K[Xn ], es decir, está estrictamente contenido en K[Xn ]. Razonemos por reducción al
absurdo y supongamos que 1 ∈ c. Entonces, existe f ∈ a tal que:
1 := f (a1 , . . . , an−1 , Xn ).
De otro lado, sea g ∈ a el polinomio mónico que existe en a y que, por ser a propio, es no unidad.
Consideremos ahora el polinomio h := ResXn (f, g) := det(f (C(g))) ∈ K[X1 , . . . , Xn−1 ]. Con-
sideremos el anillo R := K[X1 , . . . , Xn−1 ] y, por el Lema precedente, tenemos que h está en el
ideal generado por f y g en R[Xn ] = K[X1 , . . . , Xn ]. Es decir,
h := ResXn (f, g) ∈ (f, g) ⊆ a.
Como h ∈ K[X1 , . . . , Xn−1 ], concluiremos que h ∈ b = ac . De otro lado, obsérvese que h
es el determinante de la matriz obtenida reemplazando Xn en f por C(g). Es decir, es el
determinante de la matriz dada mediante
f (X1 , . . . , Xn−1 , C(g)(X1 , . . . , Xn−1 )).
Más especı́ficamente, tenemos
 
0 0 0 ··· −a0 (X1 , . . . , Xn−1 )
1 0
 0 ··· −a1 (X1 , . . . , Xn−1 ) 

0 1 0 ··· −a2 (X1 , . . . , Xn−1 ) 
C(g)(X1 , . . . , Xn−1 ) = 0 0  ∈ Md (R),
 
 1 ··· −a3 (X1 , . . . , Xn−1 ) 
 .. .. .. .. .. 
. . . . . 
0 0 0 ··· −ad−1 (X1 , . . . , Xn−1 )
donde
g = Xnd + an−1 (X1 , . . . , Xn−1 )Xnd−1 + · · · + a1 (X1 , . . . , Xn−1 )Xn + a0 (X1 , . . . , Xn−1 ).
Y si
f := bt (X1 , . . . , Xn−1 )Xnt + · · · + b0 (X1 , . . . , Xn−1 ),
entonces
t
X
f (X1 , . . . , Xn−1 , C(g)(X1 , . . . , Xn−1 )) := bi (X1 , . . . , Xn−1 )C(g)(X1 , . . . , Xn−1 )i ∈ Md (K[X1 , . . . , Xn−1 ]).
i=0
En particular, observemos que la matriz
t
X
f (a1 , . . . , an−1 , C(g)(a1 , . . . , an−1 )) := bi (a1 , . . . , an−1 )C(g)(a1 , . . . , an−1 )i ∈ Md (K),
i=0

es la matriz obtenida especializando las variables de f (X1 , . . . , Xn−1 , C(g)(X1 , . . . , Xn−1 )) en


las coordenadas de a. Tomando determinantes, tendremos que
ResXn (f, g)(a1 , . . . , an−1 ) := det(f (a1 , . . . , an−1 , C(g)(a1 , . . . , an−1 ))).
Ahora bien f (a1 , . . . , an−1 , Xn ) = 1, con lo que
bi (a1 , . . . , an−1 ) = 0, 1 ≤ i ≤ t,
y
b0 (a1 , . . . , an−1 ) = 1.
Por tanto,
Xt
ResXn (f, g)(a1 , . . . , an−1 ) = det( bi (a1 , . . . , an−1 )C(g)(a1 , . . . , an−1 )i ) = det(Idd ) = 1.
i=0

Pero como ResXn (f, g) ∈ b, tendremos que ResXn (f, g)(a1 , . . . , an−1 ) = 0 con lo que habremos
llegado a contradicción.
En particular, tendremos que c ⊆ / K[Xn ] y existirá z ∈ K tal que h(z) = 0 para todo h ∈ c.
Pero, recordando la definición de c, tendremos que
f (a1 , . . . , an−1 , z) = 0, ∀f ∈ a.
Por tanto, VKn (a) 6= ∅ y haremos concluido la prueba del Lema. 
204 5. UNA PRUEBA ELEMENTAL DE NULLSTELLENSATZ DE HILBERT

5.2. Un cambio de coordenadas útil


Usaremos la idea de Noether para poner nuestras variables en condición de extensión entera
de anillos. Como antes, sea K un cuerpo y sea K la clausura algebraica de K. Consideremos
(t1 , . . . , tn−1 , 1) ∈ K n . Consideremos el siguiente cambio de variables:


 Y1 = X1 − t1 Xn ,
Y2 = X2 − t2 Xn ,




(5.2.1) ..
 .
Y = Xn−1 − tn−1 Xn ,

 n−1



Yn = Xn .
Consideremos el isomorfismo de R−álgebras dado por este cambio de coordenadas:
ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ]
(5.2.2)
f 7−→ f (Y1 + t1 Yn , . . . , Yn−1 + tn−1 Yn , Yn ).
Lema 5.2.1. Se verifican las siguientes propiedades:
i) Si a ⊆ K[X1 , . . . , Xn ] es un ideal propio, entonces ϕ(a) es un ideal propio. Y
recı́procamente.
ii) Consideremos la matriz triangular P ∈ Mn (K) dada mediante:
   
Y1 X1
 ..   .. 
 .  = P  . ,
Yn Xn
es decir, la matriz
 
1 0 ··· 0 −t1
0 1
 ··· 0 −t2 

P :=  ... .. ..
.
 
 . . 
0 0 ··· 1 −tn−1 
0 0 ··· 0 1
La matriz inversa de la matriz P es dada mediante:
 
1 0 ··· 0 t1
0
 1 ··· 0 t2 
P −1 :=  ... .. ..  .

 . . 

0 0 · · · 1 tn−1 
0 0 ··· 0 1
iii) Consideramos el isomorfismo de espacio vectoriales dado por P :
P : Kn −→ 
n
 K  
x1 y1 x1
 ..   ..   . 
 .  7−→  .  := P  ..  .
xn yn xn
Entonces, para cada polinomio f ∈ K[X1 , . . . , Xn ], ϕ(f ) := f ◦ P −1 (Y1 , . . . , Yn ). En
particular, para cada ideal a de K[X1 , . . . , Xn ],
V ((ϕ(a)) = P (V (a)).
En particular, V (a) 6= ∅ si y solamente si V (ϕ(a)) 6= 0.
Demostración. Son todos ejercicios elementales.

Observación 5.2.2 (Construcción a partir de las componentes homogéneas). Consid-
eremos el anillo K[X1 , . . . , Xn ] y consideremos un polinomio cualquiera f ∈ K[X1 , . . . , Xn ].
Podemos descomponer f es sus componentes homogéas de grado dado. Es decir, podemos
escribir:
f := fd (X1 , . . . , Xn ) + · · · + f0 (X1 , . . . , Xn ),
5.3. TESTS DE NULIDAD PARA POLINOMIOS. 205

donde fi ∈ K[X1 , . . . , Xn ] es un polinomio homogéneo de grado d, es decir,


X
fi (X1 , . . . , Xn ) := aµ(i) X1µ1 · · · Xnµn ,
|µ|=d

(i)
donde µ = (µ1 , . . . , µn ) ∈ Nn , |µ| = µ1 + · · · + µn ∈ N, aµ ∈ K. Además, esa descomposición
es única. Supondremos que fd es un polinomio homogéneo.

Sea ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ] el isomorfismo de K−álgebras descrito en la Sección


precedente. Entonces, ϕ respeta las componente homogéneas de los polinomios y tendremos
que si g = ϕ(f ) admite una descomposición en componentes homogéneas del tipo:
g := gd (X1 , . . . , Xn ) + · · · + g0 (X1 , . . . , Xn ),
donde gi = ϕ(fi ). En particular, tendremos la siguiente igualdad:
X
gi (Y1 , . . . , Yn ) := a(i)
µ (Y1 + t1 Yn )
µ1
· · · (Yn−1 + tn−1 Yn )µn−1 Ynµn .
|µ|=d

Lema 5.2.3. Sean f y g como en la Observación precedente, entonces, existe un polinomio


h ∈ K[Y1 , . . . , Yn ] tal que
g = fd (t1 , . . . , tn−1 , 1)Ynd + h,
y el grado de h con respecto a la variable Yn es menor estricto que d.
Demostración. Obvio por mera reescrittura. 

5.3. Tests de Nulidad para Polinomios.


Si bien antes hemos dicho que los esquemas de evaluación son una estructura de datos muy
adecuada para tratar y manipular polinomios multivariados, hay una dificultad esencial para
que sea tan precisa como la codificación densa o rala de polinomios. No es fácil decidir si dos
códigos de dos esquemas de evaluación evalúan el mismo polinomio. Para resolverlo, tenemos
dos opciones básicas :
i) Interpolar obteniendo todos los coeficientes y comparando a posteri-
ori. Esta no es una excelente idea, Por ejemplo, dadas dos formas de Cayley–Chow
de dos variedades cero–dimensionales, interpolar para decidir si definen la misma var-
iedad supone un esfuerzo considerablemente caro que nos lleva, usualmente, a una
2
complejidad del orden dn .
ii) Desarrollar Tests de Nulidad para Esquemas de evaluación. Se trata de
algoritmos que evalúan los códigos dados en un número finito (y “pequeño”) de puntos.
Con los valores de esas “pocas” evaluaciones, tratamos de decidir si ambos esquemas
de evaluación evalúan la misma función.
En esta Sección nos ocuparemos de estos Tests de Nulidad que pertenecen a tres tipos funda-
mentalmente :
i) Los Tests de Zippel–Schwartz. Se trata de seleccionar un conjunto fijo y, para cada
polinomio, hay muchos puntos en los que no se anula. Se trata de un Test Probabilista
que depende del polinomio y el esquema particular que tratamos. Fueron introducidos
en los trabajos de J.T. Schwartz1 y R. Zippel2.
ii) Los Cuestores o Correct Test Sequences. Es un método alternativo al método de
Zippel–Schwarzt. En ocasiones genera gran confusión entre los especialistas que no
entienden la diferencia. El método de los cuestores es un método que no depende del
polinomio particular que se discute sino de una clase de polinomios (y para ser más
precisos de una familia uniracional). Por ejemplo, depende la clase de complejidad y
es válido para toda ella. Fue introducido en el trabajo de J. Heintz y C.P. Schnorr

1J.T. Schwartz, Fast Probabilistic Algorithms for Verification of Polynomial Identities. J. of the

ACM 27 (1980), 701–717.


2R. Zippel, Interpolating Polynomials from their Values. J. Symbol. Comput. 9 (1990), 375–403.
206 5. UNA PRUEBA ELEMENTAL DE NULLSTELLENSATZ DE HILBERT

3
y refinado en el trabajo [KrPa, 96]. La versión que aquı́ se incluye es la versión
refinada de [KrPa, 96].
iii) Witness Theorem. La existencia de un sólo punto donde un polinomio no se an-
ula aparece ya en el trabajo de L. Kronecker y se conoce como “Esquema de Kro-
necker”. En el caso de polinomios con coeficientes en Z el resultado aparece recogido,
y atribuido a Kronecker, en el trabajo de J. Heintz y C.P. Schnorr de 1982, citado al
pie. Posteriormente, S. Smale4 redescubre el esquema de Kronecker para polinomios
con coeficientes en un cuerpo de números y lo denomina “Witness Theorem” (véase
también [BCSS, 98]. Sin embargo, las estimaciones de Smale y sus colaboradores
eran muy groseras. Las estimaciones se mejoran en el trabajo [CHMP, 01].
Haremos la demostración del Test de Schwartz-Zippel y dejaremos los otros resultados para
cuando tengamos una mejor fundamentación matemática.

5.3.1. El Test de Schwartz–Zippel. La clave del Test de Schwartz–Zippel es el siguiente


enunciado :
Lema 5.3.1. Sea f ∈ K[X1 , . . . , Xn ] un polinomio no nulo. Definamos recursivamente los
siguientes polinomios :
Q1 := f ∈ k[X1 , . . . , Xn ], d1 := degX1 (Q1 )
Sea Q2 ∈ K[X2 , . . . , Xn ] el coeficiente de X1d1 en Q1 . Para i ≤ 2 definamos recursivamente :
di := degXi Qi , Qi+1 ∈ K[Xi+1 , . . . , Xn ]
el coeficiente deXidiin Qi . Para 1 ≤ i ≤ n sea Ii un subconjunto finito de K.
Entonces, el número de ceros de F in I1 × · · · × In es a lo sumo
 
d1 dn
](I1 × · · · × In ) + ··· +
](I1 ) ](In )
Demostración. La prueba se sigue por inducción en n. En el caso n = 1 es obvio que un
polinomio univariado de grado d1 con coeficientes en un cuerpo no posee más de d1 ceros en el
cuerpo. La razón última es que K[X] es un dominio de factorización única.
Consideremos ahora el caso n > 1. Consideremos el polinomio Q2 ∈ K[X2 , . . . , Xn ] que es
el coeficiente director de f con respecto a la variable X1 . Por construcción, la secuencia de
polinomios Q2 , . . . , Qn y de grados d2 , . . . , dn es la misma comenzando por Q2 o comenzando
por f . Por tanto, podemos aplicar Qn la hipótesis inductiva a Q2 y tenemos que el número de
elementos de x = (x2 , . . . , xn ) ∈ i=2 Ii en los que Q2 no se anula es de cardinal mayor que:
n n n
! n n
!
Y Y X di Y X di
](Ii ) − ](Ii ) = ](Ii ) 1 − .
i=2 i=2 i=2
](Ii ) i=2 i=2
](Ii )
Qn
Para cada uno de los x = (x2 , . . . , xn ) ∈ i=2 Ii en los que Q2 (x) 6= 0, el polinomio f toma la
forma:
f (X1 , x2 , . . . , xn ) = Q2 (x)Y1d1 + h(X1 ),
donde h es un polinomio de grado a lo sumo d1 − 1. En consecuencia, este polinomio univariado
no se puede anular en, al menos, ](I1 ) − d1 elementos de I1 . Y esto para cada x con esas
condiciones.
Qn Por tanto, f no se anula en, al menos, el siguiente número de elementos de
i=1 Ii :
n n
!
Y X di
P := (](I1 ) − d1 ) ](Ii ) 1 − .
i=2 i=2
](Ii )
Desarrollando este producto obtenemos

3J. Heintz, C.P. Schnorr, Testing Polynomials wich are easy to compute. In Logic and Algorithmic

(an International Symposium in honour of Ernst Specker), Monographie n. 30 de l’Enseignement


Mathématique (1982), 237–254.
4L. Blum, F. Cucker, M. Shub, S. Smale,Algebraic settings for the problem P6=NP?. In The

mathematics of numerical analysis (Park City, UT, 1995), Amer. Math. Soc., Providence, 1996,
125–144.
5.3. TESTS DE NULIDAD PARA POLINOMIOS. 207

n n
! n n
!
Y X di Y X di
P := ](I1 ) ](Ii ) 1 − − d1 ](Ii ) 1 − .
i=2 i=2
](Ii ) i=2 i=2
](Ii )

Luego
n n n
! n n n
!
Y Y X di d1 Y d1 Y X di
P := ](Ii ) − ](Ii ) − ](Ii ) + ](Ii ) .
i=1 i=1 i=2
](Ii ) ](I1 ) i=1 ](I1 ) i=1 i=2
](Ii )

Por tanto,

n n
! n n n
!
Y X di d1 Y Y X di
P ≥ ](Ii ) 1 − − ](Ii ) = ](Ii ) 1 − ,
i=1 i=2
](Ii ) ](I1 ) i=1 i=1 i=1
](Ii )

y se sigue el enunciado previsto. 

Tenemos la siguiente aplicación inmediata:

Corollario 5.3.2. Con las notaciones previas, sea I un subconjunto finito de K and F ∈
K[X1 , . . . , Xn ] un polinomio de grado d. La probabilidad de que una elección aletaoria de un
punto x ∈ I n sea un cero de F es, a lo sumo :
d
](I)
En particular, si ](I) ≥ 2d + 1,la probabilidad de que una elección aletoria en I n de un valor
no nulo de F es, al menos, 1/2.

Demostración. Basta con usar el Lema precedente con I = I1 = · · · = In . 

Esto genera el siguiente algoritmo probablistia polinomial (RP o MonteCarlo) para detectar
polinomios no nulos.

Input : El código de un esquema de evaluación bien paralelizable G en n variables, que evalúa


un polinomio de grado d.
guess indeterministically

x = (x1 , . . . , xn ) ∈ {−d, . . . , 0, 1, . . . , d}

Eval G en x.
if G(x) 6= 0, Output : “Es un polinomio no nulo”,
else Output : “Probablemente sea nulo”,
fi
end

Para aumentar la “certeza” de que el polinomio probablemente sea el polinomio nulo, basta
con repetir el proceso varias veces, observando que tras k reiteraciones, si nos hubiera salido
siempre nulo, el polinomio serı́a nulo con probabilidad al menos
1
1− .
2k
Corollario 5.3.3. Con las anteriores notaciones, si existe un subconjunto I de K de, al
menos, 2d elementos, entonces para todo polinomio f ∈ K[X1 , . . . , Xn ] de grado a lo sumo d
existe (t1 , . . . , tn ) ∈ K n tal que f (t1 , . . . , tn ) 6= 0.

Demostración. Consecuencia inmediata del resultado precedente. 


208 5. UNA PRUEBA ELEMENTAL DE NULLSTELLENSATZ DE HILBERT

5.3.2. Cuestores.
Definición 74. Dado un subconjunto (no necesariamente finito) F ⊂ K[X1 , . . . , Xn ] (que
contiene al polinomio nulo) Diremos que un conjunto finito Q ⊂ Kn es un questor (o una
“Correct Test Sequence”) para F si y sólo si para todo F ∈ F se tiene :
P |Q = 0 =⇒ P ≡ 0 .
El resultado depende fuertemente de la desigualdad de Bézoutque analizaremos posteriormente.
El primer resultado significativo es el siguiente :
Lema 5.3.4 ([KrPa, 96]). Sea O(L, `, n) el conjunto de todos los polinomios en K[X1 , . . . , Xn ]
que se pueden evaluar mediante un esquema de evaluación de talla L y profundidad `. Sea
W (L, `, n) la clausura Zariski de ese conjunto. Entonces, se verifica

deg W (L, `, n) ≤ (2`+1 − 2)2L(L−(n+1)) .


Teorema 5.3.5 (Existencia de Conjuntos Cuestores). Sea K un cuerpo y sean n, `, L ∈ N,
L ≥ n + 1. Sean
u := (2`+1 − 2) (2` + 1)2 and t := 6 (`L)2 .
Supongamos que la caracterı́stica de K es mayor que u o que la caracterı́stica de K es cero.
t
Entonces, el conjunto {1, . . . , u}n ⊂ K n contiene al menos unt (1 − u− 6 ) conjuntos cuestores
de longitud t para W (L, `, n). En particular, contiene al menos uno.
Observe el lector que un elección aleatoria de un subconjunto cualquiera de t elementos del
conjunto {1, . . . , u}n ⊂ K n es un conjunto cuestor para W (L, `, n) con probabilidad mayor que
t
(1 − u− 6 ) > 1/2.
Por tanto, el algoritmo del Tests de Zippel–Schwartz se transforma en un algoritmo RP medi-
ante el siguiente esquema :

Input : El código de un esquema de evaluación bien paralelizable G en n variables, que evalúa


un polinomio de grado d. Supongamos que G es de talla L y profundidad `.
Compute u y t (como en el Teorema anterior)
guess indeterministically Q ⊆ {1, . . . , u}n de cardinal t.
Eval G en x para cada x ∈ Q.
if G(x) 6= 0, para algún x Output : “Es un polinomio no nulo”,
else Output : “Probablemente sea nulo”,
fi
end

En este caso, la probabilidad de no cometer errores es, al menos


t
(1 − u− 6 ).
5.3.3. Witness Theorem. Comencemos fijando la terminologı́a con la siguiente Definición :
Definición 75. Un testigo (Witness) para un polinomio F ∈ K[X1 , . . . , Xn ] es un punto
ω ∈ K n tal que si F (ω) = 0 implica P = 0.
En otras palabras, un testigo es un punto ω ∈ K n fuera del conjunto de puntos K−racionales
de la hipersuprficie V (F ) (si hubiera alguno). La manera de obtenerlo de modo explı́cito es el
siguiente Teorema
Teorema 5.3.6 (Witness Theorem). Sea K un cuerpo de números, F ∈ K[X1 , . . . , Xn ] un poli-
nomio no nulo evaluable por un esquema de evaluación Γ de talla L, profundidad ` y parámetros
en F ⊆ K. Sea ω0 ∈ K tal que se verifica la siguiente desigualdad :
ht(ω0 ) ≥ max{log 2, ht(F)}.
Sea N ∈ N un número natural tal que se verifica la siguiente desigualdad :
log N > log(` + 1) + (` + 2)(log 2) (log log(4L)) .
5.3. TESTS DE NULIDAD PARA POLINOMIOS. 209

Definamos recursivamente la siguiente secuencia de números algebraicos (conocida como Es-


quema de Kronecker) :
ω1 = ω0N ,
y para cada i, 2 ≤ i ≤ n, definamos
N
ωi = ωi−1 .
Entonces, el punto ω := (ω1 , . . . , ωn ) ∈ K n es un testigo para F (i.e. F (ω) 6= 0).

La demostración se sigue por un argumento inductivo, que usa fuertemente una Generalización
de la Desigualdad de Liouville, descrito en [CHMP, 01].

Corollario 5.3.7. Sea F ∈ K[X1 , . . . , Xn ]un polinomio no nulo evaluable por un esquema de
evaluación de talla L, profundidad ` y parámetros en F := {x1 , . . . , xr } ⊆ K. Sea ω−1 ∈ K tal
que
ht(ω−1 ) := max{log 2, ht(x1 ), . . . , ht(xr )}.
2
2L
Definamos ω0 ∈ K como ω0 := ω−1 . Sea N ∈ N un número natural tal que

log N > log(` + 1) + (` + 2)(log 2) (log log(4L)) .

Definamos recursivamente la siguiente secuencia de números algebraicos (Esquema de Kro-


necker) :
ω1 = ω0N ,
N
y para cada i, 2 ≤ i ≤ n, definamos ωi = ωi−1 . Entonces, el punto ω := (ω1 , . . . , ωn ) ∈ K n es
un Testigo para F (i.e. F (ω) 6= 0).

Observación 5.3.8.

i) El resultado nos da, codificado como un esquema de evaluación, un punto en el que no


se anula el polinomio dado. Sin embargo, el tal Testigo es un punto que, en expansión
binaria, resulta excesivo para poder manejarlo del modo adecuado. Por ello, el uso
de métodos tipo Witness Theorem exigen poner un especial cuidado con el tamaño
de los resultados intermedios o, en su defecto, usar Tests Probabilistas para números
dados por esquemas de evaluación como los que se introducen en la Subsección 5.3.4
siguiente.
ii) El Caso Denso . Para la mayorı́a (genéricamente) de los polinomios F ∈ K[X1 , . . . , Xn ]
de grado d, el esquema de evaluación óptimo tiene talla
 
d+n
L= ,
n
y profundidad ` = log d + O(1). Los parámetros en este caso genérico son los co-
eficientes de F . El Teorema 5.3.6 anterior dice que existe una pequeña constante
universal c2 > 1, tal que la cota que debe verificar N es simplemente la cota sigu-
iente :
log N > c2 n log2 d.
iii) El caso Ralo (Sparse/Fewnomials). Supongamos que nuestro polinomio F ∈
K[X1 , . . . , Xn ] tiene pocos términos no nulos. Supongamos que F tiene grado a lo
sumo d y que a lo sumo M de sus términos tienen coeficientes no nulos. Entre estos
polinomios, el esquema de evaluación óptimo que los evalúa tiene talla del orden
L = c3 M d (donde c3 > 0 es una constante universal), y profundidad log2 d + O(1).
Entonces, el Teorema 5.3.6 anterior dice que existe una pequeña constante c3 > 1, tal
que la condición para definir N en el esquema de Kronecker es la siguiente :

log N > c3 log d (log log d + log log M ) .


210 5. UNA PRUEBA ELEMENTAL DE NULLSTELLENSATZ DE HILBERT

5.3.4. Tests de Nulidad para Números Dados por Esquemas de Evaluación. Del
mismo modo que los esquemas de evaluación pueden ser la buena estructura de datos para
codificar polinomios que aparecen en Teorı́a de la Elminación, la misma estructura de datos
se aplica a la representación de números enteros y racionales que aparecen como resultados de
eliminación. Del mismo modo que ocurre con los polinomios, los esquemas de evaluación de
números son muy adecuados para realizar operaciones aritméticas entre números codificados
mediante esquemas. Sin embargo, los Tests de Igualdad (o Tests de Nulidad) son problemáticos.
En este sentido, la operación correspondiente a la evaluación de un polinomio es la operación
de evaluar un esquema de evaluación módulo una constante dada. La buena capacidad de
adaptación de los esquemas de evaluación para estas propiedades hace que los Tests de Nulidad
para esquemas de evaluación representando números pasen por los cálculos modulares.
Los algoritmos esenciales en esta Sección vienen de los trabajos de O.H. Ibarra, S. Moran5 y
del trabajo de A. Schönhage 6
El resultado esencial es el siguiente Teorema que aprovecha ampliamente del Teorema de Den-
sidad de los Números Primos.
Teorema 5.3.9. Existe un algoritmo probabilista que, en tiempo polinomial decide la nulidad
de todo número entero evaluado por un esquema de evaluación.
El resultado técnico esencial es el siguiente Lema.
Lema 5.3.10. Sea N un número entero no nulo tal que
n
|N | ≤ 22n2
Etonces, para n suficientemente grande, la probabilidad de que N 6= 0 mod m, para una elección
aleatoria de m ∈ {1, . . . , 22n } es, al menos,
1
4n
El algoritmo correspondiente se define del modo siguiente :

Input : Γ el código de un esquema de evaluación de talla L evaluando un número entero.


Gess un conjunto DL de 4L números enteros en el conjunto {1, . . . , 22L },
if Γ 6= 0modm, para algún m ∈ DL , Output : “El número es no nulo”.
else Output :“El número es probablemente nulo.
fi
end

La probabilidad de error en este algoritmo es del orden


1 4L
(1 − ) < e−1 < 1/2,
4L
donde e es el número de Neper.

5.4. Una demostración elemental del Nullstellensatz de Hilbert: Parte II


La primera prueba del Nullstellensatz de Hilbert puede encontrarse en el trabajo de D. Hilbert7
de 1893. Un poco antes, en 1882, L. Krnoecker 8 demuestra el miso resultado, aunque en un
contexto y con una interpretación distintas.
Previamente al Teorema de los Ceros y, aunque no es necesario, vamos a recordar el Teorema
de la Base de Hilbert, en la versión de Lasker o Neother. Dicho Teorema fue descrito por D.
Hilbert9 en 1890 y puede enunciarse como sigue.
5O.H.Ibarra, S. Moran, Equivalence of Straight–Line Programs. J. of the ACM 30 (1983), 217–228.
6A.Schönhage, On the power of random access machines. In H. A. Maurer, ed., Proceedings of
the 6th Colloquium on Automata, Languages and Programming, vol. 71 of LNCS, Springer, 1979,
520–529.
7D. Hilbert, Über die vollen Invariantensysteme. Mathematische Annalen 42 (1893), 313373.
8L. Kronecker, Grundzüge einer arithmetischen theorie de algebraischen grössen. J. reine angew.

Math. 92 (1882) 1122.


9D. Hilbert,Über theorie der Algebraischen Formen. Math. Ann. 36 (1890), 473-534.
5.4. UNA DEMOSTRACIÓN ELEMENTAL DEL NULLSTELLENSATZ DE HILBERT: PARTE II 211

Teorema 5.4.1 (Hilbert’s Basissatz). Si K es un cuerpo (o un anillo noteheriano), el anillo


K[X1 , . . . , Xn ] es noetheriano. Es decir, todo ideal de K[X1 , . . . , Xn ] es finitamente generado.
En otras palabras, si a es un ideal de K[X1 , . . . , Xn ] exite un conjunto finito {f1 , . . . , fs } ⊆ a
tal que:
a = (f1 , . . . , fs ).
Observación 5.4.2. El Teorema de la base de Hilbert puede escribirse de maneras diversas.
Una maner didáctica de recordarle es la siguiente: Supongamos que nos dan un conjunto finito
de elementos {f1 , . . . , fs } en el anillo K[X1 , . . . , Xn ]. Entonces, el ideal a = (f1 , . . . , fs ) que
generan se describe mediante:
a := {g ∈ K[X1 , . . . , Xn ] : ∃g1 , . . . , gs ∈ K[X1 , . . . , Xn ], g = g1 f1 + · · · + gs fs }.
A las presentaciones de un elemento g de un ideal a como “combinación lineal” de los gener-
adores, es decir, como:
g = g1 f1 + · · · + gs fs ,
se les suele denominar Indetidad de Bézout. Aunque, más normalmente, se suele aplicar al caso
g = 1 cuando corresponda.
5.4.1. Nullstellensatz de Hilbert.
Lema 5.4.3. Sea K un cuerpo y f ∈ K[X1 , . . . , Xn ] un polinomio homogéneo. Entonces, existe
i, 1 ≤ i ≤ n tal que el polinomio en una variable menos
f (X1 , . . . , Xi−1 , 1, Xi+1 , . . . , Xn ),
es un polinomio no nulo.
Demostración. Es un mero ejercicio de comprobación. 
Teorema 5.4.4 (Hilbert’s Nullstellensatz). Sea a un ideal en un anillo K[X1 , . . . , Xn ],
siendo K un cuerpo infinito. Entonces, la variedad algebraica V = VK (a) ⊆ Kn verifica:
V = ∅ ⇐⇒ 1 ∈ a.
Demostración. Hay una implicación obvia: si 1 ∈ a, es decir a = K[X1 , . . . , Xn ], es obvio
que VK (a) = ∅.
Para la otra implicación haremos inducción en n, usando el Corolario 5.3.3 anterior. El caso
n = 1 es obvio.
Supongamos que el resultad es cierto para todo ideal propio en todo ideal de un anillo de
polinomios involucrando a los sumo n−1 variavles (esto es, en todo anillo del tipo K[Y1 , . . . , Yr ],
con r ≤ n − 1).
Por hipótesis, a es un ideal propio en K[X1 , . . . , Xn ]. Como K es infinito, podemos encontrar
un elemento f ∈ a de grado d no nulo y un subconjunto I de K de cardinal 2d + 1. Siguiendo
la descomposición descrita en la Observación 5.2.2, sea fd (X1 , . . . , Xn ) su parte homogénea de
grado d y no nula. Supongamos, sin pérdida de la generalidad, que f (X1 , . . . , Xn−1 , 1) 6= 0.
Por tanto, existe (t1 , . . . , tn−1 ) ∈ I n−1 , tal que
f (t1 , . . . , tn−1 , 1) 6= 0.
Consideremos ahora el isomorfismo descrito en la Sección 5.2 (es decir, el isomorfismo de la
Ecuación 5.2.2):
ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ]
(5.4.1)
f 7−→ f (Y1 + t1 Yn , . . . , Yn−1 + tn−1 Yn , Yn ).
Entonces, por el apartado i) del Lema 5.2.1, como a es un ideal propio, también lo es el ideal
b := ϕ(a). Pero g := ϕ(f ) es, tras este cambio de variables un polinomio mónico no nulo en b.
Adicionalmente, consideremos el ideal
c := bc := b ∩ K[Y1 , . . . , Yn−1 ].
Como b es propio, también lo es c. Y, por hipótesis inductiva, VKn−1 (c) 6= ∅.
Podemos aplicar el Lema 5.1.3 (se satisfacen las dos condiciones i) y ii)) a b y concluir que
VK (b) 6= ∅ es no vacı́o. Usando el apartado iii) del Lema 5.2.1, tendremos que VK (a) 6= ∅ es no
vacı́o. 
212 5. UNA PRUEBA ELEMENTAL DE NULLSTELLENSATZ DE HILBERT

5.4.2. Nullstellensatz de Hilbert: Cuerpos finitos.


Teorema 5.4.5 (Hilbert’s Nullstellensatz: cuerpos finitos). Sea a un ideal en un anillo
K[X1 , . . . , Xn ], siendo K un cuerpo finito. Supongamos que a posee un elemento no nulo y no
unidad de grado d ≥ 1. Supongamos que el cardinal de K verifica: ](K) ≥ 2d + 1. Entonces, la
variedad algebraica V = VK (a) ⊆ Kn verifica:
V = ∅ ⇐⇒ 1 ∈ a.
Demostración. El resultado se sigue de una demostración idéntica a la anterior. Nótese
que el punto crı́tico es que el número de elementos del cuerpo sea suficientemente grande.


Observación 5.4.6. En las utilizaciones algorı́tmicas del Nullstellensatz sobre cuerpos finitos,
si el cuerpo inicial K sobre el que se trabaja no tiene suficientemente elementos se suelen usar
extensiones finitas de K que tienen un cardinal suficientemente grande con respecto a los grados
de los polinomios involucrados. Una forma de entender estas construcciones son las siguientes.
5.4.2.1. Un recordatorio sobre Cuerpos Finitos. Unas palabras para recordar los cuerpos
finitos y cómo podemos extenderlos.
Teorema 5.4.7. Todo cuerpo finito F de cardinal pm y caracterı́stica p es el menor cuerpo que
contiene a Z/pZ y a todas las raı́ces de la ecuación
m
X p − X = 0.
De hecho, los elementos de F son justamente las raı́ces de esa ecuación.
Definición 76. Sea F un cuerpo finito de cardinal q = pm y sea n un número entero coprimo
con q. Llamaremos raı́z primitiva n−ésima de la unidad a todo elemento θ de F tal que las
siguientes sean las n raı́ces distintas de la unidad :
{1, θ, θ2 , . . . , θn−1 }.
En el caso en que n es coprimo con q las raı́ces n−ésimas primitivas de la unidad sobre F tienen
un comportamiento próximo al caso de caracterı́stica 0; aunque con matices y diferencias que
es necesario destacar.
Definición 77. Sea F un cuerpo finito de cardinal q = pm y sea n un número natural no
nulo coprimo con q. La siguiente función racional es un polinomio en F [X] llamado polinomio
ciclotómico de grado n :
Y µ(d)
fn (X) := X n/d − 1 ,
d|n

donde µ es la función de Möbius. La funcin de Möbius fue introducida como el discriminante


en Teorı́a de Números. Viene definida del modo siguiente : Sea n ∈ N un número natural.
Definimos µ(n), mediante :

 0 si n posee algún factor irreducible múltiple
µ(n) := (−1)r si n = p1 · · · pr con pi primo, gcd(pi , pj ) = 1
1 si n = 1

En suma, µ(n) = 0 si y solamente si posee factores irreducibles múltiples. Esto permite iden-
tificar las propiedades de la función de Möbius con las propiedades del discriminante de un
polinomio. Sin embargo, la función de Möbius no se sabe calcular sin conocer la factorización
(lo que hace de ella una función difı́cil de evaluar) y tiene propiedades muy significativas como
la famosa “Fórmula de Inversión de Möbius” (véase el texto descrito en el pie de página 10
para más información).

10Eltexto clásico de Teorı́a de Números G. H. Hardy and E. M. Wright, “An Introduction to the
Theory of Numbers”. Oxford at the Clarendon Press, 1938. Este texto contiene la fórmula de inversion
de Möbius como su Teorema 270.
5.4. UNA DEMOSTRACIÓN ELEMENTAL DEL NULLSTELLENSATZ DE HILBERT: PARTE II 213

Obsérvese que el cálculo de polinomio √ ciclotómico fn puede hacerse fácilmente√a partir de la


factorización de n (en tiempo O( nlog22 n)) y de todos sus divisores (tiempo O( nlog22 n)).
Una raı́z n−ésima de la unidad sobre F es un elemento θ tal que θn = 1 y las potencias
{1, θ, θ2 , . . . , θn−1 } son todas las raı́ces n−ésimas de la unidad sobre F y son todos distintos.
Para calcularlas y poder trabajar con ellas, es necesario hacer uso del siguiente :
Lema 5.4.8. Sea F un cuerpo finito de cardinal q = pm y sea n un número natural no nulo
coprimo con q. Sea (Z/nZ)∗ el grupo multiplicativo de las clases de restos módulo n. Sea r
el orden de q como elemento de (Z/nZ)∗ . Entonces, el polinomio ciclotómico fn factoriza en
F [X] como un producto de ϕ(n)
r polinomios irreducibles de grado r cada uno de ellos, siendo ϕ
la función de Euler.
La función de Euler : Se define mediante φ(1) = 1 y para n ≥ 2 del modo siguiente :
ϕ(m) := ]{a ∈ N : 1 ≤ a ≤ m − 1, mcd(a, m) = 1}.
Se trata de probar que φ(m) coincide con el número de elementos del grupo de las unidades en
(Z/mZ)∗ . En particular, Z/mZ es un cuerpo si y solamente si ϕ(m) = m−1. Otras propiedades
de la funcin de Euler :
i) La funcin de Euler es multiplicativa, esto es, si mcd(p, q) = 1, entonces ϕ(pq) =
ϕ(q)ϕ(q).
ii) Se tiene :
X
ϕ(m) = n
m|n
Las raı́ces primitivas n−ésimas de la unidad sobre F son las raı́ces de uno de esos factores.
Para detectar las raı́ces primitivas de la unidad, factoricemos fn usando uno cualquiera de los
algoritmos de factorización de polinomios univariados sobre cuerpos finitos. Por ejemplo, el
método descrito por E. Berlekamp y que puede resumirse en el siguiente enunciado:
Teorema 5.4.9 ([Be, 70]). Sea p ∈ N un número primo. Sea Fp el cuerpo primo de p elemen-
tos. Entonces, existe una máquina de Turing M determinista tal que realiza la siguiente tarea :
dado f ∈ Fp [T ] un polinomio mónico, sin factores múltiples y de grado d, M calcula los factores
irreducibles de f en Fp [T ]. El tiempo de cálculo de tal máquina de Turing es polinomial en p y
d, i.e.
pO(1) dO(1)
A partir de esa factorización, sea gn uno de esos factores y definamos el cuerpo
F 0 := F (θ) = F [Y ]/(gn (Y )).
Se tiene :
Lema 5.4.10. La clase de Y módulo gn (esto es, θ ∈ F 0 ) es una raı́z primitiva n−ésima de la
unidad sobre F .
Con ello tenemos una descripción de cualquier cuerpo.
5.4.3. Nullstellensatz: Identidad de Bézout.
Teorema 5.4.11 (Hilbert’s Nullstellensatz: Identidad de Bézout). Sea {f1 , . . . , fs } un
conjunto finito de elementos de K[X1 , . . . , Xn ] no todos nulos y ninugno unidad, siendo K un
cuerpo. Sea d el máximo de os grados de los polinomios f1 , . . . , fs .Sea V ⊆ Kn la variedad
algebraica V = VK (f1 , . . . , fs ) ⊆ Kn de los ceros comunes de estos polinomios. Supongamos que
el cardinal de K satisface: ](K) ≥ 2d + 1. En tonces son equivalente:
∃x ∈ Kn , f1 (x) = 0, . . . , fs (x) = 0,
y ∃g1 , . . . , gs ∈ K[X1 , . . . , Xn ], tales que:
1 = g1 f1 + dotsgs fs .
Demostración. Simplemente notar que si a es el ideal que generan los polinomios {f1 , . . . , fs },
el ideal es propio si y solamente si V (a) = V (f1 , . . . , fs ) 6= ∅. El resto es reescritura.

214 5. UNA PRUEBA ELEMENTAL DE NULLSTELLENSATZ DE HILBERT

5.4.3.1. La Teorı́a de Primer Orden sobre los Complejos admite Eliminación de Cuantifi-
cadores. Una de las aplicaciones obvias del Nullstellensatz en la forma de identidad de Bézout
es la de permitir la eliminación de cuantificadores existenciales en la Teorı́a de Primer Orden
sobre los Complejos, por ejemplo, y sobre todo cuerpo de caracterı́stica cero. Analicemos un
poco esa formulación, sin entrar en profundidad en los detalles. Por simplicidad supongamos
K = Q y K = C que, aunque no es la clausura algebraica de Q admite la misma formulación.
Consideremos todas las expresiones que se pueden escribir usando los siguientes elementos y
sus combinaciones naturales (definen un lenguaje regular):
• Un conjunto numerable de variables {Xn : n ∈ N},
• Un conjunto de constantes {0, 1, −1},
˙ y la inversión sobre las constantes
• Operaciones usuales de la teorı́a de anillos ({+, −, })
−1
no nulas { }.
• Condiciones de signo {= 0}.
• Operadores booleanos {∨, ∧, ¬}.
• Cuantificadores que afectan a elementos de K: {∀, ∃}.
Unas pocas observaciones:
i) Las constantes son los objetos que puedo construir usando {−1, 0, 1} y las operaciones
elementales de cuerpo {+, −, }. ˙ Luego se trata de los número naturales Z.
ii) Si admito la inversión de constantes no nulas ({−1 }) tengo el cuerpo de los racionales
Q.
iii) Las funciones se obtienen mezclando constantes (en Q), variables y las operaciones de
anillo {+, −, }, ˙ son los polinomios en un número finito de variables Q[X0 , . . . , Xn ].
iv) Las fórmulas atómicas son, expresiones de la forma f (X0 , . . . , Xn ) = 0, con f ∈
Q[X0 , . . . , Xn ] un polinomio en un número finito de variables. Usualmente, de admiten
como fórmulas atómicas las negaciones de las anteriores, es decir, ¬(f (X0 , . . . , Xn ) =
0) o, equivalentemente, f (X0 , . . . , Xn ) 6= 0.
v) Se admiten coombinaciones booleanas de fórmulas atómicas. Se pede probar que todas
se pueden escribir como:
  !
n
_ ^k ^ ^ t
 (fi,j = 0) (gi,` 6= 0) .
i=1 j=1 `=1

Una de las primeras observaciones casi inmediatas es que se puede suponer que todas las
fórmulas son estudiables en forma pre-nexa, es decir, con los cuantifidaores por delante. Suponiendo
que fi,j , hi,j ∈ K[X0 , . . . , Xn ], una fórmula se primer orden en el lenguaje de cuerpos algebra-
caente cerrados en forma pre-nexa es una fórmula del tipo:
  !
_n k
^ ^ ^ t
Q1 Xi1 , . . . , Qr Xir ,  (fi,j = 0) (gi,` 6= 0) ,
i=1 j=1 `=1

donde Qi ∈ {∀, ∃} son cuantificadores. Si los cuantificadores son todos del tipo Qi ∈ {∃},
decimos que es una fórmula existencial o que sólo involucra un bloque de cuantificadores exis-
tenciales.
La Semántica de esas fórmulas consiste en indeiticador las fórmulas con subconjuntos de Kn ,
donde K es algebraicamente cerrado.. Unas ideas son:
i) Ası́, un átomo, f (X0 , . . . , Xn ) = 0 se identifica con el conjunto algebraico

V (f ) := {x = (x0 , . . . , xn ) ∈ Kn+1 : f (x) = 0}.

ii) Una fórmula del tipo:


 
k
^
 (fi,j (X0 , . . . , Xn ) = 0) ,
j=1
5.4. UNA DEMOSTRACIÓN ELEMENTAL DEL NULLSTELLENSATZ DE HILBERT: PARTE II 215

se identifica con la variedad algebraica (atmbién llamado cerrado en la topologı́a de


Zariski) V (a) donde a es el ideal generado por fi,1 , . . . , fi,m . Es decir, con
 
k
^
V (fi,1 , . . . , fi,m ) = {x ∈ Kn+1 :  (fi,j (x) = 0)}.
j=1

De hecho, el Teorema de la Base indica que todo V (a), para cualquier ideal a de
K[X0 , . . . , Xn ] se puede escribir mediante una fórmula de este tipo.
iii) Una negación de un átomo f (X0 , . . . , Xn ) 6= 0 se identifica con el complementario de
un conjunto algebraico dado por una sola ecuación:
V (f )c := {x = (x0 , . . . , xn ) ∈ Kn+1 : f (x) 6= 0}.
Se llaman abiertos de la sub-base de la toplogı́a de Zariski.
iv) Las fórmulas del tipo:
t
!
^
(gi,` (X0 , . . . , Xn ) 6= 0) ,
`=1
definen los conjuntos que forman la base de abiertos de la topologı́a de Zariski.
t
!
^
n+1
{x ∈ K : (gi,` (x) 6= 0) }.
`=1

Por culpa de la condición noetheriana (Teorema de la Base de Hilbert) todos los


abiertos de la toplogı́a de Zarsikis serán uniones finitas de abiertos de la base.
v) Las fórmulas del tipo:
  !
^k ^ ^ t
 (fi,j = 0) (gi,` 6= 0)
j=1 `=1

definen conjuntos que son intersección de un abierto y un cerrado en la topologı́a de


Zariski.
  !
k
^ ^ ^ t
n+1
{x ∈ K :  (fi,j = 0) (gi,` 6= 0) }.
j=1 `=1

Se llaman, obviamente, localmente cerrados en la topologı́a de Zariski.


vi) Las uniones finitas de localmente cerrados se denominan constructibles de la toplogı́a
de Zariski y, obviamente, son dados por fórmulas de la forma:
  !
n
_ k
^ ^ ^ t
 (fi,j = 0) (gi,` 6= 0)
i=1 j=1 `=1

Teorema 5.4.12 (Teorema Fundamental de la Teorı́a de la Eliminación). Sea C ⊆ Kn+1


un conjunto constructible y sea π : Kn+1 −→ Kr una proyección. Entonces, π(C) ⊆ Kn+1 es
también constructible.
En otras palabras, sea C ⊆ Kn+1 un conjunto constructible dado por una fórmula Φ(X0 , . . . , Xn )
sin cuantificadores. Sea π : Kn+1 −→ Kr la proyección dada mediante:
π: Kn+1 −→ Kr
(x0 , . . . , xn ) 7−→ (xn−r+1 , . . . , xn ).
La proyección π(C) es el conjunto dado por la fórmula
∃Xn−r+1 ∈ K, . . . , ∃Xn ∈ K, Φ(X0 , . . . , Xn ).
El Teorema afirma que existe una fórmula de primer orden libre de cuantificadores Ψ de la
forma
  !
n
_ k
^ t
^ ^
Ψ(X0 , . . . , Xn−r ) :=  (fi,j (X0 , . . . , Xn−r ) = 0) (gi,` (X0 , . . . , Xn−r ) 6= 0) ,
i=1 j=1 `=1
216 5. UNA PRUEBA ELEMENTAL DE NULLSTELLENSATZ DE HILBERT

tal que
π(C) := {x ∈ Kn−r+1 : Ψ(x0 , . . . , xn−r )}.
Por tanto, toda fórmula con cuantificadores existencias es equivalente a una fórmula sin cuan-
tificadores (se dice libre de cuantificadores). Como los constructibles son cerrados por comple-
mentación y ∀ se interpreta mediante ¬ (∃¬(...)), podemos concluir.
Teorema 5.4.13. Toda fórmula de primer orden del lenguajde de cuerpos algebraicamente
cerrados es semánticamente equivalente a una fórmula libre de cuantificadores. Luego la teorı́a
es completa. Además es decidible, es decir, existe un algoritmo que elimina los cuantificadores
de la fórmula cuantificada.
5.4.3.2. Uso del Nullstellensatz Efectivo en la eliminación de un bloque de cuantificadores
existenciales. Una de las estrategias antiguas más habituales para eliminar un bloque de cuan-
tificadores existenciales es el uso del llamado Nullstellensatz Efectivo. Fué comenzado por la
alumna de D. Hilbert G. Hermann en su trabajo de 1926 [He, 26]. Básicamente, este enunciado
puedes darse como sigue:
Teorema 5.4.14 (Nullstellensatz Efectivo, [He, 26]). Existe una función D : N3 −→ R+
que verifica las popiedades siguientes:
Sea {f1 , . . . , fs } un conjunto finito de elementos de K[X1 , . . . , Xn ]. Sea d el máximo de os
grados de los polinomios f1 , . . . , fs . Sea V ⊆ Kn la variedad algebraica V = VK (f1 , . . . , fs ) ⊆
Kn de los ceros comunes de estos polinomios. Supongamos que el cardinal de K satisface:
](K) ≥ 2d + 1. Entonces son equivalente:
∃x ∈ Kn , f1 (x) = 0, . . . , fs (x) = 0,
y ∃g1 , . . . , gs ∈ K[X1 , . . . , Xn ], tales que:
deg(gi ) ≤ D(d, n, s),
Y
1 = g1 f1 + dotsgs fs .
Además, D(d, n, s) puede elegirse satisfaciendo:
n
D(d, n, s) ≤ (sd)2 .
La demostración es más sutil que la descrita para el Nullstellensatz porque es constructiva:
se trata de dar descripciones de los polinomios que surgen en el Nullstellensatz en función de
los datos f1 , . . . , fs . Las cotas iniciales de G. Hermann fueron sucesivamente reducidas por la
colaboración de diversos autores y el paso de casi un centenar de aos. Se pueden destacar las
siguientes:
n
i) D.W. Masser, G. Wusholtz (cf. [MaWü, 71]) : D(d, n, s) ≤ d2 s.
ii) D.W. Brownawell (cf. [Br, 87]), L. Caniglia, A. Galligo, J. Heintz (cf. [CGH, 88]),
J. Kollár (cf. [Kl, 88]) :D(d, n, 2) ≤ max{3, d}n .
iii) Otras variantes con distintos métodos de cálculo se puede obtener en [KrPa, 96],
[HMPS, 00], [KPS, 01] y sus referencias.
Este procedimiento da, por ejemplo, un procedimiento para decidir si un sistema de ecuaciones
polinomiales posee una solución en una clausura algebraica sin conocer las soluciones ni calcu-
larlas. El ejemplo más simple es el siguiente procedimiento:

Input: Una lista de polinomios f1 , . . . , fs ∈ K[X1 , . . . , Xn ] con coeficientes en el cuerpo K.

Output: Una respuesta Sı́ o No a la fórumla de primer orden:


∃x1 ∈ K, · · · , ∃xn ∈ K, f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0.

Concepto del procedimiento:

Introducir un juego de variables


[s
Z := {Zµ(i) : µ ∈ Nn , |µ| ≤ D(d, n, s)}.
i=1
5.4. UNA DEMOSTRACIÓN ELEMENTAL DEL NULLSTELLENSATZ DE HILBERT: PARTE II 217

Introducir la lista de polinomios genéricos {Gi (Z, X1 , . . . , Xn ) : 1 ≤ i ≤ s} dados mediante:


X
Gi (Z, X1 , . . . , Xn ) := Zµ(i) X1µ1 · · · Xnµn .
|µ|≤D(d,n,s)

Escribir La identidad de Bézout:


(5.4.2) 1 = G1 (Z, X1 , . . . , Xn )f1 (X1 , . . . , Xn ) + · · · + Gs (Z, X1 , . . . , Xn )fs (X1 , . . . , Xn ).
Observación: Se trata de una igualdad entre dos polinomios de grados acotados por D(d, n, s)+
d. Por tanto, es un sistema de ecuaciones lineales. Para verificarlo, introduzcamos un poco más
de notación. Como todos los polinomios f1 , . . . , fs tiene grado acotado por d, podemos suponer
que existen constantes
s
[
{a(i) n
µ : µ ∈ N , |µ| ≤ d},
i=1
de tal modo que: X µ1
fi := a(i) µn
µ X1 · · · Xn .
|µ|≤d

Los coeficientes del producto G1 fi se pueden escribir como sigue:


(i)
X
Gi (Z, X1 , . . . , Xn )fi (X1 , . . . , Xn ) := Lθ (Z)X1θ1 · · · Xnθn ,
|θ|≤D(d,n,s)+d
(i) (i)
donde Lθ (Z) es la aplicación lineal (en las variables {Zµ } dada mediante:
(i)
X
Lθ (Z) := a(i) (i)
µ Zτ .
τ + µ = θ,
|τ | ≤ D(d, n, s), |µ| ≤ d
Finalmente, tenemos la aplicación lineal:
(1) (s)
Lθ (Z) := Lθ (Z) + · · · + Lθ (Z).
Esto nos permite escribir el polinomio:
X
G1 (Z, X1 , . . . , Xn )f1 + · · · + Gs (Z, X1 , . . . , Xn )fs = Lθ (Z)X1θ1 · · · Xnθn .
|θ|≤D(d,n,s)
Por tanto, la ecuación (5.4.2) es equivalente al siguiente sistema de ecuaciones lineales en las
variables en la colección Z siguientes:

Lθ (Z) = 0, si θ 6= (0, . . . , 0)
(5.4.3)
Lθ (Z) = 1, si θ = (0, . . . , 0)
Lema 5.4.15. Las siguientes propiedades son equivalentes:
i) Los polinomios f1 , . . . , fs posee una solución común en Kn , es decir, la fórmula:
∃x1 ∈ K, · · · , ∃xn ∈ K, f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0.
ii) No existen valores en K de la forma
ζ := (zτ(i) : 1 ≤ i ≤ s, |τ | ≤ D(d, n, s)) ∈ K N (d,n,s) ,
donde N (d, n, s) son los ı́ndices de las variables en la lista Z. Tales que
1 = g1 f1 + · · · ‘ + gs fs ,
donde
gi := Gi (ζ, X1 , . . . , Xn ) ∈ K[X1 , . . . , Xn ].
iii) El sistema de ecuaciones lineales (5.4.3) en las variables Z con coeficientes en K es
incompatible.
Demostración. La equivalencia entre i) y ii) es el Nullstellensatz de G. Hermann. La
equivalencia entre ii) y iii) es mera re-escritura de la identidad de Bézout como sistema de
ecuaciones lineales. En el cao univariado, el sistema es el famosos sistema asociado a la matriz
de Sylvester. 
218 5. UNA PRUEBA ELEMENTAL DE NULLSTELLENSATZ DE HILBERT

Output: YES si y solamente si el sistema de ecuaciones lineales (5.4.3) es un sistema de


ecuaciones lineales incompatible.

Teorema 5.4.16. Sea K un cuerpo computable de ceracterı́stica distinta de 2 y sea K un cuerpo


algebraicamente cerrado que le contiene. Existe un algoritmo que realiza la tera siguiente:
Dados como inputs polinomios {f1 , . . . , fs } ∈ K[X1 , . . . , Xn ], el algoritmo decide si
∃x1 ∈ K, · · · , ∃xn ∈ K, f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0.
El tiempo de ejecución del algoritmo está acotado por un procedimiento que realiza un número
de operaciones en K acotado por:
ω 
max{3, d}n + d + n
 
2
O s ) ≤ O(sω max{3, d}ωn + dωn ),
n
donde ω ≤ 2.7.
Demostración. Se trata simplemente de decidir si el sistema de ecuaciones lineales (5.4.3)
es o no compatible. Para el caso de ceracterı́tica distinta de 2 podemos aplicar la cota de
Bronawell–Caniglia-Galligo-Heintz-Kollár y tendremos
D(d, n, s) ≤ max{3, d}n .
Ahora bien, el sistema de ecuaciones lineales (5.4.3) tiene:
• El número de variables involucradas es el número de variables en Z, es decir,
max{3, d}n + n
   
D(d, n, s) + n
s ≤s ,
n n
para el caso que nos ocupa es el número de coeficientes estudiado en la Parte 1 del
curso para una listra de s polinomios en n variables de grados acotados por D(d, n, ).
• El número de ecuaciones en el sistema de ecuaciones lineales (5.4.3) es el número
de coeficientes en n variables de un polinomo de grado acotado por D(d, n, s) + d ≤
max{3, d}n + d.
Finalmente, el exponente ω ≤ 2.7 es el exponente (menor estricto que 3) conocido desde los
trabajos de V. Strassen (cf. [?]) tal que permite decidir si un sistema de n ecuaciones lineales
en m variables es compatible en tiempo O(max{n, m}ω ). 
Corollario 5.4.17. Existe un algoritmo que permite realizar la tarea siguiente:
Dada una secuencia de polinomios f1 , . . . , fs , g1 , . . . , gt ∈ K[Y1 , . . . , Ym , X1 , . . . , Xn ], hallar una
fórmula libre de cuantificadores con coeficientes en K y en las variables {Y1 , . . . , Ym }
Ψ(Y1 , . . . , Ym ),
equivalente a la fórmula
(5.4.4)  
s t
!
^ ^ ^
∃X1 ∈ K, . . . , ∃Xn ∈ K,  (fj (Y1 , . . . , Ym , X1 , . . . , Xn ) = 0) (g` (Y1 , . . . , Ym , X1 , . . . , Xn ) 6= 0) .
j=1 `=1

En particular, la teorı́a de primer orden sobre cuerpos algebraicamente cerrados es decidible y


completa y admite algoritmos de eliminación de cuantificadores.
Demostración. La única idea es reescribir la fórmula (5.4.4) como una fórmula del tipo
del Nullstellensatz, usando el truco siguiente: añadamos una variable Z` para 1 ≤ ` ≤ t, de tal
modo que se observa que la fórmula siguiente:
(∃X1 ∈ K, . . . , ∃Xn ∈ K, g` (Y1 , . . . , Ym , X1 , . . . , Xn ) 6= 0) ,
es equivalente a la fórmula
(∃Z` ∈ K, ∃X1 ∈ K, . . . , ∃Xn ∈ K, Z` g` (Y1 , . . . , Ym , X1 , . . . , Xn ) − 1 = 0) .
Una vez puesta nuestra fórmula en la forma del Nullstellensatz del Teorema precedente, hacemos
crecer el cuerpo considerando L = K(Y1 , . . . , Ym ). Escribimos la correspondiente ecuación lineal
(5.4.3) cuya matriz tiene coordenadas en L. De hecho, las coordenadas están en K[Y1 , . . . , Ym ].
Ahora, el sistema es incompatible si y solamente si ciertos menores de la matriz de coeficientes
5.4. UNA DEMOSTRACIÓN ELEMENTAL DEL NULLSTELLENSATZ DE HILBERT: PARTE II 219

del sistema de ecuaciones lineales (5.4.3) son nulos o no. La fórmula Ψ(Y1 , . . . , Ym ) son combi-
naciones booleanas de condiciones de signo sobre los menores de esa matriz. Esos menores son
polinomios en K[Y1 , . . . , Ym ]11. En particular, acabamos de denostrar el Teorema Fundamental
de la Eliminación usando el Nullstellensatz y Álgebra Lineal Elemental. El resto se sigue de
modo obvio. 

Observación 5.4.18 (Crı́ticas a este Procedimiento). Este procedimiento es el que subyace


a los intentos de mejorar los Nullstellensatz Efectivos que fueron moda a finales de los años 80
y principios de los 90, pero que siguen siendo considerados resultados de élite en Matemáticas.
Sin embargo, el método no es nada bueno porque la conpmplejidad ni siquiera es simplemente
2
exponencial: está en O(dωn ). Veremos, si es posible a lo largo del curso, que se puede decidir
en tiempo O(d(ω+1)n ) con una complejidad que necesariamente están en Ω(dn ) (al menos para
algoritmos universales). Por tanto, no es recomendable usar este procedimiento por más que
sea el más accesible e inmediato de entender.
5.4.4. Nullstellensatz: Maximales. Esta versión del Nullstellensatz (totalmente equiv-
alente a las anteriores) tiene sus reminiscencias en el Teorema del Resto, consecuencia inmediara
de la división Euclı́dea. En España, por tradiciones incomprensibles, se suele llamar Teorema
de Ruffini al Teorema del Resto. En realidad, están confundiendo el “Método de Ruffini” (que
sı́ es un método para dividir por (X − a)) y es debido a Ruffini12. En cambio, en el mundo
anglosajón ese método de Ruffini es conocido como el “Horner’s method” y se basa en un tra-
bajo de Horner13. Una descripción de ese conocimiento puede verse en [?]. Recientemente, en
la campaña de enaltecimiento del nuevo imperio global, se ha descubierto, cómo no, que, en
realidad, el “Método de Ruffini” era ya conocido por el matemático chino Qin Jiushao14 en el
siglo XIII. En todo caso, el método es tan obvio que darle un nombre carece de interés: es el
“método” que a cualquiera se le ocurre. Lo que no sı́ es evidente es que el Teorema de Resto
es antecesor de todos ellos, es consecuencia de la existencia de división euclı́dea y se remonta,
cuando menos, al siglo III a. de C y a los Elementos de Euclides.
Haremos la discusión suponiendo que K = K es un cuerpo algebraicamente cerrado. De todos
modos, la restriccón es innecesaria siempre que se consideren adecuandamente los ideales en el
anillo de polinomios cuyo cuerpo de coeficientes es el cuerpo base. La hipótesis simplemente
simplifica la exposición de los hechos.
Observación 5.4.19 (Ideales maximales asociados a puntos). Hay un tipo particular de
ideales. Supongamos ζ := (z1 , . . . , zn ) ∈ Kn un punto en el espacio afı́n. Definimos el siguiente
conjunto en el anillo K[X1 , . . . , Xn ]:
mζ := {f ∈ K[X1 , . . . , Xn ] : f (ζ) = 0}.
Se trata claramente de un ideal en K[X1 , . . . , Xn ] y es un ideal maximal. Además, si K = K,
se tiene claramente que el cociente:
K[X1 , . . . , Xn ]/mζ ∼
= K.
Se puede probar, además, que este ideal maximal tiene el siguiente cojunto de generadores:
mζ := (X1 − z1 , . . . , Xn − zn ).
Como notación, denotaremos como Spm(R) al conjunto de todos los ideales maximales de un
anillo R.

11Note el alumno que se trata de los menores que, rudimentariamente, le salı́an en los lejanos
cursos de secundaria en los que se discutı́a si un sistema de ecuaciones lineales con parámetros era
compatbile o no.
12P. Ruffini, Sopra la determinazione delle radici nelle equazioni numeriche di qualunque grado. Memoria
del Dottor Paolo Ruffini, pubblico professore di matematica sublime in Modena, uno dei quaranta délia società
italiana delle scienze ec. Coronata dalla società medesima. In Modena, MDOCCIV. Presso la società tipografica.
Con Approvazione, 1804.
13W. G. Horner, Horner, William George (July 1819). A new method of solving numerical equations of
all orders, by continuous approximation. Philosophical Transactions (Royal Society of London), July 1819,.
308335.
14Qin Jiushao, Shu Shu Jiu Zhang (Tratado Matemático en Nueve Secciones), 1247.
220 5. UNA PRUEBA ELEMENTAL DE NULLSTELLENSATZ DE HILBERT

Teorema 5.4.20 (Hilbert’s Nullstellensatz: maximales). Sea K = K un cuerpo alge-


braicamente cerrado. La siguiente es una biyección entre conjuntos no vacı́os:
m : Kn −→ Spm(K[X1 , . . . , Xn ])
(5.4.5)
ζ 7−→ mζ

Demostración. De hecho, se tiene la equivalencia entre las siguientes tres afirmaciones:


i) El cuerpo K es algebraicamente cerrado, esto es, K = K,
ii) La aplicación m anterior es una biyección entre K n y Spm(K[X1 , . . . , Xn ]),
iii) Se verifica el Nullstellensatz de Hilbert en K[X1 , . . . , Xn ] en la forma siguiente:
Para cada ideal a de K[X1 , . . . , Xn ], existe ζ ∈ K n tal que f (ζ) = 0, ∀f ∈ a, si y
solamente si 1 6∈ a.
Probar que si no se verifica i), no se verifica iii) es evidente. Si un cuerpo no es algebraicamente
cerrado, siempre hay un polinomio univariado e irreducible que no posee raı́ces en K (el ejemplo
f = X 2 + 1 ∈ R[X] es clásico). Ese polinomio define un ideal propio a = (f ) (con 1 6∈ a) y no
posee ninguna solución en K 1 . Por tanto, iii)=⇒ i).
La implicación i) =⇒ iii) es simplemente el Teorema 5.4.4, dado que todo cuerpo algebraica-
mente cerrado es de cardinal infinito.
De otro lado, ii) =⇒ iii). La razón es obviamente la siguiente. En la equivalente de iii) sólo hay
una implicación, la otra es obvia. La implicación es la siguiente:
1 6∈ a, =⇒ ∃ζ ∈ K n , f (ζ) = 0, ∀f ∈ a.
Pero si 1 6∈ a, entonces, hay un ideal maximal n de K[X1 , . . . , Xn ] que contiene al ideal a
(i.e.a ⊆ n). Pero, por ii), todos los tales maximales son de la forma n = mζ , con ζ ∈ K n . En
conclusión, existe ζ ∈ K n tal que a ⊆ mζ . Esto es lo mismo que escribir f (ζ) = 0, ∀f ∈ a y
tendremos la implicación relevante de iii).
Finalmente, iii) =⇒ ii). Si n es un ideal maximal, entonces 1 6∈ n luego, por iii), existe ζ ∈ K n
tal que f (ζ) = 0, ∀f ∈ n. Esto es lo mismo que decir n ⊆ mζ . Como n es maximal, entonces
n = mζ y m es suprayectiva. La inyectividad se sigue del hecho de que dos puntos disntintos de
K n definen distintos maximales mζ1 6= mζ1 . 

Observación 5.4.21. Una variación clásica de esta verisón del Nullstellensatz es el famoso
Teorema de Banach-Stone-Cech-Gelfand-Kolmogorov (y algún otro autor que, probablemente,
descubirón un resultado análogo por el camino). Una demostración del mismo pude consultarse
en [GiJe, 76]. No inistermoes aquı́ en su historia, pero este resultado afirma lo siguiente:
Teorema 5.4.22 (Banach-Stone-Cech-Gelfand-Kolmogorov). Si X es un espacio topológico
compacto, entonces X es homemorfo al espectro maximal de C 0 (X).
5.4.5. Nullstellensatz: Rabinowitsch. El “Truco de Rabinowitsch” es el método de-
scrito por George Yuri Rainich, bajo el peudónimo de J. J. Raboniwtsch, en su trabajo [Rb, 29].
El resultado es una identificación entre los ideales del anillo de polinomios que son radicales y
las variedades algebriacas. Es consecuencia inmediata del Nullstellensatz y vamos a tratar de
recuperarlo.
Definición 78. El radical de un ideal a de un anillo R se define mediante la siguiente igualdad:

a := {f ∈ R : ∃n ∈ N, f n ∈ a}.

Un ideal a se llama radical si coincide con su radical, i.e. si a = a.
Se podrı́a hacer un estudio de propiedades del radical de un ideal, pero nos limitaremos a reflejar
una propiedad como la siguiente:
Proposición 5.4.23. Si a es un ideal de un anillo R, su radical es la intersección de todos los
primos que le contienen, es decir,
√ \
a = {p : p ⊇ a, p ∈ Spec(R)},

donde Spec(R) es el conjunto de todos los ideales primos de R.


5.4. UNA DEMOSTRACIÓN ELEMENTAL DEL NULLSTELLENSATZ DE HILBERT: PARTE II 221

Teorema 5.4.24 (Nullstellensatz: Rabinowitsch trick). Sea K un cuerpo infinito y K un


cuerpo algebraicamente cerrado que le contiene. Consideremos los conjuntos siguientes:

RadK := {a ⊆ K[X1 , . . . , Xn ] : a es ideal, a = a}.
ClK := {VK (b) : a es ideal de K[X1 , . . . , Xn ]}.
La siguiente aplicación es una biyección:
VK : RadK −→ ClK
b 7−→ VK (b)
La aplicación inversa es dada mediante:
IK : ClK −→ RadK
V 7−→ IK (V ) := {f ∈ K[X1 , . . . , Xn ] : f (ζ) = 0, ∀ζ ∈ V }.
Dicho de otra manera, para cada ideal b de K[X1 , . . . , Xn ] se verifica

IK (VK (b)) = b,
mientras
VK (IK (V )) = V, ∀V ∈ ClK .
Demostración. En realidad sólo hay que probar que para cada ideal b de K[X1 , . . . , Xn ]
se verifica √
IK (VK (b)) = b.
Y, dado que tenemos que K[X1 , . . . , Xn ] es noetheriano, basta con que probemos que dado
un conjunto finito de elementos {f1 , . . . , fs } en K[X1 , . . . , Xn ], y dado un elemento adicional
f ∈ K[X1 , . . . , Xn ], si f se anula sobre VK (f1 , . . . , fs ), entonces, existen m ∈ N y existen
g1 , . . . , gs ∈ K[X1 , . . . , Xn ] verificando:
f m := g1 f1 + · · · + g2 f2 .
En realidad, técnicamente, el Truco de Rabinowirsch consiste en trabajar en la localización
K[X1 , . . . , Xn ]f , pero, para no introducir más lenguaje sofisticado en el curso, lo haremos sin
hablar de esa localización.
Para hacerlo de esta manera clásica, introduzcamos una nueva variable Xn+1 y trabajemos en
el anillo de polinomios K[X1 , . . . , Xn , Xn+1 ]. En este anillo de polinomios consideremos el ideal
b0 generado por los siguientes polinomios:
b0 := (f1 , . . . , fs , Xn+1 f − 1).
Dado que f se anula en todos los puntos en los que se anulan simultáneamente f1 , . . . , fs ,
entonces
VK (b0 ) ⊆ Kn+1 ,
es el conjunto vacı́o, esto es, VK (b0 ) = ∅. Podemos aplicar el Nullstellensatz básico (Teorema
5.4.4 anterior) y concluiremos que existen g1 , . . . , gs , gs+1 en K[X1 , . . . , Xn+1 ] tales que
1 = g1 f1 + · · · + g2 f2 + gs+1 (Xn+1 f − 1).
1
Ahora reemplazamos la variable Xn+1 por f en la expresión anterior, observando que f1 , . . . , fs
no contienen esa variable, y obtendremos:
s
!
X 1 1 1
1 := gi (X1 , . . . , Xn , )fi (X1 , . . . , Xn ) + gs+1 (X1 , . . . , Xn , )( f − 1).
i=1
f f f
Es decir, obtenemos la siguiente igualdad (en K[X1 , . . . , Xn ]f ):
s
!
X 1
(5.4.6) 1 := gi (X1 , . . . , Xn , )fi (X1 , . . . , Xn ) .
i=1
f
Sea m una cota superior de los grados de los gi ’s con respecto a la variable Xn+1 . Entonces, es
una mera comprobación el verificar que:
1
hi (X1 , . . . , Xn ) = f m gi (X1 , . . . , Xn , ) ∈ K[X1 , . . . , Xn ].
f
222 5. UNA PRUEBA ELEMENTAL DE NULLSTELLENSATZ DE HILBERT

Por tanto, multiplicando por f m a la identidad (??) obtendremos:


s
!
X
f m := hi (X1 , . . . , Xn )fi (X1 , . . . , Xn ) ∈ b.
i=1

Por tanto, f ∈ b y tenemos la afirmación buscada. 
Corollario 5.4.25. Si K = K es un cuerpo algebraicamente cerrado, el radical y el radical de
Jacobson de todo ideal en K[X1 , . . . , Xn ] coinciden, es decir, para cada ideal a de K[X1 , . . . , Xn ]
se tiene: √ \
a = {m ∈ Spm(K[X1 , . . . , Xn ]) : m ⊇ a}.

Demostración. Un contenido es evidente (⊆), para el otro, supogamos que f está en


todos los ideales maximales que contienen a a. Pero los maximales en K[X1 , . . . , Xn ] están
asociados a puntos. Entonces, si ζ ∈ VK (a), entonces mζ ⊇ a y, por tanto, √ f ∈ mζ . Luego
f (ζ) = 0. Por la versión anterior del Nullstellensatz, concluimos que f ∈ b y la afirmación
queda demostrada.

Observación 5.4.26. El Truco de Rabinowitsch, que no es sino una variante del Nullstellen-
satz, permite introducir un Diccionario Álgebra-Geometrı́a que permitirá traducir indistin-
tamente los objetos geométriocs a objetos descriptibles mediante polinomios y recı́procamente.
Éste es el principio de la Geometrı́a Algebraica y tendrá su influencia en el posterior desarrollo
de la Geometrı́a a lo largo de la segunda mitad del siglo XX y princpios del XXI. Por lo que
a nosotros respecta, nos quedaremos con que esa identificación existe y la usaremos cuando
convenga.
CAPı́TULO 6

Anillos y Módulos Noetherianos: Primeras propiedades

Índice
6.1. Introducción 223
6.2. Diagramas Conmutativos, Complejos y Sucesiones Exactas 224
6.3. El Bi-functor HomR (−, −), localización, y propiedades locales 227
6.4. Anillos y Módulos Noetherianos 229
6.4.1. Condición de cadena ascendente para submódulos e ideales 229
6.4.2. El Teorema de la Base de Hilbert 231
6.5. Descomposición Primaria 234
6.5.1. Un par de resultados técnios peliminares: NAK y otros 234
6.5.2. Descomposicón Primaria: Teorema de Lasker–Noether 235
6.6. Temas Opcionales 239
6.6.1. Snake Lemma 239
6.6.2. Libres, Proyectivos, Inyectivos y Planos (Opcional) 240
6.7. Cuestiones y Problemas 240

6.1. Introducción
Aunque dedicaremos parte de este Capı́tulo a añadir más nociones elementales el objeto fun-
damental es establecer los fundamentos sobre anillos y módulos noetherianos, el Teorema de
la Base de Hilbert y la existencia de decomposición primaria en anillos neotherianos (Teo-
rema de Lasker–Noether). Dejaremos para el siguiente Capı́tulo los aspectos de unicidad en la
descomposición primaria.
El primer enunciado esencial sobre anillos noetherianos es el Teorema de la Base de Hilbert
(Basissatz)1. Nadie discute a Hilbert su prioridad en este sentido, pero es E. Noether quien
establiza la noción y le concede el valor y relevancia que posteriormente tendrá. En aquella
época no todo se publicaba y se sabe por documentos, notas aisladas de seminarios y conferencias
que E. Neother usaba sistemáticamente las condiciones de cadena ascendente y descendente.
En su trabajo de 19212 E. Noether pone en marcha el Álgebra Conmutativa e incorpora a
ella las nociones de noetherianidad como nociones centrales. La influencia de Noether en el
futuro desarrollo del Álgebra Conmutativa (de la que la podemos considerar como fundadora)
se fundamentará a través de su propia obra, pero también a través de muchos de sus alumnos
como W. Krull3. Dedicaremos la Sección 6.4 a definir y establecer las propiedades más básicas
de los anillos y módulos noetherianos.
No es menos desdeñable el famoso Teorema de Lasker–Noether. Este resultado que generaliza
la factorización a través de al descomposición primaria de ideales, fue probado por el alumno
de D. Hilbert (y famoso jugador de ajedrez, a quien le ineteresaban más los tableros que las
matemáticas) E. Lasker en 1905 4 para anillos de polinomioas y anillos de series de potencias
formales. Fue, sin embargo, E. Noether quien lo generalizó a todo anillo y módulo verificando

1
D. Hilbert, Über theorie der Algebraischen Formen. Math. Ann. 36 (1890), 473–534.
2
E. Noether, Idealtheorie in Ringbereichen, Math. Annalen 83 (1921) 24–66.
3
Véanse, por ejemplo, sus contribuciones en:
• W. Krull, Die Idealtheorie in Ringen ohne Endlicheitsbedingungen, Mathematische Annalen 10
(1929), 729744.
• W. Krull, Idealtheorie, Springer, 1935.

4
E. Lasker, Zur Theorie der Moduln und Ideale, Math. Ann. 60 (1905), 19116.

223
224 6. NOETHERIANOS

las condiciones de cadena ascendente en su trabajo de 1921 ya citado. Dedicaremos la Sección


6.5 a establecer esta versión de Noether de la descomposición primaria.

6.2. Diagramas Conmutativos, Complejos y Sucesiones Exactas


Comencemos con una noción básica de Combinatoria.
Definición 79 (Grafo orientado). Un grafo orientado es un par G := (V, E), donde V es un
conjunto (cuyos elementos se denominan vértices o nodos) y E ⊆ V 2 es una relación (cuyos
elementos se denominan aristas). Un camino en un grafo orientado es una sucesión finita de
vértices
ν1 , . . . , νn ,
de tal modo que (νi , νi+1 ) ∈ E. En ocasiones, el camino se describe mediante la notación:
ν1 → ν2 → · · · → νn .
Un ciclo es un camino que comienza y termina en el mismo nodo.
Un grafo con pesos en un conjunto F es un par (G, A), donde G := (V, E) es un grafo y
A : E −→ F es una aplicación que asigna a cada arista (ν1 , ν2 ) un elemento A(ν1 , ν2 ) ∈ F .
Observación 6.2.1. Usualmente, en Combinatoria, se tratan los grafos G := (V, E) para los que
el conjunto de vértices V es finito. Sin embargo, esta restricción es, a veces, poco enriquecedora.
Por ejemplo, considerando V := N2 y E formado por los pares (µ1 µ2 ) dados mediante la
propiedad µ1 ≤deg−lex µ2 es un grafo orientado definido por una relación de orden.
Es decir, toda relación de orden ≤ sobre un conjunto V , define un grafo orientado (V, ≤).
Recı́procamente todo grafo orientado permite definir una relación sobre el conjunto de sus
vértices que no siempre es relación de orden salvo que añadamos bulces (self–lopps) de la forma
(x, x) y que no haya ciclos con más de un nodo.
Otros ejemplos sintomáticos de grafos orientados son los sistemas dinámicos formados por un
par (M, f ) donde M es una variedad y f : M −→ M es un difeomorfismo. esto permite
introducir un grafo (M, Gr(f )), donde Gr(f ) es el grafo de f .
Definición 80 (Diagrama en la categorı́a de R−módulos). Un diagrama en la categorı́a
de R−módulos MR en un grafo con pesos (G, A), donde G = (V, E), los vértices en V son
R−módulos y la asignación A a las aristas, satisface:
∀(M, N ) ∈ E, A(M, N ) ∈ HomR (M, N ).
Un diagrama conmutativo en la categorı́a de R−módulos es un diagrama (G, A), donde G =
(V, E) si verifica los siguiente:
dados dos caminos en el grafo:
N1 → N2 → · · · → Nn ,
y
M1 → M2 → · · · → Mm ,
con el mismo punto inicial y final (M1 = N1 , Mm = Nn ) y dadas las asignaciones de morfismos:
fi := A(Ni , Ni+1 , 1 ≤ i ≤ n − 1, gj := A(Mj , Mj+1 ), 1 ≤ j ≤ m − 1,
se tiene
fn−1 ◦ fn−2 ◦ · · · ◦ f1 = gm−1 ◦ gm−2 ◦ · · · ◦ g1 ,
donde ◦ quiere decir, como siempre, composición.

Notación 6.2.2. Usualmente se usan los sı́mbolos o  para representar la conmutatividad


de una diagrama. Ası́a la propiedad que define la conmutatividad de un diagrama se puede
escribir mediante el dibujo siguiente:

f2 fn−3 fn−2
N2 −−−−−→ ··· −−−−−−−−→ Nn−2 −−−−−−−−→ Nn−1
% f1 fn−1 &
M1 = N1 M m = Nm
& g1 gm−1 %
M2 −−−−−→
g2 ··· −−−−−−−−→
gn−3 Mm−2 −−−−−−−−→
gn−2 Mm−1
6.2. DIAGRAMAS CONMUTATIVOS, COMPLEJOS Y SUCESIONES EXACTAS 225

Ejemplo 6.2.3 (Diagrama Conmutativo de los Teoremas de Isomorfı́a). Veamos algunos ejem-
plos sencillos de diagramas conmutativos asociados a los Teoremas de Isomorfı́a de R−módulos
discutidos en Capı́tulos anteriores.
• Primer Teorema de Isomorfı́a: Consideremos un morfismo de R−módulos f :
M → N . Consideremos M/ker(f ) el cociente por el núcleo, sea π : M −→ M/ker(f )
la proyección canónica y sea i : Imf (f ) −→ N la inclusión de la imagen en N . El
Primer Teorema de Isomorfı́a afirma que existe un único isomorfismo fe : M/ker(F ) −→
Im(f ) que hace conmutativo el diagrama siguiente:
f
M −→ N
π ↓ ↑ i
M/ker(f ) −→ Im(f )
fe
• Segundo Teorema de Isomorfı́a: Consideramos N ⊆ L dos submódulos de M .
Como L/N es submódulo de M/N tenemos tres proyecciones:
π1 : M −→ M/N, π2 : M −→ M/L, π2 : M/N −→ (M/N )/(L/N ).
e : M/L −→
El Segundo Teorema de Isomorfı́a afirma que existe un único isomorfismo π
(M/N )/(L/N ) haciendo conmutativo el siguiente diagrama:
π1
M −→ M/N
π2 ↓ ↓ π3
M/L −→ (M/N )/(L/N )
π
e
• Tercer Teorema de Isomorfı́a: Consideramos N1 , N2 dos submódulos de un
R−módulo M . Tenemos los morfismos siguientes: i : N1 −→ N1 + N2 dado como la
inclusión, tenemos que N1 ∩N2 es submódulo de N1 y, por tanto, tenemos la proyección
π1 : N1 −→ N1 /(N1 ∩ N2 ) y, finalmente, N2 es submódulo de N1 + N2 con lo que
tenemos la proyección π2 : N1 + N1 −→ (N1 + N2 )/N2 . El Tercer Teorema de Iso-
morfı́a afirma que existe un único isomorfismo de R−módulos ei : N1 /(N1 ∩ N2 ) −→
(N1 + N2 )/N2 haciendo conmutativo el siguiente diagrama:
i
N1 −→ N1 + N2
π1 ↓ ↓ π2
N1 /(N1 ∩ N2 ) −→ (N1 + N2 )/N2
ei

Definición 81 (Complejos de R−módulos). Se denomina complejo de R−módulos a todo


diagrama dado como una secuencia (sub-indicada por Z o N, según el caso) de módulos y
morfismos:
di di+1 di+2
C := · · · Mi−−−−−→ Mi+1
−−−−−−−→ M −−−−−−−→ · · · ,
i+2
de tal modo que di+1 ◦ di (o, equivalentemente, Im(di ) ⊆ ker(di+1 )). A los morfismos di se les
denomina morfismos frontera5.

Definición 82 (Sucesiones exactas de R−módulos). Las sucesiones exactas de R−módulos


son los complejos de R−módulos:
di di+1 di+2
C := · · · Mi−−−−−→ Mi+1
−−−−−−−→ M −−−−−−−→ · · · ,
i+2
que verifican:
Im(di+1 ) = ker(di ), ∀i.
5La terminologı́a viene de la Topologı́ Algebraica y los morfismos frontera inducidos por triangulaciones,
ası́ como los términos ciclo, borde para representar, respectivamente ker(di ) e Im(di+1 ), permitiendo definir los
grupos de homologı́a Hi (X) := ker(di )/Im(di+1 ).
226 6. NOETHERIANOS

Se llaman sucesiones exactas cortas a las sucesiones exactas de la forma:


0 f g
0 −→ M −−−−−→ M −−−−→ M 00 −→ 0,
Donde 0 es el R−módulo nulo, y 0 −→ M 0 , M 00 −→ 0, son los morfismo obvios (y, por ello,
no se representan).

Observación 6.2.4 (Primeras Observaciones). Como primeros comentarios obvios, supong-


amos que tenemos una sucesión exacta de R−módulos:
0 f g
0 −→ M −−−−−→ M −−−−→ M 00 −→ 0,
• Como es exacta y 0 −→ M 0 es el morfismo nulo 0, Im(0) = ker(f ) = 0 significa que
necesariamente f ha de ser inyectiva. Algunos autores usan la notación M 0 ,→ M
• Como es exacta y M 00 −→ 0 es el morfismo nulo 0, ker(0) = M 00 = Im(g) significa
que f ha de ser necesariamente suprayectiva. Algunos autores usan M  M 00 .
• Finalmente, es una forma distinta de escribir que
M/f (M 0 ) ∼
= M 00 .
• En el caso de espacios vectoriales de dimensión finita, una sucesión exacta como la
anterior, implicarı́a que M ∼= M 0 ⊕ M 00 . Esto, que es cierto para espacios vectoriales,
no es cierto para módulos. Baste con observar la s.e.c. siguiente:
f g
0 −→ 2Z−−−−−→ Z−−−−→ Z/2Z −→ 0,
donde f es la inclusión y g es la proyección. Clarmente Z 6= ∼ 2Z ⊕ (Z/2Z), porque Z
es libre de torsión y 2Z ⊕ (Z/2Z) tiene torsión.

Ejemplo 6.2.5 (Núcleo y Co-núcleo y s.e.c.). Dado un morfismo de R−módulos f : M −→


N , tenemos una sucesión exacta de la forma siguiente:
i f π
0 −→ ker(f )−−−−−→ M −−−−−→ N −−−−−→ Coker(f ) −→ 0,
donde i es la inclusión y π es la proyección obvia.

Proposición 6.2.6. Dado un complejo de R−módulos


di di+1 di+2
C := · · · Mi−−−−−→ Mi+1
−−−−−−−→ M −−−−−−−→ · · · ,
i+2
entonces C es exacto si y solamente si para cada i, la sucesión exacta corta siguiente es exacta:
ki di
Ci := 0 −→ ker(di )−−−−−−→ Mi−−−−−→ ker(di+1 ) −→ 0,
donde ki es la inclusión canónica.
Demostración. Si la sucesión C es exacta, entonces Im(di ) = ker(di+1 ) para cada i.
Claramente, Im(ki ) = ker(di ) por definición, ası́ que Ci es una sucesión exacta corta. El
recı́proco es igualmente obvio. 

Definición 83 (Functores exactos). Un functor F de la categorı́a de R−módulos MR en sı́


misma, se denomina exacto si transforma sucesiónes exactas en sucesiones exactas.
A la vista de la Proposición anterior, un functor es exacto si y solamente si transforma suce-
siones exactas cortas en sucesiones exactas cortas.

Definición 84 (Functor exacto a izquierda). Un functor F de la categorı́a de R−módulos


MR en sı́ misma, se denomina exacto si verifica las condiciones siguientes:
• En el caso covariante, F transforma sucesiones exactas cortas
0 −→ M 0 −→ M −→ M 00 −→ 0
en sucesiones exactas
0 −→ F (M 0 ) −→ F (M ) −→ F (M 00 ).
6.3. EL BI-FUNCTOR HomR (−, −), LOCALIZACIÓN, Y PROPIEDADES LOCALES 227

• En el caso contravariante, G transforma esa misma sucesión exacta corta en la sucesión


exacta
0 −→ G(M 00 ) −→ G(M ) −→ G(M 0 ).

6.3. El Bi-functor HomR (−, −), localización, y propiedades locales


Proposición 6.3.1. Dados R−módulos M y N , los functores HomR (M, −) y HomR (−, N )
son exactos a izquierda.
Demostración. Hagamos la prueba para HomR (M, −) y dejamos el otro como Ejercicio.
Consideremos una sucesión exacta de R−módulos:

0 f g
0 −→ N −−−−−→ N −−−−→ N 00 −→ 0,
Tenemos la sucesión siguiente:
HomR (M, f ) HomR (M, g)
0 −→ HomR (M, N 0 )−−−−−−−−−−−−−−−−−→ HomR (M, N )−−−−−−−−−−−−−−−−→ HomR (M, N 00 ),
donde el morfismo que sale del módulo nulo es el obvio morfismo nulo. Tenemos, además, los
morfismos:
HomR (M, f ) : HomR (M, N 0 ) −→ HomR (M, N )
h 7−→ f ◦ h.
y
HomR (M, g) : HomR (M, N ) −→ HomR (M, N 00 )
h 7−→ g ◦ h.
Para ver que HomR (M, f ) es inyectiva, sea h ∈ HomR (M, N 0 ) tal que HomR (M, f )(h) = 0.
Esto significa que ∀m ∈ M , f ◦ h(m) = f (h(m)) = 0. Como f es inyectiva, esto implica
h(m) = 0, ∀m ∈ M . Con lo que HomR (M, f ) es monomorfismo y tenemos exactitud en el nodo
HomR (M, N 0 ).
De otro lado, observamos que HomR (M, g)◦HomR (M, f ) = HomR (M, g◦f ) = HomR (M, 0) =
0, con lo que
Im(HomR (M, f )) ⊆ ker(HomR (M, g)).
De otro lado, sea h ∈ HomR (M, N ) tal que HomR (M, g)(h) = g ◦ h = 0. Por tanto, Im(h) ⊆
ker(g) = Im(f ). Además, f era inyectiva, luego la siguiente es una aplicación bien definida :
h0 : M −→ N0
m 7−→ f −1 (h(m)).
Es fácil comprobar que es morfismo de R−módulos y más fácil aún verificar que HomR (M, f )(h0 ) =
h. 

A partir de la localización también podemos definir un functor del modo siguiente: Sea S ⊆ R
un sistema multiplicativo en un anillo R y sea f : M 0 −→ M un morfismo entre dos R−módulos.
Definamos:
S −1 : S −1 M 0 −→ S −1 M
m f (m)
s 7−→ s .
Se tiene:
Proposición 6.3.2. El functor S −1 es un functor covariante exacto de la categorı́a de R−módulos.
En particular, si N y P son submódulos de un R−módulo M , se tiene:
• S −1 (N + P ) = S −1 N + S −1 P ,
• S −1 (N ∩ P ) = S −1 N ∩ S −1 P ,
• Los S −1 R−módulos S −1 (M/N ) y S −1 M/S −1 N son isomorfos.
Demostración. Para probarlo, es evidente comprobar que S −1 f es morfismo de S −1 R−módulos
y que S −1 (g ◦f ) = S −1 g ◦S −1 f , para cualesquiera dos morfismos f : M 0 −→ M , g : M −→ M 00 .
También es claro que S −1 IdM = IdS −1 M . Nos queda solamente analizar la exactitud como
functor. Para ello, consideremos una sucesión exacta de R−módulos:

0 f g
0 −→ M −−−−−→ M −−−−→ M 00 −→ 0,
228 6. NOETHERIANOS

Tenemos la sucesión siguiente:


−1
0 S f S −1 g
0 −→ S −1 M −−−−−−−−−→ S −1 M −−−−−−−−→ S −1 M 00 ) −→ 0,
Comencemos observando que ker(S −1 f ) = 0. Para ello, si m
s ∈ S −1 M 0 es tal que
m f (m)
S −1 f (
)= = 0,
s s
es porque existe t ∈ S tal que t(f (m) − s0) = 0, es decir, f (tm) = 0 y, como f es inyectiva,
0
tm = t(m1 − s0) = 0 o lo que es lo mismo m s = 0 en M .
Seguidamente, es claro que 0 = S (g ◦ f ) = S g ◦ S −1 f = 0, con lo que Im(S −1 f ) ⊆
−1 −1

ker(S −1 g). Supongamos ahora m s ∈ ker(S


−1
g) ⊆ S −1 M . Esto significa que
m g(m)
S −1 g( )= = 0,
s s
es decir, existe t ∈ S ⊆ R tal que t(g(m)1 − s0) = tg(m) = 0. Por tanto, g(tm) = 0 y
tm ∈ ker(g) = Im(f ). Es decir, existe n ∈ M 0 tal que f (n) = tm. Considero, entonces,
−1
n
ts ∈ S M 0 (que tiene sentido porque t, s ∈ S y S es un sistema multiplicativamente cerrado).
Tendremos:
n f (n) tm m
S −1 f ( ) = = = ∈ Im(S −1 f ).
ts ts ts s
Con esto tenemos la exactitud en el nodo S −1 M . Resulta muy sencillo probar que S −1 g es un
00
epimorfismo. Para ello, sea ms ∈ S −1 M 00 un elemento cualquiera. Como g es suprayectiva,
00 00
existe m ∈ M tal que g(m) = m00 . Entonces, resulta claro que S −1 g( ms ) = g(m) s = ms ∈
Im(S −1 g).
Las otras propiedades descritas en el enunciado son sencillas de probar (como S −1 (N + P ) =
S −1 N + S −1 P ) o son consecuencia de los Teoremas de Isomorfı́a combinados con la exactitud
como functor (como S −1 (N ∩ P ) = S −1 N ∩ S −1 P o S −1 (M/N ) ∼ = S −1 M/S −1 N ). 
Corollario 6.3.3. Similares propiedades se verifican para ideales en un anillo. Es decir,
i) Para cada ideal a de R, S −1 a es ideal de S −1 R. De hecho, S −1 a es el ideal de S −1 R
generado por { a1 : a ∈ a}. Nótese que si S ∩ a 6= ∅, entonces S −1 a = S −1 R.
ii) Para dos ideales a, b de R, se tiene
• S −1 (a + b) = S −1 a + S −1 b,
• S −1 (a ∩ b) = S −1 a ∩ S −1 b
iii) Hay una biyección entre los ideales primos de R que tienen intersección vacı́a con S
y Spec(S −1 R):
S −1 : {p ∈ Spec(R) : p ∩ S = ∅} −→ Spec(S −1 R)
p 7 →
− S −1 p.
iv) La anterior porpiedad no es, en general, cierta cuando se trata de ideales maxi-
males. De hecho, los ideales maximales de S −1 R son las localizaciones S −1 m, donde
m ∈ Spec(R) es maximal entre los primos con intersección vacı́a con S (pero no
necesariamente maximal en R).
Demostración. Las propiedades (1) y (2) son mera reescritura de la anterior Proposición.
0
La propiedad (3) tiene un poco más de interés. Tomemos xs , xs0 ∈ S −1 R tales que
x x0 xx0 y
0
= 0
= ∈ S −1 p,
ss ss r
donde y ∈ p, r ∈ S. Entonces, existe y t ∈ S tal que t(xx0 r − yss0 ) = 0. Como y ∈ p, también
se tiene tyss0 ∈ p y, por tanto, trxx0 ∈ p. Pero tr ∈ S \ p, luego xx0 ∈ p y p es primo en R. De
esto concluimos que x ∈ p o x0 ∈ p, lo que, obviamente, implica
x x0
∈ S −1 p ∨ 0 ∈ S −1 p,
s s
y S −1 p ∈ Spec(S −1 R).
Para la suprayectividad, se q ∈ Spec(S −1 R) un ideal primo y sea p := qc ⊆ R su contracción.
Obviamente, tenemos que p ∈ Spec(R), S −1 p ⊆ q y, en particular, p ∩ S = ∅. Comprobemos
6.4. ANILLOS Y MÓDULOS NOETHERIANOS 229

que el contenido es, de hecho, una igualdad. Para ello, sea ys ∈ q. Entonces, sy s ∈ q (por ser
c −1 −1
ideal) e y ∈ q = p. Con ello, es claro que S p = q y S es suprayectiva.
En cuanto a la inyectividad, supongamos que p, p0 ∈ Spec(R) son tales que S −1 p = S −1 p0 .
Probemos, entonces, que p ⊆ p0 (el contenido recı́proco es análogo). Dado x ∈ p, se tiene que
0
−1
x
1 ∈ S p = S −1 p0 , por cuanto existen x0 ∈ p0 , s0 ∈ S tales que x1 = xs0 o, según la definción,
existe t ∈ S, tal que t(xs0 − x0 ) = 0. Pero tx0 ∈ p0 , con lo que concluimos txs = (ts)x ∈ p0 y
ts ∈ S, ts 6∈ p0 . Por tanto, x ∈ p0 y tenemos probado uno de los contenidos. 
Observación 6.3.4. También se podrı́a haber descrito la prueba anterior observando el isor-
mofismo de S −1 R−módulos :
S −1 (R/p) ∼= S −1 R/S −1 p,
que se da por la exactitud del functor S −1 . Es fácil verificar que se trata de un ismorfismo de
anillos. Es más, como S ∩ p = ∅, si consideramos S := {s + p : s ∈ S} tenemos un sistema
−1
multiplicativamente cerrado de R/p que es un dominio de integridad. Por tanto, S (R/p) está
contenido en el cuerpo de fracciones de R/p y es, también, dominio de integridad. Finalmente,
−1
observemos que S (R/p) es isomorfo, como anillo, a S −1 (R/p), con lo que S −1 p ∈ Spec(S −1 R).
Corollario 6.3.5. Para cada ideal p ∈ Spec(R), el anillo Rp es un anillo local, cuyo único
ideal maximal es el ideal generador por p en Rp y que denotaremos mediante pRp .
Además, los ideales primos de Rp están en biyección con los ideales primos de R contenidos en
p.
Por último, el anillo cociente Rp /pRp es un cuerpo y se da el isomorfismo:
(Rp /pRp ) ∼
= qf (R/p),
donde qf (R/p) es el cuerpo de fracciones del dominio de integridad R/p.
Definición 85 (Localización en un primo). Al anillo local Rp se le denomina localización
de R en p y, para cada R−módulo M , llamaremos al Rp − módulo Mp , la localización de M en
p.

Se llaman propiedades locales a aquellas propiedades de los módulos que se satisfacen si y


solamente si se satisfacen para cada localización. Son ejemplos de propiedades locales las
siguientes:
Proposición 6.3.6 (Ser cero es una propiedad local). Las siguientes propiedades son
equivalentes para cada R−módulo M :
i) M = 0,
ii) Mp = 0, ∀p ∈ Spec(R),
iii) Mm = 0, ∀m ∈ Spm(R).
Para un R−módulo M cualquiera, se define el soporte de M , Supp(M ) del modo siguiente:
Supp(M ) := {p ∈ Spec(R) : Mp 6= 0}.
En particular, M 6= 0 si y solamente si Supp(M ) 6= ∅.
Demostración. Probar (1) ⇒ (2) ⇒ (3) es obvio porque la localización es exacta y
todo maximal es primo. Para probar (3) ⇒ (1), supongamos que M 6= 0, pero Mm = 0,
∀m ∈ Spm(R). Si M 6= 0, entonces, ha de existir m ∈ M , con m 6= 0. Consideremos el
anulador de ese elemento no nulo: a := Ann(m) := {x ∈ R : xm = 0}. Se trata de un ideal
de R tal que a ⊆/ R. En caso contrario, 1 ∈ a = Ann(m) y, m = 1m = 0. Por tanto, existe
un maximal m ∈ Spm(R) tal que a ⊆ m. Pero, por (3), Mm = 0, lo que significa m 1 = 0 y
esto equivale a ∃t ∈ S = R \ m tal que tm = 0. Luego t ∈ R \ Ann(m) y tm = 0, llegando a
contradicción. 

6.4. Anillos y Módulos Noetherianos


6.4.1. Condición de cadena ascendente para submódulos e ideales. En el Capı́tulo
?? hicimos referencia al uso del Lema de Zorn para probar que todo anillo posee, al menos, un
ideal maximal. A partir de aquı́, nos ocuparemos solamente de anillos y módulos noetherianos
para los cuales basta con una versión más suave el Lema de Zorn, conocido como el Axioma de
Elección Dependiente.
230 6. NOETHERIANOS

Definición 86 (Axioma de Elección Dependiente). Sea X un conjunto no vacı́o y R ⊆


X × X una relación. Supongamos que R satisface la siguiente propiedad:
∀a ∈ X, ∃b ∈ X, aRb.
Entonces, existe una sucesión {xn : n ∈ N} ⊆ X de tal modo que xn Rxn+1 , ∀n ∈ N.

Proposición 6.4.1 (Módulo Noetheriano). Sea R un anillo y M un R−módulo. Las sigu-


ientes propiedades son equivalentes:
i) Todo submódulo de M es finitamente generado.
ii) Los submódulos de M satisfacen las “condición de cadena ascendente”, es decir, dada
una cadena ascendente de submódulos de M :
N0 ⊆ N1 ⊆ N2 ⊆ · · · ⊆ Nm ⊆ · · · ,
entonces existe un entero n ∈ N a partir del cual la cadena se establiza, es decir,
Nm = Nn , ∀m ≥ n.
iii) Todo conjunto no vacı́o de submódulos de M posee elemento maximal para la inclusión.
Demostración. • (1) ⇒ (2): Nótese que si tenemos una cadena ascendente:
N0 ⊆ N1 ⊆ N2 ⊆ · · · ⊆ Nm ⊆ · · · ,
S
la unión N := i∈N Ni ⊆ M es también un submódulo de M y, por (1), será
finitamente generado. Una colección finita {n1 , . . . , nr } de generadores de N debe
pertenecer a algún submódulo Nn de M (simplemente porque todo subconjunto finito
de naturales posee elemento maximal). Entonces, N = Nn y Nm = Nn , ∀m ≥ n.
• (2) ⇒ (3): Aquı́ usaremos el Axioma de Elección Dependiente del modo siguiente. Sea
X un subconjunto no vacı́o de submódulos de M y supongamos que no posee elemento
maximal. Entonces, verifica que
0
∀N ∈ X, ∃N ∈ X, N ⊆
/ N .

Tomando R =⊆
/ como la relación sobre X, concluiremos que existe una cadena ascen-
dente:
N0 ⊆/ N1 ⊆ / N2 ⊆
/ ··· ⊆
/ Nm ⊆/ ··· ,
contradiciendo (2).
• (3) ⇒ (1): Sea N un submódulo de M . Consideremos el conjunto XN formado por
todos los submódulos L de N que son finitamente generados. Como (0) es submódulo,
finitamente generado, y (0) ⊆ N , entonces (0) ∈ X 6= ∅. Por tanto, X posee una
elemento maximal para la inclusión. Sea N0 ese elemento maximal. Tenemos que
N0 ⊆ N . Si N0 = N habremos concluido. Supongamos, por tanto, que N0 ⊆ / N.
Entonces, existe n ∈ N \ N0 y consideremos el submódulo N1 := N0 + hni ⊆ N .
Claramente N1 ∈ X y N0 ⊆ / N1 , con lo que llegarı́amos a contradicción.


Observación 6.4.2. Usualmente la prueba de la equivalencia entre estas tres propiedades


(esencialmente la prueba de (2) ⇒ (3) o, equivalentemente, la prueba de (2) → (1) se hace sin
mostrar la relevancia del Axioma de Elección Dependiente. Este aspecto fue destacado por W.
Hodges, en su trabajo:
W. Hodges, Six impossible rings, J. Algebra 31 (1974), 218-244.
Este trabajo ha generado bastante controversia y nuestra elección simplifica por la vı́ de elegir
un Axioma más débil.

Idénticamente a la anterior Proposición, como todo anillo es R−módulo sobre sı́ mismo y sus
submódulos son sus ideales, tenemos el correspondiente enunciado para anillos:
Proposición 6.4.3 (Anillo Noetheriano). Sea R un anillo. Las siguientes propiedades son
equivalentes:
i) Todo ideal de R es finitamente generado.
6.4. ANILLOS Y MÓDULOS NOETHERIANOS 231

ii) Los ideales de R satisfacen las “condición de cadena ascendente”, es decir, dada una
cadena ascendente de ideales de R:
a0 ⊆ a1 ⊆ a2 ⊆ · · · ⊆ am ⊆ · · · ,
entonces existe un entero n ∈ N a partir del cual la cadena se establiza, es decir,
am = an , ∀m ≥ n.
iii) Todo conjunto no vacı́o de ideales de R posee elemento maximal para la inclusión.
En particular, todo anillo que satisface una cualquiera de esas propiedades equivalentes posee
al menos un ideal maximal.

Definición 87. Se tienen las nociones siguientes:


i) Un R−módulo M se llama noetheriano si satisface una cualquiera de las propiedades
equivalentes descritas en la Proposición 6.4.1 anterior.
ii) Un anillo R se llama noetheriano si es noetheriano como módulo sobre sı́ mismo,
esto es, si satisface una cualquiera de las propiedades equivalentes descritas en la
Proposición 6.4.3 anterior.

Ejemplo 6.4.4. Algunos ejemplos elementales e inmediatos:


• Los cuerpos son, obviamente, anillos noetherianos.
• Los dominios de ideales principales son anillos noetherianos (todos sus ideales son
finitamente generados).
• Los espacios vectoriales son finitamente generados si y solamente si son neotherianos
(todos sus subespacios son finitamente generados).
• Los grupos abelianos libres finitamente generados son noetherianos: sus submódulos
son libres de torsión (y, por tanto, libres) y finitamente generados
• Submódulos de módulos noetherianos son noetherianos porque los submódulos de un
submódulo son submódulos del módulo original.
• Cocientes de módulos noetherianos son noetherianos: para verlo basta con usar la
propiedad (3) de la Proposición 6.4.1: Recuérdese que los submódulos de un cociente
M/N están biyectados con los submódulos de M que contienen a N y que esa biyección
preserva la inclusión.
• Cocientes de anillos noetherianos son también noetherianos.
Pero necesitamos de mecanismos adicionales para mostrar ejemplos más aleborados de anillos
y módulos noetherianos.

6.4.2. El Teorema de la Base de Hilbert.


Proposición 6.4.5. Dada una sucesión exacta corta de R−módulos:
f g
0 −→ M 0 −→ M −→ M 00 −→ 0,
entonces, M es noetheriano si y solamente si M 0 y M 00 son noetherianos.
Demostración. Es claro que si M es noetheriano, M 0 también lo es dado que es isomorfo
a un submódulo de M . De otro lado, M 00 es isomorfo a un cociente de M por un submódulo
(de heho, M 00 ∼
= M/M 0 ). Por tanto, sólo hay que probar la otra implicación.
Comencemos tomando un submódulo N de M y sea g(N ) submódulo de M 00 . Como M 00 es
noetheriano, entonces, existen n1 , . . . , np ∈ N tales que g(n1 ), . . . , g(np ) generan g(N ) como
submódulo de M 00 . De otro lado, f −1 (N ) es un submódulo de M 0 . Como M 0 es noetheriano,
posee un conjunto finito mp+1 , . . . , ms de generadores y considero np+1 = f (mp+1 ), . . . , ns :=
f (ms ) elementos de N . Probemos que el conjunto X := {n1 , . . . , np , np+1 , . . . , ns } genera N
como submódulo de M . Para ello, consideremos un elemento n ∈ N y el submódulo NX ⊆ N
generado por X. Tenemos que g(n) ∈ g(N ) y, por tanto, existen x1 , . . . , xp ∈ R tales que
g(n) = x1 g(n1 ) + · · · + xp g(np ).
En particular, tendremos que g(n − (x1 n1 + · · · + xp np )) = 0, lo que significa que n − (x1 n1 +
· · · + xp np ) ∈ Keg(g) = Im(f ). Pero n − (x1 n1 + · · · + xp np ) ∈ N , luego existe y ∈ f −1 (N ) tal
232 6. NOETHERIANOS

que f (y) = n − (x1 n1 + · · · + xp np ). Pero mp+1 , . . . , ms generan f −1 (N ). Por tanto, existen


xp+1 , . . . , xs ∈ R tales que y = xp+1 mp+1 + · · · + xs ms . Esto último implica que
n − (x1 n1 + · · · + xp np ) = xp+1 f (mp+1 ) + · · · + xs f (ms ).
Esto último también se resscribe:
n = x1 n1 + · · · + xp np + xp+1 np+1 + · · · + xs ns ,
y queda probado que n ∈ NX , con lo que N = NX y M es noetheriano. 

Proposición 6.4.6. Si R es un anillo noetheriano, entonces un R−módulo es noetheriano si


y solamente si es finitamente generado como R−módulo.
Demostración. Es claro que si M es un R−módulo noetheriano es finitamente generado
(todos sus submódulos lo son). Por tanto, sólo hay que probar el recı́proco.
Ası́, sea M un R−módulo finitamente generado, suponiendo que R es noetheriano. Supongamos
que M es generado por n elementos. Probaremos, por inducción en n, que M es un R−módulo
noetheriano.

Para el caso n = 1, si M está generado por un sólo elemento, entonces M es isomorfo como
R−módulo a un cociente R/a, donde a es un ideal de R. Entonces, aplicando la anterior
proposición, habremos concluido que M es un R−módulo noetheriano a través de la sucesión
exacta:
0 −→ a −→ R −→ R/a −→ 0.
Supongamos que el resultado es cierto para toso los R−módulos que se pueden generar con a
lo sumo n − 1 elementos. Sea {m1 , . . . , mn } un conjunto de elementos de M que lo generan
como R−módulo. Consideremos el submódulo M 0 de M generado por {m1 , . . . , Mn−1 }. Por
hipótesis inductiva, M 0 es noetheriano. Pero, además podemos considerar la sucesión exacta
corta siguiente:
i π
0 −→ M 0 −→ M −→ M/M 0 −→ 0,
donde i es la inclusión canónica y π es la proyección canónica. Además, es fácil observar que
M/M 00 está generado, como R−módulo, por la clase {xn +M 0 }. Aplicando el caso n = 1 tenemos
que M/M 0 es también noetheriano y, finalmente, aplicando la Proposición 6.4.5 concluiremos
que M ha de ser noetheriano también. 

Proposición 6.4.7. Sea S un sistema multiplicativo de un anillo R. Si R es neotheriano,


también es neotheriano su localización S −1 R. En particular, para cada ideal primo p ∈ Spec(R)
se un anillo noetheriano, la localización Rp es anillo local noetheriano.
Demostración. Basta con recordar la relación entre los ideales de S −1 R y los ideales de
R que no intersecan S. Ası́, si q es un ideal de S −1 R, su contracción qc ⊆ R es un ideal de R y
es finitamente generado cuando R es neotheriano. Si q está generado por {x1 , . . . , xr }, entonces
q estará generado por {x1 /1, . . . , xr /1} y será finitamente generado. 

Teorema 6.4.8 (Hilbert Basissatz). Si R es un anillo noetheriano, entonces R[X] también


es un anillo noetheriano.
Demostración. Para probar este Teorema tomemos un ideal a en R[X] y consideremos
el conjunto b ⊆ A siguiente:
Un elemento a ∈ R están en b si y solamente si existe un polinomio f := an X. + an−1 X n−1 +
· · · + ao ∈ a tal que an = a. Es decir, el conjunto formado por todos los coeficientes dorectores
de elementos en a. Es fácil comprobar que b es un ideal de R y, por ser R noetheriano,
es finitamente generado. Consideremos {a1 , . . . , ap } un conjunto finito de generadores de b.
Supongamos f1 , . . . , fp ∈ a tales que el coeficiente director de fi es ai . Es decir, para cada i,
1 ≤ i ≤ p se tiene:
fi := ai X ni + hi ,
con deg(hi ) ≤ ni . Sea N := max{n1 , . . . , np } el máximo de esos grados y consideremos la
intersección aN := a ∩ R[X]N , donde R[X]N son los polinomios en R[X] de grado a lo sumo N .
6.4. ANILLOS Y MÓDULOS NOETHERIANOS 233

Claramente, R[X]N es un R−módulo finitamente generado y, por tanto, noetheriano. Además,


a∩R[X]N es un submódulo de R[X]N , luego es finitamente generado. Consideremos {g1 , . . . , gs }
un conjunto de generadores de a ∩ R[X]N como R−módulo. Entonces, el conjunto:
F := {f1 , . . . , fp } ∪ {g1 , . . . , g2 },
generan a como ideal en R[X]. Denotemos por (F ) el ideal generador por F . Supongamos
que existe h ∈ a un elemento que no está en el ideal (F ). Supongamos, además, que h es de
grado mı́nimo con esa propiedad. Si deg(h) ≤ N , entonces h ∈ a ∩ R[X]N , luego han de existir
constantes λ1 , . . . , λs ∈ R de tal modo que:
h = λ1 g1 + · · · + λs gs ∈ (F ).
Por tanto, deg(h) > N . De otro lado, supongamos
h := bm X m + bm−1 X m−1 + · · · + b1 X + b0 ,
siendo m el mı́nimo de los grados de los polinomios h ∈ a \ (F ). Es claro que bm ∈ b por lo que
han de existir θ1 , . . . , θp ∈ R tales que
bm = θ1 a1 + · · · + θp ap .
Ahora consideremos el polinomio:
p
X
h1 := h − θi X m−ni fi .
i=1
Es claro que el polinomio h1 ∈ a. De otro lado, h1 6∈ (F ) pues, si h1 ∈ (F ), entonces, h ∈ (F ) y
llegarı́amos a contradicción. Pero, además, es claro que el coeficiente de grado m de h1 es dado
por:
bm − (θ1 a1 + · · · + θp ap ) = 0.
En otras palabras, deg(h1 ) ≤ m − 1, contradiciendo la minimalidad de m. Por tanto, no puede
existir ningún h ∈ a \ (F ) y a = (F ), concluyendo que a es finitamente generado. 

Corollario 6.4.9. Si R es un anillo noetheriano, también lo es el anillo de polinomios en un


número finito de variables R[X1 , . . . , Xn ]. En particular, si R es noetheriano tambin lo es toda
R − álgebra finitamente generada, esto es, todo anillo B de la forma R[X1 , . . . , Xn ]/a, donde a
es un ideal de R[X1 , . . . , Xn ].
Demostración. Obvio por inducción. 

Ejemplo 6.4.10. • Todos los anillos de polinomios con coeficientes en un cuerpo K[X1 , . . . , Xn ]
son noetherianos. También lo son los cocientes K[X1 , . . . , Xn ]/a que se denominan
K−álgebras finitamente generadas.
• Todos los anillos de polinomios con coeficientes en dominios de ideales principales son
noetherianos.
• No son noetherianos los anillos de polinomios en una cantidad infinita de variables
K[Xn : n ∈ N].
• Todos los K[V ] , cuando V ⊆ Kn es una variedad algebraica afı́n, son anillos noethe-
rianos.
• Todas las localizaciones de anillos de polinomios K[X1 , . . . , Xn ]p , por ideales primos
p ∈ Spec(K[X1 , . . . , Xn ]) son anillos noetherianos. Los mismo con las localizaciones
K[V ]p , que también son noetherianos.
Obviamente son noetherianos todos los módulos finitamente generados sobre esos anillos.
Ejemplo 6.4.11. Una de las conscuencias inmediatas del Teorema de la Base de Hilbert es que
toda variedad algebraica es intersección de un número finito de hipersuperficies. En particualr,
Si V ⊆ Kn es una variedad algebraica (un cerrado Zariski) dado mediante V (a), siendo a un
ideal en k[X1 , . . . , Xn ], entonces a es finitamente generado y se tiene a = (f1 , . . . , fs ) para
un número finito de elementos f1 , . . . , fs ∈ a. A partir de lo dicho en la Proposición ?? y la
Observación ??, V (a) = V (f1 , . . . , fs ) y, por tanto:
[s
V = V (a) = V (fi ).
i=1
234 6. NOETHERIANOS

6.5. Descomposición Primaria


6.5.1. Un par de resultados técnios peliminares: NAK y otros. Comenzaremos
con unos resultados preliminares. El primero de ellos es un sencidllo resultado, conocido como
el Lema de Nakayama 6 que, como bien indica [Ma, 80], es también debido a Azumaya7 y a
W. Krull. En los ejercicios daremos una versión debida a M.F. Atiyah y basada solamente en
el Teorema de Hamilton-Cayley para módulos finitamente generados sobre un anillo, técnica
concida como el “determinantal trick” (ver Problema 181).

Lema 6.5.1 (NAK, Lema de Nakayama). Sea M un R−módulo finitamente generado, p N


un submódulo de M y a un ideal de R contenido en el radical de Jacobson NR = J (0) de R.
Entonces, si M = aM + N , entonces M = N .
En particular, si M = aM , entonces M = 0.
Demostración. En primer lugar, obśervese que basta con demostrar el enunciado para
el caso particular N = 0. Deducir el caso general del caso N = 0 es inmediato considerando el
módulo cociente M/N .
Razonemos por reducción al absurdo, supongamos M = aM , M es fintamente generado, M 6= 0
y sea n ∈ N el cardinal mı́nimo de un sistema de generadores de M . Nótese que este n existe
porque N es un conjunto bien ordenado y que, por hipótesis, estamos suponiendo n > 1. Sea,
entonces, {m1 , . . . , mn } un sistema generador de M como R−módulo de cardinal minimal.
Dado que M = aM , entonces, mi ∈ aM para cada i. En particular, para cada i, 1 ≤ i ≤ n,
existirán xi,1 , . . . , xi,n ∈ a tales que:
mi = xi,1 m1 + · · · + xi,n mn .
Adicionalmente, esta igualdad se puede escribir mediante:
X
(1 − xi,i )mi := xi,j mj .
j6=i
p
Ahora recordemos la Proposición 4.3.12. Como xi,i ∈ a ⊆ J (0) están en el radical de Jacobson
de R, tenemos que (1 − xi,i ) ∈ R∗ es una unidad en R. Tomando, i = 1, concluiremos que
X
x1 = (1 − x1,1 )−1 xi,j mj ,
j6=i

con lo cual concluimos que x1 están en el submódulo de M generado por {m2 , . . . , mn }. Por
tanto, {m2 , . . . , m : n} es un sistema generador de M de cardinal n − 1 lo que contradice la
minimalidad de n. 

Una de las primeras, obvias, aplicaciones del Lema de Nakayama es mostrar que hay algo muy
similar a una base en el caso de módulos finitamente generados sobre un anillo local.
Proposición 6.5.2. Sea (R, m) un anillo local, M un R−módulo y M/mM visto como R/m−espacio
vectorial. Dados {x1 , . . . , xs } elementos de M tales que sus clases módulo mM generan M/mM
como R/m−espacio vectorial, entonces {x1 , . . . , xs } generan M como R−módulo. En partic-
ular, el cardinal mı́nimo de sistemas de generadores de M como R−módulo coincide con la
dimensión de M/mM como R/m−espacio vectorial.
Demostración. Dados {x1 , . . . , xs } tales que sus clases módulo mM generan M/mM
como R/m−espacio vectorial, sea N el submódulo de M generado por {x1 , . . . , xs }. Claramente
concluiremos que, dado que
M/ (N + mM ) ∼ = (M/mM ) / (N + mM/mM ) = 0,
entonces M = N + mM y, por el Lema de Nakayama. M = N . El resto de las afirmaciones
son obvias. 

Del siguiente resultado omitiremos la prueba que puede seguirse en [AtMc, 69] o [Ra et al., 75]
o en cualquier otro texto básico de Álgebra Conmutativa:
6T. Nakayama, A remark on finitely generated modules, Nagoya Mathematical Journal 3 (1951), 139140.
7G. Azumaya, On maximally central algebras, Nagoya Mathematical Journal 2 (1951), 119150.
6.5. DESCOMPOSICIÓN PRIMARIA 235

Proposición 6.5.3. Se tienen las dos propiedades siguientes para un anillo R:


i) Sean p1 , . . . , pn ∈ Spec(R) ideales primos y sea a un ideal propio contenido en ∪ni=1 pi .
Entonces, existe i tal que a ⊆ pi .
ii) Sean a1 , . . . , am ideales propios de R y sea p un ideal primo que contiene a ∩m i=1 ai .
Entonces, p ⊆ ai para algún i.
iii) Sea a un ideal de R, b0 ∈ Spec(R) y sean b1 , . . . , bn otros ideales de R. Si a ⊆
b0 ∪S
b1 ∪ · · · ∪ bn , entonces existe un subconjunto propio J ⊆ {0, 1, 2, . . . , n} tal que
a ⊆ j∈J bj .

Demostración. Ver las referencias indicadas. 

6.5.2. Descomposicón Primaria: Teorema de Lasker–Noether. Probaremos aquı́


el Teorema de Lasker–Noether sobre la existencia de descomposición primaria en anillos y
módulos noetherianos. Comencemos con unas nociones preliminares.

Definición 88. Sea M un R−módulo.


i) Para cada elemento a ∈ R, denotaremos por ηa,M : M −→ M a la homotecia de razón
a sobre M , es decir, el endomorfismo dado mediante ηa (m) := am, ∀m ∈ M .
ii) Un endomorfismo de R−módulos, φ : M −→ M , se denomina nilpotente si existe
n ∈ N, n ≥ 1, tal que φn ≡ 0, es decir, si existe n ∈ N, n ≥ 1, tal que la composición
de φ consigo mismo n veces nos da el endomorfismo nulo.
iii) Un submódulo N de M se denomina primario si N 6= M y para cada a ∈ R, la
homotecia ηa,M/N es o bien inyectiva o bien nilpotente.
iv) Un ideal q de R se dice primario si es primario como submódulo.

Proposición 6.5.4. Se tienen las propiedades siguientes para un ideal q un ideal de R:



i) La homotecia ηa,R/q es nilpotente si y solamente si a ∈ q.
ii) Un ideal q de R es primario si y solamente si se verifica la siguiente propiedad:
Para cada a ∈ R y para cada x ∈ R, si ax ∈ q, entonces o bien y ∈ q o bien existe
n ∈ N tal que an ∈ q.
Demostración. • Prueba de la afirmación (1): Nótese que ηa,R/q es nilpotente si
n
y solamente si existe un número natural n ∈ N tal que ηa,R/q ≡ 0. Esto último es
n n
equivalente a la existencia de n ∈ N tal que a x + q = ηa,R/q (x + q) =, para todo
x ∈ R. Pero ηa,R/q es un endomorfismo de R/q−módulos. Por tanto,
ηa,R/q (x + q) = (x + q)ηa,R/q (1 + q).
En conclusión, ηa,R/q es nilpotente si y solamente si existe n ∈ N tal que
an + q = ηa,R/q
n
(1 + q) = 0 + q.
Esto último es equivalente a que exista n ∈ N tal que an ∈ q y tenemos la equivalencia
de la afirmación (1).
• Prueba de la afirmación (1): Nótese que ax ∈ q es equivalente a
ηa,R/q (x + q) = 0 + q ∈ R/q.
Por tanto, la hipótesis ax ∈ q es equivalente a decir x + q ∈ ker(ηa,R/q ). Entonces,
ser primario es equivalente a la propiedad: para cada a ∈ R y para cada x ∈ R si
x + q ∈ ker(ηa,R/q ) y x 6∈ q (o, equivalentemente, ηa,R/q no es inyectiva, entonces
ηa,R/q es nilpotente. El resto se sigue de la propiedad (1).


Proposición 6.5.5. Si N es un submódulo primario de un R−módulo M , entonces el conjunto:


p := {a ∈ R : ηa,M/N no es inyectiva},
es un ideal primo de R. Diremos que el submódulo N es p−primario.
236 6. NOETHERIANOS

Demostración. En primer lugar es fácil ver que p es un ideal de R. Para ello, veamos
una de las propiedades. Obsérvese que si a, b ∈ p, entonces, las homotecias ηa,M/N y ηb,M/N
son nilpotentes. Existirán exponentes r, s ∈ N, r, s ≥ 1 tales que
r 2
ηa,M/N ≡ 0, ηb,M/N ≡ 0.
Es claro que, en ese caso
r+s
ηa,M/N + ηb,M/N ≡ 0.
Y ηa,M/N + ηb,M/N = ηa+b,M/N , con lo que a + b ∈ p. Veamos que, además, es un ideal primo.
Para ello, consideremos x, y ∈ R. Nótese que ηxy,M/N = ηy,M/N ◦ ηx,M/N = ηx,M/N ◦ ηy,M/N
es la composición de endomorfismos. Si xy ∈ p y x 6∈ p, entonces ηx,M/N es inyectiva y
ηxy,M/N = ηy,M/N ◦ ηx,M/N no es inyectiva. Por tanto, si la composición no es inyectiva,
entonces ηy,M/N no puede ser inyectiva y, por tanto, y ∈ p, con lo que habremos probado la
primalidad de p. 

Proposición 6.5.6. Sean N1 , . . . , Ns submódulos p−primarios de un R−módulo M (es decir,


primarios con respecto al mismo ideal primo de R). Entonces, la intersección
N = N1 ∩ · · · ∩ Ns
es un submódulo p−primario.
Demostración. Sea a ∈ p. Para cada i, 1 ≤ i ≤ s, la homotecia ηa,M/Ni : M/Ni −→
ni
M/Ni es nilpotente. Entonces, para cada i, 1 ≤ i ≤ s, existen ni ∈ N, ni ≥ 1 tales ηa,M/N i
≡ 0.
n0
Sea n0 ; = max{n1 , . . . , ns }. Veamos que ηa,M/N ≡ 0. Pues si m + N ∈ M/N , tenemos que
n0
ηa,M/N (m + N ) = an0 m + N.
ni
Pero esto significa que an0 m = an0 −ni ani m. Como ηa,M/N i
≡ 0, tendremos que ani m ∈ Ni ,
para cada i, 1 ≤ i ≤ s. Por tanto, an0 m ∈ Ni , para cada i, 1 ≤ i ≤ s y, por tanto, an:0 m ∈ N
n0
para cada m ∈ M . Es decir, ηa,M/N ≡ 0 o, equivalentemente, ηa,M/N es nilpotente. Para
concluir, veamos que si a 6∈ p, entonces ηa,M/N es necesariamente inyectiva. Pues si no lo fuera
es porque existe m ∈ M , m 6∈ N tales que ηa,M/N (m + N ) = am + N = 0. Es decir, si ηa,M/N
no fuera inyectiva, entonces, existe m ∈ M tal que m 6∈ N y am ∈ N . Pero m 6∈ N implica que
existe i, 1 ≤ i ≤ s, tal que m 6∈ Ni . Por tanto, tendrı́amos que existe m ∈ M tal que m 6∈ Ni y
am ∈ N ⊆ Ni . Es decir ηa,M/Ni no es inyectiva contradiciendo el hecho de que a 6∈ p y Ni es
p−primario. 


Corollario 6.5.7. Si q es un ideal primario de un anillo R, entonces su radical p := q es
un ideal primo de R y diremos que q es un ideal p−primario. Más aún si q1 , . . . , qs es una lista

finita de ideales p−primarios (i.e. qi = p, para todo i), entonces la intersección
q = q1 ∩ · · · qs ,
es también un ideal p−primario.
Demostración. Es consecuencia inmediata de la anterior Proposición y del apartado (1)
de la Proposición 6.5.4 anterior. La afirmación sobre la intersección de primarios es consecuencia
inmediata de la Proposición 6.5.6. 

Ejemplo 6.5.8. Los ideales primarios en dominios de ideales principales on las potencias de
ideales primos. Ası́ el ideal 8Z es un ideal (2)−primario, pero el ideal (12) no es primario.
Sin embargo, no es necesario que un ideal sea potencia de ideal primo para ser primario. Con-
sideremos el ideal a := (X, Y 2 ) en el anillo de polinomios en dos variables R := k[X, Y ]. Es un
ideal primario (su radical es el ideal maximal m = (X, Y )) pero no es potencia de m. Para ver
que es primario, obsérvese que el cociente k[X, Y ]/a es un K−espacio vectorial de dimensión
2, con base {1 + a, Y + a}. Ahora para cada elemento f ∈ k[X, Y ] nos interesa su clase módulo
a. La clase tiene la forma f + a = (a + bY ) + a y tenemos dos caso: si a 6= 0, entonces ηf,R/a
2
es inyectiva (y f + a es unidad) o a = 0 y ηf,R/a ≡ 0. Ver que a 6= mn , ∀n ∈ N, es un sencillo
ejercicio pues X 6∈ m , para cada n ≥ 2 (con lo que a 6= mn , ∀n ≥ 2) y, de otro lado, Y 6∈ a
n

(con lo que a 6= m).


6.5. DESCOMPOSICIÓN PRIMARIA 237

La idea de descomposición primaria y del Teorema de Lasker–Noether es una generalización


de la factorización única a cualquier anillo noetheriano. Pero necesitamos avanzar más para
interpretar el resultado y su significado geométrico.

Definición 89 (Descomposición Primaria). Sea M un R−módulo y N un submódulo de


M . Una descomposición primaria de N es una descripción de N como intersección finita:
N := N1 ∩ . . . ∩ Ns ,
donde cada Ni es un sumódulo primario de M . Tenemos la lista finita de ideales primos
{p1 , . . . , ps } ⊆ Spec(R) de tal modo que para cada i, 1 ≤ i ≤ s, el submódulo Ni es pi −primario.
Decimos que la descomposición primaria anterior es reducida (o, también, irredundante) si
pi 6= pj , para cada i 6= j.

Definición 90 (Submódulo Irreducible). Un submódulo N de un R−módulo M se llama


irreducible si verifica las dos propiedades siguientes:
i) N 6= M ,
ii) N no puede expresarse como una intersección N = N1 ∩ N2 , con N1 , N2 submódulos
de M y N ⊆ / Ni , 1 ≤ i ≤ 2.

Proposición 6.5.9. Si M es un R−módulo noetheriano, todo submódulo irreducible es pri-


mario.
Demostración. Supongamos que N es irreducible. Para cada a ∈ R consideremos la
homotecia ηa,M/N : M/N −→ M/N . Consideremos la secuencia de submódulos de M/N dada
r
por los núcleos de las potencias se este endomorfismo Kr := ker(ηa,M/N ). Claramente tenemos:
(0) = K0 ⊆ K1 ⊆ K2 ⊆ · · · ⊆ Kr ⊆ · · · .
Como M/N es noetheriano esa cadena se estabiliza y existe n ∈ N, n ≥ 1, tal que Kr = Kn ,
n
para cada r ≥ n. Definamos φ := ηa,M/N : M/N −→ M/N . Probaremos que
(6.5.1) ker(φ) ∩ Im(φ) = (0).
Es claro que si m + N ∈ Im(φ) ∩ ker(φ), entonces, m + N = φ(m0 + N ) = ηa,M/N
n
(m0 + N ) y
n 2n 0 0 2n
0 + N = φ(m + N ) = ηa,M/N (m + N ) = ηa,M/N (m + N ). Por tanto, m + N ∈ ker(ηa,M/N )=
n 0 n 0
K2n = Kn = ker(ηa,M/N ). Por tanto, m + N = φ(m + N ) = ηa,M/N (m + N ) = 0 + N y
habremos probado la igualdad anterior.
Sea ahora π : M −→ M/N la proyección canónica y consideremos los submódulos de M dados
mediante:
N1 := π −1 (ker(φ)), N2 := π −1 (Im(φ)).
Claramente tenemos que N ⊆ N1 y N ⊆ N2 . Además, la igualdad (6.5.1) anterior implica que
N = N1 ∩ N2 . Ahora, como N es irreducible, tendremos que o bien N = N1 o bien N = N2 .
• Si N = N1 : En este caso, N = π −1 (ker(φ)), luego N1 /N = 0 o, lo que es lo mismo,
n
ker(φ) = 0. Pero esto último significa que φ es inyectiva y, por tanto, ηa,M/N es
inyectiva, con n ≥ 1. Por tanto, si la composición (varias veces) de ηa,M/N es inyetiva,
el propio endomorfismo ηa,M/N es inyectivo.
• Si N = N2 : En este caso, N = π −1 (Im(φ)). Esto es lo mismo que decir que N2 /N = 0
y que Im(φ) = 0. Por tanto, en ese caso, φ ≡ 0 es el endomorfismo nulo. Pero
n n
φ = ηa,M/N , con n ≥ 1. Es decir, ηa,M/N ≡ 0 y el endomorfismo ηa,M/N es nilpotente.
Hemos concluido que si N es irreducible, entonces para cada a ∈ R, ηa,M/N es o bien inyectivo
o bien nilpotente y, por tanto, N es primario. 

Podemos, finalmente, enunciar el Teorema de Lasker–Noether.


Teorema 6.5.10 (Teorema de Lasker–Noether). Si M es un R−módulo noetheriano, en-
tonces todo submódulo propio posee una descomposición primaria irredundante.
238 6. NOETHERIANOS

Demostración. Probaremos, primer lugar, la siguiente afirmación:


Para todo submódulo N de M , con N ⊆ / M,
(6.5.2)
N es intersección finita de submódulos irreducibles de M .
Para probarlo, usaremos el tipo de argumento habitual con la condición noetheriana. Consid-
eremos el conjunto M formado por todos los submódulos propios de M que no son intersección
fnita de submódulos irreducibles de M . Supongamos, por reducción al absurdo, que M es no
vacı́o. Aplicando la definición de noetherianos (cf. Proposición 6.4.1 anterior), entonces M
posee un elemento maximal N . Por ser N ∈ M, N no puede ser irreducible. Si fuera irre-
ducible, serı́a intersección finita de irreducibles y no podrı́a estar en M. Como no es irreducible,
entonces N es reducible y, por tanto, N = N1 ∩ N2 donde N1 , N2 son submódulos propios de M
yN⊆ / Ni , 1 ≤ i ≤ 2. Como N es maximal y N ⊆ / Ni , 1 ≤ i ≤ 2, podemos concluir que Ni 6∈ M,
1 ≤ i ≤ 2. Pero si N1 y N2 no están en M es porque no verifican la condición que define
M. Por tanto, tanto N1 como N2 son intersección finita de submódulos irreducibles de M .
Pero, como N = N1 ∩ N2 , también concluirı́amos que N es intersección finita de submódulos
irreducibles de M con lo que N 6∈ M y habremos llegado a contradicción desde la hipótesis
M= 6 ∅. Por tanto, concluiremos M = ∅ y, por tanto, hemos probado la afirmación descrita en
(6.5.2) anterior.
A partir de la Proposición 6.5.9 anterior, como todo irreducible es primario, habremos probado:
Para todo submódulo N de M , con N ⊆ / M,
(6.5.3)
N es intersección finita de submódulos primarios de M .
Nos queda por probar la existencia de descomposición primaria irredundante de acuerdo con la
Definición 89 anterior. Para ello, sea N un submódulo propio de M y consideremos el siguiente
conjunto de números naturales:
NN := {s ∈ N : N = N1 ∩ . . . ∩ Ns , Ni es primario, 1 ≤ i ≤ s}.
Por la afirmación descrita en (6.5.3), tenemos que NN 6= ∅, con lo que existe un mı́nimo
r := min NN . Tendremos una descomposición primaria:
(6.5.4) N = N1 ∩ . . . ∩ Nr ,
donde supondremos que cada Ni es pi −primario, con pi ∈ Spec(R) un ideal primo, 1 ≤ i ≤ r.
Veamos que, en estas condiciones, pi 6= pj , para todo i 6= j. Si no fuera ası́, supongamos,
sin pérdida de la generalidad, que p1 = p2 . Entonces, por la Proposición 6.5.6, el submódulo
N0 := N1 ∩ N2 es también un submódulo primario de M y tendremos:
N = N0 ∩ N3 ∩ . . . ∩ Nr ,
con lo que r−1 ∈ NN , contradiciendo la minimalidad de r. Concluimos ası́ que, necesariamente,
pi 6= pj , para todo i 6= j y habremos concluido que la descomposición primaria descrita en (6.5.4)
es irredundante y, por tanto, queda probado el Teorema de Lasker–Noether. 

Corollario 6.5.11. Sea R un anillo noetheriano y a ⊆ / R un ideal de R. Entonces, a posee


descomposición primaria irredudante. Es decir, existen q1 , . . . , qs ideales de R, de tal modo que
qi es pi − primario y pi ∈ Spec(R), verificando:
i) a = q1 ∩ · · · ∩ q2 ,
6 pj , para todo i 6= j.
ii) pi =
En particular, en anillos noetherianos, el radical de todo ideal es una intersección finita de
primos, dado que
√ √ √
a = q1 ∩ · · · ∩ qs = p1 ∩ · · · ∩ ps .

Observación 6.5.12. En particular, todos los ideales radicales de anillos noetherianos (como
k[X1 , . . . , Xn ]) son intersección finita de ideales primos.
6.6. TEMAS OPCIONALES 239

Observación 6.5.13. El anterior resultado admite una interpretación inmediata en el caso


de dominios de ideales principales. Aunque las interpretaciones más profundas seguirán en
Capı́tulos siguientes, dejemos aquı́ constancia de que el Teorema de Lasker–Noether implica la
existencia de factorización en dominios de ideales principales. Es decir, implica la siguiente
afirmación:

Si R es un dominio de ideales principales, para todo f ∈ R,


existen u ∈ R∗ , unidad; elementos primos f1 , . . . , fs ∈ R,
(6.5.5)
y números naturales n1 , . . . , ns ∈ nN, con ni ≥ 1, para 1 ≤ i ≤ s, tales que
f = uf1n1 · · · fsn2 .
Para demostrar esta afirmación consideremos el ideal (f ) de R que es neotheriano porque todos
sus ideales son finitamente generados. Por el Teorema de Lasker–Noether, tendremos una
descomposición primaria irredundante
(f ) := q1 ∩ · · · ∩ q2 ,
donde qi es pi −primario y pi 6= pj , para todo i 6= j. Como R es dominio de ideales principales,
existirá fi ∈ R elemento primo tal que (fi ) = pi . De otro lado, qi = (gi ) es pi −primario.

Como qi = pi , concluiremos que qi = (fini ) para algún ni ≥ 1. Por el Teorema Chino de los
Restos (cf. Teorema 3.2.2), como R es dominio de ideales principales, qi y qj son dos a dos
comaximales. y, por tanto,
s
Y s
Y
(f ) := q1 ∩ · · · ∩ q2 = qi = (fini ) = (f1n1 · · · fsns ).
i=1 i=1

Como f y f1n1 · · · fsns generan el mismo ideal en R, ha de existir un elemento unidad u ∈ Rn


tal que
f = uf1n1 · · · fsns .

Observación 6.5.14. Veremos más adelante, tras probar el Teorema del Ideal Principal de W.
Krull (Hauptidealsatz de Krull), que si un anillo noetheriano R verifica la propiedad siguiente:
(6.5.6) Todo ideal primo de altura 1 es principal,
entonces los elementos del anillo R admiten factorización como producto de elementos pri-
mos, generalizando ası́ la factorización de elementos y, por el Teorema de Lasker–Noether, la
“factorización” de ideales cualesquiera.
***

6.6. Temas Opcionales


Claramente hay muchos temas relacionados con los contenidos de este Capı́tulo. Hemos omi-
tido algunos de los más interesantes y proponemos que los alumnos busquen, se informen o
complemente por su cuenta los temas que se indican a continuación:

6.6.1. Snake Lemma. Se trata del siguiente enunciado que es clave en la definición de
la suceción exacta larga de Homologı́a de Toplogı́ Algebraica:
Proposición 6.6.1 (Snake Lemma). Consideremos un diagrama de R−módulos y morifmos
como el siguiente, en el que las filas son sucesiones exactas cortas:
0 −→ M0 −→ M −→ M 00 −→ 0
f0 ↓ ↓ f ↓ f 00
0 −→ N0 −→ N −→ N 00 −→ 0
Entonces, existe un morfismo de R−módulos d : ker(f ) −→ Coker(f 0 ) tal que la siguiente
00

sucesión es exacta:
0 → ker(f 0 ) → ker(f ) → ker(f 00 ) →
→ Coker(f 0 ) → Coker(f ) → Coker(f 00 ) → 0,
donde los demás morfismos son inducidos por las filas horizontales del diagrama inicial.
240 6. NOETHERIANOS

6.6.2. Libres, Proyectivos, Inyectivos y Planos (Opcional). Esta es una Sección


claramente opcional. Puede ser interesante que los alumnos que lo deseen, busquen referencias
y traten de completar las pruebas.
Definición 91 (Proyectivos, Inyectivos, Planos). Sea M un R−módulo. Se definen las sigu-
ientes nociones:
• Se dice que M es proyectivo si HomR (M, −) es un functor exacto.
• Se dice que M es inyectivo si HomR (−, M ) es un functor exacto.
• Se dice que M es plano si M ⊗R − es un functor exacto.
Proposición 6.6.2. Se dan las siguientes implicaciones para un R−módulo M cualquiera:
M es libre =⇒ M es proyectivo =⇒ M es plano.
Lo que da una buena colección de ejemplos. De hecho, si R es local noetheriano y M es
finitamente generado, las tres nociones coinciden.
Se pueden probar algunas propiedades del tipo:
Proposición 6.6.3. Un R−módulo P es proyectivo si y solamente si es sumando directo de
un R−módulo libre.
O también
Proposición 6.6.4. Un R−módulo P es proyectivo si y solamente si toda sucesión exacta corta
0 −→ M −→ N −→ P −→ 0
es escindida.
Para concluir, no sin bastante trabajo que:
Proposición 6.6.5. Todo módulo posee una resolución proyectiva.
De otro lado se pueden discutir los módulos inyectivos observando, por ejemplo, que Q es un
Z−módulo inyectivo y que Z no lo es. Para ello se puede usar el Criterio de Baer:
Proposición 6.6.6 (Criterio de Baer). Una R−módulo I es inyectivo si y solamente si satisface:
Dado un ideal a de R y un morfismo de R−módulos f : a −→ I, existe f˜ : R −→ I tal que
f˜ |a = f.
Ası́ podemos probar que si I es un Z−módulo inyectivo, entonces, HomZ (R, I) es un R−módulo
inyectivo y conluir (poniendo I = Q/Z, por ejemplo, como co–generador injectivo):
Proposición 6.6.7. Todo R−módulo posee una resolución inyectiva.

6.7. Cuestiones y Problemas


Problema 174. Concluir la prueba de la Demostración 6.3.1, probando que HomR (−, N ) es
exacto a izquierda.
Problema 175. Definir functor exacto a derecha. Buscar ejemplos de functores exactos a
derecha de la categorı́a de R−módulos en sı́ misma.
Problema 176 (Valores Absolutos p−ádicos). Buscar los conceptos siguientes:
• Valor Absoluto sobre un cuerpo.
• Valor Absoluto No Arquimediano.
• Cuerpos Valuados.
• Valores Absolutos Equivalentes.
• Valor absoluto p−ádico sobre Q: | · |p : Q −→ R+
Establecer alguna relación entre el valor asoluto p−ádico sobre Q y la localización Z(p) .
Problema 177 (A.M. Ostrowski). Busca el enunciado del Siguiente Teorema de A.M. Os-
trowski:
Teorema.[cf. [Os, 73]] Todo valor absoluto sobre Q es equivalente a uno de los siguientes:
• El valor absoluto usual | · |0 : Q −→ R+ ,
• o un valor absoluto p−ádico | · |p : Q −→ R+ , para algún primo p ∈ N.
6.7. CUESTIONES Y PROBLEMAS 241

A partir de un valor absoluto se define una distancia y a través de la distancia tenemos una
estructura de espacio métrico. Recordar la definición de completado de un espacio métrico.
Probar las siguientes afirmaciones:
• El completado de Q con respecto al valor absoluto | · |0 es el cuerpo R de los números
reales.
• El completado de Q con respecto al valor absoluto p−ádico | · |p es también un cuerpo
Q̂p denominado cuerpo de los números p−ádicos.
• La bola cerrada de centro 0 y radio 1 en Q con respecto al valor absoluto p−ádico
B̄p (0, 1) es el anillo local Z(p) cuyo ideal maximal (que denotaremos por pZp ) es justa-
mente la bola abierta Bp (0, 1) de centro 0 y radio 1 en Q con respecto al valor absoluto
p−ádico.
• Hallar las bolas de centro 0 y radio 1/pk en Q con respecto al valor absoluto p−ádico.
¿Tiene todo ésto algo que ver con la localización?
Problema 178. Buscar analogı́as con el cuerpo C(X) y la valoración dada por tener un “polo
en 0 ∈ C de orden k”. Describir la bola cerrada de centro 0 y radio 1 en C(X) y hallar
su clausura en el completado de C(X). ¿Te suena a algún anillo que hayamos definido con
anterioridad?.
Problema 179. Probar que no son anillos noetherianos los anillos C 0 (X) o C ∞ (X). ¿Qué
puedes decir delanillo H(U ) de funciones holomorfas sobre un abierto U ⊆ C?.
Problema 180. Un módulo M se dice libre si existe un conjunto I y una colección {Mi :
i ∈ I} de R−módulos, cada uno isomorfo a R, de tal modo que M ∼ = ⊕i∈I Mi . Probar que
un R−módulo es finitamente generado si y solamente si es (isomorfo) a un cociente de un
R−módulo libre de la forma Rn .
Problema 181 (Hamilton-Cayley para módulos finitamente generados, aka “deter-
minantal trick”). Sea M un R−módulo finitamente generado y sea ϕ : M −→ M un en-
domorfismo de R−módulos. Supongamos π : Rn −→ M un epimorfismo sobre M , desde un
R−módulo finitamente generado. Probar:
i) Existe un endomorfismo de R−módulos φ : Rn −→ Rn que hace conmutativo el dia-
grama siguiente:
φ
Rn −→ Rn
π ↓ ↑ π
M −→ M
ϕ
ii) Si χφ ∈ R[X] es el polinomio del Teorema de Hamilton–Cayley para módulos libres
finitamente generados, probar que para todo m ∈ M , se tiene χφ (ϕ)(m) = 0 con las
operaciones de suma y composición de endomorfismos.
iii) Si, además, existe un ideal a de R, tal que ϕ(M ) ⊆ aM , entonces, podemos elegir φ
de tal modo que φ(Rn ) ⊆ aRn y de tal modo que los coeficientes de χφ , excluyendo el
coeficiente director, estén en el ideal a.
(Pista: Retomar el Problema ??)
Problema 182 (Lema de Nakayama, à la Atiyah). Deducie el Lema de Nakayama (Lema
6.5.1 anterior) del enunciado del anterior problema. (Pista: Consultar [AtMc, 69]).
CAPı́TULO 7

Suplementos sobre Noetherianidad: Teorema de Unicidad,


Espacios Topológicos, Anillos y Módulos Artinianos

Índice
7.1. Introducción 243
7.2. Primer Teorema de Unicidad de la Descomposición Primaria:
Asociados, Soporte 243
7.3. Espacios Topológiocs Noetherianos: Componentes Irreducibles 247
7.4. Anillos y Módulos de Artin 249
7.5. Dimensión de Krull 252
7.5.1. Dimensión de Krull en espacios topológicos noetherianos 254
7.6. Cuestions y Problemas 258

7.1. Introducción
Dedicaremos este Capı́tulo a establecer algunos aspectos suplementarios de la noción de anillos y
módulos noetherianos. Incluimos un Teorema Débil de Unicidad de la descomposición primaria,
el estudio de los espacios topológicos noetherianos y los anillos y módulos de Artin.

7.2. Primer Teorema de Unicidad de la Descomposición Primaria: Asociados,


Soporte
Definición 92. Sea M un R−módulo. Un ideal primo p ∈ Spec(R) se denomina asociado a
M si existe x ∈ M tal que x 6= 0 y
p = Ann({x}) := {a ∈ R : ax = 0}
Denotaremos por Ass(M ) el conjunto de los ideales primos asociados a M .

Observación 7.2.1. Otra manera de interpretar los ideales primos asociados a un R−módulo
M viene dada por la formulación siguiente :
Un ideal primo p ∈ Spec(R) es asociado a M si y solamente si existe un monomorfismo de
R−módulos:
ϕ : R/p −→ M.
El elemento ϕ(1R + p) = x verifica p = Ann({x}). La clase de ideales primos asociados a un
R−módulo es especialmente importante por determinar los divisores de cero.

Definición 93. Dado un R−módulo M y un elemento no nulo a ∈ R, diremos que a es un


divisor de cero de M , si existe m ∈ M , m 6= 0, tal que am = 0.

Ejemplo 7.2.2. Por tomar un ejemplo clásico, retomemos la Teorı́a del Endomorfismo vista
en Capı́tulos anterores. Tomemos Mn (K) las matrices cuadradas sobre un cuerpo K y sea
A = K[X] el dominio de ideales principales dado por los polinomios univariados con coeficientes
en K. En Mn (K) tenemos una estructural “natural” de A−módulo. Ası́, dados f (X) ∈ A y
M ∈ Mn (K), definimos :
d
X
f (M ) := ak M k
i=0
Pd
cuando f = i=0 ak X k . Con esta estructura de A−módulo, dada una matriz cuadrada M ∈
Mn (K), Ann({M }) es justamente el ideal de A generado por el polinomio mı́nimo de M .
243
244 7. SUPLEMENTOS NOETHERIANIDAD

Lema 7.2.3. Se tienen las siguientes propiedades:


√ n
i) Sea R un anillo noetheriano y a un ideal de R. Entonces, existe n ∈ N tal que a ⊆ a.
ii) Si R es noetheriano, M un R−módulo finitamente generado y N un submódulo
p−primario de M , existirá n ∈ N tal que pn M ⊆ N .

Demostración. i) Puesto que a es finitamente generado, supongamos

a = (a1 , . . . , as )
Entonces, existirán ni ∈ N tales que ani i ∈ a. Tomando n := max{ni : 1 ≤ i ≤ s}
habremos terminado.
ii) Para cada a ∈ p, la homotecia aM/N : M/N −→ M/N es nilpotente. Para cada
generador ai de p = (a1 , . . . , as ) existira ni ∈ N tal que (ai )nM/N
i
= 0, es decir,
ni
ai M ⊆ N . Tomando n := max{ni : 1 ≤ i ≤ s} habremos terminado.


Observación 7.2.4. Si q es un ideal p−primario, existirá n ∈ N tal que pn ⊆ q.

Teorema 7.2.5 (Primer Teorema de Unicidad). Sea R un anillo noetheriano y M un


R−módulo finitamente generado. Sea
(0) = N1 ∩ · · · ∩ Nr
una descomposición primaria irredudante del submódulo (0) de M , donde cada Ni es pi −primario.
Entonces,
Ass(M ) = {p1 , . . . , pr }.
En particular, Ass(M ) es un conjunto finito y está unı́vocamente determinado, independiente-
mente de la descoposición primaria irredundante del submódulo (0) elegida.
Demostración. Probemos los dos contenidos
• ⊆ : Consideremos p ∈ Ass(M ) y supongamos x ∈ M , x = 6 0, tal que p = Ann({x}).
Salvo reordenación de los ı́ndices de la descomposición primaria, existirá un cierto
ı́ndice j ≥ 1 tal que :
x 6∈ N1 ∪ · · · ∪ Nj , x ∈ Nj+1 ∩ · · · ∩ Nr
Sea ni ∈ N tal que pni i M ⊆ Ni . Tendremos que :
j
Y
pni i x ⊆ (N1 ∩ · · · ∩ Nj ) ∩ Nj+1 ∩ · · · ∩ Nr
i=1
Qj
Tenemos ası́ i=1 pi ⊆ p y, dado que p es un ideal primo, existirá un cierto k, 1 ≤ k ≤
j, tal que pk ⊆ p. Por otro lado, para cada a ∈ p, la homotecia aM/Nk : M/Nk −→
M/Nk no es inyectiva : aM/Nk (x + Nk ) = 0 y x 6∈ Nk . Por no ser inyectiva, a ∈ pk y
tenemos la igualdad.
• ⊇ :Para el otro contenido, probemos que cada pi ∈ Ass(M ). Supongamos i = 1 y
considremos x ∈ N2 ∩ · · · ∩ Nr tal que x 6∈ N1 . Tal elemento ha de existir porque la
descomposición es irredundante. Puesto que N1 es p1 −primario, existirá n ∈ N tal que
pn1 M ⊆ N1 . Consideremos n minimal con esa propiedad. Existirá entonces y ∈ pn−1 1 x
tal que y 6∈ N1 . En particular y 6= 0 y p1 y ⊆ N1 . Por lo tanto, p1 ⊆ Ann({y}). De otro
lado, si a ∈ R es un elemento tal que ay = 0, la homotecia aM/N1 : M/N1 −→ M/N1
no es inyectiva (y 6∈ N1 y ay = 0). Por lo tanto a ∈ p1 como buscábamos.
La caracterización de los primos que aparecen en una descomposición primaria irredundante
como primos asociados, los determina de manera única e independiente de la descomposición
primaria irredundante elegida. 

Corollario 7.2.6. Sea R un anillo noetheriano y M un R−módulo finitamente generado. Sea


N un submódulo de N y tomemos una descomposición primaria irredudante de N :
N = N1 ∩ · · · ∩ Nr
7.2. PRIMER TEOREMA DE UNICIDAD DE LA DESCOMPOSICIÓN PRIMARIA: ASOCIADOS, SOPORTE
245

donde Ni es pi −primario. Entonces,


Ass(M/N ) = {p1 , . . . , pr }
En particular, los ideales asociados a una descomposición primaria irredundante están deter-
minados de manera única por el módulo y son independientes de la descomposición primaria
irredudante elegida.

Corollario 7.2.7. Análogas propiedades se verifican para los ideales de un anillo noetheriano.

La siguiente propiedad muestra a relación entre los divisores de cero de un R−módulo y los
primos asociados:
Proposición 7.2.8. El conjunto de los divisores de cero de un R−módulo noetheriano es dado
por:
[
p
p∈Ass(M )

Demostración. Tomemos una descomposición primaria irredundante del submódulo (0)


de M :
(0) = N1 ∩ · · · ∩ Nr
donde cada Ni es pi −primario. Si a ∈ R es un divisor de cero en M , existirá m ∈ M , m 6= 0, tal
que am = 0. Pero ha de existir un ı́ndice k, 1 ≤ k ≤ r tal que m 6∈ Nk . Entonces, la homotecia
aM/Nk : M/Nk −→ M/Nk
no es inyectiva, por lo que a ∈ pk .
Recı́procamente, Supongamos que a ∈ p1 . Como la descomposición es irredundante, existirá
y ∈ N2 ∩ · · · ∩ Nr tal que y 6= 0. Como la homotecia :
xM/N1 : M/N1 −→ M/N1
es no inyectiva, deberá ser nilpotente, luego existe n ∈ N tal que xnM/N1 = 0. En particular,
tendremos
xnM/N1 (y) ∈ N1 ⇒ xn y = 0.
Elijamos n ∈ N minimal con la propiedad xn y = 0. Entonces, xn−1 y 6= 0 y tomando y 0 =
xn−1 y 6= 0, concluiremos xy 0 = 0 y x es un divisor de cero del R−módulo M . 

Observación 7.2.9. Obsérvese que si R es un anillo noetheriano y a es un ideal radical de R,


existirá una descomposición primaria irredudante de a donde todos los primarios son primos :
Tomemos una descomposición primaria irredundante del ideal a = q1 ∩ · · · ∩ qr , donde qi es

un ideal pi −primario. Entonces, q = p1 ∩ · · · ∩ pr y ésta es una descomposición primaria
irredundante de a.

Definición 94. Dado M un R−módulo, definiremos el ideal anulador de M en R, mediante :


AnnR (M ) := {a ∈ R : am = 0, ∀m ∈ M }

Corollario 7.2.10. Sea R un anillo noetheriano y M un R−módulo noetheriano. Entonces,


p
AnnR (M ) = ∩p∈AssR (M ) p,
y p
(0) = ∩p∈AssR (A) p.

Definición 95. Sea M un R−módulo. y para cada ideal primo p ∈ Spec(R) denotemos por
Mp la localización de M en p. Definiremos el soporte de M como :

Supp(M ) := {p ∈ Spec(R) : Mp 6= 0}
246 7. SUPLEMENTOS NOETHERIANIDAD

Lema 7.2.11. El siguiente morfismo de R−módulos es inyectivo :


Q
ϕ : M −→ p∈Spec(R) Mp
a
a 7−→ ( 1 )p∈Spec(R) .
En particular, M = (0) si y solamente si Supp(M ) = ∅.
Demostración. Simplemente recordar a los alumnos la disusión en torno a la condición
local de la propiedad “ser cero ” un R−módulo. 

TODO: ****
7.3. ESPACIOS TOPOLÓGIOCS NOETHERIANOS: COMPONENTES IRREDUCIBLES 247

Observación 7.2.12. Las propiedades de la localización de anillos y módulos nos garantizan


las siguientes propiedades :
i) Si 0 → M 0 → M → M 00 → 0 es una sucesión exacta corta de A−módulos :
Supp(M ) = Supp(M 0 ) ∪ Supp(M 00 )
N
ii) Supp(M A N ) = Supp(M ) ∩ Supp(N ).
Teorema 7.2.13. Si A es un anillo noetheriano, las siguiente propiedades son equivalentes para
cualquier A−módulo finitamente generado y cualquier ideal primo p ∈ Spec(A) :
i) p ∈ Supp(M ),
ii) ∃p0 ∈ Ass(M ), p ⊇ p0 ,
iii) p ⊇ Ann(M ).
En particular, Ass(M ) contiene a los primos minimales de Supp(M ) y éste es un conjunto
finito.
Demostración. • i) ⇒ ii) : Supongamos
p Ass(M ) = {p1 , . . . , pr }. Si ii) no fiera
cierto, p no contiene a ∩ri=1 pi = Ann(M ). Por lo tanto, siendo p primo, existe
a ∈ Ann(M ) tal que a ∈ p. Es fácil concluir entonces que Mp = (0) en contra de la
hipótesis p ∈ Supp(M ). p
• ii) ⇒ iii) : Obvio pues Ann(M ) = ∩ri=1 pi .
• iii) ⇒ i) : Supongamos que p ⊇ Ann(M ). Entonces, si Mp = (0), tomemos
m1 , . . . mr ∈ M generando M como A−módulo.
Qr Existirán xi ∈ A \ p tales que
xi mi = 0 en M , 1 ≤ i ≤ r. Sea s = i=1 xi ∈ A \ p. Entonces, sm = 0, para
todo m ∈ M (es decir s ∈ Ann(M ) ) y s 6∈ p.

Corollario 7.2.14. Para todo A−módulo finitamente generado sobre un anillo noetheriano
se tiene :
Ass(M ) ⊆ Supp(M ) = Spec(A/Ann(M ))
Corollario 7.2.15. Para todo anillo noetheriano A y todo ideal I de A se tiene :
i) Los ideales primos minimales sobre I están en Ass(A/I).
ii) No todos los ideales primos de Ass(A/I) son minimales sobre I
Demostración. Sólo discutimos el apartado ii) : Tomemos el ideal (x2 , xy) = (x) ∩ (x, y)
en Q[x, y]. Tal descripción es una descomposición primaria irredudante de (x2 , xy), pero el ideal
primo (x, y) no es minimal aun siendo asociado. 
Definición 96. Los ideales primos minimales sobre un ideal se denominan divisores primos
del ideal, mientras que los ideales primos asociados que no son minimales se denominan com-
ponentes inmersas del ideal.
Corollario 7.2.16. Si K es un cuerpo algebraicamente cerrado, I un ideal de K[X1 , . . . , Xn ],
los siguientes conjuntos se pueden identificar :
i) Los ideales primos minimales sobre
√ I.
ii) Los ideales primos asociados a I.
iii) Las componentes irreducibles de la variedad VK n (I).

7.3. Espacios Topológiocs Noetherianos: Componentes Irreducibles


Es una interpretación de la noción de condición de cadena.
Proposición 7.3.1. Sea (X, T ) un espacio topológico. Las siguientes condiciones son equiva-
lentes :
i) (X, T ) es un espacio topológico noetheriano.
ii) Todo conjunto no vacı́o de abiertos posee elemento maximal.
iii) Los cerrados de (X, T ) verifican la condición de cadena descendente.
iv) Todo conjunto no vacı́o de cerrados de (X, T ) posee elemento minimal.
v) Cada subespacio abierto de (X, T ) es quasicompacto (i.e. todo cubrimiento posee un
cubrimeinto finito).
vi) Cada subespacio de (X, T ) es quasicompacto.
248 7. SUPLEMENTOS NOETHERIANIDAD

Demostración. La equivalencia entre las primeras cuatro afirmaciones es trivial y no


requiere esfuerzo adicional.
• ii) ⇒ v) Sea A abierto en X y consideremos un recubrimiento de A por abiertos de
X :
A ⊆ ∪i∈I Ai
Consideremos ahora el conjunto de todos los abiertos dados por uniones finitas de
abiertos en {Ai : i ∈ I}. Sea A0 un elemento maximal de ese conjunto. Si A ⊆ A0
no habrı́a nada que probar. En caso contrario, existirá x ∈ A que no está en A0 .
Entonces, existirá un cierto ı́ndice i0 ∈ I tal que x ∈ Ai0 . Entonces, A0 ⊆ A0 ∪ Ai0
contradiciendo la maximalidad de A0
• v) ⇒ vi) Sea F un subespacio cualquiera de (X, T ). Si tomamos un cubrimiento
abierto de F , tenemos, tomando la uni—ón, un recubrimiento de un abierto de (X, T ),
por lo tanto, posee un subcubrimeinto finito y también lo posee F .
• vi) ⇒ i) Dada una cadena ascendente de abiertos de (X, T ) :
A1 ⊆ A2 ⊆ · · · ⊆ An ⊆ · · ·
Tomemos el abierto A := ∪An . Por ser quasicompacto, posee un subrecubrimiento
finito. Tomando como m ∈ N el máximo de los subı́ndices de los abiertos que aparecen
en ese subcubrimiento finito, tendremos A = Am = An , para cada n ≥ m.

Los espacios topológicos noetherianos disponen además de una propiedad análoga a la de las
componentes conexas en Rn : las componentes irreducibles.
Definición 97. Un cerrado F de un espacio topológico (X, T ) se denomina irreducible si
verifica :

∀V1 , V2 cerrados de (X, T ), F = V1 ∪ V2 ⇒ F = V1 óF = V2


Ejemplo 7.3.2. Los conjuntos algebraicos irreducibles son cerrados irreducibles en K n con la
topologı́a de Zariski. El que posean propiedades análogas a las componentes conexas, no quiere
decir que sean conexos.
Proposición 7.3.3. Sea (X, T ) un espacio topológico neotehriano. Entonces, todo cerrado es
unión finita de cerrados irreducibles. Además existe una única descomposición para cada F
cerrado en (X, T ) del tipo :
F := V1 ∪ · · · ∪ Vn
tal que :
• V1 , . . . , Vn son cerrados irreducibles,
• ∀i 6= j, Fi 6⊆ Fj .
Una tal descomposición se denomina descomposición iredudante. El conjunto {V1 , . . . , Vn } está
unı́vocamente determinado por F : son los cerrados irreducibles maximales entre los contenidos
en F . Sus elementos se denominan componentes irreducibles de F .
Demostración. Para probar la existencia, definamos el siguiente conjunto de cerrados de
(X, T ) :
F := {F ⊆ X : F es cerrado y no es unión finita de irreducibles}
Si F no fuera vacı́o, poseerı́a un elemento minimal por ser (X, T ) noetheriano. Sea F0 tal
elemento minimal. Por ser un elemento de F, F0 no puede ser irreducible. En ese caso,
existirı́an F1 y F2 cerrados de (X, T ) tales que Fi 6= F0 , i = 1, 2 y F0 = F1 ∪ F2 . Por ser F0
minimal ni F1 ni F2 están en F, luego son uniones finitas de irreducibles. Concluirı́amos que
F0 es también una unión finita de irreducibles y habrı́amos llegado a una contradicción. Luego
F = ∅ y todo cerrado de (X, T ) es unión finita de irreducibles.
Para obtener una descomposición irredundante de F basta con tomar una descomposición
cualquiera y eliminar los elementos supérfluos. Dicho de otra manera, dada una descomposición
F := F1 ∪ · · · ∪ Fn , eliminemos aquellos Fi que están contenidos en algún Fj con j 6= i. Lo que
nos sale al final de ese proceso es una descomposición primaria irredudante.
7.4. ANILLOS Y MÓDULOS DE ARTIN 249

Para probar la unicidad, probemos primero que si F = F1 ∪ · · · ∪ Fn , es una descomposición


irredudante de F como unión de irreducibles, para cada cerrado irreducible W ⊆ F existe un
Fi tal que W ⊆ Fi . Claramente :
W := (F1 ∩ W ) ∪ · · · ∪ (Fn ∩ W )
luego por la ireducibilidad de W , concluiremos W = W ∩ Fi para algún i. Dada otra de-
scomposición primaria irredundante F = G1 ∪ · · · ∪ Gm de F , tenemos Gi ⊆ Fσ(i) para algún
σ(i) ∈ {1, . . . , n}. Ahora, como Fσ(i) es también un cerrado irreducible contenido en F , existirá
Gj tal que Fσ(i) ⊆ Wj . Pero eso implicarı́a Wi ⊆ Wj , luego i = j y Wi = Fσ(i) . Tenemos ası́
una aplicación inyectiva
σ : {1, . . . , m} −→ {1, . . . , n}
σ(i) es el ı́ndice tal que Wi = Fσ(i) . Concluimos m ≤ n y habremos concluido el argumento, 
Corollario 7.3.4. Todo conjunto algebraico de K n es unión finita irredundante de irreducibles
y esos irreducibles se hallan unı́vocamente determinados.

Corollario 7.3.5. i) Si V ⊆ K n es algebraico, I(V ) es un ideal radical y es inter-


sección finita de primos.
ii) Si K es algebraicamente cerrado, existe solamente un número √ finito de ideales primos
minimales sobre cada ideal I de K[X1 , . . . , Xn ]. Además, I es una intersección de
los ideales primos minimales que contienen al ideal I.
iii) Los ideales primos minimales sobre un ideal I están biyectados con las componentes
irreducibles de VK n (I).
Demostración. Sean V1 , . . . , Vm las componentes irreducibles de V . Entonces, cada I(Vj )
es un ideal primo de K[X1 , . . . , Xn ] y se tiene :
V = V1 ∪ · · · ∪ Vm ⇔ I(V ) = I(V1 ) ∩ · · · I(Vm )
Para las otras afirmaciones necesitamos del Corolario al Teorema de los Ceros de Hilbert que dice
que si p es un ideal primo de K[X1 , . . . , Xn ], K algebraicamente cerrado, V (P ) es irreducible.
En ese caso, si p es un primo conteniendo al ideal I V (p) ⊆ V (I), luego V (p) está contenido en
alguna componente irreducible de V (I), Vj , y tendremos
p = I(V (p)) ⊇ I(Vj )
. La biyección entre los ideales primos minimales sobre I y las componentes irreducibles de V (I)
queda pues garantizada. El resto es mera comprobación. 

7.4. Anillos y Módulos de Artin


Retomamos una serie de ideas básicas de E. Artin sobre este tipo de anillos, antes de proseguir.
Proposición 7.4.1 (Anillos de Artin). sea R un anillo. Las dos propiedades siguientes son
equivalentes:
i) Toda cadena descendente de ideales se estabiliza, es decir, dada una cadena descen-
dente de ideales de R:
a0 ⊇ a1 ⊇ · · · ⊇ am ⊇ · · · ,
existe m ∈ N tal que an = am , ∀n ≥ m.
ii) Todo conjunto no vacı́o de ideales de R posee elemento minimal.
Los anillos que satisfacen cualquiera de estas dos propiedades equivalentes se llaman anillos de
Artin o artinianos.
Demostración. Acudir a cualquier texto básico de Álgebra Conmutativa cono [AtMc, 69].

Los anillos de Artin poseen algunas propiedades interesantes que podemos resumir. De nuevo,
para una demostración se puede acudir a cualquier texto básico de Álgebra Conmutativa para
no iniciados como el [AtMc, 69].
250 7. SUPLEMENTOS NOETHERIANIDAD

Proposición 7.4.2. Si R es un anillo de Artin, el ideal (0) es un producto finito de ideales


maximales. Es decir, existen ideales maximales m1 , . . . , ms y enteros positivos n1 , . . . , n2 ∈ N
tales que
(0) = mn1 1 · · · mns s .
Teorema 7.4.3 (Teorema de Akizuki). Un anillo R es artiniano si y solamente si se verif-
ican las dos propiedades siguientes:
i) R es noetheriano, es decir, todo ideal de R es finitamente generado.
ii) Todo ideal p primo en R es maximal.
Vamos a extraer un sencillo Corolario sobre la estructura de los anillos artinianos a través del
Teorema Chino de los Restos. Recordemos este enunciado:
Teorema 7.4.4 (Teorema Chino de los Restos). Sea R un anillo y sea a1 , . . . , as una
familia finita de ideales de R. Supongamos que estos ideales son dos a dos co-maximales, es
decir,
∀i, j, i 6= j ai + aj = R.
Entonces, el siguiente es un isomorfismo de anillos:
Qs
ϕ : R/a −→ i=1 (R/ai )
x + a 7−→ (x + a1 , . . . , x + as ),
donde
s
\ s
Y
a= ai = ai .
i=1 i=1

De nuevo el resultado es un clásico y una demostración puede seguirse en cualquier clásico de


Álgebra Conmutativa como [AtMc, 69]. Una conclusión casi inmediata es la siguiente:
Corollario 7.4.5 (Teorema de Estructura de anillos locales de Artin). Todo anillo de
Artin es isomorfo a un producto de anillos locales de Artin. En particular, si
(0) = mn1 1 · · · mns s .
es una descomposición del ideal (0) de R como producto de ideales maximales, el siguiente es
un isomorfismo de anillos:
Qs ni
ϕ : R/a −→ i=1 (R/mi )
n1
x + a 7−→ (x + m1 , . . . , mns s ),
Demostración. Es evidente a partir de las discusiones precendentes. 
Vamos a ver lo que significa el concepto de anillos de Artin en nuestro contexto:
Definición 98 (Ideales Cero-dimensionales). Sea K un cuerpo, K su calusura algebraica,
a un ideal en K[X1 , . . . , Xn ] y VK (a) el conjunto de sus soluciones en Kn . Decimos que a es
cero-dimensional si VK (a) es un conjunto finito.
Un conjunto finito de ecuaciones (como las descritas en (??)) se dice cero-dimensional si
posee un número finito de soluciones o, equivalentemente, si el ideal a que generan es cero-
dimensional.
El siguiente enunciado caracteriza los ideales y los sistemas de ecuaciones cero-dimensionales:
Teorema 7.4.6. Sea K un cuerpo, K un cuerpo algebraicamente cerrado que contiene a K,
{f1 , . . . , fs } un conjunto finito de polinomios en K[X1 , . . . , Xn ]. Sea a el ideal gebnerado por
{f1 , . . . , fs } en K[X1 , . . . , Xn ] y ae el ideal que generan en K[X1 , . . . , Xn ]. Sea VK (a) el conjunto
de soluciones del sistema de ecuaciones (??) en K‘n. Son equivalentes:
i) El sistema de ecuaciones (??) asociado a {f1 , . . . , fs } es cero-dimensional.
ii) El ideal a es cero-dimensional en K[X1 , . . . , Xn ].
iii) El ideal ae√es cero-dimensional en K[X1 , . . . , Xn ].
iv) El radical √a es intersección finita de maximales de K[X1 , . . . , Xn ].
e
v) El radical a es intersección finita de maximales de K[X1 , . . . , Xn ].
vi) El anillo K[X1 , . . . , Xn ]/a es un anillo de Artin.
vii) El anillo K[X1 , . . . , Xn ]/ae es un anillo de Artin.
7.4. ANILLOS Y MÓDULOS DE ARTIN 251


viii) El anillo K[X1 , . . . , Xn ]/√ a es un anillo de Artin.
e
ix) El anillo K[X1 , . . . , Xn ]/ a es un anillo de Artin.
x) El anillo K[X1 , . . . , Xn ]/a es un K−espacio vectorial de dimensión finita.
xi) El anillo K[X1 , . . . , Xn ]/a√e es un K−espacio vectorial de dimensión finita.
xii) El anillo K[X1 , . . . , Xn ]/√ a es un K−espacio vectorial de dimensión finita.
e
xiii) El anillo K[X1 , . . . , Xn ]/ a es un K−espacio vectorial de dimensión finita.
De nuevo dejamos la demostración para el [AtMc, 69], combinando con el Nullstellensatz de
Hilbert que hemos discutido en el Capı́tulo precedente. Pasemoa a describir algún detalle de lo
que significan estos resultados.
En primer lugar, supongamos que V = VK (a) = VK (ae ) es el conjunto dado por los elementos
siguientes:
V := {ζ1 , . . . , ζD },
donde D = ](V ) es el cardinal del conjunto de soluciones. Se denomina grado de V y se
representa mediante deg(V ) = D. Escribamos R para el anillo K[X1 , . . . , Xn ]/a y escribiremos
K ⊗K R para K[X1 , . . . , Xn ]/ae . Finalmente, escribamos

Rred := K[X1 , . . . , Xn ]/ a,
y √ e
(K ⊗K R)red := K[X1 , . . . , Xn ]/ a .
Proposición 7.4.7. Se dan las siguientes desigualdades e igualdades:
i) Las dimensiones de los espacios vectoriales satisfacen:
dimK (R) = dimK (K ⊗K R) ≥ D.
Además, como R ⊆ K ⊗K R, una base de R como K−espacio vectorial es base de
K ⊗K R como K−espacio vectorial.
ii) Las dimensiones de los espaciones vectoriales satisfacen:
dimK (Rred ) = dimK ((K ⊗K R)red ) = D.
Además, como Rred ⊆ (K ⊗K R)red , una base de Rred como K−espacio vectorial es
base de (K ⊗K R)red como K−espacio vectorial.
Demostración. La idea clave del asunto es el Teorema Chino de los Restos, junto al
Teorema de Akizuki y el Nullstellensatz. Comencemos con el caso de los anillos sobre K.
Como K ⊗K R es zero-dimensional, esto es, artiniano, podemos usar el Teorema Chino de los
Restos y concluir que hay un número finito de ideales maximales m1 , . . . , ms y enteros positivos
n1 , . . . , ns ∈ N tales que
Ys
ae := mni i ,
i=1
y, además, un isomorfismo de anillos:
Qs
ϕ : K ⊗K R = K[X1 , . . . , Xn ]/ae −→ i=1 K[X1 , . . . , Xn ]/mni i
Pero, además, el Nullstellensatz nos dice cómo son los ideales maximales de K[X1 , . . . , Xn ]. Son
todos de la forma mζ := (X1 − z1 , . . . , Xn − zn ), donde ζ := (z1 , . . . , zn ) ∈ Kn . Pero, además,
si ζ ∈ VK (a) entonces mζ ⊇ a y recı́procamente. Luego los ideales maximales m1 , . . . , ms y los
ceros en VK (a) están indenticados. Es decir,
{m1 , . . . , ms } = {mζ1 , . . . , mζD }.
Por tanto, uno puede concluir que
D
Y
ae := mnζii ,
i=
y
D
K ⊗K R ∼
Y
= K[X1 , . . . , Xn ]/mnζii .
i=1
Viendo que K[X1 , . . . , Xn ]/mnζii es un K−espacio vectorial de dimensión al menos 1 tenemos la
desigualdad:
dimK (K ⊗K R) ≥ D.
252 7. SUPLEMENTOS NOETHERIANIDAD

De hecho, hemos entendido mejor que existe una ligazón entre el anillo K ⊗K R y las soluciones
del sistema de ecuaciones. Al exponente ni se le puede denominar la multiplicidad de ζi como
solución del sistema de ecuaciones que define el ideal a.
Para estudiar R y la relación entre R y K ⊗K R, recordemos un sencillo detalle. El conjunto de
todos los monomios es una base de K[X1 , . . . , Xn ]. por su parte a es un subespacio vectorial
y claramente, por ser R de dimensión finita, existe una base de R dada por las clases de
equivalencia de un conjunto finito de monomios, es decir, existe J ⊆ Nn tal que:
β := {X1µ1 · · · Xnµn + a : µ = (µ1 , . . . , µn ) ∈ J},
serı́a una base de R := K[X1 , . . . , Xn ]/a. Es (relativamente) fácil ver que estos mismos
monomios definen una base de K ⊗ R mediante
K ⊗ β := {X1µ1 · · · Xnµn + ae : µ = (µ1 , . . . , µn ) ∈ J}.
Con ello tenemos la igualdad entre las dimensiones como espacios vectoriales (aunque con
respecto a diferentes cuerpos):
dimK (R) = dimK (K ⊗K R) .
Para la otra igualdad bastará con que observemos que “tomar radicales” significa quitar expo-
nentes y, por tanto, tendrı́amos algo como:
D
Y D
Y
ae := mnζii =⇒ ae := mζi .
i= i=

En particular, el Teorema Chino de los Restos implicará un ispmorfismo de anillos que es


isomorfismo de espacios vectoriales (sobre K) del tipo siguiente:
D

Y
(K ⊗K R)red = K[X1 , . . . , Xn ]/mζi .
i=1

Recordemos, además, que los maximales de la forma mζ tienen la propiedad de dar isomorfismos
de anillos (y, por tanto, de K−espacios vectoriales) del tipo
∼ K.
K[X1 , . . . , Xn ]/mζ =
Por tanto,
D
(K ⊗K R)red ∼ = KD ,
K[X1 , . . . , Xn ]/mζi ∼
Y
=
i=1
y tenemos la primera igualdad de dimensiones. Usando de nuevo las bases monomiales, pro-
baremos que
dimK (Rred ) = dimK (K ⊗K R)red = D,
y se conluye el enunciado. 
Observación 7.4.8. Lo importante en este enunciado no es solamente las igualdades entre las
dimensiones, sino, también, cómo son sus descomposiciones y cómo son los isomorfismos.

7.5. Dimensión de Krull


Comencemos con una sencilla propiedad de los espacios topológicos neotherianos. Las nociones
son esencialmente debidas a W. Krull1
1W. Krull estudió en Götingen bajo la dirección de F. Klein y E. Noether. Si bien F. Klein influyó en la
comprensión de la matemática en un sentido amplio, E. Noether dejó en W. Krull todo un programa de trabajo
que ella misma no pudo concluir por el advenimiento de los nazis al poder en Alemania. En su trabajo W. Krull
“Primidealketten in allgemeinen Ringbereichten”. S.–B. Heildelberg Akad. Wiss. 7 (1928), introdujo la noción
de dimensión de un anillo noetheriano, lo que le permitió alcanzar el enunciado del Teorema del Ideal Principal.
Posteriormente influirá a geómetras como C. Chevalley y O. Zariski quienes, a a su vez, continuarı́an la obra
de W. Krull. Entre sus obras, debe destacarse este trabajo de 1928, su trabajo sobre los anillos asociados a
variedades algebraicas de 1938 (en el que introduce los anillos locales regulares) y, sobre todo, su texto W. Krull,
“Idealtheorie”. Springer, 1935. Es a este texto y a su autor a quienes debemos la transformación del conjunto
de resultados de P. Gordan, D. Hilbert y E. Noether, y sus respectivas escuelas, sobre Teorı́a de Invariantes en
una nueva rama del conocimiento matemático hoy conocida como Álgebra Conmutativa.
7.5. DIMENSIÓN DE KRULL 253

Definición 99 (Cerrado irreducible). Sea (X, T ) un espacio topológico, un cerrado C de


X se dice irreducible si no se puede descomponer como unión de cerrados propios, es decirm si
verifica
[
C=V W, V, W ∈ T c =⇒ [C = V ] ∨ [C = W ].

Los cerrados que no son irreducibles se denominan reducibles.

Proposición 7.5.1. Sea (X, T ) un espacio toplógico noetheriano. Entonces todo cerrado posee
una descomposicón única como unión finita de irreducibles. A los irreducibles que aparecen en
esa descomposición se les denomina componenets irreducibles.

Demostración. Se trata de usar, de modo evidente, la noción de Noetheriano. Consid-


eremos el conjunto

F := {V ⊆ X : V es cerrado y no es unión finita de irreducibles}.

Suponganos, por reducción al absurdo, que este conjunto sea no vacı́o. Entonces posee un
elemento minimal que denotaremos por V . Es claro que, como V ∈ F, V no puede ser irreducible
(porque serı́a unión finita de irreducible), luego es reducible y existen W1 , W2 dos cerrados tales
que Wi ( V y
V = W1 ∪ W2 .
Como V es minimal en F concluiremos que Wi 6∈ F, luego, por ser cerrados, han de ser unión
finita de irreducibles. Pero, entonces, V lo es también contradiciendo su minimalidad en F
y permitiéndonos concluir que F = ∅. Usando la minimalidad de todas las desomposiciones
finitas podemos encontrar un mı́nimo y la unicidad. 

Proposición 7.5.2. Sea K un cuerpo K un cuerpo algebraicamente cerrado que le contiene.


Un conjunto algebraico K−definible V ⊆ Kn es irreducible si y solamente si su ideal IK (V ) es
primo en K[X1 , . . . , Xn ].

Demostración. Es obvio y no necesita el Nullstellensatz. Sı́ necesita una cierta condición


de separabilidad por polinomios. Ası́, si IK (V ) es primo y si V = W1 ∪ W2 , entonces, existen
f ∈ IK (W1 ) y g ∈ IK (W2 ) tales que

f |W2 6= 0, g |W1 6= 0.

Simplementre porque W1 6= W2 . Pero f g ∈ IK (V ) mientras que f, g 6∈ IK (V ), contradiciendo


la primalidad de IK (V ).
Para el recı́proco, si f g ∈ IK (V ) y V es irreducible, definamos

W1 := V ∩ V (f ), W2 := V ∩ V (g).

Tendremos V = W1 ∪ W2 y, por ser V irreducible, V = W1 o V = W2 , lo que es equivalente a


decir f ∈ IK (V ) o g ∈ IK (V ), lo que implica la primalidad de IK (V ). 

Proposición 7.5.3. En un anillo noetheriano R, todo ideal radical es una intersección finita
de ideales primos, llamadas componentes primas del ideal.

Demostración. Dado que todo ideal radical es intersección de primos, el argumento es el


mismo de siempre usando la condición noetheriana. 

Observación 7.5.4. El anterior resultado entronca con el clásico Teorema de Lasker-Noether


sobre desomposición primaria de ideales en anillo noteherianos que obviaremos por falta de
tiempo.
254 7. SUPLEMENTOS NOETHERIANIDAD

7.5.1. Dimensión de Krull en espacios topológicos noetherianos. La noción de


dimensión que vamos a desarrollar en esta parte del curso es una noción bien adapatada a los
espacios topológicos neotherianos y basada en una noción intuitivamente muy simple, como son
las cadenas de irreducibles. Ya nos hemos enfrentado a un ejemplo de esta noción : los anillos
artinianos tiene un espacio topológico noethereiano de dimensión 0 y finito.
Definición 100. Sea (X, T ) un espacio topológico noetheriano. Llamaremos dimensión de
Krull de X al máximo de las longitudses de cadenas de irreudcibles de X, es decir el máximo
de los números naturales n ∈ N tales que existen :
∅ ( V0 ( V1 ( · · · ( Vn ⊆ X
donde V0 , . . . , Vn son cerrados irreducibles de X.
Ejemplo 7.5.5. • Para un conjunto algebraico V ⊆ K n , su dimensión de Krull es el
máximo de las longitudes de cadenas de conjuntos algebraicos irreducibles contenidos
en V .
• Lo mismo podemos decir de la dimensión de los conjuntos algebraicos proyectivos.
• Como primera observación concerniente a estos tres casos, si K es un cuerpo infinito,
la dimensión de un cerrado en las topologı́as de Zariski K n y Pn (K) de un cerrado 0
si y solamente si están formados por un conjunto finito de puntos.
• Dado un cerrado V ⊆ Spec(A), llamaremos dimensión de Krull de V al máximo de
las longitudes de cadenas de irreducibles contenidos en V . En esta caso, podemos
encontrar cerrados de dimensión 1 formados por un conjunto finitio de puntos.
Definición 101. Llamaremos dimensión de Krull de un anillo A a la dimensión de Krull de
Spec(A).

Ejemplo 7.5.6. Los anillos artinianos tienen dimensión 0. Los conjuntos finitos de puntos de
K n tienen dimensión de Krull 0.

Definición 102. Sea A un anillo y p un ideal primo de A.


i) Llamaremos altura de p al máximo de las longitudes de cadenas de ideales primos de
A contenidas en p, esto es, el máximo de los números naturales n ∈ N tales que exite :
p0 ( p1 ( · · · ( pn ⊆ p
donde p0 , . . . , pn son ideales primos de A. Lo denotaremos por ht(p).
ii) Llamaremos coaltura de p al máximo de las longitudes de cadenas de ideales primos
de A que contienen a p, esto es, el máximo de los números naturales n ∈ N tales que
exite :
p ⊆ p0 ( p1 ( · · · ( pn
donde p0 , . . . , pn son ideales primos de A. Lo denotaremos por coht(p).
Proposición 7.5.7. Sea A un anillo. Sea tiene :
i)
dimKrull (A) = max{ht(p) : p ∈ Spec(A)} = max{coht(m) : m ∈ Spm(A)}
ii)
dimKrull (A) = max{coht(p) : p ∈ Spec(A)}
iii) Si A es noetheriano,
dimKrull (A) = max{coht(p) : p ∈ Ass(A)}
Demostración. Para las dos primeras afirmaciones baste con observar la biyección exis-
tente entre los irreducibles de Spec(A) y los ideales primos de A. La tercera, el caso noetheriano,
se sigue del hecho de que los ideales primos minimales de A están entre los ideales primos aso-
ciados a A. 

Definición 103. Sea a un ideal de un anillo A.


i) Llamaremos altura del ideal a al ı́nfimo de las alturas de los ideales primos que con-
tienen a a. Lo denotaremos por ht(a).
7.5. DIMENSIÓN DE KRULL 255

ii) Llamaremos coaltura del ideal a al máximo de las coalturas de los ideales primos que
contienen al ideal a. Lo denotaremos por coht(a).
En ocasiones a la altura se la denomina codimensión, mientras a la coaltura de la denomina
dimensión del ideal.

Proposición 7.5.8. Sea A un anillo, a un ideal de A, p un ideal primo de A.


i)
dimKrull (A/a) = coht(a)
ii)
dimKrull (Ap ) = ht(p)
iii)
ht(a) + coht(a) ≤ dimKrull (A)
Demostración. Las dos primeras afirmaciones son obvias para el conocimiento actual de
los alumnos. En ucanto a la tercera, es fácil probarla para los ideales primos de A. Para un
ideal cualquiera a, si coht(a) = coht(p) y p es un primo que contiene a a, entonces, p es minimal
sobre a. De otro lado, ht(a) es elı́nfimo de las alturas de los primos minimales conteniendo al
ideal a. 

Definición 104. Sea M un A−módulo. Llamaremos dimensión de Krull de M a la dimensión


del espacio topológico asociado a M : Supp(M ), es decir,
dimKrull (M ) = dimKrull (Supp(M ))

Proposición 7.5.9. Si A es un anillo noetheriano y M es un A−módulo finitamente generado,


se tiene :
dimKrull (M ) = dimKrull (A/Ann(M )) = coht(Ann(M ))
Demostración. Obvio 

Ejemplo 7.5.10. • Si K es un cuerpo algebraicamente cerrado y V ⊆ K n es un con-


junto algebraico, se tiene :

dimKrull (V ) = dimKrull (K[V ]) = coht(I(V ))


• Obsérvese que en cuerpos finitos, la dimensión de todo conjunto algebraico V ⊆ K n
es 0, mientras los ideales pueden tener diversas alturas (cf. Problemas).
• Los dominions de ideales principales son anillos noetherianos cuya dimensión de Krull
es igual a 1. El recı́proco no es cierto. Baste copnsiderar el anillo C[X, Y ]/(X 2 + Y 2 )
que es un anillo noetehriano de dimensión de Krull igual a 1, pero el maximal definido
por las clases de X, Y no es rpincipal.
• Los anillos de valoración discreta y los dominios de Dedekind son de dimensión de
Krull 1.

Es interesante observar el buen comportamiento de la dimensión de Krull con extensiones


enteras de anillos. Eso es lo que vamos a ver en el siguiente :
Teorema 7.5.11. Sea A ⊆ B una extensión entera de anillos, entonces :
dimKrull (A) = dimKrull (B)
Demostración. Usaremos las propiedades elementales demostradas en nuestro estudio de
los teoremas del Ascenso y del Descenso. En primer lugar, la operación de contracción define
una aplicación suprayectiva entre Spec(B) y Spec(A), que transforma ideales maximales de B
en ideales maximales de A. Recordemos también que no hay inclusión estricta entre los ideales
primos de B que se contraen sobre el mismo ideal primo de A. Ası́, consideremos una cadena
de ideales primos de B :
P0 ( P1 ( · · · ( P n
256 7. SUPLEMENTOS NOETHERIANIDAD

y sean pi := Pi ∩ A, sus contracciones en A. Por la propiedad sobre la inclusión estricta,


pi ( pi+1 . Y tendremos
dimKrull (B) ≤ dimKrull (A)
Recı́procamente, consideremos una cadena de ideales primos de A :
p0 ( p1 ( · · · ( pn
Existirá P0 un ideal primo de B que se contrae sobre p0 . Aplicando el teorema del Ascenso,
construiremos unos ideales primos Pi de B tales que Pi se contrae sobre pi y la siguientees una
cedna de ideales primos de B :
P0 ( P1 ( · · · ( P n
luego
dimKrull (A) ≤ dimKrull (B)
y hemos terminado la prueba. 

Podemos observar también la relación entre las nociones de dimensión que afectan a los con-
juntos algebraicos proyectivos y sus partes afines. Para ello disponemos del siguiente :
Teorema 7.5.12 (Dimensión en Pn (K)). Sea V ⊆ Pn (K) un conjunto algebraico proyectivo,
sin componentes en el hiperplano del infinito.
i) La dimensión de V es igual a la dimensión de su cono propyectante menos uno, es
decir :
dimKrull (V ) = dimKrull (π −1 (V )) − 1
ii) Si V no posee componentes en el hiperplano del infinito, sea V ∩ K n la parte afı́n de
V , entonces,
dimKrull (V ) = dimKrull (V ∩ K n )
iii) Si W ⊆ K n es un conjunto algebraico afı́n, sea W ⊆ Pn (K) su clausura proyectiva.
Entonces,
dimKrull (V ) = dimKrull (W )
iv) V tiene dimensión de Krull 0 si y solamente si consta de un número finito de puntos.
Demostración. Recordando que π : K n+1 \ {(0, . . . , 0)} ←- Pn (K) transforma conjuntos
algebraicos en algebraicos, 

Proposición 7.5.13. Sea V ⊆ Pn (K) un conjunto algebraico proyectivo, K algebraicamente


cerrado y m := (X0 , . . . , Xn ) ideal maximal de K[X0 , . . . , Xn ]. Denotemos por m := m/I(V )
que es un ideal maximal del anillo graduado K[V ]. Entonces,
dimKrull (V ) + 1 ( en Pn (K) ) ≥ ht(m) ( en K[V ])
Demostración. Tenemos una biyección entre los conjuntos algebraicos irreducibles no
vacı́os contenidos en V y los ideales primos homogéneos de K[X0 , . . . , Xn ] que contienen a I(V )
y definen una variedad no vacı́a en Pn (K), luego se trata de probar que ht(m) coincide con el
máximo de las longitudes de cadenas de ideales primos homogéneos que definen una variedad
no vacı́a en Pn (K) :
I(V ) ⊆ p0 ( · · · ( pr
La desigualdad es obvia, pues todo ideal primo homogéneo está contenido en m, basta con
considerar la cadena :
I(V ) ⊆ p0 ( · · · ( pr ⊆ m
Como VPn (K) (pr ) 6= ∅, el último es un contenido estricto. 

Una curiosa propiedad de los anillos noetherianos relaciona factorialidad y altura de los ideales
primos minimales sobre un ideal principal. Pero insistiremos en esa idea a la luz del Teorema
del Ideal Principal de Krull. Por el momento veremos :
Lema 7.5.14. Si A es un dominio noetheriano y f, g ∈ A \ {0}, f no unidad en A, entonces
existe y es finito el número dado por :
max{n ∈ N : f n | g}
7.5. DIMENSIÓN DE KRULL 257

Demostración. Si f no divide a g ese máximo es 0 y no hay nada que probar. En caso


contrario, podrı́amos construir una cadena infinita creciente estrictamente de naturales positivos
kn ∈ N, n ∈ N tales que f kn | g. Ası́ las cosas, se hn ∈ A tal que hn f kn = g y tenemos la
siguiente cadena ascendente de ideales de A :
(h0 ) ⊆ (h1 ) ⊆ · · · ⊆ (hn ) ⊆ · · ·
Para verlo, baste ver que hn es divisible por hn+1 .
g = hn f kn = hn+1 f kn+1 = hn+1 f kn+1 −kn f kn
Por ser A dominio, f 6= 0 y g 6= 0, concluimos :
hn = hn+1 f kn+1 −kn
Ahora la cadena ha de estabilizarse, luego :
hn+1 = un+1 hn
con lo cual, obtendremos
hn = hn+1 f kn+1 −kn = un+1 f kn+1 −kn hn
De nuevo la condición de dominio de A implicarı́a que f es una unidad y habremos llegado a
contradicción . 

Lema 7.5.15. Si A es un dominio noetheriano, todo ideal primo, principal distinto de (0), tiene
altura 1.
Demostración. Supongamos p = (f ) un ideal primo y principal de un dominio noetheri-
ano A. Sea p0 ⊆ p un ideal primo estrictamemnte contenido en p. Supongamos que p0 no es el
ideal (0) de A y sea g ∈ p0 un elemento no nulo de p0 . Dado que f no es unidad de A y f 6= 0,
sea n la máxima potencia de f que divide a g. Claramente n ≤ 1 y tendremos :
g := hf n
donde h 6∈ p. Ahora, si f 6∈ p0 , concluirı́amos h ∈ p0 ⊆ p, f divide a h y tenemos una
contradicción. 
Lema 7.5.16. Si A es un dominion noetheriano y q es un ideal p−primario, donde p es un ideal
principal, entonces, existe n ∈ N tal que pn = q y q es un ideal principal.
Demostración. Supongamos que p = (f ), hallemos la mı́nima potencia de f que se
encuentra en q : f r ∈ q. Es claro que pr = (f r ) ⊆ q, pero veamos el recı́proco : Si g ∈ q, sea
n la máxima potencia de f que divide a g. Entonces, g = hf n y h 6∈ p. Entonces, por ser q
primario, f n ∈ q, luego n ≥ r y g ∈ (f r ) = pr . 

Proposición 7.5.17. Un dominio noetheriano A es un dominio de factorización única si y


solamente si los ideales primos asociados a un ideal principal son también principales.
Demostración. Supongamos que A es un D.F.U. y sea (f ) un ideal principal. Entonces,
existen elemntos primos distintos f1 , . . . , fn ∈ A tales que :
f := f1k1 · · · fnkn (∗)
Obsérvese que
(f1k1 ) · · · (fnkn ) = (f1k1 ) ∩ · · · ∩ (fnkn )
Para verlo baste hacer inducción en n. Si n = 1, no hay nada que probar. Para el caso n ≥ 2,
sea g ∈ (f1k1 ) ∩ · · · ∩ (fnkn ) y sea k l máxima potencia de f1 que divide a g . Entonces, k ≥ k1
y supongamos g = hf k . Claramente f no divide a h y f k no es un elemento de (fi ) para
2 ≤ i ≤ n. Por lo tanto, siendo (fiki ) un ideal primario, h ∈ (fiki ), 2 ≤ i ≤ n. Aplicando la
hipótesis inductiva habremos terminado.
Por lo tanto, la identidad (∗) nos ofrece una descomposición primaria del ideal (f ) con primos
asociados (f1 ), . . . , (fn ). Como son todos distintos, la descomposición primaria es irredundante
y los ideales primos asociados a A/(f ) son justamente los de esta lista.
Para ver el recı́proco, sea f ∈ A un elemento no nulo y no unidad. Sea
(f ) = q1 ∩ · · · ∩ qn
258 7. SUPLEMENTOS NOETHERIANIDAD

una descomposición primaria irredundante del ideal (f ) de A, donde qi es pi −primario. En


consecuencia, pi = (fi ) donde fi es primo e irreducible de A. En particular, qi := (fiki ) y
tendremos, usando un argumento similar al del apartado anterior, que :
(f ) := (f1k1 · · · fnkn )
Luego existe una unidad u ∈ A tal que :
f = uf1k1 · · · fnkn
La unicida de la factorización se seguirá de la unicidad de las descomposiciones primarias en
anillos noetherianos, con escaso esfuerzo adicional. 

7.6. Cuestions y Problemas


Part 3

Sublimando el pensamiento de Noether


: Álgebra Local
CAPı́TULO 8

EL Teorema de la Dimensión Local

Índice
8.0.1. El Polinomio de Hilbert-Samuel 261
8.0.1.1. Algunas Hipótesis 262
8.0.2. Teorema de la Dimensión Local 268

8.0.1. El Polinomio de Hilbert-Samuel.


Definición 105. Sea f : N −→ Q una aplicación. Diremos que f es una aplicación polinomial
si existen n0 ∈ N y q ∈ Q[T ] tales que :
f (n) = q(n), ∀n ≥ n0

Proposición 8.0.1. Si f : N −→ Q es una aplicación polinomial, existe un único polinomio


q ∈ Q[T ] que coincida con f salvo en un número finito de puntos. Ası́, podemos hablar del
coeficiente director de f y del grado de f como el coeficiente director y el grado del polinomio
asociado.
Demostración. Baste notar que dos polinomios de Q[T ] no pueden tener un número
inifinito de raı́ces comunes en N. 

Notación 8.0.2. • Si el polinomio asociado a una función polinomial es el polinomio


nulo, diremos que el grado de la función polinomial es −1. Si es una constante no
nule, diremos que el grado de f es 0.
• Sea f : N −→ Q una aplicación cualquiera. Por inducción en r, definiremos las
aplicaciones incremento siguientes :
∆0 (f ) := f

∆r (f ) := ∆r−1 f (n + 1) − ∆r−1 f (n)


Lema 8.0.3. Sea f : N −→ Q una aplicación. Entonces, f es un aplicación polinomial de grado
d si sy solamente si ∆f : N −→ Q es una función polinomial de grado d − 1. Además, el
coeficiente director de f es el coeficiente director de ∆f dividido por d.
Demostración. • Es casi obvio, si q ∈ Q[T ] es el polinomio asociado a f , el
polinomio asociado a ∆f es el polinomio dado por :
q 0 (T ) := q(T + 1) − q(T ) ∈ Q[T ]
que tiene claramente grado d − 1 y su coeficiente director es dado por la siguiente regla
Pd
de cálculo : Si q(T ) := i=0 ak T k ,
d
X
q 0 (T ) := ak ((T + 1)k − T k ) = dad T d−1 + g(T )
k=0

donde g es un polinomio de grado a lo más d − 2.


• Es la parte más importante de la prueba y la que nos dará argumentos inductivos más
adelante. Supongamops h ∈ Q[T ] una función polinomial de grado d − 1 coincidiendo
con ∆f . Hagamos inducción en deg(h).
261
262 8. EL TEOREMA DE LA DIMENSIÓN LOCAL

– Si deg(h) = 0, entonces, ∆f es una constante. Supongamos c ∈ Q tal que


∆f (n) = c para n ≥ n0 . Tenemos la siguiente relación :
f (n + 1) = f (n) + c, ∀n ≥ n0
En este caso, sea a := f (n0 ) y se tiene :
f (n) := c(n − n0 ) + a
– Supuesto probado para el caso deg(h) ≥ r − 1, veamos qué sucede con el caso
deg(h) = r : Sea
h(t) := ar T r + · · · + a0
y tenemos la siguiente relación para n ≥ n0 :
ar 
(n + 1)r+1 − nr+1 + g(n)

∆f (n) = f (n + 1) − f (n) =
r+1
donde g ∈ Q[T ] es un polinomio de grado menor o igual que r − 1. Definamos
ahora la aplicación polinomial :
ar+1
f ∗ (n) := f (n) −
r+1
Observamos que
∆f ∗ = f ∗ (n + 1) − f ∗ (n) = g(n)
Aplicando la hipótesis inductiva podremos concluir que f ∗ es una aplicación poli-
nomial de grado r y, por su definición, también f ha de ser una aplicación polino-
mial (de grado r + 1 en este caso). Las relaciones entre los coeficientes directores
son obvias.


8.0.1.1. Algunas Hipótesis.


• Sea A := ⊕n An un anillo graduado. Supongamos que el anillo A0 es un anillo artiniano
y que existan elementos x1 , . . . , xr ∈ A1 generando A como A0 −álgebra. Por lo visto
en la Sección ?? el anillo A es noetheriano.
• En las mismas condiciones, sea M := ⊕n Mn un A−módulo graduado finitamente
generado. Por ser A noetheriano, M es también noetheriano y cada subgrupo Mn es un
A0 −módulo finitamente generado. Como A0 es artiniano, cada Mn es un A0 −módulo
artiniano y, por ende, de longitud finita. Tiene sentido, pues, considerar :
`A0 (Mn )

Proposición 8.0.4 (Polinomio de Hilbert). Bajo las hipótesis anteriormente descritas, la sigu-
iente función χ(M, −), dada por :
χ(M, −)N −→ N
χ(M, n) := `A0 (Mn )
es una aplicación polinomial de grado menor o igual que r − 1 (recordemos que r es el número
tal que x1 , . . . , xr ∈ A1 , generan A como A0 −álgebra).
Demostración. Haremos la demostración por inducción en r.
• r = 0 : En este caso A = A0 . Ahora, dado un conjunto finito S de generadores
homogéneos de M como A0 −módulo, sea :
n0 := max{deg(s) : s ∈ S}
Claramente, Mn = (0) para n ≥ n0 y se tiene χ(M, n) = 0, para n ≥ n0 .
• r ≥ 1 : Supongamos que el resultado es cierto para todos los módulos graduados
finitamente generados sobre anillos graduados noetherianos, verificando las hipótesis
anteriores, cuyos generadores en A1 como A0 −módulos son menos de r − 1. Consid-
eremos el siguiente morfismo graduado de grado 1 entre A−módulos :
(xr )M : M −→ M
8. EL TEOREMA DE LA DIMENSIÓN LOCAL 263

dado por (xr )M (m) := xr m. Ahora, xr Mn ⊆ Mn+1 nos permite considerar las re-
stricciones a Mn de ese morfismo y obtener morfismos de A0 −módulos
ϕn := xr |Mn : Mn −→ Mn+1
la cual nos permite construir la siguiente sucesión exacta de A0 −módulos :
0 −→ Kn −→ Mn −→ Mn+1 −→ Cn+1 −→ 0
donde Kn := Ker(ϕn ), y
Cn+1 := Mn+1 /Im(ϕn )
Definamos :
M M
K := Ker(xr )M := Kn , C := (Mn+1 )/Im(ϕn ) = M/Im(xr )M = CoKer(xr )M
n n≥−1

Tanto K como C son dos A−módulos noetherianos y se verifican las hipótesis ante-
riores a la Proposición, luego podemos considerar χ(K, −) y χ(C, −), observando la
siguiente relación :
∆χ(M, −) := χ(C, n + 1) − χ(K, n)
Ahora bien, tanto C como K son A0 −módulos, cuando A0 es el módulo graduado
A/(xr ), con la graduación cociente (que tiene sentido por ser xr un elemento ho-
mogéneo de grado 1). Ahora observamos que xr ∈ AnnA (K) y xr ∈ AnnA (C), luego
sus estructuras como A−módulos u su estructura como A0 −módulos coinciden. Lo
mismo se puede decir de las graduaciones y observamos que A0 está generado como
A0 −álgebra por las clases módulo (xr ) definidas por {x1 , . . . , xr−1 }. Podemos aplicar
la hipótesis inductiva y χ(K, −) y χ(C, −) son aplicaciones polinomiales de grado
menor o igual que r − 2. Retomando el Lema previo, χ(M, −) será una aplicación
polinomial de grado a lo más r − 1.


Definición 106. A la función χ(M, −) se la denomina función de Hilbert de M . Al polinomio


en Q[T ] coincidente con χ(M, −) se le denomina polinomio de Hilbert y se le denota también
por χ(M, −). Al grado de χ(M, −) se le denomina dimensión de Hilbert de M y a su coeficiente
director se le denomina grado de M . Al número natural n0 tal que la función polinomial coincide
con el polinomio se le denomina “regularidad de la función de Hilbert” de M .

Ejemplo 8.0.5. • Sea V ⊆ Pn (K) un conjunto algebraico proyectivo. Consideremos


I(V ) que es un ideal homogéneo de K[X0 , . . . , Xn ] y consideremos el anillo graduado
cociente :
K[V ] := K[X0 , . . . , Xn ]/IK (V )
Este es un anillo graduado, noetheriano, cuyos elementos homogéneos de grado 0
son justamente los elementos del cuerpo K. Si denotamos por hn (V ) los elementos
homogéneos de grado n en I(V ), tendremos que la función de Hilbert de K[V ] viene
dada por :
χ(K[V ], m) := dimHm (X0 , . . . , Xn ) − dimhm (V )
para cualquier m ∈ N, donde la dimensión se refiere a la dimensión como K−espacio
vectorial. En particular, observamos que el grado de χ(K[V ], −) está acotado por
n y es una función polinomial. Ası́, el grado de la función de Hilbert de Pn (K) es
justamente n y el grado de la función de Hilbert de ∅ es justamente −1. Llamare-
mos dimensión del Hilbert de V al grado de ese polinomio de Hilbert de K[V ]. Y
llamaremos grado proyectivo de V al valor dado por :
– Si a0 es el coeficiente director de χ(K[V ], −).
– Y si d es el grado de χ(K[V ], −),
El grado de V es dado por :
a0 d!
Volveremos más adelante sobre estas nociones.
• Demos un método para calcular la función de Hilbert de este anillo :
264 8. EL TEOREMA DE LA DIMENSIÓN LOCAL

– Sean {g1 , . . . , gs } polinomios homogéneos, deg(gi ) = mi , generando I(V ).


– Para m ≥ max{m1 , . . . , ms }, se observa que un polinomio homogéneo de grado
m, f ∈ K[X+ 0, . . . , Xn ], está en hm (V ) si y solamente si existen polinomios
homogéneos hi de grado m − mi tales que
s
X
f= hi gi
i=1

– El procedimiento será como sigue :


∗ Considerar todos los monomios
β := {X µ : µ ∈ Nn+1 , | µ |≤ m}
como base de Hm (X0 , . . . , Xn ).
∗ Considerar todos los monomios de la forma :
{X µ gi : | µ |= m − mi }
por sus coordenadas en la base β.
∗ Sea A la matriz cuyas filas son los vectores de la anterior colección. En-
tonces, el rango de A es la dimensión de hm (V ) y podemos calcular la
función de Hilbert de K[V ] por ser conocido
 
m+n
dimHm (X0 , . . . , Xn ) =
n
• Consideremos ahora (A, m) un anillo local noetheriano. Llamaremos “ideal de definición”

de A a todo ideal q tal que q = m, es decir, tal que existe n ∈ N, n ≥ 1 tal que :
mn ⊆ q ⊆ m
Sea ahora M un A−módulo finitamente generado y consideremos tanto en A como
en M la filtración q−ádica, definida por el ideal q, ası́ como los graduados (anillos y
módulo) asociados :
M M
Gq (A) := qn /qn+1 , Gq (M ) := qn M/qn+1 M
n∈N n∈N

Por ser q un ideal de definición de A y A un anillo local de maximal m, el único


maximal de A/q es m/q, por lo que éste anillo es artiniano. Además, las clases módulo
q2 de los elementos de q generan Gq (A) como A/q−álgebra. Dado que q es finitamente
generado, las clases defnidas por los generadores de q en q/q2 , generan Gq (A) como
A/q−álgebra. Además, Gq (M ) es un Gq (A)−módulo finitamente generado.

Proposición 8.0.6. Si (A, m) es un anillo local noetheriano, q un ideal de definición de A y M


un A−módulo finitamente gereando, las funciones χ(Gq (M ), −) y χ(Gq (A), −) son Aplicaciones
polinomiales y su grado está cotado por r−1, donde r es el mı́nimo de los cardinales de conjuntos
generadores de q como ideal de A.
Demostración. La prueba ha sido desarrollada en la discusión del ejemplo anterior. 

Ejemplo 8.0.7. Bajo las hipótesis del apartado ii) del ejemplo anterior, observemos que
Supp(M/qn M ) = {m}
como A−módulo. Claramente, pues qn tiene que estar contenido en AnnA (M ), luego m es el
único ideal primo de A que contiene a qn . Dicho de otra manera, M/qn M es un A−módulo
finitamente generado y su soporte está formado solamente por ideales maximales de A. Por el
Teorema de Akizuki para módulos, deducimos que M/qn M es un A−módulo de longitud finita
y podemos considerar :
`A (M/qn M ) < +∞
8. EL TEOREMA DE LA DIMENSIÓN LOCAL 265

Proposición 8.0.8 (Polinomio de P. Samuel). En las condiciones de los ejemplos anteri-


ores, definamos la función de Samuel de M :
Pq (M, −) : N −→ N
dada por :
Pq (M, n) := `A (M/qn M )
Entonces, Pq (M, −) es una función polinomial cuyo grado está acotado por el mı́nimo de los
cardinales de los conjuntos generadores de q. Además se tiene la siguiente relación :
∆Pq (M, n) = χ(Gq (M ), n)
Demostración. Consideremos la siguiente sucesión exacta corta de A/q−módulos :
0 −→ qn M/qn+1 M −→ M/qn+1 M −→ M/qn M −→ 0
donde el último morfismo es la proyección canónica. Se trata de una sucesión exacta corta de
A−módulos de longitud finita puesto que Supp(qn M/qn+1 M ) = {m} es el único maximal de
A. Tenemos la siguiente relación entre las respectivas longitudes :
`A (M/qn+1 M ) − `A (M/qn M ) = `A (qn M/qn+1 M )
Ahora,
q ⊆ AnnA (qn M/qn+1 M )
luego la estructura de A−módulo y la de A/q−módulo en qn M/qn+1 M coinciden. Tambi’en lo
hará la longitud (que sólo depende de los respectivos submódulos). Podremos concluir ası́ :
∆Pq (M, n) := Pq (M, n + 1) − Pq (M, n) = χ(Gq (M ), n)
y tenemos el resultado apetecido. 

Nos queda por observar que el grado del polinomio de Samuel no depende del ideal de definición
elegido. Eso nos lo garantiza la siguiente :
Proposición 8.0.9. Sea (A, m) un anillo local noetheriano, q un ideal de definición de A y
M un A−módulo finitamente generado. Entonces, los grados de los polinomios de Samuel
Pq (M, −) y Pq (M, −) coinciden. En particular, el grado del polinomio de Samuel no depende
el ideal de definición elegido. Llamaremos dimensión de Samuel de M al grado de su polinomio
de Samuel con respecto a cualquier ideal de definición de (A, m).
Demostración. Sea m ∈ N tal que mn ⊆ qm. Para cada n ∈ N tenemos :
mnm ⊆ qn ⊆ mn
con lo que podemos considerar los siguientes epimorfismos de A−módulos :
M/mn M −→ M/qn M
M/mnm M −→ M/qn M
Por lo tanto, tendremos :
`A (M/mn M )`A (M/qn M ) ≤ `A (M/mnm M )
Lo que se transforma en la siguiente relación entre funciones de Samuel :
Pm (M, n) ≤ Pq (M, n) ≤ Pm (M, nm)
Dado que tanto Pm (M, −) como Pq (M, −) son funciones polinomiales, la anterior relación im-
plica una relación de igualdad de grado. 

Observación 8.0.10. Los coeficientes directores de los polinomios de Samuel son posiotivos,
pues M/qn M = (0) ⇒ M = (0) por el Lema de Nakayama. Luego, salvo en ese caso, Pq (M, n) ≥
0, De otro lado, si d = deg(Pq (M, T )) = deg(Pm (M, T )) sea ad el coeficiente director de
Pq (M, T ) mientras bd es el coeficiente director de Pm (M, T ). Ambos son números racionales
positivos y verificarán la relación :
bd ≤ ad ≤ bd md
donde m es tal que mm ⊆ q ⊆ m.
266 8. EL TEOREMA DE LA DIMENSIÓN LOCAL

Un instrumento técnico de gran utilidad en lo que sigue es la siguiente Proposición que relaciona
los polinomios de Samuel y las sucesiones exactas cortas :
Proposición 8.0.11. Sea (A, m) un anillo local noetheriano, q un ideal de definición de A y la
sucesión exacta corta de A−módulos finitamente generados :
0 −→ M 0 −→ M −→ M 00 −→ 0
Entonces, existe una aplicación polinomial R : N −→ Q, cuyo grado es estrictamente menor
que el grado de Pq (M, T ), siendo el coeficiente director de R no negativo, y verificándose :
Pq (M 0 , n) + Pq (M 00 , n) = Pq (M, n) + R(n), ∀n ∈ N
Demostración. A partir de nuestra sucesión exacta corta, podemos obtener la siguiente :
0 −→ M 0 /(M 0 ∩ qn M ) −→ M/qn M −→ M 00 /qn M 00 −→ 0
que es también una sucesión exacta corta de A−módulos de longitud finita. Tendremos la
siguiente relación :
`A (M/qn M ) = `A (M 00 /qn M 00 ) + `A (M 0 /(M 0 ∩ qn M )) (∗)
Denotemos por Mn0 := M 0 ∩ qn M , submódulo de M 0 y tendremos una filtración en M 0 definida
por la filtración q−ádica de M . Por el Lema de Artin-Rees, existirá un n0 ∈ N tal que
qMn0 = Mn+1
0
, ∀n ≥ n0
En particualr, para cada n ∈ N, tendremos :
qn0 +n M 0 ⊆ Mn+n
0
0
= qn Mn0 0 ⊆ qn M 0
lo que supone en términos de longitudes :
`A (M 0 /qn M 0 ) ≤ `A (M 0 /Mn+n
0
0
) ≤ `(M 0 /qn+n0 M 0 ) (∗∗)
En otras notaciones :
Pq (M 0 , n) ≤ `A (M 0 /Mn+n
0
0
) ≤ Pq (M 0 , n + n0 )
Resulta claro que tanto Pq (M, −) como `A (M 0 /Mn0 ) son aplicaciones polinomiales. La primera
por el resultado de Samuel y la segunda por la identidad descrita en (∗). La relación (∗∗)
nos garanetiza que ambas funciones polinomiales poseen el mismo grado y el mismo coeficiente
director. Podemos considerar R : N −→ Q dada por :
R(n) := Pq (M, n) − `A (M 0 /Mn0 )
Por la relación (∗∗) deducimos también que R es positiva a partir de n0 , luego su coeficiente
director es un número no negativo. Finalmente, es claro de la relación (∗) que R verifica las
propiedades requeridas :
Pq (M 0 , n) + Pq (M 00 , n) = Pq (M, n) + R(n), ∀n ∈ N


Definición 107. Llamaremos dimensión de Samuel ( o de Hilbert-Samuel) de un A−módulo


M verifiucando las propiedades anteriormente descritas al grado de Pq (M, T ), para cualquier
ideal de definición q de (A, m).

Corollario 8.0.12. Sea (A, m) un anillo local noetheriano, q un idela de definición de A, M


un A−módulo finitamente generado y N un submódulo de M . Entonces,
dimHilbert−Samuel (N ) ≤ dimHilbert−Samuel (M )

dimHilbert−Samuel (M/N ) ≤ dimHilbert−Samuel (M )


8. EL TEOREMA DE LA DIMENSIÓN LOCAL 267

Demostración. Baste tomar la sucesión exacta corta :


0 −→ N −→ M −→ M/N −→ 0
yaplicar la Proposición anterior. Entonces,
Pq (N, n) + Pq (M/N, n) = Pq (M, n) + R(n)
dado que el grado de R es menor estricto que el grado de Pq (M, −), y que la función de Samuel
es positiva, tendremos que los coeficientes directores de Pq (N, −) y Pq (M/N, −) son números
positivos y los grados no son mayores que el grados de Pq (M, −) 

Un bonita manera de ver el comportamiento del polinomio de Samuel, será la dada por la
siguiente argumentación :
Proposición 8.0.13. Sea (A, m) un anillo local noetheriano. Sea K := A/m el cuerpo cociente,
por se m un ideal maximal. Ahora observamos que para {x1 , . . . , xr } ⊆ m son equivalentes :
• Las clases {x1 + m2 , . . . , xr + m2 } son una base del K−espacio vectorial m/m2 .
• {x1 , . . . , xr } son un sistema generador de cardinal minimal del ideal m.
Demostración. Para demostrar este resultado, baste observar que, gracias al Lema de
Nakayama, si {x1 + m2 , . . . , xr + m2 } generan m/m2 como K−espacio vectorial, también lo
generan como A−módulo, luego generan m como ideal de A. Si hubiera un sistema generador
de m como ideal con menos de r elementos, sus clases módulo m2 generarı́an m/m2 como espacio
vectorial, contraviniendo la hipótesis de que r es la dimensión de tal esopacio. Recı́procamente,
si {x1 , . . . , xr } son de cardinal minimal generando m como ideal, sus clases son un sistema
generador del espacio vectorial m/m2 . Si no fueran una base, un subconjunto propio suyo
también generarı́a ese espacio vectorial y, levantando con Nakayama, generarı́a m como ideal,
contradiciendo la minimalidad de r. 

Esta afirmación sobre m/m2 tiene su interés en el siguiente :


Corollario 8.0.14. En las notaciones anteriores, sea (A, m) un anillo local noetheriano y r el
mı́nimo de los cardinales de los generadores de m como ideal de A. Entonces, Pm (A, T ) tiene
grado r si y sólo si Gm (A) es un anillo de polinomios en r variables con coeficientes en el cuerpo
K := A/m.
Demostración. Sean {x1 , . . . , xr } un conjunto de cardinal minimal de generadores de m
como ideal de A. Definamos el epimorfismo de K−álgebras graduadas de grado 0 :
ϕ : K[X1 , . . . , Xr ] −→ Gm (A)
donde ϕ(Xi ) = xi , 1 ≤ i ≤ r. El grado del polinomio de Samuel es r si y solamente si ϕ es un
isomorfismo. Para verlo, baste con tomar a := Ker(ϕ) ideal de K[X1 , . . . , Xr ]. Tomemos los
respectivos polinomios de Hilbert, para lo cual consideramos la sucesión exacta corta :
0 −→ a ∩ Hm (X1 , . . . , Xr ) −→ Hm (X1 , . . . , Xr ) −→ mn /mn+1 −→ 0
Como a es un ideal homogéneo de K[X1 , . . . , Xr ], am := a ∩ Hm (X1 , . . . , Xr ) son los polinomios
homogéneos de grado m en I. dado que una de las implicaciones es evidente, supongamos que
el grado del polinomio de Hilbert es r − 1. A partir de la sucesión exacta anterior, tendremos
la siguiente relación :  
n+r−1
χ(Gm (A), n) = − `A (an )
r−1
Sea ahora f ∈ ad un elemento homogéneo no nulo de grado d. Para cada número natural
n ∈ N, se tiene f Hn (T1 , . . . , Tr ) ⊆ In+d . Como K[T1 , . . . , Tr ] es un dominio de integridad, f no
es divisor de cero y la homotecia definida por f es inyectiva, luego
dimK (f Hn (T1 , . . . , Tr )) = dimK (Hn (T1 , . . . , Tr )
En particular, concluimos la siguiente relación entre longitudes :
`K (an+1 ) ≥ `K (f Hn (T1 , . . . , Tr ))`K (Hn (T1 , . . . , Tr ) ≥ `K (an )
Tendremos que los polinomios de Hilbert de K[T1 , . . . , Tr ] e a son aplicaciones polinomiales del
mismo grado y mismo coeficiente director. De la igualdad (∗) deducirı́amos deg(χ(Gm (A), −) <
r − 1. 
268 8. EL TEOREMA DE LA DIMENSIÓN LOCAL

Corollario 8.0.15. En las mismas hipótesis anteriores, para cualquier ideal de definición q
de A, deg(Pq (A, −)) = r si y solamente si Gm (A) es un anillo de polinomios en r variables.
8.0.2. Teorema de la Dimensión Local. El objetivo de esta Sección es demostrar el
Teorema de dimensión local para anillos locales noetherianos y módulos finitamente generados
sobre estos anillos. Ası́ como algunas de sus consecuencias más inmediatas. Además de la
dimensión de Krull en anillo y módulos, disponemos de las siguientes nociones de dimensión :
Definición 108. Dado (A, m) un anillo local noetheriano y M 6= (0) un A−módulo finitamente
generado, llamaremos dimensión de Chevalley de M , y lo denotaremos por dimChevalley (M ),
al mı́nimo de los números naturales m ∈ N tales que :
∃a1 , . . . , am ∈ m tales que `A (M/(a1 , . . . , am )M ) < +∞
Si M = (0) diremos dimChevalley (M ) = −1.

Nótese que tal mı́nimo siempre existe : el cardinal mı́nimo de generadores de m es una cota
superior porque M/mM es un A/m−espacio vectorial de dimensión finita.
Teorema 8.0.16 (de la Dimensión). Si (A, m) es un anillo local noetheriano y M es un
A−módulo fintamente generado, se tiene :
dimKrull (M ) = dimHilbert−Samuel (M ) = dimChevalley (M ) < +∞
Y a partir de ahora utiulizaremos solamente la palabra dimensión para designar una cualquiera
de las cantidades citadas.
Dividiremos la prueba en varias partes :
Lema 8.0.17. En las condiciones del Teorema
i) dimHilbert−Samuel (M ) < +∞.
ii) dimChevalley (M ) < +∞.
Demostración. Obsérvese que el grado del polinomio de Samuel Pm (M, −) está siempre
acotado por el cardinal de un conjunto de generadores de m. En cuanto al segundo apartado
lo hemos discutido previamente. 

Lema 8.0.18. En las anteriores condiciones :


dimKrull (M ) ≤ dimHilbert−Samuel (M )
Demostración. Primero probaremos la afirmación para anillo locales noetherianos y de-
spués para módulos.
En primer lugar, observemos que si dimH−S (A) = −1, entonces A/mn = (0) para algún n ∈ N.
Aplicando el Lema de Nakayama A = (0) luego dimKrull (A) = −1.
Vamos a probar la siguiente afirmación por inducción en r : Para cualquier cadena de ideales
primos de A :
p0 ( p1 · · · pr , p0 minimal ⇒≤ dimH−S (A)
Puesto que A/p0 6= (0), es claro que dimH−S (A) no puede ser −1, por lo discutido anterior-
mente, luego se verifica el caso r = 0.
Supongamos, como hipótesis inductiva que la afirmación es cierta para cualquier cadena de
longitud menor que r − 1. Supongamos a ∈ p1 \ p0 . Sea p0 ∈ Spec(A) un ideal primo minimal
entre los ideales que contienen a p0 + (a) (su existencia está garantizada por la condición de
noetherianidad de A). Consideremos el anillo A0 := A/p y la cadena de primos :
p0 ( p1 ( · · · ( pr
tendremos r − 1 ≤ dimKrull (A0 ). Como p0 es minimal sobre p0 + (a) también es asociado, con
lo que tenemos un monomorfismo de A−módulos :
0 −→ A/p0 ←- A/(p0 + (a))
por lo tanto, dimH−S (A0 ) ≤ dimH−S (A/(p0 + (a)).
Consideremos la sucesión exacta corta definida por la homotecia aA/p0 :
0 −→ A/p0 −→ A/p0 −→ A/(p0 + (a))
8. EL TEOREMA DE LA DIMENSIÓN LOCAL 269

Existirá una función polinomial R : N −→ N de grado menor que el grado de la función de


Samuel de A/p0 y de coeficiente director positivo tal que :
Pm (A/p0 , n) + Pm (A/(p0 + (a)), n) = Pm (A/p0 , n) + R(n)
Luego :
dimH−S (A/p0 ) = deg(Pm (A/p0 , n) ≥ Pm (A/p0 + (a)) + 1 ≥ r
Finalmente, dado p0 ∈ Ass(A) minimal existe un monomorfismo A/p0 monoA, con lo cual
dimH−S (A/p0 ) ≤ dimH−S (A)
y hemos terminado con los anillos.
Por otro lado, si M es un A−módulo finitamente generado,
dimKrull (M ) = dimKrull (A/Ann(M ))
Si p ∈ Supp(M ) es un primo asociado a M , tenemos :
0 −→ A/p ←- M
con lo cual dimH−S (M ) ≥ dimH−S (A/p). Dado que Ass(M ) contiene a los pirmos minimales
sobre Ann(M ) y aplicando el caso de anillo,s habremos terminado. 

Corollario 8.0.19. Se tiene:


i) Todo anillo local noetheriano tiene dimensión de Krull finita.
ii) Todo ideal primo de un anillo noetheraino tiene altura finita.
iii) Mismo para módulos.

Lema 8.0.20. Sea A un anillo noetheriano y M un A−módulo finitamente generado. Entonces,


para cada ideal a de A se tiene :
p
Ann(M/aM ) ⊆ a + Ann(M )
Demostración. Este resultado se prueba fácilmente usando la propiedad :
O
M/aM = A/a M
A

y el comportamiento del soporte con respecto al producto tensorial. Una demostración alter-
nativa es la siguiente :
Dado λ ∈ Ann(M/IM ), y {m1 , . . . , mr } un sistema generador de M como A−módulo, para
cada m ∈ M se tiene :
r
X
∃b1,i , . . . , br,i ∈ a, λmi := bj,i mj
j=1
Sea  
b1,1 ··· b1,r
 .. ..  .
B :=  . . 
br,1 br,r
la matriz r × r con coeficientes en A y consideremos
f := det(λIdr − B) = λr + h
donde h ∈ a, es un polinomio sin término independiente. Consideremos la aplicación lineal :
(λIdr − B) : Ar −→ Ar
y observemos que para cada x1 , . . . , xr ∈ A, si
   
x1 z1
 ..   .. 
(λIdr − B)  .  =  . 
xr zr
se tiene :
z1 m1 + · · · + zr mr = 0
270 8. EL TEOREMA DE LA DIMENSIÓN LOCAL

La razón es la siguiente :
r
X
zi := λxi − bi,j xj
j=1
Luego,
r
X Xr r
X Xr r
X
zi mi = x1 ( λm1 − bi,1 mi ) + · · · + xr ( λmr − bi,r mi ) = 0
i=1 i=1 i=1 i=1 i=1
En particular, usando la transpuesta de la adjunta :
t
Adj(λIdr − B)(λIdr − B) = det(λIdr − B)Idr
Luego,
det(λIdr − B)mi = 0, 1 ≤ i ≤ r
y det(λIdr − B) = λr + h ∈ Ann(M ). 

Lema 8.0.21. En las hipótesis del Teorema de la Dimensión :


dimHilbert−Samuel (M ) ≤ dimChevalley (M )
Demostración. Si la dimensión de Chevalley de M es −1 es porque M = (0) y su
dimensión de Hilbert-Samuel también es −1. Podemos suponer s = dimChevalley (M ) ≥ 0 y
consideremos : a1 , . . . , as ∈ A tales que :
`A (M/(a1 , . . . , as )M ) < +∞
Entonces, el A−módulo M/(a p 1 , . . . , as )M es artiniano y su soporte tiene que ser {m}. Pero
Ann(M/(a1 , . . . , as )M ) ⊆ (a1 , . . . , as ) + Ann(M ). En particular, este ideal a := (a1 , . . . , as )+
Ann(M ) es un ideal de definición de A. La razón es simple, el único ideal primo que puede
contener a este ideal es m.
Ahora observemos que la estructura de A−módulo en M y la estructura de A/Ann(M )−módulo
coinciden. Denotesmo por A := A/Ann(M ) y a := (a1 , . . . , as ) + Ann(M )/Ann(M ). También
concluiremos que a es un ideal de definición de A.
Más aún, se tiene la siguiente igualdad entre longitudes :
`A (M/aM ) = `A (M/aM )
Como a está generado por s elementos, el grado del polinomio de Samuel Pa (M, −) está acotado
por s. En particular, lo estará también Pa (M, −) y por ende la dimensión de Chevalley de
M. 

Lema 8.0.22. En las condiciones del Teorema de la Dimensión,


dimChevalley (M ) ≤ dimKrull (M )
Demostración. Lo haremos por inducción en la dimensión de Krull de M , que es finita
por lo probado en 8.0.18.
Si la dimensión de Krull de M es −1 es porque M = (0) y su dimensión de Chevalley es también
−1.
dimKrull (M ) = −1 ⇔ Ann(M ) = A ⇔ M = (0)
Si la dimensión de Krull de M es 0, Supp(M ) = Ass(M ) = {m} y M es artiniano, con lo que
la dimensión de Chevalley es también 0 y hemos terminado.
Supongamos ahora que la dimensión de Krull es estrictamente positiva y sean p1 , . . . , ps ∈
Spec(A) los ideales primos asociados a M tales que :
dimKrull (M ) = coht(pi )
mientras que si p 6= pi , dimKrull (M ) > coht(pi ) (la finitud queda garantizada por la noethe-
rianidad). Tenemos que pi 6= m luego existe a ∈ m que no es divisor de cero de M , luego no
están en la unión de los primos asociados a M y
s
[
a 6∈ pi
i=1
8. EL TEOREMA DE LA DIMENSIÓN LOCAL 271

Sea M 0 := M/aM . Tenemos que la dimensión de Krull de M 0 es estrictamente menor que le


dimensión de Krull de M , luego coincide con la dimensión de Chevalley de M 0 . Baste notar
que la dimensión de Chevalley de M está acotada por la dimensión de Chevalley de M 0 + 1
para concluir la prueba :
Ası́, si {a1 , . . . , as } son tales que M 00 /(a1 , . . . , as )M 0 es artiniano, es claro que {a1 , . . . , as , a}
verifican que :
M/(a1 , . . . , as , a)M es artiniano


Queda ası́ demostrado el Teorema de la Dimensión y podemos pasar a algunas aplicaciones


inmediatas.
Corollario 8.0.23 (Teorema del Ideal Principal de Krull). Sea A un anillo noetheriano,
a := (a1 , . . . , ar ) ( A un ideal generado por r elementos. Entonces, cualquier ideal primo
minimal conteniendo al ideal a tiene altura menor o igual a r. Luego ht(a) ≤ r.
En particular, si a ( A es principal, a = (a1 ) y a1 no es divisor de cero en A, todo ideal primo
minimal conteniendo a a tiene altura 1.
Demostración. La primera observación obvia es la siguiente :
ht(p) := dim(Ap )
para cualquier primo del anillo A. Sea, pues, p un primo minimal sobre a, entonces, aAp es un
ideal de definición del anillo local noetheriano (Ap , pAp ). Si a está generado por r elementos,
es claro que ht(p) ≤ r.
De otro lado, si a es principal y p es un ideal que contiene a a y tiene altura 0, entonces, p es
un ideal minimal de A, con lo que es asociado y el generador de a es un divisor de cero de A
por estar en p. 

Corollario 8.0.24. Sea A un dominion noetheriano. Entonces, A es un dominio de factor-


ización única si y solamente si todo ideal primo de altura 1 es principal.
Comenzaremos con un pequeño Lema :
Lema 8.0.25. Sea A un dominio noetheriano. Entonces, si todo ideal de altura 1 es principal,
los ideales primos asociados a un ideal principal son minimales.
Demostración. Sea a := (f ) un ideal principal propio de A. Consideremos una descom-
posición primaria de a :
[r
a := qi
i=1
donde qi es pi −primario. Supongamos que pi := (fi ), con 1 ≤ i ≤ s ≤ r. Sea αi la máxima
potencia de fi que divide a f . Consideremos la cadena :
f
F1 := 6∈ p1
f1α1
i
Fi−1 [
Fi := αi 6∈ pk
fi
k=1
Esta cadena tiene sentido porque estamos en un dominio : f = F1 f1α1 , como f ∈ pi y f1α1 6∈ pi ,
entonces F1 ∈ pi , 1 ≤ i ≤ s. Consideremos entonces, Fs . Es claro que Fs | f , mientras
Fs ∈ ps+1 ∩ · · · pr . Aplicando el Teorema del Ideal Principal de Krull, todo ideal primo minimal
sobre Fs es de altura 1, luego es principal. Sea p = (g) uno de esos minimales sobre Fs .
Entonces, g | Fs | f , pero g 6∈ pi , 1 ≤ i ≤ s (si perteneciera a alguno de tales pi , también Fs
pertenecerı́a, llegando a contradicción). Luego p es un ideal primo de altura 1 que contiene a
a y no es p1 , . . . , ps (ni los contiene). Se trata pues, de un ideal minimal sobre a y ha de estar
asociado. Por lo tanto, es igual a algún pj , con s + 1 ≤ j ≤ r, contradiciendo la hipótesis de
que estos ideales tienen altura mayor estricto que 1. 
272 8. EL TEOREMA DE LA DIMENSIÓN LOCAL

Demostración del Corolario : si A es un D.F.U. ya hemos visto que todos los primos minimales
sobre un ideal principal han de ser principales, como el Teorema de Krull nos dice que son de
altura 1, hemos acabado. Recı́procamente, si todo ideal de altura 1 es principal, todo asociado
es minimal (Lema de arriba) y todo asociado a un ideal principal es principal, con lo que
tenemos el enunciado. 

Definición 109. Llamaremos sucesión regular en un anillo A a toda cadena de elementos de


A, f1 , . . . , fr ∈ A, tal que :
• fi no es divisor de cero en A/(f1 , . . . , fi−1 ).
• (f1 , . . . , fr ) ( A.

Corollario 8.0.26. Si A es noetheriano y f1 , . . . , fr es una sucesión regular de A, ht(f1 , . . . , fr ) =


r y todo ideal primo minimal sobre a = (f1 , . . . , fr ) tiene altura r.
Demostración. Baste aplicar el Teorema de Krull por inducción en r. Es claro que
ht(a) ≤ r y que ht((f1 ) = 1 en A y todo ideal primo minimal sobre (f1 ) tiene altura 1.
Para el caso r, sea p un ideal primo minimal sobre (f1 , . . . , fr ). Sabemos que ht(p) ≤ r y p no
es minimal sobre (f1 , . . . , fr−1 ) porque fr ∈ p y fr no es divisor de cero módulo (f1 , . . . , fr−1 ).
Entonces, existe un primo minimal p0 sobre (f1 , . . . , fr−1 ) tal que :
(f1 , . . . , fr−1 ) ⊆ p0 ( p
Luego ht(p) > ht(p0 ) = r − 1. 
Definición 110. Sea (A, m) un anillo local noetheriano de dimensión d. Llamaremos sistema
de parámetros de A a toda colección, a1 , . . . , ad de elementos de A generando un ideal de
definición de A.

Proposición 8.0.27. Si (A, m) es un anillo local noetheriano y {a1 , . . . , ad } es un sistema de


parámetros de A, se tiene :
dimA/(a1 , . . . , ai ) = d − i
Demostración. Consideremos A0 := A/ai , ai := (a1 , . . . , ai ). Claramente dimA0 ≤
d − i pues {ai+1 + ai , . . . , ad + ai } generan un ideal de definición de A0 . Recı́procamente, si
b1 , . . . , bp ∈ A son tales que sus clases bj + ai generan un ideal de definición de A/ai , entonces,
{a1 , . . . , ai , b1 , . . . , bp } generan un ideal de definición de A y dim(A) ≤ i + p. 
CAPı́TULO 9

Extensiones Enteras de Anillos: Going Up y Going Down

Índice
9.1. Extensiones Enteras de Anillos 273
9.2. Going–Up y Going–Down 273
9.2.1. Going–Up 274
9.2.2. Going–Down 274
9.3. Dimensión en K−álgebras: Normalización de Noether y álgebras
Cohen-Macaulay 275
9.3.1. El Lema de Normalización de Noether 275
9.3.2. Grado y Normalización de Noether 282
9.4. Cuestiones y Problemas 283

Este material es obtenidble en [AtMc, 69], [Ma, 80], [Ma, 89] y, para el Lema de Normal-
ización de Noether1, seguiremos la prueba que da [Ku, 85].

9.1. Extensiones Enteras de Anillos


Definición 111. Dada una extensión de anillos R ⊆ R0 , un elemento x ∈ R0 se dice entero
sobre R si verifica una ecuación polinomial mónica con coeficientes en R. Una extensión R ⊆ R0
se dice entera si todos los elementos de R0 son enteros sobre R.
Proposición 9.1.1. Las siguientes propiedades son equivalentes para una extensión de anillos
R ⊆ R0 :
• Un elemento x ∈ R0 es entero sobre R.
• La R−álgebra R[x] es un R−módulo finitamente generado.
• La R−álgebra R[x] está contenido en un subanillo B de R0 tal que B es un R−módulo
finitamente generado.
• Existe un R[x]−módulo fiel M que es de generación finita como R−módulo.
Corollario 9.1.2 (Clausura Entera). Dada una extensión entera de anillos R ⊆ R0 , los
elementos de R0 que son enteros sobre R forman un subanillo R̄ de R0 llamado clausura entera
de R en R0 .
Corollario 9.1.3 (Transitividad). Dadas extensiones de anillos R ⊆ R0 ⊆ R00 , si R0 es enetro
sobre R y R00 es entero sobre R0 , entonces R00 es entero sobre R. En particular, la clausura
entera de R en R0 es ı́ntegramente cerrado en R0 .
Proposición 9.1.4. Dada una extensión entera de anillos R ⊆ R0 . Se tiene:
• Si b es un ideal de R0 , entonces, R0 /b es enetro sobre R/bc .
• Si S es un subconjunto multiplicativamente cerrado de R, entonces S −1 R0 es entero
sobre S −1 R.

9.2. Going–Up y Going–Down


Aunque normalmente se les asigna a I.S. Cohen y A. Seidenberg, parece que W. Krull también
los conocı́a con lo que podrı́an llamarse los teoremas KCS o Krull–Cohen–Seidenberg.

1
E. Noether, “Abstrakter Aufbau der Idealtheorie in algebraischen Zahl und Funktionenkrpern”.
Math. Ann. , 96 (1927) pp. 26-61.

273
274 9. EXTENSIONES ENTERAS DE ANILLOS: GOING UP Y GOING DOWN

9.2.1. Going–Up. La clave es la siguiente Proposición.


Proposición 9.2.1. Sea R ⊆ R0 una extensión entera de dominios de integridad. Entonces R0
es un cuerpo si y solamente si R es un cuerpo. En particular, si q es un ideal primo de R0 , su
contracción p := qc es maximal en R si y solamente si q es maximal en R0 .
Corollario 9.2.2. Sea R ⊆ R0 una extensión entera de anillos. Entonces, no hay relación de
inclusión propia entre ideales primos de R0 que se contraen sobre el mismo idela primo de R.
Corollario 9.2.3. Sea R ⊆ R0 una extensión entera de anillos y ϕ : Spec(R0 ) −→ Spec(R) la
aplicación continua dada por la contracción de ideales. Entonces:
• ϕ es suprayectiva
• ϕ(Spm(R0 )) ⊆ Spm(R) y la siguiente aplicación está bien definida y es suprayectiva:
ϕSpm(R0 ) : Spm(R0 ) −→ Spm(R).
Podemos incluir también una interpretación geométrica.
Corollario 9.2.4. Sea ϕ : V −→ W un morfismo de conjuntos algebraicos dominante (i.e.
ϕ∗ : K[W ] −→ K[V ] es inyectiva). Entonces, si la extensión K[W ] ⊆ K[V ] es entera, ϕ es
suprayectiva.
Teorema 9.2.5 (Going–Up). Sea R ⊆ R0 una extensión entera de anillos. Sean dadas:
• Una cadena ascendente de ideales primos de R:
p1 ⊆ p2 ⊆ · · · ⊆ pn ,
• Una cadena ascendente de ideales primos de R0 :
q1 ⊆ q2 ⊆ · · · ⊆ qm ,
De tal modo que n > m y qci = pi , para cada i, 1 ≤ i ≤ m. Entonces, existe una cadena
ascendente de ideales primos de R0 :
qm ⊆ qm+1 ⊆ qm+2 ⊆ · · · ⊆ qn ,
tales que qci = pi para cada i, m + 1 ≤ i ≤ n.
9.2.2. Going–Down.
Proposición 9.2.6. Sea R ⊆ R0 una extensión de anillos, R̄ la clausura entera de R en R0 y S
un sistema multiplicativamente cerrado de R. Entonces, S −1 R̄ es la clausura entera de S −1 R
en S −1 R0 .
Definición 112 (Dominios normales). Un dominio R se dice normal o ı́ntegramente cerrado
si es ı́ntegramente cerrado en su cuerpo de fracciones.
Proposición 9.2.7. La condición “normalidad” es una propiedad local.
Tras algún esfuerzo probaremos:
Teorema 9.2.8 (Going–Down). Sea R ⊆ R0 una extensión entera de dominios de integridad,
siendo R un dominio normal. Sean dadas:
• Una cadena desscendente de ideales primos de R:
p1 ⊇ p2 ⊇ · · · ⊇ pn ,
• Una cadena descendente de ideales primos de R0 :
q1 ⊇ q2 ⊇ · · · ⊇ qm ,
De tal modo que n > m y qci = pi , para cada i, 1 ≤ i ≤ m. Entonces, existe una cadena
descendente de ideales primos de R0 :
qm ⊇ qm+1 ⊇ qm+2 ⊇ · · · ⊇ qn ,
tales que qci = pi para cada i, m + 1 ≤ i ≤ n.
9.3. DIMENSIÓN EN K−ÁLGEBRAS: NORMALIZACIÓN DE NOETHER Y ÁLGEBRAS COHEN-MACAULAY
275

9.3. Dimensión en K−álgebras: Normalización de Noether y álgebras


Cohen-Macaulay
9.3.1. El Lema de Normalización de Noether. Según algunas fuentes, el Lema de
Normalización de E. Noether2 también puede ser debido a D. Hilbert quien ya habı́a demostrado
un resultado análogo en el contexto de álgebras de invariantes en su trabajo de 18933. La formu-
lación actual, sin embargo, es enteramente debida a Noether. Aquı́ seguiremos la demostración
de [Ku, 85], p. 51 y siguientes.
Teorema 9.3.1 (Lema de Normalización de E. Noether). Sea A una K−álgebra fini-
tamente generada sobre un cuerpo y sea a ⊆ A un ideal propio. Entonces, existen elementos
Y1 , . . . , Yd ∈ A y existe s ≤ d tales que :
i) {Y1 , . . . , Yd } son algebraicamente independientes sobre K.
ii) ATes un K[Y1 , . . . , Yd ]−módulo finitamente generado.
iii) a K[Y1 , . . . , Yd ] = (Ys+1 , . . . , Yd ).
Más aún, si K es un cuerpo consuficientes elementos y A := K[x1 , . . . , xn ] es una Kálgebra
finitamente generada, podemos suponer que los elementos Yi son combinaciones lineales de los
elementos {x1 , . . . , xn }.
Haremos la demostración en diversas etapas, marcadas por Lemas.
El enunciado y la prueba lo he tomado, con matices, de [?].
Lema 9.3.2. Sean p1 , . . . , pm ∈ K[T ], caract(K) = 0 polinomios univariados cualesquiera que
supondremos de grado a lo más d. Entonces, existe k ∈ {0, 1, . . . , m

2 d} tal que
pi (k) 6= pj (k), ∀i 6= j
Demostración. Definamos el polinomio univariado no nulo :
Y
(pi − pj ) ∈ K[T ]
i<j
m

Este polinomio tiene grado a lo más d y claramente no puede anularse en el conjunto citado.
2
En caso contrario, aplicando un argumento obvio sobre interpolación, este polinomio serı́a un
polinomio idénticamente nulo. 

Obsérvese que si la caracterı́stica del cuerpo es distinta de cero, bastará con tomar un conjunto
cualquiera con el mismo cardinal.
Lema 9.3.3. Sea F ∈ K[X1 , . . . , Xn ] un polinomio no nulo de grado a lo más d y sean
{α0 , . . . , αd } ⊆ K elementos distintos del cuerpo K. Entonces, existe α ∈ {α0 , . . . , αd }n tal
que :
F (α) 6= 0

Lema 9.3.4. Un polinomio homogéneo no nulo de K[X1 , . . . , Xn ] no puede anularse en ningún


abierto afı́n de K n .
Lema 9.3.5. Sea F un polinomio no constante en K[X1 , . . . , Xn ] un polinomio no constante.
• a) : Mediante una sustitución de la forma :
Xi := Yi + Xnri , (1 ≤ i ≤ n − 1)
para adecuados ri ∈ N, el polinomio F se transforma en un polinomio de la forma :
aXnm + ρ1 Xnm−1 + · · · + ρm
donde a ∈ K \ {0}, ρi ∈ K[Y1 , . . . , Yn−1 ], 1 ≤ i ≤ m. los ri verifican la cota
N
ri ≤ ( (n − 1))i
2
donde N es el número de monomios de coeficiente no nulo de F .
2E. Noether, “Abstrakter Aufbau der Idealtheorie in algebraischen Zahl und Funktionenkrpern”.
Math. Ann. , 96 (1927) pp. 26-61.
3D. Hilbert. “Über die vollen Invariantensysteme”. Math. Annalen 42 (1893) 313–373.
276 9. EXTENSIONES ENTERAS DE ANILLOS: GOING UP Y GOING DOWN

• b) : Si K es un cuerpo infinito, entonces el mismo resultado puede ser obtenido por


medio de una sustitución del tipo :
Xi := Yi + ai Xn
para adecuados ai ∈ K.
Demostración. • a) : Supongamos :
X
F := aν X1ν1 · · · Xnνn
ν∈Nn
n
Para cada ν ∈ N tal que aν 6= 0, definamos
pν (T ) := νn + ν1 T + ν2 T 2 + · · · + νn−1 T n−1 ∈ Z[T ]
Se trata de polinomios distintos cuando es distinto el ı́ndice ν a que
 hacen referencia.
En este sentido existirá un cierto k de valor absoluto a lo más N2 (n − 1) tal que :
pν (k) 6= pν 0 (k), ∀ν 6= ν 0
Ahora definamos ri := k i y las variables :
Yi := Xi − Xnri , 1≤i≤n−1
Tendremos la siguiente transformación para F :
X
F (X1 , . . . , Xn ) := aν (Y1 + Xnr1 )ν1 · · · (Yn−1 + Xnrn−1 )νn−1 Xnνn
ν∈Nn

De esta manera el polinomio F toma la forma :


p (k)
F (Y1 , . . . , Yn−1 , Xn ) := aµ Xi µ + Gµ (Y1 , . . . , Yn−1 , Xn )
donde pµ (k) es el máximo de los pν (k), con lo cual el gradoi en Xn de Gµ es estricta-
mente menor que pν (k) y F tiene la forma apetecida.
• b) : Supongamos de nuevo :
X
F := aν X1ν1 · · · Xnνn
ν∈Nn

y escribamos :
Yi := Xi − ai Xn , 1 ≤ i ≤ n − 1
Escribamos F := F0 + · · · + Fd la descomposición de F en componentes homogéneas
en K[X1 , . . . , Xn ], donde d es el grado total de F y Fd 6= 0. Con el cambio buscado,
tomemos :
X
F := −ν ∈ Nn aν (Y1 + a1 Xn )ν1 · · · (Yn−1 + an−1 Xn )νn−1 Xnνn
Entonces,
F := Fd (a1 , . . . , an−1 , 1)Xnd + Gd−1 (Y1 , . . . , Yn−1 , Xn )
donde Gd−1 es un polinomio de grado a lo más d − 1 en Xn . Como Fd es un poli-
nomio homogéneo no se anula en el abierto Zariski de K n dado por : {Xn 6= 0}.
Luego Fd (T1 , . . . , Tn−1 , 1) es un polinomio no nulo y podremos encontrar un punto
(a1 , . . . , an−1 ) ∈ K n−1 verificando la inecuación Fd (a1 , . . . , an−1 , 1) 6= 0. Ese punto
verificará las propiedades prescritas.

Demostración del Lema de Normalización de Noether.–
• Caso 1 : Supongamos que A := K[X1 , . . . , Xn ] es un anillo de polinomios con coefi-
cientes en un cuerpo K y el ideal a = (F ) es un ideal principal.
• Bastará con que apliquemos el Lema previo. Hagamos el cambio de coordenadas
(X1 , . . . , Xn ) −→ (Y1 , . . . , Yn−1 , Xn )
correspondiente bien al caso a) o al caso b) del Lema. Describamos el caso b) por su
belleza. Entonces, el polinomio :
G(Y1 , . . . , Yn−1 , Xn ) := F (Y1 + a1 Xn , . . . , Yn−1 + an−1 Xn−1 , Xn )
9.3. DIMENSIÓN EN K−ÁLGEBRAS: NORMALIZACIÓN DE NOETHER Y ÁLGEBRAS COHEN-MACAULAY
277

que es un polinomio mónico en Xn . Definamos Yn := F y tendremos :


K[Y1 , . . . , Yn ] ,→ K[X1 , . . . , Xn ]
es una extensión entera de anillos. Es claro que Xn verifica una ecuación de depen-
dencia entera sobre el anillo K[Y1 , . . . , Yn ] :
G(Y1 , . . . , Yn−1 , Xn ) − Yn = 0
Por lo demás tenemos la cadena de extensiones :
K[Y1 , . . . , Yn ] ,→ K[Y1 , . . . , Yn−1 , Xn ] ,→ K[X1 , . . . , Xn ]
Siendo todas ellas enteras, el tercer anillo es entero sobre el primero y, por ende,
finitamente generado como módulo. Ahora, al ser {X1 , . . . , Xn } algebraicamente in-
dependientes sobre K, tambien lo son {Y1 , . . . , Yn }, por estar ante una extensión entera
(luego algebraica). De otro lado, a ∩ K[Y1 , . . . , Yn ] ⊇ (Yn ). Pero si H(Y1 , . . . , Yn ) ∈
a ∩ K[Y1 , . . . , Yn ), tendremos :

H = H 0F
en K[X1 , . . . , Xn ]. Como H 0 es entero sobre K[Y1 , . . . , Yn ] verificará una ecuación de
dependencia entera :
(H 0 )d + ad−1 (H 0 )d−1 + · · · + a0 = 0
Como los ai ∈ K[Y1 , . . . , Yn ] podemos multiplicar esa ecuación por F d y obtendremos :
H d + ad−1 Yn H d−1 + · · · + a0 Ynd = 0
de donde se deduce que Yn | H en K[Y1 , . . . , Yn ].
• Caso 2 : Supongamos que A := K[X1 , . . . , Xn ] es un anillo de polinomios y el ideal a
es un ideal cualquiera de A.
• Hagamos inducción en el número de variables n. Para n = 1, o bien a = (0) o bien
a es un ideal principal y basta con retrotraerse al caso anterior para no tener nada
más que hacer. Supongamos n ≥ 1 y consideremos el caso que que a no es un ideal
principal. Si a es principal o nulo no hay nada que hacer. Supongamos a 6= (0) y sea
F ∈ a, F 6= 0, Sea b = (F ) ⊆ a y apliquemos el caso n = 1 : Existirán {Y1 , . . . , Yn }
tales que :
K[Y1 , . . . , Yn ] ,→ K[X1 , . . . , Xn ]
es una extensión entera de anillos. Además b ∩ K[Y1 , . . . , Yn ] = (Yn ). Sea ac la con-
tracción de a a K[Y1 , . . . , Yn ] y sea a := ac /(Yn ) que es un ideal de K[Y1 , . . . , Yn ]/(Yn ) =
K[Y1 , . . . , Yn−1 ]. Estamos en condiciones de aplicar la hipótesis inductiva y existirán :
{Y10 , . . . , Yn−1
0
} tales que :
K[Y10 , . . . , Yn−1
0
] ,→ K[Y1 , . . . , Yn−1 ]
es una extensión entera de anillos, siendo :
a ∩ K[Y10 , . . . , Yn−1
0 0
] = (Ys+1 0
, . . . , Yn−1 )
Tomando {Y10 , . . . , Yn−1
0
, Yn } tenemos la colección buscada y es fácil probar que se
verifican las propiedades requeridas.
• Caso 3 : Caso general.
• Baste notar que si A es una K−álgebra finitamente generada tiene la forma :
A = K[X1 , . . . , Xn ]/b
donde b es un ideal de K[X1 , . . . , Xn ] mientras a tiene la forma ã/b, siendo ã un ideal
de K[X1 , . . . , Xn ] que contiene a b. Aplicando el caso 2 a b existirán {Y1 , . . . , Yn }
tales que :
K[Y1 , . . . , Yn ] ,→ K[X1 , . . . , Xn ]
es una extensión entera de anillos, mientras
b ∩ K[Y1 , . . . , Yn ] = (Yr+1 , . . . , Yn )
278 9. EXTENSIONES ENTERAS DE ANILLOS: GOING UP Y GOING DOWN

Como las extensiones enteras se portan bien al tomar cocientes, la siguiente es una
extensión enetra de anillos :
K[Y1 , . . . , Yr ] = K[Y1 , . . . , Yn ]/b ,→ A
Consideremos el ideal contracción ac dado mediante :
ac := ã ∩ K[Y1 , . . . , Yr ] := a ∩ (K[Y1 , . . . , Yn ]/b)
Apliquemos de nuevo el caso 2 a ac y obtengamos : {Y10 , . . . , Yr0 } tales que :
K[Y10 , . . . , Yr0 ] ,→ K[Y1 , . . . , Yr ] ,→ A
son extensiones enteras de anillos y, además :
a ∩ K[Y10 , . . . , Yr0 ] = ac ∩ K[Y10 , . . . , Yr0 ] = (Ys+1
0
, . . . , Yr0 )

Este sencillo Lema tiene muchas consecuencias relevantes, algunas de las cuales pasaremos a
analizar :
Corollario 9.3.6. Sea K un cuerpo infinito, a ideal homogéneo de K[X0 , . . . , Xn ] entonces,
existen {Y0 , . . . , Yn } polinomios homogéneos, tales que :
i) K[Y0 , . . . , Yn ] ,→ K[X0 , . . . , Xn ] es una extensión entera de anillos.
ii) a ∩ K[Y0 , . . . , Yn ] = (Yr+1 , . . . , Yn ).
iii) La extensión de anillos :
K[Y0 , . . . , Yr ] ,→ K[X0 , . . . , Xn ]/a
es entera y es un morfismo de anillos graduados de grado 0.
Demostración. Se trata de la misma demostración, usando cambios lineales de coorde-
nadas y siguiendo la misma estrategia del Lema de Normalización de Noether, pero tomando
homogéneos a cada etapa. 

Hagamos ahora un recordatorio de algunos resultados concernientes a extensiones enteras de


anillos :
Lema 9.3.7. Si A ,→ B es una extensión entera de anillosse tiene :
i) Si B es un cuerpo, A es un cuerpo.
ii) Los ideales maximales de B se contraen sobre ideales maximales de A.
iii) No hay relación de inclusión estricta entre los ideales primos de B que se contraen
sobre el mismo ideal primo de A.
iv) f ∗ : Spec(B) −→ Spec(A) es suprayectiva.
Corollario 9.3.8. Sea A ,→ B un extensión entera de anillos. Entonces,
i)
dimKrull (A) = dimKrull (B)
.
ii) Para cualquier ideal primo P de B, coht(P ) = coht(P ∩ A).
Demostración. Sea
P0 ( P1 ( · · · ( Pn
una cadena de ideales primos de B. Sean pi := Pi ∩ A y tenemos una cadena de ideales primos
de A dada por :
p0 ( p1 ( · · · ( pn
La razón profunda de la permanencia de loes contenidos estrictos es la propiedad iii) del Lema
previo. Con lo cual dimKrull (A) ≥ dimKrull (B).
Para el otro contenido, utilizaremos la Propiedad del Ascenso que verifica toda extensión entera
de anillos. Ası́, consideremos una cadena de ideales primos de A :
p0 ( p1 ( · · · ( pn
y sea P0 un ideal primo de B que se contrae sobre p0 . Por el Teorema del Ascenso, tendremos
una cadena de ideales primos de B :
P0 ⊆ P1 ⊆ · · · ⊆ Pn
9.3. DIMENSIÓN EN K−ÁLGEBRAS: NORMALIZACIÓN DE NOETHER Y ÁLGEBRAS COHEN-MACAULAY
279

donde Pi ∩ A = pi . Los contenidos estrictos abajo significan contenidos estrictos arriba (obvio)
y esta cadena tiene longitud n, con lo que queda terminada la prueba. 

Corollario 9.3.9. Sea A ,→ B una extensión entera de anillos y supongamos que A es un


anillo normal. Entonces, para cada ideal primo P de B se tiene : ht(P ) = ht(P ∩ P ).
Demostración. De hecho, esta propiedad se verifica cuando se verifica la propiedad del
Descenso. Ası́, tomemos una cadena de ideales primos de B contenidos en P :
P0 ( P 1 ( · · · ( Pn = P
Por no haber inclusión estricta entre los ideales primos de B que se contraen sobre el mismo
ideal primo de A, si pi := Pi ∩ A, tenemos una cadena de contenidos estrictos :
p0 ( p1 ( · · · ( pn = P ∩ A
De otro lado, sea p := P ∩ A y consideremos una cadena de ideales primos de A contenidos en
p:
p0 ( p1 ( · · · ( pn = p
Como P se contraen sobre p, aplicando el Teorema del Descenso, tendremos
P0 ( P1 ( · · · ( Pn = P
tales que Pi ∩ A = pi y habremos terminado la prueba. 

Observación 9.3.10. La anterior propiedad se verifica también para cualquier ideal a de B.


Para verlo, sea b := a ∩ A. Para cada ideal primo P que contiene a a se tiene P ∩ A contiene a
b y ht(P ) = ht(P ∩ A). Con ello se prueba :
ht(a) := min{ht(P ) : P ⊇ a} ≥ min{ht(p) : p ⊇ b}
De otro lado, dado p ⊇ b un ideal primo, por ser la extensión de anillos :
A/b ,→ A/a
entera, existirá un ideal primo P ⊇ a de B tal que P ∩ A = p, luego
ht(b) ≥ ht(a)
y habremos terminado.

Proposición 9.3.11. Sea K un cuerpo,


dimKrull (K[X1 , . . . , Xn ]) = n
Además, ht(X1 , . . . , Xi ) = i, 1 ≤ i ≤ n.
Demostración. Es claro que tenemos la siguiente cadena de ideales primos de K[X1 , . . . , Xn ] :
(0) ( (X1 ) ( · · · ( (X1 , . . . , Xn )
con ello tenemos ya probado,
dimKrull (K[X1 , . . . , Xn ]) ≥ n
Además, por ser los ideales (X1 , . . . , Xi ) primos y la sucesión X1 , . . . , Xi regular, tenemos las
propiedades de la altura.
Para la otra desigualdad, haremos inducción en n. En el caso n = 1 todo ideal de K[X] es
principal, luego todo primo distinto de (0) tiene altura 1 y habremos terminado. Para dimensión
superior, supongamos una cadena de ideales primos :
(0) = p0 ( p1 ( · · · ( pn+1
Apliquemos el Lema de Normalización de Noether y tendremos {T1 , . . . , Tn } algebraicamente
independientes sobre K tales que :
K[T1 , . . . , Tn ] ,→ K[X1 , . . . , Xn ]
es una extensión entera de anillos y p1 ∩ K[T1 , . . . , Tn ] = (Tr+1 , . . . , Tn ) Podremos construir la
siguiente cadena de ideales primos de K[T1 , . . . , Tr ], r ≤ n − 1 :
(0) ( P2 ( · · · ( Pn+1
280 9. EXTENSIONES ENTERAS DE ANILLOS: GOING UP Y GOING DOWN

donde Pi es la contracción a K[T1 , . . . , Tn−1 ] de pi /p1 . Los contenidos estrictos se siguen por
ser la siguiente una extensión entera de anillos :
K[T1 , . . . , Tn−1 ] = K[T1 , . . . , Tn−1 , Tn ]/pc1 ,→ K[X1 , . . . , Xn ]
Aplicando la hipótesis inductiva habremos llegado a contradicción. 

Corollario 9.3.12. Sea K un cuerpo,


i) Si p es un ideal primo de K[X1 , . . . , Xn ],
coht(p) := dimKrull (K[X1 , . . . , Xn ]/p) = grtrK (q.f.(K[X1 , . . . , Xn ]/p))
ii) Si V ⊆ K n es un conjunto algebraico irreducible :
coht(I(V )) = dimKrull (K[V ]) = grtrK (K(V ))
Demostración. Usando el Lema de Normalización de Noether, es claro que si {T1 , . . . , Tr }
son tales que :
K[T1 , . . . , Tr ] ,→ K[X1 , . . . , Xn ]
son algebraicamente independientes sobre K, entonces, r = n. Además si p ∩ K[T1 , . . . , Tn ] =
(Ts+1 , . . . , Tn ), tenemos la siguiente cadena de extensiones enteras de anillos :
K[T1 , . . . , Ts ] = K[T1 , . . . , Tn ]/p ,→ K[X1 , . . . , Xn ]/p
Se trata de extensiones algebraicas entre los respectivos cuerpos de fracciones, luego el grado de
trascendencia del último es s; pero s es también la dimensión de Krull de los dos primeros. Por
ser la extensión entera, también s es la dimensión de Krull del último y habremos terminado. 

Corollario 9.3.13. Sea p un ideal primo de K[X1 , . . . , Xn ], entonces


ht(p) + coht(p) = n
En particular, todos los ideales maximales de K[X1 , . . . , Xn ] tienen altura n. En cambio, el
único ideal primo de coaltura n de K[X1 , . . . , Xn ] es el ideal (0).
Demostración. Apliquemos el Lema de Normalización de Noether y sean {T1 , . . . , Tn }
algebraicamente independientes sobre K tales que :
K[T1 , . . . , Tn ] ,→ K[X1 , . . . , Xn ]
es entera. Tenemos que p ∩ K[T1 , . . . , Tn ] = (Ts+1 , . . . , Tn ). Claramente, s = coht(p). Además,
podemos aplicar el Teorema del Descenso para concluir que :
ht(p) = ht(p ∩ K[T1 , . . . , Tn ]) = n − s
El caso de los maximales queda descrito por ser los maximales los primos de coaltura 0. El otro
caso es igual por ser (0) de altura 0. 

Corollario 9.3.14. Si V ⊆ Kn es un conjunto algebraico, exiten d ∈ N y existe una aplicación


lineal ϕ : Kn −→ Kd tal que:
• ϕ |V : V −→ Kd es suprayectiva,
• Para cada y ∈ Kd , la fibra ϕ−1 (y) es finita.
Corollario 9.3.15. Para cualquier ideal a de K[X1 , . . . , Xn ] se tiene :
ht(a) + coht(a) = n
Demostración. Para demostrarlo, se p un ideal primo minimal sobre a tal que coht(p) =
coht(a). Hallemos una normalización de Noether :
K[T1 , . . . , Tn ] ,→ K[X1 , . . . , Xn ]
tal que a ∩ K[T1 , . . . , Tn ] = (Ts+1 , . . . , Tn ). Entonces, s = coht(a) = coht(p). Por el Corolario
anterior, n − s = ht(p) ≤ ht(a). Luego ht(a) + coht(a) ≥ n. Como la otra desigualdad se da
siempre, tenemos el resultado. 

Corollario 9.3.16. Toda K−ágebra finitamente generada tiene dimensión finita, todo ideal
primo suyo tiene altura y coaltura finitas y acotadas pr la dimensión de A.
9.3. DIMENSIÓN EN K−ÁLGEBRAS: NORMALIZACIÓN DE NOETHER Y ÁLGEBRAS COHEN-MACAULAY
281

Observación 9.3.17. La propiedad enunciada en el anterior Corolario no es extensible a cua-


lesquiera anillos noetherianos, aunque sı́ es extensible a los anillos locales noetherianos.
Una propiedad importante es la de respetar los cocientes mediante las alturas.
Definición 113. Un anillo A se denomina catenario si para cualesquiera dos ideales primos
p ⊆ p0 de A, se verifica :
ht(p0 /p) = ht(p0 ) − ht(p)

Corollario 9.3.18. Los anillos de polinomios K[X1 , . . . , Xn ] son catenarios. Más aún, para
cualesquiera dos ideales primos p ⊆ p0 se tiene :
ht(p0 /p) = ht(p0 ) − ht(p) = coht(p) − coht(p0 )
Demostración. Basta con hacerlo para anillos de polinomios. Hallemos una normal-
ización de Noether de K[X1 , . . . , Xn ] con respecto al ideal p, es decir {T1 , . . . , Tn } tales que :
K[T1 , . . . , Tn ] ,→ K[X1 , . . . , Xn ]
donde p ∩ K[T1 , . . . , Tn ] = (Ts+1 , . . . , Tn ). Se tiene que s = coht(p) y n − s = ht(p). Sea p0 el
c
ideal primo p0 /p y sea p0 su contración a K[T1 , . . . , Ts ]. Claramente,
c c
coht(p0 ) + ht(p0 ) = s
Pero
c
coht(p0 ) = coht(p0 ) = coht(p0 )
Por lo tanto,
c
ht(p0 /p) = ht(p0 ) = s−coht(p0 ) = coht(p)−coht(p0 ) = (n−ht(p))−(n−ht(p0 )) = ht(p0 )−ht(p)


Corollario 9.3.19. Sean f1 , . . . , fr una sucesión regular de K[X1 , . . . , Xn ]. Entonces, si K


es algebraicamente cerrado se tiene :
dimKrull (V (f1 , . . . , fr )) = n − r
Demostración. Baste notar que ht(f1 , . . . , fr ) = r y la identificación entre los ideales
radicales de K[X1 , . . . , Xn ] y los conjuntos algebraicos. 
Para los conjuntos algebraicos proyectivos tenemos una situación relativamente distinta :
Lema 9.3.20. Sea A = K[X0 , . . . , Xn ] anillo graduado con la graduación usual. Sea m :=
(X0 , . . . , Xn ) ideal maximal en A, y sea m0 := mAm el único ideal maximal de Am . Entonces,
Gm0 (Am ) = K[X0 , . . . , Xn ]
Demostración. Obsérvese que
mm /mm+1 := Hm (X0 , . . . , Xn )
Por la definición de la operación en el graduado, bastará con que probemos que los siguientes
son espacio vectoriales isomorfos sobre K = A/m :

m0m /m0m+1 ∼
= Hm (X0 , . . . , Xn )
Es claro que tenemos un monomorfismo :
ϕ : Hm (X0 , . . . , Xn ) ,→ m0m /m0m+1
dado por ϕ(F ) := F/1 + m0m+1 . Supongamos, ahora p/q + m0n+1 ∈ m0m /m0m+1 , un elemento
cualquiera.
Podemos suponer que p ∈ Hm (X0 , . . . , Xn ), (descomponiento p/q en sumas donde los numer-
adores son homogéneos, todo lo que pase de grado n + 1 se va). Ahora q = a0 + h, con a0 ∈ K
y h ∈ m, podemos concluir :
a0 p − qp = −(hp) ∈ mn+1 ⊆ m0n+1
con lo que ϕ(a0 p) = p/q + m0n+1 y ϕ es un isomorfismo. 
282 9. EXTENSIONES ENTERAS DE ANILLOS: GOING UP Y GOING DOWN

Lema 9.3.21. Sea A = K[X0 , . . . , Xn ] anillo graduado con la graduación usual. Sea m :=
(X0 , . . . , Xn ) ideal maximal en A e a un ideal homogéneo de A. Sean m := m/a ideal maximal
del anillo graduado A/a. Entonces, los siguientes anillos son isomorfos :
Gm(A/a)m ((A/a)m ) = A/a
Demostración. Sigue los mismos pasos que la prueba anterior. 

Corollario 9.3.22. Sea a un ideal homogéneo en A := K[X0 , . . . , Xn ]. Sea m := (X0 , . . . , Xn )


ideal maximal de A y sea m := m/a ideal maximal de A/a. Entonces,

deg(χ(G(A/a, −) = degPm ((A/a)m , −) − 1 = dimKrull ((A/a)m )) − 1


En particular, para cualquier conjunto algebraico proyectivo, V ⊆ ¶n (K) se tiene :
deg(χ(K[V ], −) = dimK[V ]m − 1
donde m := m/I(V ).
Demostración. Usando el Teorema de la dimensión y los isomorfismos destacados en los
apartados anteriores tenemos claramente el Corolario. 

Corollario 9.3.23 (Dimensión de la Intersección). Sean p1 y p2 dos ideales primos en


un anillo de polinomios R = K[X1 , . . . , Xn ] sobre un cuerpo K. Supongamos dim(R/p1 ) = r,
dim(R/p2 ) = s. Entonces, para cualquier ideal primo q minimal sobre p1 + p2 se tiene :
dim(R/q) ≥ r + s − n
Demostración. Consideremos un nuevo conjunto de variables {Y1 , . . . , Yn } y el ideal p02
en el anillo K[Y1 , . . . , Yn ] obtenido simplemente cambiando las variables. Definamos finalmente
R0 := K[X1 , . . . , Xn Y1 , . . . , Yn ]
En este anillo consideramos el ideal I := p1 +p02 y el ideal D generado por (X1 −Y1 , . . . , Xn −Yn )
que corresponde a la diagonal. Obsérvese el isomorfismo de anillos entre R0 /D y R.
Ahora, tomemos normalizacioones de Noether de K[X1 , . . . , Xn ]/p1 y K[Y1 , . . . , Yn ]/p02 , ten-
dremos una normalizacion de Noether de R0 /I y facilmente se concluye
dim(R0 /I) := dim(R/p1 ) + dim(R/p2 )
Ahora, sea q un primo minimal de R sobre p1 + p2 . Por el isomorfismo, podemos identificarlo
con un ideal primo Q de R0 /D que contiene a I + D/D. Más aún, se respetan las condiciones de
minimalidad y coaltura. En particular, Q/I es un ideal primo minimal sobre D en R0 /I. Por
estar generado D + I/D por las clases de sus n generadores, obtenemos ht(Q/I) ≤ n (Krull).
De otro lado, R0 /I + D es isomorfo a R/p1 + p2 , luego,
dim(R/q) := dim((R0 /I)/(Q/I)) = dim(R0 /I) − ht(Q/I) ≥ r + s − n


Corollario 9.3.24. Sea K un cuerpo algebraicamente cerrado V, W ⊆ K n dos conjuntos


algebraicos irreducibles. Entonces,
dim(V ∩ W ) ≥ dim(V ) + dim(W ) − n
9.3.2. Grado y Normalización de Noether. Aunque aún no hemos hablado del caso
de dimensión positiva, veremos más adelante la relevancia de la Normalización de Noether (ya
hemos visto algo en nuestra prueba del Nullstellensatz) y, en ese contexto, será útil valorar el
resultado siguiente:
Teorema 9.3.25. Sea F := [f1 , . . . , fs ] ∈ K[X1 , . . . , Xn ]s un sistema de ecuaciones polinomi-
ales generando un ideal a. Sea V (F ) ⊆ Kn el conjunto algebraico que definen y supongamos que
es equidimensional (i.e. todas sus componentes tienen la misma dimensión). Sea K[Y1 , . . . , Yr ]
una normalización de Noether de K[X1 , . . . , Xn ]/a. Supongamos que Y1 , . . . , Yr son combina-
ciones lineales de las variables X1 , . . . , Xn . Sea g ∈ K[X1 , . . . , Xn ] un polinomio adicional. Se
tiene :
9.4. CUESTIONES Y PROBLEMAS 283

i) La siguiente es una extensión entera de anillos :



K[Y1 , . . . , Yr ] ,→ K[X1 , . . . , Xn ]/ a.
ii) La imagen del morfismo G siguiente es una hipersuperficie de Kr+1 , donde
G : V −→ Kr+1
donde
G(x1 , . . . , xn ) := (Y1 (x1 , . . . , xn ), . . . , Yr (x1 , . . . , xn ), g(x1 , . . . , xn )).
iii) El grado de la hipersuperficie G(V ) está acotado por deg(V ) √ · deg(g). √
iv) El polinomio mı́nimo mónico de la dependencia entera de g + a ∈ K[X1 , . . . , Xn ]/ a
sobre K[Y1 , . . . , Yr ] está acotado por deg(V ) · deg(g) y, de hecho, coincide con el poli-
nomio mı́nimo de la hipersuperficie G(V ).
Más aún, si V (F ) es irreducible se tiene :
 √  
q.f. K[X1 , . . . , Xn ]/ a : K(Y1 , . . . , Yr ) ≤ deg(V (F )),
donde q.f. significa cuerpo de fracciones.

9.4. Cuestiones y Problemas


CAPı́TULO 10

El Teorema de la Función Implı́cita : Fibras de


Levantamiento.

Índice
10.1. Introducción 285
10.2. Anillos y módulos topológicos : filtraciones y completados 287
10.2.1. Graduaciones y filtraciones a−ádicas 290
10.2.2. El Lema de Artin–Rees y el Teorema de la Intersección de Krull. 291
10.3. Propiedades del Completado : Anillos de Zariski. 292
10.4. Los Teoremas de División y Preparación de Weierstrass. 293
10.5. Anillos Locales Regulares. 295
10.5.1. Criterio del Jacobiano. 295
10.5.2. Teorema de Estructura de Cohen. 296
10.6. Teorema de la Función Implı́cita. 297
10.6.1. El Lema de Hensel. 297
10.6.2. El Operador de Newton No–Arquimediano 298

10.1. Introducción
El Teorema de la Función Implı́cita ha sido una de las piezas fundamentales de la Historia de
la Matemática. La parametrización local de variedades alrededor de puntos donde el jacobiano
no se anula comienza con I. Newton en 1771. El algoritmo que Newton habı́a pensado para
aproximar raı́ces de polinomios univariados era adaptable a la aproximación local de curvas
mediante funciones racionales y su expansión en series de potencias formales. Ciertamente
Newton vislumbra las series de potencias que luego serán extendidas por B. Taylor1. Parece
que Taylor asigna el descubrimiento de las series de potencias formales a Newton en la frase “Sir
Isaac Newton’s series”. Sin embargo, las series “de Taylor” parecen remontarse a J. Wallis2,
quien las introdujo para el cálculo de la integral de la función (1 − x2 )1/2 . Parece, también, que
otros matemáticos como J. Gregory, G.W. Leibniz, Johann Bernoulli y A. de Moivre habı́an
descubierto ya variantes de las series de potencias o series “de Taylor”.
La aportación fundamental de Newton es doble : de una parte permite representar funciones
implı́citas a través de su expansión en series de potencias formales. De otra parte, ofrece un
algoritmo de aproximación de estas series de potencias formales. Tenemos ası́ un Teorema
de la Función Implı́cita con funciones dadas mediante series de las que Newton desconoce la
convergencia. Parece también que no se preocupó excesivamente de este problema.
De hecho, debemos esperar a K. Weirstrass para disponer de una Teorı́a completa de las Fun-
ciones Analı́ticas. Debido a sus problemas de salud, Weierstrass no escribió siempre y del modo
más completo las ideas subyacentes a sus investigaciones. Los primeros estudios sobre fun-
ciones analı́ticas datan de su trabajo de 18543. No será hasta 1861 que Weierstrass obtendrá
el primer ejemplo de función real continua no diferenciable. Esto supuso un vuelco consider-
able en la fundamentación del Análisis que, hasta Weierstrass, tenı́a mucho de intuicionista.
Las aportaciones fundamentales de K. Weierstrass tuvieron siempre la forma de cursos semes-
trales impartidos en la Universidad de Berlı́n (hoy Humboldt Universität). Dichos cursos fueron
recogidos por muchos de sus alumnos en forma de textos (como, por ejemplo, las notas tomadas
1
B. Taylor. “ Methodus incrementorum directa et inversa”. (1715)
2
J. Wallis.“Arithmetica infinitorum”. (1656)
3En este trabajo Weierstrass explora la descripción de las funciones abelianas mediante series de
potencias formales : K. Weierstras. “Zur Theorie der Abelschen Functionen”. J. für Reine und Angew.
Math. (1854).
285
286 10. EL TEOREMA DE LA FUNCIÓN IMPLÍCITA : FIBRAS DE LEVANTAMIENTO.

por W. Killing de los cursos impartidos en 1868 o las notas tomadas por A. Hurwirtcz de los
cursos de Weierstrass en 1878). Es destacable, por la influencia que tiene en este Capı́tulo, el
curso de 1863/64 sobre la “Teorı́a General de las Funciones Analı́ticas”. En lo concerniente
a este Capı́tulo nos interesarán sustancialmente los Teoremas de División y Preparación4 que
discutiremos en el caso de anillos de series de potencias formales.
Posteriormente, estos trabajos iniciales de Newton se diversifican en varios frentes. De una
parte, un esfuerzo por demostrar el Teorema de la Función Implı́cita y la convergencia de las se-
ries resultantes; pero preservando el carácter iterativo del método de Newton puede encontrarse
en J. Liouville5. A la sazón, A. Cauchy, predecesor de Liouville en la École Polytechnique, habı́a
dado ya una demostración del Teorema de la Función Implı́cita de tipo existencial, basándose
en los desarrollos hechos para demostrar la existencia y unicidad de solución de Ecuaciones
Diferenciales Ordinarias (Teorema de Cauchy–Peano–Lipschitz)6.
De otro lado, V. Puisseux, ha continuado los trabajos de Cauchy, obteniendo las nociones de polo
y puntos de ramificación, ası́ como las series de potencias formales con exponente fraccionario
(Series de Puisseux) y ha extendido el algoritmo original de Newton para la representación local
de curvas alrededor de puntos singulares.
Finalmente, K. Hensel reinterpreta las ideas de K. Weierstrass sobre series de potencias for-
males introduciendo y desarrollando los número p-ádicos y la correspondiente interpretación
del algoritmo de Newton.
Este Capı́tulo está dedicado a hacer una relectura, en el lenguaje actual, de la historia de estos
resultados. Ciertamente, como en el caso de Newton, no haremos mucho caso a la cuestión de
la convergencia y nos instalaremos en el confortable anillo local regular de las series de poten-
cias formales en un punto. Comenzaremos con una somera descripción de las propiedades del
completado de anillos locales Noetherianos para la filtración m−ádica (Sección 10.3) siguiendo
una combinación del [ZaSa, 60] y del [Ma, 80].
Posteriormente (Sección 10.4 ) se demuestran los Teoremas de División y Preparación que
pueden encontrarse en cualquiera de los textos clásicos de Funciones Holomorfas en Varias Vari-
ables Complejas como [?], [?]. Aunque esos enunciados también se encuentran en [ZaSa, 60],
he elegido la versión del más reciente [?].
En el camino (Sección 10.5) nos dedicaremos a la noción de anillo local regular y a exponer
el Criterio del Jacobiano. La noción genérica de anillo local regular es debida al alumno de
E. Noether W. Krull7. Incluimos una demostración del Teorema de Estructura para anillos
locales equi–caracterı́sticos, como el prensentado por el alumno de O. Zariski I.S. Cohen8. La
demostración propuesta para este resultado que propongo seguir es la expuesta en [ZaSa, 60].
Juntando este Teorema de I.S. Cohen con los Teoremas de Weierstrass tenemos una versión
débil como resolución del Problema de Serre.
A partir de esta Sección ya pasamos a la Demostración del Teorema de la Función Implı́cita
(Sección 10.6). En esta Sección daremos dos variantes del Lema de Newton–Hensel. De una
parte, la versión del Lema de Hensel propuesta en [ZaSa, 60] y la no menos destacable influencia
del texto de P. Ribenboim9. La demostración de [ZaSa, 60] consiste en mostrar un algoritmo
de convergencia lineal para la norma no–arquimediana definida por la filtración m−ádica (en la
Subsección 10.6.1). Posteriormente, ofreceremos una demostración no ya del Lema de Hensel
sino del Teorema de la Función Implı́cita usando el operador de Newton multivariado (en la
Subsección 10.6.2) y demostrando que tiene una convergencia cuadrática para la norma no–
arquimediana.

4K.Weierstrass. “Zur Theorie der eindeutigen analytischen Functionen”. Berl. Abh. (1876) 11-60.
5Véaseel comentario histórico hecho por M. Demazure en su texto “Catastrophes et Bifurcations”
Ellipses (1989).
6Véase una descripción de los sucesos históricos en el excelente texto de ecuaciones diferenciales
E.L. Ince.“Ordinary Differential Equations”. Dover (1956).
7Véanse los trabajos

• W. Krull. “Dimensionen in Stellensringen”. J. reine angew. Math.179 (1938) 204–26.


• W. Krull. “Idealtheorie”. Springer (1935).

8
I.S. Cohen. “On the Structure and Ideal Theory of Complete Local Rings”. Trans. AMS 59
(1946) 54–106.
9
P. Ribenboim. “Equivalent forms of Hensel’s Lemma”. Expo. Math. 3 (1985) 3–24.
10.2. ANILLOS Y MÓDULOS TOPOLÓGICOS : FILTRACIONES Y COMPLETADOS 287

10.2. Anillos y módulos topológicos : filtraciones y completados


El propósito es comenzar con el [?] y continuar, más adelante, con el modelo del discurso del
Capı́tulo final de [ZaSa, 60].
Definición 114. Llamaremos anillo topológico a todo anillo A dotado de una topologı́a T tal
que las siguientes son aplicaciones continuas :
i) − : A × A −→ A, −(a, b) := a − b
ii) · : A × A −→ A, ·(a, b) := a · b.
donde A × A está dotado de la topologı́a producto.
Tras unos pocos ejemplos clásicos :
Definición 115. Sea (A, T ) un anillo topológico, M un A−módulo y T ’ una topologı́a sobre
M . Diremos que M es un A−módulo topológico si las siguientes son aplicaciones continuas :
i) − : M × M −→ M, −(m, n) := m − n
ii) · : A × M −→ M, ·(a, m) := a · m.
donde A × M está dotado con la topologı́a producto.
Proposición 10.2.1. Sean (A, T ) un anillo topológico y (M, T 0 ) un A−módulo topológico.
Entonces para x ∈ A y m ∈ M , se tiene :
i) la traslación tx : A −→ A, dada por tx (a) := a + x, es un homeomorfismo.
ii) la traslación tm : M −→ M , dada por tm (n) := m + n, es un homeomorfismo.
Obsérvese que, como en el caso de los espacios vectoriales topológicos, si U0 es una base de
entornos de 0 ∈ A, donde (A, T ) es un anillo topológico. Entonces, la clase :
x + U0 := {tx (U ) : U ∈ U0 }
es una base de entornos de x ∈ A.
Análogamente ocurrirá cuando tratemos de A−módulos topológicos.
La conclusión de esta observación es que para determinar una topologı́a en un anillo o en
un módulo, nos basta con determinar una base de entornos del 0 para esa topologı́a. Las
propiedades adicionales que tal base de entornos debe verificar se describen en la siguiente
Proposición tomada del texto clásico de grupos topológicos de [?].
Proposición 10.2.2. Sea A un anillo cualquiera y consideremos una colección de subconjuntos
de A, Σ ⊆ P(A) verificando :
i) La intersección de dos elementos cualesquiera de Σ contiene a algún elemento de Σ.
ii) Si U ∈ Σ, existe W ∈ Σ tal que :
W − W := {x − y : x, y ∈ W } ⊆ U, W 2 := {xy : x, y ∈ W } ⊆ U
iii) Si U ∈ Σ, x ∈ U, y ∈ A, existe W ∈ σ tal que :
tx (W ) ⊆ U, yW := {y · a : a ∈ W } ⊆ U
Entonces, existe una única topologı́a T sobre A tal que (A, T ) es un anillo topológico y Σ es
una base de entornos abiertos de 0 ∈ A.
Proposición 10.2.3. Sea (A, T ) un anillo topológico y Σ una base de entornos abiertos de
0 ∈ A. Entonces, Σ verifica las propiedades i), ii) y iii) de la Proposición anterior.
Análogos resultados se pueden obtener para módulos topológicos (cf. [?]).
Proposición 10.2.4. Sea (A, T ) un anillo topológico y (M, T 0 ) un A−módulo topológico con
respecto a la topologı́a T sobre A. Las siguientes afirmaciones son equivalentes :
i) (M, T 0 ) es un espacio topológico de Hausdorff.
ii) El conjunto {0} es un cerrado.
iii) Si Σ0 es una base de entornos abiertos de 0 ∈ M , se tiene :
\
{0} = U
U ∈Σ0

No vamos a ocupar este curso en un amplio estudio de los anillos topológicos. El alumno puede
seguir, si quiere, el texto [?]. Nos centraremos en las filtraciones.
288 10. EL TEOREMA DE LA FUNCIÓN IMPLÍCITA : FIBRAS DE LEVANTAMIENTO.

Definición 116. i) Sea A un anillo. Llamaremos filtración sobre A a toda colección Σ,


cadena descendente de ideales :
Σ := {A = a0 ⊇ a1 ⊇ · · · ⊇ an ⊇ · · · }
verificando an · am ⊆ an+m , ∀n, m ∈ N. Diremos que (A, Σ) es un anillo filtrado.
ii) Sea (A, Σ) un anillo filtrado y M un A−módulo. Una filtración sobre M compatible
con la filtración Σ = {an : n ∈ N} de A, a toda cadena descendente de submódulos
de M :
Σ0 := {M = N0 ⊇ N1 ⊇ · · · ⊇ Nn ⊇ · · · }
tal que an · Nm ⊆ Nn+m , ∀n, m ∈ N.
Proposición 10.2.5. i) Si (A, Σ) es un anillo filtrado, la filtración Σ verifica las propiedades
de la Proposición 10.2.2 anterior y existe una única topologı́a sobre A para la cual Σ
es una base de entornos abiertos de 0 ∈ A. A esa topologı́a se la denomina topologı́a
asociada a la filtración Σ.
ii) Un análogo resultado se tiene para módulos con filtraciones.
Proposición 10.2.6. Sea (A, Σ) es un anillo filtrado, y (M, Σ0 ) es un A−módulo filtrado, con
una filtración Σ0 compatible con la filtración Σ de A. Supongamos
Σ := {A = a0 ⊇ a1 ⊇ · · · ⊇ an ⊇ · · · }
0
Σ := {M = N0 ⊇ N1 ⊇ · · · ⊇ Nn ⊇ · · · }
Entonces, para cada S ⊆ A y cada N ⊆ M , las clausuras de S y N para las respectivas topologı́as
vienen dadas por : \
S= (S + an )
n∈N
\
N= (N + Nn )
n∈N

Corollario 10.2.7. Con las mismas notaciones de la Proposición anterior, sea a un ideal de
A y N un submódulo de M . Entonces,
i) \
a= (a + an )
n∈N
ii) Si a es abierto en A, entonces es cerrado.
iii) \
N= (N + Nn )
n∈N
iv) Si N es abierto en M , entonces es cerrado.
Corollario 10.2.8. Sea (A, Σ) es un anillo filtrado, y (M, Σ0 ) es un A−módulo filtrado, con
una filtración Σ0 compatible con la filtración Σ de A. Supongamos :
Σ0 := {M = N0 ⊇ N1 ⊇ · · · ⊇ Nn ⊇ · · · }
Entonces, M con la topologı́a asociada a la filtración Σ0 es de Hausdorff si y solamente si :
\
{0} = Nn
n∈N

Seguiremos con la condición de metrizabilidad, que se basará en este Corolario, y que tratare-
mos de seguir a través del Capı́tulo de Algebra Local del texto [ZaSa, 60]. Más adelante
recuperaremos la condición de Hausdorff a través del Teorema de la Intersección de Krull.
Teorema 10.2.9. Sea (A, Σ) es un anillo filtrado, y (M, Σ0 ) es un A−módulo filtrado, con una
filtración Σ0 compatible con la filtración Σ de A. Supongamos
Σ0 := {M = N0 ⊇ N1 ⊇ · · · ⊇ Nn ⊇ · · · }
Si M es Hausdorff con la topologı́a asociada a la filtración Σ0 , entonces es metrizable con la
métrica :
dM (x, y) := e−k
10.2. ANILLOS Y MÓDULOS TOPOLÓGICOS : FILTRACIONES Y COMPLETADOS 289

donde x − y ∈ Nk , x − y 6∈ Nk+1 . En particular, si BM (0, e−n ) es la bola cerrada de centro


0 ∈ M y radio e−n para la métrica dM , esta bola coincide con el submódulo Nn .
Recordemos que todo espacio métrico posee un completado. Podemos hacer aquı́ la construcción
del completado de un A−módulo filtrado cuya topologı́a es de Hausdorff.
Recordemos de los cursos elementales de topologı́a la siguiente propiedad :
Teorema 10.2.10 (Completado de un espacio métrico). Sea (X, d) un espacio métrico. En-
tonces, existe un espacio métrico completo (X ∗ , d∗ ) y una función i : X −→ X ∗ continua,
verificando :
i) i es una isometrı́a entre X y una parte densa de X ∗ .
ii) Dada ϕ : X −→ Y una función uniformemente contı́nua, donde (Y, d0 ) es un espacio
métrico completo, existe una única función continua ψ : X ∗ −→ Y tal que ψ ◦ i = ϕ.
De otro lado, cualquier otro espacio métrico completo que verifique estas dos propiedades es
homeomorfo (e isométrico) a (X ∗ , d∗ ).
A cualquier espacio métrico (X ∗ , d∗ ) y aplicación i : X −→ X ∗ verificando estas propiedades
se le denomina completado del espacio métrico (X, d).
Observando que la suma y el producto son funciones uniformemente continuas, se pueden
extender las respectivas estructuras de anillo y módulo al completado. Esto es,
Proposición 10.2.11. Sea (A, Σ) es un anillo filtrado, y (M, Σ0 ) es un A−módulo filtrado de
Hausdorff, con una filtración Σ0 compatible con la filtración Σ de A. Sea M ∗ es el completado
de M para la métrica definida por la filtración Σ0 . Entonces, M ∗ posee una estructura de
A−módulo filtrado de Hausdorff, es decir, es un A−módulo filtrado con la filtración dada por :
Σ∗ := {M ∗ ⊇ N1 ⊇ · · · ⊇ Nn ⊇ · · · }
donde Ni es la clausura de Ni en M ∗ , y la topologı́a definida por esa filtración en M ∗ es la
topologı́a de M ∗ como completado del espacio métrico (M, dM ).
Lo mismo se puede decir del anillo y su completado A∗ .
Las filtraciones y las graduaciones en anillos y módulos son elementos interrelacionados de
manera fuerte. Para verlo, introduzcamos los siguientes ejemplos :
Ejemplo 10.2.12. • Sea A un anillo Σ := {A = a0 ⊇ · · · an ⊇ · · · } una filtración sobre
A. Podemos definir el grupo abeliano
GΣ (A) := ⊕n∈N (an /an+1 )
Al grupo abeliano GΣ (A) le podemos dotar de una estructura de anillo, extendiendo
la operación producto
· : GΣ (A) × GΣ (A) −→ GΣ (A)
sobre los elementos “homogéneos” de la manera natural. Con esta definición, GΣ (A)
es un anillo graduado que llamaremos anillo graduado asociado a la filtración Σ sobre
A.
• Sea (A, Σ) un anillo filtrado y (M, Σ0 ) un A−módulo filtrado con una filtración com-
patible con la filtración Σ de A. De la manera natural se construye GΣ0 (M ) y se
le dota de una estructura de GΣ (A)−módulo, que llamaremos módulo asociado a la
filtración Σ0 sobre M .
Definición 117. Sea (A, Σ) un anillo filtrado y (M, Σ0 ) un A−módulo filtrado con una filtración
compatible con Σ. Dados x ∈ A, m ∈ M , llamaremos parte inicial de x y de m a los elementos :
GΣ (x) = x + an+1 ∈ GΣ (A), donde n = νΣ (x)
GΣ0 (m) = m + Nn+1 ∈ GΣ (M ), donde n = νa (m)
o bien GΣ (x) = 0 y GΣ0 (m) = 0, cuando νΣ (x) = +∞ y νΣ0 (m) = +∞
Lema 10.2.13. En las notaciones anteriores, dados a, b ∈ A, son equivalentes :
i) νΣ (ab) > νΣ (a) + νΣ (b).
ii) ab ∈ aνΣ (a)+νΣ (b)+1 .
iii) GΣ (a)GΣ (b) = 0 en GΣ (A).
Donde νΣ es la función de orden asociada a la filtración Σ.
290 10. EL TEOREMA DE LA FUNCIÓN IMPLÍCITA : FIBRAS DE LEVANTAMIENTO.

10.2.1. Graduaciones y filtraciones a−ádicas. Uno de los ejemplos esenciales de fil-


traciones en anillos y módulos es el definido por las potencias de un ideal.
Definición 118. Sea A un anillo, M un A−módulo y a un ideal de A. Llamaremos filtración
a−ádica sobre A y sobre M a las filtraciones definidas por los conjuntos :
Σa (A) := {A = a0 ⊇ a1 ⊇ a2 ⊇ · · · }
Σa (M ) := {M = a0 M ⊇ a1 M ⊇ a2 M ⊇ · · · }
Ejemplo 10.2.14. • Dado el anillo de polinomios A := K[X0 , . . . , Xn ] y el ideal max-
imal m := (X0 , X1 , . . . , Xn ), la filtración m−ádica en A es la dada por las potencias
del ideal m, es decir, por los ideales mn formados por los polinomios tales que la
multiplicidad de (0, . . . , 0) es, al menos, n.
• Dado el anillo Z y un elemento primo p ∈ Z, la filtración p−ádica es la filtración
asociada a las potencias del ideal primo (p) de Z.
Definición 119. Sea A un anillo, M un A−módulo y a un ideal de A. Llamaremos anillo
graduado asociado a la filtración a−ádica, Ga (A), en A y el Ga (A)−módulo asociado a la
filtración a−ádica en M a los siguientes anillo y módulo graduados :
Ga (A) := ⊕n∈N (an /an+1 )
Ga (M ) := ⊕n∈N (an M/an+1 M )
con las operaciones pertinentes.
Notación 10.2.15. Denotaremos por νa tanto a la función de orden definida por la filtración
a−ádica en A como en M , declarando en cada caso a cuál nos referimos. De la misma manera
denotaremos la parte inicial de un elemento x ∈ A o m ∈ M , siendo :

Ga (x) = x + an+1 ∈ an /an+1 , donde n = νa (x)


Ga (m) = m + an+1 M ∈ an M/an+1 M, donde n = νa (m)
Las filtraciones y graduaciones a−ádicas permiten obtener propiedades del anillo a partir del
anillo graduado asociado. Ası́, tenemos :
Lema 10.2.16. Sea A un anillo, a un ideal de A, y sea M un A−módulo.
i) Si A es noetheriano, también lo es Ga (A).
ii) Si A es Hausdorff (i.e. ∩n∈N an = (0)), entonces,
Ga (A) es un dominio ⇒ A es un dominio
En este caso, νa (ab) = νa (a) + νa (b), para cada a, b ∈ A.
iii) Si A es noetheriano y M es un A−módulo finitamente generado, Ga (M ) es un Ga (A)−módulo
noetheriano.
iv) En las anteriores condiciones, cada an M/an+1 M es un A/a−módulo noetheriano y
finitamente generado.
También condiciones más técnicas como la de ser normal un anillo se trasladan bien del graduado
al anillo total en ciertas condiciones :
Proposición 10.2.17. Sea A un anillo noetheriano, a un ideal de A. Supongamos que todo
ideal principal de A es cerrado para la topologı́a a−ádica. Entonces,
Ga (A) normal ⇒ A normal
Construcción Como siempre, sea A un anillo, M un A−módulo, N un submódulo de M e a
un ideal de A. Tratamos de relacionar los anillos graduados correspondientes a las filtraciones
a−ádicas en M y M/N . Para ello, consideremos la proyección canónica :
π : M −→ M/N
n n
Observamos que π(a M ) = a (M/N ). Para cada n ∈ N, consideremos el morfismo de
A−módulos :
ϕn : an M + N −→ an (M/N )
dado por ϕn (m) := m + N . Este morfismo de A−módulos induce :
10.2. ANILLOS Y MÓDULOS TOPOLÓGICOS : FILTRACIONES Y COMPLETADOS 291

Proposición 10.2.18. En las notaciones anteriores :


Ga (M/N ) ∼= ⊕n∈N an M + N/an+1 M + N


Consideremos ahora el morfismo de Ga (A)−módulos dado mediante :


ϕ : Ga (M ) −→ Ga (M/N )
definido por :
ϕ(a + an+1 M ∈ an M/an+1 M ) := a + an+1 M + N ∈ an M + N/an+1 M + N
Es fácil ver que se trata de un epimorfismo graduado de grado cero de Ga (A)−módulos. El
núcleo será un submódulo homogéneo cuyos elementos homogéneos de grado n viene dados por :
((an M ) ∩ (an+1 M + n))/(an+1 M )


Tenemos ası́ la sucesión exacta corta de A−módulos :


0 → ((an M ) ∩ (an+1 M + N ))/(an+1 M ) → an M/an+1 M → an M + N/an+1 M + N → 0
Lo que induce una sucesión exacta corta de Ga (A)−módulos graduados :
0 −→ ⊕n∈N (an M ∩ (an+1 M + N ))/an+1 M −→ Ga (M ) −→ Ga (M/N ) −→ 0


Definición 120. Sea A un anillo, a un ideal de A, M un A−módulo y N un submódulo de M .


Llamaremos submódulo director de N al submódulo del Ga (A)−módulo Ga (M ) generado por :
⊕n∈N (an M ) ∩ (an+1 M + N )/(an+1 M )


Obsérvese que el submódulo director de M es el propio Ga (M ).


Lema 10.2.19. Sea A un anillo, a un ideal de A, M un A−módulo y N un submódulo de M .
Entonces, el submódulo director de N está generado por las formas iniciales de los elementos
de N
Estos resultados nos preparan para los dos primeros enunciados esenciales de esta Sección.

10.2.2. El Lema de Artin–Rees y el Teorema de la Intersección de Krull. Si


bien el resultado conocido como Lema de Artin–Rees (fue probado independientemente por E.
Artin y D. Rees 10) tiene el aspecto de un sencillo Lema técnico, sus consecuencias (tanto para
la demostración del Teorema de la Dimensión Local como para el Teorema de la Intersección
de Krull) serán esenciales. En esta Subsección trataremos de la demostración de tal resultado
técnico y lo aplicaremos a la demostración del Teorema de la Intersección de Krull. Por su parte,
el Teorema de la Intersección, que se sigue del Lema de Artin–Ress y del Lema de Nakayama,
tiene muy interesantes consecuencias en términos de la estructura topológica de los anillos con
la filtración a−ádica.
La idea del Lema de Artin–Rees se expresa diciendo que para filtraciones en módulos compati-
bles con la filtración a−ádica, la topologı́a inducida por la filtración y por la filtración a−ádica
coinciden. Vemos la terminologı́a.
Definición 121. Sea (A, Σ) un anillo filtrado y (M, Σ0 ) un A−módulo filtrado. Sea a un ideal
de A. Supongamos :
Σ0 := {M = M0 ⊇ M1 ⊇ · · · ⊇ Mn ⊇ · · · }
Diremos :
i) La filtración Σ0 es compatible con la filtración a−ádica sobre A si aMn ⊆ Mn+1 , para
cada n ∈ N.
ii) La filtración Σ0 es estable para la filtración a−ádica sobre A si existe n0 ∈ N tal que
aMn = Mn+1 , para cada n ≥ n0 .
Nótese que la condición de ser compatible significa solamente que (M, Σ0 ) es un A−módulo
filtrado, cuando en A se considera la filtración a−ádica.
La filtración a−ádica en M es un vivo ejemplo de filtración estable.

10D. Rees. “Two classical theorems of ideal theory”. Proc. Cambridge Philos. Soc. 52 (1956),
155–157.
292 10. EL TEOREMA DE LA FUNCIÓN IMPLÍCITA : FIBRAS DE LEVANTAMIENTO.

Teorema 10.2.20 (Lema de Artin-Rees). Sea A un anillo noetheriano, a un ideal de A y M


un A−módulo finitamente generado. Sea N un submódulo de M .
Entonces, para toda filtración a−estable sobre M , la filtración inducida sobre N es estable con
respecto al ideal a de A.
Corollario 10.2.21. Sea A un anillo noetheriano, a un ideal de A, M un A−módulo finita-
mente generado y N un submódulo de M . Entonces, existe n0 ∈ N tal que :
∀n ≥ n0 , a(an M ∩ N ) = an+1 M ∩ N
Combinando el Lema de Nakayama con el Lema de Artin–Rees obtenemos el siguiente resultado
relevante.
Teorema 10.2.22 (El Teorema de la Intersección de W. Krull). Sea A un anillo noetheriano,
a un ideal de A, M un A−módulo finitamente generado
i) Si N := n∈N an M , aN = N .
T
ii) Si a está contenido en el radical de Jacobson de A,
\
an M = (0)
n∈N

y la topologı́a definida por la filtración a−ádica sobre M es Hausdorff y metrizable.


iii) Si A es un dominio noetheriano, para cada ideal a de A se tiene :
\
an = (0)
n∈N

y la topologı́a a−ádica sobre A es Hausdorff y metrizable.


Corollario 10.2.23. Si (A, m) es un anillo local noetheriano, las topologı́as q−ádicas definidas
por cualquier ideal propio de A en cualquier A−módulo finitamente generado son Hausdorff y,
por ende, metrizables.
Proposición 10.2.24. Si A es un anillo noetheriano y a es un ideal contenido en el radical de
Jacobson de A :
Ga (A) normal ⇒ A normal
El recı́proco no es cierto. Ver [Ma, 89], p.119.

10.3. Propiedades del Completado : Anillos de Zariski.


Recordamos la construcción del completado de un anillo noetheriano con respecto a las filtra-
ciones a−ádicas, hecho en las Subsecciones 10.2 y 10.2.1. Retomamos aquellos temas y hace-
mos algunas disquisiciones adicionales. Las referencias básicas serán los textos [Ra et al., 75],
[Ma, 80], [Ma, 89] y [ZaSa, 60].
Proposición 10.3.1. Sea A un anillo noeteheriano, sea a un ideal contenido en el radical de
Jacobson de A,sea M un A−módulo finitamente generado. Sea A∗ y M ∗ los completados de A
y M para las respectivas filtraciones a−ádicas. entonces, M ∗ es el A∗ −módulo generado por
M .11
Corollario 10.3.2. Sea B un anillo y sea A un subanillo de B, tal que B es un A−módulo
finitamente generado. Supongamos que A es noetheriano y sea a un ideal de A. Entonces, la
topologı́a de B como A−módulo y la topologı́a aB−ádica coinciden. En particular, la inclusión
A ,→ B induce una inclusión A∗ ,→ B ∗ .
Tenemos toda una serie de conclusiones técnicas, de gran utilidad en las argumentaciones fu-
turas, como las siguientes :
Corollario 10.3.3. Sea A un anillo noetheriano, a un ideal de A, M un A−módulo finita-
mente generado. Supongamos que tanto A como M son Hausdorff para sus respectivas topologı́as
a−ádicas. Entonces :
11En las notaciones de [ZaSa, 60], escribirı́amos M ∗ = A∗ M . Sin embargo, en las notaciones más
apropiadas de [Ma, 80] escribirı́amos M ∗ = A∗ ⊗A M . El enunciado se puede dar de ambas maneras.
10.4. LOS TEOREMAS DE DIVISIÓN Y PREPARACIÓN DE WEIERSTRASS. 293

i) La clausura de todo submódulo N de M en M ∗ viene dada por el submódulo de M ∗


generado por N (i.e. A∗ N ). Más aún, N es cerrado en M si y solamente si N =
A∗ N ∩ M .
ii) Las topologı́as de los completados A∗ y M ∗ son sus respectivas topologı́as aA∗ −ádicas.
iii) El completado del cociente M/N para todo submódulo cerrado N de M viene dado por
M ∗ /A∗ N .
iv) Los anillos graduados Ga (A) y GaA∗ (A∗ ) son isomorfos como anillos graduados, por
tanto, también se tiene :
A/a ∼
= A∗ /aA∗ ,
isomorfismo como anillos y son isomorfimos de A/a−módulos los siguientes :
an /an+1 ∼
= an A∗ /an+1 A∗ .
Lo mismo sucede con los módulos finitamente generados.
Un importante resultado técnico es el siguiente :
Teorema 10.3.4. Sea A un anillo noetheriano, a un ideal propio de A, M un A−módulo y N
un submódulo de M . Supongamos que A y M son espacios de Hausdorff para las respectivas
topologı́as a−ádicas y supongamos, además, que A es completo.
Sean {x1 , . . . , xn } una colección finita de elementos de N tales que sus formas iniciales generan
el submódulo director de N en Ga (M ) como Ga (A)−módulo. Entonces, {x1 , . . . , xn } generan
N como submódulo de M .
El resultado puede verse en [ZaSa, 60].
La siguiente es una caracterización del tipo de anillos completos que más utilizaremos en estas
páginas y que se denominan anillos de Zariski.
Definición 122. Un anillo noetheriano A se dice anillo de Zariski con respecto a un ideal
propio a de A si para todo ideal propio b de A, se tiene que b es cerrado en A para la topologı́a
definida por la filtración a−ádica.
La siguiente caracterización puede verse en [Ma, 80] :
Teorema 10.3.5. Sea A un anillo noetheriano y a un ideal propio de A. Son equivalentes :
i) El ideal a está contenido en el radivcal de Jacobson de A,
ii) 1 − a es unidad de A para todo a ∈ a,
iii) Si M es un A−módulo finitamente generado y aM = 0, entonces, M = 0,
iv) Si M es un A−módulo finitamente generado, la topologı́a a−ádica sobre M es Haus-
dorff,
v) Para todo A−módulo finitamente generado, todo submódulo N de M es cerrado para
la topologı́a a−ádica sobre M ,
vi) A es un anillo de Zariski con respecto al ideal a:
Una caracterización más que puede verse en [Ma, 80] :
Proposición 10.3.6. Sea A un anillo noetheriano y a un ideal propio de A. Entonces, A es
un anillo de Zariski si y solamente si su completado A∗ con respecto a la topologı́a definida por
la filtración a−ádica es fielmente plano sobre A.
Como Corolario obtenemos
Corollario 10.3.7. El completado de todo anillo semi–local (respectivamente local) noetheri-
ano con respecto a su radical de Jacobson es un anillo semi–local (resp. local) noetheriano de
la misma dimensión.

10.4. Los Teoremas de División y Preparación de Weierstrass.


En su esfuerzo por fundamentar el análisis complejo a partir de las series de potencias conver-
gentes, K. Weierstrass impartió varios cursos basados en su trabajo de 1876 12. Los resultados
que más han trascendido, conocidos como Teoremas de División y Preparación, son los resulta-
dos de los que nos ocuparemos en esta Sección. Para ello, recordaremos al alumno los elementos
12K. Weierstrass. “Zur Theorie der eindeutigen analytischen Functionen”. Berl. Abh. (1876)
11-60.
294 10. EL TEOREMA DE LA FUNCIÓN IMPLÍCITA : FIBRAS DE LEVANTAMIENTO.

básicos del anillo de potencias formales. Comenzaremos introduciendo los anillos de series de
potencias formales con coeficientes en un anillo A. Obtendremos como primer resultado el
siguiente, que puede consultarse en [Ma, 80] :

Proposición 10.4.1. Sea A un anillo conmutativo con unidad. Entonces, A[[X1 , . . . , Xn ]] es


el completado de A[X1 , . . . , Xn ] con respecto a la topologı́a definida por la filtración a−ádica,
donde
a := (X1 , . . . , Xn ).

En particular, concluimos :

Corollario 10.4.2. Con las anteriores notaciones :


i) Si A es noetheriano, A[[X1 , . . . , Xn ]] es noetheriano.
ii) Si A es un dominio, A[[X1 , . . . , Xn ]] es un dominio.
iii) Si A es normal, entonces A[[X1 , . . . , Xn ]] es normal.
iv) Si A es un anillo local, A[[X1 , . . . , Xn ]] es un anillo local cuyo maximal está generado
por el maximal de A y las variables X1 , . . . , Xn .

Para la factorialidad necesitaremos dos clásicos resultados de K. Weierstrass conocidos como los
Teoremas de Divisón y Preparación. Puede seguirse en cualquier texto clásico de Varias Vari-
ables Complejas o de Geometrı́a Analı́tica como los textos [?], [?] o [?]. También se encuentran
en [ZaSa, 60]. Seguiré esencialmente el texto de Kaup y Kaup.

Definición 123. Una serie de potencias formales σ ∈ K[[X1 , . . . , Xn , Y ] se denomina distin-


guida en Y de orden b si
σ(0, . . . , 0, Y ) = Y b e,
para alguna unidad e ∈ K[[Y ]].
Sea denomina polinomio de Weierstsrass de grado b a toda serie σ ∈ K[[X1 , . . . , Xn , Y ]] de la
forma :
b−1
X
σ := Y b + ak Y k ,
k=0

donde Ak ∈ K[[X1 , . . . , Xn ]].

Teorema 10.4.3 (Teorema Preparatorio de Weierstrass). Sea σ ∈ K[[X1 , . . . , Xn , Y ]] una serie


de potencias formales distinguida en Y de orden b, entonces, existe un polinomio de Weierstrass
ω ∈ K[[X1 , . . . , Xn ]][Y ] de grado b y una unidad e ∈ K[[X1 , . . . , Xn ]]∗ tales que
σ = eω.
Más aún, si K = C y σ es una serie convergente, también es convergente ω.

Teorema 10.4.4 (Teorema de División de Weierstrass). Si σ ∈ K[[X1 , . . . , Xn , Y ]] es una serie


distinguida de orden b, entonces, la aplicación :
K[[X1 , . . . , Xn , Y ]] · σ ⊕ K[[X1 , . . . , Xn ]][Y ]b−1 −→ K[[X1 , . . . , Xn , Y ]],
dada mediante :
(q · σ, r) 7−→ q · σ + r,
es un isomorfismo de K[[X1 , . . . , Xn ]]−módulos. En otras palabras, para toda serie de potencias
formales F ∈ K[[X1 , . . . , Xn , Y ]], existen series únicas q ∈ K[[X1 , . . . , Xn , Y ]] y un polinomio
distinguido de grado a lo sumo b − 1 tales que
F = qσ + r.

Los Corolarios más relevantes a este enunciado son, obviamente,

Corollario 10.4.5. El anillo de series de potencias formales K[[X1 , . . . , Xn ]] es un dominio


de factorización única, normal, local y noetheriano de dimensión n.
10.5. ANILLOS LOCALES REGULARES. 295

10.5. Anillos Locales Regulares.


El concepto de anillo local regular fue introducido por W. Krull13 en su trabajo de 1938,
tratando de responder a una pregunta que él mismo habı́a introducido en su texto de 193514.
Definición 124. Diremos que un anillo local noetheriano (A, m) es un anillo local regular si su
ideal maximal está generado por un sistema de parámetros. Esto es, si dim(A) = d y existen
x1 , . . . , xd ∈ m tales que
(x1 , . . . , xd ) = m.
A tales conjuntos se les denomina sistemas regulares de parámetros.
Son anillos locales regulares los anillos de series de potencias formales o los localizados del
anillo de polinomios con coeficientes en un cuerpo (cf. [Ma, 80], Capı́tulo 7, pp.126–127, por
ejemplo).
Teorema 10.5.1. Sea (A, m) un anillo local noetheriano de dimensión d. Son equivalentes :
i) A es un anillo local regular,
ii) El anillo graduado Gm (A) es un anillo de polinomios en d variables con coeficientes
en A/m,
iii) El A/m−espacio vectorial m/m2 tiene dimensión d.
La demostración, muy elemental, puede seguirse en [Ra et al., 75].
Corollario 10.5.2. Un anillo local noetheriano (A, m) es local regular si y solamente si su
completado A∗ es local regular.
Además, dado que Gm (A) es un anillo normal, todo anillo local regular es un anillo normal.
Proposición 10.5.3. Sea (A, m) un anillo local regular de dimensión d y sean a1 , . . . , aj una
colección de j elementos de A. Son equivalentes :
i) {a1 , . . . , aj } es parte de un sistema regular de parámetros de A,
ii) Las clases a1 + m2 , . . . , aj + m2 son A/m−linealmenmte independientes en m/m2 ,
iii) A/(a1 , . . . , aj ) es un anillo local regular de dimenjsión d − j.
En particular, para cada ideal primo p de A, A/p es local regular de dimensión d − r si y
solamente si p está generado por r elementos de A que forman parte de un sistema regular de
parámetros de A.
10.5.1. Criterio del Jacobiano. Seguiré básicamente la introducción de [Shf, 74], aunque
no es inapropiada la presentada en [?].
Sea V ⊆ Kn un conjunto algebraico, P ∈ V un punto, f1 , . . . , fs un conjunto de generadores de
I(V ) en K[X1 , . . . , Xn ].
Definición 125. Una recta {P + tv : t ∈ K} ⊆ Kn pasando por el punto P se denomina
tangente a V en P , si se verifica que el siguiente polinomio univariado :
f (T ) := gdc(f1 (P + T v), . . . , fs (P + T v)) ∈ K[T ],
tiene en t = 0 una raı́z de multiplicidad mayor que 1.
Sea mP el ideal maximal de K[X1 , . . . , Xn ] asociado al punto P . Sea K[X1 , . . . , Xn ]P la local-
ización de K[X1 , . . . , Xn ] en el maximal mP (que es un anillo local regular de dimensión n).
Obsérvese que
K[X1 − α1 , . . . , Xn − αn ] ∼
= GmP (K[X1 , . . . , Xn ]),
donde P = (α1 , . . . , αn ). Para cada G ∈ K[X1 , . . . , Xn ] denotemos por dP (G) la diferencial de G
en P , ésto es, la componente homogénea de grado 1 de G como elemento de GmP (K[X1 , . . . , Xn ]).
Lema 10.5.4. Con las anteriores notaciones, una recta {P + tv : t ∈ K} es tangente a V en
P si y solamente si dP (fi )(v) = 0, 1 ≤ i ≤ s.

13W. Krull. “Dimensionen in Stellensringen”. J. reine angew. Math.179 (1938) 204–26


14W. Krull. “Idealtheorie”. Springer (1935)
296 10. EL TEOREMA DE LA FUNCIÓN IMPLÍCITA : FIBRAS DE LEVANTAMIENTO.

Denotemos por TP V el espacio tangente a V en P y sea D(f1 , . . . , fs )P la matriz jacobiana en


P de un sistema generador de I(V ). Se tiene :
TP V := {v ∈ Kn : D(f1 , . . . , fs )P (v) = 0}.
Más aún, sea mP el ideal maximal de K[V ] asociado al punto P y consideremos
dP : mP /m2P −→ (TP V )∗ .
la aplicación inducida por dP . Entonces, se tiene :
Proposición 10.5.5. La aplicación dP define un isomorfismo de K−espacios vectoriales.
Definición 126. Con las anteriores notaciones, diremos que un punto P ∈ V es un punto
regular o un punto simple si y solamente si
dimTP V = dim(V ).
En caso contrario diremos que P es un punto singular de V .
Obsérvese que la condición dimTP V ≥ dimV se satisface siempre.
Teorema 10.5.6 (Criterio del Jacobiano). Sea V ⊆ Kn un conjuto algebraico, supongamos
I(V ) = (f1 , . . . , fs ) y sea D(f1 , . . . , fs ) la matriz jacobiana definida por un sistema generador
de I(V ). Sea P ∈ V un punto y mP el maximal de K[V ] asociado al punto P . Son equivalentes :
i) P ∈ V es un punto simple,
ii) el anillo local noetheriano K[V ]mP es un anillo local regular de dimensión igual a la
dimensión de V .
iii) el rango de la matriz jacobiana en P es n − dim(V ), i.e.
rang(D(f1 , . . . , fs )P ) = n − dim(V ).
Observe el lector que la condición de ser simple es análoga a las hipótesis del Teorema de la
Función Implı́cita en el que insistiremos más adelante. Por ahora, es conveniente señalar al
alumno las implicaciones geométricas de esta propiedad.
En particular, conviene señalar que el conjunto de puntos singulares es un subconjunto alge-
braico propio de V y que la condición de ser un punto liso es una condición genérica en V .
10.5.2. Teorema de Estructura de Cohen. De haber dispuesto de tiempo para poder
diseñar un buen curso de Algebra Conmutativa, contando con una buena base de Algebra
Homológica, habrı́a desarrollado las demostraciones de los Teoremas de J.P. Serre15 o el Teorema
de M. Auslander y D.A. Buchsbaum16. Ambos resultados suponen respuestas a dos preguntas
formuladas por W. Krull en 1938. Sin embargo, no es éste el propósito del curso por lo que nos
conformaremos con el Teorema del alumno de O. Zariski I.S. Cohen17.
El teorema de I.S. Cohen se lee del modo siguiente en [ZaSa, 60], según los propios autores,
siguiendo una demostración debida a A. Geddes :
Teorema 10.5.7. Si A es un anillo local regular completo y equicaracterı́stico, entonces, A
contiene un cuerpo de representantes, ésto es, existe un subcuerpo K de A tal que K es isomorfo
a A/m.
La conclusión de este Teorema se lee del modo siguiente :
Corollario 10.5.8 (Teorema de Estructura de I.S. Cohen). Todo anillo local regular equica-
racterı́stico y completo es un anillo de series de potencias formales.
15Todo anillo local noetheriano es regular si y solamente si es de dimensión global finita y su
dimensión global coincide con su dimensión de Krull. Demostrado por J.P. Serre en “Sur la Dimension
Homologique des Anneaux et des Modules Noetheriens”. En Proc. Int. Symp. Alg. Number Theory,
Tokyo (1956) 175–189.
16Todo anillo local regular es un dominio de factorización única en M. Auslander, S.A. Buchs-
baum. “Unique Factorisation in Regular Local Rings”. Proc. Nat. Acad. Sci. US 45 (195) 733–764.
Este resultado es, sin embargo, consecuencia de las investigaciones de ambos en torno a la dimensión
homológica de anillos en M. Auslander y D.A. Buchsbaum. “Homological Dimension in Local Rings”.
Trans. AMS 85 (1957) 390–405.
17I.S. Cohen. “On the Structure and Ideal Theory of Complete Local Rings”. Trans. AMS 59
(1946) 54–106.
10.6. TEOREMA DE LA FUNCIÓN IMPLÍCITA. 297

En vista de los Teoremas de División y Preparación de Weierstrass, todo anillo local regular
completo y equicaracterı́stico es un dominio de factorización única. Y, siguiendo el [ZaSa, 60],
será cierto para todo anillo local regular equicaracterı́stico.

10.6. Teorema de la Función Implı́cita.


En esta Sección se demuestra la presentación clásico (la de [ZaSa, 60], por ejemplo) del Lema
de Hensel. Ası́ mismo se presenta el algoritmo de convergencia cuadrática para calcular buenas
aproximaciones de las funciones implı́citas a través del operador de Newton Multivariado.
10.6.1. El Lema de Hensel. Sea trata de una versión univariada del Teorema de la
Función Implı́cita. K. Hensel desarrolló sus ideas a partir del método de K. Weierstrass de 1897
sobre la aproximación de series de potencias formales algebraicas. Ası́ introdujo los números p–
ádicos. Hoy asignamos a Hensel lo que, en buena medida, corresponde a ambos. Su incidencia en
factorización de polinomios lo hace esencial. Podrı́a darse como consecuencia de los resultados
que expondremos más adelante (Sección 10.6.2) pero un cierto regusto clásico y la belleza del
resultado hacen atractivo escribirlo aquı́ separadamente.
Hagamos notar que, con las convenientes hipótesis adicionales, el Lema de Hensel puede implicar
(y de hecho implica) el Teorema de la Función Implı́cita multivariado.
La versión que hemos elegido es básicamente la prueba que aparece en el texto de O. Zariski y
P. Samuel (cf. [ZaSa, 60]) el cual, con el paso de los años gana en valor ante mis ojos. Hay un
bonito trabajo de P. Ribenboim18 donde el lector podrá encontrar disquisiciones históricas y
formulaciones equivalentes del mismo Lema de Hensel. Otras referencias que muestran la rele-
vancia del resultado pueden ser el [Bo, 67], [Na, 75] o [?], aunque en estos casos la presentación
es mucho más exquisita que la expuesta en estas páginas.
No es menos interesante la presentación hecha en [?] o [?], este último para el caso p−ádico.
Lema 10.6.1 (Lema Bilineal). Sea (A, m) un anillo local noetheriano y completo para la topologı́a
m−ádica. Sean E, E 0 y F tres A−módulos finitamente generados. Supongamos que la topologı́a
m−ádica en todos ellos es Hausdorff. Sea f : E × E 0 −→ F una aplicación bilineal y sea :
f : E/mE × E 0 /mE 0 −→ F/mF
la aplicación bilineal obtenida tensorizando con A/m.
Sea y ∈ F , α ∈ E y α0 ∈ E 0 tales que :
• f (α + mE, α0 + mE 0 ) = y + mF ∈ F mF .
• f (α, E 0 /mE 0 ) + f (E/mE, α0 ) = F/mF .
Entonces, existen a ∈ E y a0 ∈ E 0 tales que :
i) a + mE = α + mE, a0 + mE 0 = α0 + mE 0 .
ii) f (a, a0 ) = y en F .
Este Lema Bilineal se demuestra mediante un algoritmo iterativo de construcción de los ele-
mentos a y a0 . Se trata de un algoritmo de convergencia lineal que será mejorado más adelante.
Con este Lema Bilineal, el Lema de Hensel resulta muy sencillo de probar. Para un anillo local
(A, m) y un polinomio f ∈ A[X] denotaremos por f el polinomio de A/m[X] dado tomando
clases módulo m de los coeficientes de f .
Lema 10.6.2 (Lema de Hensel). Sea (A, m) un anillo local noetheriano y completo para la
topologı́a m−ádica. Sea f ∈ A[X] un polinomio univariado de grado d cuyo coeficiente director
es una unidad en A.
Sean α(X), α0 (X) ∈ A[X] polinomios de grados respectivos r y d − r tales que :
• f = αα0 en A/m[X],
• m.c.d.(α, α0 ) = 1 en A/m[X].
Entonces, exsiten polinomios a, a0 ∈ A[X] de grados respectivos r y d − r tales que :
• f = aa0 en A[X],
• a = α, a0 = α0 en A/m[X].
La formulación en términos de la función implı́cita es la clásica y la obvia; pero es preferible
pasar ahora a la versión generalizada del operador de Newton.
18P. Ribenboim. “Equivalent forms of Hensel’s Lemma”. Expo. Math. 3 (1985) 3–24.
298 10. EL TEOREMA DE LA FUNCIÓN IMPLÍCITA : FIBRAS DE LEVANTAMIENTO.

10.6.2. El Operador de Newton No–Arquimediano. Consideraremos la siguiente


situación :
• (A, m) es un anillo local noetheriano y completo, m es su único ideal maximal.
• | a |∈ R es la norma (valor absoluto) del elemento a ∈ A para la topologı́a definida
por la filtración m−ádica en A.
• ν : A −→ N es la valoración (función de orden) asociada a la filtración m−ádica.
Recordemos que existe una constante e ∈ R, e > 1 tal que :
1
| a |= ν(a)
e
• f1 , . . . , fn ∈ A[X1 , . . . , Xn ] una sucesión de polinomios.
Escribamos F := (f1 , . . . , fn ) y, por simplificar la notación X = (X1 , . . . , Xn ).
Para cada elemento a ∈ A denotemos por a := a + m ∈ A/m la clase que define en el cuerpo
cociente A/m. Observemos que las unidades de A se caracterizan por la propiedad a 6= 0.
Para cada polinomio f ∈ A[X1 , . . . , Xn ] denotaremos por f el polinomio en A/m[X1 , . . . , Xn ]
obtenido tomando clases módulo m de los coeficientes de f .
Con la topologı́a producto, An es un espacio métrico completo. Denotaremos por || . || la
extensión a An de la norma sobre A, usando la norma del máximo.
Consideremos la matriz jacobiana (en el módulo de matrices n×n con coeficientes en A[X1 , . . . , Xn ])
asociada a la sucesión F de polinomios :
 ∂f1 ∂f1 
∂X1 ... ∂Xn
(10.6.1) D(F )X :=  ... .. .. 

. . 
∂fn ∂fn
∂X1 ... ∂Xn
Supongamos que existe un punto a = (a1 , . . . , an ) ∈ An verificando las siguiente hipótesis (que
permanecerán inalteradas a lo largo de todo lo que sigue) :
• fi (a1 , . . . , an ) = f i (a1 , . . . , an ) = 0 en A/m, para 1 ≤ i ≤ n.
• El determinante de la matriz jacobiana no se anula en A/m, es decir :

det (D(F ))a 6= 0 en A/m

En particular, det (D(F ))a es una unidad del anillo local noetheriano (A, m). (Insisto en esta
idea porque la matriz D(F )a es por tanto una matriz inversible en Mn (A)).
Más aún, para cualquier ξ := (ξ1 , . . . , ξn ) ∈ An si
ξ j = aj , 1 ≤ j ≤ n, en A/m
la matrix D(F )ξ también es inversible como matriz en Mn (A).
Pasamos a definir el operador de Newton en n variables :
   
X1 f1 (X)
NF (X1 , . . . , Xn ) :=  ...  − D(F )−1
 .. 
(10.6.2)
 
X  . 
Xn fn (X)
n
Lema 10.6.3. Sea ξ = (ξ1 , . . . , ξn ) ∈ A tal que :

• min{ν fi (ξ) : 1 ≤ i ≤ n} ≥ N
• ξ j = aj en A/m, para 1 ≤ j ≤ n.
y consideremos el punto σ := (σ1 , . . . , σn ) ∈ An dado por
 
σ1
 .. 
 .  = NF (ξ)
σn
Entonces,
min{ν (fi (σ)) : 1 ≤ i ≤ n} ≥ 2N
Lema 10.6.4. Sea (A, m) un anillo local noetheriano, F ∈ A[X1 , . . . , Xn ] un polinomio ho-
mogéneo de grado m y sean (h1 , . . . , hn ) ∈ An tales que hj ∈ mN . Entonces,
F (h1 , . . . , hn ) ∈ mmN
10.6. TEOREMA DE LA FUNCIÓN IMPLÍCITA. 299

Lema 10.6.5. En las hipótesis anteriores, sea ξ = (ξ1 , . . . , ξn ) ∈ An y supongamos D(F )ξ


inversible en Mn (A). Sea σ = (σ1 , . . . , σn ) ∈ An . Entonces,
min{ν(ξj − σj ) : 1 ≤ j ≤ n} = min{ν(fj (ξ) − fj (σ)) : 1 ≤ j ≤ n}
Teorema 10.6.6 (Newton). En las hipótesis de esta subsección, existen (σ1 , . . . , σn ) ∈ An tales
que
fj (σ1 , . . . , σn ) = 0
Además, definiendo recursivamente
 
(1)
σ1
 . 
 .  = NF (a1 , . . . , an )
 . 
(1)
σn
y
 
(k)
σ1
 . 
 .  = NF (σ (k−1) , · · · , σ (k−1) )
 .  1 N
(k)
σn
se tiene
(k) 1
| σj − σj |≤
22k
Los ámbitos de aplicación más corrientes de este enunciado son los casos del completado de ZpZ ,
donde p es un número primo (i.e. los enteros p−ádicos) y el Teorema de la Función Implı́cita
propiamente dicho. Obsérvese que de la existencia de solución en los respectivos cocientes es
condición suficiente para la existencia de solución en el anillo y la convergencia cuadrática queda
ya garantizada.
El mecanismo habitual de manipulación de las sucesivas iteraciones del operador de Newton,
tal y como ha sido introducido en esta Sección, es a través de un esquema de evaluación con
divisiones. Utilizando Vermediung von Divisionen (véase Subsección ??) podremos evitar las
divisiones en la forma siguiente :
Sea R un anillo de polinomios sobre K, sea K su cuerpo de fracciones y sean F := [f1 , . . . , fn ] ∈
R[X1 , . . . , Xn ]n polinomios de grado a lo más d. Supongamos que los polinomios f1 , . . . , fn
vienen dados por un esquema de evaluación sin divisiones β de talla L y profundidad no escalar
`. Supongamos que la matriz jacobiana
 
∂fi
D(F ) := D(f1 , . . . , fn ) :=
∂Xj 1≤i,j≤n
asociada al sistema F es regular. Consideramos el operador de Newton– Hensel definido por:

  
X1 f1 (X1 , . . . , Xn )
(10.6.3) NF (X1 , . . . , Xn ) :=  ...  − D(F )−1  ..
.
   
.
Xn fn (X1 , . . . , Xn )
Este operador define n funciones racionales de K(X1 , . . . , Xn ) y lo mismo es válido para el
resultado correspondiente a la iteración k veces del mismo operados, NFk ∈ K(X1 , . . . , Xn )n .
(k) (k)
Por lo tanto, para cualquier número natural, k ∈ N, existen polinomios g1 , . . . , gn y h(k) ∈
K[X1 , . . . , Xn ] tales que
!
(k) (k)
g1 gn
Nfk = , . . . , (k) ∈ K(X1 , . . . , Xn )n .
h(k) h
El lema que sigue muestra la existencia de un esquema de evaluación que calcula tales polinomios
sin utilizar divisiones.
300 10. EL TEOREMA DE LA FUNCIÓN IMPLÍCITA : FIBRAS DE LEVANTAMIENTO.

Lema 10.6.7. Consideremos las mismas notaciones e hipótesis que antes. Entonces, existe
un esquema de evaluación en R[X1 , . . . , Xn ] de talla O(kd2 n7 L) y profundidad no escalar
(k) (k)
O((log2 n+`)k) que, utilizando los mismos parámetros que β, computa los numeradores g1 , . . . , gn
(k) k
y un denominador (distinto de cero) h para NF .
APÉNDICE A

Naı̈ve Set Theory


(la Nada y la palabra)

Si he perdido la vida, el tiempo,


.....,
Si he perdido la voz en la maleza,
me queda la palabra.
....
Si he segado las sombras en silencio,
me queda la palabra.

Si abrı́ ....
puro y terrible ....
Si abrı́ los labios....,
me queda.....

Cuando ya no nos queda Nada,


el vacı́o de no quedar
podrı́a ser al cabo inútil y perfecto.

Dijo Dios: - Brote la Nada.


Y alzó la mano derecha
hasta ocultar la mirada
Y quedó la Nada hecha.

301
302 A. NAÏVE SET THEORY (LA NADA Y LA PALABRA)

Índice
A.1. Algunas Consideraciones Preliminares 302
A.2. Conjuntos. Pertenencia. 303
A.2.1. Observaciones preliminares. 304
A.3. Inclusión de conjuntos. Subconjuntos, operaciones elementales. 304
A.3.1. El retı́culo P(X). 305
A.3.1.1. Propiedades de la Unión. 305
A.3.1.2. Propiedades de la Intersección. 305
A.3.1.3. Propiedades Distributivas. 305
A.3.2. Leyes de Morgan. 305
A.3.3. Generalizaciones de Unión e Intersección. 306
A.3.3.1. Un número finito de uniones e intersecciones. 306
A.3.3.2. Unión e Intersección de familias cualesquiera de subconjuntos. 306
A.3.4. Ejemplo: Conjuntos y Subconjuntos como Grafos No orientados. 306
A.3.5. Ejemplo: Marcas de teléfonos móviles 307
A.3.6. Ejemplo: un grafo infinito elemental. 307
A.4. Producto Cartesiano (list). Correspondencias y Relaciones. 307
A.4.1. Correspondencias. 308
A.4.2. Relaciones. 309
A.4.3. Relaciones de Orden= Clausura Transitiva de un grafo acı́clico orientado. 309
A.4.3.1. La Transitividad 310
A.4.3.2. Completando un Grafo hasta la clausura transitiva 311
A.4.4. Relaciones de Equivalencia=Clausura Transitiva de Grafos. 312
A.4.4.1. Las Relaciones de Equivalencia son las Generadas por Grafos. 312
A.4.5. Clasificando y Etiquetando elementos: Conjunto Cociente. 313
A.4.5.1. La circunferencia es un grupo cociente 314
A.5. Aplicaciones. Cardinales. 314
A.5.1. Determinismo/Indeterminismo. 316
A.5.2. Imagen, Anti-imagen y otras propiedades. 317
A.5.3. Aplicaciones Biyectivas. Cardinales. 319
A.6. Ejercicios y Problemas 321

A.1. Algunas Consideraciones Preliminares


Ante la flagrante experiencia de la mala formación y lamentable desorganización de la docencia
de los alumnos del Grado de Matemáticas (en tercero) de la Universidad de Cantabria, cada
año más sangrante, me veo obligado a añadir un resumen sobre Teorı́a de Conjuntos “Naı̈ve”,
en el que se pretende solamente exponer las nociones básicas para poder usarlas con libertad
durante el resto del curso. No hay nada profundo más allá de rudimentos del lenguaje y algunos
ejemplos que pretenden enlazar las nociones al con aquellas que se usan en Teorı́a de Grafos
que, según parece, es el úncio recurso formal sobre el que puedo apoyarme para el curso de
Álgebra Conmutativa. Al menos, ante la flagrante destrucción de un estado de espı́ritu, me
queda la palabra.
A finales del siglo XIX, G. Cantor introduce la Teorı́a de Conjuntos. Su propósito inicial es
el modesto propósito de fundamentar matemáticamente el proceso de “contar”. Eso sı́, no se
trataba solamente de contar conjuntos finitos sino también infinitos, observando, por ejemplo,
que hay diversos infinitos posibles (ℵ0 , 2ℵ0 o ℵ1 , por ejemplo). Más allá del propósito inicial
de Cantor, la Teorı́a de Conjuntos se transformó en un instrumento útil para las Matemáticas,
como un lenguaje formal sobre el que escribir adecuadamente afirmaciones, razonamientos,
definiciones, etc...
Pronto se observaró la existencia de diversas paradojas que hacı́an esencialmente insostenible la
Teorı́a Naı̈ve de Conjuntos. Estas paradojas y otras imprecisiones hiciron necesaria la aparición
de la Teorı́a Axiomática de Conjuntos, con las formalizaciones de Zermelo, Fænkel, Gödel y
Bernays. El alumno que desee disponer de la axiomatización de Zermelo, Frenkel, Gödel y
Bernays, se recomiendan las referencias que aparecen en la página:
http://en.wikipedia.org/wiki/Zermelo%E2%80%93Fraenkel_set_theory
A.2. CONJUNTOS. PERTENENCIA. 303

Lo que aquı́ se pretende no es una introducción de la Teorı́a Axiomática de Conjuntos. En primer


lugar se necesitarı́a bastante más tiempo del disponible en esta asignatura. En segundo lugar, de
lo que se trata es solamente de establecr un lenguaje. La comunicación sin un lenguaje común es
imposible. La comunicaión en matemáticas sin el lenguaje de la Teorı́a de Conjuntos es inviable.
Y sin comunicación ni hay Formación, ni hay Aprendizaje. Desgraciadamente, el lenguaje
común es inútil para las matemáticas: introduce un exceso de imprecisión y ambigüedad que
sólo puede generar resultados y enunciados falsos y la falsedad es lo único que no es admisible
en Matemáticas. Una teorı́a que no sea, al menos, sólida es inviable.
Lo que siguen son, por tanto, unas notas básicas para tratar de fijar un lenguaje de comuni-
cación entre alumno de Matemáticas y profesor de Matemáticas. Después de una exploración
somera, uno descubre que los alumnos de Tercer Curso del Grado en Matemáticas de la Uni-
versidad Cantabria, tienen unos notables agujeros de lenguaje Matemático, muy especialmente
en Álgebra. Ası́, es imposible generar una comunicación por lo que se pretende solamente fijar
“una forma correcta de hablar”.
En todo caso, nótese que esta Teorı́a Naı̈ve de Conjuntos es la que usa Cantor para fundamentar
su método de diagonalización y, de paso, la existencia de los números reales R tal y como se
usan en análisis (único cuerpo realmente cerrado completo y conexo). Para discernir sobre la
controversia que estos métodos de diagonalización uno puede seguir las referencias de Hodge,
Feffermann u otros en la página:
http://en.wikipedia.org/wiki/Controversy_over_Cantor’s_theory
Para finalizar dos frases que ilustran la controversia suscitada por la aparición de la teo’ıa
intuitiva de Conjuntos “ à la Cantor”. La primera es de Leopold Kronecker quien afirmó:
“Yo no sé qué predomina en la teorı́a de Cantor (Filosofı́a o Teologı́a), pero estoy seguro de
que no hay Matemáticas ahı́.”
La respuesta de Hilbert fue, sin embargo, mucho más entusiasta, afirmando:
“Aus dem Paradies, das Cantor uns geschaffen, soll uns niemand vertreiben können” (Nadie
podrá expulsarnos del Paraı́so que Cantor creó para nosotros)
A partir de aquı́ cada quien puede elegir entre intuicinismo y constructivismo, al gusto del
lenctor. Por simplicidad del curso, nos centarremos en la visión naı̈ve sin más.

A.2. Conjuntos. Pertenencia.


Comencemos considerando los conjuntos como conglomerados de objetos. Estos objetos pasarán
a denominarse elementos y diremos que pertenecen a un conjunto. Para los objetos que no están
en un conjunto dado, diremos que no pertenecen al conjunto (o no son elementos suyos).
Como regla general (aunque con excepciones, que se indicarán en cada caso), los conjuntos se
denotan con letras mayúsculas:
A, B, C, . . . , X, Y, Z, A1 , A2 , ....,
mientras que los elementos se suelen denotar con letras minúsculas:
a, b, c, d, . . . , x, y, z, a1 , a2 , ......
El sı́mbolo que denota pertenencia es ∈ y escribiremos
x ∈ A, ; x 6∈ B,
para indicar “el elemento x pertenece al conjunto A” y “el elemento x no pertenece al conjunto
B”, respectivamente.
Hay muchas formas para definir un conjunto. Los sı́mbolos que denotan conjunto son las dos
llaves { y } y su descripción es lo que se escriba en medio de las llaves.
• Por extensión: La descripción de todos los elementos, uno tras otro, como, por ejem-
plo:
X := {0, 2, 4, 6, 8}.
• Por una Propiedad que se satisface: Suele tomar la forma
X := {x : P (x)},
304 A. NAÏVE SET THEORY (LA NADA Y LA PALABRA)

donde P es una propiedad (una fórmula) que actúa sobre la variable x. Por ejemplo,
el conjunto anterior puede describirse mediante:
X := {x : [x ∈ N] ∧ [0 ≤ x ≤ 9] ∧ [2 | x]},
donde hemos usado una serie de propiedades como [x ∈ N] (es un número natural),
[0 ≤ x ≤ 9] (entre 0 y 9), [2 | s] (y es par). Todas ellas aparecen ligadas medi-
ante la conectiva ∧ (conjunción). Sobre la forma y requisitos de las propiedades no
introduciremos grandes discusiones.

A.2.1. Observaciones preliminares.


• Existe un único conjunto que no tiene ningún elemento. Es el llamado conjunto vacı́o
y lo denotaremos por ∅. La propiedad que verifica se expresa (usando cuantificadores)
mediante:
¬ (∃x, x ∈ ∅) ,
o también mediante la fórmula
∀x, x 6∈ ∅.
• En Informática y Programación, todos los lenguajes normales continen una Estruc-
tura de Datos asociada a esta noción de conjunto: es el tipo set y que no hace sino
reflejar la noción matemática, aunque limitada al contexto numerable propio de los
Lenguajes Formales.
• En el lenguaje natural se suele utilizar el término grupo (grupo de personas, grupo
polı́tico, etc..) de manera impropia. Los grupos son nciones que se discutirán en un
segundo Apéndice y que tendrán otro significado. Porcuraremos no confundir ambas
nociones.

A.3. Inclusión de conjuntos. Subconjuntos, operaciones elementales.


A partir de unas nociones naı̈ve de conjunto y pertenencia, podemos comenzar a hablar de
varias nociones relacionedas.
Definición 127. Se dice que un conjunto X está incluido (o contenido) en otro conjunto Y
si todos los elementos de X son también elementos de Y . Es decir, usando el sı́mbolo ⊆ para
indicar inclusión
X ⊆ Y := [∀x, x ∈ X =⇒ x ∈ Y ] .
También se dice que X es subconjunto de Y .
Observación A.3.1. • Nótese la identificación entre la inclusión ⊆ y la implicación =⇒
(o −→, en la forma más convencional de la Lógica).
• Obviamente, a través de esa identificación, el conjunto vacı́o está contenido en cualquier
conjunto. Es decir,
∅ ⊆ X,
para cualquier conjunto X.
• Dos conjuntos se consideran iguales si poseen los mismos elementos. En términos
formales:
(A = B) ⇔ ((A ⊆ B) ∧ (B ⊆ A)) .
Lo que también puede escribirse con elementos mediante:
(A = B) ⇔ ∀x, ((x ∈ A) ⇐⇒ (x ∈ B)) .
• La familia de todos los subconjuntos de un conjunto X dado se denomina la clase de
partes de X y se suele denotar mediante P(X).
Ejemplo A.3.2. Es fácil, por ejemplo, mostrar la siguiente igualdad que describe las partes del
conjunto X := {0, 1, 2}:
P({0, 1, 2}) = {∅, {0}, {1}, {2}, {0, 1}, {0, 2}, {1, 2}, {0, 1, 1}} .
No resulta tan fácil probar que la clase P(N) es justamente el intervalo [0, 1] de la recta real R.
Lo dejamos para más tarde (en forma puramente esquemática).
A.3. INCLUSIÓN DE CONJUNTOS. SUBCONJUNTOS, OPERACIONES ELEMENTALES. 305

Las conectivas lógicas del cálculo proposicional, permiten definir operaciones entre subconjuntos
de un conjunto dado.
Definición 128. Sea dado un conjunto X dado y sean A, B ∈ P(X) dos de sus subconjuntos.
Definimos:
• Unión:
A ∪ B := {x ∈ X : (x ∈ A) ∨ (x ∈ B)}.
• Interseccón:
A ∩ B := {x ∈ X : (x ∈ A) ∧ (x ∈ B)}.
• Complementario:
Ac := {x ∈ X : x 6∈ A}.
Obsérvese que ∅c = X y que (Ac )c = A para cualquier A ∈ P(X).
Definición 129. Adicionalmente, podemos reencontrar la diferencia entre conjuntos y la traslación
del exclusive OR (denotado por XOR en Electrónica Digital) o por ⊕ ( en Teorı́a de Números,
hablando de restos enteros módulo 2, i.e. Z/2Z; aunque, en este caso se suele denotar simple-
mente mediante +).
• Diferencia:
A \ B := {x ∈ X : (x ∈ A) ∧ (x 6∈ B)}.
• Diferencia Simétrica:
A∆B := {x ∈ X : (x ∈ A) ⊕ (x ∈ B)}.
Proposición A.3.3. Las relaciones evidentes con estas definiciones se resumen en las sigu-
ientes fórmulas:
A \ B := A ∩ B c , A∆B = (A ∪ B) \ (A ∩ B) = (A \ B) ∪ (B \ A).
Demostración. Obvio desde las propiedades básicas del Cálculo Propsicional. 

A.3.1. El retı́culo P(X). Serı́a excesivo e innecesario expresar aquı́ con propiedad las
nociones involucradas, pero dejemos constancia de la propiedades básicas de estas operaciones:
A.3.1.1. Propiedades de la Unión. Sean A, B, C subconjuntos de un conjunto X.
• Idempotencia: A ∪ A = A, ∀A ∈ P(X).
• Asociativa: A ∪ (B ∪ C) = (A ∪ B) ∪ C, ∀A, B, C ∈ P(X).
• Conmutativa: A ∪ B = B ∪ A, ∀A, B ∈ P(X).
• Existe Elemento Neutro: El conjunto vacı́o ∅ es el elemento neutro para la unión:
A ∪ ∅ = ∅ ∪ A = A, ∀A ∈ P(X).
A.3.1.2. Propiedades de la Intersección. Sean A, B, C subconjuntos de un conjunto X.
• Idempotencia: A ∩ A = A, ∀A ∈ P(X).
• Asociativa: A ∩ (B ∩ C) = (A ∪ B) ∪ C, ∀A, B, C ∈ P(X).
• Conmutativa: A ∩ B = B ∩ A, ∀A, B ∈ P(X).
• Existe Elemento Neutro: El conjunto total X es el elemento neutro para la inter-
sección:
A ∩ X = X ∩ A = A, ∀A ∈ P(X).
A.3.1.3. Propiedades Distributivas. Sean A, B, C subconjuntos de un conjunto X.
• A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C), ∀A, B, C ∈ P(X).
• A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C), ∀A, B, C ∈ P(X).
• A ∩ (B∆C) = (A ∩ B)∆(A ∩ C), ∀A, B, C ∈ P(X).

A.3.2. Leyes de Morgan. Por ser completos con los clásicos, dejemos constancia de las
Leyes de Morgan. Sean A, B subconjuntos de un conjunto X.

(A ∩ B)c = (Ac ∪ B c ), (A ∪ B)c = (Ac ∩ B c ).


306 A. NAÏVE SET THEORY (LA NADA Y LA PALABRA)

A.3.3. Generalizaciones de Unión e Intersección. Tras todas estas propiedades, de-


jemos las definiciones y generalizaciones de la unión e intersección en el caso de varios (o
muchos) subconjuntos de un conjunto dado. Nótese la identificación entre ∪, ∨ y el cuantifi-
cador existencial ∃ (y, del mismo modo, la identificación entre ∩, ∧ y el cuantificador universal
∀.
A.3.3.1. Un número finito de uniones e intersecciones. Dados A1 , . . . , An unos subconjun-
tos de un conjunto X. Definimos:
n
[
Ai := A1 ∪ A2 ∪ · · · ∪ An = {x ∈ X : ∃i, 1 ≤ i ≤ n, x ∈ Ai }.
i=1

n
\
Ai := A1 ∩ A2 ∩ · · · ∩ An = {x ∈ X : ∀i, 1 ≤ i ≤ n, x ∈ Ai }.
i=1

A.3.3.2. Unión e Intersección de familias cualesquiera de subconjuntos. Supongamos {Ai :


i ∈ I} es una familia de subconjuntos de un conjunto X. Definimos:
[
Ai := {x ∈ X : ∃i ∈ I, x ∈ Ai }.
i∈I

\
Ai := {x ∈ X : ∀i ∈ I, x ∈ Ai }.
i∈I

En ocasiones nos veremos obligados a acudir a uniones e intersecciones de un número finito o


de un número infinito de conjuntos.

A.3.4. Ejemplo: Conjuntos y Subconjuntos como Grafos No orientados.

Definición 130. Un grafo no orientado (o simplemente un grafo) es una lista G := (V, E)


formada por dos objetos:
• Vértices: son los elementos del conjunto V (que usualmente se toma finito1) aunque
podremos encontrar “grafos” con un conjunto “infinito” de vértices.
• Aristas: Es un conjunto de subconjuntos de V , es decir, E ⊆ P(V ) con la salvedad
siguiente: los elementos A ∈ E (que, recordemos, son subconjuntos de V ) son no
vacı́os y tienen a lo sumo dos elementos distintos2 .

Ejemplo A.3.4. Un sencillo ejemplo serı́a:


• Vértices: V := {a, b, c, d, e}
• Aristas:
E := {{a, b}, {a, e}, {c, d}} ⊆ P(V ).
Al ser no orientado la matriz de adyacencia es simétrica y las componentes conexas son,
también, subconjuntos de V , aunque de diverso cardinal. Gráficamente:
b e

a d

Nótese que podrı́amos haber aceptado aristas que van desde un nodo a sı́ mismo (tipo {a} o
{e}, por ejemplo) pero que el orden en que son descritos los elementos de una arista no es
relevante: por eso hablamos de grafos no orientados.

1Aceptemos esta disgresión sin haber definido finitud


2De nuevo aceptamos el concepto de que sabemos contar hasta 2 cuando hablamos del cardinal de un
conjunto, aunque sea una noción que no aparecerá hasta más adelante.
A.4. PRODUCTO CARTESIANO (LIST). CORRESPONDENCIAS Y RELACIONES. 307

A.3.5. Ejemplo: Marcas de teléfonos móviles. Esencialmente, casi todo cuidadano,


salvo los más rebeldes a la alienaciı́on, disponen de un terminal móvil que les esclaviza como
pocos instrumentos han hecho hasta la fecha en la historia de la Humanidad. Por eso podemos
comenzar con un grafo no orientado descrito mediante:
• Vértices: El conjunto de todos los teléfonos móviles de todo tipo existantes en un
momento dado : V .
• Aristas: Dos teléfonos móviles a, b ∈ V están relacionados (es decir {a, b} ∈ E) si
son el mismo tipo de modelo de la misma marca.
Esto genera un grafo no orientado que desompone el conjunto de todos los móviles en una
partición formada por varios subconjuntos que representan el modelo y marca de cada uno
de ellos. Este concepto es crucial en publicidad: Nadie comprta exactamente el producto que
aparece en un anuncio, sino uno ‘equivalente” a él. Se llama ‘etiqueta”, aunque también se
puede llamar ‘representante canónico”.
A.3.6. Ejemplo: un grafo infinito elemental. La tendencia a concebir los grafos nori-
entados como grafos finitos es sólo un subterfugio. Un ejemplo simple de grafo no orientado
infinito puede ser el siguiente:
• Vértices: El conjunto de todos los números enteros : V = Z.
• Aristas: Dos números enteross a, b ∈ V están relacionados (es decir {a, b} ∈ E) si
son su diferencia define el mismo resto módulo 5.

A.4. Producto Cartesiano (list). Correspondencias y Relaciones.


Si en los grafos no orientados considerábamos aristas descritas de forma {a, b} y el orden no
interviene ({a, b} = {b, a}) ahora nos interesa destacar el papel jugado por el orden, hablamos
de pares ordenados (a, b). La definción de Kuratowsky, por ejemplo, serı́a la siguiente:
Definición 131 (Par ordenado (“à la Kuratowski”)). Sean A y B dos conjuntos y supong-
amos que ambos son subconjuntos de un conjunto X. Supongamos que la familia de todos los
subconjuntos de X, P(X), es un conjunto y consideremos la familia P (P (X)) de todos los sub-
conjuntos de P(X). Dados dos elementos a, b ∈ X, definimos el par ordenado (a.b) mediante
la siguiente identidad:
(a, b) := {{a}, {a, b}} ∈ P (P (X)) .
Definiremos el producto cartesiano de los dos conjuntos A y B mediante la identidad siguiente:
A × B := {(a, b) ∈ P (P (X)) : a ∈ A, b ∈ B}.
Observación A.4.1. y se corresponde al tipo de datos list. Ası́, por ejemplo, (a, b) = (b, a)
si y solamente si a = b. Una manera de representar las listas mediante conjuntos podrı́a ser
escribiendo (a, b) como abreviatura de {{a}, {a, b}}. En Programación se trata del tipo de datos
list.
Pero podemos
Qn considerar listas de mayor longitud: dados A1 , . . . , An definimos el producto
cartesiano i=1 Ai como las listas de longitud n, en las que la coordenada i−ésima está en el
conjunto Ai .
Yn
Ai := {(x1 , . . . , xn ) : xi ∈ Ai , 1 ≤ i ≤ n}.
i=1
En ocasiones, se hacen productos cartesianos de familias no necesariamente finitas {Ai : i ∈ I}
(como las sucesiones, con I = N) y tenemos el conjunto:
Y
Ai := {(xi : i ∈ I) : xi ∈ Ai , ∀i ∈ I}.
i∈I
En otras ocasiones se hace el producto cartesiano de un conjunto consigo mismo, mediante las
siguientes reglas obvias, definidas recursivamente:
n
Y
A1 = A, A2 := A × A, An := An−1 × A = A.
i=1

Ejemplo A.4.2. Algunos casos extremos de las potencias pueden ser los siguientes:
308 A. NAÏVE SET THEORY (LA NADA Y LA PALABRA)

• Caso n = 0: Para cualquier conjunto A se define A0 como el conjunto formado por un


único elemento, que es el mismo independientemente de A, y se conoce con la palabra
vacı́a y se denota por λ. No se debe confundir A0 := {λ} con el conjunto vacı́o ∅.
• Caso I = N: Se trata de las sucesiones (infinitas numerables) cuyas coordenadas
viven en A. Se denota por AN . Los alumnos han visto, en el caso A = R el conjunto
de todas las sucesiones de números reales (que se denota mediante AN ).
• Palabras sobre un Alfabeto El conjunto de las palabras con alfabeto un conjunto
A jugará un papel en este curso, se denota por A∗ y se define mediante
[
A∗ := An .
n∈N
Volveremos con la noción más adelante
A.4.1. Correspondencias. Es la noción primaria de la que se seguirán varias otras no-
ciones.
Definición 132 (Correspondencias, Relaciones y Grafos Orientados). Una correspon-
dencia entre un conjunto A y otro conjunto B es un subconjunto R del producto cartesiano
A × B. Cuando se tenga que ambos conjuntos son el mismo (i.e. A = B), entonces, las
correspondencias se llaman relaciones o grados orientados.
Ejemplo A.4.3 (Correspondencia = Grafo bipartito). En esencia es un grafo bipartito
que hace interactuar los elementos de A con elementos de B. Los elementos que interactúan
entre sı́ son aquellos indicados por los pares que están en R. Clásicamente, en Teorı́a de Grafos,
los grafos bipartitos se suponen entre dos subconjuntos A y B de un conjunto X dado, de tal
modo que no contengan ningún elemento en común. Si quitamos la condición A ∩ B = ∅,
entonces tenemos la noción estándard de correspondencia. Para más información sobre grafos
bipartitos, el lector puede acudir a:
http: // en. wikipedia. org/ wiki/ Bipartite_ graph
En ocasiones se escribirán una notación funcional de la forma R : A −→ B, aunque poniendo
gran cuidado porque no siempre son funciones.
Ejemplo A.4.4. Tomando A = B = R, podemos definir la relación R1 ⊆ R2 mediante:
R1 := {(x, y) ∈ R2 : x = y 2 }.
Estaremos relacionando los número reales con sus raı́ces cuadradas. Obsérvese que los elemen-
tos x tales que x < 0 no están relacionados con ningún número y (no tienen raı́z cuadrada real).
El 0 se relaciona con un único número (su única raı́z cuadrada) y los número reales positivos
se relacionan con sus dos raices cuadradas.
Ejemplo A.4.5. Tomando los mismos conjuntos A = B = R, podemos definir la relación
R2 ⊆ R2 distinta de la anterior:
R1 := {(x, y) ∈ R2 : x2 = y}.
En este caso tenemos una función (correspondencia que verifica que es aplicación, ver Sección
siguiente) que relaciona cualquier x en R con su cuadrado.
Ejemplo A.4.6. Un grafo bipartito podrı́a ser, por ejemplo, A := {a, b, c, d}, B := {1, 2, 3} y
una relación como R ⊆ A × B:
R := {(a, 2), (b, 1), (b, 3), (c, 2), (d, 1), (d, 3)},
cuyo grafo serı́a:
a
1
b

c 2

d
3
A.4. PRODUCTO CARTESIANO (LIST). CORRESPONDENCIAS Y RELACIONES. 309

Observación A.4.7. En ocasiones abusaremos de la notación, escribiendo R(x) = y o xRy,


para indicar que los elementos x ∈ A e y ∈ B están en correspondencia a través de R ⊆ A × B.
A.4.2. Relaciones. Las relaciones son correspondencia R ⊆ A × A, es decir, aquellas
correspondencias donde el conjunto de primeras coordenadas es el mismo que el conjunto de
las segundas coordenadas.
Observación A.4.8 (Una Relación no es sino un grafo orientado.). Aunque, por hábito, se suele
pensar en que los grafos orientados son relaciones sobre conjuntos finitos, pero admitiremos
grafos con un conjunto infinito de vértices.
Pongamos algunos ejemplos sencillos:
Ejemplo A.4.9 (Un ejemplo al uso). Consideremos el grafo G := (V, E) donde V es el
conjunto de vértices dado por:
V := {1, 2, 3, 4, 5, 6},
y E ⊆ V × V es el conjunto de aristas orientadas siguiente:
E := {(1, 3), (3, 5), (2, 4), (2, 6)}.
Gráficamente tendremos
1
4
2

6
3

Ejemplo A.4.10 (La circunferencia unidad). Es un grafo infinito cuyos vértices son los números
reales V = R y cuyas aristas son dadas mediante:
E := {(x, y) ∈ R2 : x − y ∈ Z}.
No lo dibujaremos (tenemos demasiados vértices y demasiadas aristas) pero las componentes
conexas están identicadas con los puntos de la circunferencia unidad
S 1 := {(x, y) ∈ R2 : x2 + y 2 − 1 = 0}.
Algunos tipos de relaciones son más relevantes que otras por sus consecuencias. Destaquemos
dos clases:
A.4.3. Relaciones de Orden= Clausura Transitiva de un grafo acı́clico orien-
tado. Son aquellas relaciones R ⊆ V × V , que verifican las propiedades siguientes:
• Reflexiva: ∀x ∈ V, (x, x) ∈ R. La relación descrita en el Ejemplo A.4.9 anterior no
verifica esta propiedad. Para verificarla, se necesitarı́a que también fueran aristas las
siguientes:
{(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} ⊆ E.

1
4
2

6
3

5
En cambio el ejemplo de la circunferencia verifica la propiedad reflexiva.
310 A. NAÏVE SET THEORY (LA NADA Y LA PALABRA)

• Antisimétrica: Que se expresa mediante:

∀x, y ∈ V, ((x, y) ∈ R) ∧ ((y, x) ∈ R) ⇒ (x = y) .

La relación descrita en el Ejemplo A.4.9 sı́ verifica la propiedad antisimétrica porque


no se da ningún caso que verifique simultáneamente las dos hipótesis. Incluso si
añadimos todas las reflexivas todo funciona bien. En el ejemplo de la circunferencia,
sin embargo, no se da la antisimétrica: por ejemplo 1 y 0 verifican que (1, 0) ∈ R,
(0, 1) ∈ R y, sin embargo, 1 6= 0.
• Transitiva: Que se expresa mediante:

∀x, y, z ∈ V, ((x, y) ∈ R) ∧ ((y, z) ∈ R) ⇒ ((x, z) ∈ R) .

La relación descrita en el Ejemplo A.4.9 no verifica la transitiva. Tenemos que (1, 3) ∈


E y (3, 5) ∈ E, pero (1, 5) 6∈ E. Tendrı́amos que añadirla para tener un grafo como:

1
4
2

6
3

Este último grafo ya nos dará una relación de orden. En el ejemplo de la cir-
cunferencia, sin embargo, se da la Transitiva, aunque no es relación de orden por no
satisfacerse la anti–simétrica.
A.4.3.1. La Transitividad. Consideremos un Grafo orientado G := (V, E) donde, en ningún
caso, hemos dicho que V sea finito. Es decir, estamos considerando una raleación.

Definición 133 (Alcanzable). Sea G = (V, E) una relación. Sean v, w ∈ V dos vértices del
grafo. Diremos que w es alcanzable desde v en G si existe una lista finita de vértices de V :

v0 , v1 , . . . , vm ,

satisfaciendo las propiedades siguientes:


i) v0 = v, vm = w,
ii) (vi , vi+1 ) ∈ E, para cada i, 0 ≤ i ≤ n − 1.
En ocasiones se utilizará la noción de camino entre v y W y se usará la notación

v = v0 → v1 → · · · → vm = w.

Diremos, además, que la longitud de ese camino es m.

Notación A.4.11. Para denotar alcanzabilidad hay varias opciones en la literatura de Teorı́a
de Grafos. Nosotros usaremos la que proviene de la Lógica (donde alcanzable se interpreta
como deducible o computable). Ası́, para denotar que w es alcanzable desde v en el grafo G
escribiremos:
v `G w.

Definición 134 (Clasura Transitiva). Sea G := (V, e) un grafo orientado y sea v ∈ V un


vértice. Llamaremos clasura transitiva de v (o compopnente conexa de v) al conjunto de todos
los vértices alcanzables desde v en G. Es decir,

T CG (v) := {w ∈ V : v `G w}.
A.4. PRODUCTO CARTESIANO (LIST). CORRESPONDENCIAS Y RELACIONES. 311

A.4.3.2. Completando un Grafo hasta la clausura transitiva. La construcció siguiente pre-


tende completar un grafo orientado, mediante la adjunción de aristas que unen vértices al-
canzables. As´i, sea G := (V, E) un grafo orientado. Denotaremos por T C(G) o por G+ , al
grafo
T C(G) := (V, E + ),
donde el conjunto de vértices es el mismo, mientras que el conjunto de aristas es dado mediante:
E + := {(v, w) ∈ V × V : v `G w}.
El siguiente enunciado muestra que toda relación de orden es, simplemente, la clausura transitiva
de un grafo orientado que satisface las propiedades anti-simétrica y transitiva.
Definición 135 (Ciclos). Un ciclo en un grafo G es un camino de longitud mayor estricto
que uno que comienza y termina en el mismo vértice. Es decir, un camino
v = v0 → v1 → · · · → vm = v,
con m ≥ 2 y vi 6= v para algı́n i con 1 ≤ i ≤ m − 1. Un grafo se denomina acı́clico si carece de
ciclos.
Nótese que omitimos las auto-referencias (i.e. nodos relacionados consigo mismo) como cilos.
Proposición A.4.12. Sea X un conjunto y R ⊆ X × X una relación entre sus elementos.
Entonces, son equivalentes:
i) La relación R es una relación de orden.
ii) Existe un grafo orientado y acı́clico G := (X, E) sobre X de tal modo que:
• E satisface la propiedad Reflexiva.
• (X, R) = T C(G).
Demostración. Es evidente que si R es una relación de orden sobre X, entonces existe
un grafo G = (X, R) que satisface las propiedades Reflexiva y Antisimétrica. Pero además, por
ser relación de orden satisface la Transitiva, es decir,
∀v, w, u ∈ V, [(v, w) ∈ R] ∧ [(w, u) ∈ R] =⇒ [(v, u) ∈ R] .
Además, es acı́clico por satisfacer la Transitiva. Si hubiera un ciclo, entonces, por verificarse la
Propiedad Transitiva, y dado un ciclo de longitud mayor que 1:
v = v0 → v1 → · · · → vm = v.
Entonces, (v, v1 ) ∈ R y (v1 , v) ∈ R, siendo v1 6= v. lo que contradice la propiedad Anti-
simétrica. Por lo tanto, la clausura transitiva no añade aristas, es decir T C(G) = G y se tiene
la implicación i) =⇒ ii).
Para el recı́proco, la parte importante del significado de la Proposición, supongamos G := (X, E)
un grafo orientado y acı́clico que satisface la propiedad transitiva. Y consideremos su clausura
transitiva T C(G) := (X, E + ), donde
E + := {(v, w) ∈ V × V : v `G w}.
En primer lugar, si E satisface la propiedad reflexiva, entonces, también lo satisface su Clausura
Transitiva. Por construcción, la clausura transitiva satisface la Propiedad Transitiva. Nos queda
por ver la anti-simétrica. Ahora bien, supongamos que existen v, w ∈ X tales que
v `G w, w `G v.
Es decir, que (v, w) ∈ E y (w, v) ∈ E + . Entonces, disponemos de dos caminos en el grafo
+

original G de (posiblemente distintas) longitudes n y m de la forma siguiente:


v = v0 → v1 → · · · → vm = w,
w = w0 → w1 → · · · → wn = v.
Obviamente, combinando ambos caminos, obtenemos un ciclo en el grafo original:
v = v0 → v1 → · · · → vm = w = w1 → · · · → wn = v.
Y esto contradice la condición de que el grafo original era acı́clico.

312 A. NAÏVE SET THEORY (LA NADA Y LA PALABRA)

Observación A.4.13. La anterior Proposición inidca solamente que las Relaciones de Orden
no son otra cosa que las clausuras transitivas de los grafos orientados acı́clicos que satisfacen la
propiedad Reflexiva.
A.4.4. Relaciones de Equivalencia=Clausura Transitiva de Grafos. Son aquellas
relaciones R ⊆ V × V , que verifican las propiedades siguientes:
• Reflexiva: (como en el caso anterior) ∀x ∈ V, (x, x) ∈ R. En el Ejemplo A.4.9
debemos completar nuestra lista de aristas, mientras que el ejemplo de la circunferencia
ya la verifica.
• Simétrica: ∀x ∈ V, (x, y) ∈ R ⇔ (y, x) ∈ R. En el caso de la circunferencia ya se
satisface. Mientras que en el caso del Ejemplo A.4.9 debems completar nuestra lista,
añadiendo las aristas:
{(3, 1), (5, 3), (4, 2), (6, 2)},
para que se satisfaga. Esto nos da un grafo como:

1
4
2

6
3

5
• Transitiva: Que se expresa como ya se ha indicado. Es claro que el caso de la circun-
ferencia tenemos una relación de equivalencia y en el caso del Ejemplo A.4.9 habrá
que completar con todos los casos. Esto nos dará una figura como la siguiente:

1
4
2

6
3

5
Este último grafo ya nos dará una relación de equivalencia.
La Propiedad Simétrica hace que sea innecesaria la introducción de orientación.
Proposición A.4.14 (Grafo= Grafo Orientado + Prop. Simétrica). Un grafo G :=
(V, E) (no orientado, en el sentido de la Definición 130) es simplement un grafo orientado (en
el sentido de la Definición 132) que satisface la Propiedad Simétrica.
A.4.4.1. Las Relaciones de Equivalencia son las Generadas por Grafos. Del mismo modo
que en el caso de las Relaciones de Orden, las Relaciones de Equivalencia son justamente
las clausuras transitivas de los grafos (no necesariamente orientados). Es decir, tenemos el
siguiente enunciado que reproduce en el caso de Relaciones de Equivalencia lo demostrado en
la Proposición A.4.12.
Proposición A.4.15. Sea X un conjunto y R ⊆ X × X una relación entre sus elementos.
Entonces, son equivalentes:
i) La relación R es una relación de equivalencia.
ii) Existe un grafo (no necesiaramente orientado) G := (X, E) sobre X de tal modo que:
• E satisface la propiedad Reflexiva.
A.4. PRODUCTO CARTESIANO (LIST). CORRESPONDENCIAS Y RELACIONES. 313

• (X, R) = T C(G).
Demostración. No neceita prueba. Es sencillamente el mismo tipo de argumento usado
en la Proposición A.4.12 anterior. 
En otras palabras, las relaciones de equivalencia son simplemente las clausuras transitivas de
los grafos que satisfacen una propiedad reflexiva.
A.4.5. Clasificando y Etiquetando elementos: Conjunto Cociente. Mientras las
relaciones de orden pretenden establecer una preferencia de unos elementos sobre otros, den-
tro de un cierto conjunto, las relaciones de equivalencia pretenden clasificar los elementos del
mismo conjunto para, posteriormente etiquetarlos. Se llamará conjunto cociente al conjunto de
etiquetas finales.
El término etiqueta no es tan espúreo dado que las etiquetas son lo que definen, de manera
bastante desafortunada en ocasiones, cosas tan dispares como la sociedad de consumo o la
claisificación e Linneo de los seres vivos, por ejemplo.
Ası́, tomemos un conjunto X y una relación de equivalencia ∼⊆ X × X definida sovre él. Para
un elementos x ∈ X, consideraremos su clase de equivalencia como el conjunto formado por
todos los elementos de X equivalentes a x, es decir,
[x] := {y ∈ X : x ∼ y}.
Las clases son sunconjuntos de X y se verifican las siguientes tres propiedades que indican que
se trata de una partición de X:
S
• X = x∈X [x],
• [[x] ∩ [y] = ∅] ∨ [[x] = [y]] .
• [x] 6= ∅.
Ası́, retomando los ejemplos, podemos clasificar un colectivo X de personas (los habitantes de
una ciudad, por ejemplo) mediante la relación de equivalencia “x ∼ y si y solamente si [x tiene
el mismo modelo de coche que y]”. Se trata claramente de una relación de equivalencia sobre
X. La relación no es fina como clasificador puesto que hay individuos que poseen más de un
coche y, por tanto, más de un modelo, con lo que podrı́amos tener que un “Dacia” y un BMW
están relacionados. Admitamos que la relación se refina mediante “x ∼ y si y solamente si [x
e y poseen un mismo modelo de coche y ambos le prefieren entre los de su propiedad]”.
Ciertamente cada clase de euivalencia recorre todos los individuos de la una ciudad que poseen
el mismo modelo de coche. Ası́, podrı́amos tener la clase [Luis], formada por todas las personas
que no tienen coche o [Juan] formada por todas las personas que tienen un Dacia Logan del
96. De hecho, la etiqueta del coche define la clase. Podrı́amos usar el sı́mbolo ∅ para describir
la clase de quienes poseen ningún coche y el sı́mbolo T T para quienes posean un Audi TT.
Recı́procamente, en la sociedad de consumo, la publicidad no nos vende el coche que sale en
un anuncio sino todos los coches equivalentes a él, es decir, todos los que tienen las mismas
caracteı́sticas de los que fabrica esa empresa...Es lo que se llama “Marca” o “etiqueta” y es lo
que los ciudadanos de las sociedades llamadas avanzadas compran.
En la clasificación de Linneo también tenemos una relación de equivalencia, esta vez entre
todos los seres vivos. Dos seres vivos serı́an equivalentes si pertenecen al mismo Reino, Orden,
Familia, Género, Especie....Luego se imponen las etiquetas. Ası́, la rana muscosa es la etiqueta
que define la clase de equivalencia de todas las ranas de montaña de patas amarillas y no
distingue entre ellas como individuos: una de tales ranas pertenece a la clase (etiqueta) pero
ella no es toda la clase. En tiempos más recientes, el afán clasificatorio de Linneo se reconvierte
en el afán clasificatorio de los genetistas: dos seres vivos son equivalentes si poseen el mismo
sistema cromosósico (mapa genético), quedando el código genético como etiqueta individual.
Con ejemplos matemáticos, es obvio que en un grafo no orientado, las clases de equivalencia son
las clausuras transitivas (o componentes conexas) de cada elemento. En el caso de los número
racionales, por ejemplo, la clase de equivalencia de 2/3 está formada por todos los pares de
números enteros a/b, con b 6= 0, tales que 2b = 3a.
Una vez queda claro que disponemos de clases de equivalencia, podemos considerarlas como ele-
mentos. Nace ası́ el conjunto cociente que es el conjunto formado por las clases de equivalencia,
es decir,
X/ ∼:= {[x] : x ∈ X}.
314 A. NAÏVE SET THEORY (LA NADA Y LA PALABRA)

En los ejemplos anteriores, el conjunto cociente es el conjunto de las etiquetas de coches, el


conjunto de los nombres propuestos por Linneo para todas las especies de animales, etc. Nótese
que el conjunto cociente es algo que, en muchas ocasiones, se puede escribir (por eso el término
etiqueta) aunque hay casos en los que los conjuntos cocientes no son “etiquetables” en el sentido
de formar un lenguaje. El ejemplo más inmediato es el caso de los números reales R que son
las etiquetas de las clases de equivalencia de sucesiones de Cauchy, pero que no son expresabels
sobre un alfabeto finito.
A.4.5.1. La circunferencia es un grupo cociente. Consideremos el conjunto R de los números
reales y una relación (un grafo) ∼⊆ R2 dada mediante:
(A.4.1) x ∼ y ⇐⇒ ∃k ∈ Z, x − y = k.
El conjunto cociente R/ ∼ es, precisamente, la circunferencia uniad. Esto es,
R/ ∼= {(x, y) ∈ R2 : x2 + y 2 − 1 = 0}.
Para demostrar esta igualdad, usaremos el Primer Teorema de Isomorfı́a para Grupos (ver
Teorema 11). De hecho, podemos resumir el resutado del modo siguiente:
Proposición A.4.16. Sea R el conjunto de los números reales con la operación suma + :
R × R −→ R. Y sea S 1 R2 la circunferencia unidad y consideremos la operación producto:
· : S 1 × S 1 −→ S 1 ,
donde · representa el producto de números complejos mediante la indetificación R2 ∼
= C. Se
tiene:
i) El par (R, +) es un grupo abeliano.
ii) El par (S 1 , ·) es un grupo abeliano.
iii) La siguiente aplicación es un epimorfismo de grupos:
exp : R −→ S1
t 7−→ eit .
iv) El núcleo de exp es el conjunto Z de los números enteros, visto como subgrupo de
(R, +).
v) Por el Primer Teorema de Isomorfı́a es siguiente es un isomorfismo de grupos:
(R/Z, +) ∼
= (S 1 , ·).
vi) El conjunto cociente R/ ∼ de la relación descrita en la expresión (A.4.1) anterior
Demostración. La demostración es evidente tan pronto como recordemos el significado
de la expresión eit . Esencialmente es una notación debida a Euler y que aparece de manera
natural al usar las coordenadas polares de un número complejo. Ası́, para cada número real
t ∈ R se define:
eit := cos(t) + i sin(t) ∈ C.
Por supuesto, la notación en coordenadas polares de un punto (x, y) ∈ R2 = C pasa a ser
reit ,
donde r ≥ 0 es el módulo. Las fórmulas de Euler para cos(kt) o sin(kt) no son sino el resultado
de hallar las partes reales e imaginarias de la potencia de eit . Es decir,
k
eikt = eit = cos(kt) + isin(kt),
apara ualquier k ∈ Z y cada t ∈ R. El resto es mera mecánica.


A.5. Aplicaciones. Cardinales.


Las aplicaciones son un tipo particular de correspondencias.
Definición 136 (Aplicaciones). Una aplicación entre dos conjuntos A y B es una correspon-
dencia R ⊆ A × B que verifica las propiedades siguientes:
• Todo elemento de A está realcionado con algún elemento de B:
∀x ∈ A, ∃y ∈ B, (x, y) ∈ R.
A.5. APLICACIONES. CARDINALES. 315

• No hay más de un elemento de B que pueda estar relacionado con algún elemento de
A:
∀x ∈ A, ∀y, y 0 ∈ B, ((x, y) ∈ R) ∧ ((x, y 0 ) ∈ R) ⇐= y = y 0 .
En ocasiones se resume con la expresión:
∀x ∈ A, ∃ | y ∈ B, (x, y) ∈ R,
donde el cuantificador existencial modificado ∃ | significa “existe uno y sólo uno”, es decir, para
un sunconjunto S ⊆ A se tiene
[∃ | z ∈ A, z ∈ S] := [∃z ∈ A, z ∈ S] ∧ [∀z1 , ∀z2 ∈ A, [z1 ∈ S] ∧ [z2 ∈ S] =⇒ [z1 = z2 ]] .
Al conjunto A de una aplicación f : A −→ B se le denomina dominio, mientras que al conjunto
B se le denomina rango de la aplicación.
Notación A.5.1. Notacionalmente se expresa R : A −→ B, en lugar de R ⊆ A × B y, de hecho,
se suelen usar letras minúsculas del tipo f : A −→ B para indicar la aplicación f de A en B.
Al único elemento de B relacionado con un x ∈ A se le representa f (x) (es decir, escribimos
x 7−→ f (x) en lugar de (x, f (x)) ∈ f ). En ocasiones usaremos la notación:
f: A −→ B
x 7−→ f (x).
Por simplicidad, mantendremos la notación (inadecuada, pero unificadora) f : A −→ B también
para las correspondencias, indicando en cada caso si hacemos referencia a una aplicación o a
una correspondencia, y reservaremos la notación R ⊆ A × A para las relaciones.
Observación A.5.2 (Bien Definida (?)). En ocasiones, los matemáticos más clásicos usan la
expresión “bien definida”. Con ello quieren decir que estamos “definiendo” una correspondencia
R ⊆ A×B y que, de hecho, es aplicacón. Es decir, cuando, en una demostración, se nos dice que
estamos probando la “buena definición” de R, estamos diciendo que se verifican las siguientes
propiedades:
• Probamos que efectivamente R ⊆ A × B, es decir que es una correspondencia que
relaciona elementos del conjunto A con elementos del conjunto B y no otra cosa.
• Probamos que efectivamente, esa correspondecnia es aplicación.
Ejemplo A.5.3 (Aplicación (o función) caracterı́stica de un subconjunto). Sea X un conjunto
L ⊆ X un subconjunto. De modo natural tenemos definda una aplicación que toma como
entradas los elementos de X y depende fuertemente de L: el la función caracterı́stica
χL : X −→ {0, 1}
y que viene definida para cada x ∈ X mediante:

1, si x ∈ L
χL (x) :=
0, en otro caso-
Se usa la expresión función cuando se trata de aplicaciones f : Rn −→ R, expresión que viene
de la tradición del Análisis Matemático.
Definición 137 (Composición). Dados tres conjuntos A, B y C y dos aplicaciones f : A −→ B,
g : B −→ C, podemos definir una aplicación (llamada composición de f y g) que denotaremos
g ◦ f : A −→ C y viene definida por la regla:
x 7−→ g(f (x)), ∀x ∈ A,
es decir, “primero aplicamos f sobre x y luego aplicamos g a f (x)”.
Proposición A.5.4. La composición de aplicaciones verifica las propiedades siguientes:
i) Para cada conjunto A existe una aplicación especial, llamada identidad sobre A y
denotada por IdA , dada mediante:
IdA : A −→ A
x 7−→ x.
Para cualesquiera conjuntos B y C y cualesquiera correspondencia f : A −→ B y
g : C −→ A, la aplicación identidad verifica verifica
f ◦ IdA = f, IdA ◦ g = g.
316 A. NAÏVE SET THEORY (LA NADA Y LA PALABRA)

ii) La composición de aplicaciones verifica la asociativa. Es decies, dadas f : A −→ B,


g : B −→ C y h : C −→ D, se verifica:
h ◦ (g ◦ f ) = (h ◦ g) ◦ f.
Demostración. Mera comprobación. 
Observación A.5.5. En primer lugar, debe señalarse que la composición de aplicaciones re-
quiere que el dominio de la segunda aplicación coincide con el rango de la primera. En otro
caso, no hay aplicación.
De otro lado, la asociatividad en la composición de aplicaciones nos permite ‘omitir” los
paréntesis, lo que permie escrivir, para una sucesión de aplicaciones “componibles”.
En ocasiones usaremos diagramas que son grafos orientados cuyos vértices y aristas están eti-
quetados y que representan la siguiente información:
• Los nodos o vértices están etiquetas por conjuntos (en casos más restrictivos serán
objetos de una categorı́a comogrupos, anillos, módulos, estapcios topológicos, álgebras
de Banach, etc.)
• Las etiquetas de las aristas son aplicaciones entre esos conjuntos (en casos más re-
strictivos son morfismos de la categorı́a, como homomorfismos, aplicaciones continuas,
etc..):
• Diremos que un diagrama es conmutativo si para cualesquiera ciclo (camino en el
grafo subyacente) que comienzan y terminan en el mismo vértice, la composición de
las aplicaciones que aparecen en las aristas de ese camino definen la misma aplicación.
Esto se representa mediante grafos como el siguiente, que representa la descomposición canónica
de un endomorfismo de espacios vectoriales f : V −→ V mediante el Primer Teorema de
Isomorfı́a (hemos destacado en azul los conjuntos y en negor las etiquetas que indican las
apliaciones:

f
V V

π i

V / ker(f ) Im(f )
fe
Y el sı́mbolo indica la conmutatividad del diagrama. En este caso, como sólo hay dos caminos
que empiezan y terminan en los mismos espacios, la conmutatividad significa simplemente:
f := i ◦ fe ◦ π.
Observación A.5.6 (Potencia de aplicación). Para una aplicación (o correspondencia) f :
A −→ A podemos definir la potencia mediante:
f 0 := IdA , (la identidad),
f 1 := f,
f n := f n−1 ◦ f, ∀n ≥ 2.
Un ejemplo que los alumnos pueden recordar es la potencia de matriz. Al cabo, las matrices no
son sino representaciones de aplicaciones lineales (endomorfismos) y sus potencias no son sino
las representaciones de las potencias de esa aplicación lineal. Una de las cosas simplificadoras
con las matrices en dimensión finita es que las potencias, a partir de la dimensión del espacio
vectorial de turno, están relacionadas con las anteriores mediante la combinación lineal que
determina el polinomio mı́nimo del endomorfismo. Revisaremos esta noción dentro del curso.
A.5.1. Determinismo/Indeterminismo. A partir de una aplicación (o corresponden-
cia) f : A −→ A, podemos definir una estructura de grafo orientado “natural”, definiendo los
vértices como los elementos de A y las aristas mediante
V := {(x, f (x)) : x ∈ A}.
En algunos casos, los alumnos habrán llamdo a este conjunto de vértices “el grafo de la función
f ”.
A.5. APLICACIONES. CARDINALES. 317

Dentro de ese grafo orientado, podemos considerar la parte de la “componente conexa” de x


que son descendientes de x. Este conjunto vendrá dado por las iteraciones de f , es decir:
{, x, f (x), f 2 (x), f 3 (x), . . . , f n (x), . . .}.
En términos más técnicos, el anterior conjunto es la órbita de x por la acción de f (aunque
usualmente se supone una órbita bidireccional que requiere que f sea biyectiva).
La diferencia entre el hecho de ser f aplicación o correspondencia se traduce en términos de
“determinismo” o “indeterminismo”:
• En el caso de ser aplicación, el conjunto de sucesores es un conjunto, posiblemente,
infinito, en forma de camino (un árbol sin ramificaciones):
x −→ f (x) −→ f 2 (x) −→ f 3 (x) −→ · · · .
Se dice que (A, f ) tiene una dinámica determinista.
• En el caso de ser correspondencia, el conjunto de los sucesores de x toma la forma
de árbol (con posibles ramificaciones): algunos valores no tendrán descendientes y
otros tendrán más de un descendiente directo. Se dice que (A, f ) tiene una dinámica
indeterminista.
Ejemplo A.5.7. Tomemos A := Z/5Z := {0, 1, 2, 3, 4}, las clases de restos módulo 5 y consid-
eremos f := A −→ A, dada mediante:
x 7−→ f (x) = x2 , ∀x ∈ A.
Es una aplicación, por lo que los descendientes de cada valor x ∈ A forman un camino (un árbol
sin ramificaciones). Por ejemplo, {0} es el conjunto de todos los descendientes de 0, mientras
que, si empezamos con 3 tendremos:
3 7−→ f (3) = 4 7−→ f 2 (3) = 1 7−→ f 3 (3) = 1 7−→ 1 7−→ · · · ,
COmo f es aplicación tendremos, para cada x ∈ A una dinámica determinista.
Ejemplo A.5.8. Un ejemplo de indeterminismo serı́a A = R y la correspondencia:
R := {(x, y) : x = y 2 }.
En este caso, si x < 0 no hay descendientes, si x = 0 hay solamente un deecendiente, y si x > 0
tenemos una infinidad de descendientes en forma de árbol no equilibrado. Por ejemplo,
···


4
2


2 ···


−42
2


− 2
√ √
Los vértices − 2, − 4 2, . . . no tendrán descendientes, mientras los positivos tienen un par de
descendientes directos.
Debe señalarse que este ejemplo muestra un indeterminismo fuertemente regular (sabemos la
regla) pero, en general, el indeterminismo podrı́a presentar una dinámica muy impredecible.
A.5.2. Imagen, Anti-imagen y otras propiedades. Las nociones son válidas tanto
para aplicaciones como para correspondencias, ası́ que las introducimos igualmente para poder
usarlas con naturalidad.
Definición 138. Sea f : A −→ B una correspondecia y sean S ⊆ A y T ⊆ B subconjuntos
respectivamente de A y B. Definiremos:
318 A. NAÏVE SET THEORY (LA NADA Y LA PALABRA)

i) La imagen de S por f :
f (S) := {y ∈ B : ∃x ∈ S, f (x) = y} ∈ P(B).
ii) La anti-imagen de T por f :
f −1 (T ) := {x ∈ A : f (x) ∈ T } ∈ P(A).
Algunas propiedades en la interacción con las operaciones de los respectivo retı́culos son las
siguientes:
Proposición A.5.9. Con las anteriores notaciones, sea {Ai : i ∈ I} ⊆ P(A) una familia de
subconjuntos de A y {Bj : j ∈ J} ⊆ P(B) una familia de subconjuntos de B y f : A −→ B
una correspondencia. Sean A1 , A2 ∈ P(A) y B1 , B2 ∈ P(B). Se verifica:
i) f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ), f (A1 ∩ A2 ) ⊆ f (A1 ) ∩ f (A2 ) y la igualdad no siempre
se da.
ii) f −1 (B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ) y f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ).
iii) f (A1 ) ⊆ B1 ⇐⇒ A1 ⊆ f −1 (B1 ).
iv) f (f −1 (B1 )) ⊆ B y la igualdad no siempre se da.
v) f −1 (f (A1 )) ⊇ A y la igualdad no siempre se da.
vi) A1 ⊆ A2 =⇒ f (A1 ) ⊆ f (A2 ).
vii) B1 ⊆ B2 =⇒ f −1 (B1 ) ⊆ f −1 (B2 )
c
viii) f −1 (B1c ) = f −1 (B) .
Usando las familias, tenemos las siguientes propiedades:
!
[ [
f Ai = f (Ai ),
i∈I i∈I
!
\ \
f Ai ⊆ f (Ai ),
i∈I i∈I
y no siempre es una igualdad. Además, se tiene:
 
[ [
f −1  Bj  = f −1 (Bj ),
j∈J j∈J
 
\ \
f −1  Bj  = f −1 (Bj ).
j∈J j∈J

Demostración. Lo dejamos como Ejercicio para los alumnos. 


Dada una correspondecia f : A −→ B, podemos definir dos correspondencias entre los respec-
tivos retı́ulos P(A) y P(B):

f∗ : P(A) −→ P(B)
S 7−→ f (S),
f ∗ : P(B) −→ P(A)
T 7−→ f −1 (T ).
Proposición A.5.10. Con las anteriores notaciones, si f : A −→ B es correspondencia, tanto
f∗ como f ∗ son aplicaciones.
Observación A.5.11 (Las correspondencias son ciertas aplicaciones entre subcon-
juntos). En particular, las correspondencias pueden interpretarse como aplicaciones del modo
siguiente:
Una correspondencia entre los conjuntos A y B es una aplicación ϕ : P(A) −→ P(B) que
verifica:
ϕ(A ∪ B) = ϕ(a) ∪ ϕ(B), ϕ(∅) = ∅.
Una aplicación es una correspondencia del tipo anterior ϕ : P(A) −→ P(B), en la que los
átomos de A tienen imagen no vacı́a y la imagen de cada átomo es también un átomo. Es decir,
A.5. APLICACIONES. CARDINALES. 319

• La imagen de todo átomo es no vacı́a, es decir:


∀a ∈ A, ϕ({a}) 6= ∅.
• La imagen de todo átomo es átomo:
∀a ∈ A, ∃b ∈ B, ϕ({a}) = {b}.
A.5.3. Aplicaciones Biyectivas. Cardinales. Sólo un pequeño resumen del proceso
de contar el número de elementos de un conjunto, noción que preocupaba originalmente a G.
Cantor.
Definición 139 (Aplicaciones inyectivas, suprayectivas, biyectivas). Sea f : A −→ B
una aplicación.
• Decimos que f es inyectiva si verifica:
∀x, x0 ∈ A, (f (x) = f (x0 )) =⇒ x = x0 .
• Decimos que f es suprayectiva si verifica:
∀y ∈ B, ∃x ∈ A, f (x) = y.
• Decimos que f es biyectiva si es, a la vez, inyectiva y suprayectiva.
Abusando del Axioma de Elección3, obsérvese que una aplicación f : A −→ B es biyectiva si
y solamente si disponemos de una aplicación (llamada inversa de f ) que se suele denotar por
f −1 : B −→ A y que satisface:
f ◦ f −1 = IdB , f −1 ◦ f = IdA ,
donde ◦ es la composición y IdA e IdB son las respectivas aplicación identidad en A y en B.
En general, las aplicaciones no tienen inversa, es decir, no podemos suponer siempre que sean
biyectivas. Sin embargo, la notación f −1 (T ) usanda anteriormente tiene sentido para cualquier
aplicación sea biyectiva o no. Viene esto a cuento del error habitual en Tercero de Matemáticas
de la UC, en promociones anteriores al menos, que confunde ambas cosas.
El proceso de contar no es sino la fundamentación del proceso “infantil” de contar mediante
identificación de los dedos de las manos con los objetos a contar. Este proceso es una biyección.
Definición 140 (Cardinal). Se dice que dos conjuntos A y B tienen el mismo cardinal (o
número de elementos) si existe una biyección f : A −→ B. También se dice que son biyectables.
• Un conjunto A se dice finito si existe un número natural n ∈ N y una biyección
f : A −→ {1, 2, 3, . . . , n}.
Por abuso de lenguaje se identifican todos los conjuntos del mismo cardinal y escribire-
mos, en el caso finito, ](A) = n, cuando A sea biyectable a {1, 2, . . . , n}.
• Un conjunto A se dice (infinito) numerable si hay una biyección f : A −→ N
• Un conjunto se dice contable si es finito o numerable.
Proposición A.5.12. Si dos conjuntos A e B son biyectables, también son biyectables P(A) y
P(B). De hecho, con las notaciones anteriores, tanto f ∗ como f∗ son biyecciones.
Demostración. Se deja como ejercicio. 
Proposición A.5.13. Algunas propiedades básicas de los cardinales son las siguientes:
i) Los conjuntos N, Z, Q son conjuntos numerables, mientras que R o C son conjuntos
infinitos (no son finitos) y son no numerables (no son biyectables con N).
ii) Los subconjuntos de un conjunto finito son también finitos. Entre los subconjuntos
A, B de un conjunto finito se tiene la propiedad
](A ∪ B) + ](A ∩ B) = ](A) + ](B).
iii) Los subconjuntos de un conjunto contable son también contables.
iv) Si A y B son finitos tendremos:
] (A × B) = ](A)](B).
3Ver http://en.wikipedia.org/wiki/Axiom_of_choice.
320 A. NAÏVE SET THEORY (LA NADA Y LA PALABRA)

v) Si A es un conjunto finito, el cardinal de P(A) (el número de todos sus subconjuntos)


es dado por
] (P(A)) = 2](A) .
vi) Si A es un conjunto finito, el número ](A) de aplicaciones f : A −→ {0, 1} verifica:
](A) = ] (P(A)) = 2](A) .
vii) Si A es un conjunto finito,
n
](An ) = (](A)) .
Por ejemplo, si K es un cuerpo finito de la forma K := Z/pZ, donde p ∈ N es un
número primo, el cardinal
](K n ) = ](K)n ,
por lo que se tiene que para cada espacio vectorial V de dimensión finita sobre un
cuerpo K finito se tiene:
dim V = log](K) ](V ).
viii) Si A es un conjunto finito ](A) = n, el número de permutaciones (es decir, biyecciones
de A en sı́ mismo) es n!. Además, el número de subconjuntos de cardinal k de A es
dado por el número combinatorio:
 
n n!
:= .
k k!(n − k)!
De ahı́ que se tenga:
n  
X n
2n := .
k
k=0

Demostración. Se deja como Ejercicio para los alumnos. 


Algunas propiedades elementales de los cardinables contables se resumen en:
Proposición A.5.14. Productos finitos de conjuntos contables es un conjunto contable. Es
dados {A1 , . . . , An } una familia finita de conjuntos contables, entonces el producto carte-
decir, Q
n
siano i=1 Ai es también contable.
La unión numerable de conjuntos contables es contable, es decir, dados {An : n ∈ N} una
familia numerable de conjuntos, de tal modo queo cada An es contable, entonces, tambiés es
contable el conjunto: [
A := An .
n∈N
Si A es un conjunto contable (finito o numerable), el conjunto de palabras A∗ también es
contable.
Ejemplo A.5.15 (Los subconjuntos de N). Por lo anterior, los subconjuntos de N son siempre
conjuntos contables (finitos o numerables) pero la cantidad de subconjuntos de N es infinita no
numerable (es decir, el cardinal de P(N) es infinito no numerable). Para comprobarlo, vamos
a mostrar una biyección entre P(N) y el intervalo [0, 1] ⊆ R de números reales. Nótese que
el cardinal del intervalo [0, 1] es igual al cardinal de los números reales. Usaremos la función
caracterı́stica asociada a cada subconjunto L ⊆ N. Ası́, dado L ∈ P(N), definiremos el número
real:

X χL (i)
L 7−→ xL := ∈ [0, 1].
i=1
2i
Nótese que el número real asociado al conjunto vacı́o ∅ es el número real x∅ = 0, mientras que
el número real xN ∈ [0, 1] es precisamente xN = 1 ∈ [0, 1].
Recı́procamente, dado cualquier número real x ∈ [0, 1], éste posee una única expansión “decimal”
en base dos (para ser más correcto, digamos, una única expansión binaria):

X xi
x := .
i=1
2i
A.6. EJERCICIOS Y PROBLEMAS 321

Definamos el sunconjunto Lx ⊆ N mediante:


Lx := {i ∈ N : xi = 1}.
Ambas aplicaciones (x 7−→ Lx y L 7−→ xL ) son una inversa de la otra y definen biyecciones
entre [0, 1] y P(N) y recı́procamente).
Dejamos al lector el esfuerzo de verificar que hay tantos número reales (en todo R) como número
reales en el intervalo [0, 1].

A.6. Ejercicios y Problemas


Problema 183. Completa el verso con el que se inicia el Apéndice, busca al autor y trata de
interpretar el significado del poema.
Problema 184. Busca en internet cualquier información adicional sobre Teorı́a de Conjuntos
Axiomática o Naı̈ve. Reflexiona sobre la lectura (con o sin demostraciones) y trata de plasmar
por escrito tus conclusiones.
Problema 185. Probar las afirmaciones que se listan el la Proposición A.5.9. En los casos
en los que un cierto contenido se da pero no la igualdad mostrar ejemplos que justifiquen la
afirmación.
Problema 186. Probar la Proposición A.5.12.
Problema 187. Demuestra las propiedades de la Proposición A.5.13.
Bibliografı́a

[Ar, 06] E. Arrondo, Another elementary proof of the Nullstellensatz. Amer. Math. Monthly 113 (2006), 169171.
[AtMc, 69] M.F. Atiyah, I.G. Macdonald, “Introduction to Commutative Algebra”, Addison-Wesley Publishing
Co., 1969. [Edición en español por Ed. Reverté, 1980].
[BaSh, 96] E. Bach, J. Shallit, “Algorithmic Number Theory. Vol 1 : Efficient Algorithms”, MIT Press, 1996.
[Be, 70] E.R. Berlekamp, Factoring Polynomials over Large Finite Fields. Mathematics of Computation 24,
(1970), 713–735.
[BCSS, 98] L. Blum, F. Cucker, M. Shub, and S. Smale, Complexity and real computation, Springer-Verlag,
New York, 1998.
[Bo, 67] N. Bourbaki, “Algébre Commutative, Éléments de mathématique, Fascicule XXVIII, chapitres 1–7”,
Hermann 1961–.
[Br, 87] W. D. Brownawell, Bounds for the degree in the Nullstellensatz. Annals of Math. 126 (1987), 577591.
[CGH, 88] L. Caniglia, A. Galligo and J. Heintz, Borne simplement exponentielle pour les degrés dans
le théorème des zéros sur un corps de caractéristique quelconque, C.R. Acad. Sci. Paris, t. 307, Série I
(1988), 255258.
[CaEi, 56] H. Cartan, S. Eilenberg, “Homological algebra. With an appendix by David A. Buchsbaum”.
Princeton Landmarks in Mathematics. Princeton University Press, Princeton, NJ, 1999 [Reedición del
original editado en Princeton en 1956].
[CHMP, 01] D. Castro, K. Hägele, J.E.Morais, L. M. Pardo, Kronecker’s and Newton’s approaches to
Solving : A first Comparison. J. of Complexity 17 (2001), 212–203.
[CoLiOS, 97] D. Cox, J. Little, D. O’Shea, “Ideals, Varieties, and Algorithms”, Springer, 1997 (1a. edición,
1992).
[CoLiOS, 98] D. Cox, J. Little, D. O’Shea, “Using algebraic geometry”. Graduate Texts in Mathematics 185,
Springer, 1998.
[EiMc, 45] S. Eilenberg, S. Mac Lane, General Theory of Natural Equivalence. Trans. of the Amer. Math.
Soc. 58 (1945), 231–294.
[Ei, 95] D. Eisenbud, “Commutative algebra: with a view toward algebraic geometry”, Springer Verlag, 1995.
[GiJe, 76] L. Gillman and M. Jerison,“Rings of Continuous Functions”. Springer-Verlag, New York, 1976.
[HMPS, 00] K. Hägele, J.E. Morais, M. Sombra, L. M. Pardo,The intrinsic complexity of the Arithmetic
Nullstellensatz. J. of Pure and App. Algebra vol. 146, (2000), 103183.
[HaWr, 38] G. H. Hardy, E. M. Wright, “An Introduction to the Theory of Numbers”. Oxford at the Claren-
don Press, 1938.
[He, 26] G. Hermann, Die Frage der endlich vielen Schritte in der Theorie der Polynomideale. Math. Ann.
95 (1926), 736788.
[HiSt, 97] P. Hilton, U. Stammbach, “A course in homological algebra. Second edition”. Graduate Texts in
Mathematics, 4. Springer-Verlag, New York, 1997.
[Jo, 67] M.A. Jodeit, Uniqueness in the Disision Algorithm. Amer. Math. Monthly 74 (1967), 835-836.
[Ka, 70] I. Kaplansky, “Commutative Rings”, Allyn and Bacon, 1970.
[Kn, 81] D.E. Knuth,“The Art of Computer Programming, vol. 2 Seminumerical Algorithms” Addison–Wesley,
1981.
[Kl, 88] J. Kollár, Sharp Effective Nullstllensatz. J. of A.M.S. 1 (1988), 963975.
[Ko, 92] D.C. Kozen,“The Design and Analysis of Algorithms”. Texts and Monographs in Computer Science,
Springer Verlag, 1992.
[KrPa, 96] T. Krick, L.M. Pardo, A Computational Method for Diophantine Approximation. In Algorithms in
Algebraic Geometry and Applications, Proc. MEGA’94, Progress in Mathematics 143, Birkhäuser Verlag,
1996, 193–254.
[KPS, 01] T. Krick, L.M. Pardo, M. Sombra, Sharp Estimates for the Arithmetic Nullstellensatz. Duke Math.
Journal 109 (2001), 521598.
[Ku, 85] E. Kunz, “Introduction to Commutative Algebra and Algebraic Geometry”, Birkhäuser, 1985.
[Krull, 29] W. Krull, Die Idealtheorie in Ringen ohne Endlicheitsbedingungen. Mathematische Annalen 10
(1929), 729-744.
[Krull, 35] W. Krull, “Idealtheorie”. Springer, 1935.
[La, 77] J.P. Lafon, “Algèbre commutative”, Hermann, 1977.
[Lm, 1844] G. Lamé, Note sur la limite du nombre des divisions dans la recherche du plus grand commun
diviseur entres deux nombres entiers. Comptes Rendus Acad. Sci. 19 (1844), 876-870.
[Mc, 75] S. Mac Lane, “Homology. Reprint of the 1975 edition”. Classics in Mathematics. Springer-Verlag,
Berlin, 1995.

323
324 BIBLIOGRAFÍA

[MaWü, 71] D. W. Masser and G. Wüstholz, Fields of large transcendence degree generated by values of
elliptic functions. Invent. Math. 72 (1971) 407463.
[Ma, 80] H. Matsumura,“Commutative Algebra (2nd. Edition)”, Benjamin/Cummings, 1980.
[Ma, 89] H. Matsumura, “Commutative Ring Theory”. Cambridge Studies in advanced Math. 8, Cambridge
Univ. Press, 1989.
[Mi, 89] M. Mignotte, “Mathématiques pour le Calcul Formel”, Presses Univ. de France, 1989.
[Mtz, 49] T. Motzkin, The Euclidean algorithm. Bull. Amer. Math. Soc., 55 (1949), 1142–1146.
[Na, 75] M. Nagata,“Local Rings”, Robert E. Krieger, 1975.
[Noether, 1921] E. Noether, Idealtheorie in Ringbereichen. Math. Annalen 83 (1921), 2466.
[Or, 13] Nuccio Ordine, “L’utilità dell’Inutile. Manifesto”. Bompiani, 2013.
[Os, 73] A.M. Ostrowski, “Solutions of Equations in Euclidean and Banach Spaces”, Academic Press, 1973.
[Pr, 75] V.R. Pratt, Every Prime has a succinct certificate. SIAM J. on Computing 4 (1975), 214-220.
[Rb, 29] G. Y. Rainich (pseudonym J.L. Rabinowitsch), Zum Hilbertschen Nullstellensatz. Math. Ann. 102
(1929), 520
[Ra et al., 75] S. Raghavan, B. Singh, R. Sridharan, “Homological Methods in Commutative Algebra”, Tata
Institute for Fund. Res., Oxford University Press, 1975.
[Re, 95] M. Reid, “Undergraduate Commutative Algebra”, Cambridge University Press, 1995.
[Rha, 62] T.S. Rhai, A characterization of polynomial domians over a field. Amer. Mathematical Monthly 69
(1962), 984-986.
[RSA, 78] R.L. Rivest, A. Shamir y L.A. Adleman, A method for obtaining digital signatures and public-key
cryptosystems. Communications ACM 21(1978), 120-126.
[Ro, 94] H.E. Rose,“A Course in Number Theory”.2nd. ed., Oxford Sci. Publications, 1994.
[Shf, 74] I.R. Shafarevich, “Basic Algebraic Geometry”, Springer–Verlag, 1974.
[Shp, 00] R.Y. Sharp, “ Steps in commutative algebra”. Cambridge University Press, 1990, (2nd. Ed. 2000).
[Wls, 73] J.C. Wilson, A Principal Ideal Ring that is not a Euclidean Ring. Mathematics Magazine, 46 (1973),
34–38.
[ZaSa, 60] O. Zariski, P. Samuel, “Commutative Algebra”, vols. I–II, Van Nostrand, Princeton, 1958,1960.

También podría gustarte